Author(s): Robert Hollmann
Year: 2008
Language: German
Pages: 197
3834807230......Page 1
Ausgezeichnete Arbeiten zur Informationsqualität......Page 3
Webbasierte
Datenintegration......Page 4
Geleitwort......Page 6
Vorwort......Page 7
Inhaltsverzeichnis......Page 9
Abbildungsverzeichnis......Page 12
Tabellenverzeichnis......Page 15
Abkürzungsverzeichnis......Page 17
Teil I
Datenbereinigung und
Konsolidierung von heterogenen
Datenbeständen......Page 20
1 Einleitung......Page 21
2 Datenqualität......Page 25
3 Dimensionen und Architektur der
Informationsintegration......Page 42
4 Data Cleaning......Page 52
5 Konzeption des Data Cleaning Toolkits......Page 66
6 Implementierung......Page 80
7 Zusammenfassung und Ausblick......Page 95
Teil II
Auffinden und Bereinigen von
Duplikaten in heterogenen
Datenbeständen......Page 97
8 Einleitung......Page 98
9 Informationen, Daten und Wissen- ein
Definitionsversuch......Page 102
10 Informationsintegration im Fokus der
Datenqualität......Page 110
11 Duplikate in Datenbeständen......Page 124
12 Konkrete Verfahren zur
Dublettenauffindung und Klassifikation......Page 132
13 Konzept der Datenqualitätsanwendung
„DCT“......Page 153
14 Implementierung, ausgewählte
Algorithmen- und Datenstrukturen......Page 178
15 Fazit und Ausblick......Page 192
16 Anhang......Page 194