datenqualit atsmodelle - vkoeppen/vortraege/hart.pdfstefan willi hart datenqualit atsmodelle 3....

14
Datenqualit¨ atsmodelle Stefan Willi Hart 3. Dezember 2009 Stefan Willi Hart () Datenqualit¨ atsmodelle 3. Dezember 2009 1 / 14

Upload: others

Post on 17-Oct-2019

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Datenqualitatsmodelle

Stefan Willi Hart

3. Dezember 2009

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 1 / 14

Page 2: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Inhaltsverzeichnis

1 Motivation

2 ModelleSystemseitiges DQ-Modell

AllgemeinAufbau des DQ-Modells

Empirisches DQ-ModellAllgemeinDQ-Klassen und ihre Merkmale IDQ-Klassen und ihre Merkmale II

3 Ausblick

4 Zusammenfassung

5 Literatur

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 2 / 14

Page 3: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Motivation

Allgemein Teil I

Datenqualitat

ist die Gesamtheit der Auspragungen von Qualitatsmerkmalen einesDatenbestandes bezuglich dessen Eignung, festgelegte undvorausgesetzte Erfordernisse zu erfullen.

[DMC04, Seite 4]

Modell

”Modell 〈 ital.〉 das, Muster, Vorbild; Nachbildung oder Entwurf vonGegenstanden (vergrossert, verkleinert, in naturlicher Grosse). Modellkonnen ausser wirklichen Gegenstanden auch gedanklicheKonstruktionen sein.”

[Brockh71, ]

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 3 / 14

Page 4: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Motivation

Allgemein Teil II

Betrachtung uber den gesamten Lebenszyklus

mussen im Zusammenhang betrachtet werden

Abbildung: System-Bi-Cycle

[Hin01a, Kapital 3 S.26]Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 4 / 14

Page 5: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Modelle

Modelle

Systemseitiges Datenqualitatsmodell von E. Borowski undH.J. Lenz

Empirisches Datenqualitatsmodell von H. Hinrich

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 5 / 14

Page 6: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Modelle Systemseitiges DQ-Modell

Systemseitiges DQ-Modell: Allgemein

Basis des Modells:

Betrachtung von Zustanden des modellierten Abschnittes

falsch zugeordnete Zustande im Informationssytem

z.B. mehrdeutige/bedeutungslose Zustande oder unvollstandigefalsche Reprasentation

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 6 / 14

Page 7: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Modelle Systemseitiges DQ-Modell

Systemseitiges DQ-Modell: Aufbau

Abbildung: DQ-Dimensionen

[BL2008, Seite 4]Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 7 / 14

Page 8: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Modelle Empirisches DQ-Modell

Empirisches DQ-Modell: Allgemein

Basis des Modells:

Beziehungen zwischen Merkmalen der Bedeutsamkeit

von Merkmalen auf Basis von Kundenbefragungen

Anzahl der DQ-Merkmale kann sehr groß sein

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 8 / 14

Page 9: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Modelle Empirisches DQ-Modell

Empirisches DQ-Modell: Merkmale I

Glaubwurdigkeit

KorrektheitKonsistenzZuverlassigkeit

Nutzlichkeit

VollstandigkeitGenauigkeitZeitnaheRedundanzfreiheitRelevanz

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 9 / 14

Page 10: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Modelle Empirisches DQ-Modell

Empirisches DQ-Modell: Merkmale II

Interpretierbarkeit

EinheitlichkeitEindeutigkeitVerstandlichkeit

Schlusselintegritat

SchlusseleindeutigkeitReferentielle Integritat

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 10 / 14

Page 11: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Ausblick

Ausblick

weitere Ansatze:

intuitiver Ansatz:

Merkmale aufgrund intuitiven Verstandisses eines Experten

Dienstleistungsorientierter Ansatz:

Quality of ServiceLieferung von Informationen an Informationsverbraucher

Datenbanksystemorientierter Ansatz:

klassische 3-Ebenen Architekturinterne Schema (technische Merkmale)logische Schema (Vollstandigkeit und Konsistenz)externe Schema (kontextabhanige Merkmale und Aktualitat)

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 11 / 14

Page 12: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Zusammenfassung

Zusammenfassung

Modelle haben verschieden Ansichtsweisen

Datenqualitatsmerkmale unterschiedlich Definiert

Ergebnis: Datenqualitatsmodelle sollen Datenqualitatsmerkmaledefinieren ⇒ nicht Allgemeingultig

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 12 / 14

Page 13: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Zusammenfassung

Fragen?

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 13 / 14

Page 14: Datenqualit atsmodelle - vkoeppen/Vortraege/Hart.pdfStefan Willi Hart Datenqualit atsmodelle 3. Dezember 2009 3 / 14. Motivation Allgemein Teil II Betrachtung uber den gesamten Lebenszyklus

Literatur

Literatur

H. Hinrichs. Datenqualitatsmanagement in DataWarehouse-Umgebung, 2001

E. Borowski und H.J. Lenz, Design of a workflow system toimprove data quality using Oracle warehouse builder 2008

www.wikipedia.org Stichwort: Modell Kategorie:Wissenschaftstheorie Stand 01.12.09

Dr. Ulrich Windheuser Vortrag auf den 5. Data-Mining-CupAnwendertagen 2004

Brockhaus Enzyklopadie Band 12, 1971

Stefan Willi Hart () Datenqualitatsmodelle 3. Dezember 2009 14 / 14