microsoft sql server 2005 analysis services / data warehousing / data mining architektur und...
TRANSCRIPT
![Page 1: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/1.jpg)
Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining
Architektur und Verwendung
![Page 2: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/2.jpg)
Einführung
• OLTP und OLAP im Vergleich
• Data Warehouse-Komponenten
• OLAP-Würfel
![Page 3: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/3.jpg)
OLTP und OLAP im Vergleich
• Mithilfe der analytischen Onlineverarbeitung (Online Analytical Processing, OLAP) können Sie auf aggregierte und organisierte Daten aus Geschäftsdatenquellen, z. B. Data Warehouses, in einer multidimensionalen Struktur, die als Cube bezeichnet wird, zugreifen.
• Microsoft SQL Server 2005 Analysis Services (SSAS) stellt Tools und Features für OLAP zur Verfügung, mit deren Hilfe Sie Cubes und andere unterstützende Objekte entwerfen, bereitstellen und verwalten können.
![Page 4: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/4.jpg)
OLTP und OLAP im Vergleich
• OLTP• OnLine Transaction Processing• Merkmale
– Verarbeitet Echtzeittransaktionen eines Unternehmens
– Enthält für Einträge und Bearbeitungen optimierte Datenstrukturen
– Stellt eingeschränkte Entscheidungsfindungsfunktionen bereit
• Beispiele– Anwendungen zum Nachverfolgen
von Aufträgen – Kundendienstanwendungen– Point-of-Sales-Anwendungen
• OLAP• OnLine Analytical Processing• Merkmale
– Es stellt Daten für Geschäftsanalysevorgänge bereit
– Es integriert Daten aus heterogenen Quellsystemen
– Es kombiniert überprüfte Quelldaten – Es organisiert Daten in
themenspezifischen Gruppen, die sich nicht ständig ändern
– Es speichert Daten in physischen Strukturen, die für das Verteilen und Abfragen von Daten optimiert sind
• Beispiele– Matrix-/Pivot-Untersuchungen– Erweiterte Wissensgenerierung
![Page 5: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/5.jpg)
OLTP und OLAP im Vergleich
• Allgemeine Kennzeichen
– Optimiertes Schema für schnelle Benutzerabfragen
– Stabiles Berechnungs-modul für numerische Analysen
– Vorausberechnete Aggregate, Beziehungs-management
– Konzeptionelles, intuitives Datenmodell
– Multidimensionale Sicht von Daten
• Drilldown und Drillup • Sichten von Daten mit Hilfe
des Pivotprinzips
• Einsatzmöglichkeiten
– EIS-Systeme • Leistungswerte • Ausnahmeberichts-erstellung
– Verkaufs- und Marketinganwendungen
• Bestellungs- und Rechnungsanwendungen
• Produktanalysen • Kundenanalysen • Zeitreihen-Trendanalysen
![Page 6: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/6.jpg)
REGIONWest CA OREast MA NY
REGIONWestEast
STATE REGIONCA WestOR WestMA EastNY East
OLTP und OLAP im Vergleich
OLAP-Dimension
Relationale Dimension
![Page 7: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/7.jpg)
OLTP und OLAP im Vergleich
USA ist die übergeordnete Ebene von North West und South West
North West und South West sind untergeordnete Ebenen von USA
North West und South West sind gleichgeordnete Elemente
North West und California sind nachfolgende Elemente von USA
North West und USA sind vorausgehende Elemente von Washington
Oregon und California sind Elemente mit übergeordneten Ebenen, die gleichgeordnete Elemente sind
Alle sind Elemente ein und derselben Dimension
USANorth West Oregon WashingtonSouth West California
![Page 8: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/8.jpg)
Data Warehouse-Komponenten
Datawarehouse
Datenzugriff
Benutzer-zugriff auf DatenDaten-
quellen
Dateneingabe
Staging-bereich
Datamarts
![Page 9: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/9.jpg)
Data Warehouse-Komponenten
RelationaleRelationaleDatamartsDatamarts OLAP-CubesOLAP-Cubes
Datenspeicherung RelationaleDatenstruktur
Multidimensionale Datenstrukturen
Dateninhalt Detaillierte und zusam-mengefasste Daten Zusammengefasste Daten
Datenquellen Relationale und nicht relationale Quellen
Relationale und nicht relationale Quellen
Datenabruf Gute Abfrageleistung beimExtrahieren von Daten
Sehr gute Abfrageleistung beim Extrahieren von Daten
![Page 10: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/10.jpg)
OLAP-Würfel: Struktur
Q4Q1 Q2 Q3„Time“-Dimension
„Prod
ucts“
-Dimen
sion
Detroit
Denver
Chicago
„Mar
kets
“-Di
men
sion
Apples
CherriesGrapes
Atlanta
Melons
![Page 11: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/11.jpg)
Q4Q1 Q2 Q3„Time“-Dimension
„Prod
ucts“
-
Dimen
sionDallas
Denver
Chicago
„Mar
kets
“-Di
men
sion
Apples
CherriesGrapes
Atlanta Sales Fact
Melons
OLAP-Würfel: Abfragen
![Page 12: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/12.jpg)
ApplesQ4Q1 Q2 Q3
„Time“-Dimension „Prod
ucts“
-Dimen
sion
Detroit
Denver
Chicago
Atlanta
„Mar
kets
“-Di
men
sion
MelonsCherries
Grapes
OLAP-Würfel: Schneiden
![Page 13: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/13.jpg)
OLAP-Würfel: Visualisierung
![Page 14: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/14.jpg)
OLAP-Würfel: Visualisierung
![Page 15: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/15.jpg)
Fragen...
![Page 16: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/16.jpg)
OLAP und SQL Server 2005
• Übersicht• Server-/Client-
Architektur• Berichte/Auswertung
![Page 17: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/17.jpg)
Übersicht
• Microsoft SQL Server 2005 Analysis Services (SSAS) verwendet sowohl Server- als auch Clientkomponenten zum Bereitstellen von OLAP-Funktionen (Online Analytical Processing) und von Data Mining-Funktionen für Business Intelligence-Anwendungen:
– Die Serverkomponente von Analysis Services ist als Microsoft Windows-Dienst implementiert. SQL Server 2005 Analysis Services unterstützt mehrere Instanzen auf demselben Computer, wobei jede Instanz von Analysis Services als eigene Instanz des Windows-Dienstes implementiert ist.
– Clients kommunizieren mit Analysis Services mithilfe des öffentlichen Standards für XMLA (XML for Analysis). Hierbei handelt es sich um ein SOAP-basiertes Protokoll für die Ausgabe von Befehlen und den Empfang von Antworten in Form eines Webdienstes. Clientobjektmodelle werden ebenfalls über XMLA bereitgestellt. Auf diese Modelle kann sowohl ein verwalteter Anbieter (ADOMD.NET) als auch ein eigener OLE DB-Anbieter zugreifen.
– Abfragebefehle können mithilfe der folgenden Abfragesprachen ausgegeben werden: SQL; MDX (Multidimensional Expressions), eine Abfragesprache nach Industriestandard für Analysen; oder DMX (Data Mining Extensions), eine am Data Mining orientierte Abfragesprache nach Industriestandard. Zum Verwalten von Analysis Services-Datenbankobjekten kann außerdem ASSL (Analysis Services Scripting Language) verwendet werden.
![Page 18: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/18.jpg)
Serverarchitektur
• Die Serverkomponente von Microsoft SQL Server 2005 Analysis Services (SSAS) ist die Anwendung msmdsrv.exe, die normalerweise als Windows-Dienst ausgeführt wird.
• Diese Anwendung besteht aus– Sicherheitskomponenten– einer XMLA-Überwachungskomponente (XML for Analysis)– einer Abfrageverarbeitungs-komponente und– zahlreichen internen Komponenten, die die folgenden
Funktionen ausführen:– Analysieren von Anweisungen, die
von Client empfangen werden– Verwalten von Metadaten– Behandeln von Transaktionen– Verarbeiten von Berechnungen– Speichern von Dimensions- und
Zellendaten– Erstellen von Aggregationen– Planen von Abfragen– Zwischenspeichern von Objekten– Verwalten von Serverressourcen
![Page 19: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/19.jpg)
Clientarchitektur
• Microsoft SQL Server 2005 Analysis Services (SSAS) unterstützt eine Thin Client-Architektur. Das Analysis Services-Berechnungsmodul ist vollständig serverbasiert, sodass alle Abfragen auf dem Server aufgelöst werden. Daher ist für jede Abfrage nur ein Roundtrip zwischen dem Client und dem Server erforderlich, was zu skalierbarer Leistung führt, wenn die Komplexität der Abfragen zunimmt.
• Das native Protokoll für Analysis Services ist XMLA (XML for Analysis). Analysis Services stellt mehrere Datenzugriffsschnittstellen für Clientanwendungen zur Verfügung. Diese Komponenten verwenden jedoch alle XMLA für die Kommunikation mit einer Instanz von Analysis Services.
![Page 20: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/20.jpg)
Clientarchitektur
• Zusammen mit Analysis Services werden mehrere unterschiedliche Anbieter zur Verfügung gestellt, um unterschiedliche Programmiersprachen zu unterstützen.
• Ein Anbieter kommuniziert mit einem Server mit Analysis Services, indem XMLA in SOAP-Paketen über TCP/IP oder durch Internetinformationsdienste (Internet Information Services, IIS) über HTTP gesendet und empfangen wird.
• Eine HTTP-Verbindung verwendet ein von IIS instanziiertes COM-Objekt, das als Datapump bezeichnet wird und als Datenleitung für Analysis Services-Daten fungiert.
![Page 21: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/21.jpg)
Clientarchitektur
• Win32-Clientanwendungen können mithilfe von
– OLE DB für OLAP-Schnittstellen – Microsoft ActiveX Data Objects-
Objektmodell (ADO) für COM-Automatisierungssprachen (Component Object Model) wie Microsoft Visual Basic
Verbindungen zu einem Server mit Analysis Services herstellen.
• Mit .NET-Sprachen codierte Anwendungen können mithilfe von ADOMD.NET eine Verbindung zu einem Server mit Analysis Services herstellen.
Programmier-sprache
Datenzugriffs-schnittstelle
C++ OLE DB für OLAP (OLE DB for OLAP)
Visual Basic 6 ADO MD
.NET-Sprachen ADOMD.NET
Alle Sprachen mit SOAP-Unterstützung
XMLA (XML for Analysis)
![Page 22: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/22.jpg)
Clientarchitektur
• Analysis Services verfügt über eine Webarchitektur mit einer vollständig skalierbaren mittleren Ebene, die sowohl in kleineren als auch in großen Organisationen bereitgestellt werden kann.
• Analysis Services stellt umfassende Unterstützung auf mittlerer Ebene für Webdienste zur Verfügung.
• ASP-Anwendungen werden von OLE DB für OLAP und ADO MD unterstützt, ASP.NET-Anwendungen werden von ADOMD.NET unterstützt.
• Die mittlere Ebene ist für viele gleichzeitige Benutzer skalierbar.
![Page 23: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/23.jpg)
Clientarchitektur
• Lokale Cubes und lokale Miningmodelle ermöglichen Analysen auf einer Clientarbeitsstation, wenn deren Verbindung zum Netzwerk getrennt ist.
• Das lokale Cubemodul (Msmdlocal.dll) unterstützt lokale Cubes und lokale Miningmodelle auf Clientcomputern. Das lokale Cubemodul ist ein In-Process-COM-Server.
• Eine Clientanwendung ruft den OLE DB-Anbieter für OLAP auf, der das lokale Cubemodul zum Erstellen und Abfragen von lokalen Cubes lädt.
![Page 24: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/24.jpg)
Clientarchitektur
• Ein lokaler Cube kann entweder auf einem vorhandenen, in Analysis Services gespeicherten Cube basieren oder auf einer relationalen OLE DB-Datenbank.
– Wenn ein lokaler Cube aus einer relationalen Datenquelle erstellt wird, ist dessen Struktur jener von Cubes in Analysis Services sehr ähnlich.
– Wenn ein lokaler Cube aus einer OLAP-Datenquelle erstellt wird, ist der lokale Cube an den Quellcube gebunden.
• Ein lokaler Cube kann auch ohne eine Ausgangsdatenquelle erstellt werden.
• Sowohl lokale Cubes als auch lokale Data Mining-Modelle werden in multidimensionalen Cubedateien (CUB) auf einem Clientcomputer gespeichert.– Eine CUB-Datei enthält
mindestens einen lokalen Cube, kann jedoch mehrere Cubes enthalten.
– Abfragen an die lokalen Cubes werden vom lokalen Cubemodul verarbeitet und benötigen keine Verbindung zu einer Analysis Services-Instanz.
![Page 25: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/25.jpg)
Clientarchitektur
• Das lokale Cubemodul kann auch lokale Data Mining-Modelle erstellen, die in lokalen Cubes verarbeitet wurden. Ein lokales Data Mining-Modell basiert auf einem lokalen Cube und wird in derselben CUB-Datei gespeichert, die auch den lokalen Cube definiert. Lokale Miningmodelle können auch ohne eine Verbindung zu einer Analysis Services-Instanz verwendet werden.
![Page 26: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/26.jpg)
Berichte
• Reporting Tool-Optionen
• Excel Pivot-Tabellen und Pivot-Charts
• Office Web Components (OWC)
• Reporting Services• Report Builder
• Strukturierte Berichte (relational)– Reporting Services, Report
Builder• Strukturierte
Gruppierungen (OLAP)– Excel Pivot-Tabellen-
Berichte und Diagramme– Office Web PivotTable
Reports und Diagramme– Excel Add-In Accelerator
• Strukturierte Attribute (Data Mining)– Data Mining-
Auswertungs-/Anzeigewerkzeuge
![Page 27: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/27.jpg)
Berichte: Excel PivotTables und PivotCharts
• Excel ist bekannt und oft schon vorhanden
• Unterstützt AS 2005• Arbeitet mit relationalen
und OLAP-Daten• GetPivotData fügt
Flexibilität hinzu
![Page 28: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/28.jpg)
Berichte: Office Web Components (OWC)
• In eigene Anwendungen einbettbar
• Flexibler als Excel• Bessere Diagramm-
Erzeugung als in Excel• Benutzerdefinierte
Aggregate• Keine Office-Lizenz
erforderlich• VBA/ActiveX-Unterstützung• Von Microsoft in SQL Server
Studios selbst eingesetzt
![Page 29: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/29.jpg)
Berichte: Excel Add-In Accelerator
• Verbesserte Abfragen• Freiform-Modus mit
asymmetrischen Berichten, mehreren Datenquellen und flexiblen Formeln
• Verteilung über Arbeitsblatt/Excel-Datei
![Page 30: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/30.jpg)
Berichte: Reporting Services
• Tabellen, Matrizen, Diagramme
• Vordefinierte Struktur• Interaktivität möglich• Strukturierte Daten:
relational, OLAP, hierarchisch
• URL-Zugriff und einbettungsfähig in eigenen Anwendungen
• Web Service-Unterstützung
![Page 31: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/31.jpg)
Berichte: Report Builder
• Zusatzwerkzeug für die direkte Erstellung von Berichten auf Basis eines Datenmodells für Berichte durch Profi-Benutzer
• Unterstützt prinzipiell die gleichen Layout-/Abfragefähigkeiten wie Visual Studio für die Standard-Reporting Services
![Page 32: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/32.jpg)
Fragen...
![Page 33: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/33.jpg)
Konzepte
• Unified Dimensional Model (UDM)
• Data Mining• Objekte
![Page 34: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/34.jpg)
UDM
• Ein Benutzer, der Informationen direkt aus einer Datenquelle abrufen möchte, wie z. B. aus einer ERP-Datenbank (Enterprise Resource Planning), steht mehreren bedeutenden Herausforderungen gegenüber:– Die Inhalte solcher Datenquellen sind häufig schwer verständlich, da sie für
Systeme und Entwickler entwickelt wurden, ohne dabei die Anforderungen des Benutzers zu berücksichtigen.
– Die vom Benutzer benötigten Informationen werden häufig auf mehrere heterogene Datenquellen verteilt. Umso schwieriger wird es für den Benutzer, wenn diese Datenquellen unterschiedlichster Arten sind, die neben relationalen Datenbanken auch Dateien und Webdienste beinhalten.
– Während viele Datenquellen so ausgerichtet sind, dass sie große Mengen an Transaktionsebenendetails aufnehmen, schließen die zur Unterstützung von Geschäftsentscheidungen durchgeführten Abfragen in vielen Fällen zusammengefasste, aggregierte Informationen ein. Bei sehr großen Datenmengen kann die zum Abrufen solcher zusammengefasster Werte für die interaktive Endbenutzeranalyse erforderliche Zeit ein Hindernis darstellen.
– Die Geschäftsregeln sind im Allgemeinen nicht in den Datenquellen gekapselt. Die Benutzer müssen daher die Daten selbst interpretieren.
![Page 35: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/35.jpg)
UDM
• Die Rolle eines UDM (Unified Dimensional Model) besteht darin, eine Brücke zwischen dem Benutzer und den Datenquellen bereitzustellen.
• Ein UDM wird aus mindestens einer physikalischen Datenquelle hergeleitet.
• Der Benutzer gibt Abfragen für das UDM mithilfe einer Vielzahl von Clienttools wie Microsoft Excel aus.
• Es ergeben sich Vorteile für den Endbenutzer, auch wenn das UDM nur als minimale Schicht über der Datenquelle erstellt wird: ein einfacheres, verständlicheres Modell der Daten, das Isolieren heterogener Back-End-Datenquellen sowie Leistungsverbesserungen bei Abfragen.
• Das UDM bietet die folgenden Vorteile:– Deutlich verbessertes Benutzermodell.– Stellt Abfragen mit hoher Leistung bereit
und unterstützt so interaktive Analysen von großen Datenmengen.
– Erfasst Geschäftsregeln im Modell zur Unterstützung umfangreicherer Analysen.
– Ermöglicht eine Rückkopplung, bei der Benutzer auf die angezeigten Daten reagieren können.
![Page 36: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/36.jpg)
UDM
• Direkter Zugriff auf die Datenquellen (traditionell)
• Zugreifen auf die Datenquellen mithilfe eines UDM
![Page 37: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/37.jpg)
UDM
• Hierarchien
• Key Performance Indicators (KPIs)
• Zeitangaben
• Übersetzungen
• Kategorisierung• Perspektiven• Attributsemantik
![Page 38: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/38.jpg)
UDM
• Erweiterte Analytik
![Page 39: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/39.jpg)
UDM
BI-AnwendungenBI-Anwendungen
Berichtswerkzeug Berichtswerkzeug (1)(1)
WerkzeugWerkzeugDatenquelleDatenquelle
OLAP OLAP Browser (2)Browser (2)
OLAP OLAP Browser (1)Browser (1)
Berichtswerkzeug Berichtswerkzeug (1)(1)
XM
L/A
or O
DB
ODW UDMUDM
AnalysisAnalysisServicesServices
Cache
MDXMDX
![Page 40: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/40.jpg)
Data Mining
• Data Mining wird oft als "der Prozess des Extrahierens gültiger, authentischer und aussagefähiger Informationen aus großen Datenbanken" beschrieben. Data Mining ist demnach ein Prozess, der Muster und Trends in Daten aufdeckt. Diese Muster und Trends lassen sich zusammenfassen und als Miningmodell definieren. Miningmodelle werden u. a. auf folgende Geschäftsszenarien angewendet:
– Erstellen von Verkaufsprognosen– Durchführen von
Direktmarketingaktionen, die auf einen bestimmten Kundenkreis abzielen
– Ermitteln von Produkten mit Cross-Selling-Potenzial
– Ermitteln der Reihenfolge, in der Kunden Produkte in den Einkaufswagen legen
• Die Erstellung eines Miningmodells muss als Teil eines größeren Prozesses verstanden werden, der sich von der Definition der zentralen Problemstellung bis hin zur Implementierung des Modells in einer Arbeitsumgebung erstreckt.
• Ein Data Mining-Prozess besteht im Wesentlichen aus sechs Schritten:
1. Definieren der Problemstellung2. Vorbereiten der Daten3. Durchsuchen von Daten4. Erstellen von Modellen5. Durchsuchen und Validieren von
Modellen6. Bereitstellen und Aktualisieren von
Modellen
![Page 41: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/41.jpg)
Data Mining
![Page 42: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/42.jpg)
Data Mining
• Sobald die Miningmodelle in eine Produktionsumgebung integriert wurden, stehen sie je nach Bedarf für zahlreiche Tasks zur Verfügung. Sie können u. a. folgende Tasks ausführen:
– Mithilfe der Modelle Vorhersagen erstellen, die für Geschäftsentscheidung herangezogen werden können. SQL Server stellt die DMX-Sprache zur Verfügung, die Sie zum Erstellen von Vorhersageabfragen verwenden können. Darüber hinaus unterstützt Sie der Generator für Vorhersagebabfragen beim Erstellen der Abfragen.
– Data Mining-Funktionen in eine Anwendung integrieren. Sie können Analysis Management Objects (AMO) hinzufügen oder ein Assembly mit mehreren Objekten einbetten. Mit diesen Objekten kann Ihre Anwendung Miningstrukturen und -modelle erstellen, ändern, verarbeiten und löschen. Alternativ können Sie XMLA-Nachrichten (XML for Analysis) direkt an eine Instanz von Analysis Services senden.
– Mit Integration Services ein Paket erstellen, in dem mithilfe eines Miningmodells eingehende Daten eigenständig aufgeteilt und mehreren Tabellen zugeordnet werden. Wenn eine Datenbank beispielsweise fortlaufend mit potenziellen Neukunden aktualisiert wird, können Sie ein Miningmodell zusammen mit Integration Services dazu verwenden, die eingehenden Daten zwei verschiedenen Kundengruppen zuzuordnen: Einer Gruppe, deren Kunden wahrscheinlich ein Produkt kaufen, und einer anderen, deren Kunden wahrscheinlich kein Produkt kaufen.
– Erstellen Sie einen Bericht, mit dem Abfragen direkt für ein vorhandenes Miningmodell ausgeführt werden können.
![Page 43: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/43.jpg)
Data Mining
• Microsoft SQL Server 2005 Analysis Services (SSAS) beinhaltet folgende Algorithmen:
– Microsoft Decision Trees-Algorithmus– Microsoft Clustering-Algorithmus– Microsoft Naive Bayes-Algorithmus– Microsoft Association-Algorithmus– Microsoft Sequence Clustering-Algorithmus– Microsoft Time Series-Algorithmus– Microsoft Neural Network-Algorithmus (SSAS)– Microsoft Logistic Regression-Algorithmus– Microsoft Linear Regression-Algorithmus
![Page 44: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/44.jpg)
Data Mining
Naïve BayesNaïve Bayes
Decision TreesDecision Trees ClusteringClustering Time SeriesTime Series
SequenceSequenceClusteringClustering
AssociationAssociation
Neural NetNeural Net
![Page 45: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/45.jpg)
Data Mining: Naïve Bayes
• Einfaches und am einfachesten z implementierendes Modell
• Welches Attribut kann das Attribut am besten vorhersagen?
![Page 46: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/46.jpg)
Data Mining: Decision Tree
• Welcher Attributbaum kann das Ergebnis am besten vorhersagen?
• Zusammenspiel zwischen Attributen.
![Page 47: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/47.jpg)
Data Mining: Cluster
• Welche Untergruppen sind in den Daten enthalten?
• Wie verschieden sind die Untergruppen?
• Finde Muster ohne spezielles Ziel.
![Page 48: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/48.jpg)
Data Mining: Association
• Ähnlich Cluster, aber mit Blick auf eine einzige Transaktion.
• Welche Produkte werden zusammen gekauft (Warenkorbanalyse)?
![Page 49: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/49.jpg)
Data Mining: Sequence Cluster
• Wie Cluster, aber mit Berücksichtigung einer Abfolge
• Welches Ereignis wird wahrscheinlich danach eintreten (Klickpfade)?
• Benötigt ein Attribut, um die Abfolge abzubilden.
![Page 50: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/50.jpg)
Data Mining: Time Series
• Welche Trends sind vorhanden?
• Wie interagieren Trends miteinander?
• Benötigt ein zeitbasiertes Attribut (Vorschau).
![Page 51: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/51.jpg)
Data Mining: Neural Net
• Erstellt eine mehrschichtige Netzwerk von Neuronen
• Wie ein Entscheidungsbaum, aber mit dreidimensionaler Knotenstruktur
![Page 52: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/52.jpg)
Analysis Services-Objekte
• Datenquellen: Datenquelle in Analysis Services.
• Datenquellensichten: ein logisches Datenmodell, das auf mindestens einer Datenquelle in Analysis Services basiert.
• Cubes: Cubes und Cubeobjekte, einschließlich Measures, Measuregruppen, Dimensionsverwendungbeziehungen, Berechnungen, Key Performance Indicators (KPIs), Aktionen, Übersetzungen, Partitionen und Perspektiven.
• Dimensionen: Dimensionen und Dimensionsobjekte, einschließlich Attribute, Attributbeziehungen, Hierarchien, Ebenen und Elemente.
• Miningstrukturen: Miningstrukturen und Miningobjekte, einschließlich Miningmodellen.
• Rollen: eine Rolle, den Sicherheitsmechanismus, der zum Steuern des Zugriffs auf Objekte in Analysis Services verwendet wird.
• Assemblys: eine Auflistung von benutzerdefinierten Funktionen, die zum Erweitern der Sprachen MDX und DMX in Analysis Services verwendet werden.
![Page 53: Microsoft SQL Server 2005 Analysis Services / Data Warehousing / Data Mining Architektur und Verwendung](https://reader035.vdocuments.net/reader035/viewer/2022081520/570491cb1a28ab14218ddfd5/html5/thumbnails/53.jpg)
Fragen...