ad-hoc analiza i olap kocke -...
TRANSCRIPT
Ad-hoc analiza i OLAP kocke
Šta treba znati Šta je poslovna inteligencija
Osobine i razlike OLTP i OLAP sistema
Tok podataka u PI
ETL i problemi izgradnje skladišta
Skladište podataka i osobine
Centri podataka
Alati za analizu
PI i SPO
OLAP analiza
OLAP kocka
• Šta je Olap Kocka
• Čemu služi
• Osnovni Elementi
• Oblasti primene
OLAP kocka
• OLAP Kocka je softversko rešenje koje služi poboljšanju klasičnog načina postavljanja upita i izveštavanja
• Dimenzije – podaci koji čine strukturu kocke
• Mere – agregirani podaci po dimenzijama i članovima dimenzija
Dimenzioni model podataka
OLAP kocka PRIMER
Strategije za ubrzanje1. Denormalizacija
2. Multidimenziona struktura podataka
3. Pre-agregacija
Strategije za ubrzanje Denormalizacija
pojednostavljenje šeme baze (smanjivanje broja tabela)
znatno manji broj potrebnih spajanja (join) tabela, posebno kod složenih upita
ali, više prostora (memorije) zauzeto
Šeme:
jednotabelarna
zvestasta (star) - mere u centralnoj tabeli, dimenzije okolo
pahuljičasta (snowflake) – mere u centralnoj tabeli, dimenzije rasčlanjene (normalizovane) u više tabela
Zvezdasta šema
Pahuljičasta šema
Prodaja
Vreme
KupacProizvod
Tip
proizvoda
GradDrzava
Brend
Strategije za ubrzanje Multidimenziona struktura podataka
zamena za “spajanje po vrednosti” u relacionim bazama
znatno brže spajanje tabela
dodatno indeksiranje i keširanje podataka
ali, može zahtevati dugo vreme za kreiranje
3 vrste OLAP struktura:
ROLAP – relaciona (klasična) struktura
MOLAP – multidimenziona struktura
HOLAP – hibridna struktura, gde su samo izabrani delovi u multidim. strukturi (vrlo često agregacije)
Strategije za ubrzanje Pre-agregacije:
na nivou dana, nedelje, meseca, kvartala, godine
na nivou grada, regije, države
po granularnostima bilo koje dimenzije
ali, zauzima više memorijskog prostora
Hijerarhije dimenzija Granularnost dimenzija
Vreme
Lokacija
Proizvod (kategorija, podkategorija)
Kupac (industrija, podgrana, niša)
Zaposleni?
Drill down, Drill through (u OLTP)
OLAP kocka PRIMER
Domadi zadatak
Northwind
AdwentureWorks
ETL Data Mart
(jednotabelarni)
(ROLAP)
UpitiDodavanje kolona
Spajanje tabelaČišćenje
AccessAccessExcel
TableauExcel
OLTP
Ad-hoc analizeDashboards
Scenario (Story)
Šta treba znati Šta je OLAP kocka i zašto se pravi
Dimenzije i mere
Šeme podataka i denormalizacija
ROLAP, MOLAP, HOLAP
Pre-agregacije
Hijerarhije dimenzija, drill down, drill through