dusko kukavica seminar ski rad

21
1 PANEVROPSKI UNIVERZITET APEIRON FAKULTET POSLOVNE INFORMATIKE Redovne studije Smer „Informatički inžinjering” Predmet Poslovna intelegencija „Data Warhouse” (seminarski rad) Predmetni nastavnik Prof. dr Branko Latinović Student Dusko Kukavica Index br.:161-08/RPI Banja Luka, februar 2011.

Upload: dusko-kukavica

Post on 06-Apr-2018

223 views

Category:

Documents


0 download

TRANSCRIPT

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 1/21

PANEVROPSKI UNIVERZITET APEIRONFAKULTET POSLOVNE INFORMATIKE 

Redovne studije Smer „Informatički inžinjering” 

Predmet Poslovna intelegencija 

„Data Warhouse” (seminarski rad) 

Predmetni nastavnik

Prof. dr Branko Latinović 

Student

Dusko Kukavica 

Index br.:161-08/RPI

Banja Luka, februar 2011.

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 2/21

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 3/21

Uvod 

Danas, više nego ikad,Danas, više nego ikad, menadţerima su potrebni lako dostupni i konzistentnimenadţerima su potrebni lako dostupni i konzistentni

 podaci predstavljeni tako da u isto vrijeme, precizno i saţeto daju prikaz podaci predstavljeni tako da u isto vrijeme, precizno i saţeto daju prikazorganizacije u cjelini kao i njenog okruţenja. MeĊutim sloţeni uslovi poslovanjaorganizacije u cjelini kao i njenog okruţenja. MeĊutim sloţeni uslovi poslovanjagenerišu svakim danom sve veći broj poslovnih dgenerišu svakim danom sve veći broj poslovnih dogaĊaja u okviru preduzeća iogaĊaja u okviru preduzeća iizvan njega, a dobijeni podaci najĉešće su pohranjeni u operativnim bazamaizvan njega, a dobijeni podaci najĉešće su pohranjeni u operativnim bazama

 podataka. Zbog veliĉine takvih baza nije ih moguće pretraţivati u stvarnom podataka. Zbog veliĉine takvih baza nije ih moguće pretraţivati u stvarnomvremenu, a kad se i dobije konaĉni odgovor na upit, obiĉno su to izvještaji uvremenu, a kad se i dobije konaĉni odgovor na upit, obiĉno su to izvještaji u  dvodimenzionalnom obliku na velikom broju stranica i predstavljajudvodimenzionalnom obliku na velikom broju stranica i predstavljajuselektovano prepisivanje podataka iz baze.selektovano prepisivanje podataka iz baze.

Budući da je pravovremeno dobijanje kvalitetnih informacija bitno za ostvarenjeBudući da je pravovremeno dobijanje kvalitetnih informacija bitno za ostvarenje prednosti pred konkurencijom, menadţer ih mora dobiti što prije prednosti pred konkurencijom, menadţer ih mora dobiti što prije i u oblikui u obliku prilagoĊenom njegovim potrebama. Iz toga proizlazi da se od današnjih prilagoĊenom njegovim potrebama. Iz toga proizlazi da se od današnjihinformacionih sistema preduzeća oĉekuje da osiguraju informacije ĉiji sadrţaj,informacionih sistema preduzeća oĉekuje da osiguraju informacije ĉiji sadrţaj,

 brzina pristupa i naĉin prikaza odgovaraju trenutnim potrebama menadţera u brzina pristupa i naĉin prikaza odgovaraju trenutnim potrebama menadţera u procesu odluĉivanja. procesu odluĉivanja. Dok se za potrebe operativnog voĊenja poslovanja koristeDok se za potrebe operativnog voĊenja poslovanja koristeklasiĉne baze podataka, zasnovane na relacionom modelu, koje odraţavajuklasiĉne baze podataka, zasnovane na relacionom modelu, koje odraţavajuaţurno, stvarno stanje poslovnog sistema, a odreĊenim se podacima nakonaţurno, stvarno stanje poslovnog sistema, a odreĊenim se podacima nakonaţuriranja gubi trag, za donošenje pravilnih poslovnihaţuriranja gubi trag, za donošenje pravilnih poslovnih odluka potrebno je imatiodluka potrebno je imati

uvid i u vremenski tok dešavanja poslovnih dogaĊaja, pa takve baze podataka neuvid i u vremenski tok dešavanja poslovnih dogaĊaja, pa takve baze podataka ne predstavljaju zadovoljavajuće rješenje. predstavljaju zadovoljavajuće rješenje. 

Radi toga se prišlo kreiranju novih oblika organizovanja podataka u raĉunarskimRadi toga se prišlo kreiranju novih oblika organizovanja podataka u raĉunarskimmemorijama informacionih sistememorijama informacionih sistema. Razvijena je nova generacija raĉunarskihma. Razvijena je nova generacija raĉunarskihsistema koja se temelji na konceptu skladištenja podataka. Skladište podatakasistema koja se temelji na konceptu skladištenja podataka. Skladište podatakasadrţi podatke prikupljene iz razliĉitih izvora, istorijske o poslovanju preduzećasadrţi podatke prikupljene iz razliĉitih izvora, istorijske o poslovanju preduzećakao i podatke iz vanjskog okruţenja, a dizajniranokao i podatke iz vanjskog okruţenja, a dizajnirano je tako da omogućava je tako da omogućava

 pretraţivanje podataka, on pretraţivanje podataka, on--line analitiĉku obradu, izvještavanje i podrţavanjeline analitiĉku obradu, izvještavanje i podrţavanje procesa donošenja odluka. Skladište podataka je po tehniĉkim zahtjevima i po procesa donošenja odluka. Skladište podataka je po tehniĉkim zahtjevima i po

sadrţaju sasvim drugaĉije od transakcionih sistemasadrţaju sasvim drugaĉije od transakcionih sistema11. Premda je operativna baza. Premda je operativna bazanjegova pretpostavka, skladišta podataka se u svom dizajnu oslanjaju nanjegova pretpostavka, skladišta podataka se u svom dizajnu oslanjaju navišedimenzionalni koncept. Dakle, nova generacija raĉunarskih sistema sada sevišedimenzionalni koncept. Dakle, nova generacija raĉunarskih sistema sada sesastoji od dva dijela, operativnog (transakcijonog) i skladišta podatakasastoji od dva dijela, operativnog (transakcijonog) i skladišta podataka(anal(analitiĉkog), ĉime se postiţe izdvajanje procesa za generisanje informacijaitiĉkog), ĉime se postiţe izdvajanje procesa za generisanje informacija(ekstrakcije, agregacije, izvještaji, analize) koji se po svojoj prirodi razlikuju od(ekstrakcije, agregacije, izvještaji, analize) koji se po svojoj prirodi razlikuju odoperativnih procesa.operativnih procesa. 

1

Transakcioni sistemi- manipulacija transakcijama, procesima koji su frekventni i ponavljajući, paralelno se izvode (primer: bankarski poslovi, rezervacije letova, naruĉivanje robe). (On-Line Transaction Processing) 

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 4/21

DefinicijaDefinicija 

Sam pojam "skladište podataka" (engl. Data Warehouse) podrazumijeSam pojam "skladište podataka" (engl. Data Warehouse) podrazumijeva zbirkuva zbirku podataka izolovanih iz operativnih baza i spremljenih u posebne baze odnosno podataka izolovanih iz operativnih baza i spremljenih u posebne baze odnosno

skladišta podataka. Ralph Kimball u svojoj knjizi "The Data Warehouse Toolkit:skladišta podataka. Ralph Kimball u svojoj knjizi "The Data Warehouse Toolkit:Practical Techniques for Building Dimensional Data Warehouses" definišePractical Techniques for Building Dimensional Data Warehouses" definišeskladište podatakaskladište podataka kao kopiju transakcionih podataka specifiĉno strukturiranihkao kopiju transakcionih podataka specifiĉno strukturiranihza upite i analize.za upite i analize.22

 

Glavna karakteristika koja odreĊuje skladište podataka odnosi se na njegovuGlavna karakteristika koja odreĊuje skladište podataka odnosi se na njegovusvrhu. U skladištu podataka podaci se skupljaju i organizuju na naĉin da budusvrhu. U skladištu podataka podaci se skupljaju i organizuju na naĉin da budulako dostupni da bilako dostupni da bi ih menadţment mogao na brz i jednostavan naĉin koristiti zaih menadţment mogao na brz i jednostavan naĉin koristiti za

 potrebe analize svog poslovanja. potrebe analize svog poslovanja. 

Prema definiciji koju je postavio William H. InmonPrema definiciji koju je postavio William H. Inmon33, skladište podataka, skladište podataka predstavlja subjektno usmjeren (subject predstavlja subjektno usmjeren (subject--oriented), integrisani (integrated), vezanoriented), integrisani (integrated), vezanna vrina vri jeme (time jeme (time--variant) i sadrţajno nepromjenjiv (nonvariant) i sadrţajno nepromjenjiv (non--volatile) skup podataka,volatile) skup podataka,a krajnji cilj mu je pomoć menadţmentu pri donošenju odluka.a krajnji cilj mu je pomoć menadţmentu pri donošenju odluka.  

Subjektna usmjerenost podataka znaĉi da se oni organizuju oko predmeta, naSubjektna usmjerenost podataka znaĉi da se oni organizuju oko predmeta, nanaĉin da daju informacije o taĉno odreĊenimnaĉin da daju informacije o taĉno odreĊenim predmetima u okviru funkcionalnih predmetima u okviru funkcionalnih

 podruĉja (npr. u okviru prodaje, nabavke.) umjesto o tekućim operacijama podruĉja (npr. u okviru prodaje, nabavke.) umjesto o tekućim operacijama preduzeća. Suprotno tome operativne baze podataka organizovane oko preduzeća. Suprotno tome operativne baze podataka organizovane oko poslovnih aplikacija, dakle usmjerene su na tekuće operacije (npr. obrade poslovnih aplikacija, dakle usmjerene su na tekuće operacije (npr. obradenarudţbinarudţbi, isporuka i sl.)., isporuka i sl.). 

IntegrisanostIntegrisanost -- podaci se skupljaju u bazu podataka iz razliĉitih izvora i podaci se skupljaju u bazu podataka iz razliĉitih izvora i pohranjuju uvijek u istom formatu, te su konzistentni i prikazuju se na dosljedan pohranjuju uvijek u istom formatu, te su konzistentni i prikazuju se na dosljedannaĉin.naĉin. 

Vezanost uz vrijemeVezanost uz vrijeme -- svi podaci u skladištu podataka vezani su i identsvi podaci u skladištu podataka vezani su i identifikuju seifikuju seuz odreĊeni vremenski period, što znaĉi da imaju istorijski karakter. Za razlikuuz odreĊeni vremenski period, što znaĉi da imaju istorijski karakter. Za razliku

od njih, u operativnim bazama podataka pohranjeni su samo aktuelni, najsvjeţijiod njih, u operativnim bazama podataka pohranjeni su samo aktuelni, najsvjeţiji podaci. MeĊutim, s gledišta koncepta poslovne inteligencije, sveobuhvatno podaci. MeĊutim, s gledišta koncepta poslovne inteligencije, sveobuhvatno predviĊanj predviĊanje budućih dogaĊaja nije moguće provesti bez poznavanja istorije istihe budućih dogaĊaja nije moguće provesti bez poznavanja istorije istihili nekih drugih dogaĊaja. Iz togaili nekih drugih dogaĊaja. Iz toga sledisledi da premda podaci u skladištu podatakada premda podaci u skladištu podatakaodraţavaju prošlost, njihova usmjerenost je okrenuta budućnosti.odraţavaju prošlost, njihova usmjerenost je okrenuta budućnosti. 

Sadrţajna nepromjenjivostSadrţajna nepromjenjivost -- podaci u skla podaci u skladištu su stabilni i kad se jednomdištu su stabilni i kad se jednom pohrane u skladište u pravilu se ne mijenjaju. Time se omogućuje da pohrane u skladište u pravilu se ne mijenjaju. Time se omogućuje da 

2 A Definition of Data Warehousing", http:// www.dwinfocenter.org/defined.html, 26.3.20043 "The Business Intelligence and Data Warehousing Glossary", http://www.sdgcomputing.com/glossary.htm, 

2.4.2004.

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 5/21

menadţement ili svako ko koristi skladište podataka moţe biti siguran da ćemenadţement ili svako ko koristi skladište podataka moţe biti siguran da ćedobiti jednak odgovor nezavisno od vremena ili uĉestalosti postavljanja upita.dobiti jednak odgovor nezavisno od vremena ili uĉestalosti postavljanja upita. 

Postupak skladištenja podataka predstavlja kontinualan proces planiranja,Postupak skladištenja podataka predstavlja kontinualan proces planiranja,

graĊenja, i prikupljanja podataka iz razliĉitih izvora te njegovog korištenja,graĊenja, i prikupljanja podataka iz razliĉitih izvora te njegovog korištenja,odrţavanja upravljanja i stalnog unaprjeĊenja. MeĊu mnogim koracima u tomodrţavanja upravljanja i stalnog unaprjeĊenja. MeĊu mnogim koracima u tomkompleksnom kontinualnom pr kompleksnom kontinualnom pr ocesu bitno je naglasiti vaţnost posjedovanjaocesu bitno je naglasiti vaţnost posjedovanjavizije o tome što se ţeli postići kreiranjem skladišta podataka. Jedna od ulogavizije o tome što se ţeli postići kreiranjem skladišta podataka. Jedna od ulogaskladišta je primjerice razvijanje i korištenje znanja zasnovanog na podacimaskladišta je primjerice razvijanje i korištenje znanja zasnovanog na podacima(engl. data(engl. data-- based knowledge). Aktivnost skladištenja based knowledge). Aktivnost skladištenja podataka predstavlja podataka predstavljakontinualan proces, a sama investicija uvoĊenja skladišta podataka je skupa ikontinualan proces, a sama investicija uvoĊenja skladišta podataka je skupa idugotrajna. Pa je prilikom procesa donošenja odluke o kreiranju idugotrajna. Pa je prilikom procesa donošenja odluke o kreiranju iimplementaciji skladišta podataka potrebno usaglasiti i niz pitanja bitnih zaimplementaciji skladišta podataka potrebno usaglasiti i niz pitanja bitnih zauspostavljanuspostavljan je projekta skladišta. Na primjer prije implementacije projekta je projekta skladišta. Na primjer prije implementacije projekta

 potrebno je identifikovati poslovni interes za izgradnjom i upotrebom skladišta potrebno je identifikovati poslovni interes za izgradnjom i upotrebom skladišta podataka za potrebe svog poslovanja, dogovoriti izvore finansiranja, razviti podataka za potrebe svog poslovanja, dogovoriti izvore finansiranja, razvitikriterije za odreĊivanje poslovne ukriterije za odreĊivanje poslovne u potrebljivosti skladišta podataka, provesti potrebljivosti skladišta podataka, provestiintervju korisnika o traţenim informacijama, identifikovati izvore podataka zaintervju korisnika o traţenim informacijama, identifikovati izvore podataka za

 popunjavanja skladišta podataka, odluĉiti se za veliĉinu skladišta podataka, popunjavanja skladišta podataka, odluĉiti se za veliĉinu skladišta podataka,utvrditi vrstu sa aspekta sadrţaja, odrediti fiziĉku lok utvrditi vrstu sa aspekta sadrţaja, odrediti fiziĉku lok aciju, donijeti odluku oaciju, donijeti odluku oizgradnji ili kupovini skladišta podataka, napraviti odabir najpovoljnijih alata iizgradnji ili kupovini skladišta podataka, napraviti odabir najpovoljnijih alata isistema za upravljanje bazama, riješiti pitanje zapošljavanja itd. Na krajusistema za upravljanje bazama, riješiti pitanje zapošljavanja itd. Na krajuimplementacije slijedi puštanje sistema u rad, trening korisnika u ciljuimplementacije slijedi puštanje sistema u rad, trening korisnika u cilju potpunog potpunog

iskorištenja instaliranih alata, upravljanje sistemom skladištenja dodavanjem,iskorištenja instaliranih alata, upravljanje sistemom skladištenja dodavanjem,modifikovanjem i razvijanjem istog itd.modifikovanjem i razvijanjem istog itd. 

Uloga skladišta podataka 

Iz prethodno navedenih definicija, obiĉnim jezikom reĉeno, glavni cilj skladištaIz prethodno navedenih definicija, obiĉnim jezikom reĉeno, glavni cilj skladišta podataka je oslobod podataka je osloboditi informacije koje su "zakljuĉane" u bazama podataka iiti informacije koje su "zakljuĉane" u bazama podataka i"pomiješati" ih s informacijama iz ostalih, u pravilu vanjskih izvora podataka."pomiješati" ih s informacijama iz ostalih, u pravilu vanjskih izvora podataka.Velike organizacije danas sve više traţe dodatne podatke iz vanjskih izvora, kaoVelike organizacije danas sve više traţe dodatne podatke iz vanjskih izvora, kao

što su npr. podaci o konkurenciji, demšto su npr. podaci o konkurenciji, demografski trendovi, prodajni trendovi i sl.ografski trendovi, prodajni trendovi i sl.

Da bi skladište podataka moglo ispuniti cilj i svrhu svog postojanja, mora prijeDa bi skladište podataka moglo ispuniti cilj i svrhu svog postojanja, mora prijesvega ispuniti sljedeće preduslove:svega ispuniti sljedeće preduslove: 

  Mora osiguravati pristup svim zaposlenim u preduzeću, a ne samo menadţerima, znaĉimoţe sluţiti velikom broju ljudi. Taj pristup mora biti pouzdan, brz i jednostavan.

  Skladište treba sadrţavati veliku koliĉinu detaljnih podataka. To znaĉi da sve poslovne 

transakcije relevantne za donošenje poslovnih odluka, koje su nastale u procesima

 preduzeća moraju biti evidentirane u skladištu podataka. Uneseni podaci trebaju bitikonzistentni, npr. ako je sa dva razliĉita mjesta u razliĉito vrijeme postavljen jednak 

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 6/21

upit i rezultat tih upita mora biti isti.

  Osvjeţavanje, odnosno aţuriranje novim podacima treba biti kontinualan proces, pomogućnosti treba se odvijati u stvarnom vremenu praktiĉno odmah nakon što se neki

 poslovni dogaĊaj odigrao ili odmah po završetku nekog procesa.

  Mora biti uvijek raspoloţivo i oblikovano na naĉin da moţe posluţiti svakoj svrsi kojunije uvijek moguće unaprijed predvidjeti. 

  Treba predvidjeti mogućnost izdvajanja i meĊusobnog povezivanja podataka u smisludobijanja svih mjera i pokazatelja poslovanja u poduzeću (engl. slice and dice). 

  Podaci u skladištu koji se skupljaju iz razliĉitih izvora, ĉiste se uz osiguranje kvalitetai samo takvi su dostupni korisnicima. Loši ulazni podaci ne mogu davati dobre izlaznepodatke.

  Mora biti proširivo da bi moglo pratiti strategiju proširenja poslovanja preduzeća. 

  I na kraju, mora zadovoljiti odgovarajuće mjere zaštite tajnosti osjetljivih podataka štose postiţe provoĊenjem rigoroznih mjera ĉuvanja tajnosti. 

Osnovne funkcije skladišta podataka 

Uspostavljanjem skladišta podataka operativne baze podataka rasterećuju seUspostavljanjem skladišta podataka operativne baze podataka rasterećuju sesloţenih upita pa dolazi do unapreĊenja njihovih operativnih funkcija. Izsloţenih upita pa dolazi do unapreĊenja njihovih operativnih funkcija. Izoperativnih baza time je uklonjena ogromna masa najĉešće istorijskih podataka ioperativnih baza time je uklonjena ogromna masa najĉešće istorijskih podataka i

 preseljena je u skladište p preseljena je u skladište podataka. Informacioni sistem sastoji se sada od dvaodataka. Informacioni sistem sastoji se sada od dvadijela, operativnog dijela i skladišta podataka. Budući da se tako lakše kontrolišedijela, operativnog dijela i skladišta podataka. Budući da se tako lakše kontrolišei restrukturira on postaje puno produktivniji.i restrukturira on postaje puno produktivniji. 

Pomoću tehnika otkrivanja znanja skladište podataka osigurava stalnoPomoću tehnika otkrivanja znanja skladište podataka osigurava stalno pro pronalaţenje novih informacija zavisno od novonastalih uslova i zahtjeva.nalaţenje novih informacija zavisno od novonastalih uslova i zahtjeva.Procesi za generisanje informacija (ekstrakcije, agregacije, analize, izvještajiProcesi za generisanje informacija (ekstrakcije, agregacije, analize, izvještajiitd.) izdvojeni su iz operativnih procesa, što znaĉi da operativni nivo sistemaitd.) izdvojeni su iz operativnih procesa, što znaĉi da operativni nivo sistema

više nije njima opterećeviše nije njima opterećen. Sada skladište podataka postaje mjesto skupljanja in. Sada skladište podataka postaje mjesto skupljanja i pohranjivanja poslovnih podataka i izvor informacija korištenih pri poslovnom pohranjivanja poslovnih podataka i izvor informacija korištenih pri poslovnomodluĉivanju.odluĉivanju. 

Strukturu skladišta podataka ĉine dva osnovna dijela, a to su podaci i mehanizmiStrukturu skladišta podataka ĉine dva osnovna dijela, a to su podaci i mehanizmimanipulacije tim podacima. Dmanipulacije tim podacima. Dio skladišta gdje se nalaze podaci sastoji se odio skladišta gdje se nalaze podaci sastoji se odosnovnih podataka i agregiranih višedimenzionalnih podatakaosnovnih podataka i agregiranih višedimenzionalnih podataka44, a mehanizme, a mehanizmemanipulacije predstavljaju procesi ekstrakcije, transformacije i punjenjamanipulacije predstavljaju procesi ekstrakcije, transformacije i punjenja

4 Agregacija –  apstrakcija u kojoj se skup objekata i njihovih meĊusobnih veza tretira kao novi, jedinstveni, agregirani tip. Agregirani objekat

kao svoje komponente ima objekte koji ĉine agregaciju, a moţe da ima, kao celina i svoje sopstvene atribute i moţ e kao celina da stupa u

vezu sa drugim objektima u modelu.

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 7/21

 podataka (ETL) sistem upravljanja podacima, postupci analit podataka (ETL) sistem upravljanja podacima, postupci analitiĉke obradeiĉke obrade podataka i sama prezentacija podataka. podataka i sama prezentacija podataka. 

 Na slici 1. prikazana Na slici 1. prikazana je struktura skladišta podataka predstavljena u dva dijela je struktura skladišta podataka predstavljena u dva dijela 

Slika1.Slika1. 

Osnovna funkcija skladišta podataka je skupljanje podataka i stvaranje logiĉkiOsnovna funkcija skladišta podataka je skupljanje podataka i stvaranje logiĉkiintegrisanih i predmetno usmjerenih informacija. Treba ga oblikovati naintegrisanih i predmetno usmjerenih informacija. Treba ga oblikovati na naĉinnaĉinda se moţe na jednostavan naĉin i brzo prilagoĊavati svim promjenama ida se moţe na jednostavan naĉin i brzo prilagoĊavati svim promjenama izahtjevima poslovnog okruţenja. S obzirom na predmetnu usmjerenostzahtjevima poslovnog okruţenja. S obzirom na predmetnu usmjerenost

 podataka, pri modelovanju skladišta primjenjuju se tehnike koje podrţavaju podataka, pri modelovanju skladišta primjenjuju se tehnike koje podrţavaju

 predmetnu orijentaciju te osiguravaj predmetnu orijentaciju te osiguravaju dovoljnu prilagodljivost da bi se tokomu dovoljnu prilagodljivost da bi se tokomvremena mogli integrisati i podaci iz mogućnih dodatnih izvora. Skladištevremena mogli integrisati i podaci iz mogućnih dodatnih izvora. Skladište

 podataka treba biti izvor stabilnih podataka, nezavisnih od eventualnih promjena podataka treba biti izvor stabilnih podataka, nezavisnih od eventualnih promjenau poslovnim procesima. Iz tog razloga potrebno je koristitiu poslovnim procesima. Iz tog razloga potrebno je koristiti model neosjetljiv namodel neosjetljiv nauticaje operativnih procesa koji kreiraju većinu podataka. OsloboĊenouticaje operativnih procesa koji kreiraju većinu podataka. OsloboĊenooperativnih obrada, skladište podataka osigurava unapreĊenje procesaoperativnih obrada, skladište podataka osigurava unapreĊenje procesagenerisanja informacija, a kroz tehnike otkrivanja znanja osigurava stalnogenerisanja informacija, a kroz tehnike otkrivanja znanja osigurava stalno

 pronalaţenje novih i pronalaţenje novih informacija.nformacija. 

sistem za

upravljanje

odacima

prezentacija

informacije

analitička obrada 

višedimenzionalni

odaci

osnovni podaci

ETL procesi

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 8/21

ETL procesi 

Kao što je već prethodno reĉeno, podaci ulaze u skladište podataka iz razliĉitihKao što je već prethodno reĉeno, podaci ulaze u skladište podataka iz razliĉitih

izvora, najĉešće iz transakcionih sistema preduzeća. Najopseţniji posao uizvora, najĉešće iz transakcionih sistema preduzeća. Najopseţniji posao uaktivnostima skladištenja podataka predstavljaju procesi integrisanja podaaktivnostima skladištenja podataka predstavljaju procesi integrisanja podataka itaka iorganizovanje njihovog sadrţaja. Pri tom glavnu ulogu predstavlja skup procesaorganizovanje njihovog sadrţaja. Pri tom glavnu ulogu predstavlja skup procesakojima je zadatak obuhvatanje, preoblikovanje i punjenje ili unošenje podatakakojima je zadatak obuhvatanje, preoblikovanje i punjenje ili unošenje podatakaiz jednog ili više transakcionih sistema u skladište podataka.iz jednog ili više transakcionih sistema u skladište podataka. 55 Zajedniĉki im jeZajedniĉki im jenaziv ETL procesi, nastao od prvih slova engleskih rijeĉi extraction,naziv ETL procesi, nastao od prvih slova engleskih rijeĉi extraction,transformation and loading.transformation and loading. 

Prije samog poĉetka ETL procesa potrebno je izvršiti pripremne aktivnostiPrije samog poĉetka ETL procesa potrebno je izvršiti pripremne aktivnosti

vezane uz reformu, usklaĊivanje i ĉišćenje podataka. Izvorne podavezane uz reformu, usklaĊivanje i ĉišćenje podataka. Izvorne podatketkezaprimljene iz razliĉitih datoteka i baza podataka potrebno je unificirati odnosnozaprimljene iz razliĉitih datoteka i baza podataka potrebno je unificirati odnosno prikazati u jedinstvenom formatu. U tom formatu podaci će se koristiti u svim prikazati u jedinstvenom formatu. U tom formatu podaci će se koristiti u svimdaljnjim fazama obrade. UsklaĊivanje podataka se provodi da bi se izbjegladaljnjim fazama obrade. UsklaĊivanje podataka se provodi da bi se izbjeglaredundancija podredundancija podataka. Osim što se u informacionom sistemu isti podaci moguataka. Osim što se u informacionom sistemu isti podaci mogu

 pojaviti na više mjesta, oni znaju biti i nedosljedni, odnosno njihove vrijednosti pojaviti na više mjesta, oni znaju biti i nedosljedni, odnosno njihove vrijednostinisu iste na svim mjestima kojima se ti podaci javljaju. Radi toga potrebno ih jenisu iste na svim mjestima kojima se ti podaci javljaju. Radi toga potrebno ih jeotkriti i uskladiti. Ĉišćenje k otkriti i uskladiti. Ĉišćenje k ao pripremna aktivnost ETL procesa ima zadatak ao pripremna aktivnost ETL procesa ima zadatak ukloniti one podatke koji se pojavljuju kao posljedica ranijih grešaka u raduukloniti one podatke koji se pojavljuju kao posljedica ranijih grešaka u radu

informacionih sistema (greške podrazumijevaju podatke koji nisu kompletni,informacionih sistema (greške podrazumijevaju podatke koji nisu kompletni,taĉni, konzistentni i sl.) ili zbog namjernih ubacivanjataĉni, konzistentni i sl.) ili zbog namjernih ubacivanja netaĉnih i laţnih podatakanetaĉnih i laţnih podatakau sistem (raĉunarski virusi i sl.).u sistem (raĉunarski virusi i sl.). 

Uopšteno, karakteristika standardnih ETL alata je da, ako imaju boljeUopšteno, karakteristika standardnih ETL alata je da, ako imaju bolje performanse vezane uz procese ĉišćenja, tada im je slabiji kapacitet vezan uz performanse vezane uz procese ĉišćenja, tada im je slabiji kapacitet vezan uz procese transformacije ili procese transformacije ili obrnuto. Pa je prije izbora potrebno znatiobrnuto. Pa je prije izbora potrebno znatikarakteristike podataka koji će se slijevati u skladište podataka. Na primjer, akokarakteristike podataka koji će se slijevati u skladište podataka. Na primjer, akose unaprijed zna da će biti puno podataka koji zahtjevaju postupak se unaprijed zna da će biti puno podataka koji zahtjevaju postupak transformacije, tada treba odabrati ETL alate koji su "jaĉi" utransformacije, tada treba odabrati ETL alate koji su "jaĉi" u procesima procesima

transformacije, ili obrnuto.transformacije, ili obrnuto. 

Ekstrakcija podataka 

Proces ekstrakcije podataka potrebno je provoditi na naĉin da pri tom redovniProces ekstrakcije podataka potrebno je provoditi na naĉin da pri tom redovnioperativni poslovi što manje trpe. Pa su programi i alati za ekstrakcijuoperativni poslovi što manje trpe. Pa su programi i alati za ekstrakcijuoblikovani tako da ETL procese mogu obavljoblikovani tako da ETL procese mogu obavljati što produktivnije uz nastojanjeati što produktivnije uz nastojanjeda potrebne podatke iz operativnih procesa zaprimaju što je moguće brţe. Prida potrebne podatke iz operativnih procesa zaprimaju što je moguće brţe. Pritom se kao problem moţe pojaviti potencijalno visok stepen redundancijetom se kao problem moţe pojaviti potencijalno visok stepen redundancije

5 Panian Ţ., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003., str 86. 

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 9/21

 podataka u transakcionim sistemima, pa treba odabrati takav pristup eks podataka u transakcionim sistemima, pa treba odabrati takav pristup eks trakcijitrakcijikojim se vrši zahvatanje samo onih podataka koji će se koristiti u aplikacijamakojim se vrši zahvatanje samo onih podataka koji će se koristiti u aplikacijama

 poslovne inteligencije. poslovne inteligencije. 

Proces transformacije podataka 

U okviru ETL procesa najviše vremena troši se na postupak transformacijeU okviru ETL procesa najviše vremena troši se na postupak transformacije podataka, prema struĉnim procjenama i podataka, prema struĉnim procjenama i preko 80 posto od ukupnog ETL preko 80 posto od ukupnog ETL procesa. U postupku transformacije mogu se pojaviti razliĉiti problemi koji procesa. U postupku transformacije mogu se pojaviti razliĉiti problemi kojiusporavaju proces, a kao najĉešći javljaju se:usporavaju proces, a kao najĉešći javljaju se:66 

  Nekonzistentne vrijednosti podataka - pojavljuju se prilikom kopiranja podataka, a

kopija pri tom nije potpuno vjerna orginalu.

   Nepodudarnost primarnih kljuĉeva korištenih u izvornim datotekama i bazama podataka s primarnim kljuĉevima koje pretpostavljaju aplikacije poslovneinteligencije.

   Netaĉne vrijednosti podataka -  potrebno je definisati logiku ĉišćenja za ispravljanjenetaĉnih vrijednosti podataka. Ĉišćenje je potrebno provoditi stalno, odnosno svakimnovim ciklusom punjenja podataka.

  Razliĉiti formati podataka - format podataka, na primjer broj ţiro-raĉuna kupca nijeevidentiran u operativnoj bazi u istom formatu kako ga oĉekuje alat poslovneinteligencije te ga treba prilagoĊavati. 

  Problem sinonima i homonima -  ponekad se isti podaci pojavljuju pod razliĉitimnazivima. Isto tako dogaĊa se da razliĉiti podaci nose isti naziv tj. govori se ohomonimima. Oba sluĉaja su nepoţeljna i treba ih uklanjati premda pretpostavljajuvelik dodatni posao.

  "Skrivena" procesna logika - moţe predstavljati problem koji usporava procestransformacije kad se za zahvatanje podataka koriste softverski sistemi stari nekoliko

decenija i danas više nitko ne zna kako oni rade. U njima se moţe naići na arhaiĉneodnose meĊu podacima koje nije lako protumaĉiti i ukoliko je potrebno transformisati

u neki drugi poznati tip odnosa. Takva procesna logika moţe biti velik problem kaoizvor grešaka koje treba ispravljati. 

  Iako proces transformacije podataka podrazumijeva paţljiv, dugotrajan i savjestan posao, potrebno ga je savjesno i do kraja u cjelini izvršiti. 

6 Panian Ţ., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003., str 89. 

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 10/21

10 

Procesi punjenja skladišta podataka 

Slika2. Mjesto i tok ETL procesa u kreiranju koncepta poslovne inteligencijeSlika2. Mjesto i tok ETL procesa u kreiranju koncepta poslovne inteligencije 

Podaci u transakcionim sistemima nalaze se u bazama podataka koje obuhvatajuPodaci u transakcionim sistemima nalaze se u bazama podataka koje obuhvatajukraĉi vremenski period pa nisu dovoljni kao podloga za kvalitetnekraĉi vremenski period pa nisu dovoljni kao podloga za kvalitetne analize ianalize i

 pomoć odluĉivanju. Pored njih, dio izvornih podataka koji se obraĊuju ETL pomoć odluĉivanju. Pored njih, dio izvornih podataka koji se obraĊuju ETL procesima ĉine i istorijski podaci. Pa se za procese punjenja skladišta podataka procesima ĉine i istorijski podaci. Pa se za procese punjenja skladišta podatakakoristi više vrsta ETL programa kao što su programi za inicijalno punjenje, zakoristi više vrsta ETL programa kao što su programi za inicijalno punjenje, za

 punjenje is punjenje istorijskih podataka i programi za inkrementalno punjenje.torijskih podataka i programi za inkrementalno punjenje. 

Karakteristika programa za inicijalno punjenje skladišta podataka jest da sadrţeKarakteristika programa za inicijalno punjenje skladišta podataka jest da sadrţerutine za ĉišćenje i usklaĊivanje podataka, da bi se iz podataka uklonile greške.rutine za ĉišćenje i usklaĊivanje podataka, da bi se iz podataka uklonile greške.Kod istorijskih podataka ponekad nKod istorijskih podataka ponekad nije moguće primijeniti postupke ĉišćenja kojiije moguće primijeniti postupke ĉišćenja kojise primjenjuju za "ţive" podatke, jer je od vremena nastanka tih podataka dose primjenjuju za "ţive" podatke, jer je od vremena nastanka tih podataka dodanas moţda došlo do razliĉitih promjena u slogovima i formatima podataka. Padanas moţda došlo do razliĉitih promjena u slogovima i formatima podataka. Pase za tu kategoriju podataka primjenjuju programi za puse za tu kategoriju podataka primjenjuju programi za punjenje istorijskihnjenje istorijskih

 podataka koji ĉine nastavak inicijalnog punjenja. Za razliku od ţivih, istorijski podataka koji ĉine nastavak inicijalnog punjenja. Za razliku od ţivih, istorijski

su podaci statiĉnog karaktera i sada ĉine samo sadrţaj arhivskih datoteka. Trećusu podaci statiĉnog karaktera i sada ĉine samo sadrţaj arhivskih datoteka. Trećuvrstu predstavljaju programi za inkrementalno punjenje podataka, a aktivir vrstu predstavljaju programi za inkrementalno punjenje podataka, a aktivir aju seaju senakon što su prethodna dva programa obavili postupak ĉišćenja i usklaĊivanjanakon što su prethodna dva programa obavili postupak ĉišćenja i usklaĊivanja

 podataka. Njihova karakteristika je da se pokreću po periodama i oni podataka. Njihova karakteristika je da se pokreću po periodama i oni predstavljaju stalno aktivan mehanizam punjenja skladišta podataka predstavljaju stalno aktivan mehanizam punjenja skladišta podatakaodgovarajućim sadrţajima. Na slici 2odgovarajućim sadrţajima. Na slici 2. prikazan je tok ETL procesa vaţnih u. prikazan je tok ETL procesa vaţnih ukreiranju skladišta podataka i jednim od preduslova za razvijenje i primjenukreiranju skladišta podataka i jednim od preduslova za razvijenje i primjenukoncepta poslovne inteligencije.koncepta poslovne inteligencije. 

Skladište  Izvještaji Transakcione baze  podataka  BI

podataka

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 11/21

11 

Osnovni modeli skladišta podataka 

Prilikom kreiranja skladišta podataka danas u praksi susrećemo tri osPrilikom kreiranja skladišta podataka danas u praksi susrećemo tri osnovnanovna

modela ili osnovne arhitekture skladišta podataka: dvoslojna arhitektura smodela ili osnovne arhitekture skladišta podataka: dvoslojna arhitektura s jednim zajedniĉkim skladištem podataka, dvoslojna arhitektura s više nezavisnih jednim zajedniĉkim skladištem podataka, dvoslojna arhitektura s više nezavisnihlokalnih skladišta podataka (engl. Data Marts) i troslojna arhitektura salokalnih skladišta podataka (engl. Data Marts) i troslojna arhitektura sazajedniĉkim skladištezajedniĉkim skladištem podataka i više povezanih lokalnih skladišta podataka.m podataka i više povezanih lokalnih skladišta podataka. 

Dvoslojna arhitektura s jednim zajedničkim skladištem podataka 

Ovaj model karakteriše jedinstveno, zajedniĉko centralizovano skladišteOvaj model karakteriše jedinstveno, zajedniĉko centralizovano skladište podataka. podataka. Podaci se zaprimaju iz razliĉitih izvora unutar organizacije (npr.Podaci se zaprimaju iz razliĉitih izvora unutar organizacije (npr.

 podaci iz online sistema za obradu transakcija, podaci iz ranije razvijenih podaci iz online sistema za obradu transakcija, podaci iz ranije razvijenihsistema koji odrţavaju baze podataka itd.) i vanjskih izvora podataka dostupnihsistema koji odrţavaju baze podataka itd.) i vanjskih izvora podataka dostupnih putem Interneta ili nekim drugim putem Interneta ili nekim drugim naĉinima. Karakteristika dvoslojne arhitekturenaĉinima. Karakteristika dvoslojne arhitektureskladišta je da ono sluţi većem broju organizacionih jedinica preduzeća kao iskladišta je da ono sluţi većem broju organizacionih jedinica preduzeća kao i

 pojedinaĉnim korisnicima. Takva skladišta su velikog obima i vrlo sloţena, a u pojedinaĉnim korisnicima. Takva skladišta su velikog obima i vrlo sloţena, a unjima se u pravilu skladišti ogromna koliĉina podatnjima se u pravilu skladišti ogromna koliĉina podataka. Pa i šeme podatakaaka. Pa i šeme podataka

 prema kojima se vrši pohranjivanje podataka trebaju podrţavati široku lepezu prema kojima se vrši pohranjivanje podataka trebaju podrţavati široku lepezuaplikacijskih zahtjeva. Iz navedenog je vidljivo da su troškovi odrţavanja takveaplikacijskih zahtjeva. Iz navedenog je vidljivo da su troškovi odrţavanja takvearhitekture visoki i pretpostavljaju znatan angaţman i vrijeme odreĊenog barhitekture visoki i pretpostavljaju znatan angaţman i vrijeme odreĊenog b roja iroja i

 profila struĉnjaka. profila struĉnjaka. 

Dvoslojna arhitektura s više nezavisnih lokalnih skladišta podataka 

Karakteristika ove arhitekture skladišta podataka je postojanje većeg brojaKarakteristika ove arhitekture skladišta podataka je postojanje većeg brojanezavisnih lokalnih skladišta podataka namijenjenih za podrţavanjenezavisnih lokalnih skladišta podataka namijenjenih za podrţavanje

 pojedinaĉnih apl pojedinaĉnih aplikacija po organizacionim jedinicama preduzeća. Rezultat takveikacija po organizacionim jedinicama preduzeća. Rezultat takvearhitekture je velik broj sistema koji svaki posebno zaprimaju "svoje" podatke izarhitekture je velik broj sistema koji svaki posebno zaprimaju "svoje" podatke izrazliĉitih transakcionih baza podataka. Prednost navedenog modela skladištarazliĉitih transakcionih baza podataka. Prednost navedenog modela skladišta

 podataka je jednostavnija izgradnja podataka je jednostavnija izgradnja i lakše korištenje. MeĊutim takav model imai lakše korištenje. MeĊutim takav model ima

i nedostatke kao što su:i nedostatke kao što su:   oteţana komunikacija meĊu organizacionim jedinicama preduzeća. Ovaj model nije

 pogodan za preduzeća ĉije poslovanje zahtjeva podršku aplikacija i projekata koji pretpostavljaju meĊusobnu  komunikaciju i saradnju većeg broja organizacionih jedinica preduzeća, 

   povećanjem broja meĊusobno nezavisnih skladišta podataka, usporedno raste iopterećenost samih transakcionih sistema, 

  data mart-ovi oblikovani su tako da podrţavaju samo jednu aplikaciju, pa naknadno

dodavanje novih aplikacija u odreĊeno skladište predstavlja poteškoće, 

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 12/21

12 

  ograniĉena proširivost platforme i 

  oteţan je uvid u stvarno stanje informacija na nivou preduzeća. 

Troslojna arhitektura skladišta podataka 

Ovaj model sastojOvaj model sastoji se od većeg broja lokalnih skladišta podataka i jednogi se od većeg broja lokalnih skladišta podataka i jednogzajedniĉkog skladišta podataka koje je smješteno izmeĊu skladišta podataka izajedniĉkog skladišta podataka koje je smješteno izmeĊu skladišta podataka irazliĉitih izvora podataka unutar i izvan preduzeća. Skladišta podataka oslanjajurazliĉitih izvora podataka unutar i izvan preduzeća. Skladišta podataka oslanjajuse na centralno skladište podataka kojese na centralno skladište podataka koje im isporuĉuje podatke u obliku koji dajeim isporuĉuje podatke u obliku koji dajeujednaĉen uvid u sve segmente poslovanja preduzeća. U odnosu na prethodnaujednaĉen uvid u sve segmente poslovanja preduzeća. U odnosu na prethodnadva modela prednosti troslojne arhitekture su veća taĉnost informacija nevezanodva modela prednosti troslojne arhitekture su veća taĉnost informacija nevezanos kojeg izvora su zahvaćene, olakšana je komunikacija meĊu or s kojeg izvora su zahvaćene, olakšana je komunikacija meĊu or ganizacionimganizacionim

 jedinicama, smanjena je opterećenost informatiĉara, povećana je skalabilnost i jedinicama, smanjena je opterećenost informatiĉara, povećana je skalabilnost i proširivost platforme za skladištenje podataka i na kraju ova arhitektura pruţa proširivost platforme za skladištenje podataka i na kraju ova arhitektura pruţamogućnost korištenja vanjskih aplikacija ĉime se omogućava povezivanje svihmogućnost korištenja vanjskih aplikacija ĉime se omogućava povezivanje svihsubjekatsubjekata u lancu vrijednosti.a u lancu vrijednosti. 

 Na slici 3. prikazan je primjer troslojnog modela sistema skladištenja podataka. Na slici 3. prikazan je primjer troslojnog modela sistema skladištenja podataka. 

SSlliik k aa 33.. TTrroosslloo j jnnii mmooddeell ssiisstteemmaa ssk k llaaddiišštteenn j jaa ppooddaattaak k aa 

Istorijskipodaci

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 13/21

13 

Implementacija skladišta podataka u poslovni subjekt 

Razvoj i implementacija sistema skladišta podataka zahtijeva dosta vremena iRazvoj i implementacija sistema skladišta podataka zahtijeva dosta vremena i

znaĉajna finansijska sredstva. MeĊutim kako su danas uspješna preduzećaznaĉajna finansijska sredstva. MeĊutim kako su danas uspješna preduzećasvjesna ĉinjenice da posjedovanje pravih i pravovremenih informacijasvjesna ĉinjenice da posjedovanje pravih i pravovremenih informacija predstavlja "stratešku imovi predstavlja "stratešku imovinu" odnosno mogućnost brze reakcije na stanja nanu" odnosno mogućnost brze reakcije na stanja natrţištu, odluĉuju se na korištenje tehnologije skladišta podataka jer je upravo onatrţištu, odluĉuju se na korištenje tehnologije skladišta podataka jer je upravo ona

 preduslov za brzo i fleksibilno pretraţivanje podataka. preduslov za brzo i fleksibilno pretraţivanje podataka. 

Jedan od praktiĉnih pristupa je postepena izgradnja sistema uz suk Jedan od praktiĉnih pristupa je postepena izgradnja sistema uz suk cesivnocesivnonadograĊivanje. Ukoliko se primjeni taj pristup, završni korak predstavljanadograĊivanje. Ukoliko se primjeni taj pristup, završni korak predstavljakreiranje troslojnog modela sistema skladištenja podataka. Sam postupak kreiranje troslojnog modela sistema skladištenja podataka. Sam postupak 

zapoĉinje razvojem nekoliko skladišta podataka koja podrţavaju troslojnuzapoĉinje razvojem nekoliko skladišta podataka koja podrţavaju troslojnuarhitekturu. Nakon odreĊenogarhitekturu. Nakon odreĊenog vremena, kad je već razvijen odreĊeni brojvremena, kad je već razvijen odreĊeni brojskladišta podataka, tok i izgradnja centralnog skladišta i odvajanje od pojedinihskladišta podataka, tok i izgradnja centralnog skladišta i odvajanje od pojedinihskladišta podataka.skladišta podataka. 

Tok izgradnje sistema skladištenja podataka sastoji se od nekoliko faza koje seTok izgradnje sistema skladištenja podataka sastoji se od nekoliko faza koje senadovezuju:nadovezuju:77 

1.  UtvrĊivanje zajedniĉkih elemenata svih predmetnih podruĉja koje ima smisla 

ugraditi u svako lokalno skladište podataka, s ciljem osiguranja integracije svih  

elemenata u jedinstveni model.

2.  Razvoj prve pilot-aplikacije kojoj se pridruţuje prvo skladište podataka. Skladište podataka podijeljeno je na dvije komponente: na miniskladište i na 

skladište podataka. Miniskladište se fiziĉki pohranjuje kao nezavisna relaciona baza podataka. Komponenta skladišta podataka zahvaća podatke iz miniskladišta inakon obrade puni ih u relacione tabele rezervisane za zbirne podatke.

3.  U trećoj fazi slijedi postupno aktiviranje novih skladišta podataka i razvijanjadaljnjih aplikacija potrebnih za zahvatanje njima potrebnih informacija iz "mini

skladišta" razvijenog s prvim skladištem. 

4.  U ĉetvrtoj fazi dolazi do odvajanja skladišta podataka. Postepenim prethodnimdodavanjem novih aplikacija mini skladište razvija se u sveobuhvatno centralnoskladište podataka koje u potpunosti zadovoljava potrebe svih skladišta podatakaza ekstrakcijom informacija. Budući da sva skladišta podataka zaprimajuinformacije iz centralno kontrolišenog skladišta podataka, dobijeni podaci sunormalizovani i konzistentni. Samo centralno skladište moguće je sada premjestitina posebnu server platformu ĉime se završava pr oces kreiranja troslojnog modela

sistema skladištenja podataka. 

7 Panian Ţ., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003., str. 101.

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 14/21

14 

Postepena izgradnja i implementacija sistema skladišta podataka predstavljaPostepena izgradnja i implementacija sistema skladišta podataka predstavlja prihvatljivije rješenje za većinu preduzeća jer ga je moguće ostvariti uz prihvatljivije rješenje za većinu preduzeća jer ga je moguće ostvariti uzvremensko razgraniĉenje troškova.vremensko razgraniĉenje troškova. 

UvoĊenUvoĊen jem ovog sistema u preduzeće i "puštanjem u rad" završen je jedan velik  jem ovog sistema u preduzeće i "puštanjem u rad" završen je jedan velik  posao, meĊutim to nije i sam kraj. Implementacijom skladišta podataka i posao, meĊutim to nije i sam kraj. Implementacijom skladišta podataka ikorištenjem njegovih "usluga" u praksi, pojavit će se nova pitanja i zadaci skorištenjem njegovih "usluga" u praksi, pojavit će se nova pitanja i zadaci s

 pozitivnim i negativnim predznakom pozitivnim i negativnim predznakom, koja će trebati rješavati. Na primjer u, koja će trebati rješavati. Na primjer u postupku skladištenja podataka i korištenja dobijenih informacija, pojavit će se postupku skladištenja podataka i korištenja dobijenih informacija, pojavit će se potreba za podacima koje nije moguće zahvatiti iz postojećih transakcionih potreba za podacima koje nije moguće zahvatiti iz postojećih transakcionihsistema. U takvim sluĉajevima, za nadopunu tim podacima, psistema. U takvim sluĉajevima, za nadopunu tim podacima, pojavit će se potrebaojavit će se potrebaza nadogradnjom ili modifikacijom sistema za transakcijsku obradu podataka iliza nadogradnjom ili modifikacijom sistema za transakcijsku obradu podataka ilirazvoja sistema namijenjenom za zahvatanje podataka koji nedostaju.razvoja sistema namijenjenom za zahvatanje podataka koji nedostaju.Tradicionalni projekti zapoĉinju sa zahtjevima, a završavaju s podacima,Tradicionalni projekti zapoĉinju sa zahtjevima, a završavaju s podacima,

 projekti skladi projekti skladištenja podataka startaju s podacima, a završavaju za zahtjevima.štenja podataka startaju s podacima, a završavaju za zahtjevima.Konkretno, jednom kad korisnici skladišta podataka uoĉe sve mogućnosti kojeKonkretno, jednom kad korisnici skladišta podataka uoĉe sve mogućnosti kojeim pruţa tehnologija novog doba, oni će traţiti i više, što samo po sebi i nijeim pruţa tehnologija novog doba, oni će traţiti i više, što samo po sebi i nijeloše. Pa prilikom projektovanja sklloše. Pa prilikom projektovanja skladišta podataka, korisnicima skladištaadišta podataka, korisnicima skladišta

 podataka ne treba postavljati samo pitanja koje informacije trebaju i ţele sada, podataka ne treba postavljati samo pitanja koje informacije trebaju i ţele sada,već i koje informacije će trebati nakon njih.već i koje informacije će trebati nakon njih. 

S druge pak strane mnogi krajnji korisnici skladišta podataka, koji su prošliS druge pak strane mnogi krajnji korisnici skladišta podataka, koji su prošlitrening i otrening i o buĉeni za njegovo korištenje, nikad u potpunosti ne koriste sve buĉeni za njegovo korištenje, nikad u potpunosti ne koriste sve

mogućnosti koje im skladište pruţa. Prema nekim istraţivanjima, samo ĉetvrtinamogućnosti koje im skladište pruţa. Prema nekim istraţivanjima, samo ĉetvrtinaosposobljenih u potpunosti koristi usluge skladišta podatakaosposobljenih u potpunosti koristi usluge skladišta podataka 

Dimenzioni model podatakaDimenzioni model podataka 

U transakcijskimU transakcijskim sistemima se koristi relacijski model podataka koji jesistemima se koristi relacijski model podataka koji jenormaliziran i optimiziran za postizanje visokih brzina obrade. Takav modelnormaliziran i optimiziran za postizanje visokih brzina obrade. Takav model

 podataka se pokazao izvanrednim kada je rijeĉ o transakcijskim obradama u podataka se pokazao izvanrednim kada je rijeĉ o transakcijskim obradama ukojima se dohvaća najviše nekoliko desetaka zapisakojima se dohvaća najviše nekoliko desetaka zapisa odjednom. Medjutim zaodjednom. Medjutim za potrebe skladišta podataka, u kojima se dohvaća i do nekoliko miliona zapisa potrebe skladišta podataka, u kojima se dohvaća i do nekoliko miliona zapisaistovremeno, taj model je neprihvatljiv. Problem leţi u ĉinjenici da je relacijskiistovremeno, taj model je neprihvatljiv. Problem leţi u ĉinjenici da je relacijskimodel podataka normaliziran i kao takav je neupotrebljiv za izvršavanjemodel podataka normaliziran i kao takav je neupotrebljiv za izvršavanjekokompleksnih upita nad milionima podataka. Zato se u skladištu taj modelmpleksnih upita nad milionima podataka. Zato se u skladištu taj model

 podataka zamjenjuje s podataka zamjenjuje s dimenzionidimenzionim modelom koji je na višem stepenum modelom koji je na višem stepenuapstrakcije od relacijskog i zato je pogodniji za skladište podataka.apstrakcije od relacijskog i zato je pogodniji za skladište podataka.

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 15/21

15 

Šta jeŠta je dimenzionidimenzioni modelmodel 

„„DimenzioniDimenzioni model je tehnika logiĉkog dizajna koja teţi prikazivanju podatakamodel je tehnika logiĉkog dizajna koja teţi prikazivanju podatakana standardizovan, intuivan naĉin koji omogućava pristup podatcima velikomna standardizovan, intuivan naĉin koji omogućava pristup podatcima velikom

 brzinom.“ brzinom.“ 

DimenzioniDimenzioni model se najĉešće prikazuje apstraktno kao kocka ĉije dimenzijemodel se najĉešće prikazuje apstraktno kao kocka ĉije dimenzije predstavljaju dimenzije posla predstavljaju dimenzije posla koji modeliramo, a podatak na presjeku tihkoji modeliramo, a podatak na presjeku tihdimenzija predstavlja podatak koji traţimo.dimenzija predstavlja podatak koji traţimo. 

SSlliik k aa 44.. PPrriik k aazz ddiimmeennzziioonnoogg mmooddeellaa ppooddaattaak k aa uu oobblliik k uu k k oocck k ee 

Broj dimenzija u praksi moţe biti i veći od tri pa se onda govori oBroj dimenzija u praksi moţe biti i veći od tri pa se onda govori ovišedimenzionalnoj kocki. Gotovo uvišedimenzionalnoj kocki. Gotovo u svim dimenzionim modelima postojisvim dimenzionim modelima postojidimenzija vremena. Organiziranje i spremanje podataka prema ovom modeludimenzija vremena. Organiziranje i spremanje podataka prema ovom modeluomogućuje korisnicima bolje razumjevanje podataka i omogućuje da kotisniĉkaomogućuje korisnicima bolje razumjevanje podataka i omogućuje da kotisniĉkasuĉelja budu jednostavnija za korišćenje a izvedba upita na zadovoljavajućsuĉelja budu jednostavnija za korišćenje a izvedba upita na zadovoljavajuć ememnivou. Sgtruktura dimenzijskog nivoa se sastoji od jedne tablice sa sloţenimnivou. Sgtruktura dimenzijskog nivoa se sastoji od jedne tablice sa sloţenimkljuĉem koja se naziva tablicom ĉinjenica (eng. Fact table) i više tablicakljuĉem koja se naziva tablicom ĉinjenica (eng. Fact table) i više tablicadimenzija ( engl. Dimensional tables) od kojih svaka ima jednostavan ljuĉ kojidimenzija ( engl. Dimensional tables) od kojih svaka ima jednostavan ljuĉ koji

 je dio sloţenog kljuĉa je dio sloţenog kljuĉa tablice ĉinjenica. Takava struktura se ĉesto zove zvijezdatablice ĉinjenica. Takava struktura se ĉesto zove zvijezdaspoj (engl.spoj (engl. Star Star -- join schema). Na slici 5. join schema). Na slici 5. je prikazan tipiĉan izgled dimenzijskog je prikazan tipiĉan izgled dimenzijskogmodela.modela. 

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 16/21

16 

SSlliik k aa 55.. PPrriik k aazz ttiippiiccnnoogg ddiimmeennzziioonnoogg mmooddeellaa 

DimenzioniDimenzioni model i relacijski model se razlikuju u mnogo ĉemu. Relacijskimodel i relacijski model se razlikuju u mnogo ĉemu. Relacijskimodel je puno sloţeniji (tj. Dijagram relacijskog modela je mnogo sloţeniji) odmodel je puno sloţeniji (tj. Dijagram relacijskog modela je mnogo sloţeniji) oddimenzijskog modela. Mnogi dizajneri zato kaţu da zbog togadimenzijskog modela. Mnogi dizajneri zato kaţu da zbog toga dimenzionidimenzioni model sadrţi manje informacija i da se on koristi za saţetke više razine. Najvećimodel sadrţi manje informacija i da se on koristi za saţetke više razine. Najvećiautoritet u podruĉju skladištenja podataka Ralph Kimball smatra da to nijeautoritet u podruĉju skladištenja podataka Ralph Kimball smatra da to nijetaĉno: „ Osnovni odnos izmedju relacijskog i dimenzijskog modela je da setaĉno: „ Osnovni odnos izmedju relacijskog i dimenzijskog modela je da sedijagram relacdijagram relacijskog modela razlaţe u nekoliko dijagrama dimenzijskog modela.ijskog modela razlaţe u nekoliko dijagrama dimenzijskog modela.Dijagram relacijskog modela predstavlja svaki mogući poslovni proces u nekojDijagram relacijskog modela predstavlja svaki mogući poslovni proces u nekojkompaniji i odnose izmedju njih i zato je veoma kompleksan. Prvi korak ukompaniji i odnose izmedju njih i zato je veoma kompleksan. Prvi korak u

 pretvaranju dijagrama relacijskog modela pretvaranju dijagrama relacijskog modela u dijagram dimenzijskog modela jeu dijagram dimenzijskog modela jerazdvajanje poslovnih procesa i njihovo modeliranje zasebno. Drugi korak jerazdvajanje poslovnih procesa i njihovo modeliranje zasebno. Drugi korak jenalaţenje „manynalaţenje „many--toto--many“ odnosa i pretvaranje tih odnosa u tablice ĉinjenica.many“ odnosa i pretvaranje tih odnosa u tablice ĉinjenica.Ostatak se denormalizacijom pretvara u tablice dimenzija. RezultirajOstatak se denormalizacijom pretvara u tablice dimenzija. Rezultirajućiućidijagram dimenzijskog modela za relacijski model za veliko preduzeće moţedijagram dimenzijskog modela za relacijski model za veliko preduzeće moţeimati 10imati 10--25 vrlo sliĉnih zvijezda spojeva od kojih svaki moţe imati 425 vrlo sliĉnih zvijezda spojeva od kojih svaki moţe imati 4 --12 tablica12 tablicadimenzija“dimenzija“

Upotreba dimenzijskog modela u skladištu podataka ima mnoge prednosti predUpotreba dimenzijskog modela u skladištu podataka ima mnoge prednosti predrelacijskirelacijskim modelom. Kao prvo, dimenzioni model je predvidljiv,m modelom. Kao prvo, dimenzioni model je predvidljiv,

DIMENZIJA

Ključ_vrijeme Dan_u_sedmici Mjesec Godina 

PRODAJA 

kljuc_vrijemekljuc_artiklkljuc_trgovinaprodano_kmprodano_kolicinatroškovi_km 

DIMENZIJA

kljuc_artiklopisproizvodackategorija

DIMENZIJA TRGOVINA

kljuc_trgovinaime_trgovinaadresatip_trgovina 

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 17/21

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 18/21

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 19/21

19 

DDiimmeennzzii j jaa vvrreemmeennaa 

DDiimmeennzzii j jaa vvrreemmeennaa j jee ddiimmeennzzii j jaa k k oo j jaa j jee pprriissuuttnnaa uu ssvviimm ssk k llaaddiiššttiimmaa ppooddaattaak k aa,, zzaattoo ššttoo j jee 

ssvvaak k oo ssk k llaaddiiššttee ppooddaattaak k aa vvrreemmeennssk k aa sseerrii j jaa 

ssnniimmaak k aa ssttaann j jaa nneek k ee oorrggaanniizzaaccii j jee.. SSnniimmaammoo 

ssttaann j jaa ttrraannssaak k ccii j jssk k oogg ssiisstteemmaa ii sspprreemmaammoo ttaa 

ssnniimmll j jeennaa ssttaann j jaa uu ssk k llaaddiiššttee ppooddaattaak k aa k k aaoo nniizz sslloo j jeevvaa ppooddaattaak k aa ttee j jee ssttooggaa ssvvaak k oo ssk k llaaddiiššttee 

ppooddaattaak k aa vvrreemmeennssk k ii nniizz.. NNaak k oonn ttooggaa,, 

aannaalliizziirraa j juuccii ppooddaattk k ee,, k k ooppaammoo k k rroozz sslloo j jeevvee 

ppooddaattaak k aa k k aak k oo bbii sshhvvaattiillii k k aak k oo j jee nnaaššee ppoodduuzzeeccee iizzgglleeddaalloo uu nneek k oo j j ttoocck k ii vvrreemmeennaa.. TTiippiiccnnaa 

ddiimmeennzzii j jaa vvrreemmeennaa mmoožžee  izgledati kao na slici

7.

 

Slika 7. Dimenzija vremena

 

Zaključak  

Skladištenje podatakaSkladištenje podataka -- Data Warehouse je posebno projektovano tehnološkoData Warehouse je posebno projektovano tehnološkookruţenje koje omogućava objedinjavanje srodnih podataka u oblik pogodan zaokruţenje koje omogućava objedinjavanje srodnih podataka u oblik pogodan zaanalizu ĉime se olakšava proces donošenja odluka i daje nov pristup sistemimaanalizu ĉime se olakšava proces donošenja odluka i daje nov pristup sistemimaza podršku odluĉivanju. Ovajza podršku odluĉivanju. Ovaj koncept obezbeĊuje fleksibilan, efikasan naĉinkoncept obezbeĊuje fleksibilan, efikasan naĉinraspolaganja podataka u formatu pogodnom za savremene poslovne aplikacije.raspolaganja podataka u formatu pogodnom za savremene poslovne aplikacije.Postojanje skladišta podataka kao bogato informacijama integrisano okruţenjePostojanje skladišta podataka kao bogato informacijama integrisano okruţenjeorijentisano je ka potrebama krajnjih korisnika koji uzorijentisano je ka potrebama krajnjih korisnika koji uz  pomoć alata za poslovno pomoć alata za poslovno

odluĉivanje mogu donositi pravovremene i kvalitetne poslovne odluke.odluĉivanje mogu donositi pravovremene i kvalitetne poslovne odluke.  

Omogućava stalno pronalaţenje novih informacija namijenjenih menadţerima, aOmogućava stalno pronalaţenje novih informacija namijenjenih menadţerima, asluţe im prvenstveno za strateško, taktiĉko i operativno donošenje odluka.sluţe im prvenstveno za strateško, taktiĉko i operativno donošenje odluka.UvoĊenjem k UvoĊenjem k oncepta skladištenja podataka, operativne baze prestaju bitioncepta skladištenja podataka, operativne baze prestaju bitiopterećene sloţenim upitima, pa cijeli informacioni sistem koji se sad sastoji odopterećene sloţenim upitima, pa cijeli informacioni sistem koji se sad sastoji oddva dijela, operativnog i skladišta podataka postaje produktivniji i lakše sedva dijela, operativnog i skladišta podataka postaje produktivniji i lakše sekontroliše i restrukturira.kontroliše i restrukturira. 

MetodeMetode skladištenja podataka sve više postaju integrisane u softverske paketeskladištenja podataka sve više postaju integrisane u softverske paketetemeljnog informacionog sistema preduzeća, novije verzije relacionih bazatemeljnog informacionog sistema preduzeća, novije verzije relacionih baza

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 20/21

20 

 podataka (kao npr. Oracle i SQL server) imaju dio za Data Warehousing podataka (kao npr. Oracle i SQL server) imaju dio za Data Warehousingintegrisan u svom paketu kao OLAP.integrisan u svom paketu kao OLAP. MenaMenaţerimaţerima nije potreban angaţmannije potreban angaţmananalitiĉara za obradu kljuĉnih pokazatelja o stanju preduzeća, već takve podatkeanalitiĉara za obradu kljuĉnih pokazatelja o stanju preduzeća, već takve podatkeklikom miša mogu dobiti obraĊene iz baze podataka, te koristiti kao pomoć uklikom miša mogu dobiti obraĊene iz baze podataka, te koristiti kao pomoć u

donošenju poslovnih odluka.donošenju poslovnih odluka. 

 Naĉela Naĉela upravljanja prema ciljevima (Manaupravljanja prema ciljevima (Management by Objectives) će bitigement by Objectives) će biti podrţana mogućnostima online pristupa bazama i skladištima podataka, kroz podrţana mogućnostima online pristupa bazama i skladištima podataka, krozalate poslovne inteligencije. Koncept skladišta podataka usklaĊivanjem podatakaalate poslovne inteligencije. Koncept skladišta podataka usklaĊivanjem podatakaomogućuje jedinstvenu istinu o preduzeću, što povećava kredibilitetomogućuje jedinstvenu istinu o preduzeću, što povećava kredibilitetinfoinformacionog sistema.rmacionog sistema. 

8/3/2019 Dusko Kukavica Seminar Ski Rad

http://slidepdf.com/reader/full/dusko-kukavica-seminar-ski-rad 21/21

21

Literatura 

  Bojan Ćirić, Poslovna inteligencija, Data status, Beograd, 2006 

  A.Bonifati, F.Cattaneo, S.Ceri, A.Fugetta, S.Paraboschi, “Designing Data marts for Data Warehouse” 

  Kellett, A., "Integrated Business Intelligence", Butler Group, April 2003.  Panian Ţ., Klepac G., "Poslovna inteligencija", Masmedia, Zagreb, 2003.