relacciske baze

23
RELACIJSKO OBLIKOVANJE (RELACIJSKI MODEL BAZE PODATAKA) UVOD: Osnovne principe i strukturu relacijskog modela podataka iznio je E.F. Codd. Taj model podataka je s vremenom usavršen i danas je najrašireniji, općeprihvaćeni model podataka. Najveća prednost relacijskog modela podataka je to što on u potpunosti počiva u matematičkoj teoriji relacijske algebre 1. OBJEKTI RELACIJSKOG MODELA : - definirat ćemo objekte koji su u relacijskom modelu na raspolaganju za prikaz entiteta. 1.1. POJEDINAČNI PODATAK – najmanji element relacijskog modela 1.2. ATRIBUT - jedno svojstvo određenog objekta o kojemu skupljamo podatke u bazi podataka. Pod samim pojmom atributa najčešće mislimo na vrijednost atributa. - primjer složenog atributa DATUM (vrijednost atributa datum sastavljena je od vrijednosti jednostavnih atributa DAN,MJESEC,GODINA) 1.3. DOMENA – skup svih vrijednosti koje atribut može poprimiti 1.4. RELACIJA - osnova relacijskog modela jest prikaz podataka pomoću relacija - uobičajeni izraz u svakodnevnoj upotrebi za relaciju je tablica u kojoj stupci predstavljaju atribute(njihove vrijednosti), a redovi (n-torke ili slogovi) informacije o jednom entitetu relacije

Upload: dragan-karanovic

Post on 07-Nov-2015

235 views

Category:

Documents


8 download

DESCRIPTION

rel

TRANSCRIPT

RELACIJSKO OBLIKOVANJE

RELACIJSKO OBLIKOVANJE(RELACIJSKI MODEL BAZE PODATAKA)

UVOD:

Osnovne principe i strukturu relacijskog modela podataka iznio je E.F. Codd. Taj model podataka je s vremenom usavren i danas je najraireniji, opeprihvaeni model podataka.Najvea prednost relacijskog modela podataka je to to on u potpunosti poiva u matematikoj teoriji relacijske algebre

1. OBJEKTI RELACIJSKOG MODELA : definirat emo objekte koji su u relacijskom modelu na raspolaganju za prikaz entiteta.

1.1. POJEDINANI PODATAK najmanji element relacijskog modela1.2. ATRIBUT - jedno svojstvo odreenog objekta o kojemu skupljamo podatke u bazi podataka. Pod samim pojmom atributa najee mislimo na vrijednost atributa. - primjer sloenog atributa DATUM (vrijednost atributa datum sastavljena je od vrijednosti jednostavnih atributa DAN,MJESEC,GODINA)1.3. DOMENA skup svih vrijednosti koje atribut moe poprimiti1.4. RELACIJA - osnova relacijskog modela jest prikaz podataka pomou relacija - uobiajeni izraz u svakodnevnoj upotrebi za relaciju je tablica u kojoj stupci predstavljaju atribute(njihove vrijednosti), a redovi (n-torke ili slogovi) informacije o jednom entitetu relacije - jedan od osnovnih pojmova u matematici i kljuan pojam relacijskog modela. Izmeu relacije u matematici i relacije u relacijskom modelu postoji odreena razlika:- Pod relacijom u matematici podrazumijevamo skup ureenih n-torki. Broj lanova od kojih se n-torka relacije sastoji, odreen je brojem domena na kojima je relacija zadana i konstantna je za danu relaciju. - U relacijskom modelu relacija odgovara dvodimenzionalnoj tabeli u kojoj svaki red sadri jednu n-torku,a svaki stupac elemente jedne domene (odn. Vrijednost atributa zadanog u toj domeni).Ako svakom stupcu pridruimo naziv atributa,dobit emo zaglavlje ili shemu relacije - relacija se sastoji od 2 dijela -ZAGLAVLJE sadri imena svih atributa od kojih se relacija sastoji -TIJELO relacija se sastoji od podataka tj.vrijednosti atributa iji se nazivi nalaze u zaglavlju relacije

Zaglavlje ili shema relacije

IME IFRAMJESTO-RO.

Tijelo relacije

n-torka(slog)

Barbara517Slavonski Brod

Dragana632Osijek

Igor727Osijek

Ivana814akovo

stupac

- SVOJSTVA RELACIJE: Za relacijski model vrlo su znaajna 4 osnovna svojstva relacije: - shema relacije ne sadri 2 jednaka naziva atributa - redoslijed stupaca u relaciji nije bitan - relacija ne sadri dvije jednake n-torke - redoslijed n-torki u relaciji nije bitan - adresibilnost-svojstvo koje proizlazi iz osnovnih svojstava relacije - svaki stupac relacije jednoznano je odreen odgovarajuim nazivom atributa - svaki red relacije sadri jednu n-torku i jednoznano je odreen vrijednou kljua te n-torke.

Radi boljeg razumijevanja modela, prisjetit emo se jo nekih definicija vanih pojmova:

ENTITET - objekt realnog svijeta u kojemu se informacije skupljaju i obrauju PRIMARNI KLJU je atribut ili skup atributa ije vrijednosti jednoznano odreuju Pojavljivanje svake n-torke,tj.svakog retka relacije - u jednoj relaciji ne mogu postojati dvije n-torke sa istim Vrijednostima primarnog kljua STRANI KLJU - u relaciji R1 je atribut koji je primarni u relaciji R2. - Tipian primjer je baza podataka o dobavljaima i proizvodima Koje nabavljaju. Sastoji se od 3 relacije,krajnje pojednostavljene Radi preglednosti: Dobavljai D(D#, IME,GRAD,STATUS); Proizvodi P(P#,NAZIV,OPIS) Narueni pojedini proizvodi od pojedinog dobavljaa DP(D#, P#,KOLIINA)

2. NUL VRIJEDNOSTI

Model baze podataka polazi od pretpostavke da su nam sve relativne informacije poznate mogu biti unesene u bazu. U praksi ova pretpostavka esto zataji. Informacije koje nedostaju problem su gotovo svake baze podataka. U okviru relacijskog modela mnogi su autori razmatrali ovu problematiku. Naglasimo da zasada postoji vie razliitih prijedloga,ali cjelovito rjeenje informacija koje nedostaju, ne postoji.

oznaka da je stvarna vrijednost nepoznata svaki atribut u svakoj relaciji baze podataka moe poprimiti nul-vrijednost(u nekim sluajevima to nije dozvoljeno) oznaka ? u bazu podataka je upisujemo privremeno od 5 jednostavnih operacija relacijske algebre samo u sluaju Kartezijeva produkta ne dolazi ni do kakvih promjena. Jednostavne operacije unija,razlika i projekcija neto su izmjenjene. Ova promjena posljedica je definicije pojma kopije n-torke u prisutnosti nul-vrijednosti. Inae definicije ovih operacija ostaju neizmjenjene

3. PRAVILA INTEGRITETA U RELACIJSKOM MODELU Po svom znaenju izrazi integritet,konzistencija i osiguranje odnosno zatita podataka meusobno su srodni. pod integritetom baze podataka podrazumjevamo ispravnost i istinitos informacija, odnosno podataka sadranih u bazi problematika integriteta baze podatka u irem smislu obuhvaa sve mjere kojima je cilj da sprijee unos neispravnih podataka u bazu.

zajednika karakteristika svih integritetskih ogranienja jest injenica da svaki podatak koji nije u skladu s nekim od pravila sigurno nije istinit pravila integriteta koja se javljaju u jednoj relacijskoj bazi podataka moemo podijeliti u dvije grupe opa pravila integriteta vrijede u svim relacijskim bazama podataka korisnika pravila : specifina za pojedine relacijske sisteme - sastoje se od dva pravila : 1. ENTITESKOG INTEGRITETA 2. REFERENCIJALNOG INTEGRITETA1. ENTITETSKI INTEGRITET - vrijednost primarnog kljua kao cjeline, ne smije biti jednaka nul-vrijednosti. Ako je primarni klju relacije sloeni atribut, vrijednost niti jedne komponente primarnog kljua ne smije biti jednaka nul-vrijednosti.

2. REFERENCIJALNI INTEGRITET - ako u relaciji r(R) postoji strani klju koji odgovara primarnom kljuu u relaciji s(S), svaka vrijednost stranog kljua u r mora biti: - ili jednaka vrijednosti primarnog kljua u nekoj od n-torki relacije s - ili jednaka nul-vrijednosti. - relacije r i s ne moraju biti razliite relacije

4. FUNKCIJSKA OVISNOST

je preslikavanje kod kojeg se svaki element prvog skupa preslikava na najvie 1 element drugog skupa. Rezultat takvog preslikavanja je skup ureenih parova. Prvi lan svakog ureenog para u tom skupu potjee iz prvog ,a drugi iz drugog skupa. U skupu ne mogu postojati dva razliita ureena para koji imaju meusobno jednak prvi lan. Poto atributi nisu skupovi. Kad govorimo o funkcijskoj ovisnosti meu atributima, mislimo na funkcijsku ovisnost meu domenama na kojima su zadani ti atributi Funkcijske ovisnosti zadane na relacijskoj shemi su tvrdnje o realnom svijetu. Kao takve,one mogu biti odraz prirodnih zakona(svaki ovjek ima 1 spol),drutvenih normi, poslovnih obiaja, itd.

5..VIEZNANA OVISNOST

- definiramo kao odnos izmeu dva elementa (X i Y). Meutim,rije je o dijelu odnosa izmeu tri elementa DEF : Pretpostavimo da je R relacijska shema, i da su X i Y disjunktni podskupovi

atributa u R (tj. ). Intuitivno znamo da X vieznano odreuje Yako se dana vrijednost od X preslikava na neki podskuo vrijednosti od Y,koji moe imati = ili vie elemenata i ako taj podskup vrijednosti od Y nije ni na kakav nain ovisan o vrijednostima ostalih atributa u R(R-XY) na koje se preslikava dana vrijednost od X.

6. DEKOMPOZICIJA BEZ GUBITKA INFORMACIJA

U toku normalizacije ne smije doi do gubitka informacija.DEF. Dekompozicija relacijske sheme R(A1,A2,...,AN) je zamjena relacijske sheme R sa skupom relacijskih shema {R1,R2,...,RK} za koje vrijedi Ri R ( 1 i k ) i R1R2...RK = R. Relacijske sheme Ri ne moraju biti meusobno disjunktni skupovi. Smatramo da je dekompozicija relaciske sheme izvedena bez gubitaka informacija ako je ispunjen sljedei uvijet. DEF.Neka je R relacijska shema i neka je skup {R1,R2,...,RK} dekompozicija u R. Neka je r relacija zadana R , i neka su ri projekcije od relacije r zadane na Ri ( 1 i k ) .Dekompizicija relacijske sheme R je izvedena bez gubitaka informacija, ako za bilo koju relaciju r zadanu R vrijedi da je ona rezultat prirodnog pridruivanja svih svojih projekcija ri zadanih na Ri.Uvijet koji mora biti ispunjen da bi dekompozicija bila reverzibilna definirao je Rissanen (1977):DEF. Dekompozicija relacijske sheme P na relacijske sheme R i S je reverzibilna ako su zajedniki atributi u relacijskim shemama R i S klju u bar jednoj od ove dvije sheme

7. NORMALIZACIJA:

osnovni cilj (prema Coddu) relacijskog modela jest da zatiti korisnika formatiziranih podatka od estih i potencijalno opasnih reorganizacija baze podataka. U relacijskom modelu to se postie tako da se: - spreavaju anomalije odravanja podataka u bazi - na minimum svede potreba za reorganizacijom,izazvana unoenjem novih tipova podataka u bazu - omogui bolje koritenje informacija pohranjenih u bazu- u ostvarenju tih ciljeva znaajna uloga pripada oblikovanju baze podataka (tzv. normalizacija) je postupak kojim se proizvoljna nenormalizirana relacija transformira u skup manjih i normaliziranih relacija tj. oblikovanje baze podataka na takav nain da se pridravanjem odreenih ogranienja i pravila smanje mogunosti pojave neeljenih situacija kao to su unitavanje ili neusklaenost izmeu podataka kao posljedica auriranja baze podataka radi lakeg razumijevanja postupka normalizacije upoznat emo se sa redudancijom, pojedinim tipovima anomalija odravanja i razlozima zbog kojih se javljaju u bazipodataka: redudancija- memoriranje vie kopija iste informacije u bazi podataka, moe u nekim sluajevima poveati brzinu obrade podataka. Npr. Ako u logikom slogu svakog radnika memoriramo sve informacije relevantne za obraun osobnog dohotka tog radnika, onda e za obraun osobnog dohotka radnika biti dovoljno da uitamo jedan jedini logiki slog iz baze podataka. S druge strane ovakvo rjeenje izazvat e niz problema. Podaci o radnom zadatku na kojem je radilo tridesetak radnika moraju biti memorirani u tridesetak kopija , podaci o opini u kojoj boravi nekoliko tisua radnika moraju biti memorirani u nekoliko tisua kopija....Ovako velik broj kopija izazvat e ozbiljne probleme kod odravanja tzv. Anomalije odravanja posljedice su u pravilu, ovakve nekontrolirane redudancije. Da bi se nekontrolirana redudancija i anomalije odravanja sprijeile, opis svakog entiteta treba biti memoriran kao zasebna logika cjelina anomalija odravanja podataka pod anomalijom podrazumjevamo :a) potencijalnu inkonzistenciju posljedica nekontrolirane redudancije ako je neka informacija memorirana u bazi podatka u vie kopija uvijek postoji mogunost da neka od njih ostane neaurirana, tada emo imati dvije suprotne tvrdnje (1 nije istinita)b) anomalija dodavanja javlja se u onim sluajevima kad su informacije o svojstvima jednog entiteta memorirane u bazi kao dio opisa nekog drugog entiteta. Npr. u okviru opisa svojstva jednog radnika memorirane informacije o opini u kojoj radnik boravi. Informacije u opini nije mogue unijeti u bazu tako dugo dok ne postoji bar jedan radnik koji u toj opini boravi. S obzirom na to da se prikupljene informacije o opini odvijaju potpuno neovisno o prikupljanju podtaka o radniku, ovakvo rjeenje u velikoj bazi podataka moe imati za posljedicu gubitak informacija c) anomalija brisanja - inverzija anomalije dodvanja - svakim brisanjem opisa radnika brie se i jedna kopija podataka o opini u kojoj taj radnik boravi. Kad bude obrisan opis posljednjeg radnika koji boravi u odreenoj opini oigledno je i obrisana i posljednja kopija podataka o opini. - s obzirom na to da kod brisanja podataka o radniku ne mislimo na to a pri tome unitavamo podatke o drugim entitetama, na ovaj nain mogue je nenamjerno unititi podatke koji su potrebni i vani

varijabilna duljina n-torke : interesantan je nain na koji se problem varijabilne duljine zapisa tretitra u relacijskom modelu i literaturi o relacijskom modelu slino kao i redudancija i varijabilna duljina zapisa u bazi podataka nije anomalija i moe biti korisna u odnosu na koji se tretira problem redudancije uoljive su dvije bitne razlike:1. relacijski model , u odreenoj mjeri dozvoljava redudanciju u bazi podataka. Varijabilnu duljinu zapisa relacijski model ne dozvoljava ni pod kakvim uvjetima.2. druga razlika sastoji se u nainu na koji se u literaturi objanjava potreba spreavanja varijabilne duljinezapisa i redudancije. Potreba za spreavanje redudancije obrazlae nizom argumenata, a argumenti za spreavanje varijabilne duljine zapisa ,djeluju neuvjerljivo

7.1. METODE NORMALIZACIJENormalna forma je ogranienje na relacijskoj shemi Reverzibilnost je dokaz da u okviru normalizacije, ne smije doi do gubitka informacija sadranih u relaciji

TEHNIKE NORMALIZACIJE :

1. VERTIKALNA NORMALIZACIJA2. HORIZONTALNA NORMALIZACIJA

7.1.1. VERTIKALNA NORMALIZACIJA izvodi se transformacijom relacijske sheme kod vertikalne normalizacije koriste se operacije projekcije(odn. Prirodnog zdruivanja). Pomou operacije projekcije relaciju vertikalno razbijemo na dvije ili vie manjih relacija. Pri tome dolazi do cijepanja svake pojedine n-torke u relaciji. Operaciju prirodnog zdruivanja koristimo da bismo dokazali reverzibilnost tj. da bismo rekontruirali polaznu, normaliziranu relaciju. Je osnovna tehnika Razlikujemo dvije varijante ove tehnike:a) normalizacija dekompozicijomb) normalizacija sintezoma) normalizacija dekompozicijom je starija tehnika. Postupak zapoinje od proizvoljne,nenormalizirane relacije i izvodi se u koracima. Svakim korakom normalizacija relacijom(relacijska shema)prevodi se u iduu viu normalnu formu, tako da se pojedini atributi izdvajaju i od njih se formiraju zasebne relacijske sheme. Svaki korak normalizacije mora biti reverzibilan.0.korak.) IZBOR PRIMARNOG KLJUA - prije nego to se pristupi normalizaciji dekompozicijom mora biti odreen primarni klju relacijske sheme - primarni klju je podskup atributa sheme ije vrijednosti jednoznano odreuju svaku n-torku u relaciji i unutar kojeg niti jedan pravi podskup ne ispunjava uvjet jednoznanosti - atributi u normaliziranoj shemi odreuju vrste svojstva jedne odreene vrste entiteta. Svaka n-torka, u relaciji na takvoj relacijskoj shemi, opis je svojstva odreenog entiteta. Unutar tog opisa vrijednost kljua je identifikator entiteta (entitet moe imati vie razliitih identifikatora) Izmeu vie moguih kljueva relacijske sheme, odabrat emo jedan primarni klju Npr. PROIZVOD(IF-PROIZVODA NAZIV-PROIZVODA CIJENA KOLIINA) U rekacijskoj shemi PROIZVOD uvjete za klju ispunjavat e atributi IF- PROIZVODA I NAZIV PROIZVODA. S obzirom na to da postoji, makar minimalna mogunost da se pojave dva razliita proizvoda s istim nazivom, za primarni klju relacijske sheme odabrat emo atribut IF- PROIZVODA.1.korak.) PRVA NORMALNA FORMA - zadatak prvog koraka normalizacije jest da relacijsku shemu transformaira u prvu normalnu formu (1NF) DEF Relacijska shema R nalazi se u 1NF ako su svi nekljuni atributi funkcijski ovisni o kljuu od R Vrijednost atributa koji je funkcijski ovisan o kljuu jednoznano je odreen s vrijednou kljua. Za odreenu vrijednost kljua ne mogu se javiti dva ili vie razliitih vrijednosti atributa koji je o kljuu funkcijski ovisan. Recimo da je klju relacijske sheme atribut IME-RADNIKA. Atribut GODINA-ROENJA je funkcijski ovisan o atributu IME-RADNIKA . Uz svako ime radnika moe biti navedena samo jedna godina roenja tog radnika.Atributi koji nisu funkcijski ovisni o kljuu, imat e, za danu vrijednost kljua, neki podskup vrijednosti. Atributi koji nisu funkcijski ovisni o kljuu unutar relacije, tvore grupu koja se ponavlja. U okviru prvog koraka normalizacije valja iz relacijske sheme izdvojiti sve atribute koji tvore grupe koje se ponavljaju. Da bismo to postigli, treba ustanoviti koji nekljuni atributi u relacijskoj shemi su funkcijski ovisni o kluu. Nakon toga iz relacijske sheme izdvaamo sve atribute koji nisu funkcijski ovisni o kljuu (i od njih formiramo novu relacijsku shemu) Ono to nam je od relacijske sheme preostalo je relacijska shema u 1NF Dvije novonastale relacijske sheme su projekcije osnovne relacijske sheme. Da bi dekompozicija bila reverzibilana, projekcije moraju imati zajednike atribute i ti atributi moraju biti klju u bar jednoj od projekcija. Ovaj postupak emo najjednostavnije upoznati na primjeru: Uzmimo relaciju radnik:

Radnik (IME-RADNIKA GODINA RO IME-DJETETA GOD-RO-D) Darko 1938. Ivica 1964 Marica 1967 Petar 1957. Nikola 1981 Pavle 1949. Ana 1971 Iva 1972 Marko 1976 arko 1949. Nada 1969 N-troke relacije imaju varijabilnu duljinu i relacija se ne nalazi u 1NF . Moemo je prevesti tako da za svako dijete kopiramo podatke o roditelju Radnik (IME-RADNIKA GODINA RO IME-DJETETA GOD-RO-D) Darko 1938. Ivica 1964 Darko 1938. Marica 1967 Petar 1957. Nikola 1981 Pavle 1949. Ana 1971 Pavle 1949. Iva 1972 Pavle 1949. Marko 1976 arko 1949. Nada 1969 Sada je grupa koja se ponavlja nestala(nije izvedena nikakva transformacija relacijske sheme) Prije normalizacije klju relacije je bio atribut IME-RADNIKA. Nakon normalizacije IME-RADNIKA ne moe biti klju s obzirom na to da vrijednost kljua moraju jednoznano odreivati n-torke relacije. Klju relacije je nakon normalizacije atribut IME-DJETETA. Dakle, relacija je promjenom vlasnika relacije prevedena u 1NF. 2.korak.) DRUGA NORMALNA FORMA DEF: Relacijska shema R nalazi se u 2NF ako se svi nekljuni atributi u R nalaze u punoj funkcijskoj ovisnosti o kljuu od R. - relacija koja se nalazi u 2NF mora biti i u 1NF - svi nekljuni atributi(atributi koji nisu funkcijski ovisni o kljuu) relacije u 2NF moraju biti funkcijski ovisni o kljuu relacije i ta funkcija ovisnosti mora biti puna (Parcijalana funkcijska ovisnost u sluaju kad je klju relacije sloen i sastoji se od 2 ili vie atributa, funkcijska ovisnost o kljuu moe biti posljedica funkcijske ovisnosti o dijelu kljua. Takva funkcijska ovisnost nije puna-nazivamo je parcijalnom ) Neka je klju relacije sastavljen od atributa IFRA-RADNIKA I IFRA-RADNOG-ZADATKA Atribut SATI-RADNIKA je funkcijski ovisan o kljuu puna funkcijska ovisnost (jer ni ifra radnika ni ifra radnog zadatka pojedinano ne odreuje jednoznano broj sati koje je radnik proveo na ranom zadatku) Atribut IME-RADNIKA je funkcijski ovisan o kljuu- parcijalna funkcijska ovisnost(jer ifra radnika jednoznano odreuje ime radnika) Primjer (IF-RADNIKA (IF-RAD-ZADATKA SATI-RADA (IF-RADNIKA (IF-RADNIKA (IF-RAD-ZADATAKA IME-RADNIKA IME-RADNIKA) IME-RADNIKA NAZIV-R-ZADATKA ( IF-RAD-ZADATKA SATI-RADA)NAZIV-R-ZADATKA NAZIV-R-ZADATKA)

Atributima, koje smo izdvojili iz sheme, dodat emo dio kljua o kojemu su funkcijski ovisni i od njih formirati novu relacijsku shemu. Klju ove relacijske sheme bit e dio kljua koji je u shemu dodan na kraju.

3.korak.) TRA NORMALNA FORMA - u treem koraku normalizacije iz relacijske sheme treba izbaciti sve one nekljune atribute koji su tranzitivno ovisni o kljuu DEF: Relacijska shema R nalazi se u 3NF ako je u 1NF i ako niti jedan nekljuni atribut u R nije tranzitivno ovisan o kljuu od R. Tranzitivna ovisnost o relacijskoj shemi Uzmimo primjer : Neka je R relacijska shema koja se sastoji od sljedih atributa R( IME-RADNIKA MJESTO-BORAVKA GODINA-ROENJA IME-DJETETA GOD-R-D)

Atribut IME-DJETETA je klju relacijske sheme R koja se nalazi u 2NF. Pored ovinosti o kljuu ,u R vrijedi i ovisnost IME-RADNIKA MJESTO- BORAVKA GODINA-ROENJA. Atribut MJESTO-BORAVKA i GODINA- ROENJA su tranzitivno ovisni o kljuu. - parcijalna funkcijska ovisnost je poseban sluaj tranzitivne ovisnosti - 3NF podrazumjeva 1NF i 2NF Tranzitivnu ovisnost o kluu eliminirat emo iz relacijske sheme koja se nalazi u 1NF ili 2NF tako da izbacimo tranzitivno ovisne atibute. Osnovna relacijska shema je time prevedena u 3NF,ali to je samo dio posla.

Nadalje, atributima koje smo izbacili iz osnovne sheme, dodajemo kopiju podskupa atributa koji ih funkcijski odreuje(a koji nije klju osnovne sheme) i tako formiramo novu shemu relacije. Primjer (IME-RADNIKA MJESTO-BORAVKA MJESTO-BORAVKA R(IME-RADNIKA GODINA-ROENJA GODINA-ROENJA) MJESTO-BORAVKA GODINA-ROENJA IME-DJETETA GOD-RO-D) (IME-RADNIKA IME-DJETETA GOD-RO-D)

Iskljuivanjem tranzitivno ovisnih atributa MJESTO-BORAVKA i GODINA-ROENJA osnovna relacijska shema je prevedena u 3NF. Iskljuivanjem atributa dodana je kopija atributa IME-RADNIKA i od njih formirana nova relacijska shema u kojoj je atribut IME-RADNIKA klju. Ova dekompozicija relacijske sheme R je reverzibilna. Zajedniki atribut u projekcijama relacijske sheme R je IME-RADNIKA i klju je novoformirane relacijske sheme.

Ukratko emo rezimirati prva tri koraka normalizacije. U prvom koraku iz relacijske sheme eliminirani su svi nekljuni atributi koji nisu bili funkcijski ovisni o kljuu sheme. U drugom koraku eliminirani su nekljuni atributi koji su bili funkcijski ovisni o dijelu kljua sheme relacije. Konano,u treem koraku iz sheme su izbaeni svi nekljuni atributi koji su bili funkcijski ovisni o dijelu kljua shemerelacije. Kao rezultat sva tri koraka dobili smo relacijsku shemu u 3NF u kojo su svi nekljuni atributi: funkcijski ovisni o kljuu sheme nisu funkcijski ovisni o podskupu atributa sheme, koji nije klju, bez obzira na to da li se taj podskup sastoji od kljunih ili nekljunih atributa(odn. nisu tranzitivno ovisni o kljuu )

4. korak) Boyce Coddova normalna forma (BCNF) - najvia normalna forma koja se definira pomou funkcijskih ovisnosti

DEF: Neka je R relacijska shema i neka vrijedi XR i A(R-X). Relacijska shema R se nalazi u Boyce-Coddovoj normalnoj formi ako se nalazi u 1NF i ako za svako X, za koje vrijedi X A vrijedi i XR.

Ako neki podskup atributa X u R funkcijski odreuje bilo koji atribut u relacijskoj shemi, koja se nalazi u BCNF, i ako ta funkcijska ovisnost nije trivijalna, onda X mora biti klju relacijske sheme R. Obratimo panju da od ovoga uvjeta nisu izuzeti atributi koji ulaze u sastav kljua relacijske sheme.Tim uvjetom su iz relacijske sheme eliminirane sve tranzitivne funkcijske ovisnosti o kljuu.

Primjer: Neka je R (PACIJENT AMBULANTA LIJENIK) relacijska shema, neka je klju relacijske sheme sloen od atributa PACIJENT i AMBULANTA i neka vrijede ovisnosti PACIJENT AMBULANTA LIJENIK i LIJENIK AMBULANTA. Drugim rijeima svaki lijenik radi samo u jednoj ambulanti,a svaki pacijent u jednoj ambulanti ide istom lijeniku. Relacijska shema nalazi se u 3NF ,a kljuni atribut AMBULANTA tranzitivno je ovisan o kljuu preko nekljunog atributa LIJENIK. Moemo zakljuiti, relacijska shema, koja se nalazi u 3NF i ima jednostavan klju, mora biti i u BCNF. Samo relacijska shema koja ima bar jedan sloeni klju i nalazi se u 3NF ne mora biti i u BCNF. Da bismo relacijsku shemu, koja se nalazi u 3NF tranformirali u BCNF, moramo eliminirati tranzitivnu funkcijsku ovisnost o kljuu sheme. To emo uiniti tako da iz relacijske sheme odstranimo tranzitivno ovisan atribut, ili u nekim sluajevima da odstranimo podskup atributa preko kojeg je tranzitivna ovisnost uspostavljena. Odstranjenjem atributa dodajemo kopiju podskupova atributa o kojem je funkcijski ovisan i od njih formiramo novu relacijsku shemu. Svaku relacijsku shemu mogue je reverzibilno transformirati u BCNF. Meutim,za svaku relacijsku shemu nije mogue nai takvu dekompoziciju u BCNF u kojoj e biti ouvan skup zadanih funkcijskih ovisnosti. Relacija je u BCNF ako ne postoji ni jedan tranzitivno zavisan atribut(onaj koji nije iskljuivo zavisan o kljuu.)

BCNF3NF

Svaka netrivijalna funkcijska zavisnost proizlati iz kljuaSvaka netrivijalna funkcijska zavisnost ili proizlazi iz kljua ili zavrava u kljuu

5.korak) ETVRTA NORMALNA FORMA -eliminacijom vieznane ovisnosti iz relacijske sheme,relacijsku shemu transformiramo u 4NF. DEF : Relacijska shema R nalazi se u 4NF, ako za bilo koja dva disjunktna podskupa atributa u R, X i Y, za koje vrijedi XY(i ta ovisnost nije

trivijalna), vrijedi XA za svaki atribut AR Prevoenjemrelacijske sheme u 4NF eliminirali smo sve netrivijalne vieznane ovisnosti koje nisu funkcijske ovisnosti,i sve funkcijske ovisnosti osim ovisnosti o kljuu sheme. Iz toga proizlazi da relacijska shema u 4NF mora biti i u BCNF. Obratno ne vrijedi. Da bismo objasnili postupak eliminiranja vieznane ovisnosti (VZO)iz relacijske sheme, posluit emo se jo jedno relacijskom shemom R(IF-RAD SPORT STR- JEZIK). Relacijska shema R nalazi se u BCNF,a jedine netrivijalne ovisnosti koje u njoj postoje su VZO IF-RADSPORT|STR-JEZIK. Dekompozicijom relacijske

sheme R na projekcije R(IF-RAD SPORT) i R(IF-RAD STR-JEZIK)

pretvorili smo netrivijalne VZO u R, u trivijalne VZO u projekcijama Ri R, koje se nalaze u 4NF.

JOIN OVISNOST (JO)

-vrsta ogranienja koje moe biti zadano na relacijskoj shemi.- zbog svojstva asocijativnosti operacija prirodnog pridruivanja moe imati 2 ili vie operanada. injanica da su se reverzibilne dekompozicije, s kojima smo se sretali, bile ograniene na dvije relacijske sheme posljedica je karakteristika funkcijske ovisnosti (FO) i VZO s kojima smo se do sada bavili . Aho, Beeri i Ullman pokazali su da postoje relacijske sheme za koje nije mogue nai reverzibilnu dekompoziciju na dvije , ali za koje postoji reverzibilna dekompozicija na tri ili vie relacijskih shema . Postojanje ovakvih relacijskih shema bila je indikacija da su FO i VZO posebni sluajevi nekog opeg tipa ovisnosti koji moe biti zadan na relacijskoj shemi

DEF : Neka je R relacijska shema i neka je dekompozicija od R. Smatramo da

u R vrijedi join ovisnost koju oznaavamo s ,ako je deompozicija

od R reverzibilna. 6.korak) PROJEKT-JOIN NORMALNA FORMA - prevoenjem relacijske sheme u 4NF odstranili smo iz nje sve VZO(osim trivijalnih VZO i FO o kljuu). U relacijskoj shemi u 4NF pored funkcijskih ovisnosti o kljuu sheme, mogu postojati JO koji nisu VZO,(te ovisnosti je potrebno odstraniti iz relacijske sheme).

DEF : Neka je R relacijska shema, neka je F skup FO i JO zadanih na R. R je u projekt-join normalnoj formi (PJNF) s obzirom na F ako za svaki JO koji

logiki proizlazi iz F vrijedi da je trivijalan, ili da svaki sadri klju od R.

Primjer : Neka je R(ABCDEI)relacijska shema na kojoj je zadan skup ovisnosti

F=. Relacijska shema nije u

PJNF. Kljuevi od R su A i BC. U dekompoziciji jedino (ABCD) sadri klju od R. Da bismo relacijsku shemu transformirali u PJNF, moramo je

zamijeniti s dekompozicijom (ABCD), (CDE) i (BDI).

b) normalizacija sintezom : vertikalana normalizacija sintezom ne polazi od relacijske sheme nego od skupa atributa i skupa ovisnosti zadanih na tom skupu atributa. Postupak se ne provodi u koracima Polazei od skupa atributa i skupa ovisnosti zadanog na skupu atributa, konstruiramo relacijske sheme u traenoj normalnoj formi direktno. Normalizacija sintezom treba omoguiti da se, polazei od proizvoljne relacijske sheme R i skupa funkcijskih vrijednosti F koji je zadan na R, postignu sljedei ciljevi: - da se konstruira skup relacijskih shema iji se elementi

nalaze u 3NF obzirom na F - da skup relacijskih shema u 3NF bude minimalan - da bude osigurana reverzibilnost - da bude sauvan skupfunkcijskih ovisnosti F Minimalan broj relacijskih shema u 3NF(koje treba konstruirati da bi se relacijska shema Rtransformirala u 3NF)odreen je skupom funkcijskih ovisnosti koje su zadane

na R. Za svaki podskup funkcijskih ovisnosti u G mora biti konstruirana najmanje jedna relacijska shema u 3NF.

7.1.2. HORIZONTALAN NORMALIZACIJA:

- za razliku od vertikalne normalizacije, horizontalna se izvodi pomou operacija sekcije i unije relacija. Pri tome se relacijska shema ne mijenja.- kod horizontalne normalizacije transformiraju se domene na kojima su zadani pojedini atributi sheme- relacija se rastavlja na podskupove n-torki koji zadovoljavaju odreene uvjete. Ti podskupovi n-torki nazivaju se fragmenti relacije- sama tehnika zasad nije potpuno razvijena