informatika predavanje br. 3 podaci i informacije p3.pdf · 2019. 4. 1. · 1.4.2019. autor: dr ana...

85
Informatika Predavanje br. 3 Podaci i informacije dr Ana Kovačević [email protected] Fakultet bezbednosti

Upload: others

Post on 28-Jan-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • Informatika

    Predavanje br. 3

    Podaci i informacije

    dr Ana Kovačević

    [email protected]

    Fakultet bezbednosti

    mailto:[email protected]

  • Plan predavanja

    • Podaci

    • Informacije

    1.4.2019. autor: dr Ana Kovačević, FB 2

  • 1.4.2019. autor: dr Ana Kovačević, FB 3

    Podaci

    • Podaci – jedna od osnovnih komponenata računarskog sistema.

    • Podaci i informacije nisu sinonimi u računarstvu.

    • Danas sve više podataka je raspoloživo krajnjim korisnicima (zbog pada cene hardvera; pristupa preko Interneta).

    • Podaci: – sirove, nestruktuirane zabeležene činjenice.

    – značenje zavisi od konteksta.

    – tumačenjem se dobijaju informacije.

    – računari obrađuju podatke bez razumevanja njihovog značenja.

  • PRIMERI PODATAKA

    1.4.2019. autor: dr Ana Kovačević, FB 4

  • 1.4.2019. autor: dr Ana Kovačević, FB 5

    Podaci

    – broj: 1234,45

    – tekst: “Analiza socijalnih mreža je popularna.”

    – slika

    – video zapis

    – zvuk

  • 1.4.2019. autor: dr Ana Kovačević, FB 6

    Tekstualni podaci

    • Slobodan tekst nedovoljno struktuiran i

    pruža mogućnost višestruke interpretacije.

    • Manja je pouzdanost kod slobodnog teksta

    nego u egzaktnim numeričkim podacima,

    zbog mogućnosti različite interpretacije.

  • Transakcioni podaci

    7

    Specijalni tip slogovnih podataka gde važi:

    svaki slog (transakcija) sadrži skup stavki

    Na primer, podaci o prodavnici prehrambene robe.

    Transakciju predstavlja skup proizvoda koji je

    neki kupac kupio. Stavke su individualni

    proizvodi.

    TID Items

    1 Bread, Coke, Milk

    2 Beer, Bread

    3 Beer, Coke, Diaper, Milk

    4 Beer, Bread, Diaper, Milk

    5 Coke, Diaper, Milk

  • Graf zasnovani podaci

    • Graph

    Partitioning

    • Parallel Solution of Sparse Linear System of Equations

    • N-Body Computation and Dense Linear System Solvers

    8

    2

    5

    1

    2

    5

    Primer: Generički graf i HTML veze

    Data Mining

  • Podaci o hemijskim

    strukturama • Molekul benzena: C6H6 Prikaz strukture (ugljenik - crno, vodonik -

    sivo)

    1.4.2019. autor: dr Ana Kovačević, FB 9

  • Podaci sa poretkom

    10

    Element u

    nizu

    Stavka/Događaj Nazivaju se i vremenski

    podaci

    Niz transakcija

  • Podaci sa poretkom

    (transakcija)

  • Podaci sa poretkom

    12

    Genomske sekvence GGTTCCGCCTTCAGCCCCGCGCC

    CGCAGGGCCCGCCCCGCGCCGTC

    GAGAAGGGCCCGCCTGGCGGGCG

    GGGGGAGGCGGGGCCGCCCGAGC

    CCAACCGAGTCCGACCAGGTGCC

    CCCTCTGCTCGGCCTAGACCTGA

    GCTCATTAGGCGGCAGCGGACAG

    GCCAAGTAGAACACGCGAAGCGC

    TGGGCTGCCTGCTGCGACCAGGG

  • Podaci sa poretkom

    13

    Prostorno-

    vremenski podaci

    U prostorne podatke

    spadaju i podaci

    vezani za

    vremenske serije

    Prosečne mesečne temeprature

    kopna i mora

  • 1.4.2019. autor: dr Ana Kovačević, FB 14

    Podatak

    • Svaki podatak karakteriše:

    – simbol

    – opis

    – kontekst

  • Šta su podaci?

    Skup objekata i njihovih

    atributa

    Atributi su svojstvo ili

    karakteristika objekta Primer: temperatura, boja auta, veličina

    ekrana, itd.

    Atributi su poznati i kao promenljive, polja,

    osobine, karakteristike, obeležja...

    Skup atributa opisuje

    objekat Objekat je takođe poznat i kao slog, tačka,

    slučaj, primer, entitet, instanca, ...

    15

    Tid Refund Marital

    Status

    Taxable

    Income

    Cheat

    1 Yes Single 125K No

    2 No Married 100K No

    3 No Single 70K No

    4 Yes Married 120K No

    5 No Divorced 95K Yes

    6 No Married 60K No

    7 Yes Divorced 220K No

    8 No Single 85K Yes

    9 No Married 75K No

    10 No Single 90K Yes 10

    Atributi

    Objekti

  • Šta je atribut?

    • Atribut je osobina ili karakteristika objekta koja se razlikuje među objekima ili je različita (vremenski) za jedan objekat.

    • Npr. Boja očiju se razlikuje za osobe (simbolički atribut), dok temperatura varira u vremenu (numerik)

    • Merna skala je pravilo (funkcija) koja je pridružena numeričkoj ili simboličkoj vrednosti atributa objekta.

  • Vrednosti atributa

    17

    Vrednosti atributa su brojevi ili simboli koji su pridruženi atributu

    Razlika između atributa i njihovih vrednosti Isti atributi mogu da budu preslikani u

    različite vrednosti atributa Primer: visina može da se meri u metrima ili kilometrima

    Različiti atributi mogu da budu preslikani u isti skup vrednosti, pri čemu osobine vrednosti atributa mogu da budu različite

    Primer: vrednosti za broj godina i težinu su celobrojne, ali broj godina ne može da se smanjuje dok težina može

  • Tipovi atributa

    18

    Osobine i operacije (nad brojevima) koje se

    najčešće koriste radi određivanja tipa atributa

    su:

    Različitost

    :

    = i

    Uređenje

    :

    i ≥

    Aditivnost

    :

    + i -

    Multiplikativnost

    :

    * i /

  • Tip atributa Opis Primeri

    Imenski

    (eng. Nominal)

    Vrednost imenskog

    atributa su upravo

    različita imena, tj.

    imenski atributi pružaju

    samo mogućnost

    razlikovanja jednog od

    drugog objekta (=, )

    poštanski kodovi,

    identifikacije

    zaposlenih, boja

    očiju, pol (muški,

    ženski)

    Kvalitativni

    Redni

    (eng.

    Ordinal)

    Vrednosti rednih atributa

    pružaju dovoljno

    informacija za uređenje

    objekata ()

    tvrdoća minerala

    (dobar, bolji,

    najbolji), stepeni,

    redni brojevi

    zgrada u ulici

    Kvalitativni

    Intervalni (eng. Interval)

    Za intervalne atribute, ima

    smisla razlika između

    vrednosti, tj. postoji

    jedinica mere takvih atributa

    (+, - )

    datumi u

    kalendaru,

    temepratura u

    stepenima

    Celizijusa

    Kvantitativni

    Razmerni

    (eng. Ratio)

    Kod razmernih atributa ima

    smisla i proizvod i količnik

    (*, /) tih atributa

    količina novca,

    godine, masa,

    dužina

    Kvantitativni

    20

  • Tip atributa Opis Primeri Operacije

    Imenski

    (eng. Nominal)

    Vrednost imenskog atributa su

    upravo različita imena, tj.

    imenski atributi pružaju samo

    mogućnost razlikovanja jednog

    od drugog objekta (=, )

    poštanski kodovi,

    identifikacije

    zaposlenih, boja

    očiju, pol (muški,

    ženski)

    entropija,

    korelacija

    kontingenata, 2

    test

    Redni

    (eng.

    Ordinal)

    Vrednosti rednih atributa

    pružaju dovoljno informacija za

    uređenje objekata ()

    tvrdoća minerala

    (dobar, bolji,

    najbolji), stepeni,

    redni brojevi zgrada

    u ulici

    procenat,

    korelacija ranga,

    izvršavanje

    testova, oznake

    testova

    Intervalni

    (eng. Interval) Za intervalne atribute, ima smisla

    razlika između vrednosti, tj. postoji

    jedinica mere takvih atributa (+, - )

    datumi u kalendaru,

    temepratura u

    stepenima Celizijusa

    srednja vrednost,

    standardna

    devijacija,

    Pearson’ova

    korelacija, t i F

    test

    Razmerni

    (eng. Ratio)

    Kod razmernih atributa ima smisla i

    proizvod i količnik (*, /) tih atributa

    količina novca,

    godine, masa, dužina

    geometrijska

    sredina,

    harmonijska

    sredina, procenat

    varijacije

    21

  • Diskretni i kontinuirani atributi

    23

    Atributi mogu da budu opisani i preko broja vrednosti koje sadrže

    Diskretni atributi Imaju konačan ili prebrojivo beskonačan skup vrednosti

    Primer: poštanski brojevi, računi, skup reči u nekom

    dokumentu

    Često se prikazuju kao celobrojne promenljive

    Binarni atributi su specijalan slučaj diskretnih atriubuta

    Kontinuirani (neprekidni) atribututi Skup vrednosti ovih atributa čine realni brojevi

    Primer: temepratura, visina, težina, pritisak, brzina

    Realne vrednosti mogu da se mere i predstavljaju samo preko konačnog broja cifara

    Uobičajen način predstavljanja je u obliku realnih brojeva u pokretnom zarezu

  • Kvalitet podataka

    24

    Koje su vrste problema pri određivanju

    kvaliteta podataka?

    Kako odrediti probleme sa podacima?

    Šta raditi sa uočenim problemima?

    Primer problema kvaliteta podataka:

    greške pri merenju i prikupljanju podataka

    šum i elementi van granica

    nedostajuće vrednosti

    duplirani (multiplicirani) podaci

  • 1.4.2019. autor: dr Ana Kovačević, FB 25

    Računari i pouzdanost podataka

    • Važno kod predstavljanja podataka u

    računarima:

    – kompletnost

    – tačnost

    – preciznost podatka

  • 1.4.2019. autor: dr Ana Kovačević, FB 26

    Kompleksnost podataka

    • Kompletnost: da svaka karakteristika ili

    atribut nekog složenog podatka ili pojma

    budu definisani.

    • Nekompletni podaci nepouzdane

    informacije.

    • garbage in garbage out

  • 1.4.2019. autor: dr Ana Kovačević, FB 27

    Tačnost podataka

    • Tačnost:

    – korektnost:

    • sposobnost da se izvršava zadatak bez grešaka ili omaški;

    • mera veličine greške podataka;

    • greška:

    – sistematska – određena samim principom merenja

    – statistička – zavise od slučajnih varijacija jedne merne veličine.

    – primer: očitavanje merne vrednosti na instrumentu ima i

    sistematski i statistički karakter.

    – konformnost (usaglašenost podataka): odnosi se na

    primenu standarda ili klasifikacionih pravila za

    snimanje i prikazivanje podataka.

  • 1.4.2019. autor: dr Ana Kovačević, FB 28

    Preciznost podataka

    • Preciznost podataka – stepen rafiniranosti

    ili rezolucije kojom se mereni podaci

    prikazuju, npr. broj decimalnih mesta.

    • Primer: 1,234 kg preciznije od 1,2 kg.

  • Šum

    Šum predstavlja modifikaciju oriinalnih vrednosti

  • Šum

    Šum se nekada meša sa pravim podacima

    Eliminacija šuma nije jednostavna

    Robusni algoritmi - daju prihvatljiva rešenja i kada je šum

    prisutan

  • Elementi van granica

    32

    Elementi van granica su objekti sa karakteristikama koje

    su značajno različite od najvećeg broja objekata u skupu

    podataka

  • Nedostajuće vrednosti

    33

    Razlozi za pojavu Informacije nisu prikupljene (npr. ljudi odbijaju da prikažu

    svoju težinu, starost, veličinu plate,...)

    Atributi nisu primenljivi u svim slučajevima (npr. plata nije primenljiva na decu)

    Rukovanje nedostajućim vrednostima Eliminacija objekata

    Procena nedostajućih vrednosti

    Ignorisanje nedostajućih vrednosti pri obradi

    Zamena sa svim mogućim vrednostima (poređanim težinski prema verovatnoći pojavljivanja)

    Nekonzistentne vrednosti

  • Duplirani podaci

    34

    Skupovi podataka mogu da uključe duplikate,

    ili skoro identične podatke

    Najčešće se javljaju kod spajanja podataka

    iz heterogenih izvora

    Primer:

    Ista osoba sa više elektronskih adresa

    Proces obrade (eliminacije) duplikata se

    naziva čišćenje podataka

  • Preprocesiranje

    podataka

    35

    Primenjuje se radi dobijanja podataka koji više

    odgovaraju potrebama istraživanja podataka

    Agregacija

    Izbor uzoraka (eng. sampling)

    Smanjenje dimenzije

    Izbor podskupa atributa

    Formiranje atributa

    Diskretizacija i binarizacija

    Transformacija atributa

  • Agregacija

    36

    Kombinovanje dva ili više atributa (ili objekata)

    u jedan atribut (objekat)

    Svrha

    Redukcija podataka

    Smanjivanje broja atributa ili objekata

    Promena skale

    Npr. umesto 365 dana dobijamo 12 meseci

    'Stabilniji' podaci

    Agregirani podaci imaju tendenciju da imaju manja

    odstupanja

  • Primer

  • IZBOR UZORKA, REDUKCIJA

    DIMENZIJE

    1.4.2019. autor: dr Ana Kovačević, FB 38

  • Izbor uzoraka

    39

    Izbor uzoraka je glavna tehnika koja se koristi u izdvajanju

    podataka.

    Često se koristi kako za preliminarna istraživanja tako i za konačne analize podataka

    Statističari biraju uzorke jer je dobijanje kompletnog

    skupa podataka koji su od interesa jako skupo i vremenski zahtevno

    Izbor uzoraka se koristi u analizi podataka jer je obrada

    kompletnog skupa podataka koji je od interesa takođe jako skupa ili vremenski zahtevna

  • Izbor uzoraka

    40

    Ključni principi za efektivan izbor uzoraka su:

    Korišćenjem uzoraka koji su reprezentativni dobija

    se efekat skoro isti kao da je rađeno na

    kompletnom skupu podataka

    Uzorak je reprezentativan ako ima

    aproksimativno iste osobine kao i originalni skup

    podataka

  • Dimenzionalna

    redukcija

    6 43

    Veliki broj algoritama za istraživanje

    podataka bolje rade sa podacima manjih

    dimenzija

    Eliminišu se šum, redundantni podaci, ....

    Dobija se jednostavniji model

    Lakša vizuelizacija

  • Dimenzionalna

    redukcija

    44

    Skupovi podataka mogu da imaju veliki broj atributa (u eng. literaturi se koristi i feature)

    Svrha:

    Smanjuje se količina vremena i memorije potrebna za rad algoritama za istraživanje podataka

    Lakša vizuelizacija

    Eliminišu se šum, redundantni podaci, ....

    Tehnike Analiza glavnih komponenata (eng. Principle

    Component Analysis)

    Dekompozicija singularne vrednosti (eng. Singular Value Decomposition)

    Druge nelinearne tehnike i tehnike sa nadzorom

  • Izbor podskupa atributa

    45

    Još jedan način redukcije dimenzije

    Redundantni atributi ponavljanje jedne ili svih informacija sadržanih u

    jednom ili više atributa

    Primer: cena proizvoda i PDV

    Atributi sa irelevantnim vrednostima sadrže informacije koje nisu korisne za proces IP-a

    Primer: maticni broj studenta je irelevantan za predviđanje prosečne ocene studenta

  • Izbor podskupa atributa info Tehnike: Gruba sila:

    Probaju se svi mogući podskupovi atributa kao ulaz u IP

    algoritam

    Neprikladan zbog velikog broja podskupova

    Ugnježdeni pristup:

    Izbor podskupova atributa je deo IP algoritma.

    Filteri:

    atributi se biraju pre početka rada IP algoritma nekim

    pristupom koji je nezavisan od IP procesa

    Pristup pomoću omotača:

    Koristi se IP algoritam kao crna kutija koja pronalazi

    najbolji podskup skupa atributa.

    Slično primeni grube sile ali se ne uzimaju u obzir baš svi

    podskupovi 46

  • Izbor skupa atributa -info

    47

    Formiraju se novi atributi koji sadrže

    najvažnije informacije iz skupa podataka na

    mnogo efikasniji način nego originalni

    atributi

    Opšte metodologije:

    Izdvajanje atributa

    zavisi od domena

    Preslikavanje atributa u novi prostor

    Konstrukcija atributa

    kombinovanje (starih) atributa

  • Diskretizacija i binarizacija

    49

    Transformacija neprekidnih u

    kategoričke atribute - diskretizacija

    Transformacija neprekidnih i diskretnih atributa

    u binarne - binarizacija

    Jednostavna tehnika binarizacije: ako ima m

    kategoričkih vrednosti tada se svakoj

    dodeljuje jedinstven broj u intervalu [0,m-1] i

    konvertuje svaki od tih brojeva u binarnu

    vrednost

  • 1.4.2019. autor: dr Ana Kovačević, FB 52

    Kodiranje podataka

    • Kodiranje – proces dodeljivanja individualnog objekta klasi ili skupu klasa, u slučaju višedimenzionalne klasifikacije.

    • Primeri:

    – numerički kodovi (111123)

    – mnemonički kodovi (FB)

    – hijerarhijski kodovi (roditelj-dete)

    – binarni kodovi

  • 1.4.2019. autor: dr Ana Kovačević, FB 53

    Dani u nedelji binarno kodirani

    • Ponedeljak 000

    • Utorak 001

    • Sreda 010

    • Četvrtak 011

    • Petak 100

    • Subota 101

    • Nedelja 110

    • Ne koristi se 111

  • Transformacija atributa

    6 54

    Transformacija promenljive označava

    transformaciju koja se primenjuje na sve

    vrednosti te promenljive.

    Za svaki objekat, transformacija se primenjuje

    na vrednosti promenljive za taj objekat.

    Primer: ako je bitna jedino veličina objekta,

    promenljiva može da se transformiše

    uzimanjem apsolutne vrednosti.

  • Transformacija atributa –

    55

    Jednostavne funkcije, npr. : √x, xk, log(x), ex, |x|, 1/x

    U statistici se često koriste √x, log(x) i 1/x radi

    transformacije podataka koji nemaju Gausovu

    (normalnu) raspodelu u podatke koji imaju tu

    raspodelu

    U IP procesu ima i drugih razloga. Npr. ako je vrednost

    promenljive između 1 i 1.000.000.000, primenom log

    funkcije se dobijaju bolji odnosi kod poređenja (npr. 108

    sa 109 i 10 sa 1000)

    Transformaciju promenljivih treba primenjivati sa

    oprezom jer može da promeni prirodu podataka (npr.

    transformacija sa 1/x)

  • 1.4.2019. autor: dr Ana Kovačević, FB 58

    Integracija podataka

    • Integracija važna: radi objedinjavanja

    podataka iz autonomnih ili izolovanih

    aplikacija, i težnja ka formiranju Integralnih

    informacionih sistema.

    • Integracija podataka:

    – integracija unutar organizacije

    – integracija podataka između organizacije

    (integracija podataka na web-u).

  • 1.4.2019. autor: dr Ana Kovačević, FB 59

    Integracija podataka

    • Integracija podataka je problem

    obezbeđivanja jedinstvenog i

    transparentnog pristupa podacima koji su

    uskladišteni unutar autonomnih i

    heterogenih izvora podataka.

  • 1.4.2019. autor: dr Ana Kovačević, FB 60

    Aktivnosti nad podacima

    • klasifikacija, svrstavanje u klase na osnovu

    odabranog kriterijuma

    • sortiranje, proces uređivanje redosleda

    podataka u nizi, prema zadatom kriterijumu

    • agregacija, spajanje, združivanje

    • računanje, izvodi se nad numeričkim podacima

    • selekcija, izdvajanje podataka iz skupa

    podataka na osnovu odabranog kriterijuma

    • …

  • Primer klasifikacije

    1.4.2019. autor: dr Ana Kovačević, FB 61

  • INFORMACIJE

    1.4.2019. autor: dr Ana Kovačević, FB 62

  • 1.4.2019. autor: dr Ana Kovačević, FB 63

    Podatak vs. Informacija

    • Podaci sirove, nestruktuirane činjenice,

    materijal za dobijanje informacija.

    • Svaka informacija sadrži podatak, ali svaki

    podatak nije informacija.

    • Različitom kombinacijom istih podataka

    moguće je dobiti sasvim različite

    informacije.

    • Informacija doprinosi otklanjanju neznanja.

  • 1.4.2019. autor: dr Ana Kovačević, FB 64

    Informacije

    • Potiče od lat. Informare (informisanje ili

    obaveštavanje)

    • Informacija se može definisati kao:

    – PROTUMAČENI PODATAK

    – Podaci kada se posmatraju u datom

    kontekstu i prenose značenje korisniku.

    – Izvedena vrednost sa pridruženim značenjem

    dobijena primenom operacija obrade

    podataka.

  • 1.4.2019. autor: dr Ana Kovačević, FB 65

    Pojam informacije

    • Informacija je inkrement znanja

    – Povećava ili doprinosi skupu poznatih

    pojmova ili činjenica.

    – Informacija zavisi od: konteksta, i predznanje

    primaoca informacije.

  • 1.4.2019. autor: dr Ana Kovačević, FB 66

    Pojam informacije (komunikacija)

    • Prenos poruka (komunikacija)

    – mogućnost dobijanja informacije

    – vrlo složen

    – discipline koje ga proučavaju:

    • psihologija, biologija, filozofija

    • telekomunikacije

    • informacioni sistemi

    • druge discipline

  • 1.4.2019. autor: dr Ana Kovačević, FB 67

    Pojam informacije

    • Količina informacije

    – informacije su različitog značaja

    – formalna mera za količinu informacija –

    entropija

    – bit (binary digit) – jedinična količina

    informacija

    – semantički aspekt informacija:

    • značenje ili smisao poruka zavisi od osobe

    • ne utiče na meru količine informacija

  • 1.4.2019. autor: dr Ana Kovačević, FB 68

    Podatak vs. Informacija

    • Podatak: 10

    • Informacija 1: Sada je 10 sati.

    • Informacija 2: Matija je dobio 10 iz

    Informatike.

  • 1.4.2019. autor: dr Ana Kovačević, FB 69

    Informacija

    • “Informacija je nešto što ukida ili smanjuje

    neodređenost sistema, odnosno smanjuje

    neizvesnost promena.”

    – C. Shannon.

  • 1.4.2019. autor: dr Ana Kovačević, FB 70

    Informacija

    • Informacija povezana sa:

    – neizvesnošću, očekivanjem i pretpostavkom.

    • Informacija raste kada verovatnoća pojavljivanja

    datog događaja opada.

    – “U januaru je padao sneg” – mala kol. informacija.

    – “U avgustu je padao sneg” – veća količina

    informacija.

    • pretpostavka: severna polulopta,

    • manja verovatnoća – veća neizvesnost, manje očekivanje.

  • 1.4.2019. autor: dr Ana Kovačević, FB 71

    Informacija

    • INFORMACIJA je rezultat obrade

    podataka i pojavljuje se kao značajna za

    one koji je dobiju u specifičnom domenu,

    odnosno datom kontekstu.

    • Informacija zavisi od:

    – konteksta

    – predznanja primaoca informacija.

  • 1.4.2019. autor: dr Ana Kovačević, FB 72

    Poželjna svojstva informacija

    • Poželjna svojstva informacija su: – tačnost

    – raspoloživost

    – kompletnost

    – jednostavnost

    – ekonomičnost

    – mogućnost verifikacije

    – pouzdanost

    – relevantnost

    – trajnost

    – fleksibilnost

    – zaštićenost od neautorizovanog pristupa.

    • Neka svojstva su međusobno protivrečna, npr. Mogućnost pristupanja i zaštita

  • 1.4.2019. autor: dr Ana Kovačević, FB 73

    Vrednovanje informacija:

    Različiti korisnici – različito vrednuju

    informaciju.

    Faktori koji utiču na vrednost informacije:

    • njena aktuelnost

    • tačnost

    • pouzdanost

    • mera u kojoj zadovoljava potrebe

    korisnika

  • 1.4.2019. autor: dr Ana Kovačević, FB 74

    Količina informacija

    • U teoriji informacija: Količina informacije u

    jednoj poruci se definiše kao broj bitova

    potrebnih za kodiranje svih mogućih

    značenja te poruke (pod pretpostavkom da

    su sva moguća značenja podjednako

    verovatna).

  • 1.4.2019. autor: dr Ana Kovačević, FB 75

    Aspekti informacija

    • sintaksni: način predstavljanja nosioca

    informacija (podataka)

    • semantički: značenje (važan je kontekst)

    – Kosa leži na kosi.

    – Kosa: žensko ime, poljoprivredna alatka,

    dlaka na glavi, kosa linija, kosina...

    • pragmatički: akcije koje nastaju kao

    rezultat interpretacije informacije.

  • 1.4.2019. autor: dr Ana Kovačević, FB 76

    Transformacija podataka u

    informacije • Proces transformacije podataka u

    informacije:

    – selekcija,

    – obrada: skup aktivnosti kojima se podaci

    transformišu u informacije

    • Informacije se prikazuju u formi pogodnoj

    za korisnika.

  • 1.4.2019. autor: dr Ana Kovačević, FB 77

    Transformacija podataka u

    informacije • Važno za transformaciju podataka:

    – da su podaci ispravno zapisani

    – preneto korisnicama bez ostavljanja

    mogućnosti za različite interpretacije.

    • Podaci postaju informacije u trenutku

    njihovog korišćenja, ako se prikupljeni

    podaci ne koriste oni ne postaju

    informacije.

  • 1.4.2019. autor: dr Ana Kovačević, FB 78

    Proces akumuliranja znanja

    • Informacija se transformiše u znanje kada

    se koristi za donošenje odluka i

    preduzimanje odgovarajućih akcija.

  • 1.4.2019. autor: dr Ana Kovačević, FB 79

    Znanje

    • Znanje je informacija koja ima kontekst,

    relevantna je i na osnovu njenog sadržaja

    se može delovati.

    • Znanje je dinamično znanje informacija

    u akciji.

    • Tokom vremena sa iskustvom znanje

    evoluira.

  • 1.4.2019. autor: dr Ana Kovačević, FB 80

    Unapređenje znanja

    • Za pojedince i organizacije je veoma

    važno da unapređuju svoje znanje, da bi

    ga održale kao izvor konkurentske

    prednosti potrebno da organizacije

    imaju i unapređuju sistem za upravlje

    znanjem i intelektualnim kapitalom.

    • Znanje je Intelektualni kapital znanje

    ima finansijsku vrednost.

  • 1.4.2019. autor: dr Ana Kovačević, FB 81

    Znanje

    • Znanje: – objektivno:

    • dokumentovano u formi koja se može distribuirati drugima ili transformisati u proces;

    • znanje koje otiče.

    – subjektivno: • teško se može dokumentovati, nestruktuirano, rasuto;

    • ugrađeno znanje.

    • U savremenim IS uglavnom se prikuplja, skladišti, upravlja, izveštava o objektivnom znanju, ali treba razmatrati i subjektivno znanje.

  • 1.4.2019. autor: dr Ana Kovačević, FB 82

    Upravljanje znanjem

    • Upravljanje znanjem (engl. Knowledge

    Management) je proces koji doprinosi

    povećanju njegove vrednosti ponovnom

    upotrebom.

    • Sistem upravljanja znanjem (Knowledge

    Management) omogućava dostupnost

    upravljanja znanjem u celoj organizaciji ili

    preduzeću.

  • 1.4.2019. autor: dr Ana Kovačević, FB 83

    Upravljanje znanjem

    • Životni ciklus upravljanja znanjem:

    – stvaranje znanja

    – osvajanje znanja

    – oplemenjivanje znanja

    – upravljanje znanjem

    – širenje znanja.

  • Upravljanje znanjem

    • Podeliti ono što ste naučili, stvorili ili dokazali.

    • Inovirati da bi bili kreativniji, inventivniji i

    maštovitiji

    • Ponovno koristiti ono što su drugi već naučili,

    kreirali i dokazali.

    • Sarađivati sa drugima da bi se bolje iskoristilo

    njihovo znanje

    • Učiti radeći, od drugih, i iz postojećih informacija.

    1.4.2019. autor: dr Ana Kovačević, FB 84

  • 1.4.2019. autor: dr Ana Kovačević, FB 85

    Klasifikacija

    • Prema Russell Ackoff-u, sistem teoretičaru i profesoru organizacionih promena, ljudski um se može klasifikovati u 5 kategorija: – podaci: simboli,

    – informacije: podaci koji postaju korisni nakon neke obrade (ko, šta, gde i kada?).

    – znanje: aplikacije nad podacima i informacijama, (kako?)

    – razumevanje: zašto?

    – mudrost: evaluirano razumevanje; omogućava kreiranje budućnosti.

  • 1.4.2019. autor: dr Ana Kovačević, FB 86

    Tranzicija podataka u informacije

    (Russell Ackoff)

  • DIKW piramida III

    87 Joe Gollner: The Anatomy of

    Knowledge

  • 1.4.2019. autor: dr Ana Kovačević, FB 88

    Primer

    • Podatak: 1234567.89

    • Informacija: Vaš račune je porastao za 1234567.89$ što je 8087% .

    • Znanje: Niko mi ne duguje toliko novca.

    • Mudrost: Bolje da proverim u banci pre nego što ih potrošim, zbog onoga što se desilo drugim ljudima.

    • (Izvor: Free on-line Dictionary of Computing)

  • 1.4.2019. autor: dr Ana Kovačević, FB 89

    Definicije informacija

    • SINTAKSNI aspekt: Informacija predstavlja negativnu vrednost logaritma verovatnoće dešavanja događaja

    (C. Shenon)

    • SEMANTIČKI aspekt: Informacija je funkcija odnosa između mogućih odgovora pre i posle prijema poruke (Briljon)

    • PRAGMATIČKI aspekt: Informacija je naziv za sadržaj koji je razmenjen sa spoljašnjim svetom u postupku usaglašavanja sa njim (Viner)

  • 1.4.2019. autor: dr Ana Kovačević, FB 90

    Entropija

    • 1948. Claude Shannon

    • U teoriji informacija entropija je mera

    neizvesnosti koja se pridružuje nekoj

    slučajnoj promenljivoj.

    • Mera za količinu informacija koja

    nedostaje u datom sistemu pre prijema:

    Šenonova entropija.

  • 1.4.2019. autor: dr Ana Kovačević, FB 91

    Pojam entropije

    • Entropija

    – mera neorganizovanosti sistema

    – mera za nered u sistemu

    • potpuni nered i potpuni red ne postoje

    – mera neizvesnosti o podacima u prenetim porukama

    • Informacija

    – Shannon: negativna vrednost entropije

    – mera za red, izvesnost, organizovanost sistema.

  • 1.4.2019. autor: dr Ana Kovačević, FB 92

    Šenonova definicija informacija

    • I-informacioni sadržaj (količina informacije)

    koji se može desiti sa verovatnoćom p:

    I = -log2 p, gde je 0

  • 1.4.2019. autor: dr Ana Kovačević, FB 93

    Primer

    • “Fer” novčić, novčić koji prilikom bacanja

    ima podjednaku verovatnoću pojavljivanja

    “pisma” i “glave” ima entropiju 1 bit.

    • I = – log2 0.5= 1 bit.

    • Napomena: ukoliko novčić nije fer, tada je

    neizvesnost manja, a samim tim i

    Shannon-ova entropija.

  • 1.4.2019. autor: dr Ana Kovačević, FB 94

    Literatura

    • Dejan Simić, 2011, Osnove informaciono

    komunikacionih tehnologija, glava 3.

    • Ozren Džigurski, Informatika, Fakultet

    civilne odbrane, 2002.

    • Tan, P., Steinbach, M., Kumar, V.

    (2006). Introduction to data mining.

    Pearson AddisonWesley

    – Nenad Mitić, Podaci

    http://poincare.matf.bg.ac.rs/~nenad/ip.2016/2

    .podaci.pdf)

    http://poincare.matf.bg.ac.rs/~nenad/ip.2016/2.podaci.pdfhttp://poincare.matf.bg.ac.rs/~nenad/ip.2016/2.podaci.pdf