informatica umanistica b rappresentazione delle informazioni in forma digitale poesio/teach/iu...

74
INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE http://www.disi.unitn.it/~poesio/Te ach/IU [email protected]

Upload: giorgia-mura

Post on 01-May-2015

219 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

INFORMATICA UMANISTICA B

RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE

http://www.disi.unitn.it/~poesio/Teach/[email protected]

Page 2: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE

Due tipi di informazione: in forma ANALOGICA (continua) in forma DISCRETA (o simbolica)

Per rappresentare o comunicare informazione in forma discreta occorre un CODICE

Esempi di codici: DNA, Morse Esempi di codici digitali:

Per numeri Per testi Per immagini Per suoni

Page 3: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Informazione su computer

Un computer deve: Fare input/output dell’informazione

Usando i dispositivi di input/output Memorizzare l’informazione

Usando la memoria principale/secondaria Elaborare l’informazione

Usando il processore

Page 4: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Informazione su computer

Mondo esterno

informazione rappresentazione digitale

codifica

decodifica

Computer: memorizzazione, elaborazione

Page 5: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

PROBLEMA DELLA RAPPRESENTAZIONE DELL’INFORMAZIONE SU COMPUTER

SVILUPPARE CODICI CHE PERMETTANO DI

RAPPRESENTARE INFORMAZIONE DI TIPO DISCRETO IN MODO EFFICIENTE SU UN SUPPORTO FISICO

RAPPRESENTARE INFORMAZIONE DI TIPO ANALOGICO CON CODICI DISCRETI

Page 6: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

RAPPRESENTAZIONE ANALOGICA E DISCRETA

Rappresentazione ANALOGICA: una serie di distinzioni CONTINUE Immagini, suoni, numeri reali

Rappresentazione DISCRETA: ogni elemento chiaramente distinto dagli altri

Page 7: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

INFORMAZIONE IN FORMA ANALOGICA

Page 8: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

INFORMAZIONE IN FORMA DISCRETA

Page 9: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

RAPPRESENTAZIONE DELL’INFORMAZIONE E COMUNICAZIONE

L’IDEA DI SVILUPPARE CODICI PER RAPPRESENTARE INFORMAZIONE NON E’ SORTA CON I COMPUTER, MA PER FACILITARE LA COMUNICAZIONE TRA ESSERI UMANI

Page 10: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

UN ESEMPIO DI CODICE: LA SCRITTURA (IDEOGRAFICA O DISCRETA)

Le prime forme di scrittura furono tutte essenzialmente ideografiche

La scrittura fonetica alfabetica appare, sempre in area mediorientale, intorno al 1500 a. C

Ma furono solamente i Greci che, introducendo anche i segni per le vocali, ne completarono l’evoluzione intorno all’ottavo secolo a. C.

Page 11: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

IL CODICE MORSE

-- --- ·-· ··· · (space) -·-· --- -·· ·

M O R S E (space) C O D E

Page 12: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

IL CODICE MORSE

Un codice TERNARIO (-, ., spazio) Codici per i caratteri scelti in modo che i

caratteri piu’ frequenti hanno codici piu’ brevi

Page 13: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

UN ESEMPIO DI CODICE DISCRETO VISIVO

Page 14: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

CODICI IN NATURA

In realta’, i codici sono apparsi ben prima degli esseri umani. In natura si trovano molti esempi di codici, i piu’ famosi dei quali sono Il DNA Il repertorio di fonemi di un linguaggio

Page 15: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

UN CODICE FONDAMENTALE: Il DNA

Page 16: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

CODICE = CONVENZIONE

Il fatto che una certa immagine od un certo simbolo rappresentino informazione non è sufficiente perche’ possano essere usati per la comunicazione

Un CODICE (o LINGUAGGIO) è un insieme di SEGNI (e di regole) che mittente e destinatario devono CONDIVIDERE affinché il primo sia in grado di formulare messaggi ed il secondo di comprenderli

Ogni codice e’ quindi una forma di CONVENZIONE sociale stabilita tra individui (cfr. David Lewis)

Page 17: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

CODICI E STATI INFORMATIVI

I CODICI VENGONO PROGETTATI SULLA BASE DELLE DISTINZIONI CHE DEVONO ESSERE RAPPRESENTATE

OGNI TIPO DISTINTO DI INFORMAZIONE: STAT0

Page 18: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

UN ESEMPIO MINIMO DI INFORMAZIONE: L’INTERRUTTORE

Due stati distinti: Acceso Spento

L’informazione sullo stato dell’interruttore corrisponde dunque alla scelta fra due sole alternative

Possiamo rappresentarla usando una sola cifra con due valori: 0 od 1

Page 19: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

UNA DEFINIZIONE SEMI-FORMALE DI CODICE (O LINGUAGGIO)

a) una serie di nozioni sugli stati del mondo che possono essere il contenuto di ciascun atto comunicativo; chiamiamo questi elementi significati

b) una serie di simboli astratti che possono essere connessi in modo convenzionale a significati; essi possono essere sottoposti a regole che ne governino la combinazione e la successione e che stabiliscano quali sequenze considerare e quali scartare; chiamiamo queste regole sintassi

c) una serie di eventi fisici dotati di caratteristiche distintive, che possono essere adoperati per rappresentare le unità astratte della serie (b)

d) una regola che associa in modo sistematico le unità della serie (a) a quelle della serie (b), ed in seconda istanza le unità della serie (b) a quelle della serie (c)

Page 20: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

CODICI PER NUMERI

Nel caso dei numeri, la necessita’ di sviluppare un codice limitato non e’ motivata solo da facilita’ di memorizzazione, ma anche dalla necessita’ di usarli per MANIPOLAZIONI SIMBOLICHE

Page 21: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

DUE CODICI PER I NUMERI

Codice ROMANO: VII + IV = XI

Codice DECIMALE: 7 + 4 = 11

Differenza fondamentale: il codice decimale e’ un codice POSIZIONALE 7 = 7x100 70 = 7x101 + 0 x100

I codici posizionali rendono le operazioni aritmetiche molto piu’ semplici

Page 22: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Rappresentazione digitale dei numeri

Il codice decimale, benche’ molto comodo, non e’ il codice MINIMO

Per rappresentare informazione sui computer, codice minimo essenziale perche’ occorreva poter rappresentare ogni simbolo diverso in modo FISICO (= con circuiti elettrici)

Il minimo numero di simboli diversi necessari per rappresentare tutti i numeri e’ il codice BINARIO: 0, 1

Page 23: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Perché la rappresentazione binaria?

I due simboli (0 e 1) possono essere rappresentati da: Due stati di polarizzazione di

una sostanza magnetizzabile Due stati di carica elettrica di

una sostanza L’invenzione dei tubi catodici

prima, e dei transistor poi, ci ha fornito gli strumenti per rappresentare due stati di carica elettrica

Page 24: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Rappresentazione digitale = rappresentazione binaria

L’entità minima di informazione che possiamo trovare all’interno di un elaboratore prende il nome di bit Binary digit – cifra binaria Un bit può assumere due valori

Rappresentazione binaria Solo due simboli (0 e 1)

Page 25: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

USO DELLA RAPPRESENTAZIONE BINARIA: DUE STATI

Due possibilità Acceso Spento

L’informazione sullo stato dell’interruttore corrisponde dunque alla scelta fra due sole alternative

Possiamo rappresentarla usando un solo bit

Page 26: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

NUMERO MAGGIORE DI STATI

Per poter rappresentare un numero maggiore di informazione si usano sequenze di bit

Per esempio, per rappresentare quattro informazioni diverse possiamo utilizzare due bit che ci permettono di ottenere quattro configurazione distinte

00 01 10 11

Il processo secondo cui si fa corrispondere ad un’informazione una sequenze di bit prende il nome codifica dell’informazione

Page 27: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

QUATTRO STATI DIVERSI

Esempio: un esame può avere quattro possibili esiti: ottimo, discreto, sufficiente, insufficiente

Codifica (due bit): ottimo con 00 discreto con 01 sufficiente con 10 insufficiente con 11

Page 28: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

OTTO STATI

Esempio: otto colori: nero, rosso, blu, giallo, verde, viola, grigio, arancione

Codifico (tre bit): nero con 000 rosso con 001 blu con 010 giallo con 011 verde con 100 viola con 101 grigio con 110 arancione con 111

Page 29: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

I numeri in rappresentazione binaria

Il principio e’ lo stesso del codice decimale, ma con due soli simboli

8 = 8x100 = 1x23 + 0x22+ 0x21+ 0x20 = 1000

70 = 7x101 + 0 x100 = 64 + 4 + 2 = 1 x26 + 0x25+ 0x24+ 0x23+ 1x22+ 1x21+ 0x20 = 1000110

178 = 1x102 + 7x101 + 8x100 = 128 + 32 + 8 + 2 = 1x27+ 0x26 + 1x25+ 0x24+ 1x23+ 0x22+ 1x21+ 0x20 = 10101010

Page 30: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

BYTE

Esiste una particolare aggregazione di bit che è costituita da 8 bit (28 = 256 informazioni) e prende il nome di byte

Di solito si usano i multipli del byte

Kilo KB 210 (~ un migliaio, 1024) byte

Mega MB 220 (~ un milione, 1KB x 1024) byte

Giga GB 230 (~ un milliardo, 1MB x 1024) byte

Tera TB 240 (~ mille miliardi, 1GB x 1024) byte

Page 31: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

RAPPRESENTAZIONE DI INTERI SU COMPUTER

Tipicamente 4 byte (= 32 bit) oppure 8 byte (= 64 bit)

Page 32: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

RAPPRESENTAZIONE DIGITALE DI ALTRI TIPI DI INFORMAZIONE

Per molti anni, l’unico tipo di informazione rappresentata sui computers informazione di tipo numerico

Ma di fatto, si scopri’ presto che lo stesso trucco poteva venire usato per I TESTI

Page 33: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

La codifica digitale del testo

che tipo di rappresentazione digitale del testo?

Page 34: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

La codifica digitale del testoIl testo e la sua organizzazione

titolo

capitolo

testo

intestazione

Page 35: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

La codifica digitale del testo

Le avventure di PinocchioCapitolo ICome andò che Maestro Ciliegia, falegname, trovò un pezzo di legno, che piangeva e rideva come un bambino.C'era una volta...- Un re! - diranno subito i miei piccoli lettori.- No, ragazzi, avete sbagliato. C'era una volta un pezzo di legno.Non era un legno di lusso, ma un semplice pezzo da catasta, di quelli che d'inverno si mettono nelle stufe e nei caminetti per accendere il fuoco e per riscaldare le stanze.Non so come andasse, ma il fatto gli è che un bel giorno questo pezzo di legno capitò nella bottega di un vecchio falegname, il quale aveva nome mastr'Antonio, se non che tutti lo chiamavano maestro Ciliegia, per via della punta del suo naso, che era sempre lustra e paonazza, come una ciliegia matura.

Il testo come sequenza di caratteri

Ciascun carattere alfanumerico, di punteggiatura o di controllo che compone il testo deve essere rappresentato

nei termini di un codice binario

Page 36: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

La codifica di alto livello: il punto di partenza

Il testo codificato al livello zero si presentacome un manoscritto in scriptio continua

Page 37: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

La codifica digitale del testo

Due livelli di codifica del testo digitale codifica di basso livello (codifica di livello 0)

riguarda la rappresentazione binaria della sequenza ordinata dei caratteri

codifica di alto livello arricchisce il testo codificato al livello zero con

informazione relativa a dimensioni strutturali organizzazione del testo in strutture macrotestuali articolazione del testo in strutture linguistiche

La codifica di alto livello permette di rendere esplicita qualsiasi interpretazione, anche di tipo linguistico, si voglia associare al

testo

Page 38: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Come sono rappresentati i caratteri nel computer?

Repertorio di caratteri un insieme di caratteri (es. “A”, “a”, “!”, “à”, “P”, ecc.) i caratteri sono entità astratte, da non confondersi con il modo in cui sono

realizzati graficamente (gliphs) “a”, “a”, “a”, “a” sono tutti lo stesso carattere “a” la stessa realizzazione grafica può corrispondere a caratteri diversi (es. “A”

latino e “A” cirillico e “A” greco)

Set di carattere (codice) una tabella che definisce una corrispondenza biunivoca (1-a-1) tra un

repertorio di caratteri e un insieme di numeri interi non negativi a ogni carattere è assegnato un codice numerico (punto di codice o code

position)

Codifica di carattere algoritmo che determina come i codici dei caratteri sono rappresentati in

sequenze di bits (bytes)

Page 39: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Il codice ASCII

Primo standard per l’assegnazione di codici a caratteri (dal 1963) set di caratteri riconosciuto da tutti i computer conosciuto come “ASCII Standard” o ISO-646

Codifica 7 bits

ciascun punto di codice è rappresentato con il numero binario corrispondente di 7 bits

in realtà 1 byte = 8 bits di cui un bit non è usato per la codifica (bit di parità)

7 bits = 27 punti di codice = 128 caratteri rappresentati

Sufficiente per rappresentare l’inglese mancano i caratteri accentati, umlauts, ecc. per rappresentare

altri alfabeti occidentali

Page 40: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

ASCII (binario)

Page 41: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

CODIFICA DI PAROLE IN ASCII

Parole sono sequenze di caratteri Codifica della parole cane

01100011 01100001 01101110 01100101

c a n e Il problema inverso: data una sequenza di bit, il

testo che essa codifica può essere ottenuto nel modo seguente: si divide la sequenza in gruppi di otto bit (byte) si determina il carattere corrispondente ad ogni byte

Page 42: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

LIMITI DELL’ASCII E SOLUZIONI

ASCII sviluppato per lingue anglosassoni, quindi non contiene codici per molti caratteri di lingue come l’Italiano

Molti codici furono proposti che utilizzano l’8 bit

ISO ha cercato di proporre standards Esempio: ISO-LATIN-1

Page 43: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Il set di caratteri ISO-Latin-1

ASCII Standard

Caratteri di controllo

0-32

128-159

ISO-Latin-1 (ISO-8859-1 o ASCII esteso) unica estensione standard di ASCII 1 byte = 8 bits = 28 punti di codice = 256 caratteri rappresentati sufficiente per lingue europee occidentali (italiano, francese, ecc.)

Page 44: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

UNICODE

www.unicode.org Proposta di codice a 16 bit che può quindi essere

usato per codificare 216 simboli diversi (cioe’ tutti gli alfabeti, incluso cinese ed arabo)

Esempio: Medieval Unicode Font gandalf.aksis.uib.no/mufi

Problemi: Non tutti gli editori lo trattano Dimensioni dei file raddoppiano

Soluzioni: UTF

Page 45: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Dall’analogico al digitale

OK, nel caso dei testi è tutto chiaro…

…ma come la mettiamo con immagini, suoni, filmati?

Cominciamo dalle immagini…

Di nuovo, il trucco e’ convertire l’informazione nelle immagini in forma binaria!!

Page 46: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Codifica delle immagini

Suddividiamo l’immagine mediante una griglia formatada righe orizzontali e verticali a distanza costante

Page 47: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Codifica delle immagini

Ogni quadratino derivante da tale suddivisione prende il nome di pixel (picture element) e può essere codificato in binario secondo la seguente convenzione: Il simbolo “0” viene utilizzato per la codifica di un pixel

corrispondente ad un quadratino in cui il bianco è predominante

Il simbolo “1” viene utilizzato per la codifica di un pixel corrispondente ad un quadratino in cui il nero è predominante

Page 48: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Codifica delle immagini

0 0 0 1 0 0 0 0 0 0

0 0 1 1 1 0 0 0 0 0

0 0 1 1 1 1 1 0 0 0

0 0 0 0 0 0 0 0 0 0

Page 49: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Codifica delle immagini

0 0 0 1 0 0 0 0 0 0

0 0 1 1 1 0 0 0 0 0

0 0 1 1 1 1 1 0 0 0

0 0 0 0 0 0 0 0 0 0

Poiché una sequenza di bit è lineare, è necessario definireconvenzioni per ordinare la griglia dei pixel in una sequenza. Assumiamo che i pixel siano ordinati dal bassoverso l’alto e da sinistra verso destra0000000000 0011111000 0011100000 0001000000

Page 50: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Codifica delle immagini

Non sempre il cortorno della figura coincide con le linee della griglia. Quella che si ottiene nella codifica è un’approssimazione della figura originaria

Se riconvertiamo la sequenza di stringhe0000000000 0011111000 0011100000 0001000000in immagine otteniamo

Page 51: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Codifica delle immagini

La rappresentazione sarà più fedele all’aumentaredel numero di pixel, ossia al diminuire delle dimensioni dei quadratini della griglia in cui è suddivisa l’immagine

Page 52: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

EFFETTO DELLA RISOLUZIONE

Page 53: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

ESERCIZIO (PER I TECNOFILI DANAROSI)

Se avete sia un telefonino con camera che una camera digitale, provate a riprendere due immagini dello stesso oggetto ….

Page 54: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

PIU’ DI DUE COLORI

Se l’immagine è solo in bianco e nero (senza grigi), basterà usare un ‘1’ per i pixel neri, e uno ‘0’ per i pixel bianchi

Se l’immagine ha più di due colori, si faranno corrispondere a gruppi diversi di ‘0’ e ‘1’ sfumature diverse di colore (o di grigio)

Page 55: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

RAPPRESENTARE COLORI

Così, ad esempio, se si fa corrispondere a ogni pixel un byte (cioè 8 bit), potremo differenziare 256 colori

Al posto della tabella di codifica dei caratteri avremo una tabella di codifica dei colori

Ad es: 00101101

Page 56: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

I SUONI

Page 57: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

CONVERSIONE IN DIGITALE VIA CAMPIONAMENTO

Page 58: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

SUONO: DALLA RAPPRESENTAZIONE ANALOGICA ALLA RAPPRESENTAZIONE DIGITALE

Page 59: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Digitalizzare informazione multimediale

E i filmati? Un filmato non è altro che una successione di fotogrammi (frame) accompagnata da una colonna sonora

Basterà codificare, uno per uno, tutti i fotogrammi (sappiamo come fare: ogni fotogramma è un’immagine)… e codificare la colonna sonora.

Non stupisce che per codificare un breve filmato servano moltissimi bit!

Page 60: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

`Convergenza digitale’ o `Multimedialita’

Page 61: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

TEORIA DELL’INFORMAZIONE

Dobbiamo a Claude Shannon e Warren Weaver la prima definizione teorica rigorosa del concetto di comunicazione ed il primo schema astratto di tutti i processi comunicativi, elaborati alla fine degli anni ‘40

Page 62: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

LA COMUNICAZIONE SECONDO SHANNON & WEAVER

La comunicazione è il trasferimento di informazioni mediante segnali da una fonte a un destinatario

Lo schema della comunicazione di Shannon e Weaver è un modello astratto della comunicazione. Esso ha l’obiettivo di individuare la forma generale di ogni processo comunicativo e i fattori fondamentali che lo costituiscono, quegli elementi, cioè, che devono essere presenti ogni qual volta si verifichi un passaggio di informazione

Page 63: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

IL MODELLO ‘NOISY CHANNEL’

Page 64: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

TEMI CENTRALI DELLA TEORIA DELL’INFORMAZIONE

Informazione come SCELTA tra ALTERNATIVE

Un MESSAGGIO viene usato per comunicare quale tra queste alternative e’ vera / interessa / si vuole raggiungere

Come e’ possibile sviluppare il codice PIU’ EFFICIENTE (= che richiede il minor numero di bit)?

Page 65: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

MINIMO NUMERO DI BIT RICHIESTI PER CODICE

Con 2 bit si codificano 4 distinzioni (22) Con 3 bit si codificano 8 distinzioni (23) … Con N bit si possono codificare 2N distinzioni

differenti Viceversa, se devo rappresentare N

distinzioni, devo usare almeno log2 N bit

Page 66: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

NUMERO DI BIT NECESSARI PER RAPPRESENTARE INFORMAZIONE

Se il problema è quello di dover rappresentare M informazioni differenti si deve selezionare il numero di N bit in modo tale che

2N >= M Esempio: per rappresentare 40 informazioni

differenti devo utilizzare 6 bit perché 26 = 64

5 bit non sono sufficienti perché 25 = 32

Page 67: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

COMPRESSIONE

L’informazione analogica richiede molti bit Per cercare di ridurre l’impiego di bit,

possiamo cercare di utilizzare tecniche di compressione

Le tecniche di compressione usano ogni trucco possibile per ‘economizzare’ sul numero di bit utilizzati per la codifica

Page 68: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

GIF VS. JPEG

GIF (75279 bytes) JPEG (15975 bytes)

Page 69: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

JPEG: PIU’ / MENO COMPRESSO

Page 70: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

SUONO ORIGINALE / MP3

CD: Musica campionata 44100 volte al secondo 16 bit per campione Campioni per sinistra e destra (stereo) Totale: 1 411 200 bits x secondo = 32 M per una canzone di 3 minuti

Page 71: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

MP3

Sfrutta conoscenza dei limiti dell’udito umano per ridurre la quantita’ di informazione da immagazzinare: Escludi suoni che l’orecchio non puo’ udire Quando c’e’ un suono particolarmente rumoroso,

non registrare gli altri suoni Fattore di riduzione: anche 10 volte (= 3M per

canzone)

Page 72: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

RIASSUNTO

Due tipi di informazione: in forma ANALOGICA, in forma DISCRETA (o simbolica)

Per rappresentare o comunicare informazione occorre un CODICE

Codici digitali: Per numeri: binario Per testi: ASCII Per immagini Per suoni

E’ possibile progettare dei codici piu’ o meno ottimali usando idee della teoria dell’informazione

Compressione: JPEG, MP3

Page 73: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

RIFERIMENTI / SITI Tomasi, capitoli 1.1 e 6 Lucidi di Ciotti online:

Online: http://www.mediamente.rai.it/mediamentetv/learning/ed_multimediale/lezioni/01/

Rappresentazione digitale delle immagini e compressione: http://www.med.unifi.it/didonline/anno-I/informatica/

node3.html JPEG: http://www.brycetech.com/tutor/windows/jpeg_compression.html

MP3: http://it.wikipedia.org/wiki/MP3

Page 74: INFORMATICA UMANISTICA B RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE poesio/Teach/IU massimo.poesio@unitn.it

Ringraziamenti

Parte del materiale preso da: Informatica Umanistica anni precedenti (Cuel /

Ferrario) Sito online di Testo e Computer (Lenci /

Montemagni / Pirrelli) Ciotti / Roncaglia Jeremy Sproston (Universita’ di Torino)