numerico-vespignani, informatica per le scienze umanistiche, il mulino, 2003 capitolo viii. la...

36
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra tecnologia e applicazioni

Upload: fiorenza-ruggiero

Post on 03-May-2015

226 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Capitolo VIII.

La comunicazione multimediale:l’elaborazione audio-video

tra tecnologia e applicazioni

Page 2: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

2Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Che cosa si comunica?

Informazione

Page 3: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

3Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

La trasmissione

S Mezzo Trasmissivo D

Figura 1 – La trasmissione

Page 4: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

4Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Informazione e segnali

Introduciamo un concetto molto importante per l’informatica delle comunicazioni:

il concetto di segnale

Il segnale come ciò che percorre il mezzo trasmissivo trasportando con sé

l’informazione

Page 5: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

5Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

I segnali e la matematica

Rappresentazione di un segnale

TempoGrandezza misurata

• Un segnale può essere descritto come una funzione matematica che si evolve, ovvero varia, nel tempo.

• Formalmente:

• X=X(t)

Page 6: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

6Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Il teorema di Shannon e l’approssimazione

Claude Elwood Shannon (1916 -2001)

la natura dell’informazione è la natura dell’informazione è inerentemente discretainerentemente discreta

approssimare significa approssimare significa “rendere vicino”“rendere vicino”

Approssimare è un’operazione che facciamo quotidianamente

Page 7: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

7Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Granularità o passoGranularità o passo

È la dimensionedimensione della approssimazione e rappresenta la grandezza sotto la quale non distinguiamo le differenze in una valutazione.

Page 8: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

8Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Il campionamento

Si estraggono parti di informazione,

che si definiscono campionicampioni

e che sono “esponenti rappresentativi” dell’informazione nel suo complesso,

possono condurre a ricostruire precisamente l’informazione complessiva

e che attraverso il teorema di Shannon

Page 9: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

9Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Caratteristiche del suono

• altezza

• intensità

• timbro

Il suono è caratterizzato da tre elementi o caratteristiche fisiche:

Page 10: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

10Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Il trasduttore

Il trasduttore, come fa intuire la parola, è qualcosa che Il trasduttore, come fa intuire la parola, è qualcosa che trasforma. trasforma.

S Mezzo trasmissivo

DT T

Page 11: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

11Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

La rappresentazione del suono

X=X(t) ci descrive com’è fatto il suono e come varia nel tempo, rendendo ragione delle tre caratteristiche: altezza, intensità e timbro. Ma non solo, ci permette perfino di riportare in un grafico la “forma” del suono

Page 12: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

12Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Il campionamento dell’audio

Il campionamento consiste nell’estrarre valori della funzione di “tanto in tanto”

I valori estratti si definiscono campioni

Page 13: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

13Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

La quantizzazione

• Le onde sonore possono assumere infiniti valori

• Dobbiamo trattare con insiemi infiniti di variabilità dei valori

• Questa cosa non è “buona”

• La quantizzazione è il procedimento per trasformare l’insieme infinito di valori, che possono assumere i campioni, in un insieme finito, ma sempre rappresentativo

• La quantizzazione è in sostanza un’approssimazione

• Il procedimento di quantizzazione consiste nel definire in anticipo un insieme di valori accettabili

• Il procedimendo del campionamento consiste nell’associare al valore reale della funzione il valore più vicino definito nella quantizzazione

Page 14: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

14Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Quantizzazioni e audio digitale

• Il numero dei livelli dell’audio digitale è espresso con un numero di bit.

• Si hanno quantizzazioni a 8, 16, 24, 32 bit. – 8 bit Campionamento poco accurato – 16 bit Fornisce la qualità tipica dei CD– 24 bit È lo stato dell’arte

Ad esempio, la quantizzazione a 8 bit possiede 256 livelli possibili.

Page 15: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

15Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Elementi tecnici del campionamento

Chi effettua tecnologicamente queste operazioni?

I convertitoriI convertitori

Convertitori analogico digitali o ADC (Analogic to Digital Coverter)

I nostri ADC sono “scatole nere” che ricevono in ingresso un segnale analogico e danno in uscita un flusso di bit.

Page 16: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

16Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Il formatoNello schema della digitalizzazione abbiamo un flusso di bit in uscita da un ADC.

Il flusso dev’essere:

• elaboratoelaborato

• memorizzato memorizzato

• trasmesso trasmesso

dal sistema che lo riceve.

Per fare questo il sistema deve dare una struttura logica ordinata a questo flusso.

Questa struttura si chiama formatoQuesta struttura si chiama formato

Page 17: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

17Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

I formati applicativi comuni

I formati più comuni sono:

• il formato Wave (estensione dei file .wav), tipico degli ambienti Windowsil formato Wave (estensione dei file .wav), tipico degli ambienti Windows

• il formato Aiff tipico degli ambienti Apple il formato Aiff tipico degli ambienti Apple

• il formato au tipico degli ambienti Unix o multipiattaforma. il formato au tipico degli ambienti Unix o multipiattaforma.

L’operazione che trasforma il flusso di bit in uscita dall’ADC in un formato è detta codifica. La codifica è responsabile delle caratteristiche: La codifica è responsabile delle caratteristiche:

• fisichefisiche

• acustiche acustiche

• tecnologiche tecnologiche

del segnale audio. del segnale audio.

Page 18: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

18Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

La compressione – Perché?

• Il grande problema dell’audio digitale è la dimensione del segnale digitale

• I formati che abbiamo appena visto non si preoccupano della dimensione del segnale, ma si occupano solamente di come rappresentarlo

• Per questa ragione sono state studiate delle tecniche mirate a ridurre le dimensioni dell’audio codificato.

• Un brano in formato CD Audio di 5 minuti di musica occupa uno spazio spropositato sull’hard disk: oltre 423 Mb (MegaByte).

Page 19: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

19Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Le tre fasi della compressione

• Attraverso considerazioni di psico-acustica, si eliminano tutte le componenti presenti nel suono che l’orecchio umano non percepisce.

• Attraverso considerazioni di fisica acustica, si applicano dei filtri che ripuliscono il segnale da tutto quello che c’è “in più”.

• Attraverso il procedimento detto codifica di Huffman, codifica di Huffman, si eliminano le altre frequenze non udibili.

• Questi tre passaggi sono noti come codifica audio MPEG e definiscono i tre livelli di compressione crescenti noti con il nome di

– MPEG1 Layer-1MPEG1 Layer-1

– MPEG1 Layer-2MPEG1 Layer-2

– MPEG1 Layer-3 o MP3MPEG1 Layer-3 o MP3

Page 20: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

20Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

La forza dell’MP3

Con un codificatore MP3 si arriva ad avere una Con un codificatore MP3 si arriva ad avere una compressione in grado di far risparmiare fino a compressione in grado di far risparmiare fino a 13 volte in termini di dimensione in bit.13 volte in termini di dimensione in bit.

5 minuti di suono digitale stereofonico compresso in MP3 occupano “solamente” da 4.1 a 4.4 MByte

Page 21: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

21Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Da video analogico a video digitale

• Campionamento

• Quantizzazzione

• Codifica

• Compressione

Page 22: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

22Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Campionamento

Page 23: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

23Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Parole chiave

• La dimensione della griglia si definisce risoluzione

• I quadratini della griglia sono detti pixel, ovvero picture elements

• DPI = Dot Per Inch

Page 24: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

24Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Quantizzazione

L’insieme dei colori dei singoli pixel e delle L’insieme dei colori dei singoli pixel e delle rispettive tonalità è un insieme teoricamente rispettive tonalità è un insieme teoricamente infinito.infinito. • L’occhio umano non è in grado di percepire tutte le possibili sfumature di colore • Ogni singolo colore è rappresentato da tre numeri: {r,g,b} • Le terne variano da {0,0,0} (nero) a {255,255,255} (bianco)

Page 25: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

25Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Codifica di immagini statiche

• È molto diverso elaborare un’informazione statica (immagini, foto) o una dinamica (filmati o animazioni).• La codifica di un’immagine statica, realizzata effettuando la memorizzazione dei valori delle componenti cromatiche che rappresentano i singoli pixel, è chiamata bitmap o raster

Page 26: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

26Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Compressione

• Compressione senza perdita• Compressione con perdita

– Nella compressione con perdita è necessaria l’approssimazione

• Esempi di formati di compressione– Gif (Graphic Interchange Format)– Jpeg (Joint Photographic Expert Group )– Png (Portable Network Graphics)– Tiff (Tagged Image File Format)– Bmp (Basic Multilingual Plane)

Page 27: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

27Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

La codifica di immagini dinamiche

• L’evoluzione nel tempo dell’immagine televisiva è una sequenza frame

• Ogni frame è suddiviso in linee

• Il frame è costituito da due field:– field pari– field dispari

• Si parla di video interallacciato

Page 28: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

28Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Sistemi di codifica

• YUV (o YCbCr) nel sistema PAL

• YIQ nel sistema NTSC

Si codificano i singoli field

Page 29: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

29Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Flusso dati

• un segnale televisivo PAL richiede un flusso dati di 200 Mbps

• un segnale televisivo NTSC richiede un flusso dati di 165 Mbps

• un segnale televisivo ad alta definizione richiede circa 1 Gbps

Page 30: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

30Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Compressionedi immagini dinamiche

• Nel video è presente informazione non percepibile • Si procede a eliminare informazioni senza perdere

in qualità, sfruttando il fatto che l’occhio umano è più sensibile alla luminanza che alla crominanza.

• La tecnica usata è la decimazione: viene memorizzata una informazione di crominanza ogni due pixel, oppure ogni quattro oppure ogni otto ecc.

Page 31: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

31Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

La compressione MPEG

• Il Motion Picture Export Group fu inventato da Leonardo Chiariglione, ingegnere nato a Borgionera di Villar Dora

• Definisce standard per:

– la compressione dati video

– la compressione dati audio

– la sincronizzazione audio-video

Page 32: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

32Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Tipi di MPEG

• MPEG-1: bitrate massimo 1.5 Mbit/s

• MPEG-2: bitrate massimo 16 Mbps

• MPEG-3: Rollback in MPEG-2

• MPEG-4: progettato per la trasmissione video su rete

• MPEG-7: progettato per la codifica audiovisiva in relazione al contenuto semantico

Page 33: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

33Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

La compressione DivX

• capacità di trasmettere informazioni con basso bitrate, ma con qualità elevata

Normalmente un film su DVD utilizza lo standard MPEG-2 e occupa fino a 7 Gbyte (normalmente)

Utilizzando il formato DivX occupa circa 1 Gbyte al massimo

Page 34: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

34Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Formato DV

• Digital video• Panasonic, Sony, Jvc e Philips• È uno standard per la registrazione di video

digitale di alta qualità. • Bitrate 25mbps• Formato dv50 con bitrate 50 mbps. • È utilizzato nel campo del video professionale

e le moderne telecamere funzionano con questo standard

Page 35: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

35Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Codifica e decodifica: il CODEC

• È il cuore della compressione

• COmpressor/DECompressor

• È l’algoritmo con cui si selezionano le informazioni da scartare e quelle da tenere

Page 36: Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003 Capitolo VIII. La comunicazione multimediale: l’elaborazione audio-video tra

36Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Caratteristiche applicativedei processi di codifica

• Il processo di codifica richiede molto tempo a disposizione e sistemi di elaborazione molto potente.– Hardware dedicato– Lunghi tempi di elaborazione– Poco adatto alle operazioni “a casa”

N.B. Bisogna aggiungere che quest’ultima affermazione si sta leggermente modificando, grazie all’introduzione di processori sempre più veloci.