numerico-vespignani, informatica per le scienze umanistiche, il mulino, 2003 capitolo viii. la...
TRANSCRIPT
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Capitolo VIII.
La comunicazione multimediale:l’elaborazione audio-video
tra tecnologia e applicazioni
2Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Che cosa si comunica?
Informazione
3Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
La trasmissione
S Mezzo Trasmissivo D
Figura 1 – La trasmissione
4Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Informazione e segnali
Introduciamo un concetto molto importante per l’informatica delle comunicazioni:
il concetto di segnale
Il segnale come ciò che percorre il mezzo trasmissivo trasportando con sé
l’informazione
5Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
I segnali e la matematica
Rappresentazione di un segnale
TempoGrandezza misurata
• Un segnale può essere descritto come una funzione matematica che si evolve, ovvero varia, nel tempo.
• Formalmente:
• X=X(t)
6Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Il teorema di Shannon e l’approssimazione
Claude Elwood Shannon (1916 -2001)
la natura dell’informazione è la natura dell’informazione è inerentemente discretainerentemente discreta
approssimare significa approssimare significa “rendere vicino”“rendere vicino”
Approssimare è un’operazione che facciamo quotidianamente
7Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Granularità o passoGranularità o passo
È la dimensionedimensione della approssimazione e rappresenta la grandezza sotto la quale non distinguiamo le differenze in una valutazione.
8Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Il campionamento
Si estraggono parti di informazione,
che si definiscono campionicampioni
e che sono “esponenti rappresentativi” dell’informazione nel suo complesso,
possono condurre a ricostruire precisamente l’informazione complessiva
e che attraverso il teorema di Shannon
9Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Caratteristiche del suono
• altezza
• intensità
• timbro
Il suono è caratterizzato da tre elementi o caratteristiche fisiche:
10Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Il trasduttore
Il trasduttore, come fa intuire la parola, è qualcosa che Il trasduttore, come fa intuire la parola, è qualcosa che trasforma. trasforma.
S Mezzo trasmissivo
DT T
11Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
La rappresentazione del suono
X=X(t) ci descrive com’è fatto il suono e come varia nel tempo, rendendo ragione delle tre caratteristiche: altezza, intensità e timbro. Ma non solo, ci permette perfino di riportare in un grafico la “forma” del suono
12Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Il campionamento dell’audio
Il campionamento consiste nell’estrarre valori della funzione di “tanto in tanto”
I valori estratti si definiscono campioni
13Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
La quantizzazione
• Le onde sonore possono assumere infiniti valori
• Dobbiamo trattare con insiemi infiniti di variabilità dei valori
• Questa cosa non è “buona”
• La quantizzazione è il procedimento per trasformare l’insieme infinito di valori, che possono assumere i campioni, in un insieme finito, ma sempre rappresentativo
• La quantizzazione è in sostanza un’approssimazione
• Il procedimento di quantizzazione consiste nel definire in anticipo un insieme di valori accettabili
• Il procedimendo del campionamento consiste nell’associare al valore reale della funzione il valore più vicino definito nella quantizzazione
14Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Quantizzazioni e audio digitale
• Il numero dei livelli dell’audio digitale è espresso con un numero di bit.
• Si hanno quantizzazioni a 8, 16, 24, 32 bit. – 8 bit Campionamento poco accurato – 16 bit Fornisce la qualità tipica dei CD– 24 bit È lo stato dell’arte
Ad esempio, la quantizzazione a 8 bit possiede 256 livelli possibili.
15Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Elementi tecnici del campionamento
Chi effettua tecnologicamente queste operazioni?
I convertitoriI convertitori
Convertitori analogico digitali o ADC (Analogic to Digital Coverter)
I nostri ADC sono “scatole nere” che ricevono in ingresso un segnale analogico e danno in uscita un flusso di bit.
16Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Il formatoNello schema della digitalizzazione abbiamo un flusso di bit in uscita da un ADC.
Il flusso dev’essere:
• elaboratoelaborato
• memorizzato memorizzato
• trasmesso trasmesso
dal sistema che lo riceve.
Per fare questo il sistema deve dare una struttura logica ordinata a questo flusso.
Questa struttura si chiama formatoQuesta struttura si chiama formato
17Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
I formati applicativi comuni
I formati più comuni sono:
• il formato Wave (estensione dei file .wav), tipico degli ambienti Windowsil formato Wave (estensione dei file .wav), tipico degli ambienti Windows
• il formato Aiff tipico degli ambienti Apple il formato Aiff tipico degli ambienti Apple
• il formato au tipico degli ambienti Unix o multipiattaforma. il formato au tipico degli ambienti Unix o multipiattaforma.
L’operazione che trasforma il flusso di bit in uscita dall’ADC in un formato è detta codifica. La codifica è responsabile delle caratteristiche: La codifica è responsabile delle caratteristiche:
• fisichefisiche
• acustiche acustiche
• tecnologiche tecnologiche
del segnale audio. del segnale audio.
18Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
La compressione – Perché?
• Il grande problema dell’audio digitale è la dimensione del segnale digitale
• I formati che abbiamo appena visto non si preoccupano della dimensione del segnale, ma si occupano solamente di come rappresentarlo
• Per questa ragione sono state studiate delle tecniche mirate a ridurre le dimensioni dell’audio codificato.
• Un brano in formato CD Audio di 5 minuti di musica occupa uno spazio spropositato sull’hard disk: oltre 423 Mb (MegaByte).
19Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Le tre fasi della compressione
• Attraverso considerazioni di psico-acustica, si eliminano tutte le componenti presenti nel suono che l’orecchio umano non percepisce.
• Attraverso considerazioni di fisica acustica, si applicano dei filtri che ripuliscono il segnale da tutto quello che c’è “in più”.
• Attraverso il procedimento detto codifica di Huffman, codifica di Huffman, si eliminano le altre frequenze non udibili.
• Questi tre passaggi sono noti come codifica audio MPEG e definiscono i tre livelli di compressione crescenti noti con il nome di
– MPEG1 Layer-1MPEG1 Layer-1
– MPEG1 Layer-2MPEG1 Layer-2
– MPEG1 Layer-3 o MP3MPEG1 Layer-3 o MP3
20Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
La forza dell’MP3
Con un codificatore MP3 si arriva ad avere una Con un codificatore MP3 si arriva ad avere una compressione in grado di far risparmiare fino a compressione in grado di far risparmiare fino a 13 volte in termini di dimensione in bit.13 volte in termini di dimensione in bit.
5 minuti di suono digitale stereofonico compresso in MP3 occupano “solamente” da 4.1 a 4.4 MByte
21Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Da video analogico a video digitale
• Campionamento
• Quantizzazzione
• Codifica
• Compressione
22Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Campionamento
23Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Parole chiave
• La dimensione della griglia si definisce risoluzione
• I quadratini della griglia sono detti pixel, ovvero picture elements
• DPI = Dot Per Inch
24Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Quantizzazione
L’insieme dei colori dei singoli pixel e delle L’insieme dei colori dei singoli pixel e delle rispettive tonalità è un insieme teoricamente rispettive tonalità è un insieme teoricamente infinito.infinito. • L’occhio umano non è in grado di percepire tutte le possibili sfumature di colore • Ogni singolo colore è rappresentato da tre numeri: {r,g,b} • Le terne variano da {0,0,0} (nero) a {255,255,255} (bianco)
25Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Codifica di immagini statiche
• È molto diverso elaborare un’informazione statica (immagini, foto) o una dinamica (filmati o animazioni).• La codifica di un’immagine statica, realizzata effettuando la memorizzazione dei valori delle componenti cromatiche che rappresentano i singoli pixel, è chiamata bitmap o raster
26Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Compressione
• Compressione senza perdita• Compressione con perdita
– Nella compressione con perdita è necessaria l’approssimazione
• Esempi di formati di compressione– Gif (Graphic Interchange Format)– Jpeg (Joint Photographic Expert Group )– Png (Portable Network Graphics)– Tiff (Tagged Image File Format)– Bmp (Basic Multilingual Plane)
27Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
La codifica di immagini dinamiche
• L’evoluzione nel tempo dell’immagine televisiva è una sequenza frame
• Ogni frame è suddiviso in linee
• Il frame è costituito da due field:– field pari– field dispari
• Si parla di video interallacciato
28Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Sistemi di codifica
• YUV (o YCbCr) nel sistema PAL
• YIQ nel sistema NTSC
Si codificano i singoli field
29Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Flusso dati
• un segnale televisivo PAL richiede un flusso dati di 200 Mbps
• un segnale televisivo NTSC richiede un flusso dati di 165 Mbps
• un segnale televisivo ad alta definizione richiede circa 1 Gbps
30Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Compressionedi immagini dinamiche
• Nel video è presente informazione non percepibile • Si procede a eliminare informazioni senza perdere
in qualità, sfruttando il fatto che l’occhio umano è più sensibile alla luminanza che alla crominanza.
• La tecnica usata è la decimazione: viene memorizzata una informazione di crominanza ogni due pixel, oppure ogni quattro oppure ogni otto ecc.
31Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
La compressione MPEG
• Il Motion Picture Export Group fu inventato da Leonardo Chiariglione, ingegnere nato a Borgionera di Villar Dora
• Definisce standard per:
– la compressione dati video
– la compressione dati audio
– la sincronizzazione audio-video
32Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Tipi di MPEG
• MPEG-1: bitrate massimo 1.5 Mbit/s
• MPEG-2: bitrate massimo 16 Mbps
• MPEG-3: Rollback in MPEG-2
• MPEG-4: progettato per la trasmissione video su rete
• MPEG-7: progettato per la codifica audiovisiva in relazione al contenuto semantico
33Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
La compressione DivX
• capacità di trasmettere informazioni con basso bitrate, ma con qualità elevata
Normalmente un film su DVD utilizza lo standard MPEG-2 e occupa fino a 7 Gbyte (normalmente)
Utilizzando il formato DivX occupa circa 1 Gbyte al massimo
34Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Formato DV
• Digital video• Panasonic, Sony, Jvc e Philips• È uno standard per la registrazione di video
digitale di alta qualità. • Bitrate 25mbps• Formato dv50 con bitrate 50 mbps. • È utilizzato nel campo del video professionale
e le moderne telecamere funzionano con questo standard
35Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Codifica e decodifica: il CODEC
• È il cuore della compressione
• COmpressor/DECompressor
• È l’algoritmo con cui si selezionano le informazioni da scartare e quelle da tenere
36Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003
Caratteristiche applicativedei processi di codifica
• Il processo di codifica richiede molto tempo a disposizione e sistemi di elaborazione molto potente.– Hardware dedicato– Lunghi tempi di elaborazione– Poco adatto alle operazioni “a casa”
N.B. Bisogna aggiungere che quest’ultima affermazione si sta leggermente modificando, grazie all’introduzione di processori sempre più veloci.