numerico-vespignani, informatica per le scienze umanistiche, il mulino, 2003 capitolo viii. la...

Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Capitolo VIII.

La comunicazione multimediale:l’elaborazione audio-video

tra tecnologia e applicazioni

2Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, 2003

Che cosa si comunica?

Informazione


La trasmissione

S Mezzo Trasmissivo D

Figura 1 – La trasmissione


Informazione e segnali

Introduciamo un concetto molto importante per l’informatica delle comunicazioni:

il concetto di segnale

Il segnale come ciò che percorre il mezzo trasmissivo trasportando con sé

l’informazione


I segnali e la matematica

Rappresentazione di un segnale

TempoGrandezza misurata

• Un segnale può essere descritto come una funzione matematica che si evolve, ovvero varia, nel tempo.

• Formalmente:

• X=X(t)


Il teorema di Shannon e l’approssimazione

Claude Elwood Shannon (1916 -2001)

la natura dell’informazione è la natura dell’informazione è inerentemente discretainerentemente discreta

approssimare significa approssimare significa “rendere vicino”“rendere vicino”

Approssimare è un’operazione che facciamo quotidianamente


Granularità o passoGranularità o passo

È la dimensionedimensione della approssimazione e rappresenta la grandezza sotto la quale non distinguiamo le differenze in una valutazione.


Il campionamento

Si estraggono parti di informazione,

che si definiscono campionicampioni

e che sono “esponenti rappresentativi” dell’informazione nel suo complesso,

possono condurre a ricostruire precisamente l’informazione complessiva

e che attraverso il teorema di Shannon


Caratteristiche del suono

• altezza

• intensità

• timbro

Il suono è caratterizzato da tre elementi o caratteristiche fisiche:


Il trasduttore

Il trasduttore, come fa intuire la parola, è qualcosa che Il trasduttore, come fa intuire la parola, è qualcosa che trasforma. trasforma.

S Mezzo trasmissivo

DT T


La rappresentazione del suono

X=X(t) ci descrive com’è fatto il suono e come varia nel tempo, rendendo ragione delle tre caratteristiche: altezza, intensità e timbro. Ma non solo, ci permette perfino di riportare in un grafico la “forma” del suono


Il campionamento dell’audio

Il campionamento consiste nell’estrarre valori della funzione di “tanto in tanto”

I valori estratti si definiscono campioni


La quantizzazione

• Le onde sonore possono assumere infiniti valori

• Dobbiamo trattare con insiemi infiniti di variabilità dei valori

• Questa cosa non è “buona”

• La quantizzazione è il procedimento per trasformare l’insieme infinito di valori, che possono assumere i campioni, in un insieme finito, ma sempre rappresentativo

• La quantizzazione è in sostanza un’approssimazione

• Il procedimento di quantizzazione consiste nel definire in anticipo un insieme di valori accettabili

• Il procedimendo del campionamento consiste nell’associare al valore reale della funzione il valore più vicino definito nella quantizzazione


Quantizzazioni e audio digitale

• Il numero dei livelli dell’audio digitale è espresso con un numero di bit.

• Si hanno quantizzazioni a 8, 16, 24, 32 bit. – 8 bit Campionamento poco accurato – 16 bit Fornisce la qualità tipica dei CD– 24 bit È lo stato dell’arte

Ad esempio, la quantizzazione a 8 bit possiede 256 livelli possibili.


Elementi tecnici del campionamento

Chi effettua tecnologicamente queste operazioni?

I convertitoriI convertitori

Convertitori analogico digitali o ADC (Analogic to Digital Coverter)

I nostri ADC sono “scatole nere” che ricevono in ingresso un segnale analogico e danno in uscita un flusso di bit.


Il formatoNello schema della digitalizzazione abbiamo un flusso di bit in uscita da un ADC.

Il flusso dev’essere:

• elaboratoelaborato

• memorizzato memorizzato

• trasmesso trasmesso

dal sistema che lo riceve.

Per fare questo il sistema deve dare una struttura logica ordinata a questo flusso.

Questa struttura si chiama formatoQuesta struttura si chiama formato


I formati applicativi comuni

I formati più comuni sono:

• il formato Wave (estensione dei file .wav), tipico degli ambienti Windowsil formato Wave (estensione dei file .wav), tipico degli ambienti Windows

• il formato Aiff tipico degli ambienti Apple il formato Aiff tipico degli ambienti Apple

• il formato au tipico degli ambienti Unix o multipiattaforma. il formato au tipico degli ambienti Unix o multipiattaforma.

L’operazione che trasforma il flusso di bit in uscita dall’ADC in un formato è detta codifica. La codifica è responsabile delle caratteristiche: La codifica è responsabile delle caratteristiche:

• fisichefisiche

• acustiche acustiche

• tecnologiche tecnologiche

del segnale audio. del segnale audio.


La compressione – Perché?

• Il grande problema dell’audio digitale è la dimensione del segnale digitale

• I formati che abbiamo appena visto non si preoccupano della dimensione del segnale, ma si occupano solamente di come rappresentarlo

• Per questa ragione sono state studiate delle tecniche mirate a ridurre le dimensioni dell’audio codificato.

• Un brano in formato CD Audio di 5 minuti di musica occupa uno spazio spropositato sull’hard disk: oltre 423 Mb (MegaByte).


Le tre fasi della compressione

• Attraverso considerazioni di psico-acustica, si eliminano tutte le componenti presenti nel suono che l’orecchio umano non percepisce.

• Attraverso considerazioni di fisica acustica, si applicano dei filtri che ripuliscono il segnale da tutto quello che c’è “in più”.

• Attraverso il procedimento detto codifica di Huffman, codifica di Huffman, si eliminano le altre frequenze non udibili.

• Questi tre passaggi sono noti come codifica audio MPEG e definiscono i tre livelli di compressione crescenti noti con il nome di

– MPEG1 Layer-1MPEG1 Layer-1

– MPEG1 Layer-2MPEG1 Layer-2

– MPEG1 Layer-3 o MP3MPEG1 Layer-3 o MP3


La forza dell’MP3

Con un codificatore MP3 si arriva ad avere una Con un codificatore MP3 si arriva ad avere una compressione in grado di far risparmiare fino a compressione in grado di far risparmiare fino a 13 volte in termini di dimensione in bit.13 volte in termini di dimensione in bit.

5 minuti di suono digitale stereofonico compresso in MP3 occupano “solamente” da 4.1 a 4.4 MByte


Da video analogico a video digitale

• Campionamento

• Quantizzazzione

• Codifica

• Compressione


Campionamento


Parole chiave

• La dimensione della griglia si definisce risoluzione

• I quadratini della griglia sono detti pixel, ovvero picture elements

• DPI = Dot Per Inch


Quantizzazione

L’insieme dei colori dei singoli pixel e delle L’insieme dei colori dei singoli pixel e delle rispettive tonalità è un insieme teoricamente rispettive tonalità è un insieme teoricamente infinito.infinito. • L’occhio umano non è in grado di percepire tutte le possibili sfumature di colore • Ogni singolo colore è rappresentato da tre numeri: {r,g,b} • Le terne variano da {0,0,0} (nero) a {255,255,255} (bianco)


Codifica di immagini statiche

• È molto diverso elaborare un’informazione statica (immagini, foto) o una dinamica (filmati o animazioni).• La codifica di un’immagine statica, realizzata effettuando la memorizzazione dei valori delle componenti cromatiche che rappresentano i singoli pixel, è chiamata bitmap o raster


Compressione

• Compressione senza perdita• Compressione con perdita

– Nella compressione con perdita è necessaria l’approssimazione

• Esempi di formati di compressione– Gif (Graphic Interchange Format)– Jpeg (Joint Photographic Expert Group )– Png (Portable Network Graphics)– Tiff (Tagged Image File Format)– Bmp (Basic Multilingual Plane)


La codifica di immagini dinamiche

• L’evoluzione nel tempo dell’immagine televisiva è una sequenza frame

• Ogni frame è suddiviso in linee

• Il frame è costituito da due field:– field pari– field dispari

• Si parla di video interallacciato


Sistemi di codifica

• YUV (o YCbCr) nel sistema PAL

• YIQ nel sistema NTSC

Si codificano i singoli field


Flusso dati

• un segnale televisivo PAL richiede un flusso dati di 200 Mbps

• un segnale televisivo NTSC richiede un flusso dati di 165 Mbps

• un segnale televisivo ad alta definizione richiede circa 1 Gbps


Compressionedi immagini dinamiche

• Nel video è presente informazione non percepibile • Si procede a eliminare informazioni senza perdere

in qualità, sfruttando il fatto che l’occhio umano è più sensibile alla luminanza che alla crominanza.

• La tecnica usata è la decimazione: viene memorizzata una informazione di crominanza ogni due pixel, oppure ogni quattro oppure ogni otto ecc.


La compressione MPEG

• Il Motion Picture Export Group fu inventato da Leonardo Chiariglione, ingegnere nato a Borgionera di Villar Dora

• Definisce standard per:

– la compressione dati video

– la compressione dati audio

– la sincronizzazione audio-video


Tipi di MPEG

• MPEG-1: bitrate massimo 1.5 Mbit/s

• MPEG-2: bitrate massimo 16 Mbps

• MPEG-3: Rollback in MPEG-2

• MPEG-4: progettato per la trasmissione video su rete

• MPEG-7: progettato per la codifica audiovisiva in relazione al contenuto semantico


La compressione DivX

• capacità di trasmettere informazioni con basso bitrate, ma con qualità elevata

Normalmente un film su DVD utilizza lo standard MPEG-2 e occupa fino a 7 Gbyte (normalmente)

Utilizzando il formato DivX occupa circa 1 Gbyte al massimo


Formato DV

• Digital video• Panasonic, Sony, Jvc e Philips• È uno standard per la registrazione di video

digitale di alta qualità. • Bitrate 25mbps• Formato dv50 con bitrate 50 mbps. • È utilizzato nel campo del video professionale

e le moderne telecamere funzionano con questo standard


Codifica e decodifica: il CODEC

• È il cuore della compressione

• COmpressor/DECompressor

• È l’algoritmo con cui si selezionano le informazioni da scartare e quelle da tenere


Caratteristiche applicativedei processi di codifica

• Il processo di codifica richiede molto tempo a disposizione e sistemi di elaborazione molto potente.– Hardware dedicato– Lunghi tempi di elaborazione– Poco adatto alle operazioni “a casa”

N.B. Bisogna aggiungere che quest’ultima affermazione si sta leggermente modificando, grazie all’introduzione di processori sempre più veloci.

numerico-vespignani, informatica per le scienze umanistiche, il mulino, 2003 capitolo viii. la...

Documents