tecnologiemultimediali a.a. 2019/2020 · che si basano sulla tecnica pcm: sono cioè, una...
TRANSCRIPT
Tecnologie Multimedialia.a. 2019/2020Docente: DOTT.SSA VALERIA FIONDA
Rappresentazione digitaledell’audio
IL CAMPIONAMENTO E LA QUANTIZZAZIONE
I dati multimediali vengono digitalizzati attraverso due processi:
1. CAMPIONAMENTO à vengono prelevati dei campioni rappresentativi del dato multimediale ad intervalli regolari di tempo.
2. QUANTIZZAZIONE à si approssima ogni campione con il valore digitale più vicino rappresentabile dal calcolatore.
Dopo ogni periodo di campionamento :à si preleva un campione à si quantizza il segnale analogico in quell’istante (QUANTIZZAZIONE) à si produce una sequenza di parole binarie che corrispondono all’andamento del segnale (CODIFICA).
2. QUANTIZZAZIONE: Esempio
Consideriamo un brano musicale della durata di 3,35 minuti e rappresentato da 1720000 campioni con una frequenza di 8 KHz. • Se usiamo 8 livelli di quantizzazione, ogni campione può essere
rappresentato da 3 bit:
1720000 campioni x 3 bit = 5160000 bit = 0,62 MB
• Se usiamo 256 livelli di quantizzazione, ogni campione può essere rappresentato da 8 bit:
1720000 campioni x 8 bit = 13760000 bit = 1,64 MB
2. QUANTIZZAZIONE: Esercizi
Consideriamo un brano musicale della durata di 35 secondi e rappresentato da 80000 campioni. • Se usiamo 3 bit per ogni campione quanto occupa il brano
digitalizzato?80000 campioni x 3 bit = 240.000 bit = 30.000 Byte = 29,3 KB
• Se usiamo 40 livelli di quantizzazione per ogni campione quanto occupa il brano digitalizzato?
80000 campioni x 6 bit = 480.000 bit = 60.000 Byte = 58,59 KB
2. QUANTIZZAZIONE: Esercizi
Consideriamo un brano musicale della durata di 35 secondi campionato a una frequenza di 16KHz. • Se usiamo 100 livelli di quantizzazione per ogni campione
quanto occupa il brano digitalizzato?35 secondi x 16000 campioni/sec x 7 bit = 560.000 campioni x 7 bit = 3.920.000 bit = 490.000 Byte = 478.52 KB = 0,47MB
• CODIFICAIl BITRATE è il valore che indica quanti bit vengono usati per codificare un secondo di musica: si esprime in bit per secondo (bit/s).
• Per ottenere il bitrate si considera: - Frequenza campionamento- Quantizzazione: numero di bit per campione
... quindi il BITRATE ( numero di bit per secondo) di un file è: numero di campioni al secondo x numero di bit per campione
3. CODIFICA: Esempio
• Consideriamo un brano musicale campionato con una frequenza di 8 KHz e rappresentato da 256 livelli di quantizzazione, ovvero 8 bit, ha un bit-rate:
8000 campioni al secondo x 8 bit = 64.000 bit-per-secondo = 64.000 bps = 62,5 Kbps
• Consideriamo un brano musicale di 3,35 min con bit-rate 62,5 kbps. Occupa:
215 sec x 62,5 kbps = 13437,5 Kb = 1,64MB
3. CODIFICA: esercizio
• Consideriamo un brano musicale campionato con una frequenza di 11,15 KHz e rappresentato da 92 livelli di quantizzazione. Qual è il suo bit-rate?
11.150 campioni al secondo x 7 bit = 78.050 bps = 76,22 Kbps
ESERCIZIOUn secondo di suono campionato a 512 Hz occupa 1KB. Quantivalori distinti si possono avere per i campioni?
• Poichè vengono memorizzati 512 campioni al secondo, avremoin tutto 512 campioni (stiamo considerando un solo secondo di suono).
• Visto che il file sonoro di 512 campioni occupa 1 KB, cioè 1024 byte, ogni singolo campione occuperà 1024 / 512 = 2 byte, ovvero 16 bit.
• Quindi si potranno avere 216 = 65536 valori distinti per icampioni.
ESERCIZIO5 secondi di suono campionati a 1KHz occupano circa 5KB. Quanti valori distinti si possono avere per i campioni?• Poichè vengono memorizzati 1000 campioni al secondo,
avremo in tutto 5*1000 campioni = 5000 campioni.• Visto che il file sonoro di 5000 campioni occupa circa 5 KB, cioè
5*1024 byte = 5120 byte, ogni singolo campione occuperà5120/ 5000 = circa 1 byte, ovvero 8bit.• Quindi si potranno avere 28 = 256 valori distinti per i campioni.
• CODIFICAIl BITRATE è il valore che indica quanti bit vengono
usati per codificare un secondo di musica: si esprime in
bit per secondo (bit/s).
• Per ottenere il bitrate si considera:
- Frequenza campionamento: campione/secondo = 44,1 kHz
- Quantizzazione: numero di bit per campione= 16bit
... quindi il BITRATE ( numero di bit per secondo) di un file è:
44,1kHz x 16 = 705600 bps = 0,67 Mbps.
- ma... 44,1kHz x 16 = 0,67 Mbps à TROPPO SPAZIO!
Per cui vengono utilizzati i METODI DI COMPRESSIONE. Con il termine «compressione dati» si indica la tecnica di elaborazione dati che, attuata a mezzo di opportuni algoritmi, permette la riduzione della quantità di bit necessari alla rappresentazione in forma digitale di un'informazione.
I motivi della compressione sono:- occupare minor spazio in fase di immagazzinamento.- impiegare minor tempo in fase di trasferimento dati.
METODI DI COMPRESSIONE: LOSSY E LOSSLESS
Esistono due tipi di compressione:
1. LOSSY à compressione dei dati attraverso un processo con perdita d'informazione: l’informazione contenuta nel file compresso è minore di quella contenuta nel file di origine.(percentuale di compressione maggiore, ma a scapito della qualità sonora).
2. LOSSLESS àcompressione dei dati attraverso un processo senza perdita d'informazione: percentuale di compressione decisamente minore rispetto a quella lossy.
COMPRESSIONE LOSSLESS
COMPRESSIONE LOSSY
Nella compressione audio...
• Un codec audio è un programma o un dispositivo elettronico sviluppato per codificare un flusso audio sotto forma di dati numerici. à algoritmo di codifica.• In altri termini si tratta di uno strumento di codifica/decodifica di flussi
di dati audio e/o di compressione degli stessi per ridurne lo spazio di memorizzazione.
• Un formato audio può essere considerato come un «contenitore» in cui un segnale audio può essere riposto utilizzando un particolare codec.
FORMATI LOSSY più comuni: MP3, WMA, OGG, AAC,
FORMATI LOSSLESS più comuni: FLAC, ALAC, WAV, AIFF
Nella compressione audio...
• Un esempio di algoritmo di compressione LOSSLESS è L'algoritmo RLE (Run lenght encoding) che individua nel file delle sequenze di bit solite ripetersi e le sostituisce con un unico simbolo e con il numero di ripetizioni presenti.
1. FORMATI LOSSY
• MP3 (MPEG-1) à Algoritmo di compressione audio che nasce all'inizio degli anni '90 e dal 1998 rappresenta lo standard per la diffusione del segnale audio digitale. Elimina i suoni non udibili dall'orecchio umano, senza alcuna rilevante perdita di qualità.• Il ratio di compressione è 12:1• La qualità è variabile a seconda del bitrate utilizzato in fase di codifica: si va da 32 kilobit
sino ad arrivare ad un massimo di 320 kilobit, anche se lo “standard” di compressione varia tra i 128 e i 192 kilobit al secondo
• WMA (Windows Media Audio) à Tecnologia di compressione sviluppata da Microsoft. I file compressi in questo formato sono di circa il 20 % più piccoli degli Mp3
- è costituito da 4 distinti codec: 1. WMA originale (come concorrente dell'mp3)2. WMA Pro (alta risoluzione)3. WMA lossless4. WMA voice
1. FORMATI LOSSY
• OGG (Vorbis) à Formato open source che supporta la codificaaudio da vari codec e riesce a dare risultati migliori dell'mp3 soprattutto a bitrate bassi (maggior qualità in minor spazio).
• AAC (Advanced Audio Encoding) à Fornisce una qualità audio superiore al formato MP3 a parità di fattore di compressione (al momento uno dei migliori algoritmi al livello qualitativo) .
• FLAC (Free Lossless Audio Codec) à Formato open source di codifica molto comune, che non modifica il segnale audio e il suono risulta identico all'originale.
• ALAC (Apple Lossless Audio Codec) à Codec audio sviluppato da Apple Inc. che memorizza i dati in un contenitore MPEG-4 con estensione .m4a
• WAV (Wave Form Audio File Formate), AIFF (Audio Interchange File Format)à Formati non compressi creati rispettivamente da Microsoft-IBM e Apple, che si basano sulla tecnica PCM: sono cioè, una registrazione fedele dei suoni in formato digitale. Entrambi occupano una notevole quantità di memoria, circa 10 MB per minuto, e sono utilizzati a livello professionale.
• TABELLA RIASSUNTIVA: Standard à QUALITA’
VANTAGGI: DIGITALE > ANALOGICO• COPIA del segnale - Analogico: produce una degradazione sempre maggiore della qualità del
segnale.- Digitale: la copia di numeri non comporta alcun errore o alterazioni della curva.
• MANIPOLAZIONE del segnale- Analogico: possibile solo attraverso dispositivi elettronici.- Digitale: semplici operazioni aritmetiche.
• CORREZIONE degli errori- Analogico: non è possibile, in quanto non si è in grado di distinguere un
segnale corretto da uno errato.- Digitale: è possibile correggere gli errori attraverso l’introduzione di
informazioni aggiuntive rispetto al segnale vero.
REGISTRAZIONE DEL SEGNALE AUDIO
• MONO: è composto da un solo segnale elettrico. Può essere ottenuto grazie ad un processo di registrazione effettuato da un dispositivo di acquisizione posto in uno specifico punto dell’ambiente. Appare come una sola traccia audio.• MULTICANALE: è composto da più di un segnale elettrico.
Ottenuto grazie all’unione di più segnali audio mono. Può essere ottenuto collocando due o più dispositivi di registrazione in punti differenti. Appare come un insieme di tracce audio, una per ogni canale.
REGISTRAZIONE DEL SEGNALE AUDIO
L’audio elaborato dal nostro cervello com’è?
Multicanale a due canali, ottenuto attraverso l’unione del segnale monocanale destro e di quello sinistro
REGISTRAZIONE DEL SEGNALE AUDIO
• STEREO: segnale audio multicanale composto da due monocanali uno per le sorgenti audio disposte sulla destra e uno per le sorgenti audio disposte a sinistra.