análise comparativa: mp3 e aac

Post on 05-Aug-2015

82 Views

Category:

Engineering

4 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Análise Comparativa: MP3 e AAC

Bernardo de Campos Vidal CamiloPedro de Vasconcellos

Rachel Gonçalves de Castro

15/04/2023 1Universidade Federal do Rio de Janeiro

Roteiro

• Introdução– Motivação– MPEG– Janela

• Codificador perceptivo• MP3• AAC• Conclusão

– Vantagens e desvantagens• Bibliografia• Dúvidas

15/04/2023 2Universidade Federal do Rio de Janeiro

Introdução - Motivação

15/04/2023 3Universidade Federal do Rio de Janeiro

• Grande evolução na codificação de áudio• Mais “populares”– MP3 e AAC

• “Qual codec apresenta maior qualidade?”

Introdução - MPEG

• Moving Pictures Expert Group– Organização Internacional de Normalização– Estabelecer normas internacioanis para codificação de áudio

• MP3– MPEG-1 Layer 3

• AAC– MPEG-2

• Compressão com perdas– Irrelevância perceptiva do sistema auditivo– Redundância estatística

15/04/2023 4Universidade Federal do Rio de Janeiro

Introdução - MPEG

• Evolução:

15/04/2023 5Universidade Federal do Rio de Janeiro

Introdução - MPEG

• Aplicações:– Produção de áudio– Transmissão de som televiso– Armazenamento digital

15/04/2023 6Universidade Federal do Rio de Janeiro

Janela

15/04/2023 7Universidade Federal do Rio de Janeiro

10Hz Senoidal

Janela

15/04/2023 8Universidade Federal do Rio de Janeiro

FFT 10Hz Senoidal

Janela

15/04/2023 9Universidade Federal do Rio de Janeiro

Senoidal 9.5Hz

Janela

15/04/2023 10Universidade Federal do Rio de Janeiro

FFT Senoidal 9.5Hz

Janela

15/04/2023 11Universidade Federal do Rio de Janeiro

Senoidal 9.5Hz Fim-a-Fim

Janela

15/04/2023 12Universidade Federal do Rio de Janeiro

Hanning window

Janela

15/04/2023 13Universidade Federal do Rio de Janeiro

Senoidal multiplicada pela janela

Janela

15/04/2023 14Universidade Federal do Rio de Janeiro

FFT Senoidal 9.5Hz (após janela)

Janela

15/04/2023 15Universidade Federal do Rio de Janeiro

FFT Senoidal 10Hz (após janela)

Janela

15/04/2023 16Universidade Federal do Rio de Janeiro

Senoidal 10Hz, evento curto de 100Hz

Janela

15/04/2023 17Universidade Federal do Rio de Janeiro

50% overlapping

Janela

15/04/2023 18Universidade Federal do Rio de Janeiro

Spectro com 0% e 50% overlapping

Janela

15/04/2023 19Universidade Federal do Rio de Janeiro

Janela curta: boa resolução por tempo

Janela

15/04/2023 20Universidade Federal do Rio de Janeiro

Janela longa: boa resolução por frequência

Janela

15/04/2023 21Universidade Federal do Rio de Janeiro

Janela

15/04/2023 22Universidade Federal do Rio de Janeiro

Codificador Perceptivo

15/04/2023 23Universidade Federal do Rio de Janeiro

Banco de Filtros:• Domínio do tempo domínio da frequência

Modelo perceptivo:• Computar estimativa do limiar de mascaramento usando regras da psico-acústica

Quantização e Codificação:• Componentes espectrais são quantizados e codificados com o objetivo de manter o ruído, introduzido pela quantização, abaixo do limiar de mascaramento

Codificação de bitstream:• Juntar o bitstream (coeficientes espectrais + outras informações)

MP3

15/04/2023 24Universidade Federal do Rio de Janeiro

MP3

• Banco de Filtro polifásico– Divide o sinal em 32 sub-bandas

15/04/2023 Universidade Federal do Rio de Janeiro 25

MP3

• MDCT (Modified Discrete Cosine Transform)– Converte o sinal para o domínio da frequência– Divide cada sub-banda em 18 mais finas

– Melhor eliminação de redundância

15/04/2023 Universidade Federal do Rio de Janeiro 26

32 * 18 = 576 linhas de frequência

MP3

• FFT 1024 Points (Fast Fourier Transform)– Converte o sinal para o dimínio da frequência– Maior resolução da frequência– Cálculo do limiar de mascaramento

15/04/2023 Universidade Federal do Rio de Janeiro 27

MP3

• Modelo Psico-Acústico– Leva em consideração a sensibilidade do ouvido

humano– Frequências entre 20Hz a 20KHz– Limiar de audição

15/04/2023 Universidade Federal do Rio de Janeiro 28

MP3

• Modelo Psico-Acústico– Mascaramento em frequência

– Mascaramento temporal

15/04/2023 Universidade Federal do Rio de Janeiro 29

MP3

• Modelo Psico-Acústico– Limiar de mascaramento

15/04/2023 Universidade Federal do Rio de Janeiro 30

MP3

• Codificação de Huffman– Utiliza a probabilidade de ocorrência para

construir uma árvore de codificação

15/04/2023 Universidade Federal do Rio de Janeiro 31

MP3

• Quantização e codificação– Codifica com menor precisão valores grandes– Dois loops: • Rate Control Loop • Distortion Control Loop

15/04/2023 Universidade Federal do Rio de Janeiro 32

MP3

• Rate Control Loop – Número de bits resultante deve ser menor que

número de bits disponível– Passo de quantização aumenta valores

quantizados diminuem

15/04/2023 Universidade Federal do Rio de Janeiro 33

MP3

• Distortion Control Loop – Controla ruído causado pelo processo de

quantização– Ruído abaixo do limiar de mascaramento– Fatores de escala

15/04/2023 Universidade Federal do Rio de Janeiro 34

MP3

• Formatação de Bitstream – Armazena o som codificado em frames– Cada frame contem informação de 1152 amostras

de áudio

15/04/2023 Universidade Federal do Rio de Janeiro 35

AAC

15/04/2023 36Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

AAC

• Gain Control– Opcional– Normalmente não usado– PQF (filtro polifásico de quadratura)• 4 bandas de frequência igualmente espaçadas• Taxas de amostragem ajustáveis

15/04/2023 37Universidade Federal do Rio de Janeiro

AAC

15/04/2023 38Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

AAC

• Filter Bank– MDCT Puro, 50% sobreposição• Aplicado diretamente sobre os frames, antes da divisão

em 32 sub-bandas• Long window: 2048 amostras• Short window: 256 amostras (x8)

– 1024 linhas de frequência

15/04/2023 39Universidade Federal do Rio de Janeiro

AAC

15/04/2023 40Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

AAC

• TNS (Temporal Noise Shaping)– Opcional– Molda o ruído de quantização no domínio do

tempo

15/04/2023 41Universidade Federal do Rio de Janeiro

AAC

• TNS (Temporal Noise Shaping)

15/04/2023 42Universidade Federal do Rio de Janeiro

Sinal Original Ruído quantizado com TNS Ruído quantizado sem TNS

AAC

• TNS (Temporal Noise Shaping)

15/04/2023 43Universidade Federal do Rio de Janeiro

Sinal Original

Quantizado com TNS

Quantizado sem TNS

AAC

15/04/2023 44Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

AAC

• Intensity/Coupling– Opcional– Combina dois canais stereo (left/right) em um só

(mono)– Explora redudâncias na região de alta frequência

15/04/2023 45Universidade Federal do Rio de Janeiro

AAC

15/04/2023 46Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

AAC

• Prediction– Opcional– Usado para minimizar redundâncias– Eficiente em sinal estacionário/periódico– Aproveita semelhanças dos coeficientes

quantizados de blocos adjacentes

15/04/2023 47Universidade Federal do Rio de Janeiro

AAC

• Prediction

15/04/2023 48Universidade Federal do Rio de Janeiro

2 frames seguidos com um mesmo padrão

AAC

• Prediction

15/04/2023 49Universidade Federal do Rio de Janeiro

Comparação

AAC

• Prediction

15/04/2023 50Universidade Federal do Rio de Janeiro

Transformada

AAC

• Prediction

15/04/2023 51Universidade Federal do Rio de Janeiro

Coeficientes divididos em bandas

Resíduo enviado (acima)

AAC

15/04/2023 52Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

AAC

• M/S– Opcional– Converte um sinal stereo em dois formatos:• Middle (soma, L + R)• Side (diferença, L – R)

– Não altera o sinal de cada canal (diferentemente do intensity/coupling), que pode ser reconstruído

– Aplicado o mascaramento, verifica qual codificação (L/R, M/S) exige menos bits

15/04/2023 53Universidade Federal do Rio de Janeiro

Conclusão

• O AAC é, possivelmente, o sucessor do MP3

15/04/2023 54Universidade Federal do Rio de Janeiro

A melhoria da compressão oferece resultados de alta qualidade com menores tamanhos de arquivoSuporte para multicanais de áudio (até 48 canais de frequência)

Melhoria na eficiência da decodificação, requerendo menos potência

Conclusão

• Por que o MP3 continua forte?

15/04/2023 55Universidade Federal do Rio de Janeiro

Familiaridade com o formato

Grande quantidade de música disponível no formato MP3

Grande variedade de hardware e software que “tira vantagem” do formatoAusência de restrições DRM (Digital Rights Management)

A maioria dos utilizadores não conhece ou ignora as desvantagens do formato

Dúvidas

?15/04/2023 56Universidade Federal do Rio de Janeiro

Dúvidas

Obrigado!

15/04/2023 57Universidade Federal do Rio de Janeiro

top related