análise comparativa: mp3 e aac
Post on 05-Aug-2015
82 Views
Preview:
TRANSCRIPT
Análise Comparativa: MP3 e AAC
Bernardo de Campos Vidal CamiloPedro de Vasconcellos
Rachel Gonçalves de Castro
15/04/2023 1Universidade Federal do Rio de Janeiro
Roteiro
• Introdução– Motivação– MPEG– Janela
• Codificador perceptivo• MP3• AAC• Conclusão
– Vantagens e desvantagens• Bibliografia• Dúvidas
15/04/2023 2Universidade Federal do Rio de Janeiro
Introdução - Motivação
15/04/2023 3Universidade Federal do Rio de Janeiro
• Grande evolução na codificação de áudio• Mais “populares”– MP3 e AAC
• “Qual codec apresenta maior qualidade?”
Introdução - MPEG
• Moving Pictures Expert Group– Organização Internacional de Normalização– Estabelecer normas internacioanis para codificação de áudio
• MP3– MPEG-1 Layer 3
• AAC– MPEG-2
• Compressão com perdas– Irrelevância perceptiva do sistema auditivo– Redundância estatística
15/04/2023 4Universidade Federal do Rio de Janeiro
Introdução - MPEG
• Evolução:
15/04/2023 5Universidade Federal do Rio de Janeiro
Introdução - MPEG
• Aplicações:– Produção de áudio– Transmissão de som televiso– Armazenamento digital
15/04/2023 6Universidade Federal do Rio de Janeiro
Janela
15/04/2023 7Universidade Federal do Rio de Janeiro
10Hz Senoidal
Janela
15/04/2023 8Universidade Federal do Rio de Janeiro
FFT 10Hz Senoidal
Janela
15/04/2023 9Universidade Federal do Rio de Janeiro
Senoidal 9.5Hz
Janela
15/04/2023 10Universidade Federal do Rio de Janeiro
FFT Senoidal 9.5Hz
Janela
15/04/2023 11Universidade Federal do Rio de Janeiro
Senoidal 9.5Hz Fim-a-Fim
Janela
15/04/2023 12Universidade Federal do Rio de Janeiro
Hanning window
Janela
15/04/2023 13Universidade Federal do Rio de Janeiro
Senoidal multiplicada pela janela
Janela
15/04/2023 14Universidade Federal do Rio de Janeiro
FFT Senoidal 9.5Hz (após janela)
Janela
15/04/2023 15Universidade Federal do Rio de Janeiro
FFT Senoidal 10Hz (após janela)
Janela
15/04/2023 16Universidade Federal do Rio de Janeiro
Senoidal 10Hz, evento curto de 100Hz
Janela
15/04/2023 17Universidade Federal do Rio de Janeiro
50% overlapping
Janela
15/04/2023 18Universidade Federal do Rio de Janeiro
Spectro com 0% e 50% overlapping
Janela
15/04/2023 19Universidade Federal do Rio de Janeiro
Janela curta: boa resolução por tempo
Janela
15/04/2023 20Universidade Federal do Rio de Janeiro
Janela longa: boa resolução por frequência
Janela
15/04/2023 21Universidade Federal do Rio de Janeiro
Janela
15/04/2023 22Universidade Federal do Rio de Janeiro
Codificador Perceptivo
15/04/2023 23Universidade Federal do Rio de Janeiro
Banco de Filtros:• Domínio do tempo domínio da frequência
Modelo perceptivo:• Computar estimativa do limiar de mascaramento usando regras da psico-acústica
Quantização e Codificação:• Componentes espectrais são quantizados e codificados com o objetivo de manter o ruído, introduzido pela quantização, abaixo do limiar de mascaramento
Codificação de bitstream:• Juntar o bitstream (coeficientes espectrais + outras informações)
MP3
15/04/2023 24Universidade Federal do Rio de Janeiro
MP3
• Banco de Filtro polifásico– Divide o sinal em 32 sub-bandas
15/04/2023 Universidade Federal do Rio de Janeiro 25
MP3
• MDCT (Modified Discrete Cosine Transform)– Converte o sinal para o domínio da frequência– Divide cada sub-banda em 18 mais finas
– Melhor eliminação de redundância
15/04/2023 Universidade Federal do Rio de Janeiro 26
32 * 18 = 576 linhas de frequência
MP3
• FFT 1024 Points (Fast Fourier Transform)– Converte o sinal para o dimínio da frequência– Maior resolução da frequência– Cálculo do limiar de mascaramento
15/04/2023 Universidade Federal do Rio de Janeiro 27
MP3
• Modelo Psico-Acústico– Leva em consideração a sensibilidade do ouvido
humano– Frequências entre 20Hz a 20KHz– Limiar de audição
15/04/2023 Universidade Federal do Rio de Janeiro 28
MP3
• Modelo Psico-Acústico– Mascaramento em frequência
– Mascaramento temporal
15/04/2023 Universidade Federal do Rio de Janeiro 29
MP3
• Modelo Psico-Acústico– Limiar de mascaramento
15/04/2023 Universidade Federal do Rio de Janeiro 30
MP3
• Codificação de Huffman– Utiliza a probabilidade de ocorrência para
construir uma árvore de codificação
15/04/2023 Universidade Federal do Rio de Janeiro 31
MP3
• Quantização e codificação– Codifica com menor precisão valores grandes– Dois loops: • Rate Control Loop • Distortion Control Loop
15/04/2023 Universidade Federal do Rio de Janeiro 32
MP3
• Rate Control Loop – Número de bits resultante deve ser menor que
número de bits disponível– Passo de quantização aumenta valores
quantizados diminuem
15/04/2023 Universidade Federal do Rio de Janeiro 33
MP3
• Distortion Control Loop – Controla ruído causado pelo processo de
quantização– Ruído abaixo do limiar de mascaramento– Fatores de escala
15/04/2023 Universidade Federal do Rio de Janeiro 34
MP3
• Formatação de Bitstream – Armazena o som codificado em frames– Cada frame contem informação de 1152 amostras
de áudio
15/04/2023 Universidade Federal do Rio de Janeiro 35
AAC
15/04/2023 36Universidade Federal do Rio de Janeiro
Gain Control
Filter Bank TNS
Intensity/
CouplingPrediction M/S
Scale Factors
Quant.Noiseless
Coding
Rate/Distortion Control
Bitstream Multiplexer
Perceptual Model
Input time
signal Spectral Processing
Quantization and Noiseless Coding
Bitstream Output Data
Control
AAC
• Gain Control– Opcional– Normalmente não usado– PQF (filtro polifásico de quadratura)• 4 bandas de frequência igualmente espaçadas• Taxas de amostragem ajustáveis
15/04/2023 37Universidade Federal do Rio de Janeiro
AAC
15/04/2023 38Universidade Federal do Rio de Janeiro
Gain Control
Filter Bank TNS
Intensity/
CouplingPrediction M/S
Scale Factors
Quant.Noiseless
Coding
Rate/Distortion Control
Bitstream Multiplexer
Perceptual Model
Input time
signal Spectral Processing
Quantization and Noiseless Coding
Bitstream Output Data
Control
AAC
• Filter Bank– MDCT Puro, 50% sobreposição• Aplicado diretamente sobre os frames, antes da divisão
em 32 sub-bandas• Long window: 2048 amostras• Short window: 256 amostras (x8)
– 1024 linhas de frequência
15/04/2023 39Universidade Federal do Rio de Janeiro
AAC
15/04/2023 40Universidade Federal do Rio de Janeiro
Gain Control
Filter Bank TNS
Intensity/
CouplingPrediction M/S
Scale Factors
Quant.Noiseless
Coding
Rate/Distortion Control
Bitstream Multiplexer
Perceptual Model
Input time
signal Spectral Processing
Quantization and Noiseless Coding
Bitstream Output Data
Control
AAC
• TNS (Temporal Noise Shaping)– Opcional– Molda o ruído de quantização no domínio do
tempo
15/04/2023 41Universidade Federal do Rio de Janeiro
AAC
• TNS (Temporal Noise Shaping)
15/04/2023 42Universidade Federal do Rio de Janeiro
Sinal Original Ruído quantizado com TNS Ruído quantizado sem TNS
AAC
• TNS (Temporal Noise Shaping)
15/04/2023 43Universidade Federal do Rio de Janeiro
Sinal Original
Quantizado com TNS
Quantizado sem TNS
AAC
15/04/2023 44Universidade Federal do Rio de Janeiro
Gain Control
Filter Bank TNS
Intensity/
CouplingPrediction M/S
Scale Factors
Quant.Noiseless
Coding
Rate/Distortion Control
Bitstream Multiplexer
Perceptual Model
Input time
signal Spectral Processing
Quantization and Noiseless Coding
Bitstream Output Data
Control
AAC
• Intensity/Coupling– Opcional– Combina dois canais stereo (left/right) em um só
(mono)– Explora redudâncias na região de alta frequência
15/04/2023 45Universidade Federal do Rio de Janeiro
AAC
15/04/2023 46Universidade Federal do Rio de Janeiro
Gain Control
Filter Bank TNS
Intensity/
CouplingPrediction M/S
Scale Factors
Quant.Noiseless
Coding
Rate/Distortion Control
Bitstream Multiplexer
Perceptual Model
Input time
signal Spectral Processing
Quantization and Noiseless Coding
Bitstream Output Data
Control
AAC
• Prediction– Opcional– Usado para minimizar redundâncias– Eficiente em sinal estacionário/periódico– Aproveita semelhanças dos coeficientes
quantizados de blocos adjacentes
15/04/2023 47Universidade Federal do Rio de Janeiro
AAC
• Prediction
15/04/2023 48Universidade Federal do Rio de Janeiro
2 frames seguidos com um mesmo padrão
AAC
• Prediction
15/04/2023 49Universidade Federal do Rio de Janeiro
Comparação
AAC
• Prediction
15/04/2023 50Universidade Federal do Rio de Janeiro
Transformada
AAC
• Prediction
15/04/2023 51Universidade Federal do Rio de Janeiro
Coeficientes divididos em bandas
Resíduo enviado (acima)
AAC
15/04/2023 52Universidade Federal do Rio de Janeiro
Gain Control
Filter Bank TNS
Intensity/
CouplingPrediction M/S
Scale Factors
Quant.Noiseless
Coding
Rate/Distortion Control
Bitstream Multiplexer
Perceptual Model
Input time
signal Spectral Processing
Quantization and Noiseless Coding
Bitstream Output Data
Control
AAC
• M/S– Opcional– Converte um sinal stereo em dois formatos:• Middle (soma, L + R)• Side (diferença, L – R)
– Não altera o sinal de cada canal (diferentemente do intensity/coupling), que pode ser reconstruído
– Aplicado o mascaramento, verifica qual codificação (L/R, M/S) exige menos bits
15/04/2023 53Universidade Federal do Rio de Janeiro
Conclusão
• O AAC é, possivelmente, o sucessor do MP3
15/04/2023 54Universidade Federal do Rio de Janeiro
A melhoria da compressão oferece resultados de alta qualidade com menores tamanhos de arquivoSuporte para multicanais de áudio (até 48 canais de frequência)
Melhoria na eficiência da decodificação, requerendo menos potência
Conclusão
• Por que o MP3 continua forte?
15/04/2023 55Universidade Federal do Rio de Janeiro
Familiaridade com o formato
Grande quantidade de música disponível no formato MP3
Grande variedade de hardware e software que “tira vantagem” do formatoAusência de restrições DRM (Digital Rights Management)
A maioria dos utilizadores não conhece ou ignora as desvantagens do formato
Dúvidas
?15/04/2023 56Universidade Federal do Rio de Janeiro
Dúvidas
Obrigado!
15/04/2023 57Universidade Federal do Rio de Janeiro
top related