agenda introducción señales de voz sistema monoacústico sistema estéreo sistema híbrido...

42

Upload: clara-fidalgo-rico

Post on 24-Jan-2016

229 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación
Page 2: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Agenda

• Introducción• Señales de Voz• Sistema Monoacústico• Sistema Estéreo• Sistema Híbrido Mono/Estéreo • Detectores de doble Conversación

Page 3: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Introducción

• Objetivos

– Exponer los conceptos básicos de un problema actual

• Características inherentes a la voz humana• Características inherentes a la percepción

humana• Casos de estudio en la generación de eco

– Aplicación de las herramientas de tratamiento estadístico de señales– Aspectos reales a tener en cuenta en el modelo

teórico

Page 4: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Introducción

• Referencia histórica– Problema clásico del procesamiento de

señales– Nuevo impulso en la década del 90

• Retardos de Sistemas Digitales• Nuevas aplicaciones

• Manos Libres• Teleconferencias• Telefonía IP• Localización Espacial

Page 5: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Señales de Voz

• Principales aspectos a considerar– Ancho de banda– Concentración de la energía– Estacionalidad– Percepción humana

Page 6: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Espectro de la señal de voz

• Espectro de Potencia de la señal de voz• Análisis Tiempo-Frecuencia

Page 7: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Generación de eco en las redes

• Red Telefónica tradicional– Desbalance intrínseco del sistema a dos hilos– Significa problema en transmisiones con retardos mayores a

45ms• Redes de Paquetes

Page 8: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Generación de eco en las redes• Redes de Paquetes

– Nuevas aplicaciones de voz– Retardos en el procesamiento

• Necesidad de Buffers– Paquetización– Retardos variables: Jitter

Page 9: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Requisitos del Cancelador de Eco

• De acuerdo a las recomendaciones de ITU-T G.168– Rápida Convergencia Inicial– Bajo nivel de eco de retorno en conversación

simple– Baja divergencia en doble conversación– Detección de doble conversación– Operación en transmisiones fax/modem

Page 10: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

10

Criterios de Optimización

2

)(ˆ)()ˆ( ndndEhJ

• Queremos obtener una réplica de la respuesta al impulso h• El camino para esto es encontrar un filtro que haga mínimo el error en términos de:

– Media Cuadrática

- Mínimos Cuadrados Ponderados2

1

)(ˆ)()( ldldnJn

l

ln

Page 11: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Escenarios de Estudio

• Sistemas Mono-Acústicos• Sistemas Multicanal

— Principales características— Diferencias fundamentales

Page 12: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Canceladores de Eco Mono-Acústico

Page 13: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Máxima Atenuación

• Estimamos la señal de eco mediante un filtro de orden N• El valor de N se elige de acuerdo al tiempo de reverberación • Si los valores de filtro se ajustan perfectamente a los

primeros N coeficientes de la respuesta al impulso,

0

2

2

2

0

2

2

0

21

00

2

2

2

2

)(

)(

)()(

)()(

)()(

)()()()(

)(

)(ˆ)((

)(

)(

ii

Nii

ii

Nii

ii

N

ii

ii

NN

kh

kh

ikxkhE

ikxkhE

ikxkhE

ikxkhikxkhE

kdE

kdkdE

kdE

keE

Page 14: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Atenuación Según N

• Para obtener una atenuación de 45dB N1600 • Se requiere alta potencia de cómputo

Page 15: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Algoritmos • Entre los algoritmos más utilizados encontramos:

– NLMS (Normalized Least Mean Square) • Baja Complejidad• Convergencia lenta

– APA (Affine Projection Algorithm)• Solución intermedia respecto a complejidad

y velocidad de convergencia

– RLS (Recursive Least Square)• Alta complejidad y requerimiento de cálculo• Convergencia rápida• Problemas de estabilidad

Page 16: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Algoritmos: comparación

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.080

0.5

1

1.5

2

2.5

3x 10

-3 Curvas de Aprendizaje

Tiempo(s)

Am

plitu

d

NLMSAPARLS

Page 17: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Algoritmo NLMS

• Frecuentemente elegido por la baja complejidad (2L operaciones por iteración)

• Método de máxima pendiente• Estimación del gradiente muy ruidosa• Paso de adaptación Convergencia Vs

Precisión

Page 18: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Algoritmo NLMS

)(ˆ)()(

)()(ˆ)(ˆ

kdkdke

kxkhkd T

)()(

)()()()(ˆ)1(ˆ

kxkx

kekxkkhkh

T

Formulación del filtro adaptivo:

Estimamos el valor del gradiente en cada iteración por medio de los valores instantáneos

Page 19: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

19

Algoritmo RLS

• Orden del filtro O(L^2)• Optimización respecto a cada realización• Ecuación normal determinística

)()(ˆ

)(ˆ)(

,2

,1nr

nh

nhnR

L

L

)( )()(

)()( ,2,1

,2

,1

1

lxlxlx

lxnR T

LTL

L

Ln

l

ln

)(

)()()(

,2

,1

1 lx

lxlynr

L

Ln

l

ln

Page 20: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

20

Algoritmo RLS

• Formulación del filtro adaptivo:– Ecuación de Actualización

)()()()1(ˆ)(ˆ 1 nenxnRnhnh

),()1(ˆ)()( nxnhnyneT

1R se calcula en forma recursiva

Page 21: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

21

Algoritmo APA

• Se definen error a priori y error a posteriori, respectivamente como:

)1(ˆ)()()( nhnXnyne T

)(ˆ)()()( nhnXnyne Ta

y son vectores que contienen las p últimas muestras de y(n) y e(n)

)(ny )(ne

)1( )1( (n))( pnxnxxnX

Page 22: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

22

Algoritmo APA

• Aplicando la restricción:

Obtenemos la formulación del algoritmo

px10)( nea

• Método de error forzado a cero (Zero Forcing Algorithm)

• Orden del filtro O(L)

)()()1(ˆ)(ˆ

)()1(ˆ)(ˆ)(1neXXnXnhnh

nenhnhnX

T

T

Page 23: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

0 0.5 1 1.5 2 2.5-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

Tiempo (s)

Am

plitu

d

Señal de Entrada

0 0.5 1 1.5 2 2.5-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6Señal Estimada

Tiempo(s)

Am

plitu

d

Simulaciones: Algoritmo NLMS

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4-0.5

0

0.5Respuesta al Impulso

Tiempo(s)

Am

plitu

d

Page 24: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

0 0.5 1 1.5 2 2.5-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6Señal Estimada

Tiempo(s)

Am

plitu

d

0 0.5 1 1.5 2 2.5-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6Señal de Eco

Tiempo(s)

Am

plitu

d

Algoritmo NLMS

0 0.5 1 1.5 2 2.5-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

Error Residual

Tiempo(s)

Am

plitu

d

Page 25: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Algoritmo NLMS: Performance

20 40 60 80 100 120

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4

Comportamiento del Filtro

FiltroResp. Impulso

4620 4630 4640 4650 4660 4670 4680 4690

-0.6

-0.4

-0.2

0

0.2

0.4

Comportamiento del Filtro

Estimacion EcoEntrada

Page 26: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Canceladores de Eco Multicanal

• Sistema Estéreo– Sistemas con requerimientos de localización espacial

• Problemas Fundamentales– Unicidad de la solución

• La solución a la ecuación normal puede estar indefinida

• Correlación cruzada entre canales• La matriz de correlación con número de condición

alto– Seguimiento de caminos de eco

• La aplicación de técnicas del caso monofónico no dan buenos resultados

Page 27: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Cancelador de Eco de dos Canales

• Requiere de alta velocidad de convergencia ante:– Cambios en el recinto de recepción– Cambios de locutor en el lugar de transmisión

• x1(n) y x2(n) fuertemente correlacionadas

Page 28: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Unicidad de la Solución

La minimización de J(n) resulta en la ecuación normal:

M

TMM

TM gnxgnx

,1,2,2,1 )()(

)()(ˆ

)(ˆ)(

,2

,1nr

nh

nhnR

L

L

Las dos señales de entrada del filtro están vinculadas por:

TLiiiLi nhnhnhnh )(ˆ )(ˆ )(ˆ)(ˆ1,1,0,,

 Siendo la estimación de los filtros reales:

Page 29: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Si considero L> M y el vector:

Unicidad de la Solución

)( )(

)( )()( )(

)(

)()(

2221

1211,2,1

,2

,1

nRnR

nRnRnxnx

nx

nxEnR T

LTL

L

L

y(n)

(n)x

(n)xE(n)r

L2,

L1,

TT

M

T

M ggu 0 0 0 0 ,1,2

M = Largo de la respuesta al impulso en el lugar de transmisciónN = Largo de la respuesta al impulso en el lugar de recepciónL = Largo del filtro utilizado

Se puede ver que es un vector propio de R con valor propio nulo, y por lo tanto no tenemos solución única a la ecuación normal

Page 30: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Consecuencias de la no unicidad de la solución

TT

MLL ghnh 0 0 )(ˆ,2,1,1

TT

MLL ghnh 0 0 )(ˆ,1,2,2

• La solución a la que llegue el sistema depende de los parámetros del lugar de transmisión

• No se considera una solución adecuada• Si cambia la persona que está hablando debe

reconverger

Page 31: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Desajustes

• En los casos reales vamos a tener L < M• La inversa de la matriz de correlación existe pero va a

estar mal condicionada• Definiendo el desajuste como la relación entre la

solución buscada y la obtenida:

hhh /ˆ

• La solución es única pero el desajuste va a ser importante debido a la correlación cruzada entre las señales de entrada

hhhnQh

hhnhhnhhn

Tt

Tt

TLiLi

T

iLiLi

)(

)(ˆ)(ˆ)( ,,

2

1,,

2min

Page 32: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Efecto Tail

• Se refiere al efecto que produce modelar los filtros con L<N

• Es equivalente a truncar la respuesta al impulso del sistema a estimar

• El residuo hace posible que se tenga solución única• Potencialmente se tiene gran desajuste aunque sea

posible tener buena cancelación de eco• Degradación de la cancelación ante cambios en la

transmisión

Page 33: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Efecto Tail

• Reducción del desajuste– Aumentando el largo de los filtros

• Costoso en términos de memoria y procesamiento

• Procesamiento lento

– Aplicando técnicas de reducción de la correlación cruzada

• Transformaciones no-lineales• Factorización apropiada

Page 34: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Correlación Cruzada

• Función de Coherencia:

)()(

)()(

2211

21

fSfS

fSf

xxxx

xx

• Los valores propios de la matriz de correlación son de la forma:

0)(122 fBA

• Si , la matriz R es singular• Esto ocurre cuando las señales están

relacionadas en forma lineal

1)( f

Page 35: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

35

Método de Transformación no-lineal

• Rectificador de media onda– Es preferido por su baja complejidad y por que da

buenos resultados– Se debe cumplir que la distorsión no sea perceptible

por el oído humano– Buenos resultados para valores de menores a 0.5

2

)()()()( 11

11

nxnxnxnx

2

)()()()( 22

22

nxnxnxnx

Page 36: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Diseño de Filtros Adaptivos

• Para el caso multicanal deben tener en cuenta la correlación intercanal– Transformación no-lineal– Procesos de inter-innovación

Page 37: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

37

Método de Transformación no-lineal

20 30 40 50 60 70

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4FiltroResp. Impulso

20 30 40 50 60 70

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4 FiltroResp. Impulso

Sin aplicación

Con aplicación

Page 38: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Sistema Híbrido Mono/Estéreo

• Es un caso particular de procesamiento en sub-bandas

• Reducción del peso de cómputo al sub-muestrear• Aplicación de distintas técnicas según la banda

de frecuencia– El efecto estereofónico es predominante en

frecuencias por debajo de 1KHz– La concentración de la energía de la voz está en las

frecuencias bajas

Page 39: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

39

Sistema Híbrido Mono/Estéreo

Page 40: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Detectores de doble Conversación

• Es un elemento importante que aparece en los sistemas de cancelación de Eco

• Se utiliza como protección contra divergencias de los filtros adaptivos– Señales de audio en el lugar de recepción– Ruidos distorsionantes

• La alta convergencia de los algoritmos adaptivos es acompañada de alta divergencia ante doble-conversación

Page 41: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

41

Detector de Geigel (Geigel DTD)

• Es un sistema de aplicación comercial• Se comparan las señales de transmisión y recepción• Si se detecta doble-conversación los coeficientes

del filtro quedan “congelados”– Tiempo de hangover es el tiempo mínimo en que

el algoritmo está inhibido

11 , , ,max Lnnnn xxxy

Condición de doble conversación

Page 42: Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido Mono/Estéreo Detectores de doble Conversación

Comentarios y conclusiones

• La cancelación de Eco es un requisito en muchas aplicaciones actuales

• Las técnicas a utilizar varían según el campo de aplicación y el costo de la solución

• En sistemas multi-canal la correlación entre las señales de entrada juega un rol central

• Otros desarrollos de interés– Filtros adaptivos en sub-bandas– Filtrado en el dominio de frecuencias