hands on: sistema de voceo con reconocimiento de voz

Post on 09-Jul-2015

2.120 Views

Category:

Documents

5 Downloads

Preview:

Click to see full reader

DESCRIPTION

Juan Pablo Bustos y Alfio Muñoz Argentina Sisdetel 4th Conference - ElastixWorld 2011 Hands On: Paging system with speech recognition Hands on: sistema de voceo con reconocimiento de voz

TRANSCRIPT

Sistema de Voceocon Reconocimiento de Voz

Sistema de Voceo

• Sistema de Voceo

• Tecnologia IP

• Costos elevados

Amplificador y Bocinas

Utilizando la tarjeta de sonido

• Lo primero será habilitar el módulo chan_oss que viene con Elastix pero se encuentra deshabilitado por omisión.

• ; Load either OSS or ALSA, not both

• ; By default, load no console driver

• ;

• noload => chan_alsa.so

• ;noload => chan_oss.so

Editando archivos

• /etc/asterisk/oss.conf

• [general]

• autoanswer=yes

• context=from-internal

• overridecontext=yes

• extension=s

• language=en

• playbackonly=yes

Creando el Dialplan

• /etc/asterisk/extensions_custom.conf

• [voceo-economico]

• exten => 2512,1,Dial(console/dsp,20,A(beep))

• exten => 2512,n,Hangup()

Reconocimiento de Voz

“Hola Mundo”

Aplicaciones del reconocimiento de Voz

Reconocimiento de Vozde Google©

• Servicio disponible para la plataforma Android

• Dispone de un vasto vocabulario

• Ofrece la posibilidad de realizar búsquedas por voz

Reconocimiento de Vozde Google©

Devuelve un objeto jsoncon los resultados ordenados por la

probabilidad de éxito

Recibe un clip audio en un

formato predefinido

Integrando Reconocimiento de voz de Google© con Elastix

Soluciones TTS

Producción artificial de voz humana

Producen la voz a partir de texto o fonemas

Son ampliamente implementados en telefonía para el desarrollo de sistemas de consulta

Comparativa de algunas soluciones para TTS

Svox Pico el motor de TTS de Android

Presenta una gran calidad de voz

Disponible para Ubuntu

Disponible para FreeSwitch

Se está desarrollando un módulo para integrarlo con Elastix

Caso de Estudio

Ensamblando la Solución

El rol de AGI

Es el responsable de enviar el Audio para ser procesado

Recibe e interpreta la respuesta del servidor externo

Interactúa con el motor de TTS para generar los Audios

Realiza las consultas a la base de datos

El Rol de AMI

Es el responsable de generar la llamada

Informa si la llamada fue un éxito

Demostración de Flexibilidad de la Solución

Preguntas

Muchas Gracias

top related