manual_praat_ español

Upload: mozkbron

Post on 14-Apr-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/29/2019 Manual_praat_ espaol

    1/10

    FonoaudiologaFontica y Fonologa 2007

    1

    MANUAL DE PRAATEN ESPAOL1

    El programa de anlisis y sntesis de habla PRAAT fue creado por Paul Boersma yDavid Weenink del Instituto de Ciencias Fonticas de la Universidad de Amsterdam, con sucorrespondiente sitio webhttp://www.fon.hum.uva.nl/praat

    Para consultas y sugerencias, se ruega escribir a la lista de discusin de PRAAT, alque se puede acceder desde el mismo sitio web o escribiendo directamente [email protected]

    Figura N 1: Portada de PRAAT doing phonetics by computer. Se visualizan los crditos de los autores, la listaPRAAT OBJECTS y PRAAT PICTURE.

    CAPTULO 1: CMO OBTENER UN SONIDO

    La mayora de las cosas que los usuarios de PRAAT pretenden realizar se relacionan conla obtencin de un sonido. Existen, por lo menos, tres vas para conseguirlo.

    A) Grabacin de un sonido. Para grabar un sonido de habla en PRAAT, usted debedisponer de un ordenador con un micrfono. En caso de que no posea un micrfono,intente obtener una grabacin desde un CD con archivos de extensin de audio. Por lotanto, para grabar desde micrfono (o CD), le rogamos que siga los siguientesprocedimientos:

    1. Elija Record mono sounddesde el men NEW en la ventana de objetos. A

    continuacin, en la pantalla aparecer una nueva ventana denominadaSoundRecorder.

    2. En la ventana SoundRecorder, usted deber elegir el dispositivo INPUT adecuado

    1 Fuente de consulta: Blecua, B., Cicres, J., Ibba, D., Llach, S. Y Rost, A. (2007) Guia de suport per a prctiquesde fontica. Girona: Publicacions UDG. Traduccin para la ctedra de Fontica y Fonologa 2007:Fonoaudilogo Gianfranco Arancibia Raggio.

    http://www.fon.hum.uva.nl/praathttp://www.fon.hum.uva.nl/praathttp://www.fon.hum.uva.nl/praatmailto:[email protected]:[email protected]:[email protected]://www.fon.hum.uva.nl/praat
  • 7/29/2019 Manual_praat_ espaol

    2/10

    FonoaudiologaFontica y Fonologa 2007

    2

    (ste puede ser micrfono o grabacin en CD).3. Ahora, mediante el botn Play podr escuchar el resultado de su grabacin.4. Repita los pasos 3 y 4 hasta que usted est satisfecho con lo obtenido.5. Apriete el botn Save to list. A continuacin su grabacin aparecer en la ventana de

    objetos (object windows), bajo el nombre de Sound sound. Se recomienda, paraefectos de una adecuada rotulacin de sus archivos, que renombre (RENAME) lo

    guardado desde la ventanaobject windows.

    6. Cuando usted haya guardado el archivo, podr ver algunos botones que aparecernen la ventana. Dichos botones le ayudarn a lo que usted puede realizar con elsonido. As, pruebe con botones Play y Edit.

    B) Leer un sonido desde el disco. Adems de grabar un sonido desde un micrfono,usted puede leer un archivo de sonido existente desde su disco. Con Read from filedesde el men READ, PRAAT le brinda la posibilidad de leer la mayor variedad deextensiones estndares de sonido como, por ejemplo, la extensin *.WAV. Acontinuacin, el archivo seleccionado se mostrar como un objeto en la ventanaadministrativa (Object window). Para estos efectos, si usted abre el archivo hello.wav,

    un objeto denominado Sound Hello se consignar en la lista.En caso de que usted no disponga de un archivo de sonido en su disco, usted puede

    descargar un archivo WAV u otro estndar desde Internet, para luego leerlo en PRAATdesde Read from file.

    C)Crear un sonido desde una frmula. Si usted no dispone de micrfono ni sonidos ensu disco duro y, adems, no dispone de Internet, usted puede crear un sonido mediantela funcin Create Sound from frmula, desde NEW en el men.

    CAPTULO 2: QU HACER CON UN SONIDO?

    Tan pronto como disponga de un sonido desde la lista de objetos, los botones de mendinmico (en la zona derecha del object window) le mostrarn lo que usted puede realizarcon l.

    1. Guardar un sonido en el disco. Existen varias vas para guardar un sonido en eldisco. En primer lugar, el men de archivo (file menu) de la ventana deSoundRecorder contiene comandos para guardar el canal izquierdo, el derecho, oambos canales de la grabacin de sonido, en cualquiera de los cuatro formatosestndares de audio para archivos (WAV, AIFC, NeXT/Sun, NIST). Todas esasextensiones sern de igual calidad y adecuadas para PRAAT. Es decir, el software las

    tomar del mismo modo en todos los computadores. Cabe destacar que las tresprimeras extensiones son tambin reconocidas por otros tipos de software de audio.

    A continuacin, una vez que tenga el sonido en la List of objects, podrguardarlo en variados formatos con el comando del write menu.

    2. Desarrollar y analizar una seal de audio. Con el objeto de observar la forma deonda de un sonido que se encuentra en la List of Object, selecciona el sonido yaprieta Edit. Una ventana editor de sta (Sound Editor) aparecer en la pantalla delcomputador. Usted puede acercar la imagen resultante y recorrerla, de modo de

  • 7/29/2019 Manual_praat_ espaol

    3/10

    FonoaudiologaFontica y Fonologa 2007

    3

    observarla con mayor detalle. Adems, usted puede seleccionar una parte del sonido,seleccionndola con el mouse del computador.

    Para reproducir el sonido que se analiza, apriete en cualquiera de losrectngulos que se ubican en la zona inferior de ste. Para mover una parte de laseleccin del sonido hacia otra ubicacin, use las funciones cortar y pegar (CUT andPASTE) desde el men EDITAR. Usted puede abrir la ventana de sonido para ms de

    uno de estos y, luego, cortar, pegar y pegar entre los sonidos, de modo deacompaarlos con textos e imgenes por medio de programas de procesamiento detexto.

    Si su archivo de sonido dura ms que un par de minutos, o si usted desea observar yescuchar ambos canales de sonido estreo, puede optar por utilizarlo por medio de la funcinde ejecucin de sonidos largos (Open long sound file). Esto pondr un sonido largo en lalista de objetos. En este modo, la mayora de los sonidos estarn en un archivo del disco y,aqullos que duren ms de 60 segundos, se leern en la memoria cada vez que sereproduzca u observe una parte de este. Para cambiar esos 60 segundos hacia algo ms de500 segundos (por ejemplo), elija la opcin (LongSound prefs) desde el submenpreferencias (Preferentes).

    CAPTULO 3: ANLISIS ESPECTRALA continuacin se describir cmo usted puede analizar el espectro contenido en un

    sonido existente. Usted aprender como usar Spectrogramas y Segmentos Espectrales(Spectral Slice).

    1. Ver un EspectrogramaPara ver el contenido espectral de un sonido en funcin del tiempo, seleccionar en Sound

    o LongSound la opcin Edit. Una ventana de edicin de sonido aparecer en la pantalla. En

    la mitad inferior de esta ventana usted podr observar una imagen plomiza, que se denominaEspectrograma. Si usted no desea observarla, desactive ShowSpectogram desde el menSpectrogram.

    El espectrograma es una representacin Espectro-temporaldel sonido. El eje horizontaldel espectrograma representa el tiempo, mientras que el eje vertical representa la frecuencia.La escala de tiempo usada para el espectrograma es la misma que la utilizada para larepresentacin de la forma de onda, por lo tanto, reaccionar igual ante los acercamientos ymovimientos que se estudien en ste. Hacia la izquierda del espectrograma se puedeapreciar la escala de la frecuencia. La frecuencia descrita en el extremo inferior delespectrograma es, por supuesto, 0 [Hz], mientras que el valor comn para la frecuenciasuperior es 5000 [Hz].

  • 7/29/2019 Manual_praat_ espaol

    4/10

    FonoaudiologaFontica y Fonologa 2007

    4

    Figura 2: Spectrograma

    Las partes ennegrecidas del espectrograma dan cuenta de la presencia de altasdensidades de energa. Si el espectrograma posee un rea oscura alrededor de los 1,2 [s] y

    a una frecuencia de 4000 [Hz], significa que el sonido posee una cantidad importante deenerga para altas frecuencias en ese periodo de tiempo.

    Para observar que tiempo y frecuencia se encuentran asociados a una determinada partedel espectrograma, solo apretar en el espectrograma y se podr ver el cursor de tiempovertical sealando el tiempo sobre la forma de onda y el cursor de frecuencia horizontal,indicando la frecuencia hacia la izquierda del espectrograma. Esta es una de las formas paraencontrar la frecuencia formntica de las vocales y los peaks espectrales principales para lasfricativas.

    Encuentro lneas verticales blancas en los bordes!Esto es normal. El anlisis espectral requiere una Ventana de anlisis de una

    determinada duracin. Para este caso, si PRAAT desea conocer el espectro en 1,342segundos, necesita incluir la informacin acerca de la seal en una venta de 10 milisegundosalrededor de este punto. Por ejemplo, PRAAT usar toda la informacin contenida en laseal entre 1,337 y 1,347 segundos. En los bordes del sonido, esta informacin no estdisponible. Si un sonido se encuentra desde 0 a 1,8 segundos, el spectrum no puedecomputarizar entre 0 y 0,005 segundos, o entre 1,795 y 1,800 segundos. Por lo tanto, no sepueden procesar las lneas blancas. Si usted no las observa inmediatamente cuando abra elsonido, acerque la imagen sobre el inicio o el final del sonido.

    Cuando usted realice acercamientos de la imagen en el medio del sonido (o en cualquierpunto fuera de los bordes) las lneas blancas se desvanecen. Repentinamente usted slo veun estiramiento de tiempo entre 0,45 y 1,35. Sin embargo, PRAAT no olvida que la seal seve como si estuvieran fuera los bordes de esta ventana de tiempo. Para desplegar unespectrograma desde 0,45 a 1,35, PRAAT usar informacin desde la forma de onda entre0,445 y 1,355 segundos, y si esto est disponible, no se vern las lneas blancas en losbordes de la ventana.

  • 7/29/2019 Manual_praat_ espaol

    5/10

    FonoaudiologaFontica y Fonologa 2007

    5

    2. Anlisis bsicosUna vez obtenido un objeto en la ventana Praat objects, ya se puede comenzar a trabajar

    y a analizar los diferentes parmetros conocidos del sonido como son: la duracin, la

    Figura N3:Visualizacin de los distintos parmetros ofrecidos por PRAAT con sus respectivos colores

    frecuencia de los formantes, la intensidad o la frecuencia fundamental (o pitch). Segn el tipode objeto seleccionado, aparecen una serie de opciones en la parte derecha de la pantallacon acciones que se pueden ver sobre este objeto.

    Los anlisis principales que se pueden realizar tienen que ver con el oscilograma(forma de onda o Waveform), el espectrograma, la curva de intensidad y de frecuenciafundamental junto a los formantes. La manera ms habitual de ver estas informaciones es apartir de los botones Edity View (segn si el archivo de sonido abierto es de corta o largaduracin), que abren una nueva ventana: el Editor.

    Una vez abierto el editor, ver que la ventana est dividida en dos partes: en la parte

    superior se encuentra el oscilograma, mientras que en la parte inferior el espectrograma. Sepueden escoger los tipos de representaciones grficas que se desean ver en la parte inferiorde la ventana, seleccionando las que sean de inters determinado desde la opcin Showanlisis, desde el men View.

    Si usted selecciona todas las representaciones, se obtienen distintas zonas de coloresen la representacin del espectrograma: color rojo para delimitar los formantes, colorazul para el F0, color verde para la intensidad.

    A veces, dependiendo del tipo de datos que se analicen, uno se puede interesar pormodificar las propiedades de las representaciones, de modo de que nos permitan analizarlosde una manera ms adecuada. A continuacin se indicarn los principales parmetros.

    a) Propiedades del espectroPara efectos de analizar las propiedades del espectro, ser conveniente visualizar en la

    ventana del editor solamente la forma de onda y el espectrograma. En la ventanaSpectrogram Settings se pueden modificar los intervalos de frecuencias representadas, laamplitud de las ventanas de anlisis (para obtener espectrogramas de banda estrecha,indicar ver los armnicos, o si es de banda ancha, se recomienda habitualmente para elanlisis de formantes y el anlisis temporal). Para obtener espectrogramas de banda ancha,consignar valor 0.005 como amplitud de la ventana de anlisis (Window Lenght). Si se

  • 7/29/2019 Manual_praat_ espaol

    6/10

    FonoaudiologaFontica y Fonologa 2007

    6

    consignan valores 0.03 se obtendrn espectrogramas de banda estrecha.

    Finalmente, tambin es posible controlar la intensidad de los colores por medio de laopcin Dynamic range (dB). Mientras ms alto sea el valor, ms oscuro aparecer elespectrograma. Por lo tanto, en algunas ocasiones ser conveniente consignar un valorelevado, de modo tal que todos los elementos queden resaltados. Por el contrario, en otras

    ocasiones, por ejemplo, si el fondo del espectrograma aparece muy oscuro, se deberrebajar dicho valor.

    Figura N4: Propiedades del espectro

    b) Propiedades de la Frecuencia Fundamental (F0)Para que resulte ms sencillo el anlisis de la frecuencia fundamental, se recomienda

    visualizar nicamente la curva de entonacin, desactivando el resto de las representaciones(Show Pitch). La ventana de ajustes de la frecuencia fundamental permite modificar elintervalo de visualizacin de las unidades de anlisis. Tambin permite optimizar elprocedimiento de clculo para el anlisis de la entonacin o para el anlisis de la sonoridad.

    Cabe tener en cuenta que se debern ajustar los parmetros descritos anteriormentesegn el tipo de voz. As, en la voz aguda (especialmente la de los nios) se espera que losvalores mximos del rango se siten alrededor de los 600 [Hz]; en voces femeninas serecomienda hasta 400 [Hz] como valor mximo de tono y, en voces masculinas, un valorsuperior a los 300 [Hz] ser suficiente.

    Respecto de las unidades, por defecto se utilizar el hertz, aunque tambin se permiteescoger otras como los semitonos, Mels y ERBs. Estas tres ltimas tienen una interpretacinms afn a la escala musical, disminuyendo las diferencias entre las frecuencias altas.

  • 7/29/2019 Manual_praat_ espaol

    7/10

    FonoaudiologaFontica y Fonologa 2007

    7

    Figura N5: Propiedades de la frecuencia fundamental

    a. Propiedades de la intensidad

    En el proceso de anlisis de la intensidad se aconseja reproducir solamente la curva deintensidad, que se describir como una lnea de color verde en el recuadro inferior de laventana de EDICIN. De todos modos, en algunos casos puede ser til reproducir tambin elespectrograma, ya que de este modo resulta ms fcil localizar a qu parte de la ondacorresponde cada movimiento de la curva de intensidad que aparecer atrs de color gris.

    Figura N 6: Propiedades de la intensidad

    Por defecto, el programa mostrar la intensidad entre los 50 y 100 decibeles. Noobstante, para efectos de un mejor anlisis se recomienda disminuir el lmite inferior delrango de intensidad hacia los 0 [dB].

    b. Propiedades de los formantesEl programa PRAAT realiza un clculo automtico de los formantes por LPC (Linear

    Predictive Coding), de modo que se puede visualizar su trayectoria a lo largo de la onda. Se

  • 7/29/2019 Manual_praat_ espaol

    8/10

    FonoaudiologaFontica y Fonologa 2007

    8

    puede reproducir slo esta configuracin en la ventana del editor, aun cuandorecomendamos usar a la vez el espectograma, ya que los valores ofrecidos por el programano siempre coinciden exactamente con los formantes que se ven en la representacinespectrogrfica, la cual es ms fiable.

    Cabe tener en cuenta que si se desea obtener el valor de la frecuencia de los formantes

    en un punto determinado, y usar los valores automticos que proporciona el programa, slopara tener una idea aproximada. Adems, estos tipos de anlisis slo sirven para calcular losformantes de las vocales orales, ya que en el caso de las vocales y las consonantesnasalizadas presenta fallas de forma significativa, generando errores de etiqueta. An conestas limitaciones, puede ser til para buscar formantes que no se encuentran bien definidas.De los parmetros modificables, los ms importantes son el que marca la frecuencia mximaque se ha de buscar en un formante (por defecto 5500 [Hz]) y el nmero de formantes que sedemandan (por defecto 5). El parmetro Maximum formant(Hz) cabe calcularlo a 5000 Hz sise analizan voces masculinas y a 5500 Hz si son voces femeninas, ya que los formantes delas vocales femeninas son un 10% ms altas que las vocales masculinas. El nmero deformantes es el lmite mximo que el programa PRAAT intentar encontrar. Sin embargo, losformantes ms altos (a partir de F4) no son claros o no aparecen.

    Figura N 7: Propiedades de los Formantes

    c. Obtencin del espectroEl programa PRAAT permite obtener el espectro desde un punto determinado de la onda

    sonora a partir de dos mtodos de anlisis: FFT (Fast Fourier Transform) y LPC (Linear

    Prediction). El espectro FFT da la composicin en armnicos del sonido, mientras que el LPCrealiza una estimacin del filtro del tracto vocal, de manera que predice los picos de mayoramplitud y proporciona una curva suavizada de la forma del espectro que, en algunos casos,ayuda a interpretar de mejor forma el espectro FFT.

  • 7/29/2019 Manual_praat_ espaol

    9/10

    FonoaudiologaFontica y Fonologa 2007

    9

    El espectro FFT se puede crear directamente desde el Sound Editoro desde la ventanaPraat object. Se recomienda centrarse en la primera opcin.

    Figura N 8: Spectrum

    Para obtener el espectro se debe ubicar el cursor en el punto exacto de la onda sonoraque se desea analizar y seleccionar (View Spectral Slice) en el men Spectrum. Para serbien precisos, se recomienda fijarse no solamente en el oscilograma, sino tambin en elespectrograma. Se abrir una ventana nueva con el espectro, entonces corresponder a unobjeto nuevo (Spectral Slice) en la ventana Praat object.

    Los parmetros del espectro que se pueden modificar son los mismos que por elespectrograma, en Spectrogram Settings. La ventana de anlisis que toma el programa parahacer el espectro es definida en Window Lenght. Como ya se ha visto, por defecto es de 5ms, pero en algunos casos, sobre todo si la frecuencia fundamental es muy alta, puede ser

    conveniente reducirla a 4ms.El espectro LPC se crea desde la ventana Praat Objects. El programa hace el anlisis

    LPC de todo el archivo seleccionado y, posteriormente, se obtiene el espectro del punto quese decidi. Los pasos que se han de seguir son los siguientes.

    Seleccionar el archivo de sonido desde la ventana Praat Objects. Apretar el botnFormants & LPC y, luego, To LPC-autocorrelation. Se puede modificar el valorPrediction Orderpara ver el mejor resultado. Ahora, se ha de decidir el punto exactode la onda que se desea extraer para el espectro LPC. Para hacerlo, abrir el editor conel espectrograma, y ubicar el cursor en el punto deseado y fijarse en el valor que

    aparece en la parte superior del cursor, en rojo.Seleccionar el objeto LPC que se ha creado en la ventana Praat Objects y buscarExtract to Spectrum Slice. En la primera casilla, Time (seconds), se debe copiar elvalor que se encontr en el punto anterior, y luego apretar OK. Para ver el espectroapretarEdit.

  • 7/29/2019 Manual_praat_ espaol

    10/10

    FonoaudiologaFontica y Fonologa 2007

    10

    Figura N 9: LPC (Linear Predictive Coding)