manual praat completo

32
Privada del Relox No. 16 “A” piso 5, Col. Chimalistac, Deleg. Álvaro Obregón, México D.F. 01070 Tel. (55) 50 04 21 22 MANUAL DE PRAAT Preparado por: Ling. Héctor Hugo Rodríguez Toledo Revisado por: Mtra. Rosa María Rojas Torres Primera versión Enero 2013 Índice de contenido

Upload: octavio-alonso

Post on 28-Oct-2015

191 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Manual Praat Completo

Privada del Relox No. 16 “A” piso 5, Col. Chimalistac, Deleg. Álvaro Obregón, México D.F. 01070 Tel. (55) 50 04 21 22

MANUAL DE PRAAT

Preparado por: Ling. Héctor Hugo Rodríguez Toledo

Revisado por: Mtra. Rosa María Rojas Torres

Primera versión Enero 2013

Índice de contenido

Page 2: Manual Praat Completo

Privada del Relox No. 16 “A” piso 5, Col. Chimalistac, Deleg. Álvaro Obregón, México D.F. 01070 Tel. (55) 50 04 21 22

I. Introducción……………………………………………………………….. 1

II. Instalación………………………………………………………………… 2

III. Abrir Praat………………………………………………………………….. 4

IV. Leer un sonido……………………………………………………………… 5

V. Abrir archivo extenso de audio……………………………………….. …. 6

VI. La segmentación Parte 1……………………………………………….. 7

VII. La segmentación Parte 2……………………………………………….. 10

VIII. La transcripción…………………………………………………………… 14

IX. Insertar símbolos fonéticos……………………………………………….. 15

X. ¿Dónde escuchar los sonidos del AFI? …………………………………. 18

Page 3: Manual Praat Completo

Privada del Relox No. 16 “A” piso 5, Col. Chimalistac, Deleg. Álvaro Obregón, México D.F. 01070 Tel. (55) 50 04 21 22

XI. Guardar TextGrid………………………………………………………………. 20

XII. Extracción de audio con script……………………………………………… 22

ANEXO I. Etiquetas……………………………………………………………. 25

ANEXO II. Uso de Lenz…………………………………………………. 25

XIII. Dividir pistas extensas……………………………………………………. 12

XIV. Exportar selección…………………………………………………………. 15

Page 4: Manual Praat Completo

1

MANUAL SINTETIZADO DE PRAAT

Praat (del holandés "hablar") es un software gratuito para el análisis acústico del

habla. Es un software libre, de código abierto, multiplataforma y gratuito. Fue

desarrollado en la Universidad de Amsterdam por Paul Boersma y David Weenink

a partir del año 1992.

I. INTRODUCCIÓN

Se trata de un software de amplios propósitos; en efecto, permite hacer análisis

acústico, síntesis articulatoria, procesamiento estadístico de los datos, edición y

manipulación de señales de audio, y un largo etcétera. Otra cualidad

interesantísima es que el usuario puede crear sus propias rutinas e incluso

añadirlas a los menús del programa.

Por tratarse de un programa especializado, no es la amabilidad de las interfaces

una de sus características; más bien, requiere un cierto adiestramiento y, mucha

información teórica. Por esta razón se ha escrito este manual orientado a facilitar

su uso a los investigadores que apoyan las labores de Documentación lingüística

del Instituto Nacional de Lenguas de Lenguas Indígenas (INALI), a través de la

Dirección de Investigación (DI) y del Archivo de Lenguas Indígenas Nacionales

(ALIN).

Page 5: Manual Praat Completo

2

Este es un manual básico, en el que se presenta cómo hacer la instalación del

programa, abrir archivos de audio, crear textgrids, segmentar audio, crear

intervalos de transcripción en los distintos tiers, ingresar texto común y corriente

en los intervalos, ingresar símbolos Alfabeto Fonético Internacional (AFI) a los

intervalos utilizando Lenz, y guardar audio por ítem.

II. INSTALACIÓN

Praat, puede ser instalado en varios sistemas operativos, incluyendo Unix, Mac y

Microsoft Windows (en todas sus versiones).

1. Para hacerlo, tenemos que dirigirnos a la siguiente dirección

electrónica: http://www.fon.hum.uva.nl/praat/ o en su defecto podemos

dirigirnos al buscador de Google y escribir: Praat phonetics.

2. Una vez que nos encontramos en la página principal, encontraremos

una sección de Descarga/Download. Elegimos la versión para

Windows o podemos teclear en la barra de búsqueda la siguiente

dirección web que les llevara al enlace de descarga automáticamente

para el sistema operativo Windows:

http://www.fon.hum.uva.nl/praat/download_win.html

Page 6: Manual Praat Completo

3

3. Una vez que estamos en la página web de Descarga/Download,

elegimos bajar el archivo comprimido que contiene el programa Praat

en su versión ejecutable con extensión (.exe). Recordemos que por ser

Windows la plataforma más difundida hemos optado por mostrar cómo se

realiza la instalación de esta forma.

4. Como vemos en la imagen, la última versión revisada en Enero de 2013, es

la 5.3.39, y existen para sistemas de 32 y 64-bits, (aquí no nos

detendremos a dar mayor detalle, únicamente mencionamos que tiene que

ver con el hardware de su computadora y la memoria RAM). Elegimos la

versión de 32-bits titulada: praat5339_win32.zip (que sirve para

cualquier computadora estándar actual). Al dar clic, elegimos la

opción de Guardar archivo y damos clic en Aceptar.

Page 7: Manual Praat Completo

4

5. Abrimos el archivo encriptado con extensión (.zip) y extraemos el

contenido en una ubicación deseada, que pude ser por ejemplo, el

Escritorio.

III. ABRIR PRAAT

Damos doble clic sobre el icono de Praat que es la imagen que simula a

una boca y una oreja debajo. Inmediatamente nos desplegara un par de

pantallas llamadas “Praat Objects y “Praat Picture”, y si logramos verlas en

nuestra pantalla, enhorabuena, podemos empezar a usar el programa.

Page 8: Manual Praat Completo

5

IV. LEER UN SONIDO

Nota: Antes de ver los pasos para abrir un sonido, podemos cerrar la pantalla de

Praat Picture, ya que no la necesitaremos.

1. Usted puede leer un archivo de sonido existente desde su disco duro.

Con Read from file desde el menú Open. Praat le brinda la posibilidad

de leer extensiones estándares de sonido como, por ejemplo, la

extensión (.wav). A continuación, se abre una ventana que permite

navegar por el disco duro de su computadora y seleccionar el

fichero/carpeta que contiene el audio que desee.

2. A continuación, el archivo seleccionado se mostrará como un objeto

en la ventana administrativa (Object window). Para estos efectos, si

usted abre el archivo ejemplo.wav, un objeto denominado “Sound

ejemplo” se asignará en la lista.

Page 9: Manual Praat Completo

6

Nota: Nosotros abrimos un sonido denominado: abeja_esa_bizu_ca que en Object

window aparece como Sound abeja_esa_bizu_ca. Esto lo puede ver en la imagen

siguiente:

Ejemplo de audio listo para usarse en Praat

V. ABRIR ARCHIVO EXTENSO DE AUDIO

1. Si el audio con el que se desea trabajar tiene una duración demasiado

elevada y Praat no puede almacenarlo en la memoria temporal, puede

abrirse con la opción Open long sound file... en el menú Read.

Page 10: Manual Praat Completo

7

Nota: Debe tenerse en cuenta que el tamaño máximo de un fichero que puede

abrirse con Praat es de 2 Gigabytes.

VI. LA SEGMENTACIÓN PARTE I

1. Crearemos un archivo (.TextGrid), con la finalidad de segmentar y

después transcribir en distintos niveles el texto que deseamos.

Entonces, una vez abierto el fichero que se desea etiquetar, se

selecciona este fichero en la ventana Objects y se elige el menú

Annotate y se da clic en la opción To TextGrid….

2. Aparecerá el recuadro correspondiente a All tier names donde se

escriben los nombres de los niveles en que desee transcribir el

corpus.

Page 11: Manual Praat Completo

8

3. Substituya el texto “Mary John bell” que aparece por defecto.

Utilisaremos cuatro lineas de transcripción correspondientes a la

Transcripción fonética (TF), Transcripción ortográfica (TO), Glosa

español (GE) y Etiquetado (ET). Así escribiremos las abreviaturas

propuesta, es importante que cuando las escribia no use comas sólo

espacios en blanco como se muestra en imagen y borre el contenido

del recuadro Which of these are point tiers?, que por el momento no

usaremos.

4. A continuación, se selecciona conjuntamente el elemento Sound que

contiene el sonido con el objeto TextGrid y se elige la opción View &

Edit en el menú de la derecha.

Page 12: Manual Praat Completo

9

5. Si realizamos los pasos anteriores correctamente, nos aparecerá una

ventana, con los niveles de transcripción definidos antes, en los

cuales podemos segmentar y anotar texto.

Nota: Para reproducir la grabación, damos un clic donde dice Visible part (esto

quiere decir que se escuchara la parte visible del oscilograma), lo que haremos

enseguida es mostrar cómo se hace un zoom para poder inicar los intervalos a

anotar, es decir, la segmentación del audio. Recordemos que debemos identificar

emisiones completas. Por ejemplo en el oscilograma, el inicio del audio es una

línea recta al igual que donde existe una ausencia de sonido, es sencillo identificar

palabras completas ya que al oir y ver la imagen de ondas distinguimos las

pausas.

Page 13: Manual Praat Completo

10

Para visualizar mejor, damos clic en “in”, icono ubicado en la parte inferior

izquierda de la pantalla, ajustando con “out”, hasta que ajustemos la imagen como

deseamos, tomando encuenta las cuestiones anteriores. Además no es de

preocuparse que en algunas computadoras se visualice mejor que en otras, esto

es debido a la resolución de su pantalla.

Vemos que la parte visible ya no es la de la duración total del audio, y para

desplazarnos, usamos justamente la “barra de desplazamiento”.

VII. LA SEGMENTACIÓN PARTE II

1. Primero debe poner el cursor en el nivel/línea donde se desea marcar

el segmento, esta se activara en un color amarillo.

En este ejemplo se activo la línea 2 correspondiente a la Transcripción

ortográfica y se visualiza el icono de mano señalándola.

Page 14: Manual Praat Completo

11

2. Posiciona el cursor sobre la secuencia de sonido, al situar el cursor en

el lugar donde se desea segmentar, aparece una línea vertical gris y

unos puntos, en cada uno de los niveles de etiquetado.

3. Dar un clic sobre el punto, y así se fija la primera frontera del

segmento que se desea, que aparece en color rojo.

Page 15: Manual Praat Completo

12

4. Aún estando activados los puntos en cada una de los niveles, continúe

marcándolos hasta que se haga una solo línea de color azul, esto nos srive

para que cada nivel este alineado al sonido y podamos ingresar texto en el

mismo segmento.

5. Con el mismo procedimiento se introducen las marcas de

segmentación del fin de la emisión que se deseen en cada nivel.

IMPORTATE: De las emisiones que responda su colaborador, debe

seleccionar “la mejor” de ellas.

En la imagen de abajo, note que ahora nos podemos posicionar dentro del

corte y que la emisión corresponde a una sola palabra (puede hacerlo al ver

el oscilograma que aparece de inicio con una línea recta, seguido de ondas,

y termina con línea).

Page 16: Manual Praat Completo

13

Nota: Puede desplazarse entre los segmentos seleccionándolos, usando menú

Interval y Boundary (con los que puede editarlos) Y usando las teclas Alt +

Flechas del cursos (adelante, atrás, arriba, abajo). Si se equivoca y es necesario

eliminar un segmento marcado, debe ir a Boundary>Remove, o con la

combinación de las teclas Alt y Retroceso (Alt+←).

Page 17: Manual Praat Completo

14

VIII. LA TRANSCRIPCIÓN

Si hemos terminado con los pasos anteriores, podemos proceder a introducir

texto, es decir, a transcribir. Para ello, sigamos los pasos siguientes:

1. Seleccione el corte/segmento que desea transcribir, al hacerlo se

activara con un color amarillo entre dos marcas de segmentación y

podrá introducir el texto en la ventana superior, se percatara que el

cursor comienza a parpadear. (También se muestra el texto, en la

línea).

Nota: Para introducir símbolos fonéticos debe tenerse instalada la fuente Charis

SIL que puede obtenerse desde la página de descarga de Praat:

http://www.fon.hum.uva.nl/praat/CharisSIL-4.110.zip o desde la página de SIL

International: http://scripts.sil.org/CharisSILfont. Los links son directos y una vez

que se descargue debe ejecutar el archivo y dar clic en instalar.

Page 18: Manual Praat Completo

15

En la primera línea usted usara, el Alfabeto Fonético Internacional (AFI), en la

segunda línea o nivel, el Alfabeto Practico de su lengua, en la tercera, la glosa en

español (traducción) y en la cuarta la etiqueta (que les proporcionará el equipo que

coordina el proyecto). Para mayor información sobre la etiqueta vea el Anexo I.

IX. INSERTAR SÍMBOLOS FONÉTICOS

Mostraremos como deben utilizarse las convenciones descritas en los apartados

“Phonetic symbols: consonants”, “Phonetic symbols: vowels” y “Phonetic symbols:

diacritics” del manual de ayuda que se encuentra en el menú Help. Además en el

Anexo II se muestra el uso de un remapeador del teclado para fuentes AFI

llamado Lenz.

1. Nos dirigimos a la derecha de la ventana donde aparece el menú Help,

en el se encuentra un acceso directo a las tablas de símbolos

fonéticos dentro del menú Phonetic symbols.

2. Una vez que dimos clic, se abre la página correspondiente del manual

y se puede seleccionar una de las tres tablas de símbolos: “Phonetic

symbols: consonants”, “Phonetic symbols: vowels” o “Phonetic

symbols: diacritics”, correspondientes a consonantes, vocales y

diacríticos.

Page 19: Manual Praat Completo

16

3. Al elegir lo que deseamos, aparecerán tablas con la combinación que

debe teclearse para obtener el símbolo fonético deseado.

Nota: Podemos imprimir el contenido de las tablas o guardarlas en un formato

Html (pagina web) para visualizarlos más rápido, esto se hace en el menú File.

Page 20: Manual Praat Completo

17

4. Como vimos, debemos ir a la ventana superior para ingresar el texto y

teclear como aparece en las tablas. Por ejemplo, si tecleamos la

combinación \zh, se obtiene el símbolo correspondiente a la fricativa

postalveolar sonora [ʒ].

5. Ahora, y una vez que se inserto la transcripción en las dos primeras

líneas, ahora iremos a la línea tres e introduciremos la Glosa en

español, es decir la traducción.

Page 21: Manual Praat Completo

18

6. En la siguiente línea (la cuarta), se debe escribir la etiqueta que se le

asignará a ese ítem. En este ejemplo, es hipotético (debe ver el Anexo I,

para poder tener un panorama más amplio, además de la información que

les dará el equipo del INALI).

X. ¿DONDE ESCUCHAR LOS SONIDOS DEL AFI?

El Alfabeto Fonético Internacional (AFI), es un sistema de anotación fonética

creado por lingüistas. Su propósito es otorgar en forma regularizada, precisa y

única la representación de los sonidos de cualquier lenguaje oral.

Debido a que existen diversos sonidos distintos al español en las lenguas

indígenas y a que no todo mundo está entrenado en fonética, hemos pensado que

es importante tener a la mano el audio para poder familiarizarnos con los sonidos

de cada grafía que se representa en el AFI.

Page 22: Manual Praat Completo

19

A continuación ponernos algunas ligas donde puede hacerlo, estando conectado a

internet:

http://www.phonetics.ucla.edu/course/chapter1/consonants1.html

http://web.uvic.ca/ling/resources/ipa/charts/IPAlab/IPAlab.htm

Además les mostramos como poder bajar la aplicación titulada IPA Help, para ser

instalada en su computadora y podrán recurrir a esta cuando deseen.

1. Dirigirse a esta página web:

http://www.sil.org/computing/ipahelp/ipahelp_download.htm

Page 23: Manual Praat Completo

20

2. Cuando se encuentre en ella, dirigirse a la sección Download y de clic en el

link IPA Help que está en azul.

3. Al terminar de bajar SIL_IPA_2_1.exe, sólo de doble clic e instale.

4. Una vez descargado, diríjase a la carpeta donde lo guardó y de doble clic.

5. Se creara una carpeta llamada SIL_IPA_2_1, dentro esta un archivo

llamado Setup, ejecútelo (dando doble clic) y siga los pasos de instalación.

6. Al terminar, se creara un acceso directo del programa en el Escritorio

, ábralo y usted ya podrá escuchar y ver la grafías del AFI.

Page 24: Manual Praat Completo

21

XI. GUARDAR TEXTGRID

1. Terminando la anotación

cerramos la ventana, y nos

dirigimos a la ventana de

objetos (Praat Objects), se

selecciona únicamente el

TextGrid y se guarda dando

clic en Save, después Save

as text file...

2. Al aparecer la ventana, tendremos que elegir la ruta donde queremos

guardar el archivo, que de preferencia será en la misma carpeta donde se

encuentra nuestro archivo de audio. Después sólo damos clic en guardar,

y el archivo se salva con una extensión (.TextGrid) que después podemos

abrir en Praat. (El programa no tiene la función de autoguardado, por eso

es importante hacerlo manualmente).

Page 25: Manual Praat Completo

22

XII. EXTRACCIÓN DE AUDIO CON SCRIPT

EL script que les proporcianamos, se llama: extraer_audio_en_wav.praat y es el

mismo que “Save intervals to small WAV sound files”, realizado por Mietta Lennes

© 8.3.2002.

Básicamente, le permite realizar una tarea rutinaria que consiste en extraer el

audio de los segmentos anotados con las etiquetas de sus ítems usando la

formula que les proporciona el Archivo Nacional de Lenguas Indígenas del Instituto

Nacional de Lenguas Indígenas a través de la Dirección de Investigación.

Los archivos automáticamente llevaran el nombre de la etiqueta y se guardaran en

formato (.wav) y se guardan en la siguiente ruta: C/audios/.

Nota: Debe abrir el archivo de sonido (.wav) como Long Sound File desde el menú

Open. Además el LongSound y el archivo Sound, debe tener el mismo nombre

(idéntico).

1. Debe crear una carpeta en el disco duro de su computadora desde la

unidad C, y nombrarla “audios”.

2.- Abra su audio como Long Sound File…, (vea el apartado V)

3. Abra su TextGrid previamente guardado (para más detalle vea el apartado

XI).

Page 26: Manual Praat Completo

23

4. Selecciones ambos elementos en la pantalla de Objetos. Y después vaya a

Praat, Open Praat script:

6. De preferencia guarde el archivo del script en el Escritorio, entonces,

vaya ahí y Selecciónelo.

Page 27: Manual Praat Completo

24

7. Una vez abierto, vera esta pantalla.

8. Presione Ctrl+R o vaya a Run>Run. Cuando aparezca esta pantalla,

solo de clic en OK y se hará la tarea automáticamente, después vaya a

la carpeta C:/audios en su disco duro y ahí estarán sus audios

cortados.

Page 28: Manual Praat Completo

25

ANEXO I. ETIQUETAS La fórmula que usaremos funciona de esta forma: Código CLIN- Numero de Entidad Federativa-Número de Comunidad Estudiada -

Sexo del Hablante-Siglas del Investigador –Abreviatura de Lista _Número de dato

(ítem, narración, etc.).

Ejemplo en náhuatl:

Y05-21-2-H-HHRT-Y-001

En este caso Y05, corresponde al código propuesto el Centro de Documentación del INALI como política de Catalogación, adaptada del sistema de Dewey Decimal. Y= Familia lingüística (Yuto-nahua) 05= Agrupación lingüística (náhuatl) Después el numero 21, corresponde al estado de Puebla Seguido del guión, el 2, es el numero de la comunidad que estudia el investigador, en este caso es la segunda. H= Hombre, M=Mujer, en general se piden datos de dos hombres y dos mujeres, se pide nombrar H1 y H2 o M1 y M2, según sea el caso HHRT= Siglas de Héctor Hugo Rodríguez Toledo La Y, corresponde a la lista (cedula) que uso, en este caso es la de Yolanda Lastra. 001, corresponde a el numero de ítem, que es agua, porque en la lista es la primera palabra a elicitar. Esta etiqueta nos servirá para poder identificar cada segmento y poder extraerlo como un audio único, y nos quedara algo así: Y05-21-2-H-HHRT-Y-001.wav.

Page 29: Manual Praat Completo

26

ANEXO II. USO DE LENZ

Lenz es una aplicación que únicamente se puede ejecutar en un ambiente

Windows, es gratuita y fue desarrollada por el Dr. Scott Sadowsky, de la

Universidad de La Frontera-Temuco, Chile. La aplicación es compatible con

cualquier otro que soporte el estándar de escritura virtual Unicode, entre ellos

Praat, y también la paquetería de Office, ELAN y muchos más. Se puede utilizar

casi con cualquier otro software que use el sistema operativo Windows.

1. Para usar la aplicación, es necesario tener instalada la fuente Charis

SIL y/o Doulos SIL. Para utilizar Lenz, sólo hay que bajar el archivo

(.zip) de la siguiente dirección: http://sadowsky.cl/files/lenz/1.3/Lenz-

Esp.zip, guardarlo, descomprimirlo.

2. Una vez que extraemos el contenido vemos que hay tres archivos, uno

es la aplicación, y los otros son las tablas con las combinaciones que

debemos usar para insertar el símbolo del AFI.

Page 30: Manual Praat Completo

27

3. Ejecutamos (dando doble clic) el archivo “Lenz-Esp.exe” que contiene

la capeta. Aparecerá un ícono verde en la barra de íconos de

Windows; esto señala que el programa está funcionando, y permite, a

través de un clic del botón derecho, suspenderlo o cerrarlo en

cualquier momento. Al mismo tiempo se nos desplegara en pantalla el

siguiente mensaje:

Como se indica, presionando las teclas +H puede ver el mapa del teclado.

En la imagen de abajo, se muestra que Lenz está funcionando, y para usar el

teclado común, debe cerrarlo dando clic derecho e indicar Exit.

Cuando Lenz está cargado, las teclas normales producen los caracteres de

siempre. Las teclas modificadoras CTRL, ALT, CTRL+ALT, CTRL+SHIFT y

ALT+SHIFT, en combinación con las normales, generan los símbolos AFI. El

gráfico que figura al final de esta página indica dónde en el teclado se encuentran

los distintos símbolos fonéticos. Así, por ejemplo, schwa [ə] se produce con la

Page 31: Manual Praat Completo

28

combinación CTRL+e, esh [ʃ] se produce con ALT+s y el símbolo de aspirado [ʰ]

se genera con la combinación ALT+SHIFT+h.

Nota: El programa está diseñado para el teclado español en el cual @ se produce

con AltGr+2 y las llaves {} se encuentran en la misma fila que ASDF. Funciona con

otros teclados, pero no todos los símbolos se producen con las mismas teclas. La

imagen muestra la función de teclas.

Además, recomendamos imprimir la imagen y que esta sea a color, tenerla a la

mano para que sea más sencillo poder escribir los símbolos.

En el mismo ejemplo, que usamos anteriormente, ahora en lugar de tener que ir al

menú Help y seguir los pasos descritos, únicamente presionamos la combinación

de teclas: Alt+d, lo que nos como resultado /ʤ/. (No necesitamos recurrir a la

combinación \zh).

Page 32: Manual Praat Completo

29