t-thb0925/20180526_osaka.pdf · gabriel bergounioux 4fg2hjb ©¥$>eh7...

3
Annota&on of speech corpora : sharing experiences 7UkB 7E7EP<@>: -./2 _EuZ_Gc 7/ 14:00-18:00 1 0IB:0;)! 5 SO ?]'foTh : Annota&on and analysis of Japanese spontaneous speech P9Ys QR0;-2:2JiM?0 ga'[s8Cj$! j l A : Annoter les corpus oraux Gabriel Bergounioux +I8.0;0 ga'035.s8Cj$! j H A e : -).-)%*($ C+"-'.#(0;0 ga'6;s j = A `:kipY7UkB7E 7UkB7E7EP<@-./2_EuZ_ BergouniouxQb&K6'6;Et\^:ig308af9<e(14,32dc%*+)&@" 2>166 kipY 50-0.140663 EAGD@tXU58NC<=T3EA-K4F

Upload: doanliem

Post on 12-Sep-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: t-thb0925/20180526_Osaka.pdf · Gabriel Bergounioux 4FG2HJb ©¥$>EH7 Lesannotationspeuventêtredéfiniescomme«desséquencesdecaractères

Annota&on of speech corpora: sharing experiences

k u

14:00-18:005 o

:Annota&on and analysis of Japanesespontaneous speech

s - i 0s8

jl

:Annoter les corpus orauxGabriel Bergounioux I8 0

s8

j

e

:������� ��—�������

-C - 0

s

j

p k

k uBergounioux t ig30 af c @

2 1 6 p 5 0 - 0. 1 4 0 6 6 3

t -

Page 2: t-thb0925/20180526_Osaka.pdf · Gabriel Bergounioux 4FG2HJb ©¥$>EH7 Lesannotationspeuventêtredéfiniescomme«desséquencesdecaractères

�*5�6�,6"'2_~��:?Qmtv>[V30<OU=@��+7"40(�S)���:?�eA�YM�IR�� ������fQ>�.�0-�$���M �

1) 2018<6E1:�D ��j�;QTF 19(% H� 8 z.�6:?)49%l_nQ>px;>15:15�16:15 �} « L’art de la conversation : marques de structuration du discours, représentation

sociale et interlocution » 16:30�17:15 8�!#3&+ « Écriture inclusive : le français se donne à voir »

2) 2018<6E2:�h10:00�12:00 �\;Q W�2zW-205_u:?)49%lQ> #9/$�0 – Journée d’étude « Variation(s) » « Le français oral en variation : les enseignements de l’Enquête Sociolinguistique à Orléans »

3) 2018<6E2:�h15:00�16:15 �\;Q W�1zW-102_u:?)49%l)49%aQ>px;> dc�} « Saussure et la littérature »

1 - - 24 I

�KMs|��i�r�ki;=C�M^�1oB`��H�P450m��yP7G�KMs��i{q�C�M^�1-BB`��W�P450m��yP7G�bZ]sJLiNg��M^�X�420m��yP6G�bZ]s����M^�AwB`��b�P800m��yP12G�KMs|��i����M^�5�B`��b�P1,000m��yP15G

Page 3: t-thb0925/20180526_Osaka.pdf · Gabriel Bergounioux 4FG2HJb ©¥$>EH7 Lesannotationspeuventêtredéfiniescomme«desséquencesdecaractères

� ���������������

����

�>EH7" �-IL�b—�#l�����Laurence Labrune �?F9��BH8�:CJb��©¥$IL��LUd$�>EH7" �-IL�b#��cn0G=C���la>EH

7#IL�b#bs#,��0y��-)#�-�>EH7" �-IL�b$ 1!��P5AC:83�"*��� ���k"��Jb���e\! ����� #*�!��8�@���V� *%� 1!_�§v'"z��N/.�-�0«��*���-)#�-�

Annota&on and analysis of Japanese spontaneous speech�IL�#RU¡�"V�-2;8�6DH�Sª��[­¦ �� Jb�K]K���j��©¥$���¡�5�<7#�¨�p`" �$��¡�.�¡�"V���Uo#�

������~��WX}r#���u�Y¤x#��! �w�#2;8�6DH���`}r#�����g"!-��"RU¡�0V���-TQ���"$�&�&!£�®i�Ml�-�(��#V��hq�!-�L©¥�$�¡�5�<7#2;8�6DH"$ #*�!�¢�-�� #*�!m�hq"!,� #*�!|^t��{�.�-�� #*�!Sª��������m"���fZ#IL�5�<7#��O�0��!�+¬��-�

Annoter les corpus orauxGabriel Bergounioux�4FG2HJb��©¥$>EH7��Les annotations peuvent être définies comme « des séquences de caractèresinsérées dans un texte afin de pointer un phénomène particulier ». On endistingue trois types – intégrées, parallèles ou multilinéaires – qui opèrentaux différents niveaux de l’analyse linguistique. Dans le cas des corpusoraux, elles impliquent une standardisation des représentations, deslemmatisations et des catégorisations. La chaîne de traitement des données àmettre en place opère une distinction entre (i) les transcriptions, (ii) lesmétadonnées et (iii) les annotations qui posent des questions en matière deméthode et pour la définition de solutions d’exploitation et d’archivage.