analyse de textes avec treecloud et lexico3
DESCRIPTION
Présentation à la journée interdisciplinaire de doctorants OSIDMESH (http://tinyurl.com/osidmesh)TRANSCRIPT
![Page 1: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/1.jpg)
Journée OSIDMESHMontpellier – 23/10/2009
Analyses de textes avec TreeCloud et Lexico3
Philippe Gambette
![Page 2: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/2.jpg)
• Analyses plus fines
• Nuages de mots• Nuages améliorés
Plan
![Page 3: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/3.jpg)
• Analyses plus fines
• Nuages de mots• Nuages améliorés
Plan
![Page 4: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/4.jpg)
• Se sont popularisés avec Wordle
• Construits depuis l'ensemble des mots d'un texte• Taille de police liée à la fréquence
Nuages de mots
• Donnent un bon aperçu d'un texte
Nuages Wordle des mots les plus utilisésdébut 2009 dans les blogs des Top 100
politique et high-tech de Wikiohttp://aixtal.blogspot.com/2009/04/web-de-quoi-parlent-les-blogs.html
![Page 5: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/5.jpg)
• Se sont popularisés avec Wordle
• Construits depuis l'ensemble des mots d'un texte• Taille de police liée à la fréquence
Nuages de mots
• Donnent un bon aperçu d'un texte
![Page 6: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/6.jpg)
• Se sont popularisés avec Wordle
• Construits depuis l'ensemble des mots d'un texte• Taille de police liée à la fréquence
Nuages de mots
• Donnent un bon aperçu d'un texte
GoogleImage(obama inaugural address wordle)
![Page 7: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/7.jpg)
• Se sont popularisés avec Wordle
• Construits depuis l'ensemble des mots d'un texte• Taille de police liée à la fréquence
Nuages de mots
GoogleImage(obama inaugural address wordle)
![Page 8: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/8.jpg)
• Se sont popularisés avec Wordle
• Construits depuis l'ensemble des mots d'un texte• Taille de police liée à la fréquence
Nuages de mots
GoogleImage(obama inaugural address wordle)
![Page 9: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/9.jpg)
• Analyses plus fines
• Nuages de mots• Nuages améliorés
Plan
![Page 10: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/10.jpg)
• tags partagés en rouge dans del.icio.us
Ajouter de l'information extraite du texte :• pâleur pour exprimer la désuétude dans Amazon
Nuages de mots améliorés
• optimiser l'espace vide et la proximité sémantiqueKaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrenceFujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
• regrouper les tags cooccurrents sur la même ligneHassan-Montero & Herrero-Solana, InScit'06
![Page 11: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/11.jpg)
• tags partagés en rouge dans del.icio.us
Ajouter de l'information extraite du texte :• pâleur pour exprimer la désuétude dans Amazon
Nuages de tags/mots améliorés
• optimiser l'espace vide et la proximité sémantiqueKaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrenceFujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
• regrouper les tags cooccurrents sur la même ligneHassan-Montero & Herrero-Solana, InScit'06
![Page 12: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/12.jpg)
• tags partagés en rouge dans del.icio.us
Ajouter de l'information extraite du texte :• pâleur pour exprimer la désuétude dans Amazon
Nuages de tags/mots améliorés
• optimiser l'espace vide et la proximité sémantiqueKaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrenceFujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
• regrouper les tags cooccurrents sur la même ligneHassan-Montero & Herrero-Solana, InScit'06
![Page 13: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/13.jpg)
• tags partagés en rouge dans del.icio.us
Ajouter de l'information extraite du texte :• pâleur pour exprimer la désuétude dans Amazon
Nuages de tags/mots améliorés
• optimiser l'espace vide et la proximité sémantiqueKaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrenceFujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
• regrouper les tags cooccurrents sur la même ligneHassan-Montero & Herrero-Solana, InScit'06
![Page 14: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/14.jpg)
• tags partagés en rouge dans del.icio.us
Ajouter de l'information extraite du texte :• pâleur pour exprimer la désuétude dans Amazon
Nuages de tags/mots améliorés
• optimiser l'espace vide et la proximité sémantiqueKaser & Lemire, WWW'07
• “topigraphy”: placement 2D d'après la cooccurrenceFujimura, Fujimura, Matsubayashi, Yamada & Okuda, WWW'08
• regrouper les tags cooccurrents sur la même ligneHassan-Montero & Herrero-Solana, InScit'06
![Page 15: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/15.jpg)
Extraire l'information sémantique d'un texte
• traitement des langues naturelles :désambiguïsation
Véronis (Hyperlex)
• analyse littéraire :approche philologique : se concentrer sur le texte
Brody
• fouille de texte :graphe sémantique
Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• analyse du discours :analyse arborée, graphe de cooc., projection géodésique
Brunet (Hyperbase), Viprey (Astartex)
![Page 16: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/16.jpg)
Extraire l'information sémantique d'un texte
Mayaffre, Quand travail, famille, et patrie cooccurrent dans le
discours de NicolasSarkozy, JADT'08
• traitement des langues naturelles :désambiguïsation
Véronis (Hyperlex)
• analyse littéraire :approche philologique : se concentrer sur le texte
Brody
• fouille de texte :graphe sémantique
Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• analyse du discours :analyse arborée, graphe de cooc., projection géodésique
Brunet (Hyperbase), Viprey (Astartex)
![Page 17: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/17.jpg)
Extraire l'information sémantique d'un texte
Brunet, Les séquences (suite),JADT'08
• traitement des langues naturelles :désambiguïsation
Véronis (Hyperlex)
• analyse littéraire :approche philologique : se concentrer sur le texte
Brody
• fouille de texte :graphe sémantique
Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• analyse du discours :analyse arborée, graphe de cooc., projection géodésique
Brunet (Hyperbase), Viprey (Astartex)
![Page 18: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/18.jpg)
Extraire l'information sémantique d'un texte
Barry, Viprey,Approche comparative
des résultats d'exploration textuelle des discours
de deux leaders africainsKeita et Touré,
JADT'08
• traitement des langues naturelles :désambiguïsation
Véronis (Hyperlex)
• analyse littéraire :approche philologique : se concentrer sur le texte
Brody
• fouille de texte :graphe sémantique
Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• analyse du discours :analyse arborée, graphe de cooc., projection géodésique
Brunet (Hyperbase), Viprey (Astartex)
![Page 19: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/19.jpg)
Extraire l'information sémantique d'un texte
Peyrat-Guillard,Analyse du discours
syndical sur l’entreprise, JADT'08
• traitement des langues naturelles :désambiguïsation
Véronis (Hyperlex)
• analyse littéraire :approche philologique : se concentrer sur le texte
Brody
• fouille de texte :graphe sémantique
Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• analyse du discours :analyse arborée, graphe de cooc., projection géodésique
Brunet (Hyperbase), Viprey (Astartex)
![Page 20: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/20.jpg)
Extraire l'information sémantique d'un texte
Visualisation PhraseNet de paroles des Beatles
créé avec Many Eyes (IBM)http://many-eyes.com
http://visualthinkmap.ning.com/photo/phrasenet_beatles-many-eyes
• traitement des langues naturelles :désambiguïsation
Véronis (Hyperlex)
• analyse littéraire :approche philologique : se concentrer sur le texte
Brody
• fouille de texte :graphe sémantique
Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• analyse du discours :analyse arborée, graphe de cooc., projection géodésique
Brunet (Hyperbase), Viprey (Astartex)
![Page 21: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/21.jpg)
Extraire l'information sémantique d'un texte
Désambiguïsation du mot “barrage”.
Véronis, HyperLex:Lexical Cartography for
Information Retrieval, 2004
• traitement des langues naturelles :désambiguïsation
Véronis (Hyperlex)
• analyse littéraire :approche philologique : se concentrer sur le texte
Brody
• fouille de texte :graphe sémantique
Grimmer (Wordmapper), Viegas et al. (IBM Many Eyes)
• analyse du discours :analyse arborée, graphe de cooc., projection géodésique
Brunet (Hyperbase), Viprey (Astartex)
![Page 22: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/22.jpg)
Nuage de tags + arbre = nuage arboré
TreeCloud en Python, license GPLdisponible sur http://www.treecloud.fr
Construit avec TreeCloud et
SplitsTree : Huson 1998, Huson & Bryant 2006
![Page 23: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/23.jpg)
Nuage arboré des discours d'Obama
couleur : chronologie
Les 150 mots les plus fréquents dans les discours de campagne d'Obama, winsize=30, distance=oddsratio, color=chronology, NJ-tree.
ancienrécent
Construit avec TreeCloud et
![Page 24: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/24.jpg)
• Analyses plus fines
• Nuages de mots• Nuages améliorés
Plan
![Page 25: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/25.jpg)
Lexico 3• Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle
• Logiciel pour PC sous Windows
• Version d'évaluation gratuite
• Analyses fines, retour au texte
Analyses textuelles fines
http://www.cavi.univ-paris3.fr/Ilpga/ilpga/tal/lexicoWWW/
![Page 26: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/26.jpg)
Lexico 3• Laboratoire SYLED-CLA2T de Paris 3 Sorbonne Nouvelle
• Logiciel pour PC sous Windows
• Version d'évaluation gratuite
• Analyses fines, retour au texte
• Démo sur les avis cinéma de Monique Pantel
Analyses textuelles fines
http://monique.pantel.free.fr
![Page 27: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/27.jpg)
Analyses textuelles fines
![Page 28: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/28.jpg)
Analyses textuelles fines
![Page 29: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/29.jpg)
Analyses textuelles fines
![Page 30: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/30.jpg)
Analyses textuelles fines
![Page 31: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/31.jpg)
Analyses textuelles fines
![Page 32: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/32.jpg)
Analyses textuelles fines
![Page 33: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/33.jpg)
Analyses textuelles fines
![Page 34: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/34.jpg)
Analyses textuelles fines
glisser-déposer
![Page 35: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/35.jpg)
Analyses textuelles fines
![Page 36: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/36.jpg)
Analyses textuelles fines
![Page 37: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/37.jpg)
Analyses textuelles fines
![Page 38: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/38.jpg)
Analyses textuelles fines
![Page 39: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/39.jpg)
Analyses textuelles fines
![Page 40: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/40.jpg)
Analyses textuelles fines
sélection puisclic sur Spécifs
![Page 41: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/41.jpg)
Analyses textuelles fines
![Page 42: Analyse de textes avec TreeCloud et Lexico3](https://reader033.vdocuments.net/reader033/viewer/2022052618/554d94bdb4c90567188b5499/html5/thumbnails/42.jpg)
Analyses textuelles fines
retour au texte