analyse exploratoire d’entrevues de groupe : quand alceste, dtm, lexico et sato se donnent la main

60
1 Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main François Daoust Gaëlle Dobrowolski Monique Dufresne Claire Gélinas-Chebat JADT 2006 – Besançon

Upload: foy

Post on 05-Jan-2016

29 views

Category:

Documents


5 download

DESCRIPTION

Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main. François Daoust Gaëlle Dobrowolski Monique Dufresne Claire Gélinas-Chebat. JADT 2006 – Besançon. OBJECTIFS. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

1

Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM,

LEXICO et SATO se donnent la main

François Daoust

Gaëlle Dobrowolski

Monique Dufresne

Claire Gélinas-Chebat

JADT 2006 – Besançon

Page 2: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

2

OBJECTIFS

Page 3: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

3

• 1 : Montrer comment on peut combiner plusieurs logiciels de lexicométrie (ALCESTE, DTM et LEXICO3) pour valider et compléter une analyse SATO.

Page 4: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

4

• 2 : Mettre à l'épreuve des chaînes de traitement qui font appel à des passerelles de conversion développées dans le contexte du réseau ATONET.

Page 5: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

5

CONTEXTE DE LA

RECHERCHE : ATONET

Page 6: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

6

Les trois volets d’ATONET

• méthodologie et partage de corpus• formats d'échange de documents

électroniques• terminologie de l'analyse des

données textuelles

Page 7: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

7

CORPUS

Page 8: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

8

• Entrevues enregistrées de neuf groupes de jeunes rencontrés à Rennes en 2000 (48 jeunes Français)

Corpus Gallopel

Page 9: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

9

• Chacun des 9 groupes comprend 5 à 6 jeunes et un intervenant :

– âgés entre 15 à 25 ans

– fumeurs et non fumeurs – hommes et femmes

Page 10: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

10

Entrevues semi dirigées

• 1 Discussion précédée d’une période de familiarisation avec le tabagisme

• 2 Discussion suite à l’introduction d’une brochure

Page 11: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

11

ANALYSE AVEC SATO:

Nature

Page 12: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

12

• Analyse sémantico statistique basée sur une construction itérative d’une grille catégorielle

Page 13: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

13

ANALYSE AVEC SATO :

Démarche

Page 14: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

14

Démarche (1)

• Comparaison de lexiques associés à des sous-textes établis selon :

– sexe

– fumeur / non-fumeur

– avant / après message anti-tabac

Page 15: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

15

Démarche (2)

• Indices statistiques simples :

– Distance du Chi2

– Mesure d'écart à la moyenne

Page 16: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

16

ANALYSE AVEC SATO :

Étapes

Page 17: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

17

Étapes (1)

Va et vient entre les données lexicales brutes et leurs contextes d’utilisation (Kwic):

1. Approche univariée : saisir la spécificité de la stratification induite par chacune des variables sociologiques

2. Approche multivariée : tenir compte de l’interaction de ces variables

Page 18: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

18

Étapes (2)

• Émergence d'une grille catégorielle sémantique :– apparence, arrêt, négation, concret,

danger, dépendance, soc-je*, maladie, mort, plaisir, …

– soc-ami, soc-famille, soc-gens, soc-jeune, liberté, envie, conscience, volonté, …

*(Le préfixe soc- renvoie à un ensemble de catégories

référant aux rapports sociaux identifiés par les jeunes.)

Page 19: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

19

ANALYSES AVEC SATO :

Conclusions

Page 20: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

20

Conclusions (1)

• Construction d'une grille

catégorielle transparente et respectueuse de la spécificité du contexte d'énonciation.

Page 21: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

21

Conclusions (2)

• Démarche itérative combinant :– une approche inductive (qualitative) – une utilisation d'outils simples de

statistique lexicale– une approche plus sensible à la

pragmatique textuelle.

Page 22: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

22

Conclusions (3)

• Production de données qualifiées (catégories) qui traduisent la démarche interprétative de l’analyste

Page 23: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

23

VALIDATION

Page 24: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

24

• Validation de notre démarche et de nos résultats par divers logiciels de statistique textuelle :

– ALCESTE (Reinert)

– LEXICO 3 (Salem)

– DTM (Lebart)

Page 25: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

25

Chaîne de traitement (1)

Format initial des données : balises SATO (propriétés)– identification du locuteur et des

caractéristiques sociologiques

– identification des sections pré ou post «brochure».

Page 26: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

26

Chaîne de traitement (2)

*page=gallo02/11

*pub=brochure *locuteur=s36

*fumeur=non *sexe=h Bah, la brochure là, elle nous présente ce qui nous attend si on fume. Mais c ’est très… quoi, moi j ’ai lu ça, mais je ne sais pas je ne suis pas fumeur, donc je ne ressens peut-être pas ça de la même façon..

Page 27: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

27

Chaîne de traitement (3)

• Passerelle en Perl pour exporter le corpus en XML-TEI

• Conversion de la version TEI vers les formats propriétaires ALCESTE, LEXICO et DTM

Page 28: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

28

ANALYSE AVEC

ALCESTE

Page 29: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

29

ALCESTE (1)

• méthode complètement automatique qui vise à faire émerger des mondes lexicaux

• s'appuie sur des régularités statistiques pour faire émerger la structure du discours à partir des énoncés(Avec SATO, nous étions partis d'hypothèses structurantes du discours pour faire parler les données)

Page 30: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

30

ALCESTE (2)

•Résultats corpus Initial* : deux classes– Classe 1 (1/3 des UCE) :

• surtout les interventions exprimées après l'exposition au message antitabac (Chi2=33.82).

• plus faiblement une présence significative des UCE des non-fumeurs

*(transcription des entrevues dans leur découpage original en interventions; sont exclues les interventions des intervenants)

Page 31: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

31

ALCESTE (3)

– Classe 2 (2/3 des UCE) : • surtout des interventions précédant la

présentation du message antitabac (Chi2=33.82)

• aussi, mais plus faiblement, une présence significative des UCE des fumeurs (Chi2=8.81)

Page 32: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

32

ALCESTE (4)Formes représentatives de la classe n°1

Chi2 u.c.e. dans la classe Formes réduites

100.00 51 cancer+ 93.85 38 image+ 83.51 31 choc+ 82.20 38 poumon+ 81.60 35 choqu+er 73.64 42 preventi+f 61.71 23 routier+ 53.58 20 temoign+23 53.47 107 voir. 50.88 19 tele 49.69 39 pub+ 46.79 22 femme+ 45.39 24 mort+ 42.83 23 mourir. 42.16 46 tabac+

Formes représentatives de la classe n°2Chi2 u.c.e. dans la classe Formes réduites102.21 446 fum+er 68.65 233 arret+er 28.50 95 commenc+er 28.44 170 fum+eur 22.54 64 essa+yer 21.46 87 envi+e 20.22 69 arrete+ 19.36 108 cigarette+ 17.11 61 paquet+ 16.34 64 volonte+ 16.04 68 prendre.

Page 33: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

33

ALCESTE (5)

• CONCLUSIONS :– ALCESTE confirme que la variable

avant/après le message antitabac représente le premier élément de structuration du corpus, ce qui constitue pour nous le résultat le plus significatif.

– ALCESTE relève la présence de l’opposition fumeur/non-fumeur, deuxième variable prise en compte dans l'analyse SATO.

Page 34: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

34

ALCESTE (6)

– ALCESTE a donc retrouvé ce que nous avions observé lors de la comparaison de lexiques construits sur la base d’un découpage global du corpus.

– Ce point de rencontre entre les approches ascendantes et descendantes est un outil important de validation de l’interprétation.

Page 35: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

35

ANALYSE AVEC LEXICO O

Page 36: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

36

LEXICO (1)

• LEXICO : – calcule les spécificités

lexicométriques de parties d'un corpus d'après un modèle probabiliste basé sur la loi hypergéométrique (cf. Lebart, Salem 1994)

– rend possibles des analyses factorielles de correspondances (AFC) sur un corpus partitionné

Page 37: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

37

LEXICO (2)

• Première approche :

– Analyse du corpus Participant* : découpage du corpus selon le profil des répondants

*(ensemble des interventions de chaque participant identifié par un nom résumant son profil et suffixé par a ou b pour identifier le discours du participant avant et après le message antitabac; Élimination des participants dont le profil sociologique est incomplet)

Page 38: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

38

Corpus Participant : individus sur le plan des 2 premiers axes de l'AFC

Page 39: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

39

Lexico (4)

• Deuxième approche : – calcul des spécificités reportées sur la

sortie de l'analyseur DISTANCE de SATO appliqué au lexique avant et après la brochure.

Page 40: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

40

Lexico (5)Comparaison entre les spécificités et la distance du Chi2

Fréqtot avant après explique cumul 0.08 0.15 0.03 0.55 0.55 clair * (lexico 6) 0.05 0.00 0.09 0.50 1.05 brochure 0.25 0.37 0.17 0.49 1.54 aussi * (lexico 6) 0.46 0.60 0.36 0.40 1.94 t' * (lexico 5) 0.07 0.12 0.03 0.39 2.33 santé * (lexico 5) 0.77 0.95 0.64 0.39 2.72 ouais * (lexico 3) 0.02 0.04 0.00 0.32 3.03 appelle * (lexico 4) 0.05 0.01 0.09 0.31 3.35 risques (lexico -5) 0.06 0.10 0.03 0.31 3.66 dépendance * (lexico 5) 0.06 0.10 0.03 0.31 3.96 plaisir * (lexico 5) 1.65 1.88 1.49 0.30 4.26 je * (lexico 3) 0.02 0.05 0.00 0.28 4.54 doigts * (lexico 4) 0.01 0.03 0.00 0.26 4.80 odeur * (lexico 4) 0.16 0.09 0.21 0.25 5.05 elle (lexico -5) 0.11 0.06 0.15 0.24 5.30 beaucoup (lexico -3) 0.03 0.00 0.05 0.24 5.53 lire (lexico -4) 0.13 0.18 0.09 0.23 5.76 toi * (lexico 4) 0.01 0.03 0.00 0.23 5.99 3ème * (lexico 3) 0.03 0.00 0.04 0.23 6.22 témoignage 0.05 0.09 0.03 0.22 6.44 grave * (lexico 3) 0.42 0.32 0.49 0.22 6.66 ! 0.26 0.33 0.20 0.22 6.88 ben * (lexico 3) 0.08 0.04 0.11 0.21 7.09 " 0.61 0.49 0.69 0.21 7.30 - 0.44 0.34 0.51 0.21 7.50 peut (lexico -3) 0.02 0.03 0.00 0.20 7.70 caractère * (lexico 3)

Page 41: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

41

Lexico (6)

• Conclusion :– Très large recouvrement entre les formes

lexicales qui contribuent le plus à la distance et les spécificités calculées par LEXICO :

• parmi les mots manquants, il y a les ponctuations qui, apparemment, ne sont pas prises en compte par LEXICO, de même que les formes absentes dans le corpus Avant

• la mesure de spécificité de LEXICO fournit un bon complément à la DISTANCE du Chi2 par l'ajout d'un seuil statistique

Page 42: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

42

ANALYSE AVEC DTM

Page 43: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

43

DTM (1)

• DTM :– Outil dédié à l’analyse exploratoire de

données numériques multivariées et de données textuelles (par exemple un sondage avec questions ouvertes et fermées)

– Comptage des mots du texte brut produisant des variables représentant le nombre d’occurrences du mot

Page 44: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

44

DTM (2)

• Expérimentation # 1 :– Analyse du corpus Participant : le corpus

est vu comme un ensemble de 87 individus.

• Le profil sociologique est enregistré comme autant de réponses catégorielles à des questions fermées : pub (nil, brochure), sexe (homme, femme) et fumeur (non, oui).

• Les interventions avant et après le message antitabac donnent lieu à deux questionnaires distincts.

• L'ensemble des interventions d'un individu pour chaque questionnaire constitue la réponse à une question ouverte unique.

Page 45: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

45

Corpus Participant : variables catégorielles sur le plan des 2 premiers axes de l'AFC

Page 46: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

46

DTM (4)

• Confirmation de l'influence du message antitabac et des variables catégorielles sur la structure du discours

Page 47: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

47

DTM (5)

• Expérimentation # 2 :– Production d'un corpus artificiel

(Participant catégorisé) par substitution des catégories aux unités lexicales catégorisées

Page 48: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

48

DTM (6)

– Calcul de l'AFC en croisant :• les 87 participants avec 702 variables textuelles, soit les

formes lexicales non catégorisées et catégorisées sémantiquement (propriété thème).

Cette substitution recouvre 12,26 % des occurrences.

Page 49: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

49

Corpus Participant catégorisé: variables catégorielles sur le plan des 2 premiers axes de l'AFC

Page 50: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

50

DTM (8)

• La projection des variables sociologiques sur le plan factoriel suit le même jeu d'oppositions

Page 51: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

51

DTM (9)

• Expérimentation # 3 :

– Production d'un autre corpus artificiel (Participant réduit) par substitution des catégories à toutes les unités lexicales

Page 52: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

52

DTM (10)– Calcul de l'AFC en croisant :

• les 87 participants avec 29 variables textuelles, soit l’ensemble des occurrences du corpus Initial

Les 28 catégories utiles représentent un peu plus de 12% des occurrences.

Page 53: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

53

Corpus Participant réduit : variables catégorielles et lexique sur le plan des 2 premiers axes de l'AFC

Page 54: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

54

DTM (12)

• Visualisation simultanée du lexique des catégories et les modalités des questions fermées: – répartition aux quatre points cardinaux des

catégories les plus excentriques : apparence, dépendance, coûts, éducation, mort et soc-ami

– concentration des catégories banales (qui constituent les référents communs du discours) au centre du plan

Page 55: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

55

DTM (13)

• Outil de validation de la construction de la grille de catégories lexicales

• La visualisation des catégories sémantiques dans le plan factoriel ouvre aussi de nouvelles fenêtres d'investigation pour revenir aux contextes et affiner la grille si nécessaire

Page 56: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

56

CONCLUSIONS

Page 57: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

57

• Cette première utilisation combinée de logiciels d'analyse textuelle a été grandement facilitée par les protocoles d'échange de données réalisées par le réseau ATONET.

Page 58: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

58

• Il est possible de créer de multiples chaînes de traitement qui permettent de reconfigurer les données et de faire appel aux points forts de chaque logiciel.

Page 59: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

59

• Par la combinaison des méthodes d'analyse :– plus grande fiabilité des conclusions en fournissant

des moyens de corroborer ou d'infirmer des hypothèses et des conclusions

– aller au-delà des impressions et des commentaires descriptifs pour produire des représentations de discours sociaux susceptibles d'agir comme modèles

Page 60: Analyse exploratoire d’entrevues de groupe : quand ALCESTE, DTM, LEXICO et SATO se donnent la main

60

Merci de votre attention.