de la veille àla gestion des connaissances ou la … · de la veille àla gestion des...
TRANSCRIPT
De la veille De la veille àà la gestion des connaissances la gestion des connaissances ouou
la gestion stratla gestion stratéégique de lgique de l’’information en information en rechercherecherche
Bernard DOUSSETBernard [email protected]@irit.fr
Professeur Professeur àà ll’’Institut de Recherche en Informatique de Toulouse Institut de Recherche en Informatique de Toulouse Equipe SystEquipe Systèèmes dmes d’’Information GInformation Géénnééralisralisééss
UniversitUniversitéé Paul Sabatier (Toulouse III)Paul Sabatier (Toulouse III)
06/11/2006 CNRS Aquitaine - Limousin 2
Plan de la prPlan de la préésentationsentationHistorique
Etat de l’art
Contribution
Conclusion
en veille Sci. et Tech.en analyse textuelle
en analyse exploratoireen visualisation
bilanperspectives
InteractivitéTravail en équipePrincipe général
Définitions et butsLa veille stratégique
Les méthodesLa plate-forme
06/11/2006 CNRS Aquitaine - Limousin 3
Cycle de l’intelligence économique
Scénarios
élaborer
Stratégie
choisir
Cibles
déterminer & hiérarchiser
Sources identifier & sélectionner
Informations utiles
évaluer & collecter
Informations élaborées
analyser & interpréter
Décideur
synthétiser
Connaissance
mémoriser&
organiser
valider et diffuser l’information
exogène
Connaissancediffuser l’information endogène
Connaissance
diffusionrestreinte
Veille stratégiqueSecteurs dSecteurs d’’activitactivitéé
Historique Architecture Contribution ConclusionHistoriqueDéfinitions et buts
06/11/2006 CNRS Aquitaine - Limousin 4
Etudier lEtudier l’’environnement et lenvironnement et l’é’évolutionvolution
–– Des marchDes marchééss–– Des coopDes coopéérationsrations–– Des alliancesDes alliances–– Des participationsDes participations–– De l'innovationDe l'innovation–– Des rupturesDes ruptures–– Des modesDes modes–– Des implantationsDes implantations
–– Des transferts de technologie Des transferts de technologie –– Des dDes déépôts de brevetspôts de brevets–– Des Des ééquipes de recherchequipes de recherche–– De la terminologieDe la terminologie–– Des bases documentaires Des bases documentaires –– Des publicationsDes publications–– De la publicitDe la publicitéé–– Des appels d'offresDes appels d'offres
Historique Architecture Contribution ConclusionHistoriqueDéfinitions et buts
06/11/2006 CNRS Aquitaine - Limousin 5
Le processus de veille stratLe processus de veille stratéégique comporte cinq phases : gique comporte cinq phases : –– la sla séélection des donnlection des donnéées utiles :es utiles :
•• terminologie, dates, acteurs (auteurs, organismes, paysterminologie, dates, acteurs (auteurs, organismes, pays……))
–– la prla prééparation des donnparation des donnéées :es :•• prpréé--traitements : nettoyages [Zipf49], synonymies [Porter80]traitements : nettoyages [Zipf49], synonymies [Porter80]
•• transformations : modtransformations : modèèle de reprle de repréésentation des donnsentation des donnééeses [Salton89][Salton89]
–– ll’’analyse des donnanalyse des donnéées:es:•• classifications, rclassifications, rèègles d'associations, sgles d'associations, sééquences, ...quences, ...
–– ll’’interprinterpréétation et ltation et l’é’évaluation : valuation : •• basbaséées en grande partie sur les visualisationses en grande partie sur les visualisations
–– ll’’exploitation et donc exploitation et donc la prise de dla prise de déécisioncision
Historique Architecture Contribution ConclusionHistoriqueLa veille stratégique
06/11/2006 CNRS Aquitaine - Limousin 6
Analyses multidimensionnellesAnalyses multidimensionnelles–– Fondements : Spearman & Pearson dFondements : Spearman & Pearson dèès 1904s 1904
–– Analyse canonique et ACP : [Hotteling35]Analyse canonique et ACP : [Hotteling35]
–– Analyse des correspondances : [Hirschfeld35] et [Guttman41]Analyse des correspondances : [Hirschfeld35] et [Guttman41]
–– Analyse Analyse procustprocustééennesennes : [Schonemann65]: [Schonemann65]
–– En FranceEn France•• Analyse Factorielle des Correspondances : [BenzAnalyse Factorielle des Correspondances : [Benzéécri73]cri73]
•• Analyse de deux tableaux : [Lafosse85]Analyse de deux tableaux : [Lafosse85]
•• ComplComplééments en analyse ments en analyse procustprocustééenneenne : [Fichet87]: [Fichet87]
Historique Architecture Contribution ConclusionHistoriqueL’analyse de données
06/11/2006 CNRS Aquitaine - Limousin 7
ClassificationsClassifications–– Taxonomie par CAH [Sokal63]Taxonomie par CAH [Sokal63]
–– Centres mobiles [Forgy65] Centres mobiles [Forgy65]
–– NuNuéées dynamiques [Diday71]es dynamiques [Diday71]
–– PartitionnementsPartitionnements
•• ItItéératifs : Minimisation de la coupure [KL70], [FM82] ratifs : Minimisation de la coupure [KL70], [FM82] •• Spectraux : VP de la matrice de Laplace [Hall70], [Hagen91]Spectraux : VP de la matrice de Laplace [Hall70], [Hagen91]•• MultiMulti--niveaux : regroupement + itniveaux : regroupement + itéératif ratif KMETISKMETIS [Karypis98][Karypis98]•• Stochastiques :Stochastiques : MMarkovarkov CLCLusteringustering [Van Dongen00][Van Dongen00]
Historique Architecture Contribution ConclusionHistoriqueLes classifications
06/11/2006 CNRS Aquitaine - Limousin 8
Pourquoi un systPourquoi un systèème interactif ?me interactif ? En Amont de lEn Amont de l’’analyse lanalyse l’’interactivitinteractivitéé sert sert àà ::
–– mettre au point les mettre au point les ééquations de recherchequations de recherche–– éévaluer les corpus (volume, pertinence, bruit)valuer les corpus (volume, pertinence, bruit)–– choisir et valider le ou les formats de sortiechoisir et valider le ou les formats de sortie–– superviser la collecte du corpussuperviser la collecte du corpus–– contrôler les dictionnaires (forme et volume)contrôler les dictionnaires (forme et volume)–– choisir les filtres +, choisir les filtres +, --, th, théématiques, ...matiques, ...–– valider les synonymies et lvalider les synonymies et l’’indexation (Multiindexation (Multi--termes)termes)
Historique Etat de l’art Contribution ConclusionArchitectureInteractivité
06/11/2006 CNRS Aquitaine - Limousin 9
Pourquoi un systPourquoi un systèème interactif ?me interactif ? Pendant lPendant l’’analyse elle permet deanalyse elle permet de
–– sséélectionner et contrôler les matrices de croisementlectionner et contrôler les matrices de croisement–– choisir des mchoisir des mééthodes thodes àà ddééployerployer–– piloter ces mpiloter ces mééthodes (localement ou thodes (localement ou àà distance)distance)–– extraire les connaissances via les visualisationsextraire les connaissances via les visualisations–– choisir des vues choisir des vues àà conserver conserver –– consulter les consulter les expertsexperts via le rvia le rééseauseau–– restituer lrestituer l’’analyse au analyse au ddéécideurcideur
Historique Etat de l’art Contribution ConclusionArchitectureInteractivité
06/11/2006 CNRS Aquitaine - Limousin 10
BD
Web
CD
Documentaliste
Analyste
Décideur
Expert
Serveur
Connexions entre acteurs de la veilleConnexions entre acteurs de la veille
Historique Etat de l’art Contribution ConclusionArchitectureTravail en équipe
06/11/2006 CNRS Aquitaine - Limousin 11
X
3
D
Cooc
Dico
3
Dico
1
Dico
2
Méta2°
Niv.
Corpus
4
Corpus
3
Corpus
2
1'
Corpus
1
BD
Web
CD
Méta-données
Méta-données
Méta-données
Méta-données
Méta-données
Méta-données
Historique Etat de l’art Contribution ConclusionArchitecturePrincipe général
06/11/2006 CNRS Aquitaine - Limousin 12
Historique Architecture Contribution ConclusionContributionen analyse textuelle
Extraction des dictionnairesExtraction des dictionnaires
Courbe de charge
Dictionnaire de synonymes
Dictionnaire + ou -
06/11/2006 CNRS Aquitaine - Limousin 13
• l’information explicite (exogène)• l’information implicite (endogène) • Maturité de l ’information
L’information consciente collective (Mots-clés)
L’information consciente individuelle (Free terms)
L’information inconsciente collective (Segments)
L’information inconsciente individuelle
• La terminologie émergente• Les concepts émergents
cohérence, simultanéité, consensus
Historique Architecture Contribution ConclusionContributionen analyse textuelle
Les niveaux de lLes niveaux de l’’informationinformation
06/11/2006 CNRS Aquitaine - Limousin 14
Historique Architecture Contribution ConclusionContributionen analyse textuelle
DDéétection des multitection des multi--termestermes
Dictionnaire de multi-termes
Dictionnaire de synonymes
Dictionnaire de mots vides
Seuil de détection statistique
Traitement statistique
Traitement morphologique
Traitement syntaxique
06/11/2006 CNRS Aquitaine - Limousin 15
Historique Architecture Contribution ConclusionContributionen analyse textuelle
Croisements 2DCroisements 2D
Matrice carrée
Matrice asymétrique
Filtre positif ou négatif Dictionnaire de synonymes
Courbe de charge
06/11/2006 CNRS Aquitaine - Limousin 16
Historique Architecture Contribution ConclusionContributionen analyse textuelle
Croisements 3DCroisements 3D
Troisième variable
Dictionnaire de synonymes
Filtre
06/11/2006 CNRS Aquitaine - Limousin 17
Historique Architecture Contribution ConclusionContributionen analyse textuelle
Parts de dParts de déépôts de brevets sur 20 anspôts de brevets sur 20 ans
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
Eads-%Boeing-%Airbus-%
06/11/2006 CNRS Aquitaine - Limousin 18
Historique Architecture Contribution ConclusionContributionen analyse textuelle
Classes des dClasses des déépôts de brevetspôts de brevets
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
B64 G01 H01 NOT F16 F42 B29 G05 F02 B23 F41 G02 H04 B60 G06 H03 B21 H05 H02 B32 B65 C08 B25 C23 C04 B01 F15 C22 A61
EadsBoeingAirbus
06/11/2006 CNRS Aquitaine - Limousin 19
Historique Architecture Contribution ConclusionContributionen analyse exploratoire
pour le traitement des matrices pour le traitement des matrices –– proposition de plusieurs algorithmes de trisproposition de plusieurs algorithmes de tris–– ggéénnéération supervisration superviséée de matrices de croisemente de matrices de croisement–– tableur 3D adapttableur 3D adaptéé aux matrices de grande taille (zooms 2 et 3D)aux matrices de grande taille (zooms 2 et 3D)
pour les analyses multidimensionnellespour les analyses multidimensionnelles–– visualisations interactives en 3D et 4 Dvisualisations interactives en 3D et 4 D–– synchronisation de cartes locales ou distantessynchronisation de cartes locales ou distantes–– visualisation de trajectoires et rotations visualisation de trajectoires et rotations procustprocustééennesennes (AFCM)(AFCM)
pour les classificationspour les classifications–– arbres hiarbres hiéérarchiques interactifs avec exportation des classesrarchiques interactifs avec exportation des classes–– partitionnement de graphes, graphes de classespartitionnement de graphes, graphes de classes–– segmentation pour les cartes gsegmentation pour les cartes gééographiquesographiques
06/11/2006 CNRS Aquitaine - Limousin 20
Historique Architecture Contribution ConclusionContributionen analyse exploratoire
Algorithmes de tris de matricesAlgorithmes de tris de matricesTri par classes de connexité Tri par blocs diagonaux
06/11/2006 CNRS Aquitaine - Limousin 21
Historique Architecture Contribution ConclusionContributionen analyse exploratoire
CoCo--citations de brevetscitations de brevets
B’1B’2
B1
B2
B3
06/11/2006 CNRS Aquitaine - Limousin 22
Historique Architecture Contribution ConclusionContributionen analyse exploratoire
Cartes des coordonnées en 4D
Cercle des corrélations
Synchronisation
Analyse en composantes principales (ACP)Analyse en composantes principales (ACP) Analyse en composantes principales (ACP)Analyse en composantes principales (ACP)–– ss’’applique aux donnapplique aux donnéées quantitativees quantitative
comme les tableaux individus x variablescomme les tableaux individus x variables–– elle utilise un espace relle utilise un espace rééduit de 2 duit de 2 àà 4 D4 D–– deux cartes en sont ddeux cartes en sont dééduitesduites
•• celle des coordonncelle des coordonnéées des individuses des individus•• cercle de corrcercle de corréélation des variableslation des variables
06/11/2006 CNRS Aquitaine - Limousin 23
Historique Architecture Contribution ConclusionContributionen analyse exploratoire
Analyse factorielle des correspondances (AFC)Analyse factorielle des correspondances (AFC) Analyse factorielle des correspondances (AFC)Analyse factorielle des correspondances (AFC)–– ss’’applique aux donnapplique aux donnéées qualitativeses qualitatives
comme les matrices binaires, de contingence, de cooccurrencecomme les matrices binaires, de contingence, de cooccurrence–– cc’’est un ACP sur les profilsest un ACP sur les profils–– elle ne gelle ne géénnèère qure qu’’une carteune carte–– la proximitla proximitéé entre modalitentre modalitéés des deux variables a un senss des deux variables a un sens–– on peut manipuler son peut manipuler sééparparéément la carte des colonnesment la carte des colonnes–– et exporter son azimut sur la carte complet exporter son azimut sur la carte complèètete
06/11/2006 CNRS Aquitaine - Limousin 24
Historique Architecture Contribution ConclusionContributionen analyse exploratoire
Analyse factorielle des correspondances multiple (AFCM)Analyse factorielle des correspondances multiple (AFCM) Analyse factorielle des correspondances multiple (AFCM)Analyse factorielle des correspondances multiple (AFCM)–– nous lnous l’’appliquons aux matrices de cooccurrences 3Dappliquons aux matrices de cooccurrences 3D–– la 3la 3°° variable est le plus souvent le tempsvariable est le plus souvent le temps–– LL ’’AFC peut être appliquAFC peut être appliquééee
•• àà un des tableaux (les autres sont projetun des tableaux (les autres sont projetéés)s)•• àà tous les tableaux empiltous les tableaux empilééss•• àà la somme des tableaux (la somme des tableaux ( cas statique)cas statique)
–– Chaque ligne est reprChaque ligne est repréésentsentéée par une se par une séérie de pointsrie de points–– On peut tracer des trajectoiresOn peut tracer des trajectoires
06/11/2006 CNRS Aquitaine - Limousin 25
Historique Architecture Contribution ConclusionContributionen analyse exploratoire
Analyse Analyse procustprocustééenneenne (de Procuste ou (de Procuste ou ProcrustesProcrustes))–– Celui qui allonge en tirant, devenu le symbole de lCelui qui allonge en tirant, devenu le symbole de l’’uniformituniformitéé–– "Dans la l"Dans la léégende grecque, Procruste est un bandit qui hante la route prgende grecque, Procruste est un bandit qui hante la route prèès s
d'Eleusis. Il invite des voyageurs, qud'Eleusis. Il invite des voyageurs, qu’’il il éétend sur un des deux lits qui tend sur un des deux lits qui meublent son logis, l'un trmeublent son logis, l'un trèès long, l'autre trs long, l'autre trèès court. Si l'hôte est trop s court. Si l'hôte est trop grand pour le petit lit, Procuste lui ampute les jambes, s'il ocgrand pour le petit lit, Procuste lui ampute les jambes, s'il occupe l'autre, cupe l'autre, Procuste l'Procuste l'éétire jusqu'tire jusqu'àà ce quce qu’’il cadre avec le lit."il cadre avec le lit."
06/11/2006 CNRS Aquitaine - Limousin 26
Historique Architecture Contribution ConclusionContributionen analyse exploratoire
Analyse Analyse procustprocustééenneenne
Enlever:Enlever:–– la translation moyennela translation moyenne–– la rotation moyennela rotation moyenne–– ll’’homothhomothéétie moyennetie moyenne
G1
G2 G3
G4
G1
G2 G3
G4G4
Evolution non standard
06/11/2006 CNRS Aquitaine - Limousin 27
ni
iiee hghgdBAd,1
)²(),(),( ),
,(),( lkelk
m yxdBAd Min ),
,(),( lkelk
M yxdBAd Max BA
yxdBAd k l
lke
),(),(
Historique Architecture Contribution ConclusionContributionen analyse exploratoire
Niveau de coupure à 4 classesNiveau de coupure à 8 classes
Classification ascendante hiClassification ascendante hiéérarchique (CAH)rarchique (CAH) Classification ascendante hiClassification ascendante hiéérarchique (CAH)rarchique (CAH)–– mmééthode non supervisthode non supervisééee–– on a le choix de la distance (euclidienne, inf, on a le choix de la distance (euclidienne, inf, supsup, , moymoy, , ……))–– elle part des elle part des ééllééments disjoints et agrments disjoints et agrèège les plus prochesge les plus proches–– elle construit des classes imbriquelle construit des classes imbriquééeses–– la hila hiéérarchie peut être reprrarchie peut être repréésentsentéée par un e par un dendogrammedendogramme–– plusieurs niveaux de coupure sont possiblesplusieurs niveaux de coupure sont possibles
06/11/2006 CNRS Aquitaine - Limousin 28
Historique Architecture Contribution ConclusionContributionen analyse exploratoire
Classification par partition CPP (Centres mobiles)Classification par partition CPP (Centres mobiles)
–– supervissupervisééee–– k classesk classes–– 1 repr1 repréésentantsentant–– choix en 3D choix en 3D –– colorationcoloration–– icônesicônes–– 4 classes4 classes–– 6 classes6 classes
06/11/2006 CNRS Aquitaine - Limousin 29
Historique Architecture Contribution ConclusionContributionen visualisation
faibles.
Distribution linéaire
Choix d’une échelle non linéaire
Mise en évidence de signaux faibles
Sélection des données
Evolution de la coloration
Cartes gCartes gééostratostratéégiquesgiques
06/11/2006 CNRS Aquitaine - Limousin 30
Carte pondérée par le PNB
Historique Architecture Contribution ConclusionContributionen visualisation
Carte en valeurs absolues Carte pondérée par la population
Carte pondérée par la superficie
Choix de la pondération
PondPondéération par des donnration par des donnéées externeses externes
06/11/2006 CNRS Aquitaine - Limousin 31
–– Les cinq continents : Les cinq continents : •• Afrique, Asie, AmAfrique, Asie, Améérique, ...rique, ...
–– Des sous continents : Des sous continents : •• AmAméérique du sud, ...rique du sud, ...
–– Des zones remarquablesDes zones remarquables•• G7, Bassin mG7, Bassin mééditerranditerranééen, en, ……
–– Des zones dDes zones d’’influence influence ééconomique, conomique,
–– Des zones de prospection, ...Des zones de prospection, ...
Historique Architecture Contribution ConclusionContributionen visualisation
Choix de la zone géographique
Zones géographiques paramétrables
Vues partielles prVues partielles prééddééfinies ou paramfinies ou paraméétrablestrables
06/11/2006 CNRS Aquitaine - Limousin 32
Etude de lEtude de l’é’évolution par animationvolution par animation–– en fonction du temps: matrice PAen fonction du temps: matrice PA--DPDP
–– par dpar dééfilement de chaque variablefilement de chaque variable
–– par spar séélection de groupes de variableslection de groupes de variables
–– en mode absolu ou relatifen mode absolu ou relatif
–– en fonction du codageen fonction du codage
–– en fonction du niveau de coupure (CAH)en fonction du niveau de coupure (CAH)
Historique Architecture Contribution ConclusionContributionen visualisation
06/11/2006 CNRS Aquitaine - Limousin 33
Historique Architecture Contribution ConclusionContributionen visualisation
.
Exportation d’une classification
Niveau de coupureEffectifs des classes
Carte en mode relatif : étude de tendances
Pays non présents dans la dernière période
Pays en récession
Pays en forte croissance
Segmentation et importation de classesSegmentation et importation de classes
06/11/2006 CNRS Aquitaine - Limousin 34
Placement initial aléatoire
Historique Architecture Contribution ConclusionContributionen visualisation
.
Placement circulaire en fonction d’un triConvergence rapide du placement des sommets Dessins de graphesDessins de graphes
kdavvf
aijij
jia
,
rij
jir dkvvf
²),(
Algorithme de [Fruchterman91]
Attraction :
Répulsion :
06/11/2006 CNRS Aquitaine - Limousin 35
Historique Architecture Contribution ConclusionContributionen visualisation
Graphe partitionné
Graphe des classes Partitionnement MCLPartitionnement MCL
Extraction des classes
06/11/2006 CNRS Aquitaine - Limousin 36
Historique Architecture Contribution ConclusionContributionen visualisation
Evolution dEvolution d’’un graphe Iun graphe I
06/11/2006 CNRS Aquitaine - Limousin 37
Historique Architecture Contribution ConclusionContributionen visualisation
Evolution dEvolution d’’un graphe IIun graphe II
06/11/2006 CNRS Aquitaine - Limousin 38
Historique Architecture Contribution ConclusionContributionen visualisation
Morphing de grapheMorphing de graphe
Repère
temporel 3
Repère
temporel 4
Repère
temporel 2
Repère
temporel 1
Repère
temporel 1
Repère
temporel 2Repère
temporel 3
Repère
temporel 4
06/11/2006 CNRS Aquitaine - Limousin 39
Historique Architecture Contribution ConclusionConclusionBilan
Philosophie de notre platePhilosophie de notre plate--forme Tforme Téétralogietralogie–– cc’’est un ensemble cohest un ensemble cohéérent de rent de prototypesprototypes interinter--opopéérants,rants,–– qui utilise unqui utilise un standard uniquestandard unique pour le format des donnpour le format des donnéées, es, –– sonson interface graphiqueinterface graphique est homogest homogèène,ne,–– elle permet le partage des ressources et des melle permet le partage des ressources et des mééthodes thodes via le rvia le rééseauseau
Son utilisation en rechercheSon utilisation en recherche–– support dsupport d’é’évaluationvaluation de mde mééthodes, dthodes, d’’outils et de produits doutils et de produits d’’IE,IE,–– vaste base dvaste base d’’exemples, exemples, àà ll’’ééchellechelle, d, dééjjàà analysanalyséés.s.
Domaine dDomaine d’’application : la veille stratapplication : la veille stratéégiquegique–– veille veille scientifiquescientifique ((scientomscientoméétrietrie, indicateurs, , indicateurs, éévaluation)valuation)–– veille veille technologiquetechnologique (propri(propriééttéé industrielle, produits, procindustrielle, produits, procééddéés)s)–– veille veille ééconomiqueconomique (march(marchéés, concurrents, substituts, s, concurrents, substituts, ……))
De la veille De la veille àà la gestion des connaissances la gestion des connaissances ouou
la gestion stratla gestion stratéégique de lgique de l’’information en information en rechercherecherche
Bernard DOUSSETBernard [email protected]@irit.fr
Professeur Professeur àà ll’’Institut de Recherche en Informatique de Toulouse Institut de Recherche en Informatique de Toulouse Equipe SystEquipe Systèèmes dmes d’’Information GInformation Géénnééralisralisééss
UniversitUniversitéé Paul Sabatier (Toulouse III)Paul Sabatier (Toulouse III)