à de la veille conomique é le data mining et le text ... · contribution en analyse exploratoire...

32
De la veille De la veille à à l l intelligence intelligence é é conomique conomique : : le Data Mining et le Text Mining le Data Mining et le Text Mining Bernard DOUSSET Bernard DOUSSET [email protected] [email protected] http://atlas.irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Syst Equipe Syst è è mes d mes d Information G Information G é é n n é é ralis ralis é é s (SIG) s (SIG) Universit Universit é é Paul Sabatier (Toulouse III) Paul Sabatier (Toulouse III)

Upload: others

Post on 03-Oct-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

De la veille

De la veille àà

ll ’’intelligence

intelligence ééconomique

conomique::

le Data M

ining et le Text Mining

le Data M

ining et le Text Mining

Ber

nar

d D

OU

SSET

Ber

nar

d D

OU

SSET

douss

et@

irit.fr

douss

et@

irit.fr

http://a

tlas

.irit.fr

http://a

tlas

.irit.fr

Inst

itut de

Rec

her

che

en Info

rmat

ique

de

Toulo

use

(IR

IT)

Inst

itut de

Rec

her

che

en Info

rmat

ique

de

Toulo

use

(IR

IT)

Equip

e Syst

Equip

e Syst

èèm

es d

mes

d’’ I

nfo

rmat

ion G

Info

rmat

ion G

éénnééra

lis

ralis éé

s (S

IG)

s (S

IG)

Univ

ersi

tU

niv

ersi

t ééPau

l Sab

atie

r (T

oulo

use

III

)Pau

l Sab

atie

r (T

oulo

use

III

)

Page 2: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

2

Pla

n d

e la

pr

Pla

n d

e la

pr éé

senta

tion

senta

tion

Historique

Architecture

Contribution

Conclusion

en analyse textuelle

en analyse exploratoire

en géostratégie

en dessin de graphes

bilan

perspectives

Interactivité

Travail en équipe

Principe général

Définitions et buts

La veille stratégique

Le multidimensionnel

Les classifications

Page 3: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

3

Cycle de

l’intelligence

économique

Scé

nar

ios

élab

ore

r

Strat

égie

chois

ir

Cib

les

dét

erm

iner

& h

iéra

rchis

er

Sourc

esid

entifier

&

séle

ctio

nner

Info

rmat

ions

utile

s

éval

uer

& c

ollec

ter

Info

rmat

ions

élab

oré

es

anal

yse

r &

inte

rpré

ter

Déc

ideu

r

synth

étis

er

Connai

ssan

ce

mém

orise

r

&

org

anis

er

val

ider

et diffu

ser

l’in

form

atio

n

exogèn

e

Connai

ssan

cediffu

ser l’in

form

atio

n

endogèn

eConnai

ssan

ce

diffu

sion

rest

rein

te

Veille stratégique

Sec

teurs

dSec

teurs

d’’ a

ctiv

itac

tivitéé

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Historique

Définitions et buts

Page 4: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

4

��Etu

die

r l

Etu

die

r l ’’en

vironnem

ent et

len

vironnem

ent et

l’é’é

volu

tion

volu

tion

––D

es m

arch

Des

mar

chééss

––D

es c

oop

Des

coopééra

tions

rations

––D

es a

llia

nce

sD

es a

llia

nce

s

––D

es fusions

Des

fusions

––D

es a

cquisitio

ns

Des

acq

uisitio

ns

––D

es p

artici

pat

ions

Des

par

tici

pat

ions

––D

es im

pla

nta

tions

Des

im

pla

nta

tions

––D

e l'i

nnovat

ion

De

l'innovat

ion

––D

es ruptu

res

Des

ruptu

res

––D

es tra

nsf

erts d

e te

chnolo

gie

D

es tra

nsf

erts d

e te

chnolo

gie

––D

es d

Des

déépôts d

e bre

vet

spôts d

e bre

vet

s

––D

es

Des

ééquip

es d

e re

cher

che

quip

es d

e re

cher

che

––D

e la

ter

min

olo

gie

De

la ter

min

olo

gie

––D

es sourc

es d

Des

sourc

es d

’’ info

rmat

ion

info

rmat

ion

––D

es p

ublica

tions

Des

publica

tions

––D

e la

mode

De

la m

ode

––D

e la

publici

tD

e la

publici

t éé

––D

es a

ppel

s d'o

ffre

sD

es a

ppel

s d'o

ffre

s

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Historique

Définitions et buts

Page 5: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

5

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Historique

Définitions et buts

��D

epuis

toute

s le

s so

urc

es d

Dep

uis

toute

s le

s so

urc

es d

’’ info

rmat

ion

info

rmat

ion éé

lect

roniq

ue

lect

roniq

ue

––B

ases

bib

liogra

phiq

ues

Bas

es b

ibliogra

phiq

ues

––W

eb o

f sc

ience

(SCI)

Web

of sc

ience

(SCI)

––Pas

cal, F

ranci

s (C

NRS)

Pas

cal, F

ranci

s (C

NRS)

––Chem

ical

abstra

ct , B

iosis

Chem

ical

abstra

ct , B

iosis

––Curren

t Conte

nts, In

spec

, Curren

t Conte

nts, In

spec

,

––Cnki, C

qvip

(Chin

e),

Cnki, C

qvip

(Chin

e), ……

––Ser

veu

rs sp

Ser

veu

rs spééci

alis

cial

isééss

––D

ialo

g, Stn

Dia

log, Stn

––Q

ues

tel, D

erw

ent,

Ques

tel, D

erw

ent, ……

––Pre

sse

Pre

sse

––Fac

tiva,

Journ

aux

Fac

tiva,

Journ

aux éé

lect

roniq

ues

lect

roniq

ues

––A

fp, Reu

ters

, A

fp, Reu

ters

, ……

––In

tern

etIn

tern

et

––Bre

vet

s : U

spto

, Esp

@ce

net

Bre

vet

s : U

spto

, Esp

@ce

net

––Bio

: Pubm

ed, Bio

spac

eBio

: Pubm

ed, Bio

spac

e

––Pag

es w

eb, site

s w

ebPag

es w

eb, site

s w

eb

––Blo

gs, n

ews

Blo

gs, n

ews --

gro

ups

gro

ups

––Flu

x R

SS,

Flu

x R

SS, ……

––In

tran

etIn

tran

et

––SI pro

pri

SI pro

priééta

ire/

SG

BD

taire/

SG

BD

––D

ata

war

ehouse

Dat

a w

areh

ouse

––In

dex

atio

ns

Index

atio

ns

––W

ebW

eb-- logs

logs

––M

ails, Strea

ms,

Mai

ls, Strea

ms, ……

Page 6: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

TETR

ALO

GIE

6

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Historique

Définitions et buts

��In

form

atio

n e

xplici

teIn

form

atio

n e

xplici

te

��In

form

atio

n im

plici

teIn

form

atio

n im

plici

te

09/0

2/2

009

Page 7: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

TETR

ALO

GIE

7

•l’in

form

atio

n e

xplici

te (ex

ogèn

e)

•l’in

form

atio

n im

plici

te (en

dogèn

e)

•M

aturité

de

l’info

rmat

ion

L’info

rmat

ion c

onsc

iente

collec

tive

(CC)

L’info

rmat

ion c

onsc

iente

indiv

iduel

le (CI)

L’info

rmat

ion inco

nsc

iente

collec

tive

(IC)

L’info

rmat

ion inco

nsc

iente

indiv

iduel

le (II

)

•La

term

inolo

gie

ém

ergen

te

•Les

conce

pts

ém

ergen

ts

cohér

ence

, sim

ultan

éité

, co

nse

nsu

s

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Historique

Définitions et buts

09/0

2/2

009

Page 8: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

8

��Le

pro

cess

us de

vei

lle

stra

tLe

pro

cess

us de

vei

lle

stra

t éégiq

ue

com

porte

5 p

has

es :

giq

ue

com

porte

5 p

has

es :

––la

sla

sééle

ctio

n d

es d

onn

lect

ion d

es d

onnéées

utile

s :

es u

tile

s :

••te

rmin

olo

gie

, dat

es, ac

teurs

(au

teurs

, org

anis

mes

, pay

ste

rmin

olo

gie

, dat

es, ac

teurs

(au

teurs

, org

anis

mes

, pay

s ……))

––la

pr

la p

r éépar

atio

n d

es d

onn

par

atio

n d

es d

onnéées

:es

:

••pr

pr éé

-- tra

item

ents

: n

etto

yag

es [Zip

f49], synonym

ies [P

orter

80]

trai

tem

ents

: n

etto

yag

es [Zip

f49], synonym

ies [P

orter

80]

••tran

sform

atio

ns : m

od

tran

sform

atio

ns : m

odèèle

de

repr

le d

e re

pr éé

senta

tion d

es d

onn

senta

tion d

es d

onnééeses

[Sal

ton89]

[Sal

ton89]

––ll ’’an

alyse

des

donn

anal

yse

des

donnéées

:es

:

••cl

assi

fica

tions, r

clas

sifica

tions, rèègle

s d'ass

oci

atio

ns, s

gle

s d'ass

oci

atio

ns, s

ééquen

ces, ...

quen

ces, ...

––ll ’’in

terp

rin

terp

r ééta

tion e

t l

tation e

t l ’é’éval

uat

ion :

val

uat

ion :

••bas

bas

éées

en g

rande

par

tie

sur le

s vis

ual

isat

ions

es e

n g

rande

par

tie

sur le

s vis

ual

isat

ions

––ll ’’ex

plo

itat

ion e

t donc

explo

itat

ion e

t donc

la p

rise

de

dla

prise

de

dééci

sion

cisi

on

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Historique

La veille stratégique

Page 9: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

9

��Les

anal

yse

s m

ultid

imen

sionnel

les

Les

anal

yse

s m

ultid

imen

sionnel

les

––Fondem

ents

: S

pea

rman

& P

ears

on d

Fondem

ents

: S

pea

rman

& P

ears

on d

èès 1904

s 1904

––A

nal

yse

can

oniq

ue

et A

CP : [H

ottel

ing35]

Anal

yse

can

oniq

ue

et A

CP : [H

ottel

ing35]

––A

nal

yse

des

corres

pondan

ces : [H

irsc

hfe

ld35] et

[G

uttm

an41]

Anal

yse

des

corres

pondan

ces : [H

irsc

hfe

ld35] et

[G

uttm

an41]

––A

nal

yse

pro

cust

Anal

yse

pro

cust

ééen

nes

: [Sch

onem

ann65]

ennes

: [Sch

onem

ann65]

––En F

rance

En F

rance

••A

nal

yse

Fac

toriel

le d

es C

orr

espondan

ces : [B

enz

Anal

yse

Fac

toriel

le d

es C

orr

espondan

ces : [B

enzéécr

i73]

cri7

3]

••A

nal

yse

de

deu

x tab

leau

x : [Laf

oss

e85]

Anal

yse

de

deu

x tab

leau

x : [Laf

oss

e85]

••C

om

pl

Com

pl éé

men

ts e

n a

nal

yse

pro

cust

men

ts e

n a

nal

yse

pro

cust

ééen

ne

: [F

ichet

87]

enne

: [F

ichet

87]

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Historique

Le multidimensionnel

Page 10: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

10

��Cla

ssific

atio

ns

Cla

ssific

atio

ns

––Tax

onom

ie p

ar C

AH

[Sokal

63]

Tax

onom

ie p

ar C

AH

[Sokal

63]

––Cen

tres

mobiles

[Forg

y65]

Cen

tres

mobiles

[Forg

y65]

––N

uN

uéées

dynam

iques

[D

iday

71]

es d

ynam

iques

[D

iday

71]

––Par

titionnem

ents

Par

titionnem

ents

••ItItééra

tifs

: M

inim

isat

ion d

e la

coupure

[K

L70], [FM

82]

ratifs

: M

inim

isat

ion d

e la

coupure

[K

L70], [FM

82]

••Spec

trau

x : V

P d

e la

mat

rice

de

Lap

lace

[H

all7

0], [H

agen

91]

Spec

trau

x : V

P d

e la

mat

rice

de

Lap

lace

[H

all7

0], [H

agen

91]

••M

ulti

Multi --niv

eaux : reg

roupem

ent + it

niv

eaux : reg

roupem

ent + it éé

ratif

ratif K

METIS

KM

ETIS

[Kar

ypis

98]

[Kar

ypis

98]

••Sto

chas

tiques

:Sto

chas

tiques

:MM

arkov

arkov

CL

CLust

erin

g [V

an D

ongen

00]

ust

erin

g [V

an D

ongen

00]

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Historique

Les classifications

Page 11: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

11

Pourq

uoi un syst

Pourq

uoi un syst

èèm

e in

tera

ctif?

me

inte

ract

if?

��En A

mont de

lEn A

mont de

l ’’an

alyse

lan

alyse

l’’ inte

ract

ivit

inte

ract

ivitéé

sert

sert àà

::

––ch

oisir les

sourc

es d

choisir les

sourc

es d

’’ info

rmat

ion

info

rmat

ion

––m

ettre

au p

oin

t le

s m

ettre

au p

oin

t le

s ééquat

ions de

rech

erch

equat

ions de

rech

erch

e

––ééval

uer

les

corp

us (v

olu

me,

per

tinen

ce, bru

it)

val

uer

les

corp

us (v

olu

me,

per

tinen

ce, bru

it)

––ch

oisir e

t val

ider

le

form

at o

ptim

al d

e so

rtie

choisir e

t val

ider

le

form

at o

ptim

al d

e so

rtie

––su

per

viser

la

collec

te d

u c

orp

us

super

viser

la

collec

te d

u c

orp

us

––co

ntrôle

r le

s dic

tionnai

res (form

e et

volu

me)

contrôle

r le

s dic

tionnai

res (form

e et

volu

me)

––ch

oisir les

filtres

(+ e

t ch

oisir les

filtres

(+ e

t -- , th

, th

éém

atiq

ues

, gra

nula

rit

mat

iques

, gra

nula

rit éé

, ...)

, ...)

––val

ider

les

synonym

ies et

lval

ider

les

synonym

ies et

l’’ index

atio

n (M

ulti

index

atio

n (M

ulti --te

rmes

)te

rmes

)

His

torique

Eta

t de

l’ar

tContrib

ution

Concl

usion

Architecture

Interactivité

Page 12: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

12

Pourq

uoi un syst

Pourq

uoi un syst

èèm

e in

tera

ctif?

me

inte

ract

if?

��Pen

dan

t l

Pen

dan

t l ’’an

alyse

elle

per

met

de

anal

yse

elle

per

met

de

––ss éé

lect

ionner

et co

ntrôle

r le

s m

atrice

s de

crois

emen

tle

ctio

nner

et co

ntrôle

r le

s m

atrice

s de

crois

emen

t

––ch

oisir les

mch

oisir les

mééth

odes

th

odes

ààddééplo

yer

plo

yer

––pilote

r ce

s m

pilote

r ce

s m

ééth

odes

(lo

cale

men

t ou

thodes

(lo

cale

men

t ou àà

dista

nce

)dista

nce

)

––ex

trai

re les

connai

ssan

ces via

les

visual

isat

ions

extrai

re les

connai

ssan

ces via

les

visual

isat

ions

––ch

oisir les

vues

ch

oisir les

vues

ààco

nse

rver

co

nse

rver

––co

nsu

lter

les

co

nsu

lter

les

exper

tsex

per

tsvia

le

rvia

le

r éése

ause

au

––re

stituer

lre

stituer

l’’ a

nal

yse

au

anal

yse

au dd

ééci

deu

rci

deu

r

His

torique

Eta

t de

l’ar

tContrib

ution

Concl

usion

Architecture

Interactivité

Page 13: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

13

BD

Web

CD

Docu

men

taliste

Anal

yste

Déc

ideu

r

Exper

t

Ser

veu

r

��Connex

ions en

tre

acte

urs

de

la v

eille

Connex

ions en

tre

acte

urs

de

la v

eille

His

torique

Eta

t de

l’ar

tContrib

ution

Concl

usion

Architecture

Travail en équipe

Page 14: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

14

X3 D

Cooc

Dic

o

3

Dic

o

1

Dic

o

2

Méta

Niv.

Corpus

4

Corpus

3

Corpus

2

1'

Corpus

1

BD

Web

CD

Méta-

données

Méta-

données

Méta-

données

Méta-

données

Méta-

données

Méta-

données

His

torique

Eta

t de

l’ar

tContrib

ution

Concl

usion

Architecture

Principe général

Page 15: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

15

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en analyse textuelle

��Extrac

tion d

es d

ictionnai

res

Extrac

tion d

es d

ictionnai

res

Courbe de charge

Dictionnaire de synonymes

Dictionnaire + ou -

Page 16: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

16

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en analyse textuelle

��DD

ééte

ctio

n d

es m

ulti

tect

ion d

es m

ulti --te

rmes

term

es

Dictionnaire de multi-term

es

Dictionnaire de synonymes

Dictionnaire de mots vides

Seuil de détection statistique

Traitem

ent statistique

Traitem

ent morphologique

Traitem

ent syntaxique

Page 17: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

17

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en analyse textuelle

��Cro

isem

ents

2D

Cro

isem

ents

2D

Matrice carrée

Matrice asymétrique

Filtre positif ou négatif

Dictionnaire de synonymes

Courbe de charge

Page 18: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

18

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en analyse exploratoire

��pour le

tra

item

ent des

mat

rice

s pour le

tra

item

ent des

mat

rice

s

––pro

position d

e plu

sieu

rs a

lgorith

mes

de

tris

pro

position d

e plu

sieu

rs a

lgorith

mes

de

tris

––ggéénnééra

tion super

vis

ration super

vis

éée

de

mat

rice

s de

crois

emen

te

de

mat

rice

s de

crois

emen

t

––ta

ble

ur 3D

adap

tta

ble

ur 3D

adap

t ééau

x m

atrice

s de

gra

nde

taille

(zo

om

s 2 e

t 3D

)au

x m

atrice

s de

gra

nde

taille

(zo

om

s 2 e

t 3D

)

��pour le

s an

alyse

s m

ultid

imen

sionnel

les

pour le

s an

alyse

s m

ultid

imen

sionnel

les

––vis

ual

isat

ions in

tera

ctiv

es e

n 3

D e

t 4 D

vis

ual

isat

ions in

tera

ctiv

es e

n 3

D e

t 4 D

––sy

nch

ronisat

ion d

e ca

rtes

loca

les ou d

ista

nte

ssy

nch

ronisat

ion d

e ca

rtes

loca

les ou d

ista

nte

s

––vis

ual

isat

ion d

e traj

ecto

ires

et ro

tations pro

cust

vis

ual

isat

ion d

e traj

ecto

ires

et ro

tations pro

cust

ééen

nes

(A

FC

M)

ennes

(A

FC

M)

��pour le

s cl

assi

fica

tions

pour le

s cl

assi

fica

tions

––ar

bre

s hi

arbre

s hi éé

rarc

hiq

ues

inte

ract

ifs av

ec e

xportat

ion d

es c

lass

esra

rchiq

ues

inte

ract

ifs av

ec e

xportat

ion d

es c

lass

es

––par

titionnem

ent de

gra

phes

, gra

phes

de

clas

ses

par

titionnem

ent de

gra

phes

, gra

phes

de

clas

ses

––se

gm

enta

tion p

our le

s ca

rtes

gse

gm

enta

tion p

our le

s ca

rtes

gééogra

phiq

ues

ogra

phiq

ues

Page 19: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

19

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en analyse exploratoire

��A

lgorith

mes

de

tris

de

mat

rice

sA

lgorith

mes

de

tris

de

mat

rice

sTri par classes de connexité

Tri par blocs diagonaux

Page 20: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

20

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en analyse exploratoire

Car

tes des

coord

onnée

s en

4D

Cer

cle

des

corr

élat

ions

Synch

ronis

atio

n

��A

nal

yse

en c

om

posa

nte

s princi

pal

es (A

CP)

Anal

yse

en c

om

posa

nte

s princi

pal

es (A

CP)

��A

nal

yse

en c

om

posa

nte

s princi

pal

es (A

CP)

Anal

yse

en c

om

posa

nte

s princi

pal

es (A

CP)

––ss ’’

applique

aux d

onn

applique

aux d

onnéées

quan

tita

tive

es q

uan

tita

tive

com

me

les ta

ble

aux indiv

idus x v

aria

ble

sco

mm

e le

s ta

ble

aux indiv

idus x v

aria

ble

s

––el

le u

tilise

un e

spac

e r

elle

utilise

un e

spac

e r éé

duit d

e 2

duit d

e 2 àà

4 D

4 D

––deu

x c

arte

s en

sont d

deu

x c

arte

s en

sont dééduites

duites

••ce

lle

des

coord

onn

celle

des

coord

onnéées

des

indiv

idus

es d

es indiv

idus

••ce

rcle

de

corr

cerc

le d

e co

rrééla

tion d

es v

aria

ble

sla

tion d

es v

aria

ble

s

Page 21: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

21

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en analyse exploratoire

��A

nal

yse

fac

toriel

le d

es c

orr

espondan

ces m

ultip

le (A

FCM

)A

nal

yse

fac

toriel

le d

es c

orr

espondan

ces m

ultip

le (A

FCM

)��

Anal

yse

fac

toriel

le d

es c

orr

espondan

ces m

ultip

le (A

FCM

)A

nal

yse

fac

toriel

le d

es c

orr

espondan

ces m

ultip

le (A

FCM

)

––nous l

nous l ’’ap

pliquons au

x m

atrice

s de

coocc

urren

ces 3D

appliquons au

x m

atrice

s de

coocc

urren

ces 3D

––la

3la

3°°var

iable

est le

plu

s so

uven

t le

tem

ps

var

iable

est le

plu

s so

uven

t le

tem

ps

––LL

’’ AFC p

eut êt

re a

ppliqu

AFC p

eut êt

re a

ppliquééee

••àà

un d

es tab

leau

x (le

s au

tres

sont pro

jet

un d

es tab

leau

x (le

s au

tres

sont pro

jet éé

s)s)

••àà

tous le

s ta

ble

aux e

mpil

tous le

s ta

ble

aux e

mpilééss

••àà

la som

me

des

tab

leau

x (

la som

me

des

tab

leau

x (≅≅

cas st

atiq

ue)

cas st

atiq

ue)

––Chaq

ue

ligne

est re

pr

Chaq

ue

ligne

est re

pr éé

sent

sent éé

e par

une

se

par

une

s éérie

de

poin

tsrie

de

poin

ts

––O

n p

eut trac

er d

es tra

ject

oires

On p

eut trac

er d

es tra

ject

oires

Page 22: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

22

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en analyse exploratoire

��A

nal

yse

pro

cust

Anal

yse

pro

cust

ééen

ne

enne

��Enle

ver

:Enle

ver

:

––la

tra

nslat

ion m

oyen

ne

la tra

nslat

ion m

oyen

ne

––la

rota

tion m

oyen

ne

la rota

tion m

oyen

ne

––ll ’’hom

oth

hom

oth

éétie

moyen

ne

tie

moyen

ne

G1

G2

G3

G4

G1

G2

G3

G4

G4

Evolution non standard

Page 23: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

23

∑ =−

==

ni

ii

ee

hg

hg

dB

Ad

,1

)²(

),

()

,(

{} )

,

,(

),

(l

ke

lk

my

xd

BA

dMin

={

} ),

,(

),

(l

ke

lk

My

xd

BA

dMax

=B

A

yx

d

BA

dk

l

lk

e∑∑

=)

,(

),

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en analyse exploratoire

Niveau de coupure à4 classes

Niveau de coupure à8 classes

��Cla

ssific

atio

n a

scen

dan

te h

iCla

ssific

atio

n a

scen

dan

te h

i ééra

rchiq

ue

(CA

H)

rarc

hiq

ue

(CA

H)

��Cla

ssific

atio

n a

scen

dan

te h

iCla

ssific

atio

n a

scen

dan

te h

i ééra

rchiq

ue

(CA

H)

rarc

hiq

ue

(CA

H)

––mm

ééth

ode

non super

vis

thode

non super

vis

ééee

––on a

le

choix

de

la d

ista

nce

(eu

clid

ienne,

max

, sig

ma,

on a

le

choix

de

la d

ista

nce

(eu

clid

ienne,

max

, sig

ma,

……))

––on a

le

choix

du m

ode

don a

le

choix

du m

ode

d’’ a

gr

agr éé

gat

ion (ce

ntre,

inf, sup, m

oyen

ne)

gat

ion (ce

ntre,

inf, sup, m

oyen

ne)

––el

le p

art des

el

le p

art des

ééll éé

men

ts d

isjo

ints

et ag

rm

ents

disjo

ints

et ag

r èège

les plu

s pro

ches

ge

les plu

s pro

ches

––el

le c

onstru

it d

es c

lass

es im

briqu

elle

constru

it d

es c

lass

es im

briquééeses

––la

hi

la h

i ééra

rchie

peu

t êt

re rep

rra

rchie

peu

t êt

re rep

r éése

nt

sent éé

e par

un d

endogra

mm

ee

par

un d

endogra

mm

e

––plu

sieu

rs n

ivea

ux d

e co

upure

sont poss

ible

splu

sieu

rs n

ivea

ux d

e co

upure

sont poss

ible

s

––on p

eut ex

porter

la

clas

sifica

tion

on p

eut ex

porter

la

clas

sifica

tion

Page 24: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

24

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en analyse exploratoire

��Cla

ssific

atio

n p

ar p

artition C

PP (Cen

tres

mobiles

)Cla

ssific

atio

n p

ar p

artition C

PP (Cen

tres

mobiles

)

––su

per

vis

super

vis

ééee

––k c

lass

esk c

lass

es

––1 rep

r1 rep

r éése

nta

nt

senta

nt

––ch

oix

en 3

D

choix

en 3

D

––co

lora

tion

colo

ration

––ic

ônes

icônes

––4 c

lass

es4 c

lass

es

––6 c

lass

es6 c

lass

es

Page 25: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

25

Carte pondérée par le PNB

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en visualisation

Carte en valeurs absolues

Carte pondérée par la population

Carte pondérée par la superficie

Choix de la pondération

��Pond

Pondééra

tion p

ar d

es d

onn

ration p

ar d

es d

onnéées

exte

rnes

es e

xte

rnes

Page 26: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

26

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en visualisation

.

Exportation d’une classification

Niveau de coupure

Effectifs des classes

Carte en mode relatif : étude de tendances

Pays non présents dans la dernière période

Pays en récession

Pays en forte croissance

��Seg

men

tation e

t im

portat

ion d

e cl

asse

sSeg

men

tation e

t im

portat

ion d

e cl

asse

s

Page 27: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

IRIT

/SIG

27

Placement initial aléatoire

.

Placement circulaire en fonction d’un tri

Convergence rapide du placement des sommets

()

kda

vv

fa

ijij

ji

a

α×

=,

rij

ji

rdk

vv

fα²

),

(−

=

≈A

lgorith

me

de

[Fru

chte

rman

91]

Attra

ctio

n :

Rép

ulsio

n :

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en visualisation

Page 28: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

IRIT

/SIG

28

Gra

phe

de

clust

ers

Gra

phe

de

clust

ers

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en visualisation

Page 29: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

IRIT

/SIG

29

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en visualisation

Gra

phe

par

titionn

Gra

phe

par

titionnéé

Page 30: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

IRIT

/SIG

30

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Contribution

en visualisation

Gra

phe

Gra

phe

éévolu

tif

volu

tif

Page 31: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

31

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Conclusion

Bilan

��Philoso

phie

de

notre

pla

tePhiloso

phie

de

notre

pla

te-- f

orm

efo

rme

––cc’’ e

st u

n e

nse

mble

coh

est un e

nse

mble

cohéére

nt de

rent de

pro

toty

pes

pro

toty

pes

inte

rin

ter --

op

opééra

nts

,ra

nts

,

––qui utilise

un

qui utilise

un

stan

dar

d u

niq

ue

stan

dar

d u

niq

ue

pour le

form

at d

es d

onn

pour le

form

at d

es d

onnéées

, es

,

––so

nso

nin

terfac

e gra

phiq

ue

inte

rfac

e gra

phiq

ue

est hom

og

est hom

ogèène,

ne,

––el

le p

erm

et d

e par

tager

res

sourc

es e

t m

elle

per

met

de

par

tager

res

sourc

es e

t m

ééth

odes

th

odes

via

le

rvia

le

r éése

ause

au..

��Son u

tilisa

tion e

n rec

her

che

Son u

tilisa

tion e

n rec

her

che

––su

pport d

support d

’é’éval

uat

ion

val

uat

ion

de

mde

mééth

odes

, d

thodes

, d’’ o

utils

et de

pro

duits d

outils

et de

pro

duits d’’ IE,

IE,

––vas

te b

ase

dvas

te b

ase

d’’ e

xem

ple

s,

exem

ple

s, àà

ll ’’ééch

elle

chel

le, d

, dééjj àà

anal

ys

anal

ys éé

s.s.

��D

om

aine

dD

om

aine

d’’ a

pplica

tion : la

vei

lle

stra

tap

plica

tion : la

vei

lle

stra

t éégiq

ue

giq

ue

––vei

lle

vei

lle

scie

ntifique

scie

ntifique

(sci

ento

m(s

cien

tom

éétrie

, in

dic

ateu

rs,

trie

, in

dic

ateu

rs, ééval

uat

ion)

val

uat

ion)

––vei

lle

vei

lle

tech

nolo

giq

ue

tech

nolo

giq

ue

(pro

pri

(pro

priéétt éé

indust

riel

le, pro

duits, p

roc

indust

riel

le, pro

duits, p

rocééddéés)s)

––vei

lle

vei

lle

ééco

nom

ique

conom

ique

(mar

ch(m

arch

éés, c

oncu

rren

ts, su

bstituts

, s, c

oncu

rren

ts, su

bstituts

, ……

))

Page 32: à De la veille conomique é le Data Mining et le Text ... · Contribution en analyse exploratoire Cartes des coordonnées en 4D Cercle des corrélations Synchronisation Analyse en

09/0

2/2

009

TETR

ALO

GIE

32

His

torique

Arc

hitec

ture

Contrib

ution

Concl

usion

Conclusion

Perspectives

Dan

s le

cad

re d

e l

Dan

s le

cad

re d

e l ’’In

tellig

ence

In

tellig

ence

ééco

nom

ique

conom

ique, ,

cette

appro

che

doit p

erm

ettre

cette

appro

che

doit p

erm

ettre

––le

rec

uei

l, le

suiv

i, le

trai

tem

ent, la

diffu

sion c

ibl

le rec

uei

l, le

suiv

i, le

trai

tem

ent, la

diffu

sion c

ibl éé

e et

la

e et

la

pro

tect

ion d

e l

pro

tect

ion d

e l ’’in

form

atio

n strat

info

rmat

ion strat

éégiq

ue

giq

ue

––ll ’’ac

cac

cèès sy

sts sy

stéém

atiq

ue

mat

ique

ààll ’’in

form

atio

n im

plici

tein

form

atio

n im

plici

te

––ll ’é’ém

ula

tion d

es c

om

pm

ula

tion d

es c

om

pééte

nce

s via

les

rte

nce

s via

les

réése

aux

seau

x

––une

culture

collec

tive

inte

rne

(par

tage

et

une

culture

collec

tive

inte

rne

(par

tage

et éé

mula

tion)

mula

tion)

––une

culture

collec

tive

exte

rne

(logiq

ue

de

rune

culture

collec

tive

exte

rne

(logiq

ue

de

r éése

au d

seau

d’’ a

cteu

rs)

acte

urs

)

––ééven

tuel

lem

ent , une

culture

pro

active

(influen

ce, lo

bbyin

g,

ven

tuel

lem

ent , une

culture

pro

active

(influen

ce, lo

bbyin

g,

contre

contre-- info

rmat

ion/rum

eurs

, ex

trac

tion d

es sig

nau

x fai

ble

s,

info

rmat

ion/rum

eurs

, ex

trac

tion d

es sig

nau

x fai

ble

s,

ddéécr

ypta

ge

des

rcr

ypta

ge

des

réése

aux,

seau

x, ……

))