maimouna bagna, ingénieure, m.sc.,phd - ciqss · maimouna bagna, ingénieure, m.sc.,phd. plan de...
TRANSCRIPT
![Page 1: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/1.jpg)
Le forage de données (Data Mining), une
approche pour adresser la complexité dans les
grandes bases de données liées au vieillissement
Maimouna Bagna, Ingénieure, M.Sc.,PhD
![Page 2: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/2.jpg)
Plan de la présentation
1. Qu’est-ce que le Forage de données?
2. Forage de données vs Statistiques
3. Processus du Forage de données
4. Exemple: Caractérisation de profils de vieillissement
– NuAge
– ESCC-Vieillissement en santé
5. Perspectives
2017-04-24
![Page 3: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/3.jpg)
Qu’est-ce que le Forage de données?
Data mining / knowledge discovery:
• Ensemble de processus et de méthodes utilisant des
techniques de statistiques et d’intelligence
artificielle pour identifier et extraire de l’information
et des connaissances nouvelles et utiles (patrons) à
partir de grandes quantités de données.
2017-04-24
![Page 4: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/4.jpg)
Pourquoi le Forage de données?
• De plus en plus de données sont collectées et stockées
• Ces données constituent une mine d’or pour les entreprises (marketing) et la recherche (santé)
• Exemple: Peut-on prédire un comportement d’achat, des perturbations climatiques, un diagnostique en examinant les données préexistantes?
• Beaucoup de domaines d’applications possibles
• Avènement de méthodes puissantes de calcul et de processeurs réduisant le coût et le temps de calcul
• En recherche, spécialement en médecine, il y a beaucoup de bases de données qui restent inexploitées
2017-04-24
![Page 5: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/5.jpg)
Forage de données Vs Statistiques
2017-04-24
En statistique :
– Analyse primaire des données
– Quelques centaines d’individus, quelques variables
– Fortes hypothèses de départs (lois statistiques)
– Importance accordée au calcul (Statistiquement significatif)
– Analyses axées par hypothèses
En Forage de données
– Analyse secondaire des données
– Des millions d’individus, des centaines de variables
– Données existantes (sans hypothèse préalable)
– Nécessité de calculs rapides (mégadonnées)
– Corpus d’apprentissage (génération de nouvelles hypothèses)
![Page 6: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/6.jpg)
Processus du Forage de données
2017-04-24
Intégration de données
Bases de données ou fichiers
Données Pré-traitées
Données intéressantes
Sélection
Forage de données
Evaluation de patrons
Nettoyage de données
expert
analyste
décideur
Préparation
Modélisation
Évaluation
Déploiement
Étape la plus longue
![Page 7: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/7.jpg)
Préparation des données
• Réduction de variables
• Données manquantes
• Valeurs aberrantes
• Duplication
• Discrétisation (catégorisation)
• Transformation de variables (Z-transform,
[0,1],…)
2017-04-24
![Page 8: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/8.jpg)
• Classification
– Analyses par grappes (Cluster Analysis)
• Partitionnement (k-means, k-medoid, PAM),
• hiérarchique ( Agglomérative, divisive, Ward dendrogram)
– Classification (SVM, k-nn, SOM)
• Prédiction
– Règles d’association (market basket rules)
– Analyse discriminante
– Régressions (linéaire, logistique)
– Arbres de décision
– Réseaux de neurones
– ..etc. 2017-04-24
Modèles
![Page 9: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/9.jpg)
Évaluation
1. Choix du modèle ( Est-ce le meilleur modèle?)
2. Performance du modèle (efficacité de prédiction, classification)
3. Visualisation des résultats (représentation intuitive)
4. Interprétabilité des résultats ( Ce que mon modèle me suggère a-t-il du sens?)
5. … retour à l’étape 1 ( processus itératif).
6. Pour les besoins de la recherche: Reproductibilité et généralisation ( Est-ce que je peux tirer les mêmes conclusions avec une autre méthode? Avec une autre base de donnée?)
2017-04-24
![Page 10: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/10.jpg)
Déploiement
• Le déploiement se fait de concert avec les experts
(les chercheurs)
• Quelles sont les nouvelles connaissances acquises?
• Ces connaissances sont-elles utiles?
• A-t-on généré de nouvelles hypothèses?
• Quelles conclusions peut-on en tirer?
• Quelles actions doit-on prendre?
• Doit-on recommencer le processus?
2017-04-24
![Page 11: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/11.jpg)
Exemple d’ application:
Caractérisation de Profils de
vieillissement
![Page 12: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/12.jpg)
Mise en Contexte
• Population de plus en plus âgée
• Demande accrue d’interventions et soins de
santé
• Coûts de santé de plus en plus élevés
• Une seule approche n’est pas bonne pour tous
• Approches de plus en plus centrées sur le
patient
• Les individus vieillissent différemment
![Page 13: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/13.jpg)
Mise en Contexte
• Le processus de vieillissement est donc très
hétérogène!
• Cependant dans cette hétérogénéité, il existe
certains patrons répétitifs
• Comment comprendre cette hétérogénéité et
distinguer ces patrons sachant que le
processus de vieillissement est très
multifactoriel?
![Page 14: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/14.jpg)
ObjectifsAge
Genre
IMC
GDS
SMAF
QOL
PASE
SPA
……
Former des sous-groupes reflétant des profils distincts de vieillissement i.e
des sous-groupes de population dont les individus dans le même groupe sont
très proches les uns des autres en termes de leur processus de vieillissement
mais très différents des individus des autres groupes
A priori on ne connaît pas:
• Le nombre de profils distincts
• La composition des sous-groupes
• Les sous-groupes dominants
• La particularité de chacun des sous-groupes
Bref,…… aucune hypothèse a priori
![Page 15: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/15.jpg)
Objectifs
1) Identifier des profils distincts de
vieillissement chez les hommes et chez les
femmes
2) Caractériser ces profils selon plusieurs co-
variables
3) Identifier les profils à risque de fragilité
![Page 16: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/16.jpg)
Méthodes
1) Méthodes K-means pour l’analyse par
grappes (clustering) des individus et
l’identification des profils de vieillissement
2) Analyse des co-variables pour la
caractérisation des profils de vieillissement
3) Analyse de survie sur la fragilité pour
l’identification les profils à risque
![Page 17: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/17.jpg)
Données 1: NuAge
• N=1793 participants, âgés de 68+, 940 F (52,4%) , 4 temps de mesure annuels (T1,T2,T3,T4)
• 3 catégories de variables:
– Analyses par grappes (variables centroîdes)
– Caractérisation des sous-groupes (co-variables ou caractéristiques)
– Facteurs de risque (outcomes) pour l’analyse de survie ( ici fragilité)
![Page 18: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/18.jpg)
Variables centroîdes
• 26 variables de type continu, liées à 10 domaines du vieillissement sont initialement choisies, candidates à l’analyse: – Anthropométrie
– Performance physique
– Pression artérielle
– Qualité de vie (SF-36)
– Autonomie (SMAF)
– Activité physique (PASE)
– Dépression (GDS)
– Cognition (3MS)
– Participation sociale (DSC)
– Risque nutritionnel (DNA)
![Page 19: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/19.jpg)
Co-variables
• Variables sociodémographiques– Age
– État civil
– Situation de vie (Vivre seul ou pas)
– Nombre d’années de scolarité
– Revenu
– Tabac
• Autres – Nombre de maladies
– Maladies chroniques
– Nombre de médicaments
![Page 20: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/20.jpg)
Outcome (Fragilité)
• Fragilité selon les critères de Fried (2001)1) Perte de poids non-intentionnelle (10 lbs et + en 1 an),
2) Fatigue ou épuisement déclaré (SF-36)
3) Faiblesse (force de préhension < 20% /âge & sexe)
4) Vitesse de marche lente (<1m/s)
5) Faible activité physique (score PASE<20%/âge & sexe)
• Non Fragile = 0/5
• Pré-fragile (1-2)/5
• Fragile 3+/5
Deux catégories:
0= Non-Fragile
1= Pré-Fragile + Fragile
![Page 21: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/21.jpg)
Méthode K-means1. Choisir k centres aléatoires
définis dans l’espace des données
2. Assigner chaque individu au centre le plus proche (en terme de distance, ici Euclidienne)
3. Recalculer de nouveaux centres représentant la moyenne des individus assignés par groupe
4. Si le critère de convergence (aucune réassignation d’individus) n’est pas atteint, retourner à l’étape 2
![Page 22: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/22.jpg)
Méthodes
• 26 variables utilisées pour la classification
• List-wise deletion sur les données manquantes
• Z-transform sur toutes les variables
• Échantillon final
– T1, N= 679 hommes (H) et (Age: 74,22 ±4,1) et 709Femmes(F) (age: 74,45 ±4,2)
– T2, N = 609 H, 623 F
– T3, N= 539 H, 562F
– T4, N = 451H, 455F
![Page 23: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/23.jpg)
Choix du nombre de groupes
• Basé sur des mesures internes et externes de
validation des clusters (Gini, DB, ARI,
Jaccard…)
– Faire varier le nombre k de clusters possible entre
2 et + (ici k varie de 2 à 16)
– Calculer les mesures internes et chercher des
minima ou maxima
– Calculer les mesures externes et trouver les
incréments de k résilients à la scission
![Page 24: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/24.jpg)
Choix du nombre de groupesMesures internes Mesures externes
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
k2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
![Page 25: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/25.jpg)
Méthodes
• Procédure K-means
– K= 4
– Stratifié par sexe
– Randomisation X100
– Répéter pour chaque temps de mesure
(T1,T2,T3,T4)
![Page 26: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/26.jpg)
Résultats (H)
-2,00
-1,50
-1,00
-0,50
0,00
0,50
1,00
1,50
Hei
ght
Ssca
p
Sup
ra
MA
FA
MA
MA
TUP
5X
WSp
eed
MA
XV
MA
XQ
Syst
BP
Dia
stB
P
Hea
rtb
eat
SF-3
6 R
P
SF-3
6 V
T
SF-3
6 S
F
SF-3
6 R
E
SF-3
6 P
F
SF-3
6 B
P
SF-3
6 G
H
SF-3
6 M
H
SMA
F
PA
SE
GD
S
3M
S
SPA
ENS
Men centroids T2
Healthiest
High BMI
Less healthy
At risk
Healthiest n=272 (44.7%) mean±SE
Age 73.48 ± 0.25
Years of scholar 12.56 ± 0.31
Income (X1000CND) 45.73 ± 1.5
BMI 25.81 ± 0.16
Less Healthy n=66 (10.8%) mean±SE
Age 75.88 ± 0.53
Years of scholar 11.24 ± 0.68
Income (X1000CND) 40.44 ± 2.83
BMI 26.18 ± 0.4
High BMI n=170 (27.9%) mean±SE
Age 72.86 ± 0.27
Years of scholar 12.11 ± 0.4
Income (X1000CND) 45.76 ± 1.84
BMI 30.98 ± 0.28
At Risk n=101 (16.6%) mean±SE
Age 76.06 ± 0.37
Years of scholar 10.8 ± 0.45
Income (X1000CND) 38.52 ± 2.27
BMI 27.96 ± 0.35
P< 0.001 Posthoc
Age 1,2≠3,4
Years of scholar 1≠4
Income (X1000CND) 2≠4
BMI 2,4≠all
![Page 27: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/27.jpg)
Résultats (H)
-2,00
-1,50
-1,00
-0,50
0,00
0,50
1,00
1,50
Hei
ght
Ssca
p
Sup
ra
MA
FA
MA
MA
TUP
5X
WSp
eed
MA
XV
MA
XQ
Syst
BP
Dia
stB
P
Hea
rtb
eat
SF-3
6 R
P
SF-3
6 V
T
SF-3
6 S
F
SF-3
6 R
E
SF-3
6 P
F
SF-3
6 B
P
SF-3
6 G
H
SF-3
6 M
H
SMA
F
PA
SE
GD
S
3M
S
SPA
ENS
Men centroids T2
Healthiest
High BMI
Less healthy
At risk
Healthiest n=272 (44.7%) mean±SE
SF-Physical Compo. 53.87 ± 0.28
SF-Mental Compo. 57.7 ± 0.25
Nb of diseases 2.49 ± 0.1
Nb of medication 3.43 ± 0.18
Less Healthy n=66 (10.8%) mean±SE
SF-Physical Compo. 45.88 ± 1.22
SF-Mental Compo. 42.28 ± 0.99
Nb of diseases 4 ± 0.28
Nb of medication 5.98 ± 0.5
High BMI n=170 (27.9%) mean±SE
SF-Physical Compo. 50.5 ± 0.48
SF-Mental Compo. 56.49 ± 0.4
Nb of diseases 3.21 ± 0.14
Nb of medication 4.56 ± 0.23
At Risk n=101 (16.6%) mean±SE
SF-Physical Compo. 44.84 ± 0.77
SF-Mental Compo. 57.92 ± 0.51
Nb of diseases 4.2 ± 0.19
Nb of medication 5.89 ± 0.31
P< 0.001 Posthoc
SF-Physical Compo. 1,2≠all
SF-Mental Compo. 3≠all
Nb of diseases 1,2≠all
Nb of medication 1,2≠all
![Page 28: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/28.jpg)
Résultats co-variables (H)
Chronic conditions
Arthritis 292 (47.95%) 95 (34,93%) 92 (54,12%) 67 (66,34%) 38 (57,58%) P<0.001
High Blood Pressure 307 (50.41%) 113 (41,54%) 106 (62,35%) 56 (55,45%) 32 (48,48%) P<0.001
Cardiovascular Disease 236 (38.75%) 88 (32,35%) 60 (35,29%) 53 (52,48%) 35 (53,03%) P<0.001
Diabet 90 (14.78%) 22 (8,09%) 30 (17,65%) 22 (21,78%) 16 (24,24%) P<0.001
Cancer 17 (2.79%) 3 (1,1%) 5 (2,94%) 4 (3,96%) 5 (7,58%) p=0.030
Total
n=609
Healthiest
n=272
(44.7%)
High BMI
n=170
(27.9%)
At risk
n=101
(16.6%)
Less Healthy
n=66
(10.8%)
P value
![Page 29: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/29.jpg)
Résultats 4 temps (H+F)
-0,60
-0,40
-0,20
0,00
0,20
0,40
0,60
0,80
1,00
Healthy Aging profils T3
T1
T4
T2
-2,50
-2,00
-1,50
-1,00
-0,50
0,00
0,50
1,00
1,50
Less Healthy aging profils
T3
T1
T4
T2
HF
![Page 30: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/30.jpg)
-1,00
-0,50
0,00
0,50
1,00
1,50
High BMI aging profilsT3
T1
T4
T2
-1,50
-1,00
-0,50
0,00
0,50
1,00
1,50
AT risk aging profils
T3
T1
T4
T2
HF
Résultats 4 temps (H+F)
![Page 31: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/31.jpg)
Résultats-analyse de survie(fragilité)
Khi-deux ddl Sig.Log Rank (Mantel-Cox) 134,122 3 ,000
Khi-deux ddl Sig.Log Rank (Mantel-Cox) 187,296 3 ,000
![Page 32: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/32.jpg)
Résultats-survie-Modèles de Cox (H)
(fragilité)
B
Erreur
standard Wald ddl Sig. Exp(B)
95,0% CI pour Exp(B)
Inférieur Supérieur
ClusterHommes 101,976 3 ,000
High BMI ,272 ,097 7,877 1 ,005 1,312 1,085 1,587
At Risk ,621 ,087 51,198 1 ,000 1,861 1,570 2,207
Less Healthy ,895 ,096 86,373 1 ,000 2,448 2,027 2,956
B
Erreur
standard Wald ddl Sig. Exp(B)
95,0% CI pour Exp(B)
Inférieur Supérieur
ClusterHommes 82,152 3 ,000
High BMI ,235 ,098 5,715 1 ,017 1,265 1,043 1,533
At Risk ,554 ,093 35,446 1 ,000 1,739 1,450 2,087
Less Healthy ,858 ,100 74,099 1 ,000 2,358 1,940 2,866
age ,008 ,009 ,817 1 ,366 1,008 ,991 1,025
Revenue -,002 ,002 1,694 1 ,193 ,998 ,995 1,001
B
Erreur
standard Wald ddl Sig. Exp(B)
95,0% CI pour Exp(B)
Inférieur Supérieur
ClusterHommes 65,091 3 ,000
High BMI ,220 ,098 5,007 1 ,025 1,246 1,028 1,511
At Risk ,558 ,093 36,289 1 ,000 1,746 1,457 2,094
Less Healthy ,777 ,106 53,529 1 ,000 2,174 1,766 2,677
age ,004 ,009 ,225 1 ,635 1,004 ,987 1,021
nbpathos ,048 ,017 8,092 1 ,004 1,050 1,015 1,085
Reference = Healthy Profile
![Page 33: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/33.jpg)
Résultats-survie-Modèles de Cox (F)
(fragilité)Reference = Healthy Profile
B
Erreur
standard Wald ddl Sig. Exp(B)
95,0% CI pour Exp(B)
Inférieur Supérieur
clusterFemmes 139,728 3 ,000
High BMI -,007 ,098 ,005 1 ,943 ,993 ,819 1,204
At Risk ,580 ,087 44,897 1 ,000 1,786 1,507 2,116
Less Healthy ,877 ,090 95,203 1 ,000 2,404 2,016 2,867
B
Erreur
standard Wald ddl Sig. Exp(B)
95,0% CI pour Exp(B)
Inférieur Supérieur
clusterFemmes 123,489 3 ,000
High BMI ,013 ,102 ,016 1 ,898 1,013 ,830 1,236
At Risk ,588 ,093 39,663 1 ,000 1,800 1,499 2,162
Less Healthy ,900 ,096 88,790 1 ,000 2,460 2,040 2,966
age ,002 ,008 ,069 1 ,792 1,002 ,986 1,018
Revenue ,002 ,002 ,805 1 ,370 1,002 ,998 1,005
B
Erreur
standard Wald ddl Sig. Exp(B)
95,0% CI pour Exp(B)
Inférieur Supérieur
clusterFemmes 125,833 3 ,000
High BMI ,006 ,099 ,004 1 ,952 1,006 ,829 1,221
At Risk ,595 ,092 42,074 1 ,000 1,813 1,515 2,170
Less Healthy ,910 ,096 89,340 1 ,000 2,483 2,056 2,999
age ,003 ,008 ,113 1 ,737 1,003 ,987 1,018
nbpathos -,016 ,015 1,142 1 ,285 ,984 ,956 1,013
![Page 34: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/34.jpg)
CCHS-Healthy Aging
• Statistiques Canada(CIQSS) N= 30865
• 65 et +, N= 16369
• 15 variables (14 domaines)
• Échantillon final: N= 13966
• 5797 H (âge: 75,5 ± 0.1) et 8169 F (77,4 ±0,1)
• K=4 pour K-means
![Page 35: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/35.jpg)
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
Low support
AT Risk
Less Healthy
Healthier
Résultats CCHS-Healthy Aging (H)
Healthier (n=2604) (44.9%) mean±SE
Age 73.364 ± 0.140
BMI 26.499 ± 0.073
Income (index) 8.029 ± 0.063
Indice Santé générale 0.923 ± 0.002
Low support (n=873) (15.1%) mean±SE
Age 77.148 ± 0.280
BMI 26.089 ± 0.143
Income (index) 5.863 ± 0.093
Indice Santé générale 0.759 ± 0.008
Less Healthy (n=575) (9.9%) mean±SE
Age 79.167 ± 0.362
BMI 27.642 ± 0.230
Income (index) 6.548 ± 0.120
Indice Santé générale 0.341 ± 0.010
At Risk (n=1745) (30.1%) mean±SE
Age 76.591 ± 0.187
BMI 26.475 ± 0.107
Income (index) 6.865 ± 0.067
Indice Santé générale 0.792 ± 0.004
![Page 36: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/36.jpg)
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
Low support
At Risk
Less Healthy
Healthier
Résultats CCHS-Healthy Aging (F)
Healthier (n=3730) (45.7%) mean±SE
Age 75.807 ± 0.130
BMI 25.472 ± 0.073
Income (index) 6.460 ± 0.050
Indice Santé générale 0.909 ± 0.002
Low support (n=1723) (21.1%) mean±SE
Age 77.547 ± 0.195
BMI 24.851 ± 0.110
Income (index) 5.255 ± 0.058
Indice Santé générale 0.839 ± 0.004
Less Healthy (n=742) (9.1%) mean±SE
Age 77.957 ± 0.294
BMI 26.597 ± 0.226
Income (index) 4.959 ± 0.086
Indice Santé générale 0.391 ± 0.011
At Risk (n=1974) (24.2%) mean±SE
Age 80.079 ± 0.184
BMI 27.227 ± 0.131
Income (index) 5.643 ± 0.063
Indice Santé générale 0.581 ± 0.006
![Page 37: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/37.jpg)
Discussion
• Nous avons identifié des profils distincts de vieillissement dans 2 populations différentes
• Il existe des profils plus en santé que d’autres
• A partir des profils nous avons pu prédire un facteur de risque (fragilité)
• Les profils de vieillissement reflètent des interactions complexes de plusieurs domainesdu vieillissement
• Nous étudions présentement les mécanismes de transition entre profils ( ceux-ci semblent être différents entre les hommes et les femmes)
![Page 38: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/38.jpg)
Conclusion
• La caractérisation de profils de vieillissement permet de: – Découvrir différents profils de vieillissement intelligibles et
distincts
– Différencier les profils de vieillissement en regard de la santé des individus
– Suivre l’évolution de sous-groupes de population pour mieux comprendre les mécanismes sous-jacents de différents processus de vieillissement
– Découvrir les mécanismes de déclin et les profils à risque
– Et éventuellement… mieux prévoir, pour mieux adapter les soins, les approches préventives et la prise en charge générale de la personne âgée.
– Tout cela…. En en considérant le vieillissement dans une approche holistique
![Page 39: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/39.jpg)
Remerciements
• Alan Cohen
• Shengrui Wang
• Hélène Payette
• Mélanie Levasseur
• Olivier Germain
expert
analyste
décideur
![Page 40: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/40.jpg)
Merci!
``Laissons parler les données !’’
![Page 41: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/41.jpg)
![Page 42: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/42.jpg)
Résultats-Transitions d’états T1-T4 (H)
Healthy
Less Healthy
High BMI At risk
27,6%
11,3%
13,4% 17,1%
22,9%
57,6%
65,7%68,0%
56,1%
16,5%
19,5%
![Page 43: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/43.jpg)
Résultats-Transitions d’états T1-T4 (F)
Healthy
Less Healthy
High BMI At risk
16,3%18,5%
11,0% 17,2%
24,1% 29,3%
11,0%
61,4%
51,2%75,2%
51,7%
![Page 44: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/44.jpg)
Résultats (F)
-2,00
-1,50
-1,00
-0,50
0,00
0,50
1,00
1,50
Hei
ght
Ssca
p
Sup
ra
MA
FA
MA
MA
TUP
5X
WSp
eed
MA
XV
MA
XQ
Syst
BP
Dia
stB
P
Hea
rtb
eat
SF-3
6 R
P
SF-3
6 V
T
SF-3
6 S
F
SF-3
6 R
E
SF-3
6 P
F
SF-3
6 B
P
SF-3
6 G
H
SF-3
6 M
H
SMA
F
PA
SE
GD
S
3M
S
SPA
ENS
Women centroids T2
Healthiest
High BMI
Less healthy
At Risk
Healthiest n=185 (29.7%) mean±SE
Age 72.41 ± 0.29
Years of scholar 12.08 ± 0.28
Income (X1000CND) 38.95 ± 1.86
BMI 26.01 ± 0.21
Less Healthy n=124 (19.9%) mean±SE
Age 75.64 ± 0.34
Years of scholar 11.53 ± 0.33
Income (X1000CND) 32.4 ± 1.86
BMI 28.05 ± 0.4
High BMI n= n=136 (21.8%) mean±SE
Age 73.9 ± 0.35
Years of scholar 11.38 ± 0.34
Income (X1000CND) 33.46 ± 1.68
BMI 31.44 ± 0.34
At Risk n=178 (28.6%) mean±SE
Age 75.29 ± 0.3
Years of scholar 10.85 ± 0.28
Income (X1000CND) 30.19 ± 1.53
BMI 24.39 ± 0.25
P< 0.001 Posthoc
Age 1,2≠all
Years of scholar 1≠4
Income (X1000CND) 1≠4
BMI all≠
![Page 45: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/45.jpg)
Résultats (F)
-2,00
-1,50
-1,00
-0,50
0,00
0,50
1,00
1,50
Hei
ght
Ssca
p
Sup
ra
MA
FA
MA
MA
TUP
5X
WSp
eed
MA
XV
MA
XQ
Syst
BP
Dia
stB
P
Hea
rtb
eat
SF-3
6 R
P
SF-3
6 V
T
SF-3
6 S
F
SF-3
6 R
E
SF-3
6 P
F
SF-3
6 B
P
SF-3
6 G
H
SF-3
6 M
H
SMA
F
PA
SE
GD
S
3M
S
SPA
ENS
Women centroids T2
Healthiest
High BMI
Less healthy
At Risk
Healthiest n=185 (29.7%) mean±SE
SF-Physical Compo. 53.03 ± 0.39
SF-Mental Compo. 56.68 ± 0.34
Burden of diseases 2.76 ± 0.12
Number of medication 3.77 ± 0.17
Less Healthy n=124 (19.9%) mean±SE
SF-Physical Compo. 37.9 ± 0.71
SF-Mental Compo. 48.18 ± 0.85
Burden of diseases 5.23 ± 0.2
Number of medication 6.33 ± 0.28
High BMI n= n=136 (21.8%) mean±SE
SF-Physical Compo. 46.48 ± 0.6
SF-Mental Compo. 56.81 ± 0.46
Burden of diseases 3.77 ± 0.16
Number of medication 5.22 ± 0.29
At Risk n=178 (28.6%) mean±SE
SF-Physical Compo. 50.02 ± 0.48
SF-Mental Compo. 54.53 ± 0.49
Burden of diseases 3.72 ± 0.17
Number of medication 5.3 ± 0.24
P< 0.001 Posthoc
SF-Physical Compo. all≠
SF-Mental Compo. 3,4≠all
Burden of diseases 1,3≠all
Number of medication 1,3≠all
![Page 46: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/46.jpg)
Résultats co-variables (F)
Chronic conditions
Arthritis 390 (62.6%) 100 (54,05%) 83 (61,03%) 103 (57,87%) 104 (83,87%) P<0.001
High Blood Pressure 333 (53.45%) 79 (42,7%) 81 (59,56%) 89 (50%) 84 (67,74%) P<0.001
Cardiovascular Disease 228 (36.6%) 72 (38,92%) 42 (30,88%) 49 (27,53%) 65 (52,42%) P<0.001
Diabet 51 (8.19%) 10 (5,41%) 13 (9,56%) 13 (7,3%) 15 (12,1%) p=0.876
Cancer 19 (3.05%) 5 (2,7%) 3 (2,21%) 7 (3,93%) 4 (3,23%) p=0.255
Totaln=623
Healthiestn=185
(29.7%)
High BMIn=136
(21.8%)
At Riskn=178
(28.6%)
Less Healthyn=124
(19.9%)P value
![Page 47: Maimouna Bagna, Ingénieure, M.Sc.,PhD - CIQSS · Maimouna Bagna, Ingénieure, M.Sc.,PhD. Plan de la présentation 1. Qu’est-ce que le Forage de données? 2. Forage de données](https://reader034.vdocuments.net/reader034/viewer/2022042317/5f05caac7e708231d414ba45/html5/thumbnails/47.jpg)
Perspectives futures
• Une approche basée sur les Profils de vieillissement
permettra de:
– Proposer un cadre nouveau pour la recherche sur le
vieillissement et l’approche aux soins
– Développer une approche pluridisciplinaire intégrative
– Considérer le vieillissement dans une approche holistique
– Proposer de meilleurs approches préventives de santé
personnalisées
– Proposer des approches de soins mieux adaptées et plus
personnalisées
– …..tout en minimisant les coûts (recherche et santé)