zorg | 150129 | big data | een optie voor de toekomst van preventieve medische zorg? | presentatie |...

22
Background Big Data Final Remarks De Toekomst Van Biostatistiek in het Medisch Onderzoek Jeanine Houwing-Duistermaat Department of Medical Statistics and Bioinformatics, LUMC Big Data: Een optie voor de toekomst van preventieve medische zorg? 29 januari 2015 Baarn

Upload: flevum

Post on 16-Jul-2015

112 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

De Toekomst Van Biostatistiek inhet Medisch Onderzoek

Jeanine Houwing-Duistermaat

Department of Medical Statistics and Bioinformatics, LUMC

Big Data: Een optie voor de toekomst van preventieve medischezorg? 29 januari 2015 Baarn

Page 2: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Statistics

Page 3: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

New York Times

In his State of the Union address last week,President Obama encouraged the development ofprecision medicine, which would tailor treatmentsbased on individuals genetics or physiology.

Need for statistics

Page 4: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Data in (Bio)medical research

Demographic variablesClassical parameters‐omicsGenetic dataHuman MicrobiomeImagingQuestionnaires

Simone Houtman

Page 5: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Biomedical Research

Insight in biological mechanisms underlyinghuman diseases and health

Individiual predictionsScreeningTreatment effects

Page 6: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Statistical Challenges: Big data

Combining various data sources: heterogeneity

Hierarchical data

Longitudinally measured profiles

Combination of the above mentioned datasets→ big data

Causality

Model Validation

Page 7: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Page 8: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Types of Datasets

Aggregated dataRegistrationSummaries from studies/EPD

Reference datasetsGenome NL1000 Genomes

Patient cohorts

HIS: Data from General Practioners

Epidemiological studies

Page 9: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Combining data - heterogeneity

Populations

Measurementtechniques

Definitions

PatientCharacteristics

Study Designs

Page 1 of 1

27-01-2015file:///C:/d2011/d/presentaties/zorg/data%20analysis%20cartoon%201.gif

Page 10: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Hierarchy of data

Page 11: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Longitudinal Data

Page 12: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Causality

Page 13: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Causality

Page 14: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

”Big” Data in Biomedical Research

Genetic Studies (DNA)Genome Wide Association studies: 10M SNPs.Typically well measured.Whole genome sequencing. Data preprocessingimportant.

Metabolomics, Proteomics, GlycomicsSpectra (10-2000 peaks)Noisy data

Lots of data, but most of it not informative

Page 15: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Sample sizes of Genome Wide Associationstudies

Outcome Number of subjectsHeight 180KLipids 100KCVD 80K

Longevity 8K

Big numbers are obtained by collaborations betweenresearch groups

Page 16: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Statistical analysis of Genome WideAssociation Studies

Test for association between single geneticmarker and outcome per studySingle study results are combined by usingmeta analysis tools

Page 17: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Lessons learned from Genome WideAssociation Studies

Quality control

Statistical model should acknowledgeStudy designDistribution of outcome variableAdjust for or model the structure in the data

From Simon Heath et al, EJHG

Page 18: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Post analysis quality control

Most tests are representing the null hypothesisDistribution of observed test statistics shouldcorrespond to theoretical distribution

Page 19: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Omics data

Measurement process not automated andstandardized

Degeneration of samples

Detection limit

Non normal data

Technique differences can be huge

Page 20: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Relationship omics and age, sex

Lucija Klaric

Page 21: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Multidisciplinary

Medical Science: Need for statistics withrealistic datasets

Data Science: Need for more biological andchemistry

Page 22: Zorg | 150129 | Big Data | Een optie voor de toekomst van preventieve medische zorg? | Presentatie | Jeanine Houwing-Duistermaat

Background Big Data Final Remarks

Final remarks

New methodologies are needed for big data

The amount of data is growing fast but not theinformative part

New biostatistical methods are neededacknowledge hierarchy in datalongitudinal dataselection of correct statistical modelscausality