experto en genética médica y genómica...innovation experto en genética médica y genómica mod...
TRANSCRIPT
Innovation
Experto en Genética Médica y Genómica
MOD 4. Aplicaciones de la genética y la genómica en medicina
Medicina Reproductiva Genómica
Dra. Patricia Diaz-GimenoINVESTIGADORA LIDER DE GRUPO
Medicina Reproductiva Genómica y de Sistemas
07/03/2019
Innovation
IVI-RMA Global
Innovation
Genomic & Systems Reproductive Medicine
▪Procesos o enfermedades complejas y multifactoriales
▪Estratificación de pacientes y subfenotipado de enfermedades: NUEVA TAXONOMÍA de las enfermedades
▪Entender las bases moleculares de cada subtipo de la enfermedad para desarrollar estrategias para tratar a los pacientes de una manera personalizada. Farmacología de sistemas.
▪ Los datos dirigiendo nuevas hipótesis para avanzar en el conocimiento
Innovation
▪Predictores transcriptómico: Machine learning algorithms
▪Modelos de redes: Network models
Aproximaciones Genómicas
Innovation
Secuenciación del Genoma Humano y Tecnologías de Alto Rendimiento
▪ http://www.genome.gov
1990 20021995 2005
Illumina
HiSeq 2500
NGS
PGH 1000 genomes
project
100000
genomes
Genomics
England
2010-
actualidad2013-actualidad
Innovation
Medicina Genómica
Feero WG et al. N Engl J Med 2010;362:2001-2011.
Aumento de la complejidad de los procesos
Innovation
Medicina de Precisión
Precision medicine will require handling of multi-parametric data and someproficiency in interpreting “-omics” data, placing new demands on medicalprofessionals, who may be ill equipped to deal with the anticipated complexity andvolume of new information. Addressing these challenges will require effective clinicaldecision support tools and new educational models.
“New Taxonomy of Disease” as part of the precision medicine movement and made recommendations expected to play out over decades. The committee highlighted the need for a revised classification based on intrinsic biology as well as traditional signs and symptoms.
The shift toward a deeper understanding of disease based on molecular biology will also inevitably necessitate reclassification of disease states incorporating this knowledge. To that end, the World Health Organization’s century-old International Classification of Diseases must be modernized to take into account the expanding molecular data on health and disease.
Innovation
Los genes no trabajan solos, lo hacen en equipo, perspectiva de funciones
X
X
X
X
Innovation
Procedimiento de investigación
Mathematical modeling
Transcriptomics
DNA sequencing
Hypothesis contrast
In silico analysis
Experimental
Dataset repositories
HypothesisInductive
Method
Deductive
Method
Data driven hypothesis
Innovation
Problema clínico a mejorar
Endometrio y ciclo menstrual
Innovation
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
1 3 5 7 9 11 13 15 17 19 21 23 25 27
Ovulación
Proliferativo Secretor
WOI
Menstruacion
Días Ciclo Menstrual
Ventana de implantación
Innovation
Receptividad Endometrial: Complejo y Multifactorial
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
1 3 5 7 9 11 13 15 17 19 21 23 25 27
Ovulación
Proliferativo Secretor
WOI
Noyes y cols 1950
Menstruacion
Murphy 2004
Días Ciclo Menstrual
Histología
Ecografía
Aproximaciones Moleculares ClásicasMicroscopía Electrónica
E-Tigrity testIntegrina β3
Lessey y cols. 1995
EFT Quick Guide
Kliman y cols., 2006
p27
Ciclina E
Resultados
contradictorios
Grado de vascularización
Grosor endometrial
Innovation
Transcriptómica Endometrial:reproducible y capaz de medir lo complejo y multifactorial
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
1 3 5 7 9 11 13 15 17 19 21 23 25 27
Ovulación
Proliferativo Secretor
WOI
Menstruacion
Días Ciclo Menstrual
Transcriptómica endometrial+
Inteligencia artificial
2011
Transcriptómica endometrial 2002
Innovation
Definición de predictor transcriptómico
• Algoritmo matemático que aprende a distinguir entre clases etiquetadas a partir de un set de referencia a partir de datos transcriptómicos
Machine learning
Picture obtained from http://www.theplaidzebra.com/artificial-intelligence-evolution/
Búsqueda de patrones en los datos
Y=aX+n
SVM
KNN
Innovation
Ultrasound ≥ 7mm trilaminarendometrium
LH+days
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Estrogen Progesterone FSH LH
LH+7
Menstrual cycle days
Biopsia endometrial
WOI
Progesterona P+5
Innovation
1 spot = 1 oligonucleótido = 1 gen
Transcriptómica
Matriz de datos
Innovation
Transcriptómica RNA seq
Innovation
2
¿Cómo trabajan los predictores?
Training set
NOT INFORMATIVE
INFORMATIVE
Sample
1 3 4 5 6
1 2 2 3 31
Class
Innovation
Unknown samples are
Allocated to the class
according to the training set
Class2?
Machine learning statistics to discriminate
Class
1 2 2 3 31
Sample
1 3 4 5 62
Training set
¿Cómo trabajan los predictores?
Innovation
Validación cruzada
Original
Data Set
100%
Labelled
Training Set
80%
Test Set
20%
Training fold
Training fold
Training fold
Training fold
Training fold
Training fold
Training fold
Training fold
Training fold
Validation
K=10 folds
Classification
algorithm
Error stimation
Prediction parametersN=5 times
Innovation
Aprendizaje supervisado vs no supervisado
Machine Learning
Supervised Unsupervised
Learns from labelled data and
classify unknown data
i.e.Predictors
Learns from unlabelled
data to find classes
i.e.Clustering
Innovation
De los primeros predictores a su aplicación en Medicina Reproductiva
70-80s60-70s1956
McCarthy “Artificial
Intelligence”
Desarrollo primeros
algoritmos matemáticos
DNA microarray
Schena et al., 1996
201090s
Endometrial
Receptivity microarray
Diaz-Gimeno y cols. 2011
Primeros predictores:
• Reconocimiento escritura
• Predicción del tiempo
• Reconocimiento facial
1996 2000s
Clasificacion
en función de la
expresion génica
2002
Firma génica del
riesgo de metastasis
en cancer de mama
Multitud de publicaciones utilizando
predictores transcriptómicos en diferentes
ámbitos de la medicina
The FDA project: MAQC-II Nat BiotechGuidelines for predictors in Medicine
Uso de predictores en Biología:
• Predicción génica
• Predicción estructura proteica
2017 20182013
Reproducibilidad y consistencia de
la transcriptomica endometrial
Comparación con Noyes
Diaz-Gimeno y cols, 2013
Transferencia embrionaria
personalizada basada en el
perfil transcriptómico
Ruiz-Alonso et al., F&S 2013
2016
Reentrenamiento del ERarray
utilizando la transcriptomica
como referencia
RIF Signature
Koot y cols.,2016
Estratificación transcriptómica WOI
Díaz-Gimeno y cols, F&S 2017
Nueva taxonomía de RIF
WOI desplazada
WOI alterada
Sebastián-León y cols, 2018
2011
van't Veery cols. Nature, 2002
van de Vijver y cols. NEJM, 2003
Innovation
Firma del riesgo de cáncer de mama
Primer estudio que aplica las firmas de expresión génica a CÁNCER DE MAMA basado en datos obtenidos de microarrays de ADN (van't Veer et al. Nature, 2002)
Validación clínica (van de Vijver et al. NEJM, 2003)
23
Innovation
Firma del riesgo de cáncer de mama
24
Agrupamiento supervisado de las 70 genes más significativos como
firma predictivo del riesgo de recurrencia
van't Veer et al. Nature, 2002
Agrupamiento no supervisado de 5000 genes significativos
Innovation25
Firma del riesgo de cáncer de mama
▪Validación clínica
▪ Seguimiento
▪Metástasis ▪ Sin metástasis
25
van de Vijver et al. NEJM, 2003
Innovation
26
van de Vijver et al. NEJM, 2003
Firma del riesgo de cáncer de mama
Innovation
Microarray Quality Control Consortium
27
Se establecen las guías y bases para el uso de predictores en clínica
• The FDA project: MAQC-II in 2010
Diagnóstico transcriptómico usando machine learning aprobado por la FDA (Food and Drug Administration)
MAQC/SEQChttps://www.fda.gov/ScienceResearch/BioinformaticsTools/MicroarrayQualityControlProject/
Innovation
Endometrial Receptivity Array (ERarray)
238 genes
R
NR
Supervisado por LH Díaz-Gimeno et al., 2011
Agrupamiento supervisado por LH con los
238 genes más significativos como firma
predictiva de la receptividad endometrial
Diaz-Gimeno et al. F&S, 2011
Patented in 2009: PCT/ES 2009/000386
Díaz-Gimeno y cols, 2014
Innovation
Consistencia y mejora con respecto a la histología. LH como referencia
Pathologist 1 (P1) Pathologist 2 (P2) P1 vs P2 ERA
Kappa value0.618 (0.446-
0.791) 0.685 (0.545-
0.824) 0.622 (0.435-
0.839)0.922
(0.815-1.000)
0.61 - 0.80 - Good Concordance 0.81 - 1.00 - Very Good Concordance
Díaz-Gimeno et al., F&S 2013
Hits
Failures
Díaz-Gimeno et al., F&S 2013
Innovation
Díaz-Gimeno y cols, 2014
Ruiz Alonso y cols., 2013
Diaz-Gimeno y cols. 2014
Aplicación Clínica días de Progesterona
Aplicación clínica utilizando HRT
Innovation
Clasificación Hormonal Clasificación Transcriptómica
N=14
N=14N=39
N=12
Diaz-Gimeno et al, F&S 2013
LH+13
LH+11
LH+1
LH+4
LH+7
Day 8-12
N=20 N=13
N=7
N=8
N=20
N=10
PFPS PF PS
PR
R
EPR
LPR
R
LR
Diaz-Gimeno, et al. F&S, 2017
Grupos transcriptómicosSupervisado por día pico LH
Nueva taxonomía de la WOI
Innovation
Reentrenamiento del ERarray: Estratificación de la WOI
Díaz-Gimeno. Window of implantation subsignatures. Fertil Steril 2017.
Innovation
R-LPR RR LR R-PS ERA 1.0-2.0
N 79 132 9 8 n(R1)=228
PR 65.8 56.8 66.6 37.5
IR 49.6 47.5 23.1 28.6
OPR 76.9 80* 33.3* 100
CPR 15.4 13.3 16.6 -
BPR 7.7 6.6* 50* -
RNR NR Diaz-Gimeno et al., F&S, 2011
PF EPR LPR RR LR PS Supervisado por transcriptómica
Pregnancy area
IR=48.30%
PR=60.20%
OPR=78.83%
CPR=14.10%
BPR=7%
N=102 RR D5
PR= 62.70%
OPR=81.3%
CPR=12.50%
BPR=6.25%
N 0 1 165 132 9 12 n=321
Estratificación de la WOI: seguimiento clínico
Diaz-Gimeno, et al. F&S, 2017
Innovation
Koot et al., 2016
Innovation
Comparación firmas predictivas
Diaz-Gimeno et al., 2011 Koot et al.,2016
HLA-GDKK1
Innovation
Macklon F&S, 2017 Valdes et al.,F&S, 2017
Hipótesis derivadas
Innovation
Taxonomía Transcriptómica del RIF Endometrial
IF: 4.990
Innovation
16 firmas transcriptómicas
11 firmas de genes de dataje endometrial
5 firmas de genes asociadas al fallo de
implantación recurrente
Innovation
Signature
nameParticipants Endometrial dating Samples day/condition (n) Array platform Cut-off
Nº
genesReference
Kao Normally cycling women; not to be pregnant; no history of endometriosis Urinary LH; Histologically confirmed LP d8-10 (n=4) vs MS LH+8-10 (n=7) Affymetrix Genechip Hu95Aabs(FC)>2 & p-
value<0.05350 Kao et al., 2002
Carson Fertile volunteers Urinary LH; Histologically confirmed ES LH+2-4 (n=3) vs MS LH+7-9 (n=3) Affymetrix Genechip Hu95A abs(FC)>2 718 Carson et al.,2002
Riesewijk Normally cycling women Urinary LH; Histologically confirmed PR LH+2 (n=5) vs R LH+7 (n=5) Affymetrix Genechip Hu95A
abs(FC)>3 in at least
four out of five
women
200 Riesewijk et al., 2003
BorthwickNormally cycling women; No hormone therapy within 3 months before the
biopsy. Urinary LH; Histologically confirmed P d9-11 (n=5) vs R LH+6-8 (n=5) Affymetrix Genechip Hu95A N/A 119
Borthwick et al.,
2003
PonnampalamNormally cycling women. Not use hormonal contraception in the 3 months
prior tissue collection.Histological dating
EP (n=5) MP (n=7) LP (n=3) ES (n=7) MS
(n=8) LS (n=7) Mens (n=6)Home made adj-p-value <0.05 313
Ponnampalam et al.,
2004
MirkinNormally cycling oocyte donors; Proven fertility. Use of condom contraception
during the preceding and study cyclesUrinary LH & Histological dating ES LH+3 (n=3) vs MS LH+8 (n=5) Affymetrix Genechip Hu95A
abs(FC)>2 & adj-p-
value<0.05106 Mirkin et al., 2005
PunyadeeraNormally cycling volunteers who came to the clinic for a diagnostic
laparoscopy as part of their fertility work-up, or for a sterilisation procedureHistological dating Mens d2-5 (n=2) vs LP d11-14 (n=2) Affymetrix HG-U133A FC & p-value 53
Punyadeera et al.,
2005
TalbiNormally cicling women undergoing hysterectomy or endometrial biopsy. No
steroid hormonal medication within 3 months of endomentrial sampling.Histological dating
P (n=6) vs ES (n=3) vs MS (n=8) vs LS
(n=6)
Affymetrix HG-U133 Plus
2.0
abs(FC)>1.5 & adj-p-
value <0.05324 Talbi et al., 2006
Carrascosa Literature review N/A N/A Quantitative RT-PCR Literature review 192Carrascosa et al.,
2017
Diaz-Gimeno Normally cicling donors. Natural cycles Urinary LHPR LH+1-5 (n=15) vs R
LH+7 (n=5) Affymetrix HG-U133A
abs(FC)>3 & adj-p-
value<0.05238
Diaz-Gimeno et al.,
2011
Bhagwat Data compilation N/A PR vs R Several platforms Literature search 179 Bhagwat et al., 2013
Tapia Different type of patients depending on the pregnancy events HRT RIF (n=5) vs B (n=6) vs SF (n=6)
Two-colors cDNA set from
the human UniGEM 2.0
library
abs(FC)>2 21 Tapia et al., 2008
Bersinger patients undergoing treatment by IVF and embryo transfer N/A IF (n=3) vs M (n=3) vs OP (n=3)Affymetrix Human Genome
U133A 2.0 ChipsNo details explained 98 Bersinger et al., 2008
Altmäe2010
No ovarian stimulation before the study. Normal hormonal levels, normal
ovarian function and normal mid-secretory endometrial thickness. Normal
tubal patency in hysterosonosalpingography and no recognizable
endometriosis. LH+7
Urinary LH UI (n=4) vs C (n=5)
Whole Human Genome
Oligo Microarray (Agilent
Technologies)
abs(FC)>3 & PFP
<0.05260 Altmäe et al., 2010
Altmäe2017 Meta-analysis N/A N/A N/A RRA 57 Altmäe et al., 2017
Koot
Regular menstrual cycles; a normal uterine cavity confirmed by hysteroscopy;
endometrial thickness of the late follicular phase ≥7mm in ultrasonography;
Natural cycle
Urinary LH RIF (n=43) vs C (n=72)
human whole genome gene
expression microarrays V2
(Agilent, Belgium)
Machine learning
predictors signature
discovery
310 Koot et al., 2016
Innovation
Genes en común entre las distintas firmas
Innovation
LH+5 LH+8
WOI
Innovation
Diseño Modelo Predictivo para RIF desplazado (WOI desplazada)
Sebastian-Leon et al., Human Rep 2018
LH+5 LH+8
WOI
ER (LH+5-LH+6)
R (LH+7)
LR (LH+7-LH+8)
Innovation
Diseño Modelo Predictivo para RIF patológico (WOI patológica)
Sebastian-Leon et al., Human Rep 2018
Limma Linear models (Ritchie et al.,2015)
Controls vs RIF
InnovationSebastian-Leon et al., Human Rep 2018
WOI desplazada
WOI patológica
WO
I pat
oló
gica
WOI desplazada
Innovation
Fold
1
Fold
2
Fold
3
Fold
8
Training
ValidationFold
4
Fold
5
Fold
6
Fold
7
Fold
9
Fold
10
Training set 80%
Test set 20%
Original Data Set
100%
Classification algorithm
Modelos de predicción entrenados para distinguir desplazamientos o patología
FINAL MODEL PERFORMANCE
80% 20% 10 fold X 5 times
Innovation
Subset 1
Subset N
Diaz-Gimeno
ALtmae2017
Ran
do
m g
en
es
Ge
ne
sig
nat
ure
es
.
.
.
.
.
.
.
.
Accuracy comparison
Cálculo de la precisión de cada modelo en función de las firmas de genes
Accuracy
Accuracy
Accuracy
Accuracy
Innovation
Whole Trancriptome
Random listN
Size = m
mean
Confidence Interval
95%
Random distribution for accuracy for lists
of size = m
Qué es lo que esperamos por azar?
Random list1
Size = m
Random list2
Size = m
Accuracy
Accuracy
Accuracy
Innovation
2
accu
racy
Gene size1 m
Signature 1
Signature 2
Signature M
Better than expected by chance
Worse than expected by chance
Random Size=m , 10 times
InnovationSebastian-Leon et al., Human Rep 2018
WOI desplazada
WOI patológica
WO
I pat
oló
gica
WOI desplazada
Innovation
Nueva Taxonomía RIF Endometrial
Sebastian-Leon et al., Human Rep 2018
La proporción de pacientes con ventana de implantación patológica medida por transcriptómica, presentaba diferencias significativas en su mayor proporción en la población clasificada por criterios clínicos como RIF
Innovation
Network Biology
A discrete biological function can only rarely be attributed to an individual molecule. Instead, most biological characteristicsarise from complex interactions between cell’s constituents.
Biological networks provide a mathematical representation of complex interactions, considering molecular components within a cell as nodes and their direct or indirect interactions as links
Barabasi et al. 2004.
Innovation
Network concepts
Random Network Scale-free network
Barabasi et al. 2004.
Innovation
Network concepts
Degree: Number of nodes adjacents to the node of interest
degree=4
degree=3
degree=7
Innovation
Network concepts
Betweenness centrality: reflects the amount of control that this node exerts over the interactions of other nodes in the network. This measure favors nodes that join communities (dense subnetworks), rather than nodes that lie inside a community.
between=0.8
between=0.01
between.=0.2
Innovation
Network concepts
Module: Groups of nodes more connected between them than with the other nodes in the network
Innovation
Barabasi et al., 2011
Figure 1. Disease and essential genes in the interactome(a) Of the approximately 25,000 genes, only about 1,700 have been associated with specific diseases. In addition, about 1,600 genes are known to be in utero essential, i.e., their absence is associated with embryonic lethality. (b) Schematic illustration of the differences between essential and non-essential disease genes. Non-essential disease genes (illustrated as blue nodes) are found to segregate at the network periphery whereas in utero essential genes (illustrated as red nodes) tend to be at the functional center (encode hubs, expressed in many tissues) of the interactome.
Hubs: Non-essential disease genes (representing the majority of all knowndisease genes) tend to avoid hubs and segregate at the functional periphery ofthe interactome. In utero essential genes tend to associated with hubs.
Local hypothesis: Proteins involved in the same disease have an increasedtendency to interact with each other.
Corollary of the local hypothesis: Mutations in interacting proteins often leadto similar disease phenotypes.
Disease module hypothesis: Cellular components associated with a specificdisease phenotype show a tendency to cluster in the same networkneighborhood.
Network parsimony principle: Causal molecular pathways often coincide withthe shortest molecular paths between known disease-associated components.
Shared components hypothesis: Diseases that share disease-associatedcellular components (genes, proteins, metabolites, miRNAs) show phenotypicsimilarity and comorbidity.
Network Medicine
Innovation
Redes de co-expresión: regulación propia del tejido
A B C D E
A 1 0.12 0.69 0.15 0.85
B 0.12 1 0.18 0.19 0.97
C 0.69 0.18 1 0.21 0.98
D 0.15 0.19 0.21 1 0.72
E 0.85 0.97 0.98 0.72 1
Correlation matrix Coexpression network
Datos de expresión génica
Innovation
PF LPR
RR
LR
PS
EPR
Sebastian-Leon et al., Submitted 2019
Redes de co-expresión: regulación propia del tejido
Innovation
Farmacología de sistemas
Un fármaco
Una enfermedad Una diana
Paul Ehrlich, 1908
Farmacología de sistemas
Multiples causas de la enfermedad Multiples dianas
Complex network
59
Tratamiento para la enfermedad
Un fármaco
Innovation
Farmacogenómica
Dianas
priorizadas
Estudio SNPsModelo de farmacología de sistemas
Distintos Patrones de respuesta a fármacosen la población
Fármaco/diana y sus relaciones moleculares
Innovation
Farmacología de sistemas en Reproducción
García-Acero et al., 2017
Innovation
Funciones y genes relacionados con reproducción
Sebastian-Leon et al., SRI 2018
Innovation
Innovation
El terminal
Innovation
Lenguaje estadístico R
▪ https://www.r-project.org/
Innovation
FIVIbio
128 GB RAM
18 TB
32 cores
adevesa
16 GB
3 TB
8 cores
psebastian
32 GB
3 TB
12 cores
pgarcia
8 GB
1 TB
16 cores
jsanchez
8 GB
1 TB
4 cores
ssh FIVIbio
User
Password
128 GB RAM
32 cores
600GB
Storage
8 GB RAM
18 TB
Computational infraestructure
aaleman
32 GB
3 TB
12 cores
practicas
8 GB
1 TB
4 cores
Innovation
Medicina de Precisión: Mirnezami, NEJM 2012
•La Medicina Genómica prove de un entendimiento más profundo de las
enfermedades basado en el análisis masivo de datos generados por las
nuevas tecnologías genómicas. Estos hallazgos inevitablemente necesitan
de la reclasificación de los estados de la enfermedad desarrollando “una
nueva taxonomía de la enfermedad” o de los procesos (Mirnezami, 2012),
generando una medicina de mayor precision, especialmente para los
procesos complejos y multifactoriales.
Innovation
Medicina Reproductiva Genómica y de Sistemas
▪ PhD trainees
▪ Almudena Devesa Peiró. PhD Student FPU
▪ Pablo García Acero. PhD Student FIVI fellowship
▪ Josefa María Sanchez-Reyes. PhD Student GVA
▪ Bioinformaticians:
▪ Patricia Sebastián-León, PhD. Data Scientist
▪ Alejandro Alemán Ramos. Computational Scientist
▪ MD PhD trainees
▪ Begoña Martínez Montoro. IVI-RMA Pamplona.
▪ Evelin Lara. IVI-RMA Barcelona
▪ TFM students
▪ Hector Badenes. Bioinformatics UV
▪ Rosa Ferrando. Bioinformatics UV
▪ Ismael Henarejos. Bioinformatics UV
Innovation
El equipo
Medicina Reproductiva Genómica y de Sistemas