antonio barbadilla group genomics, bioinformatics &...
TRANSCRIPT
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
ANTONIO BARBADILLA
Group Genomics, Bioinformatics &
Biological Evolution
Institut Biotecnologia i Biomedicina
Departament de Genètica i Microbiologia
UAB, Barcelona
Spain
1
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 2 Antonio Barbadilla
R. C. Lewontin
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 3 Antonio Barbadilla
http://genomica.uab.cat/base/base3.asp?sitio=IIIjgbeb&anar=juegofrases
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 4 Antonio Barbadilla
R. C. Lewontin
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 5
Patrones de variación a lo largo de todo el genoma, dentro y entre especies
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 6
Population genomics approach
Gran capacidad exploratoria tanto en el nivel de explicación genómica
como en el nivel multiómico
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 7
Population genomics
Importancia relativa de los determinantes genómicos de la variación genética (tasas procesos genéticos fundamentales –rec,mut-, arquitectura genómica)
• Variación genética = f(Δrecombinación, Δmutación, densidad génica, regiones funcionales, composición nucleotídica,
cromosomas, regiones crom)
• Interacción selección - recombinación – mutación – densidad génica
• Interacción selección - recombinación -> Efecto Hill-Robertson
Nivel genómico
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 8
• Diversidad genómica y variantes genómicas
+• Anotaciones de genómica funcional
(transcriptómica, epigenómica…)
Una visión global (sistémica) de las causas y efectos evolutivos y funcionales de la variación genómica
Nivel multiómico
Population genomicsIntegración de grandes
conjuntos de datos ómicos
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Trudy F. C. Mackay
A Community Resource for the Study of Genotypic and Phenotypic Variation in
model organism
Funded by the US National Human Genome Research Institute
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
The Drosophila Genetic Reference Panel DGRP
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
The Drosophila Genetic Reference Panel –DGRP
Sequencing of a D. melanogaster genetic reference panel of 192 wild-type inbred lines sampled from a single natural population (Raleigh, North Carolina, USA)
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Raw data: 158 genomes D. melanogaster DGRP project (Freeze 1).205 genomes D. melanogaster DGRP project (Freeze 2).
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 13
(a) Implementación de un navegador de genómica de poblaciones para la visualización de las secuencias, anotaciones y estimas de diversidad y selección (PopDrowser)36;
(b) Primera descripción a escala genómica de la variación nucleotídica17 y de indels30,31 en D. melanogaster;
(c) nueva extensión del test de McDonald y Kreitman32 (MKT) de detección de la selección que permite estimar y cuantificar hasta cinco regímenes de selección distintos en datos de polimorfismo y divergencia17,33;
(d) Primer mapa exhaustivo de la selección natural adaptativa y purificadora a lo largo de un genoma17, donde se observa que la selección natural es ubicua en el genoma, y que la importancia de los diferentes regímenes de selección varía en función de las clases de sitios funcionales y las regiones del genoma17,33;
(e) Primer mapa de bloques de selección ligada a lo largo del genoma34,35; (f) Descubrimiento de un valor umbral de recombinación a partir del cual la adaptación
genómica alcanza un máximo34,37; (g) Primera cuantificación del coste del ligamiento o interferencia Hill-Robertson en un
genoma37; (h) Medida de la adaptación y el constreñimiento selectivo a lo largo del ciclo de vida de D.
melanogaster38; (i) Nueva aproximación metodológica para cartografiar la adaptación y el constreñimiento
selectivo sobre la anatomía completa del embrión de D. melanogaster.
Main achievements of the two previous projects
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 14
Primera descripción a escala genómica de
la variación nucleotídica y de indels en
D. melanogaster
TFC Mackay et al. Nature 482, 173-178 (2012) doi:10.1038/nature10811
Polymorphism / divergence / recombination
and the rate of recombination
Site class Spearman’s ρ
Prob
rec < 2 cM/Mb 0.471 p < 2.2 e-16
rec ≥ 2 cM/Mb -0.0044 p = 0.987
Recombination data: Fiston-Lavier, et al. Drosophila melanogaster recombination rate calculator. 2010. Gene. doi:10.1016/j.gene.2010.04.015
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 16
rumbral
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 17
Primer mapa exhaustivo de la selección
natural adaptativa y purificadora a lo largo
de un genoma
TFC Mackay et al. Nature 482, 173-178 (2012) doi:10.1038/nature10811
25,2% diferencias fijadas son adaptativas
α = 1- [(π0-fold/π4-fold) / (k4-fold/k0-fold)]
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)Coste del ligamiento (Extraído de la tesis doctoral de M. Barrón 2015, UAB)
The Hill-Robertson interference, (HRi) 1966The efficiency of selection acting simultaneously at linked sites can be considerably reduced in
regions of low recombination.
+
-
0
No recombination Free recombination
2 or more adaptive mutations
Adaptive+
deleterious mutations
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 20
ropt
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Relación entre recombinación y adaptación en el genoma de D. melanogaster. La tasa de
adaptación de una región genómica incrementa con la tasa de recombinación hasta llegar a un valor
umbral de recombinación (2 cM/Mb) en el que la tasa de adaptación alcanza un techo. El área rayada
representa la reducción adaptativa del genoma debida al coste del ligamiento, cuyo valor se ha
estimado por primera vez y es del 27%.
Primera cuantificación del coste del
ligamiento o interferencia Hill-
Robertson en un genoma
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Primer mapa de bloques de selección
ligada a lo largo del genoma
22
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 23
ropt•ropt define un techo óptimo de recombinación para la tasa de adaptación de un genoma
•El coste del ligamiento, la iHR, es substancial -> 27% en D. melanogaster
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Dos nuevos parámetros ropt y la iHR
ropt y la iHR definen el potencial adaptativo de un genoma y deberían formar parte del conjunto de parámetros básicos que se estiman en un análisis genómico futuro
• ¿los valores de ropt y la iHR estimados representan una propiedad genómica de la especie en su conjunto o por el contrario los valores son sensibles a la historia demográfica?
• ¿reflejan quizás una depresión genómica asociada a la colonización de la población analizada?
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Dos nuevos parámetros ropt y la iHR
Recurso genómico poblacional formidable
• 623 genomas completos • espectro geográfico de distribución actual
de D. melanogaster• 300 individuos de una población de
Zambia (la supuesta región ancestral de la especie).
• Todas las secuencias ensambladas con el genoma de referencia de la especie
Estudio comparativo para estimar ropt y la iHR en distintas poblaciones y especies.
The Drosophila Genome Nexus: A Population Genomic Resource of 623 Drosophila melanogaster Genomes, Including 197 from a Single Ancestral RangePopulation. Justin B. Lack, Charis M. Cardeno, Marc W. Crepeau, William Taylor, Russell B. Corbett-Detig, Kristian A. Stevens, Charles H. Langley, John E. PoolGENETICS Early online January 27, 2015; DOI: 10.1534/genetics.115.174664
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 26
The Drosophila Genome Nexus Project: .
• The Nexus data is a formidable
resource for population genomic
studies, comprising more than 600
worldwide wild-derived Drosophila
melanogaster genome sequences
from 36 populations out of 17
countries.
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Nueva aproximación metodológica
para cartografiar la adaptación y el
constreñimiento selectivo sobre la
anatomía completa del embrión de D. melanogaster.
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 28
• GP: Inventario de los genes o regiones de un genoma
sobre los que se han estimado los parámetros que capturan sus propiedades evolutivas (polimorfismo, pi; divergencia, K; fracción de fijaciones adaptativas, α; tasa local recombinación, r; tasa mutación, mu; …)
• Anotaciones multiómicas (niveles de transcripción, estados epigenéticos...)
• Regiones anatómicas y/o etapas del ciclo vital
Un salto cualitativo en los estudios fenotípicos de la adaptación -> medida de la selección sobre la completa morfología en t y s
“multiómica de poblaciones”Integración de grandes conjuntos
de datos ómicos
+
+
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Objetivo 1:
Genómica de poblaciones comparada entre poblaciones geográficas de D. melanogaster y entre las especies D. melanogaster y D. simulans
Objetivo 2:
Mapa de la adaptación y el constreñimiento selectivo en el embrión y la larva de D. melanogaster y en el cerebro humano
Objetivo 3.
Descripción de los patrones de variabilidad genómica y epigenómica en la especie humana y determinación de la influencia del estado cromatínicosobre la evolución del genoma
Objetivo 4.
Estudio de los efectos de la conservación epigenómica sobre la eficacia de la selección natural en las regiones reguladoras distales (cis-regulatorymodules
Objetivo 5.
Mantenimiento, actualización, ampliación, integración y creación de recursos bioinformáticos
Genómica y epigenómica de poblaciones en Drosophila y la especie humana
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Genómica de poblaciones en Drosophila y la especie humana
• Estimar en más poblaciones y especies la magnitud del coste del ligamiento (iHR) de un genoma y el valor de recombinación óptima en el que dicho coste desaparece.
Objetivo 1:
Genómica de poblaciones comparada entre poblaciones geográficas de D. melanogaster y entre las especies D. melanogaster y D. simulans
• Aplicar la nueva metodología que hemos desarrollado para cartografiar la selección que actúa en la morfología completa del embrión de D. melanogaster y del cerebro humano
Objetivo 2:
Mapa de la adaptación y el constreñimiento selectivo en el embrión y la larva de D. melanogaster y en el cerebro humano
• Creación y mantenimiento de recursos bioinformáticos
Objetivo 5.
Actualización y ampliación del pipeline y del navegador de genómica de poblaciones (PopFly)
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Genómica de poblaciones en Drosophila y la especie humana
• Estimar en más poblaciones y especies la magnitud del coste del ligamiento (iHR) de un genoma y el valor de recombinación óptima en el que dicho coste desaparece.
Objetivo 1:
Genómica de poblaciones comparada entre poblaciones geográficas de D. melanogaster y entre las especies D. melanogaster y D. simulans
Genómica de poblaciones comparada para definir el potencial adaptativo de un genoma
• Distintas poblaciones de D. melanogaster
• Entre las especies D. melanogaster y D. simulans.
• Para cada población y especie
• Valor iHR
• Umbral de recombinación
• Importancia de la historia demográfica de las poblaciones sobre los parámetros medidos y
determinar cómo estos valores difieren entre especies próximas.
Paquete en R que automatice la estimación de iHR y umbral de recombinación
Variación descompuesta en la parte debida a la recombinación, la mutación y la densidad génica.
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Genómica y epigenómica de poblaciones en Drosophila y la especie humana
• Aplicar la nueva metodología que hemos desarrollado para cartografiar la selección que actúa en la morfología completa del embrión de D. melanogaster y del cerebro humano
Objetivo 2:
Mapa de la adaptación y el constreñimiento selectivo en el embrión y la larva de D. melanogaster y en el cerebro humano
(a) Mapa de la adaptación y el
constreñimiento selectivo en el embrión y
la larva de D. melanogaster
(b) Mapa de la adaptación y el
constreñimiento selectivo en el cerebro
humano
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Genómica y epigenómica de poblaciones en Drosophila y la especie humana
• Aplicar la nueva metodología que hemos desarrollado para cartografiar la selección que actúa en la morfología completa del embrión de D. melanogaster y del cerebro humano
Objetivo 2:
Mapa de la adaptación y el constreñimiento selectivo en el embrión y la larva de D. melanogaster y en el cerebro humano
(a) Mapa de la adaptación y el constreñimiento
selectivo en el embrión y la larva de D. melanogaster
• Completar este mapa expresión espacial de 1199 genes de la base
de datos FlyExpress a más de 8000 genes datos recientemente
publicados
• Visión más detallada de cuándo y dónde ocurre la adaptación en el
desarrollo
• Desde el inicio del período embrionario hasta el tercer período
larvario
• Planteamos probar la hipótesis que los estados más activos y con
un contacto directo con el ambiente, como el larvario, muestran
mayor evidencia de selección adaptativa.
Metodología
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Genómica y epigenómica de poblaciones en Drosophila y la especie humana
• Aplicar la nueva metodología que hemos desarrollado para cartografiar la selección que actúa en la morfología completa del embrión de D. melanogaster y del cerebro humano
Objetivo 2:
Mapa de la adaptación y el constreñimiento selectivo en el embrión y la larva de D. melanogaster y en el cerebro humano
(b) Mapa de la adaptación y el constreñimiento
selectivo en el cerebro humano
Trazar un mapa de la selección natural del cerebro
humano para describir la adaptación y el constreñimiento
(aproximación del objetivo 2ª).
Hawrylycz et al. cartografía el transcriptoma completo del
cerebro adulto humano (> 20.000 genes)
Gran resolución diferentes estructuras anatómicas (aprox.
900 subdivisiones neuroanatómicas).
Datos GP: Divergencia (nuevo ensamblaje de la secuencia genómica del gorila) y versión hg19 del genoma humano de referencia. Polimorfismo: Alineamientos del proyecto 1000GP.
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 37
1. Se ha cuantificado el valor de recombinación óptima y coste al ligamiento de un genoma en una población de D. melanogaster, y se quiere saber como estos parámetros fundamentales varían entre poblaciones y especies.
2. Hemos ideado una nueva aproximación para cartografiar la selección en una unidad anatómica o morfológica, como por ejemplo un embrión, una larva o un órgano, y queremos poner a prueba esta metodología en dos fenotipos estelares de la biología evolutiva: el embrión de D. melanogaster y el cerebro humano.
Conclusiones Conclusiones
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges) 38
The future of
Population
Genomics isbright
Conclusiones
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)
Bioinformatics of Genome DiversityGenomics, Bioinformatics and Evolution
Research group
Maite Barrón
David Castellano
Miquel Ràmia
Sònia Casillas
Raquel Egea
Montse Torres
Carles Monterrubio
Integrative Population Genomics
III – JGBEB (16 Junio 2016, Sitges)