by na 1 linkage hapmap lezione 4. by na 2 2 definizione della regione candidata con analisi di...
TRANSCRIPT
By NA 1
Linkage HapMap
Lezione 4
By NA 2
Definizione della regione candidata con analisi di linkage: ricostruzione degli aplotipi studiando la segregazione nelle famiglie. E’ necessario risalire alla fase e identificare i ricombinanti
88338822771010
10104466441166
88338822771010
10103322335588
88338822771010
553355331177
883388442233
10103322335588
775544666622
886633221188
665522662222
222211995555
225522555555
114411337755
665522662222
665522662222
222211995555
336655557788
774444225544
225522662222
114411337755
222211995588
665522662222
775544666622
886633221188
222211662222
774444225544
336655557788
665522662222
665522662222
Linkage:fase di piu locus
Possedere un particolare polimorfismonon vuol dire avere il fenotipo, lo studio di linkage e’ a livello di popolazione, serve ad individuare una regione non la mutazione
By NA 3
Ci possono essere inconvenienti che complicano la possibilita’ di assegnare
un locus a una regione definita da marcatori:
Linkage possibili inconvenienti
Errori umani: errata lettura dei dati, scambio di campioni, paternita’……
Errori nell’interpretazione del fenotipo: un falso ricombinante.Se i
marcatori sono molti e vicini la presenza di un doppio ricombinante fa
sospettare un errore Eterogeneita’ genetica: famiglie con fenotipo simile vengono
accorpate e non si riesce a trovare il linkage. Sclerosi tuberosa: due
loci distinti
E ’ importante disporre di numerosi siti polimorfici, che
non siano soggetti a dominanza e recessivita’. I
polimorfismi del DNA sono l’ideale!
By NA 4
SE I LOCI NON SONO ASSOCIATI LA PROBABILITA’ E’ 1/2 X 1/2 X 1/2 X1/2 = 1/16=0.0625
AB
AB
ab
ab
AB
ab
ab
ab
ab
ab
ab
ab
AB
ab
Ab
ab
NON RICOMBINANTI
RICOMBINANTE
SE LA FREQUENZA DI RICOMBINAZIONE E’ 10%
LA P DI 3 NR E 1R=0.1X0.9X0.9X0.9=0.073=7.3%
Non ho la possibilita’ di scegliere fra le due ipotesi: solo un gran numero di osservazioni mi potrebbe permettere di riconoscere quale e ’ la situazione piu’ probabile NON ESISTE NULLA CHE POSSA SOSTITUIRE I GRANDI NUMERI….COME POSSIAMO OTTENERE GRANDI NUMERI NELL’UOMO???
Probabilita’ di trovare ricombinanti
SE I LOCI SONO ASSOCIATI LA PROBABILITA DIPENDE DA QUANTO SONO DISTANTI
NB non si conosce la loro posizione reciproca quindici sono due possibilita’
By NA 5
Come fare il linkage
Il calcolo del linkage e’ quindi statistico:occorre una progenie numerosa
e bisogna conoscere la fase (aplotipo)
dei parentali.
Si ricorre al lod score
come si fa visto che le famiglie umane
sono di solito piccole?
By NA 6
Il linkage e’ una relazione di vicinanza fra due loci ed e’ funzione della lorodistanza. La definizione di un linkage fra due loci si basa su calcoli statisticiche permettono di quantizzare la probabilta’ che i risultati ottenuti non siano dovuti al caso . Nel caso dell’uomo l’analisi della progenie di una singola famigliararamente fornisce informazioni sia per lo scarso numero di meiosi sia per la difficolta’ di risalire alla fase. Bisogna mettere insieme i dati provenienti da piu’ famiglie.
Linkage-lod score
Oddsratio=
P di un assortimento genetico in una progenie se i geni sono associati
P di un assortimento genetico nella progenie se i geni sono indipendenti
Lod score: logaritmo in base 10 dei singoli rapporti di ogni famiglia, si possono cosisommare. Un valore di 3 indica linkage.
(1-n r
(1/2)n+r
By NA 7
LOD SCORE
LOD SCORE (Z): logaritmo della probabilita’ che i loci siano associati (data la frazione di ricombinazione ) piuttosto che non associati (0.5). La probabilita’ complessiva di un gruppo di famiglie e’ il prodotto delle probabilta’ di ciascuna famiglia, percio’ la somma dei lod score. Per = 0.5, Z=0:infatti sono il rapporto fra probabilta’ identiche e log10(1)=0. Z=3(1000:1) e’ la soglia per accettare il linkage con una probabilita’ di errore del 5%. Z=-2 esclude il linkage.
43210
0 0.1 0.2 0.3 0.4 0.5Frequenza di ricombinazione
Z
Z Oddsratio=
P di un assortimento genetico in una progenie se i geni sono associati
P di un assortimento genetico nella progenie se i geni sono indipendenti
(1-n r
(1/2)n+r
By NA 8
La connessione fra mappe
Quindi si hanno due tipi di mappe: fisica e genetica. Il problemae’ trovare il modo di legarle: la mappa fisica mi dice in che ungruppo di sequenze formano un contiguo su un frammento dicromosoma, ma non mi permette di identificare geni candidati.La mappa genetica me lo permetterebbe perche’ non riguarda specifiche sequenze, ma anche locus di cui non conosco la sequenza.Non posso pero’ studiare il gene candidato perche’ non ho la sequenza corrispondente.
La possibilita’ di utilizzare STS e EST polimorfici hapermesso di risolvere il problema
By NA 9
Gli STS: Sequence Target SiteL’automazione del sequenziamento permette di sequenziare corte sequenze (300pb) clonate a caso da cui ricavare primers per “screenare” con la PCR ormai automatizzata le librerie e costruire mappe fisiche attraverso la creazione di contigui . Quando sono polimorfiche sono marcatori comuni alle mappe sia genetiche che fisiche e permettono di legarle fra loro
DNA genomico
Clonaggio
Sequenziamento
GACTTAG........CATAGCA ~300bp
STS A,B,C..
scelta dei primers x A,B,C..
screeninglibrary conPCR
A+,B-,C+..
A-,B+,C+..B+,D+,G+
H+,F+,T-.. F+,T-,Q+..
H F*Q
A* C B*
D G*
mappa fisica:contiguo
1 2
A C B D G H F Q
mappa genetica: A, G e F sono in linkage il loro ordine e’ F-A-G
A C B D GH F Q
I due contigui sono sullo stessocromosoma e via cosi....
By NA 10
Confronto fra mappa fisica e genetica
By NA 11
Ci possono essere inconvenienti che complicano la possibilita’ di assegnare
un locus a una regione definita da marcatori:
Linkage possibili inconvenienti
Errori umani: errata lettura dei dati, scambio di campioni, paternita’……
Errori nell’interpretazione del fenotipo: un falso ricombinante.Se i
marcatori sono molti e vicini la presenza di un doppio ricombinante fa
sospettare un errore Eterogeneita’ genetica: famiglie con fenotipo simile vengono
accorpate e non si riesce a trovare il linkage. Sclerosi tuberosa: due
loci distinti
E ’ importante disporre di numerosi siti polimorfici, che
non siano soggetti a dominanza e recessivita’. I
polimorfismi del DNA sono l’ideale!
By NA 12
Riconoscere i ricombinanti
R
By NA 13
Doppio ricombinante?
By NA 14
Il linkage disequilibrium e’ una situazione per cui un particolare aplotipo e’ statisticamente piu’ probabile in un sottogruppo di una popolazione. Indica che la popolazione deriva da un comune ancestore o, nel caso delle mutazioni patogene, che la mutazione e’ avvenuta su un cromosoma ancestrale comune alla popolazione. Il linkage disequilibrium non ha niente a che fare con la presenza della mutazione patogena e’ una osservazione che facilita la mappatura genetica. Indica che fisicamente associato al locus A polimorfico c’e’ un altro locus che, quando mutato origina la malattia. Essendo un fenomeno legato all’origine comune degli individui della popolazione, in un’altra popolazione il disequilibrium riguardera’ un altro allele del locus A
Linkage disequilibrium
By NA 15
E’ necessario considerare tutte le cause dell’associazione: il linkage disequilibrium e’ solo una delle cause
Linkage disequilibrium
Causa-effetto e selezione naturale: Un certo allele rende piu’ suscettibili a manifestare la malattia o permette alle persone malate di sopravvivere e di avere figli
Errori per la stratificazione della popolazione o per mancata correzione statistica: se una popolazione e’ composta di sottoinsiemi geneticamente distinti entrambi i marker possono essere piu’ frequenti, ma senza che questo implichi un’associazione. Nel secondo caso i dati non vengono confermati da studi successivi
By NA 16
Dati ottenuti su 114 famiglie britanniche con un figlio affetto. Il cromosoma CF, identificato perche’ presente nell’affetto, tende a portare gli alleli X1 e K2.
CHR CF(254 con mut)
CHR NORMALI(318 wild-type)
APLOTIPO ALLELE diXV-2C
ALLELE diKM-19
numero percentuale numero percentuale
A 1 1 17 6.7 74 28.9
B 1 2 218 86.5 35 16.4
C 2 1 7 2.8 110 44
D 2 2 10 4 31 10.7
Incerto 2 4
Fibrosi Cistica e linkage disequilibrium
Il gene della Fibrosi Cistica e’ stato clonato grazie alla presenza del linkage disequilibrium.
By NA 17
Potrebbe essere causa delldell’’effetto del fondatoreeffetto del fondatore: la mutazione potrebbe essere comparsa in un antenato della popolazione Nord-Europea che portava l’aplotipo B e probabilmente gli eventi di ricombinazione non hanno avuto sufficiente tempo per rispristinare una situazione di equilibrio, cioe’ ad una associazione casuale. Cio’ significa anche che gli eventi di ricombinazione sono rari tra il gene CF e i due marcatori cioe’ il locus malattia eil locus malattia e’’ strettamente associato ai due marcatori XV-2C e KM-19 strettamente associato ai due marcatori XV-2C e KM-19
La presenza di un particolare aplotipo potrebbe conferire un vantaggio selettivo vantaggio selettivo nellnell’’individuoindividuo che lo porta (come accade per gli antigeni HLA: particolari aplotipi sembrano migliorare la risposta immunitaria e percio’ sono sottoposti a pressione selettiva)
La conoscenza del linkage disequilibrium oltre a dare una indicazione della localizzazione precisa del locus malattia, risulta utile per la consulenza: permette di calcolare con maggiore precisione il rischio di trasmissione. Es: normalmente 1/25 portatori nella popolozione nord-europea, ma se un individuo ha aplotipo BB il rischio e’ maggiore, mentre e’ molto ridotto per aplotipi AA.
Possibili cause del linkage disequilibrium
By NA 18
Origine del linkage disequilibrium (LD)
Alla sua comparsa, una nuova mutazione è in LD (grigio) con tutti I loci dello stesso cromosoma. Attraverso le generazioni
la ricombinazione riduce progressivamente l’area di LD. Contano soprattutto:
1. Tasso di ricombinazione 2. Numero di generazioni
By NA 19
Consortium. 2005. A haplotype map of the human genome. Nature 437: 1299-1320.
Nature 449: 851-861, 2007.
By NA 20
HapMap I
By NA 21
... more than one million SNPs for which accurate and complete genotypes have been obtained in 269 DNA samples from four populations, including ten 500-kilobase regions in which essentially all information about common DNA variation has been extracted.
These data document the generality of recombination hotspots, a block-like structure of linkage disequilibrium and low haplotype diversity, leading to substantial correlations of SNPs with many of their neighbours.
We show how the HapMap resource can guide the design and analysis of genetic association studies, shed light on structural variation and recombination, and identify loci that may have been subject to natural selection during human evolution.
HapMap I
By NA 22
We show that 10–30% of pairs of individuals within a population share at least one region of extended genetic identity arising from recent ancestry
We demonstrate increased differentiation at non-synonymous, compared to synonymous, SNPs, resulting from systematic differences in the strength or efficacy of natural selection between populations.
HapMap II
By NA 23
HapMap I
La % di ricombinazione, in una regione campione di 500kb e’ discontinua: 80% delle ricombinazioni in 15% della sequenza. HOT SPOT di ricombinazione
By NA 24
HapMap II
Hotspots account for approximately 60% of recombinationin the human genome and about 6% of sequence
Il genoma e’ ereditato a blocchetti
By NA 25
linkage disequilibrium
m
By NA 26
HapMap
The number of tag SNPs that contain most of the information about the patterns of genetic variation is estimated to be about 300,000 to 600,000, which is far fewer than the 10 million common SNPs.
linkage disequilibriumconseguenze:
By NA 27
Science 319:1100-1104 (2008)
By NA 28
Nature 451:998-1003 (2008).
By NA 29
Science 22 febbraio 2008
Heterozigosity
By NA 30
Nature 21 febbraio 2008
Linkage disequilibrium / distanza
By NA 31
By NA 32