lezione 3 - unifem.docente.unife.it/silvia.fuselli/dispense-corsi/bag... · 2014. 10. 14. ·...
TRANSCRIPT
Lezione 3
Genoma umano come esempio di genoma eucariote
3.2 x 109 bp 22 autosomi + xx (femmina) o xy (maschio) Primo draft di sequenza: 2001 • Genotipo: sequenza di DNA, sia nucleare che mitocondriale. (Per le piante anche il DNA del
cloroplasto) • Fenotipo: l’inisieme dei tratti che si osservano, incluse proprietà macroscopiche come
l’altezza, il peso, il colore di occhi e capelli; incluse proprietà microscopiche come un’eventuale anemia falciforme, la deficienza della glucoso-6-fosfato deidrogenasi, o la capacità di digerire il lattosio oltre lo svezzamento.
• Storia personale: l’insieme delle esperienze e l’ambiente fisico e psicologico in cui ci si sviluppa. Fattori come la nutrizione, gli stimoli intellettuali, le esperienze nell’ambiente uterino hanno grande influenza sullo sviluppo individuale.
• Fattori epigenetici: ogni tessuto differenziato ha un suo set di geni espressi o silenziati. Durante lo sviluppo, reazioni chimiche precise e interconnesse attivano o disattivano parte del genoma in momenti e posizioni strategiche. Questi controlli possono cambiare durante la vita e rispondono a stimoli esterni come dieta stress etc. http://learn.genetics.utah.edu/content/epigenetics/
Genoma umano
• Regioni codificanti proteine (uomo: 2-3%)
• Regioni codificanti RNA strutturali (es. rRNA)
• DNA moderatamente ripetitivo • Famiglie geniche come actina, globine
• Geni per RNA ribosomali (ripetuti in centinaia di copie)
• tRNA (50 siti ognuno con 10/100 copie nell’uomo)
• Geni per istoni in molte specie
• Elementi ripetuti a funzione non nota (es. SINE (tra cui le Alu nei primati) e LINE) e altamente ripetuti (es. mini e microsatelliti o STR), Telomeri (corte unità ripetitive TTAGGG nell’uomo)
• Regioni intergeniche non ripetute
• Regioni funzionali ancora da definire con esattezza (ENCODE http://www.nature.com/encode/#/threads)
Genomi eucarioti
The transposable element content of the human genome About 45% of the human genome can currently be recognized as being derived from transposable elements, the vast majority of which are non-LTR retrotransposons such as L1, Alu and SVA elements. L1, LINE-1; LTR, long terminal repeat.
Distribuzione nel genoma dei diversi tipi di marcatori molecolari polimorfici
Tassi di mutazione
I microsatelliti (short tandem repeats, STRs)
Sequenze ripetitive di 2-5 paia di basi in tandem
Regioni codificanti il proteoma
• Genoma umano: ~ 20.000 geni codificanti proteine. Alcune regioni povere: regioni subtelomeriche, cromosoma 18 e X. Viceversa il 19 e il 22 sono relativamente ricchi.
http://www.ensembl.org/Homo_sapiens/Location/Genome
Molte bande G scure
Molte bande G chiare
Regioni codificanti il proteoma
• Esoni e introni (con eccezioni): lunghezza media di un esone: 200 bp
• La grande varietà di dimensione dei geni dipende soprattutto dagli introni: gene per l’insulina 1.7 kb, LDL receptor 5.45 kb, dystrophin gene 2400 kb
• Esistono regioni codificanti su entrambi i filamenti
http://www.ensembl.org/
Un esempio specifico: la famiglia delle globine
Il lucus α-globin sul cromosoma 16
p13.3 NCBI map viewer: regione genomica p13.3 cromosoma 16 Regione 100k-200k NCBI map viewer > human > cromosome 16
The α-globin locus: Cinque geni espressi, ζ, αD, α2, α1, e θ1, e due pseudogeni, ψζ e ψa1
Il lucus β-globin sul cromosoma 11
NCBI map viewer: regione genomica p15 cromosoma 11 Regione 5M-5.5M The β-globin locus:
Quattro geni espressi e uno pseudogene
Numerose duplicazioni e divergenze
Paraloghi: geni che si sono originati da un antenato comune in seguito a duplicazione genica.
L’ordine dei geni sul cromosoma ha un significato: la trascrizione segue rigidamente lo sviluppo dell’organismo. Embrione (fino a 6 settimane dopo il concepimento): tetramero ζ2ε2. A seguire, fino a ceirca 8 settimane dopo la nascita la specie predominante diventa l’emoglobina fetale, α2γ2, segue poi l’emoglobina adulta, principalemente α2 β2.
L'emoglobina nell' adulto e di tipo HbA 96% α2β2, HbA2 α2δ2 3% e HbF α2γ2 1%
β-Globin region: geni codificanti e Locus Control Region, che consiste di cinque DNAse hypersensitive segments.
Controllo dell’espressione del cluster β: locus control region
Feto: interazione tra il locus control region e i geni Gγ and Aγ genes, mediata da proteine. Cerchi blu: complessi di rimodellamento della cromatina.
Cerchio azzurro: complesso proteico PYR che lega la regione ricca di pirimidine (YR; Y = pirimidine) al 5′ del gene. Questo legame riconfigura il sistema: PYR blocca il controllo “fetale”, menter la locus control region promuove l’espressione del gene β.
Proviamo a recuperare i seguenti dati da Genbank e da altre banche dati di NCBI
(esercizio simile all’esame)
• Quanto è grande la regione codificante il gene per l’emoglobina HBA1? • Risposta: la regione codificante (CDS) è composta da 429 nucleotidi incluso lo stop
codon (nel dettaglio Esone 1*: 95 bp; Esone 2: 205; Esone 3*: 129)
*sono incluse solo le basi che codificano, esclusi i 5’ e 3’ UTR
• Quanti esoni e quanti introni? • 3 esoni e 2 introni
• Qual è la sequenza della proteina? • MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGKKVA
DALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR
• Ci sono malattie conosciute che siano state messe in relazione con mutazioni a questo gene? SI, vedi OMIM 141800
• Si conoscono le mutazioni specifiche? SI, vedi OMIM 141800 ALLELIC VARIANTS
Possiamo per esempio usare il numero di accesso GenBank: NG_000006.1 e cercare tra i geni della regione l’HBA1
Proviamo a recuperare gli stessi dati da ENSEMBL
• Esempio: ENST00000320868
Proviamo a cercare le informazioni su lunghezza di esoni e introni del
gene CYP2D6 in genbank