introduzione al sequenziamento di nuova generazione

31
INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Upload: loreto-maggi

Post on 01-May-2015

232 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Page 2: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

SANGER SEQUENCING

Page 3: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Tre aziende:454 (Roche; www.roche-applied-science.com, 454 GS 20, 454 GS Flex, 454 Titanium

Illumina/Solexa (www.illumina.com; Genome Analyzer (GA 'classic' and GAII)

Applied Biosystems (www. appliedbiosystems.com, SOLiD™ System, Solid 3)

SEQUENZIAMENTO DI NUOVA GENERAZIONE

Page 4: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Si basano sul principio del sequenziamento di 'cluster' clonali

Il processo, che incomincia con una singola molecola target, prevede la creazione di targets clonali durante un processo intermedio di amplificazione. Copie multiple identiche sono infatti necessarie per avere un alto rapporto segnale-rumore

Sequenziamento mediante sintesi (SBS) Sequenziamento

mediante ligazione (SBL)SOLID

Chimica con terminatori

SOLEXA

Chimica del pirosequenziamento

454

SEQUENZIAMENO DI NUOVA GENERAZIONE

Page 5: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Sequenziamento Sanger ad alta processività

PREPARAZIONE DELLA LIBRERIAFrammentazione casuale del DNA genomico

clonazione e trasformazione in batteri

Raccolta delle colonie

Purificazione del DNA dalle colonieSequenziamento Sanger

Elettroforesi capillare

Whole genome de novo assembly or mappingto a reference (re-sequencing)

7-10 giorniassumendo di possedere una piattaforma robotica

per alta processività

Settimane-anni (!), dipendentemente dalla dimensione del genoma (e copertura richiesta), dal numero di sequenziatori capillari

Page 6: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

PREPARAZIONE DELLA LIBRERIAFrammentazione casuale del DNA genomico

Ligazione degli adattatori

Amplificazione clonale dei frammenti

Sequenziamento mediante sintesi o ligazione

Processamento delle immagini

Mappatura delle reads su un genoma di riferimento (o assemblaggio de novo)

1 – 3 giorni

1 – 6 giorni

Sequenziamento di nuova generazione

Page 7: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Vantaggi delle piattaforme di nuova generazione

• Non sub-clonazione, non utilizzo di cellule batteriche E. coli- abolizione di bias di clonazione

- rapidità nel preparare le librerie (non c’e’ colony picking!)

• Ciascuna sequenza proviene da una molecola di DNA unica.

- quantificazione attraverso 'conta' digitale

- aumento del range dinamico- rilevazione di varianti rare

• Fornisce una eccezionale risoluzione per molti tipi di esperimenti (es. analisi di espressione, sequenziamento di DNA immunoprecipitato, di RNA piccoli, analisi di medie/grandi inserzioni-delezioni nei genomi….)

• Rivoluzionaria diminuzione del costo e del tempo per generare dati di sequenza (lavorano in multi-parallelo)

• Richiesta meno robotica nelle fasi precedenti al caricamento sul sequenziatore

Page 8: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Svantaggi delle piattaforme next-gen

• Sono prodotte sequenze più corte- relativamente alle sequenze da sequenziatori capillari (metodo Sanger)

- è necessario ri-parametrizzare l’accuratezza della procedura di chiamata delle basi

- enorme difficoltà nell’analisi dei dati; richiesto un grande sforzo di programmazione per costruire nuovi algoritmi.

• La mole enorme di dati ‘traumatizza’ le infrastrutture informatiche.

- da 10 Gb a diversi Tb di dati grezzi prodotti per corsa (dipende dalla piattaforma)

- il processamento delle read tramite pipeline informatiche richiede molta capacità di calcolo (CPU)

- è necessario prendere accurate decisioni su cosa salvare e cosa cancellare

Page 9: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Sequenze corte• Sequenze corte, ma tecnologia in continua evoluzione:

• 454: 100 basi → 200 → 400-500 → ?• Solid: 25 basi → 35 → 50 → 100 → ?• Illumina: 32 → 36 → 75-100 → 125 → 150 → ?

• Difficoltà di assemblare sequenze corte de novo, soprattutto per il problema delle sequenze ripetute complicato ancora di più rispetto a Sanger (lunghezza media 700-750bp)

Page 10: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Risequenziamento

• In presenza di un genoma di riferimento di buona qualità posso effettuare un ri-sequenziamento e allineare tutte le reads ottenute:

• Non solo del genoma, ma anche del trascrittoma

Genomic DNA

IntronsExonsExons

Page 11: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Paired-end (PE)• Tutte le piattaforme next-gen offrono la

possibilità di produrre ‘paired-end read’, cioè la sequenza può essere derivata da ciascuna delle due estremità di ogni frammento della libreria

• Esistono differenze nella distanza tra le due read pair-end, basate su un diverso approccio/piattaforma.

• In generale, le reads paired-end offrono vantaggi che dipendono dalla complessità del genoma e dall’applicazione/tipo di esperimento

Page 12: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Il problema (!) della enorme mole di dati prodotta• E’ un problema chiave che limita una più ampia adozione di questi

strumenti da parte dei laboratori

• 1 ABI3730xl genera fino un max di 260 milioni di paia di basi di sequenza all’anno

• Quando nel 2004-2005 è stato lanciato il primo 454 produceva una quantità di dati in un anno superiore a quella prodotta da più di 50 ABI3730xl

• Il problema dell’ ‘indigestione’ di dati è dal 2005 ulteriormente peggiorato sia per il 454 che a causa della possibilità di scelta anche delle altre due piattaforme (Illumina/Solexa lanciata sul mercato nel 2006 e Solid nel 2007)

• Produzione una decina di gigabytes di dati per corsa per 454, 1-4 terabytes di dati per corsa per Illumina e Solid

Page 13: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Statistiche sulle tre piattaforme

Page 14: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

VERSO IL GENOMA DA MILLE DOLLARI....

• Costo 1 anno Sanger, reads 700bp: – 1 anno, 1 sequenziatore a pieno regime=260 Mbp– 260 Mbp=circa 370.000 sequenze (lunghezza media

700bp)=370.000 EUR– EUR/base=0,0014– Sequenziamento di un genoma batterico (es E. coli, 4.5Mbp) con

copertura 10x=64.000 EUR– 1 genoma umano (dimensione 3.6 Gbp), copertura 1x=60 anni (!)

=5M EUR

• Costo 1 corsa, Illumina 2x75bp:– 10 giorni, 1 sequenziatore=fino a 18 Gbp– 18 Gbp=10,000 EUR– EUR/base= 0,00000055– Sequenziamento di un genoma batterico con copertura 10x= 25

EUR– 1 genoma umano (dimensione 3.6 Gbp), copertura 10x=2

corse=20K EUR

Page 15: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

VERSO IL GENOMA DA MILLE DOLLARI....

• Costo 1 corsa 454, reads 300-400bp: – 10 ore, 1 sequenziatore=fino a 0.6 Gbp– 0.6 Gbp=10.000 EUR– EUR/base= 0,000016– Sequenziamento di un genoma batterico (es E. coli, 4.5Mbp) con

copertura 10x= 9.600 EUR– 1 genoma umano (dimensione 3.6 Gbp), copertura 10x=almeno 60

corse (più di 1 mese)=576K EUR

• Costo 1 corsa Solid, reads 2x50bp:– 12 giorni, 1 sequenziatore= 20 Gbp– 20 Gbp = 8.000 EUR– EUR/base=0,00000044– Sequenziamento di un genoma batterico con copertura 10x= 18

EUR– 1 genoma umano (dimensione 3.6 Gbp), copertura 10x= circa 2

corse (1 mese) = 16K EUR

Page 16: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE
Page 17: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

SEQUENZIAMENTO CON LA TECNOLOGIA 454

Page 18: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE
Page 19: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Tecnologia 454

La quantità ottimale di DNA (trasformata da ng/ul in n. di molecole) necessaria per la PCR in emulsione viene determinata tramite una corsa di taratura sul sequenziatore

300-800 bp

Page 20: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Tecnolgia 454

Page 21: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE
Page 22: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Tecnologia 454

Il sequenziamento inizia con la preparazione della piastra PicoTiter. Durante questo passaggio una miscela di beads, enzimi per il sequenziamento e la libreria sstDNA vengono depositati nei pozzetti di 44um Il processo di deposizione delle beads massimizza il numero di pozzetti che contengono un frammento individuale della libreria sstDNALa piastra PicoTiter viene caricata sul sequenziatore

Page 23: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Tecnologia 454

APS=adenosine 5´phosphosulfate PPi=pyrophosphate

Page 24: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

For each cycle four pictures are captured (one picture per nucleotide); FLX standard run: 100 Cycles; FLX Titanium run: 200 Cycles Extraction, Qualification/Quantification and Normalization of wells data

Read data are converted into "flowgrams".

Page 25: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Tecnologia 454

Page 26: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Tecnologia 454 – librerie mate-paired

Page 27: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

Titanium

Page 28: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE

La tecnologia 454 rimpiazzerà i sequenziatori capillari nel

sequenziamento de novo di genomi?

Page 29: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE
Page 30: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE
Page 31: INTRODUZIONE AL SEQUENZIAMENTO DI NUOVA GENERAZIONE