rnaseq et ngs - · pdf fileselection of polya+ rna by beads or oligodt priming (only...
TRANSCRIPT
RNAseq et NGS
Journée Transcriptomique| Evry 10 juin 2014
Adriana Alberti – Karine Labadie
LES TECHNOLOGIES
METHODE SANGER
ABI 3730 xl
NGS 2ème génération
Pyroséquençage
- Roche 454 GS-FLX+
/ Roche GS Junior
Séquençage Illumina
- HiSeq / MiSeq /
NextSeq500…
Séquençage SOLiD
Séquençage PGM / Ion
Proton
NGS 3ème génération
PacBio
Nanopore
LES ORGANISMES
EUCARYOTES
animaux
plantes
champignons
protistes
BACTERIES
ARCHEES
VIRUS
METAGENOMES
LES SOURCES
ADN GENOMIQUE
ARN / cDNA
AMPLICONS
BACs ET FOSMIDES
Journée Transcriptomique| Evry 10 juin 2014
Séquençage et Diversité
Adriana Alberti – Karine Labadie
LES APPLICATIONS
Genome : de novo sequencing; targeted re-sequencing;
whole genome re-sequencing
Epigenome: methylation analysis, Chromatine
Immunoprecipitation Sequencing (ChIP-Seq)…
Metagenome and Amplicon Sequencing
Transcriptome : whole transcriptome analysis; small
RNA analysis; gene expression profiling
Séquençage et Diversité
LES TECHNOLOGIES
METHODE SANGER
ABI 3730 xl
NGS 2ème génération
Pyroséquençage
- Roche 454 GS-FLX+
/ Roche GS Junior
Séquençage Illumina
- HiSeq / MiSeq /
NextSeq500…
Séquençage SOLiD
Séquençage PGM / Ion
Proton
NGS 3ème génération
PacBio
Nanopore
Journée Transcriptomique| Evry 10 juin 2014 Adriana Alberti – Karine Labadie
Journée Transcriptomique| Evry 10 juin 2014
Solid Ion PGM Ion Proton
Quelles différences?
Le Principe
La Quantité et la Qualité des données
Les Longueurs de Lectures
Les Modes de Lecture
Impact sur les applications
2006 2007 2008 2009 2010 2011 2012 2013 2014
NGS : de perpétuelles évolutions
GS 20
GA HiSeq MiSeq
2em
e g
én
éra
tio
n
3em
e
gén
éra
tio
n
GS Flx
NextSeq500
Adriana Alberti – Karine Labadie
Journée Transcriptomique| Evry 10 juin 2014
NGS : des spécifications très variées
Un compromis entre le nombre de lectures attendus et leurs longueurs
Output range Run time Expected Reads Maximum Read Length
454 / Roche GsFlx + 800 Mb 1 day 1 M 800 bp
MiSeq 0,3 - 15 Gb 5 - 60 h 15-25 M 2 x 300 bp
HiSeq 2000 100 - 600 Gb 2 - 11 days 3000 M 2 x 100 bp
HiSeq 2500 rapid run 10 - 180 Gb 7 - 40 h 300 M 2 x 150 bp (2 x 250 bp)
HiSeq 2500 high-output 50 - 1000 Gb 1-6 days 2000 M 2 x 125 bp
HiSeq Xten 1600 - 1800 Gb < 3 days 3000 M 2 x 150 bp
SOLiD 25 - 100 Gb 1 - 15 days 1400 M 75 bp
Ion PGM 30 Mb - 2 Gb 2 - 7 h 0,5 - 5 M 400 bp
Ion Proton 10 Gb 2 - 4 h 60 - 80 M 200 bp
Pacific Bioscience PacBio RS II 275 - 375 Mb 3 h 0,05 M 30 Kb
Oxford Nanopore MinIon 100 Mb 6 h ? 50 Kb
Illumina
Life Technologies
Adriana Alberti – Karine Labadie
Evolution débit / coût du séquençage de 2001 à 2013
11 JUIN 2014
1 Mb / jour
20 => 700 Mb / jour
1 => 160 Gb / jour
5.000 $ / Mb
0,03 $ / Mb
2005
2007
2013
Journée Transcriptomique| Evry 10 juin 2014
NGS : la course au diminution de coûts …
Adriana Alberti – Karine Labadie
Evolution débit / longueur de lecture de 2001 à 2013
11 JUIN 2014
Journée Transcriptomique| Evry 10 juin 2014
1 Mb / jour
20 => 700 Mb / jour
1 => 160 Gb / jour
900 bases
2 x 150 bases
700 bases
NGS : des longueurs de lectures…
Adriana Alberti – Karine Labadie
Journée Transcriptomique| Evry 10 juin 2014
NGS: avantages et inconvénients
454 Roche Illumina SOLiD Ion PGM
Ion Proton PacBio
AVANTAGES
Séquençage de
longs fragments
(=> 800 bases)
Débit élevé
Taux erreur
<2%
Coût
Large domaine
d’applications
Débit (150
Gb/sem)
Coût
Taux erreur <1%
Pas de système
optique mais un
détecteur
électronique
Utilisation de
nucléotides non
marqués
Capacités
dépendantes
des puces
Pas
d’amplification
Rapidité (3
bases/sec)
Longueur de
lecture (5 Kb en
moyenne)
INCONVENIENTS
Préparation des
banques
(emPCR)
Taux erreur
élevé (homo-
polymères)
Coût élevé
(systèmes
enzymatiques)
Débit limité
Lectures
courtes (haut
débit)
Fréquence des
évolutions
techniques et
logicielles
Taille des
fichiers
générés
Faible
complexité
(haut débit)
Préparation des
banques
(emPCR)
Lectures courtes
Complexité
d’analyse
Préparation des
banques
(emPCR)
Difficulté à
séquencer les
homopolymères
Coût
Taux d’erreur
élevé (~15%)
Photo-
inactivation de la
polymérase
Coût
Un avantage pour la technologie Illumina (60% du marché)
Adriana Alberti – Karine Labadie
Journée Transcriptomique| Evry 10 juin 2014
RNAseq: an approach for multiple applications
To catalogue all species of transcripts (mRNA, non coding RNA, small
RNA..)
To determine the transcriptional structure of genes (start site, 5’ and 3’
ends, splicing patterns)
To annotate de novo genomes
To perform gene expression profiling
To detect polymorphisms (CNV, SNP, micro indels)
Adriana Alberti – Karine Labadie
Journée Transcriptomique| Evry 10 juin 2014
Differents RNA, different questions, different
library preparations
Next generation sequencing protocol
cDNA, not RNA sequencing
Types of libraries available
Total RNA sequencing (stranded or not)
polyA+ RNA sequencing
Small RNA sequencing
Sequencing options
Single or paired end reads
Different lenghts (from 100 bp up to 300 bp)
Adriana Alberti – Karine Labadie
Journée Transcriptomique| Evry 10 juin 2014
rRNA removal strategies
Generally, rRNA have to be removed by:
rRNA removal treatments (ex RiboZero): you keep tRNA, small RNA,
cytoplasmic and chloroplastic mRNA at various maturation steps
BUT smallRNA are lost during library preparation
( specific small RNA library preparation methods are available)
Selection of polyA+ RNA by beads or oligodT priming (only cytoplasmic
mature mRNA are retained)
Adriana Alberti – Karine Labadie
Journée Transcriptomique| Evry 10 juin 2014
rRNA depletion
or polyA+ capture by beads
AAAAAAA TTTTTTTTT
RNA fragmentation
cDNA synthesis by
oligo-dT priming
cDNA fragmentation
cDNA synthesis by
random priming
Total RNA
Library preparation
Cytoplasmic mature mRNA AAAAAAA
NNNNNN NNNNNN NNNNNN Random
hexamers
TTTTTTTTT Oligo(d)T
cDNA preparation methods
polyA + capture
by oligo dT priming
Adriana Alberti – Karine Labadie
RNAseq strategy has to be choosen based on characteristics of your study
- Eukaryotic or prokaryotic study?
- For eucaryotes: which RNA target? polyA+ mRNA or more?
- Is your sample challenging in terms of quantity and quality?
Laser capture microdissection
FFPE samples
Environmental samples
Single cells
11 JUIN 2014
Different RNAs, different questions, different strategies
Journée Transcriptomique| Evry 10 juin 2014 Adriana Alberti – Karine Labadie
Journée Transcriptomique| Evry 10 juin 2014
METHODS
OligodT priming
Random priming
Random priming with
coding strand
information
SAMPLE TYPE
Eukaryotic total RNA
(RIN 7-10, >100 ng)
Prokaryotic total RNA
Small quantity of RNA,
single cell
(RIN 7-10)
LCM and FFPE samples,
degraded samples
(RIN 2-7)
In summary…
Adriana Alberti – Karine Labadie
Merci pour votre attention
Journée Transcriptomique| Evry 10 juin 2014 Adriana Alberti – Karine Labadie