社外資料 truseq synthetic long-read dna library prep...microsoft powerpoint -...
TRANSCRIPT
© 2014 Illumina, Inc. All rights reserved.Illumina, 24sure, BaseSpace, BeadArray, BlueFish, BlueFuse, BlueGnome, cBot, CSPro, CytoChip, DesignStudio, Epicentre, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, HiSeq X, Infinium, iScan, iSelect, ForenSeq, MiSeq, MiSeqDx, MiSeqFGx, NeoPrep, Nextera, NextBio, NextSeq, Powered by Illumina, SeqMonitor, SureMDA, TruGenome, TruSeq, TruSight, Understand Your Genome, UYG, VeraCode, verifi, VeriSeq, the pumpkin orange color, and the streaming bases design are trademarks of Illumina, Inc. and/or its affiliate(s) in the U.S. and/or other countries. All other names, logos, and other trademarks are the property of their respective owners.
© 2014 Illumina, Inc. All rights reserved.Illumina, IlluminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, NuPCR, SeqMonitor, Solexa, TruSeq, TruSight, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners.
TruSeq Synthetic Long- Read DNA
ライブラリー調製キット
イルミナ株式会社マーケティング部
2
TruSeq Synthetic Long-Read DNAライブラリー調製キットは、現時点ではHiSeqのみサポートしています。
解析は、BaseSpaceで実施していただきます。
必要準備品が複数ございます。事前にご確認をお願いします。
TruSeq Synthetic Long-Read DNA ライブラリー調製キット使用にあたっての注意点
3
イルミナのDNAライブラリー調製キット
TruSeq DNAPCR-Free
TruSeqNano DNA
NexteraMate Pair
TruSeqSynthetic
Long-ReadNextera Nextera XT
概要PCRがもたら
すバイアスを削除
少ないDNA量で新たな標準
キット
長いインサートでゲルフ
リー
複数のアプリケーションに
対応
微量、迅速、MiSeq
超微量、微生物、
MiSeq
アッセイ時間 ~5時間 ~6時間 1.5日 3日 1.5時間 1.5時間
アプリケーション
全ゲノム 全ゲノムDe novo構造変化
ゲノムフィニッシング、
De novoフェージング
全ゲノム
アンプリコン
プラズミド
小さいゲノム
必要量 1ug+ 100ng+ 1ug+ 500ng 50ng 1ng
インデックス 96 96 48 (gel-free) 96 96
インサート 350 or 550bp 350 or 550bp 約8kbp 10kbp ~300bp ~300bp
NEW
4
Library Prep Barcoding Sequencing Analysis
TruSeq Synthetic Long-Read ワークフローSample to Answerのトータルソリューション
HiSeqのみサポート
5
TruSeq Synthetic Long-Read ワークフロー
DNA断片化&ライゲーション• ゲノムDNA 500ngをCovarisで約10Kbに断片化• 両端に増幅用のアダプターをライゲーション• 精製、サイズ選択および定量
DNA断片の希釈および増幅• ウェルあたり数百分子程度になるように384ウェ
ルプレートに希釈• ロングレンジPCR反応でDNA断片を増幅
バーコード化およびライブラリー調製• Nexteraによるタグメンテーション• ウェルごとに固有のバーコードを付加• ライブラリーのプーリング、精製、サイズ選択
(ビーズ使用)• 電動ピペット推奨
シーケンス• ライブラリーをまとめてHiSeqで解析
6
TruSeq Synthetic Long-Read ワークフローショートリードからロングリードを合成
100bp x2 の区分け• バーコード情報を元に区分け• ウェル単位にリード配列を分割
100bp x2 のクオリティ前処理(ウェルごと)• PCRエラーの修正
コンティグ & アセンブル(ウェルごと)• ウェルごとにコンティグを作成• アセンブルを実行してロングリードを構築
ロングリード完成• 各ウェルから得られた~10Kbのロングリード
(FASTQ)
7
BaseSpaceで2つのアプリケーションを解析サポート
De novoロングリードヒトゲノム専用フェージング
8
製品名(Library Prep) カタログ番号
TruSeq SYNTH Long-Read DNA Library Prep Kit (4 Samples) FC-126-1001
TruSeq Synthetic Long-Read 製品情報
製品名(Barcoding) カタログ番号
TruSeq SYNTH Long-Read DNA Barcode Kit (1 Sample) FC-126-1002
TruSeq SYNTH Long-Read DNA Barcode Kit (4 Samples) FC-126-1003
製品名(Optional) カタログ番号
TruSeq SYNTH Long-Read DNA Accessory Kit FC-126-1004
9
バーコードキットの利用方法
30x 全ゲノムVCFデータ(フェーズ
なし)
ヒト gDNA500ng
Phased VCF
1x Analysis
高出力あるいはRapid 1レーン
1x Library Prep
1x Barcode Prep
フェージング
LR LibraryPrep Kit
Barcode Plate
gDNA 500ng
ロングリードFastq
4x Barcode Prep
4x Analysis
• 100bp x 2のラン設定• 高出力の場合、1レーン/バーコードプレート• Rapidの場合、2レーン/バーコードプレート
Barcode Plate
Barcode Plate
Barcode Plate
Barcode Plate
LR LibraryPrep Kit
1x Library Prep
ロングリードFastq
ロングリードFastq
ロングリードFastq
ロングリード
10
gDNA 500ng
ロングリードFastq
4x Barcode Prep
4x Analysis
• 100bp x 2のラン設定• 高出力の場合、1レーン/バーコードプレート• Rapidの場合、2レーン/バーコードプレート
Barcode Plate
Barcode Plate
Barcode Plate
Barcode Plate
LR LibraryPrep Kit
1x Library Prep
ロングリードFastq
ロングリードFastq
ロングリードFastq
ロングリード
バーコードキットの利用方法de novoロングリードの場合
バーコードプレートあたり、約600Mbのロングリードのセットを構築(目安)
1サンプルスタート
1ライブラリー調製
複数のバーコードプレートを使用(必要数は次スライド参照)
バーコードプレートごとにシーケンスを実施
バーコードプレートごとに解析を実施
11
• イネのゲノムサイズ = 400Mb• 5xのデータ量で1サンプルをde novo解析• 400Mb x5 = 2Gb 必要• 2Gb / 600Mb = 4バーコードプレート必要
gDNA 500ng
ロングリードFastq
4x Barcode Prep
4x Analysis
• 100bp x 2のラン設定• 高出力の場合、1レーン/バーコードプレート• Rapidの場合、2レーン/バーコードプレート
Barcode Plate
Barcode Plate
Barcode Plate
Barcode Plate
LR LibraryPrep Kit
1x Library Prep
ロングリードFastq
ロングリードFastq
ロングリードFastq
ロングリード
イネ(400Mb)をde novo解析するには
ライブラリー調製キットFC-126-1001(4サンプルキット)1キット購入し、1サンプル分を調製
バーコードキットFC-126-1002(4サンプルキット)1キット購入し、4プレートを使用
600Mb x 4 = 2.4 Gb
高出力の場合、4レーンRapidの場合、8レーン必要
12
ゲノムサイズ
N50(>1.5kb)
(bp)
ロングリード(1.5Kb以上)に
アセンブルできた塩基数
アカパンカビ 41 Mb 8,285 1,417Mb
線虫 102 Mb 9,125 1,182 Mb
トキソプラズマ 65.6 Mb 8,847 1,052Mb
イネ 420 Mb 7,095 1,088Mb
トウモロコシ 2.3 Gb 6,129 597Mb
ロングリード解析例:ゲノムサイズ、複雑性の異なる生物種で実施
0
10
20
30
40
50
60
70
80
90
100
%GC Reference %GC Long-Reads %Aligned toReference
%Misassembled
%
Neurospora crassa C. Elegans Toxoplasma gondii Oryza sativa Zea mays
13
ゲノムサイズN50 (>1.5kb)
(bp)
ロングリード(>1.5kb)
にアセンブルされた塩基数
パイナップル TBD 6640 824Mb
昆虫 TBD 7,002 814Mb
TruSeq Synthetic Long-Read 使用例
0
500
1000
1500
2000
2500
3000
3500
4000
4500
1500
2100
2700
3300
3900
4500
5100
5700
6300
6900
7500
8100
8700
9300
9900
10500
11100
11700
12300
12900
13500
14100
14700
Num
ber o
f Lon
g Re
ads
Read Length (bp)
昆虫
0
1000
2000
3000
4000
5000
6000
7000
1500
2100
2700
3300
3900
4500
5100
5700
6300
6900
7500
8100
8700
9300
9900
10500
11100
11700
12300
12900
13500
14100
14700
Num
ber o
f Lon
g Re
ads
Read Length (bp)
パイナップル
14
TruSeq Synthetic Long-Read Nexteraメイトペア
原理
• DNAを約10kbに断片化(ロングフラグメント)した後、さらにNextera でタグメンテーション
• もとのロングフラグメントすべてを、ショートリードで読み取り、アセンブルして合成ロングリードを構築
• DNAを約5~8kbに断片化(ロングフラグメント)した後、環状化
• 環状化した接点を抽出しシーケンス(ロングフラグメントの末端配列のみを解析)
目安となるゲノム 40Mbサイズ以上のゲノム 主に微生物でよく使われる
DNAスタート量 500ng ゲルフリー 1ugゲルあり 4ug
最終産物 約10kbをアセンブル5~8kb離れたDNA断片の
両端のみシーケンス
インデックス 利用不可 12プレックス
ライブラリー調製にかかる時間
3日 1.5日
ライブラリーコスト 高 安
対応システム HiSeq HiSeq, NextSeq, MiSeq, GA
シーケンス100bp x2(高出力v3の場合)
1バーコード1レーン(高出力の場合)150bp x2
30~60xカバレッジ推奨
解析 BaseSpace専用アプリメイトペアリード解析が可能なソフトウェア
BaseSpaceアプリ(Spades, Velvet)
Nextera Mate Pairとの違い
15
Library Prep Barcoding Sequencing Analysis
TruSeq Synthetic Long-Read DNA ライブラリー調製キットSample to Answer – トータルソリューション