sequence analysis viewer (sav)の使い方と イルミナ株式会社次 … · prephasing scores,...
TRANSCRIPT
© 2012 Illumina, Inc. All rights reserved.
Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium,
iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of
Illumina, Inc. All other brands and names contained herein are the property of their respective owners.
Sequence Analysis Viewer (SAV)の使い方とイルミナ株式会社次世代シーケンサ―におけるランクオリティ評価 酒井名朋子(Nahoko Sakai, Ph.D.) テクニカルアプリケーションサイエンティスト
イルミナ株式会社
2
本日のOutline
SAVでRun の結果を評価する
1. Q30
2. Cluster Density and PF%
3. Phasing/Prephasing
4. Intensity
5. FWHM
Control LaneとPhiX Spike In
SAV Demo
3
Sequencing Analysis Viewer(SAV)とは?
Runの結果を表示させるもの – Runfolder
InterOp フォルダ全体
runInfo.xml
runParameters.xml, GAの場合は(run名).params
7
なぜQ30 で評価するのか?
Q30=Quality Score 30
Q Score = Phred scale
– Base Callされた塩基が間違いである確率を示す
Q30 はRunの総合結果
– 全Runの総計、リード毎、サイクル毎ではない。
Q30 の値は様々な要因に左右される
– >Q30% が良ければRunは成功
Phred
Score
% Error Error の確率
Q10 10% 1 in 10
Q20 1% 1 in 100
Q30 0.1% 1 in 1,000
Q40 0.01% 1 in 10,000
8
Illumina 装置毎のQ Scoreの仕様
http://www.illumina.com/systems/
サイクル数 36 50 100 150
NA >Q30
>85%
>Q30
>80% NA
>Q30
>90% NA
>Q30
>85%
>Q30
>75%
13
Cluster DensityとPass Filter
最適Cluster Density
Pass Filtreとは?
– Chastity Filtering 、クラスタの「純度」
– PFしないリード:
Chastity<0.6のサイクルが25サイクルまでに2サイクル以上検出
Software Version
Recommended
Cluster Density
(K/mm2)
HCS 1.4 (and later) 200-850
SCS 2.8 (and later) 100-800
MCS 1.0.5 (and later) 50-850
14
最適Cluster Densityの重要性
なぜ最適Cluster Densityが重要か?
– Template Generation(cycle1-4 or 5)でClusterを認識できない
Over Clusterになるとどうなるか?
– さまざまなものに影響を与える Q scores, raw cluster number, clusters passing filter, intensity profiles, phasing and
prephasing scores, output data volume, focus scores and image quality.
– Qualityをあげたい場合はCluster Densityを低めで流す
– Cluster Densityが正確に計算されない
– Cluster PF%が極端に下がる
18
PhasingとPrephasingの意義
PhasingとPrephasingは酵素反応や試薬Deliveryの失敗を補正する
– 試薬のライン中でのコンタミ(Washが不十分)
– 試薬の品質(使用期限)
– 室内温度
– 装置のFC・Reagent Chiller温度
バランスの悪い塩基配列の場合計算ができない
21
Run の結果を評価する-(5) FWHM
FWHM :Full Width Half Max
– Intensityが最大値の半分の時のクラスターの幅
ぼんやりとした大きなクラスター 明るくシャープなクラスター
25
コントロールレーンか、Spike Inか
コントロールレーン
– 1レーンすべて
– PhiXもしくはHuman WGサンプル(GC%が40-50%程度)
– CrossTalk MatrixとPhasing Prephasing値を他のレーンに適用
– バランスの悪いサンプル(mRNA、smallRNA、Amplicon)に必須
Spike In
– レーン中に混ぜる(0.5%~30%)
– SAVにてError Rateを計算させる
– MatrixとPhasing Prephasing値には反映されない
コントロールレーンの変わりにはならない
– 配列、塩基のDiversityを増やす