sequence analysis viewer (sav)の使い方と イルミナ株式会社次 … · prephasing scores,...

28
© 2012 Illumina, Inc. All rights reserved. Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium, iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of Illumina, Inc. All other brands and names contained herein are the property of their respective owners. Sequence Analysis Viewer (SAV)の使い方と イルミナ株式会社次世代シーケンサにおける ランクオリティ評価 酒井名朋子(Nahoko Sakai, Ph.D.) テクニカルアプリケーションサイエンティスト イルミナ株式会社

Upload: others

Post on 14-Sep-2019

80 views

Category:

Documents


1 download

TRANSCRIPT

© 2012 Illumina, Inc. All rights reserved.

Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium,

iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of

Illumina, Inc. All other brands and names contained herein are the property of their respective owners.

Sequence Analysis Viewer (SAV)の使い方とイルミナ株式会社次世代シーケンサ―におけるランクオリティ評価 酒井名朋子(Nahoko Sakai, Ph.D.) テクニカルアプリケーションサイエンティスト

イルミナ株式会社

2

本日のOutline

SAVでRun の結果を評価する

1. Q30

2. Cluster Density and PF%

3. Phasing/Prephasing

4. Intensity

5. FWHM

Control LaneとPhiX Spike In

SAV Demo

3

Sequencing Analysis Viewer(SAV)とは?

Runの結果を表示させるもの – Runfolder

InterOp フォルダ全体

runInfo.xml

runParameters.xml, GAの場合は(run名).params

4

SAVでRun の結果を評価する

5

Run の結果を評価するー(1) Q30

(1)

6

Run の結果を評価するー(1) Q30

%>=Q30:Run中全サイクルにおいてQ30以上でBaseCallされた塩基の割合

7

なぜQ30 で評価するのか?

Q30=Quality Score 30

Q Score = Phred scale

– Base Callされた塩基が間違いである確率を示す

Q30 はRunの総合結果

– 全Runの総計、リード毎、サイクル毎ではない。

Q30 の値は様々な要因に左右される

– >Q30% が良ければRunは成功

Phred

Score

% Error Error の確率

Q10 10% 1 in 10

Q20 1% 1 in 100

Q30 0.1% 1 in 1,000

Q40 0.01% 1 in 10,000

8

Illumina 装置毎のQ Scoreの仕様

http://www.illumina.com/systems/

サイクル数 36 50 100 150

NA >Q30

>85%

>Q30

>80% NA

>Q30

>90% NA

>Q30

>85%

>Q30

>75%

9

イルミナQuality Scoreの計算に適した条件

Cluster Densityが最適範囲内であること

サンプルの塩基バランス良いこと

サンプル配列が多様であること

10

サイクル毎のQ30 の見方

サイクル毎のQ30 以上のQualityでBaseCallされた塩基の割合

(1)

11

Run の結果を評価する-(2) Cluster Density

(2)

12

Run の結果を評価するー(2) Cluster Density

Density:全タイルの平均クラスター密度(K/mm2)

Cluster PF:Pass Filterしたクラスターの割合

13

Cluster DensityとPass Filter

最適Cluster Density

Pass Filtreとは?

– Chastity Filtering 、クラスタの「純度」

– PFしないリード:

Chastity<0.6のサイクルが25サイクルまでに2サイクル以上検出

Software Version

Recommended

Cluster Density

(K/mm2)

HCS 1.4 (and later) 200-850

SCS 2.8 (and later) 100-800

MCS 1.0.5 (and later) 50-850

14

最適Cluster Densityの重要性

なぜ最適Cluster Densityが重要か?

– Template Generation(cycle1-4 or 5)でClusterを認識できない

Over Clusterになるとどうなるか?

– さまざまなものに影響を与える Q scores, raw cluster number, clusters passing filter, intensity profiles, phasing and

prephasing scores, output data volume, focus scores and image quality.

– Qualityをあげたい場合はCluster Densityを低めで流す

– Cluster Densityが正確に計算されない

– Cluster PF%が極端に下がる

15

Over vs. Appropriate Cluster Density

Overclustered Appropriate Clustering

16

Run の結果を評価するー(3) Phasing/Prephasing

(3)

17

Run の結果を評価するー(3) Phasing/Prephasing

PhasingとPrephasing

– 1クラスター中の数分子のサイクルの進みと遅れ (<0.5)

18

PhasingとPrephasingの意義

PhasingとPrephasingは酵素反応や試薬Deliveryの失敗を補正する

– 試薬のライン中でのコンタミ(Washが不十分)

– 試薬の品質(使用期限)

– 室内温度

– 装置のFC・Reagent Chiller温度

バランスの悪い塩基配列の場合計算ができない

19

Run の結果を評価する-(4) Intensity

(4)

20

Run の結果を評価する-(5) FWHM

FWHM: Focus Qualityと同義

(5)

21

Run の結果を評価する-(5) FWHM

FWHM :Full Width Half Max

– Intensityが最大値の半分の時のクラスターの幅

ぼんやりとした大きなクラスター 明るくシャープなクラスター

22

Run の結果を評価する-(6)Flowcell Chart

(6)

23

Run の結果を評価する-(7) Qscore Heatmap

(7)

24

Control LaneとPhiX Spike In

25

コントロールレーンか、Spike Inか

コントロールレーン

– 1レーンすべて

– PhiXもしくはHuman WGサンプル(GC%が40-50%程度)

– CrossTalk MatrixとPhasing Prephasing値を他のレーンに適用

– バランスの悪いサンプル(mRNA、smallRNA、Amplicon)に必須

Spike In

– レーン中に混ぜる(0.5%~30%)

– SAVにてError Rateを計算させる

– MatrixとPhasing Prephasing値には反映されない

コントロールレーンの変わりにはならない

– 配列、塩基のDiversityを増やす

26

Control Laneの指定(HiSeq)

27

SAV Demo

28

ご清聴ありがとうございました。

ご質問は[email protected]でも承ります。