20140222 tokyo.r#36 rでspadeとvisneを使って次元削減と可視化

20
変変変 R 変変変変変変変変変変変… 9 R 変 SPADE 変 SNE 変変変変変変変変変変変変 20140222 Tokyo.R#36 @ 変変変変変変変変 変変変変変変変変変 18F YF@Med_KU

Upload: medku

Post on 20-Jun-2015

4.181 views

Category:

Documents


14 download

DESCRIPTION

Nat Biotechnol. 2013 Jun;31(6):545-52. doi: 10.1038/nbt.2594. Epub 2013 May 19. Nat Biotechnol. 2011 Oct 2;29(10):886-91. doi: 10.1038/nbt.1991.

TRANSCRIPT

Page 1: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

変態に R を与えた結果がこれだよ… 9 R で SPADE と SNE を使って次元削減と可視化

20140222Tokyo.R#36 @ ニフティ株式会社 新宿フロントタワー 18F

YF@Med_KU

Page 2: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

本日の内容

次元削減と可視化SPADECyto Spanning tree Progression of Density normalized Events

t-SNEt-distributed stochastic neighbor embedding

Page 3: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

本日の内容

Page 4: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

本日の内容

SPADEviSNE

Page 5: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

Cyto Spanning tree Progression of Density normalized Events (SPADE)n 次元定量データのパターンから分化系統樹作成

新規

退会

無課金厨課金厨

重課金厨 Nat Biotechnol. 2011 Oct 2;29(10):886-91Science. 2011 May 6;332(6030):687-96http://d.hatena.ne.jp/MikuHatsune/20130922

前回の Tokyo.R#35 で

Page 6: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

次元削減法線形K-nearest neighbors algorithm (kNN)principal component analysis (PCA)linear discriminant analysis (LDA)canonical correlation analysis (CCA)feature vectors

非線形Sammon's mappingSelf-organizing mapPrincipal curves and manifoldsAutoencodersGaussian process latent variable modelsCurvilinear component analysisCurvilinear distance analysisDiffeomorphic dimensionality reduction

Kernel principal component analysisIsomapLocally-linear embedding(LLE)Laplacian eigenmapsManifold alignmentDiffusion mapsHessian LLE, Modified LLELocal tangent space alignmentLocal multidimensional scalingMaximum variance unfoldingNonlinear PCAData-driven high-dimensional scalingManifold sculptingRankVisuTopologically constrained isometric embeddingRelational perspective map

Page 7: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化
Page 8: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

分子生物学の多次元データFlow cytometry (FCM)

Page 9: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

SPADEdensity-dependent down-sampling

Original Down-sampling

http://d.hatena.ne.jp/ryamada22/20130611

Page 10: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

SPADEminimum spanning tree

3D MST 2D MST

{nnclust}http://d.hatena.ne.jp/ryamada22/20130611

Page 11: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

SPADEup-sampling

Original Up-sampling

http://d.hatena.ne.jp/ryamada22/20130611

Page 12: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

309 人の女の子のデータ

Page 13: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

309 人の女の子のデータ

Page 14: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

309 人の女の子のデータ

歳をとる 背が伸びる

Page 15: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

Stochastic neighbor embedding

N 次元データをに次元削減するとき, がと隣り合う条件付き確率を

がと隣り合う条件付き確率を

とする。

Page 16: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

Stochastic neighbor embedding

との最小ミスマッチを, Kullback-Leibler divergenceの和を最小化して求める。

𝜂𝛾𝑡

𝛼 (𝑡 )

のときの解

Learning rate

のときの momentum

Page 17: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

Symmetric SNE and t-SNE

symmetric SNE外れ値があるときによろしくないので

t-SNE自由度 1 の t 分布

Page 18: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

実際には PCA を挟んで先に次元をいくらか落としてもよい。が大きすぎるとき,計算量が増えるので一様分布でランダムサンプリングする。

Page 19: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

viSNE による可視化

Page 20: 20140222 Tokyo.R#36 RでSPADEとviSNEを使って次元削減と可視化

小規模クラスターの検出

Minimum residual disease (MRD)