「いつ」分光データに統計処理が必要か -...

24
2017/3/1 1 新しい情報・統計理論に基づくスペクトル分解 -化学イメージング法の開発 名古屋大学 未来材料・システム研究所 高度計測技術実践センター・電子顕微鏡計測部 武藤 俊介 第3回SPring-8材料構造の解析に役立つ計算科学研究会・第10回SPring-8先端利用技術ワークショップ 放射光利用者のためのマテリアルズ・インフォマティクス入門2017227日(月) ()ニチイ学館 「いつ」分光データに統計処理が必要か 信号強度がノイズレベルに対して同等なとき (ランダムノイズの除去) 特にデータ点数(評本点の数)が膨大なとき(機械学習) さらに分光データにどのような成分が含まれているか不明 なとき(複数成分の重なりが予測されるとき)

Upload: others

Post on 07-Jun-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

1

新しい情報・統計理論に基づくスペクトル分解-化学イメージング法の開発

名古屋大学未来材料・システム研究所

高度計測技術実践センター・電子顕微鏡計測部

武藤 俊介

第3回SPring-8材料構造の解析に役立つ計算科学研究会・第10回SPring-8先端利用技術ワークショップ

―放射光利用者のためのマテリアルズ・インフォマティクス入門―2017年2月27日(月) (株)ニチイ学館

「いつ」分光データに統計処理が必要か

• 信号強度がノイズレベルに対して同等なとき

(ランダムノイズの除去)

• 特にデータ点数(評本点の数)が膨大なとき(機械学習)

• さらに分光データにどのような成分が含まれているか不明なとき(複数成分の重なりが予測されるとき)

Page 2: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

2

PIXON法のデモ:画像復元

• 微弱シグナルの検出への応用

統計処理が有効なデータ解析例の紹介1

データ解析の現状

• 分析装置のデジタル化 PC制御

• 測定の自動化

• ソフトウェアのブラックボックス化

利点:測定の精度向上同種測定の繰り返しの容易化による網羅的測定

難点:膨大なデータサイズ定型解析にしばられ内在する情報を拾い切れていない

Page 3: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

3

複合電子分光による物性イメージング

統計

処理

Beam rocking

sample

角度分解EELS

原子像

ロッキング図形

X線チャネリング図形

占有サイト・占有率

結晶構造

欠陥構造

電子状態異方性

EELS

ADF検出器

機能元素分析

欠陥構造の電子状態計測

一種類のデータをモデル化するには?(一変数から)最小二乗法

Page 4: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

4

関係のモデル化:回帰分析:最小二乗法

残差二乗和S= 残差 最小

y = a1 x + a0

係数a1,a0はどう決められるか

残差二乗和

n

iii axayS

1

201

Sの最小条件 0001

a

S

a

S

ny

y

ya

aa

x

x

x

1

0

12

1

TT ,,

1

1

1

Xy,XXaX

n

iii

i

n

ii

axaya

S

xaxaya

S

101

0

1011

1

02

02

Page 5: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

5

異なる変数間の関係は?多変量解析

膨大なデータへの統計学的アプローチ:多変量解析

年齢

背の高さIQ

相関係数

二つの変数間の関連度合い

∑ ̅

∑ ̅ ∑

Page 6: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

6

こんな分布ならどうする?

変数1

変数

多次元変数空間:主成分解析(PCA)

軸f1 : 最も分散( 情報量 )の大きい軸(新しい変数)

変数 x1,x2と最も相関が高い

軸f2: f1と直交して( f1と f2は無相関),次に分散の大きい軸

X = UL1/2VT = RVT

PCA: 特異値分解

固有値行列(スコア)固有ベクトル(ローディング)

Page 7: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

7

テストデータ:アルミ箔上のCuグリッドTOF‐SIMS

Keenan and Kotula, Surf. Interface Anal.; 2004; 36; 203‐212

テストデータ:アルミ箔上のCuグリッドTOF‐SIMS

Keenan and Kotula, Surf. Interface Anal.; 2004; 36; 203‐212

Page 8: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

8

PCAによる主要成分

スペクトルの物理的意味を直接表さない

PCAによる主要成分

スペクトルの物理的意味を直接表さない

Page 9: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

9

Blind Signal Separation(BSS)

Mixed signal1

Mixed signal2

BSS

Datacube:データの数学的構造Mathematical structure of Two‐way Spectral image

Non‐negative entries for all the matrices: NMF

E

y

100

110

120

130

0 0 0 0 0

100

110

120

130

00

020

30

=c1× + c2× + c3×

Maps of different chemical states

X = CST

Page 10: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

10

K

KST

C

Nonnegative Matrix Factorization (NMF)

Experimentaldataset

X

検出

器チ

ャン

ネル

標本点数(空間座標)

Resolve into product of low‐rank two matrices based on non‐negativity constraint

100 110 120 130 140 150 160 1700

0.2

0.4

0.6

0.8

Energy Loss [eV]

Inte

nsi

ty

成分スペクトル:化学状態解析

各成分の空間分布マップ

多変量スペクトル分解 MCR‐ALSmultivariate curve resolution‐alternating least‐square

n experimental spectra, each consisting of m points

⇒ m x n matrix, X

X = A B + R

Pure component spectra weights

X BT= ABBT ; B行列を正方行列化

A = (XBT)(BBT)-1 ; A行列の妥協解

noise

# of component > # of spectra non-determinant

B = (ATA)-1(ATX) ; B行列の妥協解

同様に

A,B行列の妥協解が収束するまで以上の繰り返し

Page 11: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

11

主成分解析(PCA)との比較

MCR: X = CST

X = UL1/2VT = RVT

PCA: 特異値分解

固有値行列(スコア)

固有ベクトル(ローディング)

S = VT, C = RT‐1

MCRとMCAを結びつける回転行列

具体的な回転行列の意味の一例:Varimax

座標回転

Page 12: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

12

A

NMFまたはMCRの問題点(特にEELS 不定形)

Energy loss

AB

B

A-B

X = ColdSoldT = (ColdT) (T

‐1SoldT) = CnewSnew

T

T:arbitrary regular matrix(rotation)

ALS解はユニークで無い!

NMF 三つのモード (S or C in X = CST )

Case 1: Non‐negative + orthogonal

ALS‐MCR(最小二乗法)

Page 13: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

13

NMF 三つのモード (S or C)

Soft‐orthogonality

ALS‐MCR(最小二乗法)

VCA

VCA

Case 1: Non‐negative + orthogonal

Case 2: Non‐negative + partially orthogonal

Soft‐orthogonality in NMF

K

KST

CExperimental

datasetX

# of Energy ch

annel

# of Sampling points

# of Energy channel

# of Sam

plin

g points D

Update C and S iteratively by minimizing “objective function”

【Distance( )】+【Orthogonality( )】+【sparsity(D)】

Shiga et al, Ultramicroscopy, 170 (2016) 43‐59.

2TCSX ICC Tw

Solution is not unique!

Page 14: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

14

成分の空間的な重なりの解消

27

「対角行列からのズレ」を評価指標に。

重なりなし 重なりあり

CT

対角行列(非対角成分ゼロ)

C

成分数の最適化

28

Ideal result: removing redundant components

Intensity matrix

Sparsity constraintfor intensities ofcomponents

0 1 2 3 4 5 6 70

0.5

1

1.5

2

2.5

3

c

p(c) ー λ=1

ー λ=3

PDF of intensities

Exponential PDF

Page 15: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

15

100 120 140 160

(b)

Energy loss (eV)

c-Si

Si3N4

SiO2

ケーススタディ: XSTEM‐EELS

500nm

SiO2

Si

Si-N

電極(a)

Reference spectra

electrode

w = 0 w = 0.1

90 100 110 120 130 140 150 160

c-SiSi

3N

4

SiO2

Inte

nsity

(a.

u.)

Energy loss (eV)

(b)

Page 16: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

16

NMF 三つのモード (S or C)

Soft‐orthogonality

ALS‐MCR(最小二乗法)

VCA

VCA

Case 1: Non‐negative + orthogonal

Case 2: Non‐negative + partially orthogonal

Vertex component analysis (VCA)IEEE Trans. Geoscience and Remote Sensing, 43 (2005) 898.

前提:pure pixelの存在

Channel1

Chan

nel2

Energy channel

AB

Channel1 Channel2

Solution is unique!

X = CST

∑ =1: simplex

Cij>0

二成分系

Page 17: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

17

#1 #2

0.5 m

60 65 70

(e)

Chemical state analysis of Li in NCA cathode

K. Kojima et al, J. Power Sources (2011).

Li on Ni site

Original Li

Difference

Example in NMF‐STEM‐EELS‐SI

56 58 60 62 64 66 68 70 72

Comp. #1Comp. #2

0

0.05

0.1

0.15

0.2

Inte

nsity

(A

rb. u

nits

)

Energy loss (eV)Muto & Tatsumi, Microscopy, in press.

NMF 三つのモード (S or C)

ALS‐MCR(最小二乗法)

Soft‐orthogonality

SSS + VCA

VCA

VCA

Case 1: Non‐negative + orthogonal

Case 2: Non‐negative + partially orthogonal

Case 3: Non‐negative + overlapped

Page 18: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

18

1. Determine the number components by ROB‐PCA2. Select PCs3. Plot all the linear combinations of PCs under non‐negativitiy constraint4. Apply VCA

Cone of NMF

Signal Subspace Sampling in NMF (SSS)

Al(3nm)/Fe(20nm)/Si3N4(15nm) film

ADF‐STEM O‐K

Page 19: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

19

Al(3nm)/Fe(20nm)/Si3N4(15nm) film

Si3N4

Fe

Al2O3

SiOxArtefacts

Fe

0.4

0.1

0.5

0.1

0.1

0.45

0.25

0

0.8

0.3

1.8

0.8

様々な応用例

substrateplasmon

EELS‐SIによるポリマーブレンドの無染色観察

YZOLSMSTEM

EDX‐SI data:  元素マッピング 相マッピング

0 2 4 6 8 10

成分1

成分2

Cou

nts

X-ray energy (keV)

O

Mn

LaGa

Sr

Y

Zr

La

LaLa

La

Mn Ga

EDX #1

#2

And many more….

Page 20: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

20

X

Emission

Samples

=a1

c1 b1

a2

b2c2 b3

c3

a3

+ +

Two‐way解析からMulti‐wayへ

Tensor Decomposition:A. Cichocki et al, IEEE Signal Processing Magazine 32, 145 (2015).

A concept of ‘Tensor Decomposition’

Tucker Decomposition

テンソル化の利点:  ✓コンパクトな表現✓各指標毎に独立した拘束条件設定✓指標間の相関、重み、因果関係の設定または導出

Canonical Polyadic Decomposition (CPD)

Page 21: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

21

LIB正極材料:Li0.21Ni0.7Mn1.64O4‐δ

EDX‐EELS同時測定

2+ 4+

635 637 639 641 643 645 647

Mn-L3

HARECES HARECXS profileMn-Kα

INT

EN

SIT

Y (

AR

B. U

NIT

)

ENERGY LOSS (eV) X-RAY INTENSITY (NORMALIZED)

INC

IDE

NT

BE

AM

OR

IEN

TAT

ION

, kx/g 4

00

0

0.5

1

1.5

2

2.5

30.8 0.9 1 1.1 1.2 1.3

X = CST × 2

HARECXS

サイト占有率

octocttettet

tettettet NN

NC

ELNESプロファイル

動力学電子回折理論計算

Page 22: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

22

Tetrahedral siteOctahedral site Xj = CjSj

T

Mn‐L2,3 ELNES

Mn4+

Mn2+

S1

C1

EDS

S2

C2

O‐K

Mn‐K

Ni‐K

Site occupancies:定量性確認

octocttettet

tettettet NN

NC

HARECES

Page 23: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

23

Site occupancies:定量性確認

octocttettet

tettettet NN

NC

HARECES

まとめ:Hyperspectral Image Analysisの進展

Two‐way解析:NMF

解の唯一性問題の解決

①ソフト直交性の導入

②SSS+VCAによる強く重畳した場合の分解

Two‐wayからMulti‐way解析へ

SDFによる複数分光データの取り扱い

Shiga et al, Ultramicroscopy, 170 (2016) 43‐59.

J. Spiegelberg et al, Ultramicroscopy, submitted.

Machine learning  << Human learning

装置に左右されない高度に洗練された新しい分析技術の確立

Page 24: 「いつ」分光データに統計処理が必要か - SPring-8support.spring8.or.jp/Doc_workshop/iuss/2016/...2017/3/1 6 こんな分布ならどうする?変数1 変数2 多次元変数空間:主成分解析(PCA)

2017/3/1

24

Collaborators

• Dr. Motoki Shiga (Gifu Univ., Japan)

• Dr. Masahiro  Ohtsuka (Nagoya Univ., Japan)

• Jakob Spiegelberg (Uppsala Univ., Sweden)

• Dr. Jan Rusz (Uppsala Univ., Sweden)

J. J. SpiegelbergDr. M. Shiga Dr. M. Ohtsuka Dr. J. Rusz

Thank you for your kind attention!