semfaq：共分散構造分析に関する10の質問kano/rese… · ppt file · web view ·...

ＳＥＭＦＡＱ：共分散構造分析に関する 10 の質

三浦麻子 × 狩野裕（大阪大学大学院人間科学研究科）

配布資料

日本ＧＤ学会第５０回大会＠京都

１． SEM によるパス解析は“must” なのか？

重回帰分析の繰り返しによるパス解析をした論文を投稿したのですが，査読者から「 SEM によるパス解析をやり直せ」と言われました

なんとか実行はできたのですが，適合度が低く，とてもじゃないですが論文に載せられたもんじゃありません

こんなとき，私はどうすればいいのでしょう ?　論文取り下げ & もう一度データ取り直しなんでしょうか ?

１．回答

Yes. “must” である不適合の理由を特定し，モデルを改善する

モデルが不適切直接効果の欠落未観測の剰余変数の存在層別を示唆（交互作用の存在）

偏相関が説明できていない誤差共分散

誤差共分散の設定

誤差間に共分散を設定する

２．標準化尺度の EFA ・CFA

質問紙調査の場合，既存の標準化された尺度を使うことがよくあります

このような場合にも，先行研究の構造が再現されるかどうかを確認するために探索的因子分析をしていたのですが，なんだか変な気がします

まず検証的因子分析をして構造を確認してから，場合によっては探索的にやりなおす方がよいのでしょうか ?

２．回答

Yes and No Establish されている尺度については

ＥＦＡ・ＣＦＡを行う必要はない理屈上日本でも establish しているかＥＦＡやＣＦＡによってサンプルの妥当性を

チェック

EFA versus CFA

CFA ではより厳しいチェックが行われる CFA をやるべきかどうかは，どこまで「厳

しさ」を要求するか，に依存尺度を吟味したあと

SEM へ移行するなら，ＣＦＡが必須古典的方法を利用するなら， EFA でもよい

のではないか合計得点を算出して分析するなど

しかし

信頼性が不十分のとき尺度分析の結果

誤差の制御が必要多重指標を利用した SEM で分析する必要

尺度解析においても CFA が必要に

３．適合度が悪いモデルは「ダメダメ」なの ?

仮説モデルにしたがって SEM をすると，適合度がいまいちよくありません．全然ダメなら捨てるのですが，どうも微妙なラインなんです

試行錯誤すると，どうやら仮説にやや合わないモデルの適合度が高いようです

こんなとき，私はどちらのモデルを選べばよいのでしょう ? 　本心を言えば，前者を選びたいのですが…

３．回答

気持ちはよくわかる仮説モデルの適合度を向上させるために

あらゆる手段を講じる

このような事態は SEM に限ったことではない e.g., 回帰分析で重要な変数の効果が非有意統計解析における共通の悩みそれゆえ，分析は自動化できない

あらゆる手段

適合度を低めている部分の同定モデルの部分評価

粗データの吟味誤差相関層別（交互作用）未観測交絡変数観測変数の選択 parceling SEM の専門家に訊く

適合度の小さいな違いは実質的な意味はない適合度の良いモデルが複数個ある場合は，分析者

の責任において最終モデルを選択ランダムな現象を扱うことの限界

研究分野によって基準は異なる各分野のコンセンサス先行研究の適合度を参考にする研究が積み重ねられている分野

More confirmatory nature ．より厳しい基準新しい研究分野

Less confirmatory nature ．やや緩い基準

４．欠損値のあるデータの処理方法　

いくつか欠損値が含まれたデータを用いてSEM をやりたいと思っています

欠損値の処理方法には場合によっていくつかあるようですが，明らかに実施時に特殊な事情がある場合以外はどうしたらいいのでしょう ?

また，欠損値の処理方法を論文に明記すべきでしょうか ? 　そこまで書いている論文を見たことが（まだ）ありません

４．回答

欠測が 1割程度ならば LD 相当数の欠測がある場合は FIML を

用いる欠測のプロセスに関して MAR を仮定ＭＡＲの仮定が崩れていても，共分散構造

分析においては，そこそこ使える経験則だが

LD ， FIML は明示する必要あり

LD と FIML Listwise Deletion (LD)

一つでも欠測のある observation は，分析から外して分析する

捨てられるデータがもったいない統計的推測の精度が低くなる

欠測が多いと分析できないことがある MCAR である必要

Full Information Maximum Likelihood (FIML) 観測されたデータにもとづく最尤法 AMOS など SEM の代表的なプログラムで利用可 MAR でよい

統計理論から

Missing Completely At Random (MCAR) どの値が欠測するかは完全にランダムである LD, PD は，このときのみ使える

Missing At Random (MAR) どの値が欠測するかはデータに依存してもよいが，

欠測値には依存しない FIML の適用が薦められる

Nonignorable Missing どの値が欠測するかが欠測した値に依存する欠測のメカニズムにモデリングが必要

５．調査データでの「因果関係の同定」

調査データの多くは，一時点で採取された認知データであり，本来は因果関係は論ずることができないことはよくわかっています

しかし私たちはそれを知りつつも， SEM を使って因果関係があるかのように議論を進めています

こんなことをしていいのか ? という根本的な疑問がふと頭をかすめることがあるのですが…

５．回答

SEM は強力な因果推論の道具交絡変数がないという前提パス図が正しいという前提

調査データにもとづく因果推論の限界未観測交絡（剰余）変数の存在を否定できない

因果の大きさ（因果関係のあるなし）パス係数の推定と検定第三変数のモデル化が容易

因果の方向適合度にもとづくモデル比較により，因果の方向を決

定当該モデルの適合と逆方向のモデルの不適合

実例

「スマートさ」から「うつくしさ」への影響が強い

対応策

十分な検討の下で，正確なパス図を作成大幅なモデル探索はしない

強い結論を主張しない．．．という関係が示唆された

縦断的データを取るデザインを考える調査データの分析は積み重ねることが大事

６．双方向因果モデル（にわとりたまご）

よくテキストで見るパスモデルは，因果の方向が一定であることが多いようですが，双方向の因果モデルというのはSEM でうまくモデリングできるのでしょうか ? 　いわゆる鶏と卵の関係のようなモデルです

６．回答

YES縦断的データの場合

パス解析横断的データの場合

双方向因果モデルしかしながら

調査データにもとづく因果方向の決定は難しい

縦断的データの利用

２時点でデータをとり，時間差を利用する民主主義⇒経済発展 or 経済発展⇒民主主義

双方向因果モデル

政治的社会化モデル

出典： Asher(1976). Causal Modeling. Sage

７．「不適解」地獄から抜け出したい !!

突然ですが，不適解に泣かされていますデータの打ち込みや読み込み，あるいはモ

デルの記述などつまらない原因はすべて探りましたが，どれも問題ないようです

こんなとき不適でない解を導き出す努力として，私たちには一体何ができるのでしょう ?

７．回答

不適解とは (improper solutions) 誤差 E や撹乱項D の分散が０または負の値に推定

相関の推定値が，絶対値 1以下でない基本的には，これらを最終解として報告して

はならない原因を切り分けてから対応する

原因と対応

不適解は何らかの不適切性を表す1. 単純ミスなど2. モデルが不適切 (model misspecification)3. 潜在変数モデル固有の問題4. サンプル変動

1. この場合のみ， V(e)≧０などとして解を報告する

5. その他・不明

4. サンプル変動

サンプル変動によって不運にも偶然不適解となってしまった残念！！

不適解がサンプル変動によることが確定した場合は， V(e)=0 とおいた解を報告できる場合がある

サンプル変動のための条件

サンプル変動による不適解と判断できるためにはさらなるモデルの改良が考えられない絶対値が大きすぎない．少しマイナス V(e)± ２ SE が原点を含んでいる測定モデルで不適解が生じた場合は，因子を合計得点

で置き換えてみて，推定値などが大きく変化しないことを確かめる

上記の条件が満たされていても，モデルが小さいと，論文を出版するのは認められにくい

８．よりどりみどりすぎる　適合度指標

AMOS （ EQS ， CALIS ）を使っていますが，プログラムを走らせると，大量の適合度指標が出てきます

残念ながらすべての適合度指標を載せるだけの紙幅は論文にありません

私たちが主張したいことはこのモデルが正しいということに尽きるのですが，一体どの指標（たち）を記述すれば必要かつ十分でしょうか ?

８．回答

適合度指標にはいくつかの側面がある同じ性質を持つ指標を複数報告しない

側面を代表する指標を報告するカイ２乗値ＧＦＩ，ＣＦＩ，ＲＭＳＥＡ

モデル局所評価も必要適合度はモデルの全体的評価パスの有意性Ｒ ^2 の大きさ

使い方

カイ 2乗値大標本のときは見ない

ＧＦＩ，ＣＦＩ一般に， 0.90 or 0.95 以上を要求する see Bentler & Bonnet (1980), Hu (1999)

RMSEA 0.05以下⇒ＯＫ 0.10以上⇒不適 see Browne & Cudeck (1993)

Reference Hu, Li-tze and Bentler, P. M. (1999). Cutoff criteria for

fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6(1), 1-55.

Bentler, P.M. & Bonnet, D.G. (1980). Significance tests and goodness of fit in the analysis of covariance structures. Psychological Bulletin, 107, 238-246

Browne, M.W. & Cudeck, R. (1993) Alternative ways of assessing model fit. In K.A. Bollen & J.S. Long [Eds.] Testing Structural Equation Models. Beverley Hills, CA: Sage, 132-162

９．適合度指標の検定ってないの ?

私は今， SEM を使って書かれた論文の査読を依頼されています

あるモデルが「適合度が高い」とされているのですが，その根拠として示されている適合度指標が本当に高いのかどうかわかりません．論文によって基準とする値にもばらつきがあるように思えてなりません

適合度指標が本当に高いことを示せる検定などはないのですか ?

９．回答

カイ２乗値による検定がそれにあたる歴史的には

カイ２乗検定の限界が指摘され，その代替として適合度指標が提案されてきた

RMSEA は，点推定値だけでなく信頼上限と下限を出力する（信頼率 90%）

信頼上限が 0.10以下かどうかという判断基準もよく用いられる

以下の検定もできる H0:RMSEA＝ 0 (exact fit) H0:RMSEA≦0.05 (close fit)

１ 0 ．ＳＥＭ論文の「正しい」書き方

さて，試行錯誤の艱難辛苦を乗り越えて， SEMをおこなったモデリング結果を論文に書こうと思います

「すべてを丁寧に書く」のがベストなのは分かり切っていますが，それだけの紙幅はありません

論文を読む人のことを考えた場合にどのような情報が必要かを，できれば優先順位つきで教えてください

10 ．回答

必須項目心理学・行動学の知見にもとづく初期（仮説）

モデルの記述最終モデルの記述

適合度，パス係数の有意性読者が duplicate できるようにする

初期モデルと最終モデルとの違いを説明モデルの変遷や経過を全て記述する必要はない

オプション

直接効果なしパスを引いても非有意

因果の方向対立モデルが適合しない

男女差なし多母集団同時分析

重要 FAQ ：詳細解説編

SEM によるパス解析が“must”な理由双方向因果モデルの構築さまざまな適合度指標の特徴と適切　な使い方

SEM によるパス解析が“must” な理由

詳細：直接効果の欠落

LM 検定や適合度指標で改善のための指針を得ることができる

未観測の剰余変数の存在

層別を示唆（交互作用の存在）

0.4 0.5

0.6 0.5

集団 A：適合度○

集団 B：適合度○

0.5 0.5A＋ B：適合度 ×

補足　交互作用と交絡 _1

A+B：適合度○

A+B：適合度 ×

補足　交互作用と交絡 _2

r=0.4X11

誤差共分散 _1

誤差間に共分散を設定する

誤差共分散 _解説

パスの意味直接効果を表現したもの

誤差共分散を置くことが多い偏相関が残ることが多いから

交絡要因として導入したもの測定モデル誤差共分散なしが一般的

FAQ６

双方向因果モデル（にわとりたまご）

相関係数から因果の方向は決まらない

---同値モデルの問題 ---

X YX 1 rY r 1

相関構造

データから区別できないモデルを同値モデルという「区別できない」とは適合度が同一であることをいう

52因果の方向を決める：

操作変数法（ Instrumental variable method ）

X Y ZX 1 b12 b13Y 1 0Z 1

X Y ZX 1 b21 b13Y 1 b21b13Z 1

相関構造相関構造

因果の方向を決める：適合度との関係

適合度が低い適合度が高い

Ｘ→Ｙの因果関係が示唆される

双方向因果モデル（非逐次モデル）

政治的社会化モデル

出典： Asher(1976). Causal Modeling. Sage

交絡変数はこわい

盛山 (1986 ，行動計量学 )

因果方向決定にも影響

X Y ZX 1 * *Y 1 0Z 1

誤ってＹ→Ｘと結論してしまう

まとめ

双方向の因果関係を同定するモデリングがある縦断的データに対するパス解析横断的データに対する非逐次モデル

“→”と“←”のモデルが同値にならないようなモデリング推定可能なモデルを作成するには操作変数法が有効

欠点交絡変数の影響を無視し得ない操作変数となるための条件が満足されているか成功例が少ない

縦断的データに基づくモデリングの方が説得性が高いと考えられている

FAQ８

さまざまな適合度指標の意味と使い分け

詳細：考え方

適合度評価の考え方データの相関行列とモデルによる相関行列の食違いの程度を評価．．．Ｓ -Σ^

多次元量を 1次元に縮約するため多種多様な方法一般的なコンセンサスはない

開発者は自分が開発した指標を薦める回帰分析におけるＲ 2 においても百家争鳴査読者に求められたら，素直に報告する

どの指標においても，そこそこの適合が得られていることが必要

いくつかの「側面」

ベースＳと Σ^ の食い違いを評価 cf. 回帰モデルの場合は， y-y^

相対評価 vs 絶対評価最小モデルを導入する独立モデル，ゼロモデル

自由度を考慮するかけちの原理（ parsimony ）自由度にくらべてどの程度の適合かをみる

好ましい性質

ｎに依存しないことが望ましい自由度を考慮した方がよい？

自由度 d が小さい（パラメータが多い）モデルは適合が良いのはあたりまえ

しかし，回帰分析でもＲ 2 が活きている最小モデルの導入については両論ある

回帰分析では「一般平均のみ」の最小モデルを導入している

指標が最小モデルの選択に依存する

比較

自由度による調整なし比差

絶対評価カイ2乗値

RMSEA F0, mkAIC

相対評価GFI AGFINFIIFI

NNFIRFI

補足：指標の定義

2/)1(,ˆtr21

2/)1(2/)1(,ˆˆtr21|,|log|)Diag(|log

2/)1(,ˆˆtr21)],ˆ(ˆtr[||log|ˆ|log

)2(,/0/1/

)/(2/12

pppppdDSSSB

qppdSSSF

dBdFdB

RFIndBFB

ndBndFndB

CFIndBdFdB

NNFIBFB

dBdFdB

AGFIBFB

dnFAICemndFFndFRMSEAnF

ndFk絶対評価

差比なし自由度による調整

カイ 2乗検定について

統計的検定にもとづく方法論統計的モデル評価の基本Ｈ 0: モデルが正しい H1: モデルが正しくない

専門家の意見 Do not rely only on the chi-square test

Bollen & Long (1993). Testing Structural Equation Models. Sage: CA (page.8)

カイ 2乗検定の問題点

検定力がｎに依存する第二種の過誤を評価していない第一種の過誤を問題とする通常の検定と逆

統計モデルは厳密にはデータの発生機構を表さない

データ分布に関する基礎仮定が厳しい n が小さいときはカイ 2乗近似が正しくなく，

大きいときは殆ど確実にモデルを棄却する

semfaq：共分散構造分析に関する10の質問kano/rese… · ppt file · web view ·...

Documents

因子分析，共分散構造分析 factor analysis...

これからの近赤外高分散分光 -...

タンパク質の小角散乱法による低分解能構...

自律分散協調システム論...

湿式メディアレス分散・乳化機ナノ分散...

horiba - 高品質・高効率な...

連続と離散微分方程式の視点から -...

sasによる共分散分析 · 2018-07-05 · 分散分析...

次ページ - jppe.org熱安定性 20min以上 jis k...

リアルタイム型大規模分散データ分析基盤技...

分散処理システム - tohoku university official...

データベース論...

平成 27 年度化学物質安全対策...

スペシャル 8...メニュー 8 月 2018/8/1～8/31 は...

第 6 回　分散分析（第 7 章） analysis of variance

数理統計学 ( 第四回）...

分散システム読書会...

「データの分析」の指導 - kagoshima u...43 155.4...

分散処理システムの動向とその運用 -...

散乱分布および質感測定用imaging sphere...

semfaq：共分散構造分析 に関する10の質問kano/rese… · ppt file · web view ·...

semfaq：共分散構造分析に関する10の質問kano/rese… · ppt file · web view ·...