構造方程式モデリング
京都大学教育学研究科
修士1回生 伊川美保
1
本日の流れ
• 構造方程式モデリング(SEM)とは
• SEMのメリット
• Amosを用いた演習
• SEMの使用上の注意点
2
構造方程式モデリングとは• Structural Equation Modeling: SEM
• 直接観測できない潜在変数を導入し、潜在変数と観測変数との間の因果関係を同定することにより社会現象や自然現象を理解するための統計的アプローチ。(狩野, 2002)
• 単に構成概念(観察可能な行動から推論したもの)を測定するだけではなく、複数の構成概念間の関係を検討することができる。
(豊田, 2006, p.1)
• 変数間の共分散(または相関係数)について、データから直接計算される値と、モデルに基づいて計算される値の近さによって評価される。
(南風原, 2005, p.22)
→ 「共分散構造分析」とも呼ばれるが、SEMは平均構造を分析することもできるので、よりメジャーな呼び名である。 (狩野, 2002)
3
構造方程式モデリングとは
• SEMでは、変数間の関係性をパス図によってモデル化して分
析を行う。
• パス図の簡略例:
4
平井, 2012, p.209, 図10.10を転載。
構造方程式モデリングとは
• パス図の主な構成要素は、次の5つである。
• 観測変数: 測定可能な変数(長方形)
• 潜在変数: 測定不可能な変数(楕円形)
• 誤差変数: 従属変数についた誤差(円形)。円の英字は、従属変数が観測変数の場合には“e” 、潜在変数
の場合には“d”と表される。
• パス: 変数間の影響関係の方向性。単方向矢印(→)は因果関係、双方向矢印(↔)は相関(共変)関係を表す。
• 決定係数(R²): 説明率。パス図の従属変数の上に表す。
5
SEMのメリット
1.グラフィカル・インターフェース (三浦, 2006, p.88)
• グラフィカル・インターフェースをもち、難解な数理言語を使わずにモデルの構築し修正することができる。
• SEMのソフトウェア “Amos”を用いることで、仮説を検証する
ためのモデルを簡便につくることができる。
6
SEMのメリット
2.適合度 (三浦, 2006, p.89‐91)
• モデルがデータにどの程度よく当てはまっているか(適合度)を、様々な指標によって確認することができる。
• これまでの統計分析では仮説が正しいか否かの検討はなされていたが、仮説モデルがデータの性質を十分に表現しているという保証がなかった。
• それに対してSEMでは、データとモデルが乖離していない科
学的に妥当なモデルをつくることができる。
• ただし研究の目的は「仮説の検証」にあり、データに適合するようなモデルの探索が目的ではない。
7
SEMのメリット
3.希薄化の修正 (三浦, 2006, p.91‐92)
• 測定値(x)は真値(t)と測定誤差(e)の加算(x = t + e)で表わされるため、誤差が入ることによって変数間の相関係数の絶対値は不当に小さくなりやすい。 → 相関の希薄化
• 相関の希薄化: 測定値間の相関≦真値間の相関• SEMでは、誤差を潜在変数から明示的に分離して表現してい
るため、より真の相関係数に近い値が得られる。
8
Amosを用いた演習
• SEMの一般的な進め方:
1.仮説の設定
2.データの収集
3.モデルの構成
4.分析の実行
5.結果の判定
6.モデルの修正・改良
9
1.仮説の設定
• 研究の意義は“innovative”で“instructive”な知見を生み出す
ことにあり、統計分析はそのための手段に過ぎない。
• また統計モデルが仮定する構造は、現実の心理的事象にフィットしているとは限らない。(吉田, 2002, p.81)
ex. 人の発達は統計モデルが仮定するような線形的なもの
ではない
→ 統計の力を過大視しないためにも、まずは検討対象と
なる仮説を設定する必要がある。
10
2.データの収集
• 誰を対象に、どれくらいの標本を収集するか
• 標本数は少なくとも100、可能であれば200以上を確保する必要がある。(平井, 2012, p.210)
• 標本数が小さいときには、①最尤法を用いること (∵正規性が頑健)
②複雑なモデルの構築を避けること、 に留意するべき。
• なお一度に多くの標本数を得られない場合は、質問紙調査を何回かに分けて実施し、多母集団分析を行う。(豊田, 2006, p.60)
(cf. 多母集団分析:測定状況の異なる母集団間の等質/異質性を
検討する分析)
11
(補足)自由度とは• 自由度(df): 変数のうち自由に選べるものの数
ex1. 全体の平方和(SSy=Σ(yi‐ÿ)^2)の自由度
(ただしÿ=yの平均、1≦i≦N)
→自由に値のとれる変数(平方数)はN‐1個
(∵残る1個はy1~yN‐1とÿで自動的に決まる)
ex2. 残差の平方和(SSe=Σei^2=Σ(yi‐ý)^2)の自由度
(ただしý=ÿ+b(x‐a)、1≦i≦N )
→自由に値のとれる変数個(平方数)はN‐2個
(∵残る2個はy1~yN‐2, ÿ, bで自動的に決まる)
• 一般的に、自由度=「全変数(平方の数)」-「推定する母数の数」12
南風原, 2002,p.208‐210を参照。
• SEMにおける自由度は、df = n(n+1)/2 ‐ q
(ただし、n:観測変数の数、n(n+1)/2:観測変数の分散・共分散の数、q:推定する母数の数)
• 共分散構造の連立方程式の数は、 n(n+1)/2が上限値とな
る。
• n(n+1)/2は標本分散共分散の下三角要素の数である。
(補足)自由度とは
1個
2個
3個
n個
~
1+2+3+…+n= n(n+1)/2
13
3.モデルの構成
(step1) Amosの起動
•“IBM SPSS Statistics”から“Amos Graphics”を選択する
(step2)基本図形の確認
: 観測変数
: 潜在変数
: 誤差変数e
: 因果関係を表す単方向矢印
: 相関関係を表す単方向矢印
14
(step3) データの読み込み
•「データファイルを選択」ボタンを押す•「ファイル名」
→「模擬データ(5月21日)(伊川)」を選択
→ OK
•本演習では、英語の内発的動機づけとタスクへの態度がタスク成績(パフォーマンス)
に与える効果について検討する。
3.モデルの構成
15
(step4) モデルの描画
•下の完成予想図をキャンパスに描画する。
•アイコンをクリックし、キャンパス上でカーソルを動かすと図を描くことができる。
3.モデルの構成
「消去」
「移動」
「潜在変数を描く、あるいは指標変数を潜在変数に追加」
「潜在変数の指標変数を回転」
16
平井, 2012, p.219,図10.26を転載。
• 以下の手順で進めると効率的に描くことができる。
1. 「潜在変数を描く、あるいは指標変数を
潜在変数に追加」を押し、キャンパス上で1回クリック→更に楕円上で3回クリック
2. 右の楕円についても同アイコンを1回
クリックしたのち、楕円上で4回クリック。
3. 「潜在変数の指標変数を回転」を
クリックし、観測変数(内発3項目、
態度4項目)と誤差変数が潜在
変数の下にくるように移動させる。
4. 観測変数(パフォーマンス)とパス
を描き、従属変数全てに誤差変数を
つける。
3.モデルの構成
17
(step5)変数に名前をつける
• それぞれの変数の上でマウスを右クリックし、「オブジェクトのプロパティ」を選択する。→下図にある名前を「変数名」に入れる。→記入したら「×」を推す。
• なお誤差変数の場合は、「プラグイン」→「Name Unobserved
Variables」をクリックすると
e1~e8, d1が自動で入る。
3.モデルの構成
18
(補足)モデルの識別性
• SEMを行う際には、モデルの識別性(母数が一意的に推定さ
れること)が確保されていなければならない。
• 識別性がないまま進めると、次に分析を行う時に「モデルが識別されませんでした。更に制約がx個必要です」という警告
が下される。
• ここで母数が一意的に定まるためには、推定する母数の数が共分散構造の方程式の数より少ない必要がある。
→ 自由度(df )= n(n+1)/2 ‐ qがプラスになる
観測変数の分散・共分散の数(方程式の数)
推定する母数の数
19
• 下のパス図の場合:• n(n+1)/2=11(11+1)/2=66
• qはパス係数(8)(ただし1で固定されたパス以外)、誤差分散の合計(11)、独立変数間の共分散(3)、独立変数の分散の数(3)の合計=25
• df=66‐25=41>0 → 識別OK
• dfをプラスにするには、
→独立変数からの分散を1に
固定して尺度を求める
→誤差変数のパスを1に
固定する
などの拘束条件が必要
(補足)モデルの識別性
20
(平井, 2012, p.210‐211)
4.分析の実行
(step6)分析の実行
• 「表示」→「分析のプロパティ」の手順で
下図を表示する。
• 「出力」タブを開き、
「最小化履歴」「標準化推定値」
「重相関係数の平方」
「間接、直接、または総合効果」
「修正指数」
にチェックを入れる。
21
• 「分析の実行」ボタンを押すと、「最小値に達しました」という言葉が現れる。 → 分析完了
• このボタンを押すと、出力パス図がチェックできる。
• また心理的構成概念には単位が存在しないので、単位やばらつきの不揃い
を調整した「標準化推定値」を見る。
• 共分散Sxy=1/N×Σ(xi‐x)(yi‐y) = 偏差の積
であることを踏まえると、共分散が大きい
場合も相関関係が強いとは限らない。(藤田, 2013)
(∵標準偏差が大きいためかもしれない)
→以上の問題を克服した「標準化推定値」は、心理的構成概念に限らず意義がある。
4.分析の実行
22
5.結果の判定
(step7)係数のチェック
•「内発的動機づけ」から「タスクへの態度」に向かう標準偏回帰係数が大きい。
→英語に対する内発的動機づけが高い人ほどタスクに肯定的な態度
を示し、タスクに肯定的な態度をもつ人ほどパフォーマンスがよい。
•因子負荷量はいずれも大きい。
•決定係数(R²)が高いため、
右記のモデルでかなりの分散が
説明された。
23
(step8)推定値と間接効果
•係数などの推定値は
いずれも有意。
推定値標準誤差
検定統計量
確率 ラベル
タスクへの態度
<‐‐‐内発的動機づけ
.743 .090 8.266 ***
内発3 <‐‐‐内発的動機づけ
1.000
内発2 <‐‐‐内発的動機づけ
.869 .086 10.070 ***
内発1 <‐‐‐内発的動機づけ
1.001 .093 10.755 ***
態度4 <‐‐‐ タスクへの態度
1.000
態度3 <‐‐‐ タスクへの態度
.896 .096 9.342 ***
態度2 <‐‐‐ タスクへの態度
1.022 .094 10.867 ***
態度1 <‐‐‐ タスクへの態度
1.086 .098 11.047 ***
パフォーマンス
<‐‐‐内発的動機づけ
.388 .160 2.424 .015
パフォーマンス
<‐‐‐ タスクへの態度
.760 .175 4.332 ***
5.結果の判定
24
• 間接効果とは、何らかの変数(z)を媒介したxとyの効果。
• 「内発的動機づけ」→「タスクへの態度」
と、「タスクへの態度」→「パフォーマンス」
それぞれの標準偏回帰係数をかけ合わ
せても同じ値を算出できる。
5.結果の判定
内発的動機づけ タスクへの態度
タスクへの態度 0 0
パフォーマンス 0.436 0
態度1 0.675 0
態度2 0.667 0
態度3 0.598 0
態度4 0.66 0
内発1 0 0
内発2 0 0
内発3 0 0
標準化間接効果 (グループ番号 1 - モデル番号 1)
タスクへの態度を介在することで、内発的動機づけへのパフォーマンスの効果は .436になる
25
(step9)テキスト出力チェック
•「テキスト出力の表示」をクリックし、モデルの適合度を検討する。
•様々な適合度指標は、3つに分類される。
1.絶対適合: モデルに対するデータの予測
力を表す指標。
2.倹約性修正: モデルの複雑さを考慮する指標。
(∵モデルが複雑になるほど特定のデータのみを
近似したモデルが出来あがってしまう)
3.比較適合: 独立モデル(観測変数にパスを一切
引かないモデル)に比べてどれ程データ
の乖離度が改善したかを表す。
5.結果の判定
26(豊田, 2006, p.122‐124)(平井, 2012, p.215)
1. 絶対適合
① CMIN(χ²値):モデルが正しいことを帰無仮説とした指標。
• 確率が.05より小さければ帰無仮説は棄却されない。
• ただし帰無仮説が採択されたとしても、「分析したモデルが間違っているとは言い切れなかった」と述べているに過ぎない。
• また標本サイズが大きいほど棄却されやすい。
5.結果の判定
モデル NPAR CMIN 自由度 確率 CMIN/DF
モデル番号 1 18 19.480 18 .363 1.082
飽和モデル 36 .000 0
独立モデル 8672.59
928 .000 24.021
帰無仮説は採択された
27
(豊田, 2006, p.120‐121)
② GFI、AGFI
• モデルがデータの分散共分散行列をどの程度再現するかを指標化したもの。
• GFIは標本サイズに影響されないが、自由度が小さいほど無条件
に値が大きくなる。
→ 自由度による補正を加えたものがAGFI
• 回帰分析でいうR²(AGFIは自由度調整済R²)にあたる。
• 値の上限1.0に近いほどモデル適合がよい。
5.結果の判定
モデル RMR GFI AGFI PGFI
モデル番号 1 0.023 0.964 0.929 0.482
飽和モデル 0 1
独立モデル 0.533 0.282 0.077 0.219
どちらも0.9より大きく
十分なモデル適合
28
(豊田, 2006, p.122)
2. 倹約性修正
RMSEA: モデルと真の分布との1自由度あたりの乖離度の大
きさを評価する指標。
• 0.00に近いほど適合がよく、0.1以上であれば当てはまりが
悪い。
• 90%信頼区間はLO,HIを見ればよい。
5.結果の判定
モデル RMSEA LO 90 HI 90 PCLOSE
モデル番号 1 0.026 0 0.085 0.683
独立モデル 0.427 0.4 0.456 0
RMSEAはよい値だが、信頼区間が.08を超えて
いるので注意が必要
29
豊田, 2006, p.124平井, 2012, p.216
3. 比較修正
CFI: (自由度を考慮した上で)分析モデルの乖離度が独立モ
デルの乖離度から何%減少したかを表す指標。
• 1.0に近いほど適合がよい。(豊田, 2006, p.123)
5.結果の判定
モデルNFI RFI IFI TLI
CFIDelta1 rho1 Delta2 rho2
モデル番号1
0.971 0.955 0.998 0.996 0.998
飽和モデル 1 1 1
独立モデル 0 0 0 0 0
およそ1.00と高い値
になっている
30
(step9)修正指数の確認
•LM検定: ある変数間に新たにパスを引くか否かを適合度指標から検討し、モデル修正を試みる手法。
•WALD検定: すでに引いているパスを外し、よりシンプルなモデルをつくるための検定法。
•AmosではLM検定の代わりに修正指数が表示される。
•ただし研究の目的は仮説を検証することにあるため、合理的な説明が可能な範囲でのみパスを引く必要がある。
6.モデルの修正・改良
修正指数 改善度
e7 <‐‐> e8 4.372 0.079
e3 <‐‐> e4 4.356 0.072
改善度が大きくないので、誤差変数の間にパスを引く必要はない
31
(豊田, 2006, p.133‐134)
SEMの使用上の注意点
• SEMは様々なメリットがあるものの、決して魔法の道具では
ない。
• 方法論についての基礎的な理解が曖昧なままでは、次のような問題に陥る可能性がある。
1. 数理的妥当性と内容的妥当性のトレード・オフ(三浦, 2009, p.95‐100)
2. 同値モデル (村山, HP, 2014年5月21日確認)
3. 個人内変動と個人間変動の混同 (吉田, 2009)
32
1. 数理的妥当性と内容的妥当性のトレード・オフ
• 適合度のよいモデルを構築すること(数理的妥当性)に拘泥するあまり、モデルが現実の事象にどれほど当てはまるか(内容的妥当性)が損なわれる危険性がある。
ex. 抑うつ尺度の作成
• 右のモデルのモデル適合度は
押しなべて低い。
• そこで「食欲不振」項目を削除
したとする。
SEMの使用上の注意点
.45
.87
.64
.71
.53
.36
カイ2乗値(df)=96.337 p=.000 n=300GFI=.908 CFI=.831 RMSEA=.180
33
三浦, 2006, p.96, 図4‐5から、
潜在変数の母数を除いて報告者作成。
• するとモデル適合度は向上し、数理的妥当性の高い結果が得られた。
• しかし下のモデルでは、「食欲不振」という、抑うつの診断において欠かすことのできない指標
が欠落している。
→ 数理的妥当性は向上した
一方、内容的妥当性が著しく
損なわれてしまった。
SEMの使用上の注意点
カイ2乗値(df)=3.733 p=.588 n=300GFI=.995 CFI=1.000 RMSEA=.000
34
三浦, 2006, p.97, 図4‐6から、
母数・パス係数を除いて報告者作成。
• 数理的妥当性と内容的妥当性のトレード・オフを解決するには:
→ 測定の対象ではない誤差変数に共分散(相関)を設定する
• 抑うつの事例については、「欲望」という点で関係が予想される、
「食欲不振」「不眠」「意欲減退」の間に誤差共分散を設定した。
→ 適合度指標の値がいずれも改善したほか、全ての項目を
モデルに加えたため内容的に
も適切なモデルが得られた。
• ただし数理的・内容的妥当性を追求するあまり、仮説から外れたモデルを
構築してしまえば本末転倒である。
SEMの使用上の注意点
カイ2乗値(df)=5.129 p=.644 n=300GFI=.994 CFI=1.000 RMSEA=.000 35
三浦, 2006, p.100, 図4‐7
母数・パス係数・共分散を除いて報告者作成。
2. 同値モデル
• パスの引き方が異なるものの、全く同じ適合度をもつモデルになることがある。 → 同値モデル
ex. 業績不振の原因
• 上の例では、“睡眠時間が少ないため疲労感が残り業績が悪い”のか、“疲労感があるため睡眠できず業績が悪い”のか区別でき
ない。
36
SEMの使用上の注意点
睡眠時間X1
睡眠時間X1
疲労感X2
疲労感X2
業績X3
業績X3
a21=0.43** a32=6.27**
a12=0.62** a32=6.27**
χ²(1)=0.041
χ²(1)=0.041
村山, p.14から
転載。
• 同値モデルについては適合度指標で優劣をつける(=数理的妥当性を比較する)ことができないため、どちらが現実の事象をよく反映しているか(=内容的妥当性)という観点をもつことが重要になる。
ex. 実際の理論と照らし合わせて説明可能か、時間的に先行する項目から
パスが引かれているか…
• どのような同値モデルがあるかをモデル構築時に提示した上で、なぜこのようなモデルにするのかを説得的に示す必要がある。
• なお同値モデルを見出すルールについては、Lee & Hershberger(1990)やMayekawa(1994)などが参考になる。
37
SEMの使用上の注意点
3. 個人内変動と個人間変動の混同
個人内変動: 評定者1人ひとりの特性値(の評定者間変動)の間に
どのような(共変)関係があるかを表す指標。
個人間変動: 特性値(の評定者間変動)が、評定者の間でどのよう
な(共変)関係があるかを表す指標。
• 個々人の心理過程を究明するためには個人内変動を検討する必要がある。
• しかし個人間変動を個人内変動にすり替えた研究が少なくない。
SEMの使用上の注意点
38
(吉田, 2009)
ex. 抑うつ尺度の作成
•SEMで構築したモデルは、ある特定の状況における評定者間の回答傾向の違いを検討している。→ 個人間変動
•よってモデルは、“「食欲不振」と答えた評定者ほど
「不眠」「意欲減退」の傾向が高い”
と述べているに過ぎない。
•1人ひとりの評定者について
これら3項目がどれほど関係する
か、ということは述べられていない。
SEMの使用上の注意点
39
• また個人間変動は、ある特定の状況における指標であるため、一般化できない偶然性の高い結果になっている恐れがある。
• 抑うつの事例では、評定者のうつ状態はその時限りのものであり、時間が経つと結果が異なる可能性も考えられる。
ex. 出来事に応じて気分が変わる「非定型うつ」
• 個人内変動と個人間変動を図式化すると、次のようになる。
SEMの使用上の注意点
評定者
n=1
n=300
…
12345
6
状況1 2 …
個人内変動
個人間変動
40
吉田, 2009, p.1を
参考に報告者作成。
1 2 3 5 64
• よって個々人の心理過程や心理的構成概念の構造を究明するには、個人「間」変動だけではなく個人「内」変動に基づく検討をも行う必要がある。
• そこで次回の発表では、測定状況の異なる母集団に対して検定を行う「多母集団分析」や、変数間の関係を群内の違いと群間の違いに切り分けた「マルチモデル分析」を取り上げる予定である。
SEMの使用上の注意点
41
参考文献・URL• 南風原朝和(2002) 心理統計学の基礎―統合的理解のために, 有斐閣
• 南風原朝和(2005) 共分散構造分析―強力な解析ツールとその使用上の注意, 心理学ワールド, 31, p.22‐23
• 平井明代 (2012) 構造方程式モデリング, 平井明代(編)教育・心理系研究のためのデータ分析入門, 東京図書
• 狩野裕(2002) 共分散構造分析の基礎と実際―基礎編―, 東京大学社会科学研究所附属社会調査・データアーカイブ研究センター,
<https://ssjda.iss.u‐tokyo.ac.jp/seminar2002_1.pdf> (2014年5月22日)
• 三浦麻子(2006) 因果関係をモデリングする―共分散構造分析, 吉田寿夫(編)心理学研究法の新しいかたち, 誠信書房
• 村山航, 共分散構造分析と同値モデル, Michiko Sakaki’s Homepage,
<m‐sk.sakura.ne.jp/murakou/equivalence.ppt> (2014年5月21日)
• 豊田秀樹(2006) 分析のよさを評価する, 豊田秀樹(編)共分散構造分析 [疑問編], 朝倉書店
• 吉田寿夫(2009) 心のメカニズムについて探求するための相関的研究における変動因に関して, 社会学研究会第6回
• 藤田弥世(2013) SEMの理論と外母集団分析, 野崎優樹(2011) 構造方程式モデリング(SEM)による成長曲線モデル, 野口寛樹(2009) 共分散構造分析の実習, 志波泰子(2006) 共分散構造分析の基礎知識, 心理データ解析演習,
<http://kyoumu.educ.kyoto‐u.ac.jp/cogpsy/personal/Kusumi/datasem.htm> (2014年5月19日)
• 模擬データ: 教育・心理系研究データ(20120531)第10章SEM 「SEM分析例3.sav」
<http://kyoumu.educ.kyoto‐u.ac.jp/cogpsy/personal/Kusumi/datasem.htm> (2014年5月20日)42