tokyo r30 anova
DESCRIPTION
Rによる分散分析TRANSCRIPT
R によるやさしい統計学
分散分析(後半)
TOKYO.R #30
簑田 高志
目次
1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ
※ スクリーンショットや機能等は Mac 版となります。 基本的には Windows も同じものがあるはずです。
目次
1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ
※ スクリーンショットや機能等は Mac 版となります。 基本的には Windows も同じものがあるはずです。
今回はここまで
目次
1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ
※ スクリーンショットや機能等は Mac 版となります。 基本的には Windows も同じものがあるはずです。
• 名前 : 簑田 高志• Twitter :aad34210• ブログ :http://pracmper.blogspot.com/• 仕事 : ビジネスアナリスト• R 歴 : 3 年程度
自己紹介
目次
1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ
※ スクリーンショットや機能等は Mac 版となります。 基本的には Windows も同じものがあるはずです。
分散分析(おさらい)
• 分散分析3つ以上の平均値を比較するための統計的方法
2 つの平均値を比較する方法は「 t 検定」
テキスト 160p~ から
• R における関数 oneway.test aov anova
目次
1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ
※ スクリーンショットや機能等は Mac 版となります。 基本的には Windows も同じものがあるはずです。
二元配置分散分析(対応なし)
うちのミネラルウォーター商品って、銘柄ごとに温度が違えば、おいしさって違うのかな。おーい、ちょっとしらべてくれー
はいはい、了解しましたっと。
データのフォーマットはこれでよさそうだな。これで分析にかけてみよう。
二元配置分散分析(対応なし)課題:自社商品は銘柄ごとに温度が変わると
美味しさがかわるのか ?
条件が 2 つあるので、二元配置分散分析(対応なし)でいけそう
二元配置分散分析(対応なし)2つの条件の組み合わせによって母平均が異な
るかどうかを検定 二元配置分散分析
二元配置分散分析(対応なし)
• ミネラルウォータのおいしさに関する実験データ• この中で「温度の違い」、「銘柄の違い」がどちらも母平均に影響を及ぼしている模様
このような平均に違いをもたらす原因を「要因」 ある要因の中に含まれているここの条件を「水準」
上記データでいうと、要因: 冷蔵(冷蔵庫)、常温(常温)水準: イカアン、ボスビック、ビビッテル
二元配置分散分析(対応なし)
• 主効果:それぞれの要因ごとの効果 “ 温度の違い”(冷蔵か常温に違いがある)
• 交互作用効果: 2 つ以上の要因が組み合わされた場合に生じる効果。単純に 2 つの要因の足し算ではない
温度が冷たい場合、 5 点押し上げる ビビッテルは温度が低いと美味しくない → 単純な足し算ではない
主効果
交互作用効果
二元配置分散分析(対応なし)• 実際に分析
1. 帰無仮説と対立仮説の設定• これまでの検定と同じように 1 つの仮説では無く、「主効果」、
「交互作用効果の設定が必要
• 要因 A (温度)の主効果− 帰無仮説:温度が違っても美味しさの得点の母平均は等しい− 対立仮説:温度の違いによって美味しさ得点の母平均は異なる
• 要因 B (銘柄)の主効果− 帰無仮説:銘柄が違ってもおいしさ得点の母平均は等しい− 対立仮説:銘柄の違いによって、母平均は異なる
• 要因 A と要因 B の交互作用効果− 帰無仮説:温度と銘柄の組み合わせに相性の良し悪しはない− 対立仮説:温度と銘柄の組み合わせに相性の良し悪しがある
2. 有意水準• 5%
二元配置分散分析(対応なし)• R で分析
# データの準備
## 乱数を発生させ、おいしさ得点を生成##set.seed 関数で常に同じ得点が出るように設定set.seed(10) taste_points <- abs(round(rnorm(30) * 10 , digits = 0))+1
## 温度temp <- factor(c(rep("refrige", 15), rep("normal_temp",15)))
## ボトル名bottle_name <- factor(c(rep("evian", 15), rep("volvic",15) , rep("vittel",15)))
二元配置分散分析(対応なし)• R で分析
# データの準備set.seed(256) # 乱数の再現taste_points <- as.integer(runif(30 , min = 1 , max = 20))
# 温度temp <- factor(c(rep("refrige", 15), rep("normal_temp",15)))
# ボトル名bottle_name <- factor(rep(c(rep("evian", 5), rep("volvic",5) , rep("vittel",5)),2))
二元配置分散分析(対応なし)• R で分析
summary(aov(taste_points~temp*bottle_name))
分散分析関数 目的変数 説明変数
二元配置分散分析(対応なし)• R で分析
帰無仮説の棄却 or 採択
1. 温度の主効果: 5% 水準で有意な効果が無い2. 銘柄の主効果: 5% 水準で有意な効果が無い3. 温度・銘柄の交互作用効果: 5% 水準で有意な効果はある (p = 0.042)
二元配置分散分析(対応なし)• R で分析
Interaction.plot で図示interaction.plot(temp , bottle_name , taste_points)
Vittel: 冷たいほうが美味しいVolvic :あまり変わらないEvian :冷たいほうが美味しくない
P187 のように、交差しているため交互作用効果がある
二元配置分散分析(対応なし)• R で分析
Interaction.plot で図示interaction.plot(bottle_name , temp , taste_points)
常温: Evian が美味しい冷蔵庫: Vittel が美味しい
P187 のように、交差しているため交互作用効果がある
二元配置分散分析(対応なし)• まとめ
1.主効果と交互作用効果2.仮説の立て方3.aov 関数4.Interaction.plot5.交互作用が起こっているグラフの見方
次回
交互作用があって、温度によって差がありそうだってことはわかった
げ・・・
でもさー、もしかして評価した人のバイアスってかかってない??
そこも評価してみてよー
目次
1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ
やるかもね
ご静聴ありがとうございました