tokyo r30 anova

25
R にににににににににに にににに ににに () TOKYO.R #30 にに にに

Upload: takashi-minoda

Post on 29-Nov-2014

3.873 views

Category:

Documents


2 download

DESCRIPTION

Rによる分散分析

TRANSCRIPT

Page 1: Tokyo r30 anova

  R によるやさしい統計学

分散分析(後半)

TOKYO.R #30

簑田 高志

Page 2: Tokyo r30 anova

目次

1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ

※ スクリーンショットや機能等は Mac 版となります。  基本的には Windows も同じものがあるはずです。

Page 3: Tokyo r30 anova

目次

1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ

※ スクリーンショットや機能等は Mac 版となります。  基本的には Windows も同じものがあるはずです。

今回はここまで

Page 4: Tokyo r30 anova

目次

1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ

※ スクリーンショットや機能等は Mac 版となります。  基本的には Windows も同じものがあるはずです。

Page 5: Tokyo r30 anova

• 名前 : 簑田 高志• Twitter :aad34210• ブログ :http://pracmper.blogspot.com/• 仕事 : ビジネスアナリスト• R 歴 : 3 年程度

自己紹介

Page 6: Tokyo r30 anova

目次

1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ

※ スクリーンショットや機能等は Mac 版となります。  基本的には Windows も同じものがあるはずです。

Page 7: Tokyo r30 anova

分散分析(おさらい)

• 分散分析3つ以上の平均値を比較するための統計的方法

2 つの平均値を比較する方法は「 t 検定」

テキスト 160p~ から

• R における関数 oneway.test aov anova

Page 8: Tokyo r30 anova

目次

1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ

※ スクリーンショットや機能等は Mac 版となります。  基本的には Windows も同じものがあるはずです。

Page 9: Tokyo r30 anova

二元配置分散分析(対応なし)

うちのミネラルウォーター商品って、銘柄ごとに温度が違えば、おいしさって違うのかな。おーい、ちょっとしらべてくれー

はいはい、了解しましたっと。

データのフォーマットはこれでよさそうだな。これで分析にかけてみよう。

Page 10: Tokyo r30 anova

二元配置分散分析(対応なし)課題:自社商品は銘柄ごとに温度が変わると

美味しさがかわるのか ?

条件が 2 つあるので、二元配置分散分析(対応なし)でいけそう

Page 11: Tokyo r30 anova

二元配置分散分析(対応なし)2つの条件の組み合わせによって母平均が異な

るかどうかを検定 二元配置分散分析

Page 12: Tokyo r30 anova

二元配置分散分析(対応なし)

• ミネラルウォータのおいしさに関する実験データ• この中で「温度の違い」、「銘柄の違い」がどちらも母平均に影響を及ぼしている模様

このような平均に違いをもたらす原因を「要因」 ある要因の中に含まれているここの条件を「水準」

上記データでいうと、要因: 冷蔵(冷蔵庫)、常温(常温)水準: イカアン、ボスビック、ビビッテル

Page 13: Tokyo r30 anova

二元配置分散分析(対応なし)

• 主効果:それぞれの要因ごとの効果 “ 温度の違い”(冷蔵か常温に違いがある)

• 交互作用効果: 2 つ以上の要因が組み合わされた場合に生じる効果。単純に 2 つの要因の足し算ではない

温度が冷たい場合、 5 点押し上げる ビビッテルは温度が低いと美味しくない → 単純な足し算ではない

主効果

交互作用効果

Page 14: Tokyo r30 anova

二元配置分散分析(対応なし)• 実際に分析

1. 帰無仮説と対立仮説の設定• これまでの検定と同じように 1 つの仮説では無く、「主効果」、

「交互作用効果の設定が必要

• 要因 A (温度)の主効果− 帰無仮説:温度が違っても美味しさの得点の母平均は等しい− 対立仮説:温度の違いによって美味しさ得点の母平均は異なる

• 要因 B (銘柄)の主効果− 帰無仮説:銘柄が違ってもおいしさ得点の母平均は等しい− 対立仮説:銘柄の違いによって、母平均は異なる

• 要因 A と要因 B の交互作用効果− 帰無仮説:温度と銘柄の組み合わせに相性の良し悪しはない− 対立仮説:温度と銘柄の組み合わせに相性の良し悪しがある

2. 有意水準• 5%

Page 15: Tokyo r30 anova

二元配置分散分析(対応なし)• R で分析

# データの準備

## 乱数を発生させ、おいしさ得点を生成##set.seed 関数で常に同じ得点が出るように設定set.seed(10)  taste_points <- abs(round(rnorm(30) * 10 , digits = 0))+1

## 温度temp <- factor(c(rep("refrige", 15), rep("normal_temp",15)))

## ボトル名bottle_name <- factor(c(rep("evian", 15), rep("volvic",15) , rep("vittel",15)))

Page 16: Tokyo r30 anova

二元配置分散分析(対応なし)• R で分析

# データの準備set.seed(256) # 乱数の再現taste_points <- as.integer(runif(30 , min = 1 , max = 20))

# 温度temp <- factor(c(rep("refrige", 15), rep("normal_temp",15)))

# ボトル名bottle_name <- factor(rep(c(rep("evian", 5), rep("volvic",5) , rep("vittel",5)),2))

Page 17: Tokyo r30 anova

二元配置分散分析(対応なし)• R で分析

summary(aov(taste_points~temp*bottle_name))

分散分析関数 目的変数 説明変数

Page 18: Tokyo r30 anova

二元配置分散分析(対応なし)• R で分析

帰無仮説の棄却 or 採択

1. 温度の主効果: 5% 水準で有意な効果が無い2. 銘柄の主効果: 5% 水準で有意な効果が無い3. 温度・銘柄の交互作用効果: 5% 水準で有意な効果はある (p = 0.042)

Page 19: Tokyo r30 anova

二元配置分散分析(対応なし)• R で分析

Interaction.plot で図示interaction.plot(temp , bottle_name , taste_points)

Vittel: 冷たいほうが美味しいVolvic :あまり変わらないEvian :冷たいほうが美味しくない

P187 のように、交差しているため交互作用効果がある

Page 20: Tokyo r30 anova

二元配置分散分析(対応なし)• R で分析

Interaction.plot で図示interaction.plot(bottle_name , temp , taste_points)

常温: Evian が美味しい冷蔵庫: Vittel が美味しい

P187 のように、交差しているため交互作用効果がある

Page 21: Tokyo r30 anova

二元配置分散分析(対応なし)• まとめ

1.主効果と交互作用効果2.仮説の立て方3.aov 関数4.Interaction.plot5.交互作用が起こっているグラフの見方

Page 22: Tokyo r30 anova

次回

Page 23: Tokyo r30 anova

交互作用があって、温度によって差がありそうだってことはわかった

げ・・・

でもさー、もしかして評価した人のバイアスってかかってない??

そこも評価してみてよー

Page 24: Tokyo r30 anova

目次

1.自己紹介2.分散分析(おさらい)3.二元配置分散分析(対応なし)4.二元配置分散分析(二要因とも対応あり)5.二元配置分散分析(一要因のみ対応あり)6.まとめ

やるかもね

Page 25: Tokyo r30 anova

ご静聴ありがとうございました