chi square
DESCRIPTION
Chi Square. 謝寶煖 台灣大學圖書資訊學系 2007 年 10 月 13 日. X 2 - test. 自變數、依變數均屬 類別變數 時,運用 X 2 - test 來檢驗其差異顯著性. Outline. Overview Bivariate Tabular Analysis Generalizing from Samples to Populations Chi Square Requirements Collapsing Values Computing Chi Square - PowerPoint PPT PresentationTRANSCRIPT
1
Chi SquareChi Square
謝寶煖台灣大學圖書資訊學系
2007 年 10 月 13 日
2
2
2
XX22- test- test
自變數、依變數均屬類別變數時,運用 X2- test 來檢驗其差異顯著性
3
OutlineOutline
Overview Bivariate Tabular Analysis Generalizing from Samples to Populations Chi Square Requirements Collapsing Values Computing Chi Square Interpreting the Chi Square Value Measures of Association SPSS procedure
4
Overview Overview Chi square 是雙變項交叉表的無母數統計檢定方法。
適切地執行統計顯著性檢定,讓我們知道有多大的信心 (degree of confidence) 接受或拒絕 (accepting or rejecting) 一項假設 (hypothesis) 。
一般而言, chi square 的假設檢定 (hypothesis test) 是檢定兩個不同的樣本(人數、關鍵詞出現次數等)的特定屬性或面向的差異是否夠大到可以從樣本一般化到母群體。
無母數統計檢定, chi square ,是一種粗估計,可以接受較不正確的資料做為 input ;相較於 t-tests 和 ANOVA 等的母數檢定
5
Chi square 最常用來檢定雙變項交叉表( bivariate tables )的統計顯著性,通常在詮釋結果時,交叉表要與卡方檢定整合
6
雙變項交叉分析雙變項交叉分析 Bivariate Tabular Analysis 雙變項交叉表是用來描述自變項和依變項之間是否存在任
何關係 例如想要知道台大學生中,男生女生對手機的偏好是否有任何關
係。 儘可能隨機地找 50 位男生和 50 位女生,問他們喜愛的手機 自變項是性別 依變項是手機品牌
自變項是可以經由抽樣控制的,是假設的特性或屬性用來預測或解釋其他的屬性或特性(依變項)
控制自變項,衡量依變項,檢定假設,以知自變與依變項是否有關係存在
7
雙變項交叉分析雙變項交叉分析雙變項交叉分析可用以回答下列問題
兩個變項是否有某種關係 (relationship) 存在? 由資料中顯示出兩變項的關係有多強 (strong ) ? 關係的方向 (direction) 或樣態 (shape) 為何? 該關係是否係其他變項所造成?
intervening variable(s)
8
男生 女生Nokia
Motorola
Ben Q
Alcatel
Other
Nokia Motorola
Ben Q Alcatel
Other
男生
女生
A B
9
雙變項交叉分析表雙變項交叉分析表自變項: Y 軸,垂直軸( SPSS :列)依變項: X 軸,水平軸( SPSS :直行)
方便讀者閱讀,由自變項到結果(依變項) 怎麼組織交叉分析表是取決於研究問題或研究假設
例如:自變項是由小到大排列,依變項的值是由左到右,由小到大,則將呈現由左到右的正相關(請注意:相關,並不等於因果關係)
10
雙變項交叉分析表雙變項交叉分析表
Nokia Motorola Ben Q Alcatel Other
男生 6 17 13 9 5
女生 13 5 7 16 9
11
分析>描述性統計>交叉表
12
* 性別 手機品牌 交叉表
個數
6 17 13 9 5 5013 5 7 16 9 5019 22 20 25 14 100
男生女生
性別
總和
Nokia Motorola Ben Q Alcatel Others手機品牌
總和
13
14
* 性別 手機品牌 交叉表
13 5 7 16 9 5026.0% 10.0% 14.0% 32.0% 18.0% 100.0%
6 17 13 9 5 5012.0% 34.0% 26.0% 18.0% 10.0% 100.0%
19 22 20 25 14 10019.0% 22.0% 20.0% 25.0% 14.0% 100.0%
個數 %性別內的
個數 %性別內的
個數 %性別內的
女生
男生
性別
總和
Nokia Motorola Ben Q Alcatel Others手機品牌
總和
* 性別 手機品牌 交叉表
13 5 7 16 9 5026.0% 10.0% 14.0% 32.0% 18.0% 100.0%68.4% 22.7% 35.0% 64.0% 64.3% 50.0%
6 17 13 9 5 5012.0% 34.0% 26.0% 18.0% 10.0% 100.0%31.6% 77.3% 65.0% 36.0% 35.7% 50.0%
19 22 20 25 14 10019.0% 22.0% 20.0% 25.0% 14.0% 100.0%
100.0% 100.0% 100.0% 100.0% 100.0% 100.0%
個數 %性別內的
%手機品牌內的個數
%性別內的 %手機品牌內的
個數 %性別內的
%手機品牌內的
女生
男生
性別
總和
Nokia Motorola Ben Q Alcatel Others手機品牌
總和
15
資料呈現資料呈現交叉分析,不必要顯示所有的橫行百分比、直行百分比及總百分比;很多時候,可能僅需要顯示橫行百分比,和每一橫行之總次數,即可。
16
交叉分析交叉分析主要功能是探討多個變項的關聯分佈,並以表格的型式呈現 每一格可以顯示次數、期望次數、總百分比、列百分比等
由次數分佈狀況,可以知道某變數在其他變數內的分配狀況,可知變數間的關係。
卡方檢定,檢定變數間的獨立性
17
18
交叉分析交叉分析 卡方統計量( Chi-square )
當 2X2 表格內的觀察值數目少於 20 時,可以方格內的次數值計算 Fisher 的準確測量值
其他的 2X2 表格,則以 Yates修正後的卡方檢定量計算 相關( correlations )
計算 Pearson 相關係數根據變數性質,選擇適當之統計量
名義:如果表格中的橫列和直行都含有名義變數 次序:如果表格中的橫列和直行都含有次序變數 名義對等距:當一個變數為類別,而另一個為等距數值時,請選取「 Eta 值」
Kappa 統計量數:如果表格中的直行類別與橫列相同時 ( 例如測量兩位評估者之間的一致性 ) ,請選取「 Cohen Kappa 值」。
19
卡方檢定
14.027a 4 .00714.530 4 .006
.937 1 .333100
Pearson卡方概似比線性對線性的關連有效觀察值的個數
數值 自由度漸近顯著
( )性 雙尾
0 (.0%) 5 7.00格 的預期個數少於 。 最小的預期個數為 。a.
Pearson 卡方檢定統計量的值為 14.027 , P 值小於 0.007. 在顯著水準為 0.01 時,(推翻兩變數為統計獨立之虛無假設)顯示性別與手機品牌偏好有關。
2=14.027, df=4, p<0.01
20
* p< .05
** p< .01
***p< .001
不太於 0 的數值,小數點前的零應省略。( APA Style )
21
* 性別 手機品牌 交叉表
13 5 7 16 9 5026.0% 10.0% 14.0% 32.0% 18.0% 100.0%
6 17 13 9 5 5012.0% 34.0% 26.0% 18.0% 10.0% 100.0%
19 22 20 25 14 10019.0% 22.0% 20.0% 25.0% 14.0% 100.0%
個數 %性別內的
個數 %性別內的
個數 %性別內的
女生
男生
性別
總和
Nokia Motorola Ben Q Alcatel Others手機品牌
總和
22
卡方檢定卡方檢定虛無假設 H0: 兩個變數 X 與 Y 是獨立的表示變數 X 與變數 Y ,沒有關聯
對立假設 H1: 兩個變數 X 與 Y 是不獨立的表示變數 X 與變數 Y ,有關聯
23
卡方檢定
12.844b 1 .00011.927 1 .00113.252 1 .000
.000 .00012.801 1 .000
299
Pearson卡方連續性校正a
概似比Fisher's精確檢定線性對線性的關連有效觀察值的個數
數值 自由度漸近顯著性
( )雙尾精確顯著性
( )雙尾精確顯著性
( )單尾
2x2 只能計算 表格a. 0 (.0%) 5 36.75格 的預期個數少於 。 最小的預期個數為 。b.
Pearson 卡方檢定統計量的值為 12.844 , P 值小於 0.0001. 在顯著水準為 0.001 時,(推翻兩變數為統計獨立之虛無假設)顯示性別與是否修課有關。
2=12.844, p<0.0001
24
* 性別 是否修課 交叉表
111 23 13482.8% 17.2% 100.0%37.1% 7.7% 44.8%
106 59 16564.2% 35.8% 100.0%35.5% 19.7% 55.2%
217 82 29972.6% 27.4% 100.0%72.6% 27.4% 100.0%
個數 %性別內的
%總和的個數
%性別內的 %總和的
個數 %性別內的
%總和的
女性
男性
性別
總和
未修課 已修課是否修課
總和
檢視交又表可知,男生已選修或正在選修資訊素養課程之比例,明顯高於女生
25
個案二個案二有沒有修過課是否會影響其對課程區隔因素之看法?
26
* 區隔因素 是否修課 交叉表
6 9 1540.0% 60.0% 100.0%2.0% 3.0% 5.0%-1.5 2.4161 59 220
73.2% 26.8% 100.0%53.3% 19.5% 72.8%
.1 -.216 5 21
76.2% 23.8% 100.0%5.3% 1.7% 7.0%
.2 -.322 4 26
84.6% 15.4% 100.0%7.3% 1.3% 8.6%
.7 -1.214 6 20
70.0% 30.0% 100.0%4.6% 2.0% 6.6%
-.1 .2219 83 302
72.5% 27.5% 100.0%72.5% 27.5% 100.0%
個數 %區隔因素內的
%總和的標準化殘差個數
%區隔因素內的 %總和的
標準化殘差個數
%區隔因素內的 %總和的
標準化殘差個數
%區隔因素內的 %總和的
標準化殘差個數
%區隔因素內的 %總和的
標準化殘差個數
%區隔因素內的 %總和的
人數
學科
年級
特殊學生需求
其他
區隔因素
總和
未修課 已修課是否修課
總和
27
卡方檢定
10.122a 4 .0389.320 4 .0541.986 1 .159
302
Pearson卡方概似比線性對線性的關連有效觀察值的個數
數值 自由度漸近顯著性
( )雙尾
1 (10.0%) 5 4.12格 的預期個數少於 。 最小的預期個數為 。a.
Pearson 卡方檢定統計量的值為 10.122 , P 值小於 0.038 ,在顯著水準為 0.05 時,(推翻兩變數為統計獨立之虛無假設)顯示是否修過課對課程區隔因素之看法,達到統計上之顯著。經卡方檢定,在 0.05下達到顯著 (2(4)=10.122, p=0.038)
但是因為期望個數少於 5 的方格數超過 10 %,使得卡方檢定有不準確之虞,因此,前述顯著性之結論可能不成立。
28
Web Chi Square Calculator Web Chi Square Calculator
http://www.georgetown.edu/faculty/ballc/webtools/web_chi.html
29
用用 WordWord 打公式打公式插入>功能變數> Eq > 方程式編輯器
30
Q & AQ & A
Thank You!Thank You!