第二部份 spss 操作程序與方法

64
1 第第第第 第第第第 SPSS SPSS 第第第第第第第 第第第第第第第 資資資資資資資資資

Upload: eman

Post on 20-Jan-2016

99 views

Category:

Documents


0 download

DESCRIPTION

第二部份 SPSS 操作程序與方法. 資料處理與數據查核. 閱讀範圍. 邱皓政著 量化研究與統計分析 Chapter 4 原始資料的電腦化 Chapter 6 SPSS 統計軟體之運用 Chapter 7 資料的描述與呈現 陳景堂著 統計分析 SPSS for Windows 入門與應用 SPSS 使用 (Chapter 2~4) 資料的轉換 (Chapter 7) 資料描述、統計量數 (Chapter 6 、 8). 1. 原始資料的電腦化. Computerized Raw Data. 課程目標. 了解資料電腦化的一般原則 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第二部份 SPSS 操作程序與方法

1

第二部份第二部份SPSSSPSS 操作程序與方法操作程序與方法

資料處理與數據查核

Page 2: 第二部份 SPSS 操作程序與方法

2

閱讀範圍閱讀範圍

邱皓政著 量化研究與統計分析Chapter 4 原始資料的電腦化Chapter 6 SPSS 統計軟體之運用Chapter 7 資料的描述與呈現

陳景堂著 統計分析 SPSS for Windows 入門與應用

SPSS使用 (Chapter 2~4)(Chapter 2~4)資料的轉換 資料的轉換 (Chapter 7)(Chapter 7)資料描述、統計量數 (Chapter 6(Chapter 6 、、 8)8)

Page 3: 第二部份 SPSS 操作程序與方法

3

1. 1. 原始資料的電腦化原始資料的電腦化

Computerized Raw Data

Page 4: 第二部份 SPSS 操作程序與方法

4

課程目標課程目標了解資料電腦化的一般原則了解編碼系統與編碼表的功能與內容了解並能操作文字資料的計量處理了解廢卷處理的概念與程序了解資料輸入的方法與程序了解特殊題型的處理方式

Page 5: 第二部份 SPSS 操作程序與方法

5

原始資料的電腦化原始資料的電腦化原始資料 (raw data): 反應受測者在問卷實際填答情形的資料型態

紙本原始資料 (raw data on paper)電腦化原始資料 (computerized raw data)

編碼或過錄 (coding):由紙本原始資料轉換成電腦化原始資料的過程編碼與工具發展應同步進行編碼是一套資料處理之模式包含

資料架構 (framework) :資料格式、符號特徵、內容廣度、遺漏處理處理流程 (procedure) :資料分類、轉換、合併、刪除

Page 6: 第二部份 SPSS 操作程序與方法

6

資料的基本類型資料的基本類型

資料特性 文 字 性 量 化 性

開 放 性 :

答案不限定 如檔案與文件資料、訪談觀察記錄、開放式語句等

如家庭人口數、身高體重、IQ無明確範圍的資料

封 閉 性 :

答案限定 以文字形式呈現之限定資料,如性別之男、女

限定的尺度,如Likert type問卷題目

Page 7: 第二部份 SPSS 操作程序與方法

7

文字資料的編碼與過錄文字資料的編碼與過錄步驟一:依編碼系統進行分類與計量步驟二:以虛擬化變項 (dummy variable) 方式,進行資料備整

虛擬化:資料收集完成後,以人為方式進行資料整理賦予數量符號之過程

如將文字轉為數字:將每個類別賦予一個特定數字,如宗教信仰的調查,將天主教賦予 1 、基督教賦予 2 、道教賦予 3 等

虛擬化的問題解釋上的困難:數字本身未具有特定數學邏輯與概念意義編碼的繁複性與主觀性分析方法的問題

Page 8: 第二部份 SPSS 操作程序與方法

8

編碼簿編碼簿(( Codebook)Codebook)

目的:記錄資料數量化之所有格式與內容,詳述資料處理步驟。功能

提供標準化的作業流程溝通的功能工作憑據的建立與工作記憶的留存

內容變項名稱與標籤 ( 說明用 )變項數值與標籤 ( 說明用 )遺漏值處理

SPSS 可利用公用程式來確認編碼表

Page 9: 第二部份 SPSS 操作程序與方法

9

欄位 原始題號

變數名稱 變數標註 數值 變數值標註 遺漏值

1 一 1 ID 受試者編號 000-999 2 一 2 COMPANY 公司名稱 文字 3 一 3 DEPT 部門名稱 文字 4 一 4 YR 資歷(月) 0.0-99.9 99 5 一 5 GENDER 性別 1 男 9 2 女 6 一 6 YOB 出生年次 00-99 99 7 一 7 SALARY 月薪(萬) 00.0-99.9 999 8 一 8 EDU 教育背景 1 國中或以下 9 2 高中職 3 專科 4 大學

5 研究所或以上

9-58 二 1 I1 9 至 至

二 50 I50

組織創新氣氛知覺量表題目:第 1至 50題 (題目略)

1 非常不符合 2 不符合 3 符合 4 非常符合

題號順序 變項的名稱、數值內容與標籤 遺漏值處理方式

Page 10: 第二部份 SPSS 操作程序與方法

10

廢卷處理廢卷處理 回收控制與登錄遺漏與補漏處理不良答題型態的處理反應心向的處理

Page 11: 第二部份 SPSS 操作程序與方法

11

原始資料的電腦處理原始資料的電腦處理純文字資料檔( ASCII files)視窗環境的資料輸入SPSS 軟體的使用直接輸入法間接輸入法

轉檔功能的使用編輯功能的使用

類別變項的加權輸入模式

Page 12: 第二部份 SPSS 操作程序與方法

12

ASCIIASCII 檔案型態檔案型態

Page 13: 第二部份 SPSS 操作程序與方法

13

SPSSSPSS 資料視窗資料視窗

Page 14: 第二部份 SPSS 操作程序與方法

14

資料電腦化的處理原則資料電腦化的處理原則資料輸入以編碼系統為依歸 充分的訓練 良好的作業環境與流程安排 資料保密工作的落實工作記憶的保留

Page 15: 第二部份 SPSS 操作程序與方法

15

上機練習1 . 1 . SPSS使用練習 (( 陳景堂著 課本第二章課本第二章 ))

2 .2 . 資料定義與輸入資料定義與輸入練習 (( 陳景堂著 課本第三、四課本第三、四章章 ))

Page 16: 第二部份 SPSS 操作程序與方法

16

特殊題型之處理程序特殊題型之處理程序 -- 複選複選題題

1. 資料輸入 ( 以個別題目型態輸入 )2. 定義集群

點選統計分析→複選題分析→定義集合 定義集內的變數

3. 完成虛擬複選題變項 4. 次數分配表分析5. 交叉表分析

Page 17: 第二部份 SPSS 操作程序與方法

17

【例】下列為了解青少年人際網路與影響力之題組【例】下列為了解青少年人際網路與影響力之題組

Q1: 長期影響最深的是 同性同學 異性朋友 兄弟姐妹 父母 老師

Q2: 目前對您影響最大的是 同性同學 異性朋友 兄弟姐妹 父母 老師

Q3: 對您最了解的是 同性同學 異性朋友 兄弟姐妹 父母 老師

Q4: 遇到身心問題可以訴說的對象

同性同學 異性朋友 兄弟姐妹 父母 老師

Q5: 重大人生決定可能討論之對象

同性同學 異性朋友 兄弟姐妹 父母 老師

題數 同性同學 異性朋友 兄弟姐妹 父母 老師Q1 ( 長期影響 ) Q11 Q12 Q13 Q14 Q15

Q2 ( 目前影響 ) Q21 Q22 Q23 Q24 Q25

Q3 (貼心了解 ) Q31 Q32 Q33 Q34 Q35

Q4 ( 身心問題 ) Q41 Q42 Q43 Q44 Q45

Q5 (重大決定 ) Q51 Q52 Q53 Q54 Q55

複選變相矩陣型態資料複選變相矩陣型態資料

Page 18: 第二部份 SPSS 操作程序與方法

18

複選題分析對話框複選題分析對話框 11

需先行定義集合才會浮現次數分配與交叉表之功能

Page 19: 第二部份 SPSS 操作程序與方法

19

複選題分析對話框複選題分析對話框 22

每個選項只有被選與不選兩種可能,將被選紀錄為 1 ,不選紀錄為 0

Page 20: 第二部份 SPSS 操作程序與方法

20

複選題分析複選題分析 :: 次數分配表結果輸出次數分配表結果輸出Group $MQ1 長期影響 (Value tabulated = 1) Pct of Pct of Dichotomy label Name Count Responses Cases 長期影響: 同性朋友 Q11 62 31.8 38.5 長期影響: 異性朋友 Q12 10 5.1 6.2 長期影響: 兄弟姊妹 Q13 24 12.3 14.9 長期影響: 父母 Q14 93 47.7 57.8 長期影響: 師長 Q15 6 3.1 3.7 ------- ----- ----- Total responses 195 100.0 121.1 1 missing cases; 161 valid cases

反應百分比

人次百分比

Page 21: 第二部份 SPSS 操作程序與方法

21

特殊題型之處理程序特殊題型之處理程序 -- 排序題排序題

1. 資料輸入 ( 以個別題目型態輸入 )2. 定義集群

點選統計分析→複選題分析→定義集合 定義集內的變數(定義時需依不同的順位進行多次的集內變數定義)

3. 完成虛擬複選題變項 4. 分析:針對不同順位虛擬變數進行次數分配表分析或交叉表分析

Page 22: 第二部份 SPSS 操作程序與方法

22

【例】下列為了解青少年使用網路工具之偏好排名,為一種排序題【例】下列為了解青少年使用網路工具之偏好排名,為一種排序題

Q1: 請問在下列網路工具選項中,指出三種您最常使用與朋友溝通之工具,並依程度標出 1 、 2 、 3 的順序 (1 為最常使用者 )

ICQ CICQ Email MSN

BBS 聊天室 WWW Netmeeting

相關對應表格如下:相關對應表格如下:

ID Gender

Q1A ICQ

Q1B CICQ

Q1C Email

Q1D MSN

Q1E BBS

Q1F 聊天室

Q1G WWW

Q1H Net-

meeting

1 2(女 ) 0 0 1 0 2 0 3 0

2 2 0 0 1 0 2 0 3 0

3 1(男 ) 0 0 2 0 0 3 1 0

4 2 0 0 2 0 1 3 0 0

5 1 0 0 3 0 0 1 2 0

Page 23: 第二部份 SPSS 操作程序與方法

23

排排序序題題定定義義對對話話框框

Page 24: 第二部份 SPSS 操作程序與方法

24

排序題分析排序題分析 : : 次數分配表結果輸出次數分配表結果輸出Group $ORDER1 第一順位 (Value tabulated = 1) Pct of Pct of Dichotomy label Name Count Responses Cases icq Q1A 1 1.7 1.7 e-mail Q1C 22 36.7 36.7 msn Q1D 5 8.3 8.3 bbs Q1E 5 8.3 8.3 聊天室 Q1F 1 1.7 1.7 www Q1G 26 43.3 43.3 ------- ----- ----- Total responses 60 100.0 100.0 0 missing cases; 60 valid cases

Group $ Order 1 第一順位

Page 25: 第二部份 SPSS 操作程序與方法

25

排序題分析排序題分析 : : 交叉表結果輸出交叉表結果輸出 * * * C R O S S T A B U L A T I O N * * * $ORDER1 (tabulating 1) 第一順位 by GENDER 姓別 GENDER Count I男 女 Row pct I Row Col pct I Total Tab pct I 1 I 2 I $ORDER1 --------+--------+--------+ Q1A I 1 I 0 I 1 icq I 100.0 I .0 I 1.7 I 6.3 I .0 I I 1.7 I .0 I +--------+--------+ Q1C I 4 I 18 I 22 e-mail I 18.2 I 81.8 I 36.7 I 25.0 I 40.9 I I 6.7 I 30.0 I +--------+--------+ Q1D I 0 I 5 I 5 msn I .0 I 100.0 I 8.3 I .0 I 11.4 I I .0 I 8.3 I +--------+--------+ Q1E I 1 I 4 I 5 bbs I 20.0 I 80.0 I 8.3 I 6.3 I 9.1 I I 1.7 I 6.7 I +--------+--------+ Q1F I 1 I 0 I 1 聊天室 I 100.0 I .0 I 1.7 I 6.3 I .0 I I 1.7 I .0 I +--------+--------+ Q1G I 9 I 17 I 26 www I 34.6 I 65.4 I 43.3 I 56.3 I 38.6 I I 15.0 I 28.3 I +--------+--------+ Column 16 44 60 Total 26.7 73.3 100.0 Percents and totals based on respondents 60 valid cases; 0 missing cases

Page 26: 第二部份 SPSS 操作程序與方法

26

上機練習

1. 1. 複選題練習

2. 2. 特殊題型排序題練習

Page 27: 第二部份 SPSS 操作程序與方法

27

2. SPSS 統計軟體之運用

Usage of the SPSS software

Page 28: 第二部份 SPSS 操作程序與方法

28

SPSS 程式的基本操作流程 一、資料定義( data definition )

使電腦能夠正確的辨認量化的數據,並對於數據賦予正確的意義。

變項名稱指定(變項標籤)、變項數值的標籤、變項的格式類型、遺漏值的設定。

資料定義必需與編碼表配合,將適當的變項名稱與數據的意義加以標註,並設定適當的遺漏值,方能使後續的資料處理與分析能夠正確有效的進行。

Page 29: 第二部份 SPSS 操作程序與方法

29

標籤註記指令範例與說明

標籤註記 SPSS/PC主指令 範 例 說 明

變項標註 VARIABLES LABELS VARIABLES LABELS SEX

“性別” AGE “年齡”.

為變項 SEX及AGE貼

標籤

數值標註 VALUE LABELS VALUE LABELS SEX 1 “男”

2 “女” / X3 1 “好人” 2 “壞人”.

為變項SEX及X3的數

值貼標籤,SEX的數值

1為男,2為女。

數值加註 ADD VALUE LABELS ADD VALUE LABELS X3 3

“廢人”.

為變項 X3的數值 3增

貼標籤為廢人。

Page 30: 第二部份 SPSS 操作程序與方法

30

二、資料轉換( data transformation )進行資料分析前的一些校正與轉換的工作如反向題的反向計分,出生年月變項轉變成年齡

之新變項的創造。廢卷處理、資料備便、遺漏值的補漏檢查等作業,也是在此一階段進行。 SPSS軟體提供的觀察值選擇、重新編組或四則運算等指令,皆能協助轉換工作的進行。

一旦轉換完成後,此一資料庫已可稱為乾淨的( clean and clear )的資料。

SPSS 程式的基本操作流程

Page 31: 第二部份 SPSS 操作程序與方法

31

資料轉換指令 量化研究的資料處理包括多

種的資料整理的程序,例如COMPUTE 、 COUNT 、 RECODE 、 RANK 、 SORT 、SAMPLE 、 N 等。

Page 32: 第二部份 SPSS 操作程序與方法

32

四則(邏輯)運算指令 COMPUTE

提供使用者將資料進行各種邏輯運算處理 四則運算的表現則依一般數學關係式的模式

(先乘除後加減),可配合函數來進行運算。語法為

COMPUTE 新變項 =原有變項之四則運算

Page 33: 第二部份 SPSS 操作程序與方法

33

四則運算指令語法與範例 四則運算 SPSS/PC指令語法 範 例

新變項運算 COMPUTE

COMPUTE 新變項=既有變項之四則運算 四則運算符號: +-*/: 加減乘除 **: 乘冪

函數符號: ABS: 取絕對值 RND: 取整數 TRUNC: 四捨五入 SORT: 取平方根 LG10: 10為底之對數 LN: 自然對數 EXP: 指數 NORMAL: 取常態分配值 Uniform: 取 Uniform分配值

一般四則運算 COMPUTE X9=X1+X2+(X3+X4)/2+X6*2. COMPUTE X9=X7**2. (平方)

函數運算 COMPUTE X9=ABS(X1-X2). COMPUTE X9=RND((X1+X2+X3)/3).

COMPUTE X9=TRUNC((X1+X2+X3)/3). COMPUTE X9=SORT(4X8)*10. COMPUTE X9=LG10(X8). COMPUTE X9=LN(X8). COMPUTE X9=EXP(X8). COMPUTE X9=NORMAL(1.5). COMPUTE X9=UNIFORM(10).

Page 34: 第二部份 SPSS 操作程序與方法

34

Recode

RECODE (轉換)指令的用途非常廣,可以將變項的數值進行各種轉換。如反向題轉換、分組類別的調整。

語法如下 : RECODE 變項名 (舊數值 = 新數值)

範例 : RECODE X2 (1=5)(2=4)(4=2)(5=1). 反向題轉換 RECODE X2 X8 X12 X25 (1=5)(2=4)(4=2)(5=1).(若有多題類似情形時 )

RECODE EDU (1=1)(2=2)(3=3)(4=3)(5=4)(6=4).(教育程度重新分組 )

VALUE LABELS EDU 1”國小及以下” 2 “國中” 3 “高中職” 4 大學及以上” .

Page 35: 第二部份 SPSS 操作程序與方法

35

COUNT(計數 ) COUNT 指令用於計算一組變項當中,重複出現某一個數值的次

數,並將此一次數指定為一個新變數的數值。 例如,民意調查用十個指標去評估行政院長的施政滿意度,受訪者在十個題目上回答相當不滿意 (1) 、不滿意 (2) 、滿意 (3) 、非常滿意 (4) ,施測完畢之後,每一位受訪者在十題的反應中,出現幾個滿意、幾個不滿意,可以用 COUNT 指令來計數

語法如下 COUNT 新變項 =舊變項名 (某數值 ) COUNT Y=I1 TO I10 (4) 計算受訪者在十題回答非常滿意的次數,放入

新變項 Y) COUNT Z=I1 TO I10 (lowest thru 2) 計算受訪者在十題回答不滿

意與非常 不滿意的次數,放入新變項 Z) COUNT MISS=I1 TO I10 (MISSING) 計算受訪者在十題回答遺漏

的次數放入 MISS 新變項 )

Page 36: 第二部份 SPSS 操作程序與方法

36

條件化邏輯指令IF 、 PROCESS IF 、 SELECT IF

在限定特定條件下,來進行新變項的創造 IF 指令為一般性條件指令,只有符合括弧內條件關係

的情形下,才會執行後方的四則運算式。 語法如下 :

IF (條件式 ) 新變項 =邏輯運算 範例 :

• IF ((A+B) LT 100) P=1. ( 當 A+B大於 10時,新變項 P 為 1)• IF (SYSMIS(GENDER)) S=0. ( 當 GENDER 為遺漏值時, S

為 0)• IF (CITY=”TPE” AND GROUP=1) K=1. (CITY 為字串變項 )

Page 37: 第二部份 SPSS 操作程序與方法

37

邏輯運算子之縮寫與範例說明

邏輯關係 英文縮寫 關係運算子 範 例

等於 EQ = IF (GENDER=1) A=B+C. IF (GENDER EQ 1) A=B+C.

不等於 NE ~=或<> IF (GENDER<>1) A=B+C. IF (GENDER NE 1) A=B+C.

大於 GT > IF (AGE > 20) K=1.

大於等於 GE >= IF (AGE >= 20) K=1.

小於 LT < IF (AGE < 20) K=2.

小於等於 LE <= IF (AGE <= 20) K=2.

且 AND & IF (AGE<20 & GENDER=1) P=1.

或 OR 1 IF (AGE>20 OR AGE <10) M=1.

非 NOT ~ IF (AGE ~ 10) N=2.

Page 38: 第二部份 SPSS 操作程序與方法

38

PROCESS IF 與 SELECT IF

PROCESS IF 與 SELECT IF 則是條件化的條件化指令。也就是在 IF條件式的功能下,附加對於 IF 指令的操作條件。

PROCESS IF 對於資料的限定化處理是暫時性的, SELECT IF 對於資料的限定化處理是永久性的。

完整的 PROCESS IF 與 SELECT IF 指令應包含兩行指令,條件式動作式

每一筆資料經過 PROCESS IF 的二行指令處理完成後,才進行其他的指令。

語法如下 : PROCESS IF (條件式 ).

Page 39: 第二部份 SPSS 操作程序與方法

39

條件化指令語法與範例

條件化指令 SPSS/PC指令語法 範 例 IF IF (條件) 新變項=條件 IF (AGE > 20) AGEGRP=2. PROCESS IF PROCESS IF (條件)

任何有效程式

之後資料可復元

PROCESS IF (GENDER =1). LIST AGE. (GENDER=1與其他資料仍留在資料庫)

SELECT IF SELECT IF (條件)

任何有效程式

之後資料無法復元

SELECT IF (GENDER =1). LIST AGE. (只有 GENDER=1者留在資料庫)

Page 40: 第二部份 SPSS 操作程序與方法

40

RANK

RANK 指令能將某一個變項的數值,產生等級、百分等級、常態分數等類型的分數。

語法如下 RANK 變項 /RANK INTO 新變項名 (產生等級變數於

新變項 ) /NTILES( 組數 ) INTO 新變項名 (產生百分等級 ) /NORMAL INTO 新變項名 (產生常態等級 ) /RFRACTION INTO 新變項名 (產生比率等級 ) /SAVAGE INTO 新變項名 (產生指數分數 )

Page 41: 第二部份 SPSS 操作程序與方法

41

SAMPLE與 N

SAMPLE 的功能在從資料庫中隨機抽取一定比率的樣本,而 N 指令則是抽取特定位置的樣本。

語法如下: SAMPLE 百分比 . SAMPLE 樣本數 FROM 總筆數 N n 範例 :

• SAMPLE .25. (隨機取用某百分之 25 之樣本 )• SAMPLE 500 FROM 5000 (自總筆數 5000 當中隨機抽取

500筆資料 )• N 100 (抽取前 100筆資料作為樣本 )

Page 42: 第二部份 SPSS 操作程序與方法

42

資料轉換指令語法與範例說明資料管理 主指令語法 範 例

轉換數值 RECODE 變項名 (新數值=舊數值)

RECODE AGE (99=SYSMIS) RECODE EDU (1=1)(2=1)(3=2)(4=2)(ELSE=3).

計數 COUNT 新變項=被計數變項 (被計數之數值)

COUNT X=I1 to I20(1).

賦予順序 RANK 變項名 /次指令 INTO 新變項名

RANK WE HI(D) (自動創造名為 RWE RHI

的順序變項)

隨機取樣 SAMPLE % SAMPLE .25.

固定取樣 N n N 100.

排序 SORT 變項名 (A或 D) SORT X1(A). (升冪) SORT AGE(D). (降冪)

直接展示 LIST /VAR 變項名 /cases from m to n by p

LIST /VAR x1 to x10 /CASES FROM 1 to 10.

報表輸出 REPORT /VAR 變項(s). REPORT /VAR X1 TO X10 ….

Page 43: 第二部份 SPSS 操作程序與方法

43

上機練習

1. 資料的轉換練習 (( 陳景堂課本第七章陳景堂課本第七章 ))

Page 44: 第二部份 SPSS 操作程序與方法

44

三、資料分析( data analysis )依操作者的指令,進行各種的統計分析或統

計圖表的製作。操作者必須具備良好的統計基本知識,才能在數十種統計指令當中選擇適合的統計方法來分析資料。

操作者必須能夠閱讀分析之後的報表數據,從不同的指數與指標當,尋求關鍵且正確的數據來作為研究報告撰寫的根據。

SPSS 程式的基本操作流程

Page 45: 第二部份 SPSS 操作程序與方法

45

3. 3. 資料的呈現與描述資料的呈現與描述

Description and Graphing of the Data

Page 46: 第二部份 SPSS 操作程序與方法

46

社會科學研究社會科學研究 : : 資料處理的角色與內容資料處理的角色與內容

資料分析前置作業流程

資料輸入資料輸入

資料查核資料查核

資料轉換資料轉換

資料呈現描述資料呈現描述

工具發展工具發展 問卷與編碼表問卷與編碼表

電腦化原始資料 電腦化原始資料 (.s(.sav)av)

備便資料檔備便資料檔 .sav.sav語法檔語法檔 .sps.sps((資料定義與轉資料定義與轉換換 ))

結果輸出檔 結果輸出檔 ..spospo

資料的統計分析與報告

研究計劃 : 方法設計與執行

Page 47: 第二部份 SPSS 操作程序與方法

4747

資料呈現與描述資料呈現與描述 資料呈現:資料呈現:

1.1. 運用運用次數分配次數分配來整理並描繪變數數值分佈情來整理並描繪變數數值分佈情形形

次數分配表次數分配表 次數分配圖次數分配圖

2.2. 利用利用統計圖表統計圖表來表現出數據的特性與分佈情來表現出數據的特性與分佈情形形

摘要統計:摘要統計: 透過透過描述統計描述統計的統計量運算,建立初步的統的統計量運算,建立初步的統

計指標,作為後續統計分析的基礎。 計指標,作為後續統計分析的基礎。

Page 48: 第二部份 SPSS 操作程序與方法

48

類別資料的次數分配表類別資料的次數分配表

研究樣本的職務別次數分配表

7 4.5 4.5 4.534 21.8 22.1 26.631 19.9 20.1 46.82 1.3 1.3 48.1

73 46.8 47.4 95.51 .6 .6 96.16 3.8 3.9 100.0

154 98.7 100.02 1.3

156 100.0

1.00 高級主管2.00 中級主管3.00 基層管理人員4.00 現場人員5.00 一般職員6.00 臨時兼職人員7.00 其他總和

有效的

系統界定的遺漏遺漏值總和

次數 百分比 有效百分比 累積百分比

類別資料由於缺乏計量單位數值的類別資料由於缺乏計量單位數值的種類較少,最適合使用次數分配表種類較少,最適合使用次數分配表

Page 49: 第二部份 SPSS 操作程序與方法

49

程度測量的次數分配表

薪水分組 組中點 頻率 %累積10000 - 14999 12500 0 .00%15000 - 19999 17500 17 3.59%20000 - 24999 22500 71 18.57%25000 - 29999 27500 120 43.88%30000 - 34999 32500 102 65.40%35000 - 39999 37500 47 75.32%40000 - 44999 42500 27 81.01%45000 - 49999 47500 14 83.97%50000 - 54999 52500 10 86.08%55000 - 59999 57500 15 89.24%60000 - 64999 62500 12 91.77%65000 - 69999 67500 9 93.67%70000 - 74999 72500 9 95.57%75000 - 79999 77500 4 96.41%80000 - 84999 82500 6 97.68%85000 - 89999 87500 2 98.10%90000 - 94999 92500 3 98.73%95000 - 99999 97500 1 98.95%

100000 - 104999 102500 1 99.16%105000 - 109999 107500 2 99.58%110000 - 114999 112500 1 99.79%115000 - 119999 117500 0 99.79%120000 - 124999 122500 0 99.79%125000 - 129999 127500 0 99.79%130000 - 134999 132500 0 99.79%135000 - 139999 137500 1 100.00%

連續變項的次數分配表

連續資料通常資料通常需要先計算全需要先計算全距再決定組數距再決定組數與組距,並定與組距,並定義各組上下限義各組上下限

Page 50: 第二部份 SPSS 操作程序與方法

50

長條圖長條圖

研究所或以上

大學

專科

高中職

國中或以下

次數

300

200

100

0

75

233

274

144

類別資料的次數分配圖類別資料的次數分配圖

Page 51: 第二部份 SPSS 操作程序與方法

51

直方圖直方圖

Current Salary

140

120

100

80

60

40

20

0

= 17075.66 標準差

= 34419.6平均數

N = 474.00

連續資料的次數分配圖連續資料的次數分配圖

Page 52: 第二部份 SPSS 操作程序與方法

52

莖葉圖(莖葉圖( Stem-and-Leaf PlotStem-and-Leaf Plot)) 普林斯頓大學 John Tukey 教授於 1977年所發展一種用以描述觀察值的簡便方法,可以快速的以人工將觀察值進行劃記,並以圖表的方式呈現出來,兼具次數分配表與長條圖的雙重優點。 莖葉圖最適合二位數資料之呈現,如考試成績

莖葉圖製作係將每個觀察值切割為莖葉兩部份,中間以垂直線隔開。莖為觀察值中間十位數或以上之數字業則為個位數的數字。

Page 53: 第二部份 SPSS 操作程序與方法

53

莖葉圖範例

年齡年齡 Stem-and-Leaf Plot Frequency Stem & Leaf 2.00 2 . 11 2.00 2 . 23 8.00 2 . 44445555 11.00 2 . 66666666777 16.00 2 . 8888899999999999 8.00 3 . 00011111 5.00 3 . 22333 8.00 3 . 44445555 8.00 3 . 66667777 10.00 3 . 8888899999 5.00 4 . 11111 1.00 4 . 2 1.00 4 . 5 1.00 4 . 7 6.00 4 . 888889 2.00 5 . 00 2.00 Extremes (>=56) Stem width: 10

Each leaf: 1 case(s)

莖的部份 葉的部份

Page 54: 第二部份 SPSS 操作程序與方法

54

描述統計描述統計 : : 集中趨勢量數集中趨勢量數基本概念

描述測量觀察值集中情形為數據建立一個能夠描述其共同落點的最佳指標

常用的集中量數眾數 (mode): 一組數中出現最多的數中數( median) : 一組數中出現在最中間的數平均數 (mean) : 將一變項中所有數值之總和除以總資料數所地之結果

Page 55: 第二部份 SPSS 操作程序與方法

55

集中量數之測量特性與比較集 中 量 數

測量層次 眾數 中位數 平均數

名義測量

順序測量

等距測量

優點 不受偏離值的影響,計算方法簡便。

對極端值不敏感,較不受極端值影響,計算方法尚稱簡便

測量最為精密, 考慮到每一個樣本,具有代表性。

缺點 測量過於粗糙,無法反應所有樣本的狀況。

無法反應所有樣本的狀況。

易受偏離極端值的影響。

Page 56: 第二部份 SPSS 操作程序與方法

56

描述統計描述統計 : : 離散量數離散量數基本概念

描述測量觀察值分散狀況的情形為數據建立數據分佈廣度的指標

常用的離散量數全距 (Range): 一組數中最大值與最小值之差,為一群數分離程度最粗略之指標四分差 : 將資料由小至大排列後,依資料數平均分為四段,則每段各佔 25%之個數,位居三個分段點之分數稱為第一四分位數、第二四分位數、第三四分位數變異數 (variable): 將資料值減去平均數後,求平方和後,在將加總後之數值除以人數。標準差 (standard deviation) : 變異數 之平方根

Page 57: 第二部份 SPSS 操作程序與方法

57

離散量數之測量特性與比較離 散 量 數 測量層次

全距 四分差 標準差與變異數

名義測量

順序測量

等距測量

優 點

不受偏離值的影響 計算方法簡便 且適用於所有的測量尺度

對極端值不敏感,較不受極端值影響 能表現順序尺度的離散情形

測量最為精密 考慮到每一個樣本,具有代表性

缺 點 測量過於粗糙 無法反映所有樣本的狀況

無法反映所有樣本的離散狀況

易受偏離極端值的影響

Page 58: 第二部份 SPSS 操作程序與方法

58

描述統計描述統計 : : 偏態與峰度偏態與峰度

高狹峰 低闊峰 常態峰

負偏態 (左偏 ) 正偏態 (右偏 ) 常態

Page 59: 第二部份 SPSS 操作程序與方法

59

偏態與峰度係數的計算

偏 態 ( 三 級 動 差 ) :

峰 度 ( 四 級 動 差 ) :

動 差 :

Page 60: 第二部份 SPSS 操作程序與方法

60

偏態與峰度係數的判斷

偏態 偏態係數 峰度 峰度係數

正偏態 g1 > 0 高狹峰 g2 > 0

負偏態 g1 < 0 低闊峰 g2 < 0

對稱 g1 = 0 常態峰 g2 = 0

Page 61: 第二部份 SPSS 操作程序與方法

61

描述統計 : 標準分數 (Z score)

標準分數將變項變量以原始平均數與標準差進行數學轉換得出一個平均數為零,標準差為 1的變量

標準分數為去單位化之分數,可以反應出原始數值的方向與分散情形,並作跨分配的比較。

Z分數 : 原始分數減去其平均數,再除以標準差後所得到的新分數。

X- Z= ─ ─ ─ s

Page 62: 第二部份 SPSS 操作程序與方法

62

常態曲線的特徵 常態曲線的特徵 (normalit(normality)y)

1. 對稱性 (symmetry)2. 單峰分配 (unimodal)3. 平均數、眾數、中數落於分配的中心點4. 具有機率分配的機本特質

Page 63: 第二部份 SPSS 操作程序與方法

63

上機練習

1 .1 . 資料描述、統計量數 資料描述、統計量數 ( 課本第六章、第八章 )

次數分配表之製作次數分配表之製作點選 分析 → 敘述性統計 → 次數分配表點選 分析 → 敘述性統計 → 次數分配表

莖葉圖之製作莖葉圖之製作點選 分析 → 敘述性統計 → 預檢資料點選 分析 → 敘述性統計 → 預檢資料

Page 64: 第二部份 SPSS 操作程序與方法

64

第一次作業 (( 陳景堂陳景堂 ))

1 . 1 . 課本第三章 (p.3-9) 、第 5小題

2 . 2 . 課本第四章 (p.4-38) 、第 1小題

3 . 3 . 課本第六章 (p.6-18) 、第 2小題

4. 4. 課本第七章 (p.7-66) 、第 5 、 6 、 8 、 9 、 10小題 5. 5. 課本第八章 (p.8-8) 、第 4小題