2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は...

10
A. Asano, Kansai Univ. 2018年度秋学期 統計学 浅野 関西大学総合情報学部 分布をまとめる平均・分散 第5回 A. Asano, Kansai Univ. 日本の大学生は 世界一? A. Asano, Kansai Univ. A. Asano, Kansai Univ.

Upload: others

Post on 11-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

2018年度秋学期 統計学

浅野 晃 関西大学総合情報学部

分布をまとめる—平均・分散

第5回

A. A

sano

, Kan

sai U

niv.

日本の大学生は

世界一?🥇🥇

A. A

sano

, Kan

sai U

niv.

A. A

sano

, Kan

sai U

niv.

Page 2: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

いったいどこのデータ?

5

EducationEducation

Education at a Glance 2016OECD INDICATORS

 OECD

(経済協力開発機構)の

「教育概況」2016年版

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

いったいどこのデータ?

6

教育程度別 国際成人力調査読解力テストでレベル4,5の人の割合

Figure A1.2. Percentage of adults scoring at literacy proficiency Level 4 or 5, by educational attainment (2012 or 2015)Survey of Adult Skills, 25-64 year-old non-students

Note: Chile, Greece, Israel, Jakarta (Indonesia), Lithuania, New Zealand, Singapore, Slovenia, Turkey: Year of reference 2015. All other countries: Year of reference 2012.* See note on data for the Russian Federation in the Methodology section.Countries and subnational entities are ranked in descending order of the percentage of 25-64 year-olds with tertiary education and literacy proficiency Level 4 or 5.Source: OECD. Table A1.6 (L) available on line. See Annex 3 for notes (www.oecd.org/education/education-at-a-glance-19991487.htm).1 2 http://dx.doi.org/10.1787/888933396586

Below upper secondaryUpper secondary or post-secondary non-tertiaryTertiary

Japa

n

Finl

and

Net

herl

ands

Swed

en

Aus

tral

ia

Nor

way

Flan

ders

(Bel

gium

)

New

Zea

land

Engl

and

(UK

)

Uni

ted

Stat

es

Czec

h R

epub

lic

Pola

nd

Cana

da

Nor

ther

n Ir

elan

d (U

K)

Aus

tria

Aver

age

Ger

man

y

Irel

and

Fran

ce

Den

mar

k

Esto

nia

Sing

apor

e

Slov

ak R

epub

lic

Kor

ea

Slov

enia

Isra

el

Rus

sian

Fed

erat

ion*

Spai

n

Gre

ece

Lith

uani

a

Ital

y

Chi

le

Turk

ey

Jaka

rta

(Ind

ones

ia)

40

35

30

25

20

15

10

5

0

%

 

 

↙大卒レベル

↙高卒レベル

↙中卒レベル

※よく読むと,国どうしの比較は目的ではないと書いてある

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

国際成人力調査(PIAAC)とは

7

文部科学省のサイトに載っています

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

調査の問題例

8

11..55 図図書書検検索索にに関関すするる問問題題 【【習習熟熟度度レレベベルル::44,,難難易易度度::334488点点】】

○○状状 況況 教教育育・・訓訓練練○○形形 式式 複複数数��文文章章かかららななるる複複合合型型○○認認知知的的スストトララテテシジ゙ーー 情情報報��統統合合・・解解釈釈

図書検索結果を見てください。次�質問�答えとなる書名を選び、そ�横にある四角をクリックしてください。

遺伝子組み換え食品に賛成�主張と反対�主張�いずれも信頼できないと主張している��ど�本ですか。

図書検索結果を見てください。次�質問�答えとなる書名を選び、そ�横にある四角をクリックしてください。

遺伝子組み換え食品に賛成�主張と反対�主張�いずれも信頼できないと主張している��ど�本ですか。

Page 3: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

現在では, 「元データ」にあたることは

むずかしくありません💡💡

英語#は必要です

A. A

sano

, Kan

sai U

niv.

代表値🤔🤔

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

代表値とは

11

統計学が相手にするのは,

「分布」しているデータ

データをこんな

ふうに読めれば

いいけれど…

http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm

(大般若会の写真)

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

代表値とは

12

こんなことはできないので,

•ひとつの数にまとめる

http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm

[代表値]

数字で表されていれば,

計算ができる

•図示する(ヒストグラム)

(大般若会の写真)

Page 4: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

平均

13

とくに[算術平均]は

代表的な代表値

(算術)平均   =(データの総和)÷(数値の個数)

↑ ” / ”でも同じ意味

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

平均

14

データ

   

x1, x2, . . . , xn,

      

     

数値の個数 (データサイズ)

   

n

      

     

のとき

平均

   

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n∑

i=1

xi

      

     

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

データサイズ?

15

「データ」という言葉は,

数値の集まりをさす

(1つ1つの数値ではない)

データの中に含まれる数値の個数を

データの大きさ(サイズ)という

家族(family)という言葉に似ている2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

度数分布から平均を求める

16

度数分布とは,これでした

                                                              

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

     

Page 5: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

度数分布から平均を求める

17

平均=(データの合計)/(データサイズ)

  =([階級値×度数]の合計)/(データサイズ)

  =[階級値×(度数/データサイズ)]の合計

  =[階級値×相対度数]の合計

                                                              

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

     

A. A

sano

, Kan

sai U

niv.

分散と標準偏差🤔🤔

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

「ばらつき」を数字で

19

分布は,

大小ばらばらな数値からなるデータ

どのくらいばらばらかを,

数字で表そう

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

     

どう違う?

平均は

どれも5

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

レンジとばらつき

20

Cは,最大と最小の差[レンジ]が

違う

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

     A, Bはレンジは同じだが,

Bのほうがばらついている

ように見える

Page 6: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

偏差

21

偏差を平均したら,AとBのばらつきの

違いが表せる?

各数値と平均との差を[偏差]という

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

     

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2 +3 +4

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

偏差の平均?

22

だめ。平均したらゼロ

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

     

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2 +3 +4

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

偏差を2乗する

23

偏差を2乗したら,全部正の数に なるから,それから平均する

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

     

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2 +3 +4

25 4 4 0 0 0 0 4 4 25

25 16 9 4 0 0 4 9 16 252018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

分散

24

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

     

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2 +3 +4

25 4 4 0 0 0 0 4 4 25

25 16 9 4 0 0 4 9 16 25

平均 6.6

平均 10.8[分散]=(偏差)2の平均

Page 7: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

分散と標準偏差

25

[分散]=(偏差)2の平均 式で書くと

 

σ2 =1

n

{(x1 − x̄)2 + (x2 − x̄)2 + · · ·+ (xn − x̄)2

}

=1

n

n∑

i=1

(xi − x̄)2

     

1番の数値 データの平均

n 個たして

n で割る

分散の平方根を[標準偏差]という

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

度数分布から分散を求める

26

データの平均=[階級値×相対度数]の合計

分散=(偏差)2の平均

  = [(偏差)2×相対度数]の合計

  = [(階級値−データの平均)2×相対度数]の合計

                                                              

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

     

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

なぜ2乗?

27

偏差の2乗ではなく,

偏差の「絶対値」ではいけないの?

絶対値の関数は,途中に折れ目があっ

てむずかしい

2乗を表す関数のグラフ

(放物線)には折り目はない

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

マイナスかけるマイナス=プラス?

28

プラスとマイナスは,「向きが反対」

東に1km進むのが「+1km」なら 🚅🚅💨💨🚅🚅💨💨西に1km進むのは「–1km」

1時間後が「+1時間」なら

1時間前は「–1時間」

東西🚅🚅💨💨

+50km/h(東向き)

+1時間(後)

+50km/h × +1時間 = +50km(東にいる)

東西🚅🚅💨💨

–50km/h(西向き)

–1時間(前)

–50km/h × –1時間= +50km(東にいる)

Page 8: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

標準得点🤔🤔

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

「試験で70点」は優れているのか

30

試験で70点をとった。

まわりより優れているのか?

一緒に受けた人たちの平均点が

50点なら 優れている

80点なら 劣っている

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

「試験で70点」は優れているのか

31

試験で70点をとった。

まわりよりとても優れているのか?

一緒に受けた人たちの平均点が

50点なら まあ優れている

30点なら とても優れている …?

分散も考えないと,答えられない2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

「試験で70点」は優れているのか

32

70点の

「地位」

は同じ。

一緒に受けた人たちが

平均60点で

標準偏差5点

0

       

     

平均0

       

     

平均30点で

標準偏差20点30 70

7060

Page 9: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

「地位」を数字で表す

33

70点の人は,平均を

標準偏差の2倍上回っている

一緒に受けた人たちが

平均60点で標準偏差5点なら

0

       

     

平均30点で標準偏差20点なら

7060

70点の人は,やはり平均を

標準偏差の2倍上回っている

70点の「地位」は同じ

平均0

       

     

30 70

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

標準得点

34

平均を

標準偏差の2倍上回っている

0

       

     

平均を標準偏差の2倍

下回っているなら

7060

[標準得点]が2点

標準得点が-2点

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

標準得点への換算

35

標準得点=

 分布中のある数値が,

 平均を標準偏差の何倍

 上回って/下回っているか

分布そのものを

平均0,標準偏差1に「変換」したら?

その数値の変換後の値が,

そのまま標準得点になる2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

分布の変換

36

分布中の各数値から,平均を引く

平均μ

標準偏差σ

平均0

標準偏差σ

各数値からμを引く

平均μ0X

平均0X – μ

Page 10: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

分布の変換(続き)

37

分布中の各数値から,平均を引いて

標準偏差で割る

平均0

標準偏差σ 各数値を

(1/σ)倍

各数値の偏差は (1/σ)倍

分散は(偏差)2の平均 (1/σ)2倍

標準偏差は分散の平方根 (1/σ)倍

平均0

標準偏差1

平均0X – μ

各数値を(1 / σ)倍する

X – μσ0

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

式で書くと

38

分布そのものをXとすると

Z = (X – μ) / σ

と変換すると,Zは平均0,標準偏差1

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

受験産業でいう「偏差値」

39

平均0,標準偏差1の分布Zを,さらに

W = 10Z + 50

と変換すると,Wは平均50,標準偏差10

これが[偏差値]

偏差値70 平均よりも,標準偏差の2倍

上回っている

偏差値40 平均よりも,標準偏差の1倍

下回っている