2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は...
TRANSCRIPT
A. A
sano
, Kan
sai U
niv.
2018年度秋学期 統計学
浅野 晃 関西大学総合情報学部
分布をまとめる—平均・分散
第5回
A. A
sano
, Kan
sai U
niv.
日本の大学生は
世界一?🥇🥇
A. A
sano
, Kan
sai U
niv.
A. A
sano
, Kan
sai U
niv.
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
いったいどこのデータ?
5
EducationEducation
Education at a Glance 2016OECD INDICATORS
OECD
(経済協力開発機構)の
「教育概況」2016年版
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
いったいどこのデータ?
6
教育程度別 国際成人力調査読解力テストでレベル4,5の人の割合
Figure A1.2. Percentage of adults scoring at literacy proficiency Level 4 or 5, by educational attainment (2012 or 2015)Survey of Adult Skills, 25-64 year-old non-students
Note: Chile, Greece, Israel, Jakarta (Indonesia), Lithuania, New Zealand, Singapore, Slovenia, Turkey: Year of reference 2015. All other countries: Year of reference 2012.* See note on data for the Russian Federation in the Methodology section.Countries and subnational entities are ranked in descending order of the percentage of 25-64 year-olds with tertiary education and literacy proficiency Level 4 or 5.Source: OECD. Table A1.6 (L) available on line. See Annex 3 for notes (www.oecd.org/education/education-at-a-glance-19991487.htm).1 2 http://dx.doi.org/10.1787/888933396586
Below upper secondaryUpper secondary or post-secondary non-tertiaryTertiary
Japa
n
Finl
and
Net
herl
ands
Swed
en
Aus
tral
ia
Nor
way
Flan
ders
(Bel
gium
)
New
Zea
land
Engl
and
(UK
)
Uni
ted
Stat
es
Czec
h R
epub
lic
Pola
nd
Cana
da
Nor
ther
n Ir
elan
d (U
K)
Aus
tria
Aver
age
Ger
man
y
Irel
and
Fran
ce
Den
mar
k
Esto
nia
Sing
apor
e
Slov
ak R
epub
lic
Kor
ea
Slov
enia
Isra
el
Rus
sian
Fed
erat
ion*
Spai
n
Gre
ece
Lith
uani
a
Ital
y
Chi
le
Turk
ey
Jaka
rta
(Ind
ones
ia)
40
35
30
25
20
15
10
5
0
%
↙大卒レベル
↙高卒レベル
↙中卒レベル
※よく読むと,国どうしの比較は目的ではないと書いてある
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
国際成人力調査(PIAAC)とは
7
文部科学省のサイトに載っています
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
調査の問題例
8
11..55 図図書書検検索索にに関関すするる問問題題 【【習習熟熟度度レレベベルル::44,,難難易易度度::334488点点】】
○○状状 況況 教教育育・・訓訓練練○○形形 式式 複複数数��文文章章かかららななるる複複合合型型○○認認知知的的スストトララテテシジ゙ーー 情情報報��統統合合・・解解釈釈
図書検索結果を見てください。次�質問�答えとなる書名を選び、そ�横にある四角をクリックしてください。
遺伝子組み換え食品に賛成�主張と反対�主張�いずれも信頼できないと主張している��ど�本ですか。
図書検索結果を見てください。次�質問�答えとなる書名を選び、そ�横にある四角をクリックしてください。
遺伝子組み換え食品に賛成�主張と反対�主張�いずれも信頼できないと主張している��ど�本ですか。
A. A
sano
, Kan
sai U
niv.
現在では, 「元データ」にあたることは
むずかしくありません💡💡
英語#は必要です
A. A
sano
, Kan
sai U
niv.
代表値🤔🤔
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
代表値とは
11
統計学が相手にするのは,
「分布」しているデータ
データをこんな
ふうに読めれば
いいけれど…
http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm
(大般若会の写真)
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
代表値とは
12
こんなことはできないので,
•ひとつの数にまとめる
http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm
[代表値]
数字で表されていれば,
計算ができる
•図示する(ヒストグラム)
(大般若会の写真)
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
平均
13
とくに[算術平均]は
代表的な代表値
(算術)平均 =(データの総和)÷(数値の個数)
↑ ” / ”でも同じ意味
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
平均
14
データ
x1, x2, . . . , xn,
数値の個数 (データサイズ)
n
のとき
平均
x̄ =x1 + x2 + · · ·+ xn
n=
1
n
n∑
i=1
xi
和
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
データサイズ?
15
「データ」という言葉は,
数値の集まりをさす
(1つ1つの数値ではない)
データの中に含まれる数値の個数を
データの大きさ(サイズ)という
家族(family)という言葉に似ている2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
度数分布から平均を求める
16
度数分布とは,これでした
以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)
25 35 30 3 0.06 (6%)
35 45 40 3 0.06 (6%)
45 55 50 8 0.16 (16%)
55 65 60 12 0.24 (24%)
65 75 70 8 0.16 (16%)
75 85 80 9 0.18 (18%)
85 95 90 3 0.06 (6%)
x x x 計 計50 1 (100%)
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
度数分布から平均を求める
17
平均=(データの合計)/(データサイズ)
=([階級値×度数]の合計)/(データサイズ)
=[階級値×(度数/データサイズ)]の合計
=[階級値×相対度数]の合計
以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)
25 35 30 3 0.06 (6%)
35 45 40 3 0.06 (6%)
45 55 50 8 0.16 (16%)
55 65 60 12 0.24 (24%)
65 75 70 8 0.16 (16%)
75 85 80 9 0.18 (18%)
85 95 90 3 0.06 (6%)
x x x 計 計50 1 (100%)
A. A
sano
, Kan
sai U
niv.
分散と標準偏差🤔🤔
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
「ばらつき」を数字で
19
分布は,
大小ばらばらな数値からなるデータ
どのくらいばらばらかを,
数字で表そう
A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10
B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10
C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7
どう違う?
平均は
どれも5
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
レンジとばらつき
20
Cは,最大と最小の差[レンジ]が
違う
A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10
B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10
C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7
A, Bはレンジは同じだが,
Bのほうがばらついている
ように見える
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
偏差
21
偏差を平均したら,AとBのばらつきの
違いが表せる?
各数値と平均との差を[偏差]という
A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10
B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10
0 +2 +5-2-5
0 +5-5 -4
0 00-2 +2
0-3 -2 +2 +3 +4
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
偏差の平均?
22
だめ。平均したらゼロ
A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10
B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10
0 +2 +5-2-5
0 +5-5 -4
0 00-2 +2
0-3 -2 +2 +3 +4
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
偏差を2乗する
23
偏差を2乗したら,全部正の数に なるから,それから平均する
A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10
B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10
0 +2 +5-2-5
0 +5-5 -4
0 00-2 +2
0-3 -2 +2 +3 +4
25 4 4 0 0 0 0 4 4 25
25 16 9 4 0 0 4 9 16 252018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
分散
24
A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10
B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10
0 +2 +5-2-5
0 +5-5 -4
0 00-2 +2
0-3 -2 +2 +3 +4
25 4 4 0 0 0 0 4 4 25
25 16 9 4 0 0 4 9 16 25
平均 6.6
平均 10.8[分散]=(偏差)2の平均
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
分散と標準偏差
25
[分散]=(偏差)2の平均 式で書くと
σ2 =1
n
{(x1 − x̄)2 + (x2 − x̄)2 + · · ·+ (xn − x̄)2
}
=1
n
n∑
i=1
(xi − x̄)2
1番の数値 データの平均
n 個たして
n で割る
分散の平方根を[標準偏差]という
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
度数分布から分散を求める
26
データの平均=[階級値×相対度数]の合計
分散=(偏差)2の平均
= [(偏差)2×相対度数]の合計
= [(階級値−データの平均)2×相対度数]の合計
以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)
25 35 30 3 0.06 (6%)
35 45 40 3 0.06 (6%)
45 55 50 8 0.16 (16%)
55 65 60 12 0.24 (24%)
65 75 70 8 0.16 (16%)
75 85 80 9 0.18 (18%)
85 95 90 3 0.06 (6%)
x x x 計 計50 1 (100%)
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
なぜ2乗?
27
偏差の2乗ではなく,
偏差の「絶対値」ではいけないの?
絶対値の関数は,途中に折れ目があっ
てむずかしい
2乗を表す関数のグラフ
(放物線)には折り目はない
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
マイナスかけるマイナス=プラス?
28
プラスとマイナスは,「向きが反対」
東に1km進むのが「+1km」なら 🚅🚅💨💨🚅🚅💨💨西に1km進むのは「–1km」
1時間後が「+1時間」なら
1時間前は「–1時間」
東西🚅🚅💨💨
+50km/h(東向き)
+1時間(後)
+50km/h × +1時間 = +50km(東にいる)
東西🚅🚅💨💨
–50km/h(西向き)
–1時間(前)
–50km/h × –1時間= +50km(東にいる)
A. A
sano
, Kan
sai U
niv.
標準得点🤔🤔
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
「試験で70点」は優れているのか
30
試験で70点をとった。
まわりより優れているのか?
一緒に受けた人たちの平均点が
50点なら 優れている
80点なら 劣っている
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
「試験で70点」は優れているのか
31
試験で70点をとった。
まわりよりとても優れているのか?
一緒に受けた人たちの平均点が
50点なら まあ優れている
30点なら とても優れている …?
分散も考えないと,答えられない2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
「試験で70点」は優れているのか
32
70点の
「地位」
は同じ。
一緒に受けた人たちが
平均60点で
標準偏差5点
0
平均0
平均30点で
標準偏差20点30 70
7060
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
「地位」を数字で表す
33
70点の人は,平均を
標準偏差の2倍上回っている
一緒に受けた人たちが
平均60点で標準偏差5点なら
0
平均30点で標準偏差20点なら
7060
70点の人は,やはり平均を
標準偏差の2倍上回っている
70点の「地位」は同じ
平均0
30 70
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
標準得点
34
平均を
標準偏差の2倍上回っている
0
平均を標準偏差の2倍
下回っているなら
7060
[標準得点]が2点
標準得点が-2点
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
標準得点への換算
35
標準得点=
分布中のある数値が,
平均を標準偏差の何倍
上回って/下回っているか
分布そのものを
平均0,標準偏差1に「変換」したら?
その数値の変換後の値が,
そのまま標準得点になる2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
分布の変換
36
分布中の各数値から,平均を引く
平均μ
標準偏差σ
平均0
標準偏差σ
各数値からμを引く
平均μ0X
平均0X – μ
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
分布の変換(続き)
37
分布中の各数値から,平均を引いて
標準偏差で割る
平均0
標準偏差σ 各数値を
(1/σ)倍
各数値の偏差は (1/σ)倍
分散は(偏差)2の平均 (1/σ)2倍
標準偏差は分散の平方根 (1/σ)倍
平均0
標準偏差1
平均0X – μ
各数値を(1 / σ)倍する
X – μσ0
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
式で書くと
38
分布そのものをXとすると
Z = (X – μ) / σ
と変換すると,Zは平均0,標準偏差1
2018年度秋学期 統計学
A. A
sano
, Kan
sai U
niv.
39 –
受験産業でいう「偏差値」
39
平均0,標準偏差1の分布Zを,さらに
W = 10Z + 50
と変換すると,Wは平均50,標準偏差10
これが[偏差値]
偏差値70 平均よりも,標準偏差の2倍
上回っている
偏差値40 平均よりも,標準偏差の1倍
下回っている