データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultx) 線形 (resultx)...

24
データの可視化 測定や計測したデータを わかりやすく表示する方法 きむあき

Upload: others

Post on 07-Jul-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

データの可視化

測定や計測したデータを

わかりやすく表示する方法

きむあき

Page 2: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

データの可視化

1 現象を測定し、数値化する

2 表計算シートに結果を入力する

3 グラフ化する(注意事項あり)

4 回帰直線や曲線の方程式を表示させる

Page 3: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

基本の作法

まずグラフ化するときの基本はまずデータの

散布図 を描くこと

(大切な注意:データの意味を考える前に棒グラフや折れ線グラフにしないこと)

Page 4: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

大切な事

• 回帰直線や曲線回帰は所詮 分散の加工

• 元データを対数化、指数化すると、

• 曲線的に見えた散布図はみな直線回帰できる(ただし 制約条件を加える)

• (統計学の思想は、できるだけシンプルにすることだから)

Page 5: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

今FactorXを測定記録する(準備)

time resultX 1 2 3 4 5 6 7 8 9 10

Page 6: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

今FactorXを測定記録 完了

time resultX 1 30 2 20 3 10 4 5 5 4 6 3 7 4 8 3 9 3

10 2

Page 7: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

1 2

Page 8: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

散布図ができる

0

5

10

15

20

25

30

35

0 2 4 6 8 10 12

resultX

resultX

Page 9: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

データ可視化 完了

データから方程式を求める方法には、最小二乗法と言われる各データとの距離が最小になるように直線を引く方法が一般的に使われる。

一般に、この二乗の意味が線からデータの点が正方形の面積の端っこ(対角線上)にあるように想定し、この面積が最小になる線分を決めることから、こう名付けられた。

この線分の引き方は誤差項を想定する場合と、原点を通す場合がある。

Page 10: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

データの方程式を求める 右クリックをする

Page 11: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

右クリックをする

Page 12: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =
Page 13: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =
Page 14: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =
Page 15: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

y = -2.4848x + 22.067 R² = 0.6511

-5

0

5

10

15

20

25

30

35

0 2 4 6 8 10 12

resultX

resultX

線形 (resultX)

線形 (resultX)

65.11%の

説明力がある

Page 16: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

対数近似を行う

Page 17: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

y = 24.403e-0.27x R² = 0.8337

0

5

10

15

20

25

30

35

0 2 4 6 8 10 12

resultX

resultX

指数 (resultX)

83.371%の

説明力がある

Page 18: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

ここまでは、通常の方法

Page 19: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

次にデータの変換を行う(対数化)

time resultX 対数化

1 30 1.477121

2 20 1.30103

3 10 1

4 5 0.69897

5 4 0.60206

6 3 0.477121

7 4 0.60206

8 3 0.477121

9 3 0.477121

10 2 0.30103

Page 20: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =
Page 21: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

対数化し、線形近似する

y = -0.1175x + 1.3874 R² = 0.8337

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

0 2 4 6 8 10 12

対数化

対数化

線形 (対数化)

Page 22: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =
Page 23: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

対数変換したものを対数回帰させる

y = -0.517ln(x) + 1.522 R² = 0.9461

0

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

0 2 4 6 8 10 12

対数化

対数化

対数 (対数化)

当てはまりは94.61%

Page 24: データの可視化 - kimuakikimuakilabo.main.jp/data_mieruka.pdf線形 (resultX) 線形 (resultX) 65.11%の 説明力があ る 対数近似を 行う y = 24.403e-0.27x R² =

まとめ

• 何に重点を置いて、回帰を行うかを、あらかじめ決めておくことが大切。

• なるべく直線で回帰することが望ましい。

• 当てはまりが良いからと言って、直観的に読み取れないグラフは、データが複雑な構造になった時に価値が減少する(情報の損失)