統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―
DESCRIPTION
統計で富山を知る ― 情報システムの進化・普及と 統計の活用 ―. 2013 年8月1日 富山国際大学 教授 浜松誠二. Ⅰ . 統計処理を巡る話題 ― 我々の知識には根拠がなかった ―. 1.最強の学問 ― 統計ブーム ―. 「統計学が最強の学問である」 西内啓著 ダイヤモンド社 2013 年. EBM( Evidence-Based Medicine ) 科学的根拠に基づく医療. ( 前史 ) イグナッツ・ゼンメルワイスの発見 (1840) 産院での女性の死亡率 12 %⇒ 2 % 手を洗うことの励行で産褥熱感染の回避. EBM宣言. - PowerPoint PPT PresentationTRANSCRIPT
統計で富山を知る
―情報システムの進化・普及と統計の活用―
2013 年8月1日富山国際大学
教授 浜松誠二
Ⅰ .統計処理を巡る話題
―我々の知識には根拠がなかった―
1.最強の学問―統計ブーム―
• 「統計学が最強の学問である」 西内啓著 ダイヤモンド社 2013 年
EBM( Evidence-Based Medicine ) 科学的根拠に基づく医療
( 前史 )• イグナッツ・ゼンメルワイスの発見 (1840) 産院での女性の死亡率 12 %⇒ 2 % 手を洗うことの励行で産褥熱感染
の回避
EBM宣言ゴードン・ガイヤット、デヴィト・サケット (1992)
• 治療法の選択は、最高の根拠に基づくべきで、最高の根拠とはできれば統計からくるべきだ。
「 10 万人の命」宣言• ドン・バーウック (2004)
• 回避可能な死の防止のために 6つの変化の導入
肺感染、静脈感染の防止など
治療方法の確認 ⇒ 根拠のある治療
• 分析が可能に カルテの電子化と共有 事実の発見
• 海外の様子が見えだす ( 日本 ) 共有化、国際化、日本へも情
報
日本での医療を巡る話題
• メタボの評価
• サプリメントの評価
• がん検診の評価
H.G.ウェールズ• 「統計学的思考が読み書きと同じよう
に良き社会人としての必須の能力になる日がくる。」 (1903 年 )
H.ヴァリンGoogle チーフエコノミスト
• 「これから 10 年もっともセクシーな職業は統計家である。 」 (2009 年 )
データサイエンティストの時代• 情報通信白書
将来的に 25 万人不足
2.統計処理の変化 ─情報技術の深化の中で─
(1) 統計学• A. ケトレー ( 近代統計学の父 )
社会事象の正規分布
• ナイチンゲール 戦場での死因 ( 統計の有効活用 )
• 19c末~ 20c初F. ゴールトン 指紋の発見者生物測定研究所 生物学に数学的厳密さを回帰 平均への回帰 親子の身長相関 計測の尺度
K.ピアソン 進化論の追跡 『科学概論』 1880s 決定論的見方に追加すべきものを認識
フィッシャー実験計画
ロザムステッド農事試験場のデータ解析
W. ゴセット ステュデントのt検定
標本調査と統計学マスコミの隆盛
新聞社の模擬投票 20c に入って盛んに 世論調査社の設立
アメリカ大統領選挙 ギャッラップの大成功 (1936) と大失敗 (1948)
センサス局等の活動 標本調査の価値
→ 標本調査の理論
統計学の実践• 数表活用 ↓• Excelでの計算
• 解析的解法 ↓• シミュレーション等による解法
(2) 日常的統計処理• データの入手 普段の活動で蓄積 インターネットでの提供
• データの加工 Excelで簡便に 多様な表現
• 成果の発信
○ 統計体系の再構築 ( 日本 )
• 統計法 改正2007年 全面施行 2009 年
基幹統計 国民経済計算、国勢調査、・・・
経済センサス 2009年7月1日実施
政府統計の総合窓口• 体系的整理
インターネット経由での入手 データベースシステム
○ 世界の統計• 各国の統計システム
• 国際機関の統計 無料化
データの加工
• Excelによる統計表の整理、 検定 χ 2検定
• Excelによるグラフの作成 散布図で多様なグラフのテンプレート
(3) 体系的検証勘による対応から根拠のある対応へ
( Evidence-Based )
• 年毎の新たなワインの質 (オーリー・アッシェンフェルター )
= 12.145+ 0.00117×冬の降雨+ 0.00614×育成期平均気温- 0.00386×収穫期降雨
• 貢献出走塁 (ビル・ジェイムズ )
=(ヒット数+四球) ×総塁数 ÷ (死球以外の打席数+四球数)
• 自動販売機で新たな需要発見
• GPS等で建設機械の稼働状況を把握
• ツイッター情報から風邪の流行を予測
• リポーターの情報を集約から ゲリラ雷雨の予測
(4) 仮説の構築• データの蓄積
• 相関から意味の発見
• ビッグデータ Volume 大量 Variety 多様 Velocity 高速
取引情報
ビッグデータの争奪・インターネットの利用がそのままデータに 位置情報、検索情報、交信情報、・・・
グーグル アップル フェースブック アマゾン ・・・
(5) 人工知能 (AI Ⅲ )
• 翻訳• チェス• 自動車の自動運転• ・・・・・
3.知識の根拠は脆弱
• 【知識についての考え方】
(1) 我々の知識の根拠 ほとんど全てが ・権威 (先生・マスコミ ) からもらったもの ・生活体験からつかんだもの 多くは従っておいてよい
真実を知ろうとしたときは 一歩、抜け出ることが必要
( 2 ) 正しい知識を持っているか①都合のよい判断
• ベンジャミン・フランクリン• 酸っぱいブドウ
B. フランクリンの格言• 理性のある動物、人間とは、まこと
に都合のいいものである。したいと思うことなら、何にだって理由を見つけることも、理窟をつけることもできるのだから。
無意識のフィルター• 脳科学の発展
• 多様な実験 権威に従う 先入観で判断する 記憶も歪む
原子力村• 仲間内で集まってもだめ 公共事業の暴走 下水道、ダム、道路、砂防、・・・
• 審議会も機能せず 誰を委員とするか
• 社外役員の重要性
②無反省な弁明• 富山の特徴に関する多様な言説があるが
根拠に乏しい。
• 日常的認識での誤りが多い。
③ヒューリスティクな判断• 「人間は生きていくために物事を適当に判断するようにできている」
• 錯覚は人にとって必要
ヒューリスティクな誤りの類型• ベースレートの誤信 乳がん検診陽性でのがんの確率• ギャンブラーの誤信 失敗続きの後は• 利用可能性への過度の依存 私の知人はこうであった• 因果関係の存在への期待 ハリネズミの失敗• アンカリングの習性 先入観の囚われ• 後知恵の追加 自らの正当化のみ• 大量情報処理の恣意的整理 8以上の序列化は無理
このため、正しい判断には工夫が必要
⇒ 知性は理性的でない
こう考えるといろいろな課題を謙虚に考え真実を得るための努力を意識的に行うことができる
4. 真実を得るための仕掛け
• 積極的に仕掛けを構築する必要がある
(1) 調査研究の手法• 統計二次分析• 実験• 調査票調査• インタビュー調査• 参与観察• 踏査• ドキュメント分析• (比較研究 )• (既存研究調査 )
調査の広がり
(2) 統計的調査/事例的調査
事例的調査
• 網羅的情報収集 一定のやり方で見た情報・聞いた情
報は 全て記録する
• 全ての情報での仮説構築 集まった情報は勝手に破棄しない
統計的調査
• 確実な統計的手続き
• 仮説の検証 (いつまでも仮説を逃れられない)
• 相関があっても因果関係とはいえない (因果関係を説明する数学的方法論はない )
事例 /定性 統計 /定量 代表性に懸念 サンプリング、回収率調査対象に影響 調査対象への影響を回避直接意識を聴く・触れる Wording等の不確かさ 因果を体験、直に聴く・触れる 豊かな内容
推論の不確実性 限定された情報
回答の信頼性( 信頼できるインフォーマントの獲得 )
検討困難非回答者の偏向
仮説生成が可能 仮説検証が主体 グラウンディド・セオリー厚い記述
数値的解析洗練された理論への昇華
時間的・精神的負担(参与観察が典型 )
金銭的負担
○ ビッグテータと調査の変化• 多種多様な変数の膨大な標本データが入手できる
ようになった。 ↓• 事例的調査・統計的調査の手順に拘束されなくなっ
た。
• 統計的調査で直接仮説構築が可能になり同時に検証もできるようになった。
• 事例的調査の不確かさが乗り越えられるようになった。
Ⅱ.統計処理の実践
○ 表グラフを読む力
• 表・グラフになじむことが大切
○資料がなかったとは言わない
―情報システムで容易に入手、分析―
◎地域を知ろう ―富山の常識・非常識―
【富山の話題】 舞台・産業・生活・郷土
【グラフの技法】
1.富山の舞台
○ 富山の自然は豊かか
フリーソフト MAPWIN
地図
○ 富山県の火災発生率はなぜ低いか
相関分析
○地球温暖化クリモグラフ
国際データ
スカイライングラフ 原単位と総量
○人口横棒グラフの調整
多重折れ線グラフ
2.富山の産業
○産業構造と職業三角グラフ
ブロックグラフ
○ 農業県か
スカイライングラフ 特化度
○景気動向
フローチャート VISIO
○産業構造の変化
スカイライングラフ 変化寄与度
3.富山の生活
○ 生地での居住・大きな家族
○ 富山の家計所得はなぜ高いか
スカイライングラフ 全体との比較
○助け合いの気風
○高齢者は地域資源
○和を乱さない
○苦手な新しいコミュニティ形成
4.富山の郷土 (土地・基盤施設 )
○土地利用制度の柔軟な運用
地図データ
○都市の非形成
○充実した基盤施設
散布図と階層区分
御清聴有り難うございました