乃木坂スクール 地域医療ビッグデータ入門 ~課題の発見と解決 … ·...
TRANSCRIPT
乃木坂スクール地域医療ビッグデータ入門
~オープンデータで医療を“見える化”しよう~
第1回オリエンテーション
2019年9月20日国際医療福祉大学大学院教授
埴岡 健一
はじめに
2
本日のゴール
• シリーズの趣旨を理解する• 受講中の自分なりのゴール設定をする(いつごろ何を学ぶか、トライするか…)
3
趣旨
4出典:ウェブ上シラバスから
本講座の趣旨(ロジックモデル)
地域の患者・住民アウトカムの均てん化
どの地域でもデータを使ったPDCAの普及
マルチSH*によるオープンデータ利活用
「地域医療ビッグデータ入門」の実施
初期アウトカム
中間アウトカム
最終アウトカム
活動アウトプット
超少子高齢化、2025(40)年問題、地域格差(⇔均てん化*)、オープンデータ公表
行政や民間、非営利団体等による研修やデータ提供が実施されてきている
オープンデータを十分に活用する実践が追いついてい
ない
環境
課題
外の動き5
均てん化=あまねく最良の状態になっていることSH=ステークホルダー(立場)
「地域医療ビッグデータ」とは
• ここでは…• ビッグデータといってもそれほど大きくはなくパソコンで十分に扱え、
• 政府統計などの「ビッグデータ由来で地域別等に集計加工されたもの」を中心に扱い…
• 探索的なデータマイニングというより、ロジックを仮想して検証するアプローチが主となる
6
オープンデータとは①
• オープンデータ(Open Data)とは、特定のデータが、一切の著作権、特許などの制御メカニズムの制限なしで、全ての人が望むように利用・再掲載できるような形で入手できるべきであるというアイデアである。
出典: フリー百科事典『ウィキペディア(Wikipedia)』
7
オープンデータとは②
• 国、地方公共団体及び事業者が保有する官民データのうち、国民誰もがインターネット等を通じて容易に利用(加工、編集、再配布等)できるよう、次のいずれの項目にも該当する形で公開されたデータをオープンデータと定義する。
①営利目的、非営利目的を問わず二次利用可能なルールが適用されたもの②機械判読に適したもの③無償で利用できるもの出典:総務省 オープンデータ研修ポータル
8
オープンデータの状況
9
データがないからどうしようもない
あるのに公表されない(紙ベースだ)
もちろん、まだまだ解消されていませんが…
データがあるのに、知られていない
データがあるのに、利活用されていない
利活用を高めることも課題に…
データを活用する5段階
①課題、問題意識、仮説、興味を出す
②関連しそうなデータを収集
③収集したデータを分析
④知見を追加、分析を高め、人智を寄せて検討
⑤施策の形成
10
重要な視点
•仮説思考(問題意識)•因果関係思考(ロジックモデル活用)•OPS指標セット思考•チーム思考(*すべてが得意な人はマレ)
11
「課題の解決」(アプローチ例)
• 課題の発見:データからアウトカム指標やプロセス指標の地域差、ワースト地域、ホットスポットを発見する
• その原因となるプロセス指標やストラクチャー指標を探す
• 解決策(案):アウトカム指標を改善する対策を考察する
12
地域診断のスタンス(例)• できれば仮説を持っておく• できれば課題に関するロジックモデル(因果関係図)を持っておく
• データはOPSセット*で考える
O=アウトカム指標(患者・住民状態)P=プロセス指標(医療サービス状態)S=ストラクチャー指標(医療資源状態)
13
インパクト分析
○○○○○○
○○○○○○
○○○○○○
○○○○○○
○○○○○○
○○○○○○
○○○○○○
○○○○○○
○○○○○○
○○○○○○
最終アウトカム中間アウトカム施策アウトプット
O★アウトカム指標P★プロセス指標S★ストラクチャー指標
★
★
★
★★
★
★
★
★
★
因果関係分析
ロジックモデルに沿ってビッグデータからSPO指標(★★★)を集め因果関係分析する
14
患者・住民の状態医療等のサービスの状態医療等の資源の状態
ビジョン:データに基づく政策評価へ
10年前?
今:5合目。展望の確認と加速の機会
3~5年後?確立へ
既存統計DPCデータデータブック
可視化プロジェクトNDBオープンデータ
精度不足項目不足統合不足理解力不足
目標、工程、役割を明確化して加速
精度向上項目補足統合化
理解力向上
データに基づく政策評価
枠組みメド工程にメド活用法にメド
15
2020年は医療計画/がん計画等の中間評価の年2019年はその準備の年
本講座の基本的構図
16
社会・地域・組織の課題・問題
みなさん(データ活用ナビゲーター)マルチステークホルダーの
強みの持ちより/弱点の相互補完
講師陣
さまざまなデータセット
データセット
さまざまなデータベース それぞれの先端性、専門性
ガイダンスと活用例
さまざまなソフト/ツール
チームで相互補完
問題意識を持つ人
データセットを持つ人
データ分析スキルを持つ人
17
データ・ナビゲーター・チーム?
• データ・ナビゲーター(案内する)• データ・サイエンティスト(理系知・文系知併せて科学する)
• データ・デザイナー(構想する)• データ・アドボケート(政策提言する)
18
ステークホルダー別関心【患者】病院選びに有益な情報、地域の医療の質、医療サービスへのアクセスの確保【医療者】自施設の収益向上/質の向上/将来マーケティング戦略など【行政】地域の医療提供体制、医療の質、医療費適性化など【メディア】アウトカム、プロセス、ストラクチャー、費用などの地域差など⇒ステークホルダー別関心の統合=施設&地域単位でのアウトカムとプロセスの均てん化。
19
医療計画と診療報酬と情報(5年前)
医療計画
診療報酬
夏休みの子どもの宿題病床数規制
効きすぎるクスリ副作用もあるクスリ
20
情報提供
外形ストラクチャー中心実用的でない
医療計画 診療報酬
・ビジョンを示し・アウトカム向上を目指し・需要予測に基づき・指標で評価しながら*重要な政策手段に
・エビデンス志向・アウトカム志向・NDBオープンデータで可視化・評価の強化*効かせたいところに効く
21
医療計画と診療報酬と情報(今)
情報提供
・NDBなど信頼性・悉皆性・オープン化・セット化・可視化・ガイダンス*評価に活用可能に
地域データナビゲーター?
パートまとめ
• オープンデータの進展によって、• マルチステークホルダー視点で、• 施設単位と地域単位を統合し、• 診療報酬制度と医療計画制度の政策意図を生かしつつ、
• 「データによる制御」によって、• “均てん化”を進める素地ができてきた• よって、よりデータ活用に注力するときである
22
今回プログラムの組み立て
23
1~5回
24
6~10回
25
11~15回
26
第2回(埴岡)オープンデータを見つける
27
個別統計、横断データ集、見える化グラフ集の関係
28
個別統計情報源
横断データ集 見える化グラフ集
個別情報源
3つの特性を知って活用する
29
個別統計/情報源 横断データ集 見える化グラフ
内容 個別の公開統計データなど
ロジックモデルに沿ってテーマ別に情報源横断的に粒度を揃えて統合したもの
エッセンスデータをBI(可視化)ツールによって提示したもの
長所ピンポイントで必要で
詳細な情報を得られる場合がある
必要なデータを探し、整合性をもって統合するという膨大な労力を略することができる
フィルター機能などで関心に応じた加工ができ、課題スクリーニング力が各段に高まる
短所どんなものがあるか、
どこにあるか、把握するのが大変
どのデータに着目すればいいのか考えるのが大変。データを読み解くのも労力が必要
スクリーニングには使えるが、必要に応じてデータ集や個別データに遡る必要がある
想定される当週のゴール例• 重要なデータの所在場所が分かる• 自分の関心のあるデータの所在場所が分かる• 情報源、横断的データセット、可視化データの関係が分かる
*自分が興味が持てそうな、医療オープンデータ可視化グラフの例が見つかり、今後の探索の方向のヒントが得られる
30
第3回(笹子さん)厚生労働省のオープンデータ戦略
31
32出典:厚労省ウェブサイト
想定される当週のゴール例• 厚生労働省のデータ戦略の方向性が理解できる• 厚生労働省のデータ戦略の主要活動の概要が理解できる
• 自分の関心との関係が理解できる
33
第4回(埴岡)可視化ツールで見える化
34
https://public.tableau.com/profile/ken.hanioka#!/
35
想定される当週のゴール例• データの可視化とBIツールを理解する• BIツール活用サイトを活用できるようになる• Tableauを触ってみる
• 希望者はTableauをインストール(次ページ)• さらに希望者は期間中にTableau Publicに自分が作ったグラフを1つでもアップできるようにトライしてみる
36
◆特別コーナー◆Tableauにトライ○Tableau Desktop と Tableau Prep(本講座では使用しません)を下記からダウンロードしてください
https://www.tableau.com/tft/activation• 開始するためには各商品のダウンロードボタンを押してください。
• 入力画面が出たら、Business E-mail 欄には自分のメルアドを、Organization欄には大学名(International University of Health and Welfare)を入れてください。
• 講座のライセンスキーを入れれば、使えるようになります。
37
今からトライする人はやってみてください。そしてMLで情報共有ください。9月27日、スタート体験談2人発表募集
第5回(渡部さん)オープンデータから横断データ集を作って活用
38
出典:https://www.wellness.co.jp/siteoperation/msd/
39
想定される当週のゴール例• オープンデータの具体的な活用の仕方が分かる• 異なる情報源から得たデータを接合、統合して横断的データセットにするときの留意点やコツが理解できる
• 横断的データセットを活用しやすくなる。また既存の横断的データセットにデータを加えることができるようになる
40
第6回(石川さん)DPCオープンデータで病院を分析
41
42
出典:https://public.tableau.com/profile/kbishikawa#!/
想定される当週のゴール例• DPCデータが理解できる• BIツールに乗ったDPCデータが活用できるようになる
• DPCデータを活用した地域マーケティング、地域医療提供体制の最適解の考察、の第一歩ができるようになる
43
第7回(柴田さん)ナショナルデータベース(NDB-SCR)
の読み解き方
44
45出典:https://medysis.jp/ndboriginated-medicalinterventionscr-visualization
想定される当週のゴール例• NDB-SCR(ナショナルデータベース標準化レセプト出現比)が理解できる
• NDB-SCRで、自分の関心テーマの状況を確認することができる
46
第8回(村松さん)オープンデータを使った考察
47
48
「社会保険旬報」での連載「医療・介護のビッグデータ分析」の⑱⑳㉗に、オープンデータを用いた分析例があります
出典:https://sites.google.com/site/pmchuoeh/files/chv-1
想定される当週のゴール例• オープンデータを分析した論考・論文が読み解けるようになる
• オープンデータを使って記事、プレゼン、レポート、論考、論文が書けるようになる
49
第9回(埴岡)がん計画の評価指標の見える化
50
51
出典:https://public.tableau.com/profile/cancer.policy.summit#!/
◆特別コーナー◆「R」を触ってみよう• 「R」(統計ソフト)および「R Commander 」(グラフィックインターフェース)をインストールして使いはじめるガイダンスを行います
52
想定される当週のゴール例• 47都道府県のがん対策推進計画の関連指標を個々に確認することができる
• 関連指標をOPS指標を関連づけて概観することができる
• 地域における課題候補を抽出できる• 課題と解決策の仮説を持つことができる
• 希望者は、「R」を触れた
53
第10回(みなさん)データコンペ大会・参加企画発表会
54
内容• 発表する人・チームが参加表明エントリーします
• 現時点でどのようなことをしたいか、構想の概略を発表します
*遠隔の方はペーパーを提出します
55
想定される当週のゴール例• たくさんの方が、自分なりに発表しようとしている
• みんなが自分なりに、講座参加前より、オープンデータの理解、活用意欲、活用実践が高まっている
• 本講座ならではの意味ある発表が準備される
56
第11回(埴岡)医療計画の評価指標の見える化
57
https://public.tableau.com/profile/ken.hanioka#!/
58
出典:https://public.tableau.com/profile/ken.hanioka#!/
◆特別コーナー◆SPSSを触ってみよう• SPSS(場合によってはSPSS-AMOS)の無料トライアル版(2週間)を、希望者みんなで、同時に2週間集中トライ。情報交換します。
59
想定される当週のゴール例• 47都道府県の医療計画(主に5疾病・在宅医療)の関連指標を個々に確認することができる
• 関連指標を、OPS指標を関連づけて概観することができる
• 地域における課題候補を抽出できる• 課題と解決策の仮説を持つことができる
• 希望者は、SPSSを触れた
60
第12回(佐々木さん)
エクセルで統計分析して政策評価
61
62出典:多賀書店ウェブサイト
想定される当週のゴール例• 評価の基礎概念を理解する• インパクト評価の手法を理解する• エクセルでインパクト評価をする実際の例題を理解する
• エクセルのデータ分析機能を使えるようになる
63
第13、14回(みなさん)
データコンペ大会
64
●乃木坂ビッグデータ入門「データ分析・解析コンペ」、発表概要まとめ表(未完)
50音順 立場? 分野? テーマ? SPO指標?
データソース? 地域単位? ロジック
使用? 分析手法? 提言? 備考
1会津心之亮さん
データ分析専門家 老衰 老衰死亡比の
地域差 O,P,S,CHOPS、NDB、厚労省在宅会議
県、医療圏 相関分析
2伊藤智朗さん医療提供者/研究者 新生児医療
新生児アウトカムのパタン分析
O,P NDB 県 使用 パタン分析 あり
3加藤忠さん メディア データ活用 社会データリテラシー向上
コミュニケーションデザイン検討
方法論に関する考察
4柴田修一さんデータ分析専門家 がん 充実度評価 O,P HOPS、千葉県県、医療圏、医
療機関(千葉県)使用ツールによる可視化
5鈴木亮太さん医療提供者/企業
精神疾患(うつ) 都道府県分析 O,P,S HOPS 県 使用 相関分析、パタン
分析 含む
6西村健さん 研究者 アレルギー(花粉症)
花粉症の影響の可視化 P,S NDB、e-stat
、林野庁
7馬場武彦さん 保険者 医薬品効果 降圧剤の効果検証 O,P 独自データ 加入者単位 ロジスティック回
帰分析
8前村聡さん メディア 医療保険制度
後期高齢者制度の医療費 O,C 独自データ、
その他 市区町村 相関分析、2×2分析 あり
9松田美恵子さん
研究者 認知症 地域差分析 P,S 厚労省統計、NDB 県 使用 可視化、相関分析
10本山聡平さん 医療産業 糖尿病 重症化予防地
域差分析 HOPS、NDB 県 使用 相関分析
11渡部鉄兵さん
データ分析専門家 医療費 外来医療費の
地域差分析 O,P,S 政府統計、NDB 県 使用 共分散構造分析
(SEM)
*埴岡がん ー がん がん死亡率均てん化 O,P,S
CANOPS(NPOがんサミ)
県 使用 可視化 コンペでなくレク
*埴岡脳卒中 ー脳卒中(急性期、回復期)
脳卒中死亡率均てん化 O,P,S HOPS 医療圏 使用 可視化、散布図 コンペで
なくレク
*埴岡在宅医療
ー 在宅医療 在宅看取り率均てん化 O,P,S 厚労省在宅会
議、HOPS市区町村、医療圏 使用 可視化、相関分析、
回帰分析コンペでなくレク
シーズン①データコンペ
ラインナップ
65
多様なアプローチ(活用5段階に沿って)
①課題、問題意識、仮説、興味を出す(⇒課題集と必要データの対比でもOK)
②関連しそうなデータを収集(⇒データを集めて配置したり可視化するだけでもOK)
③収集したデータを分析(⇒単純分析でもOK。統計的な分析、高度な分析ならなおOK)
④知見を追加、分析を高め、人智を寄せて検討(⇒分析データをもとにML内で立場別意見を集めるのもOK)
⑤施策の形成(⇒データ分析に基づいた提案もOK)
⇒⇒いずれも価値があり、大歓迎66
想定される当週のゴール例• たくさんの方が自分なりに発表してみる• みんなが自分なりに、講座参加前より、オープンデータの理解、活用意欲、活用実践が高まっている
• 本講座ならではの意味ある発表が行われる
*遠隔の方も録画かネットテレビ会議で、どこからでも参加できます
67
では、共に学びを進めていき
ましょう
これまで、データベースと情報等に関してご教示いただいた方々、相互学習機会で学ばせてくださった
みなさまに、感謝いたします。