スーパーコンピュータ「京」が拓く...
TRANSCRIPT
京都大学 医学研究科先端医療振興財団 先端医療センター研究所
理化学研究所 計算科学研究機構
奥野恭史
スーパーコンピュータ「京」が拓くコンピュータ創薬の可能性
神戸医療産業都市~国家戦略特区指定記念セミナー~
「京」産業利用枠:新薬開発を加速する「京」インシリコ創薬基盤の構築
申請主体(事務局): NPO法人バイオグリッドセンター関西研究代表 京都大学医学研究科 奥野恭史
製薬企業(23社): アスビオファーマ、杏林製薬、エーザイ、小野薬品工業、科研製薬、キッセイ薬品工業、参天製薬、塩野義製薬、大日本住友製薬、田辺三菱製薬、日本新薬、協和発酵キリン、千寿製薬、大正製薬、帝人ファーマ、東レ、日産化学工業、マルホ、持田製薬、アステラス製薬、日本たばこ産業、MeijiSeikaファルマ、カネカIT企業(2社): 京都コンステラ・テクノロジーズ, 三井情報大学等: 京都大学医学研究科, 産業技術総合研究所, 理研AICS, 先端医療振興財団, 都市活研
• コンピュータ創薬の根本課題に挑戦• 次世代の計算創薬「ビッグデータ創薬」と「シミュレーション創薬」の開拓• 製薬会社による現場利用に耐えうる計算フロー(計算精度と計算時間)の構築• 我が国のコンピュータ創薬の中心拠点形成
ビッグデータ創薬 シミュレーション創薬
医薬品開発の効率化が急務
9年~12年8分の1約800億円
開発期間: 2年~3年成功確率: 2500分の1開発費用: 約200億円
基礎研究
前臨床試験
臨床試験
承認申請
承認取得
11年~15年20,000分の1約1000億円(開発中止品の費用含)
製薬業界に横たわる深刻な問題
高騰し続ける開発費
• 製薬企業の経営圧迫• 希少疾患薬の枯渇• 医療費の高騰
一品目当りの開発コスト
計算で業界の課題に挑戦
化合物の種類: 1060以上
コンピュータ創薬の現状と課題
全ての化合物の薬効を実験で確かめるのは不可能
予測精度が悪すぎる:正答率:5%程度
計算時間がかかるため、全ての化合物を計算するのは不可能
計算機パワーの問題
Docking計算法Docking計算法
②結合の強さを予測 (結合親和性予測)
①結合するかどうかを予測 (バーチャルスクリーニング)
化合物の種類: 1060以上
「京」によるコンピュータ創薬の根本課題への挑戦
予測精度が悪すぎる:正答率:5%程度
計算時間がかかるため、全ての化合物を計算するのは不可能
「京」の圧倒的な計算機パワーでコンピュータ創薬の根本課題の解決を目指す
化合物とタンパク質の結合予測の超高速化
精密な結合シミュレーションによる予測精度の劇的向上(目標正答率70%)
②結合の強さを予測 (結合親和性予測)
①結合するかどうかを予測 (バーチャルスクリーニング)
全ての化合物の薬効を実験で確かめるのは不可能
化合物の種類: 1060以上
「京」によるコンピュータ創薬の根本課題への挑戦
予測精度が悪すぎる:正答率:5%程度
計算時間がかかるため、全ての化合物を計算するのは不可能
②結合の強さを予測 (結合親和性予測)
①結合するかどうかを予測 (バーチャルスクリーニング)
化合物とタンパク質の結合予測の超高速化
精密な結合シミュレーションによる予測精度の劇的向上(目標正答率70%)
CGBVS法
MP-CAFEE法
ビッグデータ創薬
シミュレーション創薬
全ての化合物の薬効を実験で確かめるのは不可能
化合物の種類: 1060以上
「京」によるコンピュータ創薬の根本課題への挑戦
予測精度が悪すぎる:正答率:5%程度
計算時間がかかるため、全ての化合物を計算するのは不可能
化合物とタンパク質の結合予測の超高速化
精密な結合シミュレーションによる予測精度の劇的向上(目標正答率70%)
CGBVS法
MP-CAFEE法
②結合の強さを予測 (結合親和性予測)
①結合するかどうかを予測 (バーチャルスクリーニング)
ビッグデータ創薬
全ての化合物の薬効を実験で確かめるのは不可能
結合するかどうかを予測:CGBVS法 (Chemical Genomics-based Virtual Screening法)
病気の原因タンパク質に結合する化合物を「京」で認識大量のタンパク質と化合物の結合データを学習
予測
結合パターンの統計ルール化
大量の人の顔画像を学習
顔パターンの統計ルール化
人の顔を自動認識
予測
「京」により超高速予測を実現
世界最大規模(189.3億ペア)のタンパク質と化合物の相互作用予測
膨大なタンパク質と化合物の組合せを高速計算するために、パターン認識技術を適用
論文等で結合することが分かっているタンパク質と化合物の結合ペア:12万ペア
世界最大規模(189.3億ペア)の結合予測631種のタンパク質(GPCR、キナーゼ)と
3000万種の化合物の全組合せ
以後、予測結果を基に、各製薬会社が独自に医薬品開発を行う*当初参画企業11社中、10社が自社研究開発に利用
病気の原因タンパク質に結合する化合物を「京」で認識大量のタンパク質と化合物の結合データを学習
予測
結合パターンの統計ルール化
「京」により超高速予測を実現
膨大なタンパク質と化合物の組合せに対応
CGBVS法による世界最大規模のタンパク質-化合物結合予測
実際の結合パターン(実験結果)
Kinase (388種)
化合物(500
種)
「京」が予測した結合パターン(予測結果)
化合物(500
種)
Kinase(388種) ⇒631種
3000万種←
タンパク-化合物の全組合せ( 189.3億ペア)を計算するのに汎用計算機(16ノード使用)では約2年かかる。
「京」8万ノードを使った大規模並列計算をすれば、5時間45分で計算終了
「京」を用いたCGBVS法による相互作用予測例
論文等で結合することが分かっているタンパク質と化合物の結合ペア:12万ペア
病気の原因タンパク質に結合する化合物を「京」で認識大量のタンパク質と化合物の結合データを学習
予測
結合パターンの統計ルール化
「京」により超高速予測を実現
膨大なタンパク質と化合物の組合せに対応
ポスト「京」で目指すビッグデータ創薬
多種多様な医薬関連ビッグデータを機械学習することで、薬効・安全性を総合的に加味した薬剤設計が可能
結合情報1千万件
疾患情報2.2万件
副作用情報500万件
生物活性情報12億件
遺伝子発現情報100万件
化合物の種類: 1060以上
「京」によるコンピュータ創薬の根本課題への挑戦
予測精度が悪すぎる:正答率:5%程度
計算時間がかかるため、全ての化合物を計算するのは不可能
化合物とタンパク質の結合予測の超高速化
精密な結合シミュレーションによる予測精度の劇的向上(目標正答率70%)
CGBVS法
MP-CAFEE法
②結合の強さを予測 (結合親和性予測)
①結合するかどうかを予測 (バーチャルスクリーニング)
シミュレーション創薬
全ての化合物の薬効を実験で確かめるのは不可能
結合の強さを正確かつ頑強に計算をするには、分子の動きや溶媒(水分子)も含めた長時間シミュレーションを必要であるが、これまでは計算機パワーの問題で非現実だった。
結合の強さを予測:MP-CAFEE法 (Massively Parallel Computation of Absolute binding Free Energy)
「京」による結合シミュレーション(MP-CAFEE) 従来型の結合シミュレーション(Docking)
予測正答率70%目標予測正答率70%目標
予測正答率5%程度予測正答率
5%程度
アンサンブルMDシミュレーションによって、正確かつ頑強にタンパク質と化合物の結合の強さ(結合自由エネルギー)を求める。
MP-CAFEE法による予測と実験結果比較 (CHK1の例)150個の化合物についてタンパクとの結合の強さを計算するのに、通常の汎用機では20年かかるところが、「京」をフルに利用したら1週間程度で計算が可能
CHK1 : ○CDK2 : ○ERK2 : ○uPa : △GPCR(2種): -
パーソナルゲノム情報
計算機上で変異
薬物標的タンパクの変異モデルを用いた薬物の結合シミュレーション
同じ薬剤を投与しても患者によって薬剤の応答性、副作用発現が異なる。
抗癌剤の場合、同じ患者に同じ薬剤を投与していくうちにやがて薬効が無くなる。(癌の薬剤耐性)
薬理ゲノミクス個々人の薬剤反応性を遺伝子タイプから解釈する
臨床情報と分子シミュレーションの統合化による個別化薬剤治療のシミュレーション(理研AICS 医薬応用シミュレーション研究プロジェクト)
個別化薬剤治療
ポスト「京」で目指す次世代のシミュレーション創薬
アンサンブルMD
長時間(フルタイム)MD
超分子の制御:生物製剤の合理的設計
タンパク質の動きを制御する薬剤設計、時間を制御する薬剤設計⇒ ミリ秒レベルの現象が計算可能
結合自由エネルギーの高速計算⇒ 1週間で1万個の計算が可能
高分子化 PPIのMD
システムレベルへの拡張
分子レベルからネットワーク、細胞レベルへの橋渡し
パーソナルゲノム情報
薬物標的タンパクの変異モデルを用いた薬物作用の分子シミュレーション
個別化薬剤治療
薬理ゲノミクス個々人の薬剤反応性を遺伝子タイプから解釈する
ポスト「京」で目指す個別化医療シミュレーション
•全ての変異タンパクと薬剤の結合シミュレーションによる患者の薬剤応答性や副作用危険性の予測
•薬剤耐性や副作用発現の分子メカニズムの解明
•薬剤耐性を回避する新薬の合理的分子デザイン
多種多様なヴァーチャル変異タンパク質の高速評価
ポスト「京」による超高速化
スパコン(「京」/ポスト「京」)による創薬イノベーション
9年~12年8分の1約800億円
開発期間: 2年~3年成功確率: 2500分の1開発費用: 約200億円
開発期間: 1年~1.5年成功確率: 約500分の1開発費用: 約40億円
9年~12年約7分の1約700億円
基礎研究
前臨床試験
臨床試験
承認申請
承認取得
11年~15年20,000分の1約1000億円(開発中止品の費用含)
10年~13.5年約3,500分の1約740億円
スパコンが最終的にもたらす効果
スパコンによって、より速く、より正確に、医薬品を予測
開発費の削減は、製薬産業の景気アップをもたらすだけでなく、医療費の根本削減や、難病などの患者数が少ない希少疾患の医薬品開発が加速
一品目当りの開発コスト
間接的な効果直接的な効果
医薬品開発の成功確率が大幅にアップし、1千億円超(5品目の新薬)の開発費削減
JSTサイエンスチャンネルにて放送中https://www.youtube.com/watch?v=2WJGPj-pwCI
Acknowledgements
• KBDDコンソーシアムメンバー• 理研・計算科学研究機構(AICS)• 高度情報科学技術研究機構(RIST)• 先端医療振興財団• 中外製薬株式会社
• 最先端次世代研究開発支援プログラム• NEDO若手研究グラント• CREST 「ビッグデータ応用領域」• JST COIプログラム• 三井情報株式会社
京大医 武藤学教授京大医 JBブラウン先生神戸大・工 中津井雅彦先生産総研 molprof. 広川貴次先生三井情報(株) 佐藤美和氏(株)京都コンステラ・テクノ 金井千里博士がん研究会 片山量平先生
先端医療振興財団 井村裕夫理事先端医療振興財団 鍋島陽一センター長
理研・AICS 米澤明憲副機構長理研・AICS 泰地真弘人先生理研・AICS 江口至洋先生理研・AICS 荒木望嗣博士神戸市 企画調整局 前澤綾子元部長
Special thanks