CLSTの技術を見る
効率的なインシリコ創薬技術
 
1. 高精度なインシリコスクリーニング技術
新しい創薬シーズの探索には、タンパク質の立体構造に基づく薬物設計(SBDD)が有用ですが、従来のドッキングでは、タンパク質の構造の自由度を考慮したりドッキング条件の検討を充分に行うことなく、本番のインシリコスクリーニングを行うために、特に難しい標的の場合には失敗に終わる場合もありました。制御分子設計研究チームでは、標的タンパク質の立体構造と既知阻害剤情報を最大限活かした高精度なインシリコスクリーニングのシステム(Knowledge-Based Docking Screening, KBDS、右図)を構築しています。
KBDSは、k-PALLASとk-MUSESの2つのシステムによって構成されています。当研究チームによって開発されたk-PALLASは、半自動的なドッキング条件の最適化システムであり、タンパク質の構造バリエーションや溶媒分子の有無など、様々な条件をインプットすると、多様なリガンドのドッキングに適したタンパク質構造セットを選び出します。選び出した最適条件を用いてドッキングすることによってドッキングの効率を向上させ、大失敗を回避することができます。以下の図は、4種類のターゲットに対してk-PALLASを適用した結果ですが、k-PALLASによって選び出した最適条件(Best Condition)では、1% Enrichment Factor(スコア上位1%における活性化合物数がランダム選択に比べて何倍上昇するかを表す)が、平均的な条件に比べて大きく向上していることがわかります。
k-PALLASによって選択した化合物から、最終的にアッセイするさらに少数の化合物を絞り込むために、当研究チームでは、タンパク質-リガンド間相互作用を原子単位で記述する新しい相互作用記述子(パラメータ)であるaPLIEDと、この新規パラメータ用いた活性化合物と不活性化合物(検証時は囮で代用します)を判別する機械学習予測システム(k-MUSES)を開発しました。このk-MUSESシステムは、既知の活性化合物と囮化合物をドッキングさせ、活性化合物と囮化合物の相互作用パターンのわずかな違いを統計解析によって検出することを可能とします。
右に5種類のターゲットにおいて、k-MUSESを用いた活性判別の効率が、市販のドッキングスコアに比べてどの程度向上しているかを示しました。図はROC plotと呼び、スコア上位から並べた場合に、不活性化合物を何個選択する間(横軸)に何個の真の活性化合物を選択できるか(縦軸)を示します。折れ線グラフが左上に近づくほど精度が高いことを示します。aPLIEDとSupport Vector Machineによる機械学習予測モデルは、市販のドッキングスコア(GLIDE score)や文献公知の記述子(PLIF)使った場合に比べて精度が大きく向上していることがわかります。k-PALLASとk-MUSESは、創薬研究の進展とともに増大するX線構造情報、既知阻害剤情報(構造活性相関情報)を随時活用することができ、創薬の現場で有用な技術です。
2. FMO-PBSAによる結合親和性予測
最初のヒット化合物を得ることを目的としたインシリコスクリーニングにおいては、多数の候補化合物(当研究室では一億化合物のインシリコスクリーニング用データベースを作成しています)から高速にスクリーニングするために、定量的な活性予測よりは定性的な活性判別を優先しています。しかし、ヒットを見出した後の構造最適化においては、定量的で精度の高い予測が必要とされます。しかし、従来の分子力学法(Molecular Mechanics)に基づく活性予測では、なかなか定量的な予測をすることはできませんでした。特に、構造の小さな変化によって予期しない大きな活性変化を起こす現象(Activity Cliff)は予測が難しく、最適化でインシリコ設計を行う際の障害となっています。
右の図には、Activity Cliffの一例としてPim1阻害剤の例を示しました。右翼の5-6縮環系の1個の炭素が窒素に変わることによって最大で200倍程度活性が低下しています。6化合物のうち、4化合物は複合体のX線構造が解かれていますが、その複合体構造はほとんど同じであり、従来の分子力学に基づくMM-PBSA法では、実測値のIC50(実際は対数のlogIC50と比較)との間の決定係数(R2)が0.59と低い相関しか示しませんでした。そこで、当研究チームでは、量子力学的な計算をタンパク質に対して実行可能にしたフラグメント分子軌道法(FMO法)のフラグメント間相互作用エネルギー(IFIE)の合計値とMM-PBSAのPBSA項部分を合わせたFMO-PBSAの手法を開発しています。この方法を用いて、log IC50との相関を見たところ、R2=0.92という高い相関を示しました。
また、本手法においては、タンパク質-リガンド複合体の構造の品質が重要です。X線構造そのものや、分子力学法でエネルギー最適化した構造においては、MM-PBSAで負の相関、FMO-PBSAでもR2=0.3-0.5程度であり、構造変化の小さな化合物セットにおけるAactivity Ccliff の予測では、特に構造の品質が重要であることが示唆されています。現在、私たちの研究室では、X線結晶解析の研究者と連携しながら、FMO法を利用して結晶構造を決定する手法の開発も行っています。