低分子の医薬品(特に経口医薬品)の物理化学的パラメーターを調べてみると,比較的狭い範囲に分布していることが知られています.この範囲を「薬らしい(drug-like)」と呼びます.
また数多くの低分子化合物を対象とした研究から,分子量,水素結合ドナーの数,疎水性といった指標が,その分子の溶解性,膜透過性,代謝安定性といった化合物の薬としての重要な性質と強く相関することがわかっています.
医薬品開発の成功率が低下する中で,創薬化学者が「薬らしさ」「ドラッグライクスネス」に注目するようになったのも当然と言えるでしょう.
「薬らしさ」の指標としては大きく
- 分子構造のみを考慮するもの
- 活性値と構造との関係を考慮するもの
という2つに分けることができます.今回はこれらについて概要を見ていきたいと思います.
・「The role of ligand efficiency metrics in drug discovery」Nat. Rev. Drug Discov. 2014, 13, 105.
・「Present drug-likeness filters in medicinal chemistry during the hit and lead optimization process: how far can they be simplified?」Drug Discov. Today 2018, 23, 605.
日本語では「Druglikenessについてのよもやま話」という記事がとても参考になります.
分子構造のみを考慮するもの
先ほど述べたように,分子構造から導かれるいくつかの分子記述子が物性パラメーターと強く相関することが知られています.例えば以下のようなものが挙げられます.
- 分子量
- 重原子の数
- 回転可能結合の数
- 芳香環の数
- キラル炭素の数
- 脂溶性(logP)
- 極性(PSA)
- 水素結合供与体の数
- 水素結合受容体の数
いずれも代表的な分子記述ですので,本サイトでも個別の記事を書いています.
- 「ケモインフォマティクスとLogP計算:CLogPのCは“calculated”ではありません」という記事ではLogPについて
- 「トポロジカル極性表面積は計算コストの低い推定PSA」という記事では極性表面積について
それぞれ解説しています.またこういった分子記述子が,化合物の
- 溶解性
- 膜透過性
- 代謝安定性
といった指標と大きく相関し,そのため開発成功率に大きく影響することが明らかとなっています.従って,分子構造から得られる記述子のみを基にして「薬らしさ」の基準を考えることには妥当性があることになります.
ルール・オブ・ファイブ(Ro5)
Lipinskiらが医薬品候補化合物の性質を調べる中で,経口医薬品になりやすい化合物の特徴としてまとめたものを「ルール・オブ・ファイブ(Rule of Five, Ro5)」といいます.
ルール・オブ・ファイブの内容は以下の通りです.見てわかるように,「5」を基調としたルールになっています.
- 水素結合ドナー(OH,NHの数)が5個以下であること
- 水素結合アクセプター(O,N原子の数)が10個以下であること
- LogPが5以下であること
- 分子量が500以下であること
選ばれている分子記述子が前述のように妥当かつ計算が容易であり,合成化学者にもとてもわかりやすいものであったことからルール・オブ・ファイブは広く受け入れられました.また近年ではフラグメントに使われるRo3などの指標も発表されています.
「RDKitにおける記述子の扱い方をリピンスキーの法則を通して学ぶ」という記事では,代表的なケモインフォマティクス用ライブラリーであるRDKitを用いた記述子の計算の仕方からルール・オブ・ファイブを説明しています.
芳香環問題とFsp3
Lipinskiがルール・オブ・ファイブを発表したのは1997年でした.その後の創薬化学では,
- クロスカップリング反応という強力な合成ツール
- 平面性の高い分子がヒットになりやすいkinaseという創薬標的
が駆動力となって芳香環を多く含む化合物が数多く合成されました.こういった平面性の高い化合物は溶解性などに問題があることが明らかとなり,ルール・オブ・ファイブでは考慮していなかった「平面性」が表現できるような記述子を考慮する必要性が強くなりました.
例えば
- 分子中のsp3炭素の割合に着目したFsp3
- 芳香環の数を数えたAROMs
などが挙げられます.
「RDKitで立体的な分子の形を記述する」という記事ではFsp3を,「RDKitで化合物の芳香族度合を示す分子記述子を計算する」という記事ではAROMsをはじめとして芳香環に関する様々な記述子を紹介しています.
また芳香環の数が少なく,sp3炭素の割合が多い,という特徴は天然物化合物にも当てはまります.そのため,化合物の「天然物らしさ」を評価することも有用と言えます.
「RDKitで天然物らしさをスコア化して化合物ライブラリーの指標にする」という記事では,「天然物らしさ」をどのように考えるかについて解説しています.
QED
ルール・オブ・ファイブの別の問題点は,化合物をフィルタリングして「合格」と「不合格」に分類してしまう点にもあります.
例えばほぼ同じ性質を有する分子量が499と501の2つの化合物を考えた場合,恣意的な基準である「分子量500」を根拠として後者の分子は弾かれてしまうことになります.
こういった事態を防ぐためには薬らしさを数値化して定量することが好ましいです.
「RDKitで薬らしさを定量的に評価する」という記事では,薬らしさの指標としてQEDを解説しています.QEDを用いることで,0(最も薬らしくない)から1(最も薬らしい)に定量化が可能です.
忌避構造
反応性の高い部分構造の存在は薬として好ましくありませんので,分子量や水素結合ドナー数によるフィルタリング以外にもスクリーニングで除くことが望まれます.実際に上述のQEDにおいても,忌避構造の存在は大きなペナルティとして実装されています.
「RDKitのPAINSフィルターで化合物をスクリーニング」という記事では,忌避構造リストの中で最も有名なPAINSフィルターについて解説しています.
活性値や結合様式を考慮したもの
ここまで説明してきた指標は何れも分子の構造を基に化合物の「薬らしさ」を評価してきました.実際の研究においては活性値を中心に,代謝安定性なども踏まえて化合物を絞り込んでいく必要があります.
ヒット化合物からの構造展開によって活性を上げていきますが,同時に分子量や脂溶性も増加していくのが普通です.先ほどみたように,これらの要素は「薬らしさ」にとってはマイナスです.
LE(Ligand Efficiency)メトリクス
LE
重要な知見として,Kuntzらによる化合物の結合自由エネルギー変化と重原子の数を見た場合に,ある程度以上(約15重原子)の大きさの分子では自由エネルギー変化の上昇が見られないというものがあります.
この知見を基に,Hopkinsらは
$$ LE = \Delta G \div HA = (-2.303(RT/HA)) \times \log K_{d} $$
という式によってLEを定義しました.
LEを指標とすることで,重原子導入による結合への影響を考慮することが可能になり,分子量が無駄に大きい分子を排除することができます.結合に関与する原子効率を考えることで,ヒットの質を見極めるのに利用できます.
オリジナルの定義ではKd値が用いられていますが,これをIC50, Ki, EC50などへと拡張して使われることも多いです.
またLEは小さいリガンドの場合に数字が大きくなる傾向が知られていますので,それを補正したFQ(Fit Quality)というものも知られています.
$$ FQ = LE \div LE_{scale} $$
$$ LE_{scale} = -0.0064 + 0.873 \exp ^{-0.026 \times HA} $$
LLE(Ligand-Lipophilicity Efficiency)またはLipE(Lipophilic Efficiency)
LLEはin vitro活性値と脂溶性の比で,以下のように定義されています.
$$ LLE = pIC_{50} – \log P $$
LLEは特に安全性リスクを加味した化合物の評価方法です.同様の指標が同時期に多数発表されていることから,脂溶性がリスクファクターであるという認識が化合物クラス・ターゲットを問わず広く受け入れられているということだと考えられます.
熱化学パラメーター
LEでは自由エネルギー変化(∆G)を考えていますが,自由エネルギーはエンタルピー項(∆H)とエントロピー項(T∆S)に分けられます.
エンタルピー駆動型の最適化は水素結合などの選択的な相互作用を利用した構造変換であるのに対し,エントロピー駆動型の最適化では脂溶性基による非選択的な相互作用によるものが多く,前者の方が質が高いと言えます.
一般には構造変換がこれら熱化学パラメーターに与える影響を予測することは困難です.各項はITC(Isothermal Titration Calorimetry)実験によって算出可能ですので,得られた値を基に化合物変換の質に関する知見を得ることができます.
終わりに
今回は「色々な薬らしさの指標」という話題について,
- ルール・オブ・ファイブなど化合物の構造のみを考慮したもの
- LEなど活性値と化合物の構造を考慮したもの
にわけて見てきました.
本サイトではケモインフォマティクス入門としてRDKitの使い方を中心に扱っていますので,これまで前者の指標を中心に説明してきました.しかし現実的には多数の分析によっても示されているように,LLEなどを指標とした構造最適化がよい結果に繋がることが多いようです.
さらに近年では多くのX線構造が手に入り,またSPRやITCといった実験がますます一般的になってきましたので,物理化学的な結合パラメーターを考慮しながらの構造展開が可能です.
色々なことを多面的に考慮する必要がありますが,結局はプロジェクトのフェーズに応じて色々な指標を使い分けていくことが大事ということになると思います.またこれらの指標はあくまでも目安であって絶対的なものではない,ということも常に念頭に置いておくべきことでしょう.
コメント