色々な薬らしさの指標

02_ケモインフォマティクス

低分子の医薬品(特に経口医薬品)の物理化学的パラメーターを調べてみると,比較的狭い範囲に分布していることが知られています.この範囲を「薬らしい(drug-like)」と呼びます.

また数多くの低分子化合物を対象とした研究から,分子量,水素結合ドナーの数,疎水性といった指標が,その分子の溶解性,膜透過性,代謝安定性といった化合物の薬としての重要な性質と強く相関することがわかっています.

医薬品開発の成功率が低下する中で,創薬化学者が「薬らしさ」「ドラッグライクスネス」に注目するようになったのも当然と言えるでしょう.

「薬らしさ」の指標としては大きく

  • 分子構造のみを考慮するもの
  • 活性値と構造との関係を考慮するもの

という2つに分けることができます.今回はこれらについて概要を見ていきたいと思います.

ドラッグライクスネスについては多数の総説が書かれており,今回の記事もそれらを参考にしています.いくつかリンクを貼っておきます.
・「The role of ligand efficiency metrics in drug discoveryNat. Rev. Drug Discov. 2014, 13, 105.
・「Present drug-likeness filters in medicinal chemistry during the hit and lead optimization process: how far can they be simplified?Drug Discov. Today 2018, 23, 605.
日本語では「Druglikenessについてのよもやま話」という記事がとても参考になります.

分子構造のみを考慮するもの

先ほど述べたように,分子構造から導かれるいくつかの分子記述子が物性パラメーターと強く相関することが知られています.例えば以下のようなものが挙げられます.

  • 分子量
  • 重原子の数
  • 回転可能結合の数
  • 芳香環の数
  • キラル炭素の数
  • 脂溶性(logP)
  • 極性(PSA)
  • 水素結合供与体の数
  • 水素結合受容体の数

いずれも代表的な分子記述ですので,本サイトでも個別の記事を書いています.

それぞれ解説しています.またこういった分子記述子が,化合物の

  • 溶解性
  • 膜透過性
  • 代謝安定性

といった指標と大きく相関し,そのため開発成功率に大きく影響することが明らかとなっています.従って,分子構造から得られる記述子のみを基にして「薬らしさ」の基準を考えることには妥当性があることになります.

ルール・オブ・ファイブ(Ro5)

Lipinskiらが医薬品候補化合物の性質を調べる中で,経口医薬品になりやすい化合物の特徴としてまとめたものを「ルール・オブ・ファイブ(Rule of Five, Ro5)」といいます.
ルール・オブ・ファイブの内容は以下の通りです.見てわかるように,「5」を基調としたルールになっています.

  • 水素結合ドナー(OH,NHの数)が5個以下であること
  • 水素結合アクセプター(O,N原子の数)が10個以下であること
  • LogPが5以下であること
  • 分子量が500以下であること

選ばれている分子記述子が前述のように妥当かつ計算が容易であり,合成化学者にもとてもわかりやすいものであったことからルール・オブ・ファイブは広く受け入れられました.また近年ではフラグメントに使われるRo3などの指標も発表されています.

RDKitにおける記述子の扱い方をリピンスキーの法則を通して学ぶ」という記事では,代表的なケモインフォマティクス用ライブラリーであるRDKitを用いた記述子の計算の仕方からルール・オブ・ファイブを説明しています.

RDKitにおける記述子の扱い方をリピンスキーの法則を通して学ぶ
RDKitにおける記述子の扱い方をリピンスキーの法則を通して学ぶ pythonでケモインフォマティクスを行う際の定番であるRDKitについて,これまで4つのエントリーに分けて基礎から使い方を説明してきました. RDKitでケモインフォマティクスに入門 RDKitの分子Molオブジ...

芳香環問題とFsp3

Lipinskiがルール・オブ・ファイブを発表したのは1997年でした.その後の創薬化学では,

  • クロスカップリング反応という強力な合成ツール
  • 平面性の高い分子がヒットになりやすいkinaseという創薬標的

が駆動力となって芳香環を多く含む化合物が数多く合成されました.こういった平面性の高い化合物は溶解性などに問題があることが明らかとなり,ルール・オブ・ファイブでは考慮していなかった「平面性」が表現できるような記述子を考慮する必要性が強くなりました.

例えば

  • 分子中のsp3炭素の割合に着目したFsp3
  • 芳香環の数を数えたAROMs

などが挙げられます.

RDKitで立体的な分子の形を記述する」という記事ではFsp3を,「RDKitで化合物の芳香族度合を示す分子記述子を計算する」という記事ではAROMsをはじめとして芳香環に関する様々な記述子を紹介しています.

RDKitで立体的な分子の形を記述する
「RDKitのおける記述子の扱い方をリピンスキーのルール・オブ・ファイブを通して学ぶ」という記事では,分子の性質を表現する指標として記述子(デスクリプター)について説明し,RDKitを用いて実際に計算を行ってみました.その際に扱った記述子は分子量や水素結合ドナーの数など,2次元の...
RDKitで化合物の芳香族度合を示す分子記述子を計算する
分子記述子とは分子の性質を決める指標のことです.特にケモインフォマティクスの分野では分子の構造から導くことが可能なものを記述子と呼ぶことが多いです. 一般的には,複数の記述子の組み合わせによって生理活性などの実験データを理解・予測するモデル(QSARモデル)の作成が記述子を用いる...

また芳香環の数が少なく,sp3炭素の割合が多い,という特徴は天然物化合物にも当てはまります.そのため,化合物の「天然物らしさ」を評価することも有用と言えます.

RDKitで天然物らしさをスコア化して化合物ライブラリーの指標にする」という記事では,「天然物らしさ」をどのように考えるかについて解説しています.

RDKitで天然物らしさをスコア化して化合物ライブラリーの指標にする
創薬化学の歴史において天然物は非常に重要な位置を占めています.現在でも多くの薬は天然物やその誘導体です. そのため過去には大手製薬会社は「天然物化学」部門を所有していましたが,スループットの低い天然物のスクリーニングは徐々に採算が合わなくなって閉鎖に追い込まれていきました. とこ...

QED

ルール・オブ・ファイブの別の問題点は,化合物をフィルタリングして「合格」と「不合格」に分類してしまう点にもあります.

例えばほぼ同じ性質を有する分子量が499と501の2つの化合物を考えた場合,恣意的な基準である「分子量500」を根拠として後者の分子は弾かれてしまうことになります.

こういった事態を防ぐためには薬らしさを数値化して定量することが好ましいです.

RDKitで薬らしさを定量的に評価する」という記事では,薬らしさの指標としてQEDを解説しています.QEDを用いることで,0(最も薬らしくない)から1(最も薬らしい)に定量化が可能です.

RDKitで薬らしさを定量的に評価する
1060以上と言われる広大なケミカルスペースの中から,なんらかの基準を用いることでより医薬品になりやすそうな化合物を選択し,優先的に評価を行っていくことが創薬研究においては大切です. 例えば「RDKitにおける記述子の扱い方をリピンスキーの法則を通して学ぶ」という記事で扱った「ル...

忌避構造

反応性の高い部分構造の存在は薬として好ましくありませんので,分子量や水素結合ドナー数によるフィルタリング以外にもスクリーニングで除くことが望まれます.実際に上述のQEDにおいても,忌避構造の存在は大きなペナルティとして実装されています.

RDKitのPAINSフィルターで化合物をスクリーニング」という記事では,忌避構造リストの中で最も有名なPAINSフィルターについて解説しています.

RDKitのPAINSフィルターで化合物をスクリーニング
化合物ライブラリー中の大量の化合物から,どれをスクリーニングにかけるかはケモインフォマティクスにおける重要な課題です.本サイトでもこれまで 「RDKitで薬らしさを定量的に評価する」という記事で,開発可能性が高まるような化合物の基準 「ケモインフォマティクスで多様な化合物ライブラ...

活性値や結合様式を考慮したもの

ここまで説明してきた指標は何れも分子の構造を基に化合物の「薬らしさ」を評価してきました.実際の研究においては活性値を中心に,代謝安定性なども踏まえて化合物を絞り込んでいく必要があります.

ヒット化合物からの構造展開によって活性を上げていきますが,同時に分子量や脂溶性も増加していくのが普通です.先ほどみたように,これらの要素は「薬らしさ」にとってはマイナスです.

LE(Ligand Efficiency)メトリクス

LE

重要な知見として,Kuntzらによる化合物の結合自由エネルギー変化と重原子の数を見た場合に,ある程度以上(約15重原子)の大きさの分子では自由エネルギー変化の上昇が見られないというものがあります.

この知見を基に,Hopkinsらは

$$ LE = \Delta G \div HA = (-2.303(RT/HA)) \times \log K_{d} $$

という式によってLEを定義しました.

LEを指標とすることで,重原子導入による結合への影響を考慮することが可能になり,分子量が無駄に大きい分子を排除することができます.結合に関与する原子効率を考えることで,ヒットの質を見極めるのに利用できます.

オリジナルの定義ではKd値が用いられていますが,これをIC50, Ki, EC50などへと拡張して使われることも多いです.

またLEは小さいリガンドの場合に数字が大きくなる傾向が知られていますので,それを補正したFQ(Fit Quality)というものも知られています.

$$ FQ = LE \div LE_{scale} $$
$$ LE_{scale} = -0.0064 + 0.873 \exp ^{-0.026 \times HA} $$

LLE(Ligand-Lipophilicity Efficiency)またはLipE(Lipophilic Efficiency)

LLEはin vitro活性値と脂溶性の比で,以下のように定義されています.

$$ LLE = pIC_{50} – \log P $$

LLEは特に安全性リスクを加味した化合物の評価方法です.同様の指標が同時期に多数発表されていることから,脂溶性がリスクファクターであるという認識が化合物クラス・ターゲットを問わず広く受け入れられているということだと考えられます.

熱化学パラメーター

LEでは自由エネルギー変化(∆G)を考えていますが,自由エネルギーはエンタルピー項(∆H)とエントロピー項(T∆S)に分けられます.

エンタルピー駆動型の最適化は水素結合などの選択的な相互作用を利用した構造変換であるのに対し,エントロピー駆動型の最適化では脂溶性基による非選択的な相互作用によるものが多く,前者の方が質が高いと言えます.

一般には構造変換がこれら熱化学パラメーターに与える影響を予測することは困難です.各項はITC(Isothermal Titration Calorimetry)実験によって算出可能ですので,得られた値を基に化合物変換の質に関する知見を得ることができます.

終わりに

今回は「色々な薬らしさの指標」という話題について,

  • ルール・オブ・ファイブなど化合物の構造のみを考慮したもの
  • LEなど活性値と化合物の構造を考慮したもの

にわけて見てきました.

本サイトではケモインフォマティクス入門としてRDKitの使い方を中心に扱っていますので,これまで前者の指標を中心に説明してきました.しかし現実的には多数の分析によっても示されているように,LLEなどを指標とした構造最適化がよい結果に繋がることが多いようです.

さらに近年では多くのX線構造が手に入り,またSPRやITCといった実験がますます一般的になってきましたので,物理化学的な結合パラメーターを考慮しながらの構造展開が可能です.

色々なことを多面的に考慮する必要がありますが,結局はプロジェクトのフェーズに応じて色々な指標を使い分けていくことが大事ということになると思います.またこれらの指標はあくまでも目安であって絶対的なものではない,ということも常に念頭に置いておくべきことでしょう.

コメント

タイトルとURLをコピーしました