化学

DrugBankは承認済み医薬品のデータベース:主成分分析によるドラッグライクケミカルスペースの可視化

創薬化学研究では合成・試験される化合物のほとんどは医薬品にはなりません.そのため研究開発の成功率をあげるために,実際に医薬品になる化合物がどのような特徴を有するかを明らかとすべく多くの試みがなされてきました. このような「薬らしさ(ドラッグライクスネス)」について,これまで本ブ...
化学

QM9は量子化学計算に基づいた機械学習用の大規模データセット

「ケミカルスペースプロジェクトとGDBデータベース」という記事では,Jean-Louis Reymondの研究グループによって進められているGDBデータベースについて紹介しました.GDBはある原子数以下の存在しうる低分子化合物を網羅したもので,数多くの未知化合物を含むデータベース...
化学

ケミカルスペースプロジェクトとGDBデータベース

ケモインフォマティクスでは考えられる化合物全ての集合を「ケミカルスペース」と呼びます.その数は実に1060以上にも及ぶと言われています.また化合物を何らかの特徴量をもとに投影したものをケミカルスペースと言うこともあります. 実験的にケミカルスペースの全てを網羅するのは無理のある...
化学

RDKitを用いたコンフォメーション探索:MMFFによる配座異性体生成とクラスタリング

「RDKitによるコンフォマーの生成」という記事では,RDKitを用いたコンフォマーの生成方法について説明しました. 我々が興味のある分子は大抵いくつかの回転可能な結合を持っていることから,一連の配座異性体に関する情報が重要になります. このように様々なコンフォマーを取得する...
化学

量子化学計算を利用した記述子:統計モデルにおける立体因子と電子的効果

ある化学現象に対して,分子構造から得られる性質を入力として予測モデルを組み立てることがケモインフォマティクスではよく行われます.その際に使われる分子記述子としては「分子量」などの簡単なものから,「芳香族度合」「天然物らしさ」などを表現するように化学者が工夫を凝らして作成したものま...
化学

Google ColabでRDKit:ケモインフォマティクス用のpython環境を手軽に構築

本ブログでは「有機合成化学者のためのケモインフォマティクス入門」を掲げて,特にpythonを用いてケモインフォマティクスを行う際に必要となる環境構築方法から解説してきました.例えば「RDKitでケモインフォマティクスに入門」という記事では,pythonのケモインフォマティクス用ラ...
化学

QSARにおける立体因子の記述:Sterimolパラメータを用いた線形モデル

分子の構造を入力として,反応の選択性や生理活性など何らかの現象を出力とする予測モデルの作成はケモインフォマティクスにおける重要課題です.モデルの入力としては,分子の性質を表現する「記述子」がよく用いられ, 分子量やlogPなどの分子全体の特徴を表現する記述子 ある部分構造の...
化学

pythonで一般化線形モデル:statsmodelsを用いたロジスティック回帰で化合物の変異原性予測

「pythonのstatsmodelsを使った重回帰分析で溶解度予測:AICによるモデル選択」という記事では,溶解度を推定する線形モデルとして以下のような記述子の一次結合を考えました. $$ 溶解度 = \beta_{0} + \beta_{1} \times x_{1} +...
タイトルとURLをコピーしました