02_ケモインフォマティクス

02_ケモインフォマティクス

QM9は量子化学計算に基づいた機械学習用の大規模データセット

「ケミカルスペースプロジェクトとGDBデータベース」という記事では,Jean-Louis Reymondの研究グループによって進められているGDBデータベースについて紹介しました.GDBはある原子数以下の存在しうる低分子化合物を網羅したもので,数多くの未知化合物を含むデータベース...
02_ケモインフォマティクス

ケミカルスペースプロジェクトとGDBデータベース

ケモインフォマティクスでは考えられる化合物全ての集合を「ケミカルスペース」と呼びます.その数は実に1060以上にも及ぶと言われています.また化合物を何らかの特徴量をもとに投影したものをケミカルスペースと言うこともあります. 実験的にケミカルスペースの全てを網羅するのは無理のあるス...
02_ケモインフォマティクス

RDKitを用いたコンフォメーション探索:MMFFによる配座異性体生成とクラスタリング

「RDKitによるコンフォマーの生成」という記事では,RDKitを用いたコンフォマーの生成方法について説明しました. 我々が興味のある分子は大抵いくつかの回転可能な結合を持っていることから,一連の配座異性体に関する情報が重要になります. このように様々なコンフォマーを取得する試み...
02_ケモインフォマティクス

量子化学計算を利用した記述子:統計モデルにおける立体因子と電子的効果

ある化学現象に対して,分子構造から得られる性質を入力として予測モデルを組み立てることがケモインフォマティクスではよく行われます.その際に使われる分子記述子としては「分子量」などの簡単なものから,「芳香族度合」「天然物らしさ」などを表現するように化学者が工夫を凝らして作成したものま...
02_ケモインフォマティクス

Google ColabでRDKit:ケモインフォマティクス用のpython環境を手軽に構築

本ブログでは「有機合成化学者のためのケモインフォマティクス入門」を掲げて,特にpythonを用いてケモインフォマティクスを行う際に必要となる環境構築方法から解説してきました.例えば「RDKitでケモインフォマティクスに入門」という記事では,pythonのケモインフォマティクス用ラ...
02_ケモインフォマティクス

QSARにおける立体因子の記述:Sterimolパラメータを用いた線形モデル

分子の構造を入力として,反応の選択性や生理活性など何らかの現象を出力とする予測モデルの作成はケモインフォマティクスにおける重要課題です.モデルの入力としては,分子の性質を表現する「記述子」がよく用いられ, 分子量やlogPなどの分子全体の特徴を表現する記述子 ある部分構造の電子的...
02_ケモインフォマティクス

RDKitを用いて制約付きで立体構造を生成する

我々が興味のある分子のほとんどは3次元構造を有していますから,分子の立体構造の理解は大切です. 本ブログではこれまで,「RDKitによる3次元構造の生成」という記事ではRDKitを用いて立体構造をどのように発生させるかについて扱いました.その際いくつかのアルゴリズムについて学び,...
02_ケモインフォマティクス

RDKitでOpen3DALIGNを用いた立体構造の重ね合わせ

異なる分子の立体構造を重ね合わせて眺めることで得られる知見が多くあります.これまで本ブログでは「RDKitによるコンフォマーの生成」という記事で,同じ分子のコンフォマーを重ね合わせて表示することを行いました.その際には鋳型となる原子の番号を指定することで重ね合わせの中心骨格を決め...