02_ケモインフォマティクス Tox21は米国の大規模毒性学プロジェクト:HTSによるアッセイ結果は機械学習コンペで用いられたデータセット これまで本ブログでは, 「ケミカルスペースプロジェクトとGDBデータベース」 「QM9は量子化学計算に基づいた機械学習用の大規模データセット」 「DrugBankは承認済み医薬品のデータベース:主成分分析によるドラッグライクケミカルスペースの可視化」 などの記事で,ケモイ... 2020.03.22 02_ケモインフォマティクス
01_計算化学 計算化学における電荷:psi4を用いた電子密度解析 「計算手法とエネルギー・最適化構造の関係:コンフォメーション探索における注意点」という記事では,psi4を用いて様々な計算手法を用いてエネルギー計算を行うことで, 計算手法によって考慮できる相互作用が異なる ことを説明しました.その結果 構造最適化できないことがあ... 2021.12.30 01_計算化学
01_計算化学 計算手法とエネルギー・最適化構造の関係:コンフォメーション探索における注意点 「RDKitを用いたコンフォメーション探索:MMFFによる配座異性体生成とクラスタリング」という記事では, RDKitに実装されているディスタンス・ジオメトリー法による配座発生 MMFFによる構造最適化と同一構造の除去 取得した多数のコンフォマーをDBSCANを用いてクラスタ... 2021.11.27 01_計算化学
02_ケモインフォマティクス DrugBankは承認済み医薬品のデータベース:主成分分析によるドラッグライクケミカルスペースの可視化 創薬化学研究では合成・試験される化合物のほとんどは医薬品にはなりません.そのため研究開発の成功率をあげるために,実際に医薬品になる化合物がどのような特徴を有するかを明らかとすべく多くの試みがなされてきました. このような「薬らしさ(ドラッグライクスネス)」について,これまで本ブ... 02_ケモインフォマティクス
02_ケモインフォマティクス QM9は量子化学計算に基づいた機械学習用の大規模データセット 「ケミカルスペースプロジェクトとGDBデータベース」という記事では,Jean-Louis Reymondの研究グループによって進められているGDBデータベースについて紹介しました.GDBはある原子数以下の存在しうる低分子化合物を網羅したもので,数多くの未知化合物を含むデータベース... 2020.02.23 02_ケモインフォマティクス
02_ケモインフォマティクス ケミカルスペースプロジェクトとGDBデータベース ケモインフォマティクスでは考えられる化合物全ての集合を「ケミカルスペース」と呼びます.その数は実に1060以上にも及ぶと言われています.また化合物を何らかの特徴量をもとに投影したものをケミカルスペースと言うこともあります. 実験的にケミカルスペースの全てを網羅するのは無理のある... 02_ケモインフォマティクス
02_ケモインフォマティクス RDKitを用いたコンフォメーション探索:MMFFによる配座異性体生成とクラスタリング 「RDKitによるコンフォマーの生成」という記事では,RDKitを用いたコンフォマーの生成方法について説明しました. 我々が興味のある分子は大抵いくつかの回転可能な結合を持っていることから,一連の配座異性体に関する情報が重要になります. このように様々なコンフォマーを取得する... 02_ケモインフォマティクス
02_ケモインフォマティクス 量子化学計算を利用した記述子:統計モデルにおける立体因子と電子的効果 ある化学現象に対して,分子構造から得られる性質を入力として予測モデルを組み立てることがケモインフォマティクスではよく行われます.その際に使われる分子記述子としては「分子量」などの簡単なものから,「芳香族度合」「天然物らしさ」などを表現するように化学者が工夫を凝らして作成したものま... 2022.01.16 02_ケモインフォマティクス