04_統計学・機械学習

scikit-learnの決定木でAmes試験データセットを機械学習

「RDKitとscikit-learnで機械学習:変異原性をk-最近傍法で予測」という記事では,まず「教師あり学習」と「教師なし学習」,「回帰」と「分類」といった基本的な機械学習の用語を学びました.その後,最も単純な機械学習手法とも言われるk-最近傍法を用いて,RDKitとsci...
04_統計学・機械学習

RDKitとscikit-learnで機械学習:変異原性をk-最近傍法で予測

ケモインフォマティクスにおけるモデル構築は分子を特徴ベクトルへと変換する(encoding)特徴ベクトルと目的とする分子の性質との関係を記述する(mapping)という2段階に分けられます.本サイトではこれまでケモインフォマティクス用ライブラリーのRDKitを用いて,第1段階であ...
02_ケモインフォマティクス

色々な薬らしさの指標

低分子の医薬品(特に経口医薬品)の物理化学的パラメーターを調べてみると,比較的狭い範囲に分布していることが知られています.この範囲を「薬らしい(drug-like)」と呼びます.また数多くの低分子化合物を対象とした研究から,分子量,水素結合ドナーの数,疎水性といった指標が,その分...
02_ケモインフォマティクス

RDKitのPAINSフィルターで化合物をスクリーニング

化合物ライブラリー中の大量の化合物から,どれをスクリーニングにかけるかはケモインフォマティクスにおける重要な課題です.本サイトでもこれまで「RDKitで薬らしさを定量的に評価する」という記事で,開発可能性が高まるような化合物の基準「ケモインフォマティクスで多様な化合物ライブラリー...
02_ケモインフォマティクス

RDKitで薬らしさを定量的に評価する

1060以上と言われる広大なケミカルスペースの中から,なんらかの基準を用いることでより医薬品になりやすそうな化合物を選択し,優先的に評価を行っていくことが創薬研究においては大切です.例えば「RDKitにおける記述子の扱い方をリピンスキーの法則を通して学ぶ」という記事で扱った「ルー...
01_計算化学

計算化学の構造最適化の基本をPsi4で学ぶ

「計算化学にPythonとPsi4で入門」という記事ではpythonで扱える量子化学計算ソフトウェア「Psi4」の紹介と,簡単なエネルギー計算のやり方を扱いました.その際に得られるエネルギーは用いる計算レベルによってエネルギーの値が異なる計算する構造によってエネルギーの値が異なる...
01_計算化学

計算化学にPythonとPsi4で入門

近年のコンピューターの高速化に伴い,実験化学者であっても高度な計算を手元の計算機で実行可能な環境が整いつつあります。計算化学とは「コンピュータを使って化学の問題を解く」学問領域で,分子力学法(MM)分子軌道法(MO)密度汎関数法(DFT)分子動力学法(MD)モンテカルロ法(MC)...
02_ケモインフォマティクス

ケモインフォマティクスで使われるファイル形式と化合物の描画方法

ケモインフォマティクスにおいてコンピュータで化合物を扱うためには,コンピュータが理解しやすい形式で化合物情報を伝える必要があります.通常我々が使っている構造式は,人間の眼には視覚的にわかりやすい表現方法ですが,コンピュータにとってはわかりにくいため,別の表現方法が必要になります....