02_ケモインフォマティクス

02_ケモインフォマティクス

RDKitのPandasToolsでデータ分析を加速する

当サイトでは「有機合成化学者のためのケモインフォマティクス入門」を掲げています.高価なソフトを使うこと無く学習をはじめられるように,これまでpythonのケモインフォマティクスライブラリである「RDKit」の解説を,「RDKitでケモインフォマティクスに入門」という記事から10回...
02_ケモインフォマティクス

Open Babelを使って化学情報のファイル形式を変換

ケモインフォマティクスではコンピュータで化学構造を扱います.我々が普段扱っている構造式はコンピュータに優しくないため,必然的に別のフォーマットに変換して処理させることになります. 「MOLファイル・SDFとはどんな化学情報ファイルなのか?」という記事では「コネクションテーブル」に...
02_ケモインフォマティクス

SMILES記法は化学構造の線形表記法

我々が普段使っている化学構造式は,コンピュータにとっては理解しにくいものです.そのため,コンピュータ上で構造情報を扱う際には,コンピュータに優しい方法に構造情報を変換したうえで扱う必要があります. 「MOLファイル・SDFとはどんな化学情報ファイルなのか?」という記事では,そのよ...
02_ケモインフォマティクス

MOLファイル・SDFとはどんな化学情報ファイルなのか?

我々の目はモノの形やパターンを読み取る能力に優れています.化学者が用いる構造式は人間の目で理解しやすいように設計された分子の表現です.例えば下のアスピリンの構造式を見るだけで,化学者は多くの情報を瞬時に理解できます. ところがコンピュータにとってはこのような構造式の画像ファイルは...
02_ケモインフォマティクス

ケモインフォマティクスで多様な化合物ライブラリーを構築する

本サイトでは「有機合成化学者のためのケモインフォマティクス入門」を掲げて,高価なソフトウェアを用意することなく学習がはじめられるようにプログラミング言語pythonとそのケモインフォマティクス用ライブラリーであるRDKitを用いた解説をおこなっています. 「RDKitでフィンガー...
02_ケモインフォマティクス

RDKitのMaxMin法を用いた多様性の高いライブラリの選定

これまで「RDKitとk平均法による化合物の非階層型クラスタリング」と「RDKitとウォード法による化合物の階層型クラスタリング」という2つの記事で化合物のクラスタリングについて解説してきました. これは多様性の高いライブラリーを構築するための4つの方法, クラスタリング法 距離...
02_ケモインフォマティクス

RDKitとウォード法による化合物の階層型クラスタリング

多数の化合物から構造的に多様なライブラリーを構築するためには, クラスタリング法 距離ベースの方法 区分けをベースとした方法 最適化手法を用いる方法 といった4つの手法が代表的です. クラスタリング法の中でも,「RDKitとk平均法による化合物の非階層型クラスタリング」という記事...
02_ケモインフォマティクス

RDKitとk平均法による化合物の非階層型クラスタリング

「RDKitでフィンガープリントを使った分子類似性の判定」という記事では分子のフィンガープリントを導入することで分子の類似度を評価しました.類似度が高い分子の組み合わせは,化合物空間(ケミカルスペース)における距離が近いと言い換えることができます.この場合,「類似度」と「距離」は...