02_ケモインフォマティクス

RDKitのMaxMin法を用いた多様性の高いライブラリの選定

これまで「RDKitとk平均法による化合物の非階層型クラスタリング」と「RDKitとウォード法による化合物の階層型クラスタリング」という2つの記事で化合物のクラスタリングについて解説してきました.これは多様性の高いライブラリーを構築するための4つの方法,クラスタリング法距離ベース...
02_ケモインフォマティクス

RDKitとウォード法による化合物の階層型クラスタリング

多数の化合物から構造的に多様なライブラリーを構築するためには,クラスタリング法距離ベースの方法区分けをベースとした方法最適化手法を用いる方法といった4つの手法が代表的です.クラスタリング法の中でも,「RDKitとk平均法による化合物の非階層型クラスタリング」という記事では非階層型...
02_ケモインフォマティクス

RDKitとk平均法による化合物の非階層型クラスタリング

「RDKitでフィンガープリントを使った分子類似性の判定」という記事では分子のフィンガープリントを導入することで分子の類似度を評価しました.類似度が高い分子の組み合わせは,化合物空間(ケミカルスペース)における距離が近いと言い換えることができます.この場合,「類似度」と「距離」は...
02_ケモインフォマティクス

トポロジカル極性表面積は計算コストの低い推定PSA

化合物の性質を表す指標として様々な「記述子」が開発されてきたことを「RDKitにおける記述子の扱い方をリピンスキーの法則を通して学ぶ」という記事で説明しました.今回とりあげる極性表面積(PSA)も,分子記述子の1つになります.この記事ではPSAの定義と計算法から,トロポジカルPS...
02_ケモインフォマティクス

化合物データベースChemSpiderをpythonで使いこなす

これまでに非常に多くの化合物が単離または合成されており,その化学的性質に関する膨大な知見が蓄積されています.これら化合物の情報を一カ所に集めたものが化学データベースになります.今回とりあげるChemSpiderもそういったデータベースのうちの1つです.この記事では英国化学会(RS...
01_計算化学

分子モデルの種類:CPKから針金モデルまで

みなさんは2次元で書かれたものを頭の中で立体的に思い描くことが得意でしょうか?私も含めて,多くの人にとっては立体構造を頭の中で理解することは困難だと思います.ほとんどの化合物は3次元に広がっています.従って化合物の3次元構造を理解するために,立体化学を視覚化することはとても重要で...
02_ケモインフォマティクス

py3Dmolを使って化学構造をJupyter上で美しく表示する

「RDKitによる3次元構造の生成」という記事でJupyterノートブック上で化合物の3次元構造を表示するにはpy3Dmolというライブラリを利用するのが広く使われるようになってきていると述べました.実際にpythonのケモインフォマティクス用ライブラリであるrdkitのIPyt...
02_ケモインフォマティクス

RDKitでの構造式描画を詳しく解説

構造式を2次元に描画することは人間が分子の形・性質を理解する第一歩です.これまで「RDKitの分子Molオブジェクトを扱う」という記事ではRDKitにおける分子の扱い方や描画方法を学びました.また「RDKitを用いた部分構造検索とMCSアルゴリズム」という記事では複数分子の間の共...