化学

SMILES記法は化学構造の線形表記法

我々が普段使っている化学構造式は,コンピュータにとっては理解しにくいものです.そのため,コンピュータ上で構造情報を扱う際には,コンピュータに優しい方法に構造情報を変換したうえで扱う必要があります. 「MOLファイル・SDFとはどんな化学情報ファイルなのか?」という記事では,その...
化学

MOLファイル・SDFとはどんな化学情報ファイルなのか?

我々の目はモノの形やパターンを読み取る能力に優れています.化学者が用いる構造式は人間の目で理解しやすいように設計された分子の表現です.例えば下のアスピリンの構造式を見るだけで,化学者は多くの情報を瞬時に理解できます. ところがコンピュータにとってはこのような構造式の画像フ...
化学

ケモインフォマティクスで多様な化合物ライブラリーを構築する

本サイトでは「有機合成化学者のためのケモインフォマティクス入門」を掲げて,高価なソフトウェアを用意することなく学習がはじめられるようにプログラミング言語pythonとそのケモインフォマティクス用ライブラリーであるRDKitを用いた解説をおこなっています. 「RDKitでフィ...
2018.12.18
化学

RDKitのMaxMin法を用いた多様性の高いライブラリの選定

これまで「RDKitとk平均法による化合物の非階層型クラスタリング」と「RDKitとウォード法による化合物の階層型クラスタリング」という2つの記事で化合物のクラスタリングについて解説してきました. これは多様性の高いライブラリーを構築するための4つの方法, クラスタリング法...
2018.12.08
化学

RDKitとウォード法による化合物の階層型クラスタリング

多数の化合物から構造的に多様なライブラリーを構築するためには, クラスタリング法 距離ベースの方法 区分けをベースとした方法 最適化手法を用いる方法 といった4つの手法が代表的です. クラスタリング法の中でも,「RDKitとk平均法による化合物の非階層型クラスタリング」...
2018.12.08
化学

RDKitとk平均法による化合物の非階層型クラスタリング

「RDKitでフィンガープリントを使った分子類似性の判定」という記事では分子のフィンガープリントを導入することで分子の類似度を評価しました.類似度が高い分子の組み合わせは,化合物空間(ケミカルスペース)における距離が近いと言い換えることができます.この場合,「類似度」と「距離」は...
化学

トポロジカル極性表面積は計算コストの低い推定PSA

化合物の性質を表す指標として様々な「記述子」が開発されてきたことを「RDKitにおける記述子の扱い方をリピンスキーの法則を通して学ぶ」という記事で説明しました.今回とりあげる極性表面積(PSA)も,分子記述子の1つになります. この記事ではPSAの定義と計算法から,トロポジカル...
化学

化合物データベースChemSpiderをpythonで使いこなす

これまでに非常に多くの化合物が単離または合成されており,その化学的性質に関する膨大な知見が蓄積されています.これら化合物の情報を一カ所に集めたものが化学データベースになります.今回とりあげるChemSpiderもそういったデータベースのうちの1つです. この記事では英国化学会(...
タイトルとURLをコピーしました