02_ケモインフォマティクス RDKitのPandasToolsでデータ分析を加速する 当サイトでは「有機合成化学者のためのケモインフォマティクス入門」を掲げています.高価なソフトを使うこと無く学習をはじめられるように,これまでpythonのケモインフォマティクスライブラリである「RDKit」の解説を,「RDKitでケモインフォマティクスに入門」という記事から10回... 02_ケモインフォマティクス
02_ケモインフォマティクス Open Babelを使って化学情報のファイル形式を変換 ケモインフォマティクスではコンピュータで化学構造を扱います.我々が普段扱っている構造式はコンピュータに優しくないため,必然的に別のフォーマットに変換して処理させることになります. 「MOLファイル・SDFとはどんな化学情報ファイルなのか?」という記事では「コネクションテーブル」に... 2023.02.16 02_ケモインフォマティクス
02_ケモインフォマティクス SMILES記法は化学構造の線形表記法 我々が普段使っている化学構造式は,コンピュータにとっては理解しにくいものです.そのため,コンピュータ上で構造情報を扱う際には,コンピュータに優しい方法に構造情報を変換したうえで扱う必要があります. 「MOLファイル・SDFとはどんな化学情報ファイルなのか?」という記事では,そのよ... 2021.01.18 02_ケモインフォマティクス
02_ケモインフォマティクス MOLファイル・SDFとはどんな化学情報ファイルなのか? 我々の目はモノの形やパターンを読み取る能力に優れています.化学者が用いる構造式は人間の目で理解しやすいように設計された分子の表現です.例えば下のアスピリンの構造式を見るだけで,化学者は多くの情報を瞬時に理解できます. ところがコンピュータにとってはこのような構造式の画像ファイルは... 2021.01.19 02_ケモインフォマティクス
02_ケモインフォマティクス ケモインフォマティクスで多様な化合物ライブラリーを構築する 本サイトでは「有機合成化学者のためのケモインフォマティクス入門」を掲げて,高価なソフトウェアを用意することなく学習がはじめられるようにプログラミング言語pythonとそのケモインフォマティクス用ライブラリーであるRDKitを用いた解説をおこなっています. 「RDKitでフィンガー... 02_ケモインフォマティクス
02_ケモインフォマティクス RDKitのMaxMin法を用いた多様性の高いライブラリの選定 これまで「RDKitとk平均法による化合物の非階層型クラスタリング」と「RDKitとウォード法による化合物の階層型クラスタリング」という2つの記事で化合物のクラスタリングについて解説してきました. これは多様性の高いライブラリーを構築するための4つの方法, クラスタリング法 距離... 02_ケモインフォマティクス
02_ケモインフォマティクス RDKitとウォード法による化合物の階層型クラスタリング 多数の化合物から構造的に多様なライブラリーを構築するためには, クラスタリング法 距離ベースの方法 区分けをベースとした方法 最適化手法を用いる方法 といった4つの手法が代表的です. クラスタリング法の中でも,「RDKitとk平均法による化合物の非階層型クラスタリング」という記事... 02_ケモインフォマティクス
02_ケモインフォマティクス RDKitとk平均法による化合物の非階層型クラスタリング 「RDKitでフィンガープリントを使った分子類似性の判定」という記事では分子のフィンガープリントを導入することで分子の類似度を評価しました.類似度が高い分子の組み合わせは,化合物空間(ケミカルスペース)における距離が近いと言い換えることができます.この場合,「類似度」と「距離」は... 02_ケモインフォマティクス