ケモインフォマティクスに関する記事を書いています.特にpythonのケモインフォマティクス用ライブラリであるRDKitについて解説しています.
ESP-Simで分子の電子的性質に着目した類似性を評価する
「類似した化合物は似た性質を持つ(similar property principle)」ことから,我々は類似化合物に興味があります.そのためケモインフォマティクスでは化合物の類似性を評価する様々な手法が開発されてきました. もっともよく使われる手法は,「RDKitでフィンガープ...
RDKitのxyz2molでケモインフォマティクスと計算化学の橋渡し
我々が化合物を扱う際に用いている構造式は,人間の目にはわかりやすいですがコンピュータにはわかりにくいものです.そのためコンピュータにわかりやすい形式で化合物を表現してあげることが重要となりますが,用途によって望ましい形式が変わってきます. 例えばケモインフォマティクスのように分子...
BCUTは分子のグラフ構造を基にした2D記述子
「化合物の隣接行列,距離行列,Wiener指数:RDKitを用いたグラフの扱い方」という記事では,原子をノード,結合をエッジとみなしたグラフとして分子を考え,RDKitを用いたグラフの扱い方について説明しました.また分子のグラフ表現から得られる2D記述子についても触れました. 今...
化合物の隣接行列,距離行列,Wiener指数:RDKitを用いたグラフの扱い方
「MOLファイル・SDFとはどんな化学情報ファイルなのか?」という記事では,原子をノード,結合をエッジと見なすことで分子はグラフと考えられることに触れました.またどの原子とどの原子の間に結合が存在するかをリストとして管理する「結合リスト」について説明しました. グラフ構造は分子に...
クーロン行列は分子の回転・並進操作に不変な化合物の表現法
分子構造を何らかの形でコンピュータが扱える形へと変換することが化学情報学の第一歩です.現状では化合物の有する情報を全て取り込むことが可能な表現方法は知られていませんから,その後の分析の興味によって,化合物のどの情報を残しどの情報を捨てるかを決めた上で.変換する必要があります. 今...
アトムペアやドナーアクセプターペアフィンガープリントは分子の形状を捉えた化学表現
「RDKitでフィンガープリントを使った分子類似性の判定」という記事では,ケモインフォマティクス用ライブラリであるRDKitで利用可能な分子フィンガープリントについて説明しました. ECFP4(Morganフィンガープリント)などのCircularフィンガープリントでは,着目する...
Tox21は米国の大規模毒性学プロジェクト:HTSによるアッセイ結果は機械学習コンペで用いられたデータセット
これまで本ブログでは, 「ケミカルスペースプロジェクトとGDBデータベース」 「QM9は量子化学計算に基づいた機械学習用の大規模データセット」 「DrugBankは承認済み医薬品のデータベース:主成分分析によるドラッグライクケミカルスペースの可視化」 などの記事で,ケモインフォマ...
DrugBankは承認済み医薬品のデータベース:主成分分析によるドラッグライクケミカルスペースの可視化
創薬化学研究では合成・試験される化合物のほとんどは医薬品にはなりません.そのため研究開発の成功率をあげるために,実際に医薬品になる化合物がどのような特徴を有するかを明らかとすべく多くの試みがなされてきました. このような「薬らしさ(ドラッグライクスネス)」について,これまで本ブロ...