02_ケモインフォマティクス

ケモインフォマティクスに関する記事を書いています.特にpythonのケモインフォマティクス用ライブラリであるRDKitについて解説しています.

02_ケモインフォマティクス

BCUTは分子のグラフ構造を基にした2D記述子

「化合物の隣接行列,距離行列,Wiener指数:RDKitを用いたグラフの扱い方」という記事では,原子をノード,結合をエッジとみなしたグラフとして分子を考え,RDKitを用いたグラフの扱い方について説明しました.また分子のグラフ表現から得られる2D記述子についても触れました....
02_ケモインフォマティクス

化合物の隣接行列,距離行列,Wiener指数:RDKitを用いたグラフの扱い方

「MOLファイル・SDFとはどんな化学情報ファイルなのか?」という記事では,原子をノード,結合をエッジと見なすことで分子はグラフと考えられることに触れました.またどの原子とどの原子の間に結合が存在するかをリストとして管理する「結合リスト」について説明しました. グラフ構造は...
02_ケモインフォマティクス

クーロン行列は分子の回転・並進操作に不変な化合物の表現法

分子構造を何らかの形でコンピュータが扱える形へと変換することが化学情報学の第一歩です.現状では化合物の有する情報を全て取り込むことが可能な表現方法は知られていませんから,その後の分析の興味によって,化合物のどの情報を残しどの情報を捨てるかを決めた上で.変換する必要があります. ...
2021.01.11
02_ケモインフォマティクス

アトムペアやドナーアクセプターペアフィンガープリントは分子の形状を捉えた化学表現

「RDKitでフィンガープリントを使った分子類似性の判定」という記事では,ケモインフォマティクス用ライブラリであるRDKitで利用可能な分子フィンガープリントについて説明しました. ECFP4(Morganフィンガープリント)などのCircularフィンガープリントでは,着...
02_ケモインフォマティクス

Tox21は米国の大規模毒性学プロジェクト:HTSによるアッセイ結果は機械学習コンペで用いられたデータセット

これまで本ブログでは, 「ケミカルスペースプロジェクトとGDBデータベース」 「QM9は量子化学計算に基づいた機械学習用の大規模データセット」 「DrugBankは承認済み医薬品のデータベース:主成分分析によるドラッグライクケミカルスペースの可視化」 などの記事で,ケモイ...
02_ケモインフォマティクス

DrugBankは承認済み医薬品のデータベース:主成分分析によるドラッグライクケミカルスペースの可視化

創薬化学研究では合成・試験される化合物のほとんどは医薬品にはなりません.そのため研究開発の成功率をあげるために,実際に医薬品になる化合物がどのような特徴を有するかを明らかとすべく多くの試みがなされてきました. このような「薬らしさ(ドラッグライクスネス)」について,これまで本ブ...
02_ケモインフォマティクス

QM9は量子化学計算に基づいた機械学習用の大規模データセット

「ケミカルスペースプロジェクトとGDBデータベース」という記事では,Jean-Louis Reymondの研究グループによって進められているGDBデータベースについて紹介しました.GDBはある原子数以下の存在しうる低分子化合物を網羅したもので,数多くの未知化合物を含むデータベース...
02_ケモインフォマティクス

ケミカルスペースプロジェクトとGDBデータベース

ケモインフォマティクスでは考えられる化合物全ての集合を「ケミカルスペース」と呼びます.その数は実に1060以上にも及ぶと言われています.また化合物を何らかの特徴量をもとに投影したものをケミカルスペースと言うこともあります. 実験的にケミカルスペースの全てを網羅するのは無理のある...
タイトルとURLをコピーしました