02_ケモインフォマティクス

RDKitでケモインフォマティクスに入門

ケモインフォマティクスとは化学情報学とも呼ばれる分野で,コンピュータ・情報科学を用いて化学上の問題を取り扱う学問領域になります.そのためにはコンピュータで化合物の構造・性質などを取り扱う必要がありますが,人間とコンピュータでは化合物の認識方法が異なってきますので,専用のソフトウェ...
02_ケモインフォマティクス

化合物データベースPubChemをpythonで使いこなす

これまでに非常に多くの化合物が単離または合成されており,その化学的性質に関する膨大な知見が蓄積されています.これら化合物の情報を一カ所に集めたものが化学データベースになります.今回とりあげるPubChemもそういったデータベースのうちの1つです. この記事ではpythonを使って...
03_python

Scipyの統計モジュールstatsで統計分布を使いこなす

「NumPyのrandomルーチンでいろいろな乱数を生成する」という記事では,numpy.randomに実装されている統計分布からのサンプリングについて扱いました. 統計分布についてにはscipy.statsに一通り確率密度関数から検定までが実装されています.今回はその中から統計...
03_python

NumPyのrandomルーチンでいろいろな乱数を生成する

NumPyのrandomモジュールを使うことで,様々な形の乱数を発生させることができます.このエントリーではnumpy.randomの基本的な使い方について記していきます.よく使う機能に絞って簡潔に説明していきますので,詳細はnumpy randomモジュールの公式ドキュメントを...
04_統計学・機械学習

pythonで統計学基礎:03 検定・分散分析

前回までに引き続き,ハンバーガー統計学をもとにした分析をpythonで進めることで,基本的な統計学の内容をどのようにpythonで表現していくかを学びます.具体的には今回はscipy.statsとstatsmodelを用いて, χ二乗検定 t検定 一元配置分散分析 二次元配置分散...
04_統計学・機械学習

pythonで統計学基礎:02 信頼区間・t分布

前回の「pythonで統計学基礎: 01 平均と分散」という記事では平均・分散などの基本的な統計量をpythonを用いて,特にpandasを使うことでどのように扱うかを学びました.続いてpandasの機能を使うことで度数分布表やヒストグラムが容易に作成できることを見てきました.同...
03_python

pandasでWEBサイトからデーターフレームを作成

pandasでDataFrameを作成する場合はcsvファイルなどから読み込むことが多いと思いますが,今回はpandasを使ってWEBからDataFrameを作成する方法を紹介します.pandas.read_htmlを使うのですがlxml, beautifulsoup4, htm...
04_統計学・機械学習

pythonで統計学基礎: 01 平均と分散

統計学が大事だとはわかっていても,どこから勉強をはじめたらよいかわかりにくいと感じる人が多いのではないでしょうか?この記事から数回に渡って,pythonを使いながら統計学の基本的な考え方を頭にすり込んでいくこと目指します.数式を理解することは応用力をつけるという点では大事ですが,...