python

化合物データベースPubChemをpythonで使いこなす

これまでに非常に多くの化合物が単離または合成されており,その化学的性質に関する膨大な知見が蓄積されています.これら化合物の情報を一カ所に集めたものが化学データベースになります.今回とりあげるPubChemもそういったデータベースのうちの1つです. この記事ではpythonを使っ...
2018.09.10
python

Scipyの統計モジュールstatsで統計分布を使いこなす

「NumPyのrandomルーチンでいろいろな乱数を生成する」という記事では,numpy.randomに実装されている統計分布からのサンプリングについて扱いました. 統計分布についてにはscipy.statsに一通り確率密度関数から検定までが実装されています.今回はその中から統...
2018.08.14
python

NumPyのrandomルーチンでいろいろな乱数を生成する

NumPyのrandomモジュールを使うことで,様々な形の乱数を発生させることができます.このエントリーではnumpy.randomの基本的な使い方について記していきます.よく使う機能に絞って簡潔に説明していきますので,詳細はnumpy randomモジュールの公式ドキュメント...
2018.09.03
生涯学習

実験系化学者が数学に再入門:5ヶ月経過

2018年は数学の苦手意識を取り払うと決心した,実験系化学者による記録です. モチベーション 面白そうな論文を開いては数式を目の当たりにして,そっとPDFを閉じる.高校時代は数学が得意だったはずなのに,大学に入って以来すっかり苦手意識がしみついてしまった.もう一歩踏み込んだ研...
2018.07.16
統計学・機械学習

pythonで統計学基礎:03 検定・分散分析

前回までに引き続き,ハンバーガー統計学をもとにした分析をpythonで進めることで,基本的な統計学の内容をどのようにpythonで表現していくかを学びます.具体的には今回はscipy.statsとstatsmodelを用いて, χ二乗検定 t検定 一元配置分散分析 二次元配...
2019.09.15
統計学・機械学習

pythonで統計学基礎:02 信頼区間・t分布

前回の「pythonで統計学基礎: 01 平均と分散」という記事では平均・分散などの基本的な統計量をpythonを用いて,特にpandasを使うことでどのように扱うかを学びました.続いてpandasの機能を使うことで度数分布表やヒストグラムが容易に作成できることを見てきました...
2019.09.14
python

pandasでWEBサイトからデーターフレームを作成

pandasでDataFrameを作成する場合はcsvファイルなどから読み込むことが多いと思いますが,今回はpandasを使ってWEBからDataFrameを作成する方法を紹介します.pandas.read_htmlを使うのですがlxml, beautifulsoup4, htm...
2018.07.16
統計学・機械学習

pythonで統計学基礎: 01 平均と分散

統計学が大事だとはわかっていても,どこから勉強をはじめたらよいかわかりにくいと感じる人が多いのではないでしょうか?この記事から数回に渡って,pythonを使いながら統計学の基本的な考え方を頭にすり込んでいくこと目指します.数式を理解することは応用力をつけるという点では大事ですが,...
2019.09.13
タイトルとURLをコピーしました