03_python

Scipyの統計モジュールstatsで統計分布を使いこなす

「NumPyのrandomルーチンでいろいろな乱数を生成する」という記事では,numpy.randomに実装されている統計分布からのサンプリングについて扱いました. 統計分布についてにはscipy.statsに一通り確率密度関数から検定までが実装されています.今回はその中から統計...
03_python

NumPyのrandomルーチンでいろいろな乱数を生成する

NumPyのrandomモジュールを使うことで,様々な形の乱数を発生させることができます.このエントリーではnumpy.randomの基本的な使い方について記していきます.よく使う機能に絞って簡潔に説明していきますので,詳細はnumpy randomモジュールの公式ドキュメントを...
04_統計学・機械学習

pythonで統計学基礎:03 検定・分散分析

前回までに引き続き,ハンバーガー統計学をもとにした分析をpythonで進めることで,基本的な統計学の内容をどのようにpythonで表現していくかを学びます.具体的には今回はscipy.statsとstatsmodelを用いて, χ二乗検定 t検定 一元配置分散分析 二次元配置分散...
04_統計学・機械学習

pythonで統計学基礎:02 信頼区間・t分布

前回の「pythonで統計学基礎: 01 平均と分散」という記事では平均・分散などの基本的な統計量をpythonを用いて,特にpandasを使うことでどのように扱うかを学びました.続いてpandasの機能を使うことで度数分布表やヒストグラムが容易に作成できることを見てきました.同...
03_python

pandasでWEBサイトからデーターフレームを作成

pandasでDataFrameを作成する場合はcsvファイルなどから読み込むことが多いと思いますが,今回はpandasを使ってWEBからDataFrameを作成する方法を紹介します.pandas.read_htmlを使うのですがlxml, beautifulsoup4, htm...
04_統計学・機械学習

pythonで統計学基礎: 01 平均と分散

統計学が大事だとはわかっていても,どこから勉強をはじめたらよいかわかりにくいと感じる人が多いのではないでしょうか?この記事から数回に渡って,pythonを使いながら統計学の基本的な考え方を頭にすり込んでいくこと目指します.数式を理解することは応用力をつけるという点では大事ですが,...
03_python

matplotlibで作成したプロットをきれいにカスタマイズ

「matplotlibはpythonの可視化ライブラリ:作成可能なプロットの種類を具体例で解説」という記事では,pythonのグラフ作成ライブラリの中でも圧倒的に知名度・使用実績の高いmatplotlibについて,どのようなグラフが作成可能かを具体例を通して解説しました. 今回は...
03_python

matplotlibはpythonの可視化ライブラリ:作成可能なグラフの種類を具体例で解説

matplotlib(読み方:マットプロットリブ)はプログラミング言語pythonで最も使われている可視化・グラフ作成用のライブラリです.既に登場以来10年以上もの間多くの人たちによって使われてきましたし,これからも使われ続けるでしょう.そのため一端使い方を理解すれば,これからp...