ビンの数と幅
2017/08/26
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 量的データの度数分布をグラフにしたものをヒストグラムまたは柱状グラフと言います。Excelのグラフの種類にヒストグラムはないため、Excelで作るなら棒グラフを代用することになります。Excelの分析ツールにもヒストグラムのメニューがありますが、やはり棒グラフを代用してヒストグラムを書いています(分析...
Excelの分析ツール(3)
2017/08/26
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 「Excelの分析ツール (2)」の続き。残る5つの分析ツールですが、まずサンプリングからですね。 分析ツールのウィンドウ サンプリング 入力済みの大量の数値データから標本抽出(サンプリング)を行うときに利用します。サンプリングの方法は「周期」と「ランダム」の2通りあります...
Excelの分析ツール(2)
2017/08/26
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 今回のコラムを書いていて不思議に思ったのは分析ツールのリストの並びです。リストは分散分析に始まって t検定、z検定で終わります。「分散分析も、t検定と z検定も、平均が同じかどうかを検定するためにあるのに、何故、リストの両端に分かれているの?」、「時系列データの平滑化に使う指数平滑と移動...
Excelの分析ツール(1)
2017/08/26
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ Microsoft Excelには、CORRELやTTESTといった様々な「関数」、「ピボットテーブル」、「分析ツール」や「ソルバー」などのアドインが用意されています。Excelだけでも、簡単な検定から、多大な手間は要するものの、かなり高度な多変量解析までこなせます。「相関係数を求めたい」とか「t検定をしたい」ぐらい...
Excelによる欠損値の扱い
2017/08/15
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ Excelを統計ソフトとして使う上で問題点の1つとなるのが、欠損値の扱いが一定していないことです。関数によっても異なりますし、同じ統計処理でも関数を使った場合と分析ツールを使った場合でも異なります。 次の例を見てください。シート上には2行目から9行目まで空白や文字の混ざったデータを入力して...
Excelで重回帰分析(6)―重回帰分析の分散...
2017/08/15
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ Excelの分析ツールを使って重回帰分析を行うと、2種類の検定結果が出力されてきます。1つは分散分析表、「母重相関係数は 0(ゼロ)である」という帰無仮説を検定しています。もう1つは偏回帰係数に続いて出力される t 検定の結果で、「偏回帰係数は 0 である」という帰無仮説を検定しています。 ...
Excelで重回帰分析(5)―自由度調整済み決...
2017/08/15
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 今回は、「重相関係数と決定係数」からの続きです。 さて、分析ツールによる回帰分析の「回帰統計」の出力欄には、重相関係数と決定係数のほかに、「補正 R2」と「標準誤差」というのがあります。 「補正 R2」は、一般に「自由度調整済み決定係数」あるいは「自由度修正済み決定係数」と...
局所管理の原則―フィッシャーの3原則(3)
2017/08/15
カテゴリ:コラム「統計備忘録」
タグ:フィッシャーの3原則, 統計備忘録, 分析ツール
※コラム「統計備忘録」の記事一覧はこちら※ 今回は、フィッシャーの3原則の最後、局所管理について書きます。 局所管理 local control 1919年、フィッシャーは、ピアソンからゴールトン生物測定研究室の主任統計学者としての採用の申し出を受けましたが、ピアソンに反発していたフィッシャーは申し出を断り、ロンドン郊外にあるロザムステッ...
反復の原則―フィッシャーの3原則(1)
2017/08/15
カテゴリ:コラム「統計備忘録」
タグ:フィッシャーの3原則, 統計備忘録, 分析ツール
※コラム「統計備忘録」の記事一覧はこちら※ 実験計画法や分散分析の本を読むと、必ずといってよいほど「フィッシャーの3原則」について書かれています。実験の精度を高めるために、どのように実験計画を組むべきかを説いたものです。実験系以外の人も覚えておいて損はないので簡単に触れておきます。 第1の原則 : 反復 replication 第2の原則 ...
ANOVAとGLM
2017/08/14
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ ANOVAは分散分析 analysis of variance の略称です。分散分析は統計学の中で最も使用頻度が高い手法だと思います。斯く言う私も生まれて初めて使った統計手法が二元配置分散分析でした。心理学の実験データを解析するためです。当時は Excel のような表計算ソフトも無かったので( 1980年代前半のことです)...