BellCurve 統計WEB

ブログ

コラム「統計備忘録」記事一覧

2017/09/28

カテゴリ:

アンケート・調査 アンケートの質問の順序 ―キャリーオーバー効果 sample, population, universe ―標本と母集団 統計ソフトと集計ソフトの違い 統計ソフトと集計ソフトの違い 2 統計ソフトと集計ソフトの違い 3 enquête closed-ended questions / open-ended questions Likert scale クロス集計表の分析 シンプソンのパラドックス ―三次元...

ビンの数と幅

2017/08/26

カテゴリ:

量的データの度数分布をグラフにしたものをヒストグラムまたは柱状グラフと言います。Excelのグラフの種類にヒストグラムはないため、Excelで作るなら棒グラフを代用することになります。Excelの分析ツールにもヒストグラムのメニューがありますが、やはり棒グラフを代用してヒストグラムを書いています(分析ツールのヒストグラムは、コラムの最後に書いた理由に...

Excelの分析ツール (3)

2017/08/26

カテゴリ:

「Excelの分析ツール (2)」の続き。残る5つの分析ツールですが、まずサンプリングからですね。 分析ツールのウィンドウ サンプリング 入力済みの大量の数値データから標本抽出(サンプリング)を行うときに利用します。サンプリングの方法は「周期」と「ランダム」の2通りあります。「周期」は一定の間隔を空けてデータを取り出した...

Excelの分析ツール (2)

2017/08/26

カテゴリ:

今回のコラムを書いていて不思議に思ったのは分析ツールのリストの並びです。リストは分散分析に始まって t検定、z検定で終わります。「分散分析も、t検定と z検定も、平均が同じかどうかを検定するためにあるのに、何故、リストの両端に分かれているの?」、「時系列データの平滑化に使う指数平滑と移動平均の間にF検定やヒストグラムが入るのはどうして!」...

Excelの分析ツール (1)

2017/08/26

カテゴリ:

Microsoft Excelには、CORRELやTTESTといった様々な「関数」、「ピボットテーブル」、「分析ツール」や「ソルバー」などのアドインが用意されています。Excelだけでも、簡単な検定から、多大な手間は要するものの、かなり高度な多変量解析までこなせます。「相関係数を求めたい」とか「t検定をしたい」ぐらいで、わざわざ統計ソフトを買う必要はありません。Exce...

出生率の計算

2017/08/26

カテゴリ:

「日本の人口」の記事で、厚生労働省の『平成 23 年(2011) 人口動態統計の年間推計』より人口減少を話題に取り上げました。日本の場合、人口減少の最大の要因は出生率の低下ですが、この出生率には何通りかの計算方法があります。この厚労省のレポートにも出生率と合計特殊出生率の2つの出生率が出てきます。 人口動態調査の出生率は「普通出生率」と言われる...

日本の人口

2017/08/26

カテゴリ:

毎年、1月1日に厚生労働省から前年の人口動態統計の年間推計が発表されます。人口動態統計とは出生数、死亡数、婚姻件数、離婚件数及び死産数についての統計です。1月1日の推計値は前年1月から10月までの調査結果を利用したもので、確定値は9月に公表されます。 2011年は東日本大震災の影響で推計値と確定値は開きがあるかもしれませんが、昨年の出生数が1,057,0...

検定の多重性

2017/08/26

カテゴリ:

ここ10年ぐらいで、分散分析の結果が有意となった場合に、続けて多重比較を行い、どの水準間に有意差があるか検定をすることが当たり前のようになっています。教科書によっては多重比較が分散分析の下位検定(post-hoc test)でしかないような書き方をしているものもありますが、これは誤解です。分散分析の結果が有意であることを前提としているのは、FisherのLS...

エクセル統計の分散分析について

2017/08/26

カテゴリ:

エクセル統計では一元配置や二元配置の分散分析を行うための入り口が2つずつ用意されています。どちらの入り口から入るかはデータをどう整理しているかによります。長年使っているユーザーの方でも2つあることに気づいていらっしゃらなかったリするので、コラムに書いておきます。 メニューの先頭から4つはExcelの分析ツールに入っている分散分析と同...

比率が0%のときの信頼区間(3の法則)

2017/08/26

カテゴリ:

医薬品の臨床試験を行って有害事象(AE:Adverse Event。患者さんにとって医療上望ましくないこと)の発現率が 0% だったとします。これは非常に望ましいことですが、もしかしたら被験者の数が少なくて有害事象が起こらなかっただけかもしれません。 浅井隆先生の『いまさら誰にもけない医学統計の基礎のキソ1』を読んでいたら「頻度が 0% か 100% の信頼区間」...