BellCurve 統計WEB

ブログ

単変量解析とは

2017/08/19

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら※ エクセル統計のサポートをしていると、「単変量解析をするにはどうしたらよいのか」という問い合わせを受けることがあります。単変量解析が説明変数(=独立変数)が1つだけの解析という意味なら、ほとんどの場合は多変量解析のツールをそのまま使うことができます。多変量解析の入門書を読むと、説明変数が...

無相関の検定―相関係数の有意性を検定する

2017/08/19

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら※ 「幾つデータが必要か? - 相関係数の有意性検定」をアップして以来、「相関係数の有意性検定」を調べている方のアクセスが増えているので、Excelを利用した検定の方法についても書いておきます。 相関係数の有意性検定は、「母相関係数が 0 である」を帰無仮説としています。「母相関係数が 0 」とい...

幾つデータが必要か?―測定の信頼性によ...

2017/08/19

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら※ 昨年末から3回に亘って必要なサンプルサイズの計算式を紹介してきましたが、この式で求められた n だけデータを集めれば良いということではなく、多少上積みをしておきます。 通常、どんな測定方法を用いても、測定対象の真の値から幾らかのずれがあります(体重測定の結果や、テストの点数など思い浮かべ...

幾つデータが必要か?―相関係数の有意性...

2017/08/19

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら※ 相関係数の統計的有意性の検定は「無相関の検定」と呼ばれています。相関係数がゼロである(=無相関)ことを帰無仮説としていることからこの名前が付いています。この検定についても、必要なサンプルサイズ(n)をざっくり計算できます。式は次の通りです。 r は相関係数です。|r| は相関...

幾つデータが必要か?―比率の差の検定

2017/08/19

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら※ 「幾つデータが必要か?」の記事で、2群の平均値の差の検定についてサンプルサイズ(n)を幾つにするか計算式を紹介しましたが、今回は比率の差の検定のときに n を幾つ以上にしたらよいかを求めてみましょう。 計算式は次の通りです。この式も、有意水準を5%としたときに、対立仮説が正しい(2群の比率...

幾つデータが必要か?―平均値の差の検定

2017/08/19

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら※ t検定で有意差検定を行う場合、2群間で僅かでも差があるなら、データの個数をどんどん増やしさえすれば、理論的にはいつか有意になります。しかしながら、予算にも時間にも限りがありますし、動物実験でそんなことをしたら倫理的にも許されないですね。それでは幾つデータを採ればよいのでしょうか。 統計T...

平均値と中央値の違い

2017/08/19

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら※ 最小値が2、最大値が12の33個のデータがあったとします。33個のデータを小さい方から順に1番から33番まで番号を振っておきます。一本の定規の上に、各データを、データが持っている値と定規の目盛りが一致するように積み上げたところをイメージしてください。 この定規(上図の黒い棒)の左...

平均値と統計法

2017/08/19

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら※ マーケティング・リサーチの結果を報告していると、必ずといってよいほどクライアントから平均値が幾つか聞かれます。データの分布を1つの値だけで説明しようとするなら、平均値より中央値の方がはるかにましだと思うのですが、中央値を知りたがる人はまずいません。中央値を知らない人も結構います。中央値...

まだまだ外れ値が気になる

2017/08/19

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら※ 前回までに単変量での外れ値の見つけ方を幾つか紹介しましたが、多変量における外れ値を確認する方法もあります。一番単純な方法としては、主成分分析を行って主成分得点を求め、主成分得点を散布図にプロットするなどして視覚化し、探索的に判断するといったテクニックがあります。数値化による判断として...

外れ値の見つけ方

2017/08/19

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら※ 外れ値を見つける方法としてスミルノフ・グラブス検定があると前回書きましたが、スミルノフ・グラブス検定は正規分布にしか適さない方法です。もう少し汎用性がある方法として、IQRを利用した方法があります。 IQRは第三四分位数(=75パーセンタイル)から第一四分位数(=25パーセンタイル)を引いた値で...