2014年1月16日木曜日

相関係数の検定

論文を書く時など,シミュレーション実験の結果から相関係数を算出することがある.
参考程度であれば相関係数を出しただけで終えても良いのだが,論文等に載せる場合は算出した相関係数に意味があるか否かを調べる必要がある.
どういうことかと言うと,相関係数の算出に用いたデータはあくまでもサンプルであり,真の相関係数が求まっているわけではない.

つまり,母集団から標本を取り出して計算した結果に過ぎないので,もし使用した標本が外れ値だらけで,母相関係数との間に大きなずれがあれば,意味のない値ということになってしまう.
そこで,母相関係数ρ=0であるという帰無仮説をたてて,有意性の検定を行なう.
これを無相関検定と呼ぶ.手順は次の通り.(rは相関係数,nはサンプル数)
  1. 帰無仮説をたてる:「相関が無い(ρ=0)」
  2. 対立仮説をたてる:「相関がある(ρ≠0)
  3. 有意水準を決める:通常は1%か5%
  4. 自由度*を求める:自由度=サンプル数-2
  5. t値を計算する:t=r * ((n-2)/(1-r^2))^(1/2)
  6. t分布表を見て,該当する自由度の箇所の水準値をt値が上回っていれば,帰無仮説は棄却(対立仮説を採択)
  7. 6.と逆の場合には,帰無仮説を採択
エクセルで求める場合,まず以下でt値を計算する.

 t=ABS(相関係数*SQRT(サンプル数-2)/SQRT(1-相関係数^2))
次に,以下でp値を計算する.

 p=TDIST(t値, 自由度, 2)
pが有意水準を下回っていれば,帰無仮説を棄却できる(相関係数が有意であると言える).


※参照ページ

※自由度
 母集団からサンプル数nで標本を取り出す場合について考える.標本平均を母平均と一致させるためには,n-1個のサンプルは自由に選んでも良いが,残りの1つで標本平均を調節しなければならない.この,自由に選べる数「n-1」が自由度.
 大雑把な理解としては,相関係数の場合は,相関を見る対象である2つの母集団が存在するため,自由度が2減る.従って,「サンプル数-2」が自由度となる.


0 件のコメント:

コメントを投稿