等分散の検定


2つのグループの分散が等しいことを帰無仮説として検定を行ないます.2つのグループの標本数は異なっていても構いません.


ExcelによるF検定

例えば,このようなデータを分析してみましょう.これは男女100人の身長,体重のデータ(仮想)です.以下の様にExcelの表の上にデータが並んでいたとします.※データはこの後にもならんでいます.

uni-0.gif

男女の身長の分散が異なっているかどうかを検定してみましょう.帰無仮説,つまり直接検定する仮説は「男女の身長の分散に差がない(ゼロ)」です.

ただし,このままでは分析に適さないので,例えば以下のように並べ替えをしたデータに対して分析を行ないます.

t-test1.gif

でもっていよいよ分析を行ないます.

【手順】

  1. メニューバーの「ツール(O)」
  2. 「分析ツール(D)」
  3. 「F検定」(2標本を使った分散の検定)

の順で以下のダイアログが現れます.そこで,例えば次のようにデータ範囲,出力範囲を設定し,「OK」ボタンをクリックします.

データの範囲指定にデータの名前を含めていれば,「ラベル」もチェックします.

「α」の部分は,棄却域の確率です.この確率に基づいてF境界値が表示されます.

F-test1.jpg


ExcelによるF検定(出力結果)

先の分析を実行すると以下の結果が出力されます.

F-test2.jpg

検定結果を評価する際には(1)「P(T<=t)」あるいは,(2)「観測された分散比 」と「F境界値」を見ます.観測された分散比は統計のテキストでは「F値」と呼ばれているものです.

(1)P(T<=t)<実験者が設定する棄却域の確率帰無仮説を棄却
(2)F境界値<分散比(F値) 帰無仮説を棄却

  1. 仮に棄却域を5%(0.05)としたとき,P(F<=f)は0.05よりも小さいことが分かります.(帰無仮説を棄却)
  2. F境界値よりもF値はこれを下回っています.(帰無仮説を棄却できない)

ん?上に示した(1)と(2)の判断基準は,同じ結果を与えるはずなのに,おかしいですね.

※重要:この矛盾する結果は,F値の計算方法が間違っているためです.
2つのデータ(変数1,変数2)の分散が,「変数1の分散>変数2の分散」となっていれば観測された分散比は,

「変数1の分散÷変数2の分散」
となるのですが,「変数1の分散<変数2の分散」のとき,分散比は,

「1/(変数1の分散÷変数2の分散)」
とならなくてはいけません.ちなみに境界値もそれに伴い変化します(F.INV.RT関数を使って求めることができます).

これは面倒なので,最初に「変数1の分散>変数2の分散」となるように分析することをお勧めします.つまり,この例では,男性のデータを変数1に,女性のデータを変数2に指定して,

F-test3.jpg

という結果を得ます.これだと,「分散比>境界値」であり,P<0.05なので結論が一致していることが分かります.


Excelの関数で算出するF検定

上記のように「分析ツール」は変数1と2の設定に気を使う(でないと変な結果になってしまう)そこで,安心して結果を求めたい場合,あるいは算出した統計量をさらに次の分析に移したい場合や,マクロを書く場合などには「分析ツール」よりも関数を用いたほうが便利.以下ではF検定についての関数を挙げておく.

F分布に従う確率f.test(配列1,配列2)
F検定における境界値f.inv.rt(確率,自由度1,自由度2)

f.test関数は検定結果として帰無仮説が棄却できる確率(p値,両側)を算出する.片側が欲しい場合は半分に.
f.inv.rt関数はF分布の確率関数の逆関数を与える.


Copyright(C) 2013 by ABE Keiji
All rights reserved.