等分散の検定


2つのグループの分散が等しいことを帰無仮説として検定を行ないます.2つのグループの標本数は異なっていても構いません.


ExcelによるF検定

例えば,このようなデータを分析してみましょう.これは男女100人の身長,体重のデータ(仮想)です.以下の様にExcelの表の上にデータが並んでいたとします.※データはこの後にもならんでいます.

uni-0.gif

男女の身長の分散が異なっているかどうかを検定してみましょう.帰無仮説,つまり直接検定する仮説は「男女の身長の分散に差がない(ゼロ)」です.

ただし,このままでは分析に適さないので,例えば以下のように並べ替えをしたデータに対して分析を行ないます.

実習
練習用データで実習する.

t-test1.gif

でもっていよいよ分析を行ないます.

【手順】

  1. メニューバーの「ツール(O)」
  2. 「分析ツール(D)」
  3. 「F検定」(2標本を使った分散の検定)

の順で以下のダイアログが現れます.そこで,例えば次のようにデータ範囲,出力範囲を設定し,「OK」ボタンをクリックします.

データの範囲指定にデータの名前を含めていれば,「ラベル」もチェックします.

「α」の部分は,棄却域の確率です.この確率に基づいてF境界値が表示されます.

F-test1.jpg


ExcelによるF検定(出力結果)

先の分析を実行すると以下の結果が出力されます.

F-test2.jpg

検定結果を評価する際には(1)「P(T<=t)」あるいは,(2)「観測された分散比 」と「F境界値」を見ます.観測された分散比は統計のテキストでは「F値」と呼ばれているものです.

(1)P(T<=t)<実験者が設定する棄却域の確率帰無仮説を棄却
(2)F境界値<分散比(F値) 帰無仮説を棄却

  1. 仮に棄却域を5%(0.05)としたとき,P(F<=f)は0.05よりも小さいことが分かります.(帰無仮説を棄却)
  2. F境界値よりもF値はこれを下回っています.(帰無仮説を棄却できない)

ん?上に示した(1)と(2)の判断基準は,同じ結果を与えるはずなのに,おかしいですね.

※重要:この矛盾する結果は,F値の計算方法が間違っているためです.
2つのデータ(変数1,変数2)の分散が,「変数1の分散>変数2の分散」となっていれば観測された分散比は,

「変数1の分散÷変数2の分散」
となるのですが,「変数1の分散<変数2の分散」のとき,分散比は,

「1/(変数1の分散÷変数2の分散)」
とならなくてはいけません.ちなみに境界値もそれに伴い変化します(FINV関数を使って求めることができます).

これは面倒なので,最初に「変数1の分散>変数2の分散」となるように分析することをお勧めします.つまり,この例では,男性のデータを変数1に,女性のデータを変数2に指定して,

F-test3.jpg

という結果を得ます.これだと,「分散比<境界値」であり,P<0.05なので結論が一致していることが分かります.

その他
この結果はExcel2003で出力したものです.Excel2000までですと,これ以外にも誤りがありますが,この点については省略します.
このページの2005年のバージョンには誤りがあって,2009年1月にご指摘を受け修正しました.ご指摘ありがとうございます.

実習
練習用データで実習する.ここでは講義中に指示した組み合わせで検定を行なう.


Excelの関数で算出するF検定

上記のように「分析ツール」を使っても良いのですが,算出した統計量をさらに次の分析に移したいときや,マクロを書くときなどには「分析ツール」よりも関数を用いたほうが便利です.以下ではF検定についての関数を挙げておきます.

F分布に従う確率ftest(配列1,配列2)

ftest関数は検定結果として帰無仮説が棄却できる確率(P値,両側確率)を算出します.

実習
練習用データで関数を用いて検定を行なう.具体的には2-2の例(男性の身長は平均170cmか)を検定する.


Copyright(C) 2009 by ABE Keiji
All rights reserved.