等分散の検定
2つのグループの分散が等しいことを帰無仮説として検定を行ないます.2つのグループの標本数は異なっていても構いません.
ExcelによるF検定
例えば,このようなデータを分析してみましょう.これは男女100人の身長,体重のデータ(仮想)です.以下の様にExcelの表の上にデータが並んでいたとします.※データはこの後にもならんでいます.
![]()
男女の身長の分散が異なっているかどうかを検定してみましょう.帰無仮説,つまり直接検定する仮説は「男女の身長の分散に差がない(ゼロ)」です.
- H0:男女の身長の分散に差がない
- H1:男女の身長の分散には差がある
ただし,このままでは分析に適さないので,例えば以下のように並べ替えをしたデータに対して分析を行ないます.
■実習
練習用データで実習する.
![]()
でもっていよいよ分析を行ないます.
【手順】
- メニューバーの「ツール(O)」
- 「分析ツール(D)」
- 「F検定」(2標本を使った分散の検定)
の順で以下のダイアログが現れます.そこで,例えば次のようにデータ範囲,出力範囲を設定し,「OK」ボタンをクリックします.
データの範囲指定にデータの名前を含めていれば,「ラベル」もチェックします.
「α」の部分は,棄却域の確率です.この確率に基づいてF境界値が表示されます.
![]()
ExcelによるF検定(出力結果)
先の分析を実行すると以下の結果が出力されます.
![]()
検定結果を評価する際には(1)「P(T<=t)」あるいは,(2)「観測された分散比 」と「F境界値」を見ます.観測された分散比は統計のテキストでは「F値」と呼ばれているものです.
(1) P(T<=t)<実験者が設定する棄却域の確率 帰無仮説を棄却 (2) F境界値<分散比(F値) 帰無仮説を棄却
- 仮に棄却域を5%(0.05)としたとき,P(F<=f)は0.05よりも小さいことが分かります.(帰無仮説を棄却)
- F境界値よりもF値はこれを下回っています.(帰無仮説を棄却できない)
ん?上に示した(1)と(2)の判断基準は,同じ結果を与えるはずなのに,おかしいですね.
※重要:この矛盾する結果は,F値の計算方法が間違っているためです.
2つのデータ(変数1,変数2)の分散が,「変数1の分散>変数2の分散」となっていれば観測された分散比は,「変数1の分散÷変数2の分散」
となるのですが,「変数1の分散<変数2の分散」のとき,分散比は,「1/(変数1の分散÷変数2の分散)」
とならなくてはいけません.ちなみに境界値もそれに伴い変化します(FINV関数を使って求めることができます).これは面倒なので,最初に「変数1の分散>変数2の分散」となるように分析することをお勧めします.つまり,この例では,男性のデータを変数1に,女性のデータを変数2に指定して,
![]()
という結果を得ます.これだと,「分散比<境界値」であり,P<0.05なので結論が一致していることが分かります.
■その他
この結果はExcel2003で出力したものです.Excel2000までですと,これ以外にも誤りがありますが,この点については省略します.
このページの2005年のバージョンには誤りがあって,2009年1月にご指摘を受け修正しました.ご指摘ありがとうございます.■実習
練習用データで実習する.ここでは講義中に指示した組み合わせで検定を行なう.
Excelの関数で算出するF検定
上記のように「分析ツール」を使っても良いのですが,算出した統計量をさらに次の分析に移したいときや,マクロを書くときなどには「分析ツール」よりも関数を用いたほうが便利です.以下ではF検定についての関数を挙げておきます.
F分布に従う確率 ftest(配列1,配列2) ■ ftest関数は検定結果として帰無仮説が棄却できる確率(P値,両側確率)を算出します.
■実習
練習用データで関数を用いて検定を行なう.具体的には2-2の例(男性の身長は平均170cmか)を検定する.
Copyright(C) 2009 by ABE Keiji
All rights reserved.