等分散の検定
2つのグループの分散が等しいことを帰無仮説として検定を行ないます.2つのグループの標本数は異なっていても構いません.
ExcelによるF検定
例えば,このようなデータを分析してみましょう.これは男女100人の身長,体重のデータ(仮想)です.以下の様にExcelの表の上にデータが並んでいたとします.※データはこの後にもならんでいます.
男女の身長の分散が異なっているかどうかを検定してみましょう.帰無仮説,つまり直接検定する仮説は「男女の身長の分散に差がない(ゼロ)」です.
- H0:男女の身長の分散に差がない
- H1:男女の身長の分散には差がある
ただし,このままでは分析に適さないので,例えば以下のように並べ替えをしたデータに対して分析を行ないます.
でもっていよいよ分析を行ないます.
【手順】
- メニューバーの「ツール(O)」
- 「分析ツール(D)」
- 「F検定」(2標本を使った分散の検定)
の順で以下のダイアログが現れます.そこで,例えば次のようにデータ範囲,出力範囲を設定し,「OK」ボタンをクリックします.
データの範囲指定にデータの名前を含めていれば,「ラベル」もチェックします.
「α」の部分は,棄却域の確率です.この確率に基づいてF境界値が表示されます.
ExcelによるF検定(出力結果)
先の分析を実行すると以下の結果が出力されます.
検定結果を評価する際には(1)「P(T<=t)」あるいは,(2)「観測された分散比 」と「F境界値」を見ます.観測された分散比は統計のテキストでは「F値」と呼ばれているものです.
(1) P(T<=t)<実験者が設定する棄却域の確率 帰無仮説を棄却 (2) F境界値<分散比(F値) 帰無仮説を棄却
- 仮に棄却域を5%(0.05)としたとき,P(F<=f)は0.05よりも小さいことが分かります.(帰無仮説を棄却)
- F境界値よりもF値はこれを下回っています.(帰無仮説を棄却できない)
ん?上に示した(1)と(2)の判断基準は,同じ結果を与えるはずなのに,おかしいですね.
※重要:この矛盾する結果は,F値の計算方法が間違っているためです.
2つのデータ(変数1,変数2)の分散が,「変数1の分散>変数2の分散」となっていれば観測された分散比は,「変数1の分散÷変数2の分散」
となるのですが,「変数1の分散<変数2の分散」のとき,分散比は,「1/(変数1の分散÷変数2の分散)」
とならなくてはいけません.ちなみに境界値もそれに伴い変化します(F.INV.RT関数を使って求めることができます).これは面倒なので,最初に「変数1の分散>変数2の分散」となるように分析することをお勧めします.つまり,この例では,男性のデータを変数1に,女性のデータを変数2に指定して,
という結果を得ます.これだと,「分散比>境界値」であり,P<0.05なので結論が一致していることが分かります.
Excelの関数で算出するF検定
上記のように「分析ツール」は変数1と2の設定に気を使う(でないと変な結果になってしまう)そこで,安心して結果を求めたい場合,あるいは算出した統計量をさらに次の分析に移したい場合や,マクロを書く場合などには「分析ツール」よりも関数を用いたほうが便利.以下ではF検定についての関数を挙げておく.
F分布に従う確率 f.test(配列1,配列2) F検定における境界値 f.inv.rt(確率,自由度1,自由度2) ■ f.test関数は検定結果として帰無仮説が棄却できる確率(p値,両側)を算出する.片側が欲しい場合は半分に.
■ f.inv.rt関数はF分布の確率関数の逆関数を与える.
Copyright(C) 2013 by ABE Keiji
All rights reserved.