mimetex の練習がてらに。。。。
定義
: 確率 に従う母集団からのランダムサンプル
ここに、は、の開集合とする。
: 尤度関数
ここに、 を帰無仮説の範囲とする。(つまり、 が帰無仮説。)
定理
すなわち、、もしくは、 とする時、
証明、および、成立条件は、Testing Statistical Hypotheses の Theorem 12.4.2 を参照。これが成立するための簡単な十分条件は、 が存在して、有界連続なこと。
適用例 (1) (さいころの検定)
を 通りの目のでるさいころを 回振った時のそれぞれの目の出た回数とする。それぞれの目が出る確率を とすると、未知の母変数の集合は、次の通り。
この時の、最大尤度は次の通り。
一方、帰無仮説を (定数)と置くと、 であり、
従って、
ここで、 の際の近似式 を用いると、
つまり、帰無仮説の下での期待される値と、観測による実現値をそれぞれ、
として、
に対する自由度 のカイ二乗検定が実施できる。ただし、これがよい近似となる条件は、次の通り。
、および、
なお、 の場合、大数の法則より、自然に は成立する。
適用例 (2) クロス集計表の独立性の検定
を の大きさのクロス集計表の集計値とする。各項目の確率を
とすると、これらの母変数の集合を として、
一方、帰無仮説として、縦横の項目が独立だとすると、これは、次の様に表現できる。
従って、帰無仮説に含まれる母変数の値の集合 は、 となる。また、帰無仮説の下での最大尤度を与える確率を
とすると、サンプル数を
として、最大尤度は、次の通り。
これは、適用例(1)と同じ形式であり、先と同様に、
つまり、帰無仮説の下での期待される値と、観測による実現値をそれぞれ、
として、
に対するカイ二乗検定が実施できる。ただし、自由度は、
となる。
今の場合、 が に依存していることにも注意。これより、適用例(1)との自由度の違いが発生する。帰無仮説(独立性の仮定)の下で最大尤度を与える確率 は、具体的には、次で与えられる。
この導出は、MIT Opencourseware - Statistics for Applications (Lecture Notes) の Lecture 13 に記載。
(参考)厳密にカイ二乗分布に一致する例
を正規分布 からのランダムサンプルとして、
の場合を考えると、
この時、
独立性の検定における 2logR と慣例的な検定統計量の比較例
と、 の際に近似される
の差を具体例で確認してみる。使用するデータは、R によるやさしい統計学 の 5.6 節から引用。
> data stat math 嫌い 好き 嫌い 10 4 好き 2 4 > E <- c(12*14/20, 12*6/20, 8*14/20, 8*6/20) > O <- c(10,2,4,4) > 2*sum(O*log(O/E)) [1] 2.530748 > chisq.test(data,correct=FALSE) Pearson's Chi-squared test data: data X-squared = 2.5397, df = 1, p-value = 0.1110
結果は、