Критерий однородности хи - квадрат
Критерий однородности c2 используют для проверки однородности дискретных данных, т.е. когда в опытах наблюдается некоторый переменный признак, принимающий конечное число различных значений Известно, что к такой схеме можно свести любую другую модель, применяя предварительно метод группировки данных. Поэтому критерий c2 применим к анализу любых данных, т.е. является универсальным. Пусть имеется k серий опытов, состоящих из наблюдений за случайной величиной x, которая может принимать одно из m возможных значений (x - дискретная случайная величина). Серии наблюдений характеризуются выборками =(X1,...,Xn1) ~ F1(u) =(Y1,...,Yn2) ~ F2(u) ............................... =(Z1,...,Znk) ~ Fk(u). F1(u), F2(u),...,Fk(u) - предполагаемые функции распределения. Требуется проверить гипотезу H0 о том, что все наблюдения производились над одной и той же случайной величиной H0: F1(u)=F2(u)=...=Fk(u) против альтернативы H1: хотя бы одно распределение не равно остальным. Необходимо построить правило, позволяющее на основе значений выборок принять или отвергнуть H0. Для решения используется статистика , (8.5) где nij - число появлений i-го значения в j-ой серии, - число появлений i-го значения во всех сериях; nj - объем j-ой серии; n= - общий объем всех выборок. При n®¥ (при увеличении объема выборок) статистика (8.5) будет иметь распределение c2 с (m-1)(k-1) степенями свободы, т.е. при справедливости основной гипотезы. Отсюда следует критерий проверки гипотезы: 1) вычисляется gэкс; 2) при заданном уровне значимости ищется gkp по таблицам распределения c2: gkp= ; 3) решение принимается следующим образом: gэкс³gkp®g1 gэкс<gkp®g0. Замечание. Критерий c2 применяется для непрерывной случайной величин x, тогда область возможных значений x можно разбить на подинтервалы и nij будет числом значений в j-той серии, попавших в i-ый подинтервал.
|