Эмп. частоты. . .
Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты n't (например, так, как в следующем параграфе). При уровне значимости а требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально. В качестве критерия проверки нулевой гипотезы примем случайную величину Х2 = 2К' — п\)Чп\. Эта величина случайная, так как в различных опытах она принимает различные, заранее не известные значения. Ясно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия (*), и, следовательно, он в известной степени характеризует близость Эмпирического и теоретического распределений. Заметим, что возведением в квадрат разностей частот устраняют возможность взаимного погашения положительных и отрицательных разностей. Делением на п\ достигают уменьшения каждого из слагаемых; в противном случае сумма была бы настолько велика, что приводила бы к отклонению нулевой гипотезы даже и тогда, когда она справедлива. Разумеется, приведенные соображения не являются обоснованием выбранного критерия, а лишь пояснением. Доказано, что при п —► оо закон распределения случайной величины (*) независимо от того, какому закону распределения подчинена генеральная совокупность, стремится к закону распределения ck степенями свободы. Поэтому случайная величина (*) обозначена через х2. а сам критерий называют критерием согласия «хи квадрат». Число степеней свободы находят по равенству k = = s —1—г, где s — число групп (частичных интервалов) выборки; г — число параметров предполагаемого распределения, которые оценены по данным выборки. В частности, если предполагаемое распределение — нормальное, то оценивают два параметра (математическое Если, например, предполагают, что генеральная совокупность распределена по закону Пуассона, то оценивают один параметр Я,, поэтому г = 1 и k=s — 2. Поскольку односторонний критерий более «жестко» отвергает нулевую Гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости а: р [х2 > Zip (а; *)] = «• Таким образом, правосторонняя критическая область определяется неравенством х2 > Хч> (“I А), а область принятия нулевой гипотезы — неравенством х2 < %кр (а’> k). Обозначим значение критерия, вычисленное по данным наблюдений, через Хнабл и сформулируем правило проверки нулевой гипотезы. Правило. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу генеральная совокупность распределена нормально, надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия: Xia 6Ji = '2i(ni — n't)i/ni (**) и по таблице критических точек распределения х2» по заданному уровню значимости а и числу степеней свободы k = s — 3 найти критическую точку Хкр («;&). Если Хнабл < Хкр —нет оснований отвергнуть нулевую гипотезу. Если Хнабл > Хкр — нулевую гипотезу отвергают. Замечание 1. Объем выборки должен быть достаточно велик, во всяком случае,не менее 50. Каждая группа должна содержать не менее 5—8 вариант; малочисленные группы следует объединять в одну, суммируя частоты. Замечание 2. Поскольку возможны ошибки первого и второго рода, в особенности еслн согласование теоретических и эмпирических частот «слишком хорошее», следует проявлять осторожность. Например, можно повторить опыт, увеличить число наблюдений, воспользоваться другими критериями, построить график распределения, вычислить асимметрию и эксцесс (см. гл. XVII, § 8). Замечание 3. Для' контроля вычислений формулу (**) преобразуют к виду Хнабл =[2Л*/ЛП—" ”• Рекомендуем читателю выполнить это преобразование самостоятельно, для чего надо в (**) возвести в квадрат разность частот, сократить результат на ni и учесть, что 2ni' = n>; ,п'1~п- Пример. При уровне значимости О.Оопровернть гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты:
|