Проверка статистических гипотез
Проверка статистических гипотез - один из основных разделов математической статистики, объединяющий методы проверки соответствия статистических данных некоторой статистической гипотезе (гипотезе о вероятностной природе данных). Процедуры проверки статистических гипотез позволяют принимать или отвергать статистические гипотезы, возникающие при обработке или интерпретации результатов наблюдений по многих практически важных разделах науки и производства, связанных со случайным экспериментом. Правило, в соответствии с которым принимается или отклоняется данная гипотеза, называется статистическим критерием. Построение критерия определяется выбором подходящей функции T = T(X1,..., Xn) от результатов наблюдений X1,..., Xn, которая служит мерой расхождения между опытными и гипотетическими значениями. Эта функция, являющаяся случайной величиной, называется статистикой критерия, при этом предполагается, что распределение вероятностей T может быть вычислено при допущении, что проверяемая гипотеза верна, и что это распределение не зависит от характеристик гипотетического распределения. По распределению статистики T находится критическое значение T0 такое, что если гипотеза верна, то вероятность неравенства T>T0 равна α, где α - заранее заданный уровень значимости (область значений (x1,..., xn), для которых T(X1,..., Xn)>T0, область отклонения гипотезы H0, называется критической областью). Если в конкретном случае обнаружится, что T>T0, то считается, что расхождение значимо, и гипотеза отвергается, тогда как появление значения T≤T0 не противоречит гипотезе. Такого рода критерии, называются критериями значимости, используются как для проверки гипотез о параметрах распределения, так и гипотез о самих распределениях. В частном случае, когда проверяется согласие между выборочным и гипотетическим распределениями, пользуются термином критерий согласия. Пусть, например, проверяется гипотеза о том, что независимые результаты наблюдений X1,..., Xn подчиняются нормальному распределению со средним значением a=a0 при известной дисперсии σ2. При этом арифметическое среднее Xср = (X1+...+Xn)/n результатов наблюдений распределено нормально с математическим ожиданием a=a0 и дисперсией σ2/n, а величина распределена нормально с параметрами (0, 1). Полагая При выборе статистики T всегда явно или неявно высказывают гипотезы, альтернативные проверяемой гипотезе. Например, при проверке гипотезы a=a0 с известным σ2 вместо следует взять , если заранее известно, что a≥a0, т. е. отклонение гипотезы a=a0 влечёт принятие гипотезы a>a0. При решении вопроса о принятии или отклонении какой-либо гипотезы H0 с помощью любого критерия, основанного на результатах наблюдения, могут быть допущены ошибки двух типов. Ошибка "первого рода" совершается тогда, когда отвергается верная гипотеза H0. Ошибка "второго рода" совершается в том случае, когда гипотеза H0 принимается, а на самом деле верна не она, а какая-либо альтернативная гипотеза H1. Естественно требовать, чтобы критерий для проверки данной гипотезы приводил возможно реже к ошибочным решениям. Обычная процедура построения наилучшего критерия для простой гипотезы заключается в выборе среди всех критериев с заданным уровнем значимости α (вероятность ошибки 1-го рода) такого, который имел бы наименьшую вероятность ошибки 2-го рода (или, что то же самое, наибольшую вероятность отклонения гипотезы, когда она неверна). Последняя вероятность (дополняющая до единицы вероятность ошибки 2-го рода) называется мощностью статистического критерия. В случае когда альтернативная гипотеза H1 простая (см. Статистическая гипотеза), наилучшим будет критерий, который имеет наибольшую мощность среди всех других критериев с заданным уровнем значимости α (наиболее мощный статистический критерий). Если альтернативная гипотеза H1 сложная, например зависит от параметра, то мощность критерия будет функцией, определённой на классе простых альтернативных гипотез, составляющих H1, т. е. будет функцией параметра. Критерий, имеющий наибольшую мощность при каждой альтернативной гипотезе из класса H1 называется равномерно наиболее мощным статистическим критерием, однако следует отметить, что такой критерий существует лишь в немногих специальных ситуациях. В задаче проверки простой гипотезы о среднем значении нормальной совокупности a=a0 против сложной альтернативной гипотезы a>a0 равномерно наиболее мощный критерий существует, тогда как при проверке той же гипотезы против альтернативы a≠a0 его нет. Поэтому часто ограничиваются поиском равномерно наиболее мощных критериев в тех или иных специальных классах (инвариантных, несмещённых и т. п. критериев). Теория проверки статистических гипотез позволяет с единой точки зрения трактовать задачи математической статистики, связанные с проверкой гипотез (оценка различия между средними значениями, проверка гипотезы постоянства дисперсии, проверка гипотез независимости, проверка гипотез о распределениях и т. п.). Идеи последовательного статистического анализа, применённые к проверке статистических гипотез, указывают на возможность связать решение о принятии или отклонении гипотезы с результатами последовательно проводимых наблюдений (в этом случае число наблюдений, на основе которых по определённому правилу принимается решение, не фиксируется заранее, а определяется в ходе эксперимента). Основные задачи проверки статистических гипотез могут быть сформулированы в рамках теории статистических решений.
|