Проверка статистических гипотез. Ошибки первого и второго рода.
Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, которое можно проверить по выборке. Как правило, статистические гипотезы делят на гипотезы о законах распределения и гипотезы о параметрах распределения. Пусть - закон распределения случайной величины Х, зависящий от одного параметра . Предположим, что наша гипотеза состоит в утверждении, что . Назовём эту гипотезу нулевой и обозначим её Н 0. Альтернативной, или конкурирующей гипотезой, которую обозначим Н 1 , будет . Перед нами стоит задача проверки гипотезы Н 0 относительно конкурирующей гипотезы Н1 на основании выборки, состоящей из n независимых наблюдений Х1, Х2, …, Хn. Следовательно, всё возможное множество выборок объёма n можно разделить на два непересекающихся подмножества (О и W) таких, что проверяемая гипотеза Н0 должна быть отвергнута, если наблюдаемая выборка попадает в подмножество W и принята, если выборка принадлежит подмножеству О. Подмножество О называют областью допустимых значений, а подмножество W – критической областью. При формировании критической области возможны ошибки. Ошибка первого рода состоит в том, нулевая гипотеза отвергается, то есть принимается гипотеза Н1, в то время как в действительности верна гипотеза Н0. Ошибка второго рода состоит в том, что принимается гипотеза Н0, а в действительности верна гипотеза Н1. Для любой заданной критической области будем обозначать через вероятность ошибки первого рода, а через - вероятность ошибки второго рода. Следовательно, можно сказать, что при большом количестве выборок доля ложных заключений равна , если верна гипотеза Н0, и , если верна гипотеза Н1. При фиксированном объёме выборки выбор критической области W позволяет сделать как угодно малой либо , либо .
|