Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, которое можно проверить по выборке. Как правило, статистические гипотезы делят на гипотезы о законах распределения и гипотезы о параметрах распределения.
Пусть
- закон распределения случайной величины Х, зависящий от одного параметра
. Предположим, что наша гипотеза состоит в утверждении, что
. Назовём эту гипотезу нулевой и обозначим её Н 0. Альтернативной, или конкурирующей гипотезой, которую обозначим Н 1 , будет
. Перед нами стоит задача проверки гипотезы Н 0 относительно конкурирующей гипотезы Н1
на основании выборки, состоящей из n независимых наблюдений Х1, Х2, …, Хn. Следовательно, всё возможное множество выборок объёма n можно разделить на два непересекающихся подмножества (О и W) таких, что проверяемая гипотеза Н0 должна быть отвергнута, если наблюдаемая выборка попадает в подмножество W и принята, если выборка принадлежит подмножеству О.
Подмножество О называют областью допустимых значений, а подмножество W – критической областью. При формировании критической области возможны ошибки.
Ошибка первого рода состоит в том, нулевая гипотеза отвергается, то есть принимается гипотеза Н1, в то время как в действительности верна гипотеза Н0.
Ошибка второго рода состоит в том, что принимается гипотеза Н0, а в действительности верна гипотеза Н1.
Для любой заданной критической области будем обозначать через
вероятность ошибки первого рода, а через
- вероятность ошибки второго рода. Следовательно, можно сказать, что при большом количестве выборок доля ложных заключений равна
, если верна гипотеза Н0, и
, если верна гипотеза Н1. При фиксированном объёме выборки выбор критической области W позволяет сделать как угодно малой либо
, либо
.