В процессе проверки гипотезы Н0 можно прийти к правильному решению или совершить ошибку первого рода - отклонить H0, и когда она верна, или ошибку второго рода - принять Н0, когда она ложна. Иными словами ошибка первого рода имеет место, если точка
попадает в критическую область
в то время, как верна нулевая гипотеза Н0, а ошибка второго рода, когда
Î
, но гипотеза Н0 не верна (верна альтернатива Н1).
Вероятности этих ошибок можно выразить через функцию мощности W(F) критерия
: W(F)=W(
;F)=P(
Î
|F), FÎ F, т.е. вероятность попадания в критическую область, когда F - истинное распределение выборки. Вероятности ошибок можно представить так:
1. Ошибка первого рода - принимается решение g1: гипотеза Н0 не справедлива, когда она на самом деле справедлива
P(g1|H0)=P(
Î
|H0)=W(F), FÎ F0. (6.1)
2. Ошибка второго рода - принятие решения g0, когда справедлива альтернатива Н1
P(g0|H1)=P(
Î
|H1)=1-P(
Î
|H1)=1-W(F), FÎ F1. (6.2)
Желательно провести проверку гипотезы так, чтобы свести к минимуму вероятности обоих типов ошибок. На практике в общем случае сделать это невозможно. Рациональный принцип выбора критической области можно сформулировать так: при заданном числе испытаний n устанавливается граница для вероятности ошибки первого рода и при этом выбирается критическая область
, для которой вероятность ошибки второго рода минимальна. Выбирается число a между 0 и 1 и налагается условие
W(F)£a, "FÎ F0. (6.3)
При этом условии желательно сделать минимальной величину 1-W(F) для всех FÎ F0 (за счет выбора критической области
). Или, что то же самое, сделать максимальной мощность
W(F), "FÎ F0 . (6.4)
Величину a в формуле (6.3) называют уровнем значимости, критерий обозначают
.Обычно выбирают одно из следующих стандартных значений: a=0.05; 0.01; 0.1.
В терминах функции мощности W(F) можно сказать, что критерий тем лучше, чем больше его мощность при альтернативах. Действительно, если наблюдавшееся значение
выборки попадает в критическую область, то Н0 (нулевую гипотезу) отклоняют, и если истинной является альтернатива, то тем самым принимают правильное решение. Обычно критическая область задаётся с помощью некоторой статистики Т(
) и имеет следующий вид:
={
: Т(
)³c} или
={
: Т(
)£c}, или
={
: | Т(
)³c}.
Функцию наблюдений Т(
) называют в этом случае статистикой критерия, а критическую область задают непосредственно в терминах её значений. Если T= {t: t=Т(
),
Î
} -множество всех возможных значений статистики Т, то критическая область критерия есть некоторое подмножество T1 Î T, которое должно включать все маловероятные, при гипотезе Н0, значения Т. При заданном уровне значимости a для критической области используют обозначение T1a. Для функции мощности в этом случае имеем условие
W(F)=P(Т(
)Î T1a |F)£a, "FÎ F0. (6.3’)
Выбор статистики критерия произволен до некоторой степени, на практике для конкретных задач выбор статистики ясен. Главным для расчёта критерия, как следует из (6.3’), является отыскание распределения статистики Т(
) в случае справедливости гипотезы Н0. Чтобы полностью вычислить функцию мощности критерия, и тем самым исследовать и вероятность ошибки второго рода, требуется знать распределение статистики Т(
) и при альтернативах, что является весьма трудной задачей.
Вопрос