Общий принцип выбора критической области критерия
В процессе проверки гипотезы Н0 можно прийти к правильному решению или совершить ошибку первого рода - отклонить H0, и когда она верна, или ошибку второго рода - принять Н0, когда она ложна. Иными словами ошибка первого рода имеет место, если точка попадает в критическую область в то время, как верна нулевая гипотеза Н0, а ошибка второго рода, когда Î , но гипотеза Н0 не верна (верна альтернатива Н1). Вероятности этих ошибок можно выразить через функцию мощности W(F) критерия : W(F)=W(;F)=P( Î |F), FÎ F, т.е. вероятность попадания в критическую область, когда F - истинное распределение выборки. Вероятности ошибок можно представить так: 1. Ошибка первого рода - принимается решение g1: гипотеза Н0 не справедлива, когда она на самом деле справедлива P(g1|H0)=P( Î |H0)=W(F), FÎ F0. (6.1) 2. Ошибка второго рода - принятие решения g0, когда справедлива альтернатива Н1 P(g0|H1)=P( Î |H1)=1-P( Î |H1)=1-W(F), FÎ F1. (6.2) Желательно провести проверку гипотезы так, чтобы свести к минимуму вероятности обоих типов ошибок. На практике в общем случае сделать это невозможно. Рациональный принцип выбора критической области можно сформулировать так: при заданном числе испытаний n устанавливается граница для вероятности ошибки первого рода и при этом выбирается критическая область , для которой вероятность ошибки второго рода минимальна. Выбирается число a между 0 и 1 и налагается условие W(F)£a, "FÎ F0. (6.3) При этом условии желательно сделать минимальной величину 1-W(F) для всех FÎ F0 (за счет выбора критической области ). Или, что то же самое, сделать максимальной мощность W(F), "FÎ F0 . (6.4) Величину a в формуле (6.3) называют уровнем значимости, критерий обозначают .Обычно выбирают одно из следующих стандартных значений: a=0.05; 0.01; 0.1. В терминах функции мощности W(F) можно сказать, что критерий тем лучше, чем больше его мощность при альтернативах. Действительно, если наблюдавшееся значение выборки попадает в критическую область, то Н0 (нулевую гипотезу) отклоняют, и если истинной является альтернатива, то тем самым принимают правильное решение. Обычно критическая область задаётся с помощью некоторой статистики Т() и имеет следующий вид: ={ : Т()³c} или ={ : Т()£c}, или ={ : | Т()³c}. Функцию наблюдений Т() называют в этом случае статистикой критерия, а критическую область задают непосредственно в терминах её значений. Если T= {t: t=Т(), Î } -множество всех возможных значений статистики Т, то критическая область критерия есть некоторое подмножество T1 Î T, которое должно включать все маловероятные, при гипотезе Н0, значения Т. При заданном уровне значимости a для критической области используют обозначение T1a. Для функции мощности в этом случае имеем условие W(F)=P(Т()Î T1a |F)£a, "FÎ F0. (6.3’) Выбор статистики критерия произволен до некоторой степени, на практике для конкретных задач выбор статистики ясен. Главным для расчёта критерия, как следует из (6.3’), является отыскание распределения статистики Т() в случае справедливости гипотезы Н0. Чтобы полностью вычислить функцию мощности критерия, и тем самым исследовать и вероятность ошибки второго рода, требуется знать распределение статистики Т() и при альтернативах, что является весьма трудной задачей.
Вопрос
|