Проверка гипотезы о математическом ожидании нормального распределения
Пусть случайная величина x имеет нормальное распределение с известной дисперсией s2 и неизвестным средним q ~ N(q,s2), qÎ{q0,q1}, q0<q1. Необходимо построить критерий, позволяющий на основе значений выборки решить, какое значение имеет параметр q. Н0: q=q0; Н1: q=q1. Будем использовать критерий Неймана-Пирсона. Необходимо построить отношение l( l( Значение с находится из условия: P(g1|H0)=a В виду монотонности экспоненты можно перейти к следующему неравенству ln l(x) ≥ ln c, т.е. [ В качестве статистики критерия при проверке простой параметрической гипотезы выбирают ту же статистику, что и для оценки параметра q, т.е. выборочное среднее. Поэтому из этого неравенства определим выборочное среднее
Обозначим через h правую часть равенства (*), и получаем следующий алгоритм
Необходимо найти h из условия P(g1|H0)=a. Выборочное среднее имеет нормальный закон распределения с параметрами N(θ, σ/√n). Определим ошибки первого и второго рода a=P(g1|H0)=P( b= P(g0|H1)=P( Обозначим ug то значение, для которого 1-Ф(ug)=g, ug носит название квантиль нормального распределения. Тогда из (7.2), (7.3) и из того, что ug=-u1-g вытекает (7.4)
отсюда определим h, т.е. h=q0+ua Из этого выражения найдём n
Равенство (7.5) даёт тот объём выборки, который при оптимальном критерии обеспечивает ошибки 1-го и 2-го рода (a и b). Если правая часть (7.5) - не целая, то за n надо брать ближайшее большее целое число В соответствии с выражением (7.4) пороговое значение находится правее θ0. Справа от h находится критическая область, слева – допустимая. Функция мощности (это вероятность попадания выборки в критическую область) выражается через ошибки 1-го и 2-го рода следующим образом:
Значение h называется критическим значением критерия. Слева от него находится допустимая область, справа – критическая область. На практике обычно считают известным уровень значимости α и объем выборки n, а h - критическое значение определяют из таблиц или с помощью пакетов MATHCAD и STATISTICA. Уровень значимости α связан с критическим значением h приближенной формулой α ≈ 1 - A(h), где A(h) – функция распределения той статистики, которая используется при проверке гипотез. При большом объёме выборки критическое значение h совпадает с (1 – α) квантилью соответствующего распределения.
Вопрос
|