В прошлой теме были введены основные понятия теории проверки гипотез и рассмотрен критерий знаков проверки однородности генеральных совокупностей. Сейчас мы рассмотрим еще несколько критериев, а именно критерии Пирсона, Смирнова и Колмогорова.
Критерий Пирсона (критерий хи-квадрат). Пусть имеется генеральная совокупность
, распределение которой неизвестно. Относительно распределения данной генеральной совокупности выдвигаются две гипотезы: основная
и альтернативная
. Основная гипотеза
состоит в том, что распределение
задается данной функцией распределения F, то есть
. Альтернативная гипотеза
состоит в том, что
. Для проверки данной гипотезы множество R разбивают на l непересекающихся отрезков
. Для единообразия обозначим
,
. Подсчитаем вероятности попаданий значений случайной величины
в отрезок
,
при верной гипотезе
. Имеем,
,
. Затем проведем эксперимент, получим в результате данного эксперимента выборку
и подсчитаем частоты
попаданий выборочных значений в интервал
,
. Эти частоты вычисляются по формуле
, где
- количество попаданий выборочных значений в интервал
,
. При верной гипотезе
частоты
должны быть «близки» к вероятностям
. Для оценки меры этой близости построим величину
. Если положить
,
, то получим:
. Выбор именно таких значений
,
, объясняется следующей теоремой, которую мы примем без доказательства.
Теорема Пирсона. Если верна гипотеза
и объем выборки стремится к
, то распределение
сходится к хи-квадрат с числом степеней свободы
(
).
Проверка гипотезы по критерию Пирсона производится следующим образом. Строятся интервалы
,
и вычисляются теоретические вероятности
попадания значений случайной величины
в данные интервалы. Задается уровень значимости
и по таблицам распределения
находится такое число
, для которого выполняется неравенство
. Затем проводится опыт, получают выборку
и вычисляют
,
и
. Если выполняется неравенство
, то гипотеза
отвергается на уровне значимости
(так как произошло событие, вероятность которого при верной гипотезе
очень мала). Если же справедливо соотношение
, то гипотеза
не отвергается на уровне значимости
(но может быть отвергнута на некотором другом уровне значимости).
Критерий Колмогорова. Перед рассмотрением данного критерия нам понадобится ввести следующее определение.
Определение. Пусть
- выборка объема
из генеральной совокупности
. Эмпирическая функция распределения обозначается
и равна отношению
- количества выборочных значений, меньших
, к объему выборки, то есть
.
Замечание. Эмпирическая функция распределения совпадает с функцией распределения случайной величины
, распределение которой задается таблицей
.
Эмпирическая функция распределения стремится с увеличением числа опытов к функции распределения генеральной совокупности
.
Теперь перейдем непосредственно к рассмотрению критерия Колмогорова. Основной гипотезой
здесь, как и в критерии Пирсона, является предположение, что функцией распределения генеральной совокупности является заданная функция распределения
, только здесь на
накладывается требование непрерывности. Альтернативная гипотеза
состоит в том, что
. Для проверки данной гипотезы проводится эксперимент, результатом которого является выборка
объема
и вычисляется
. Критерий Колмогорова опирается на следующую теорему, которую мы сформулируем без доказательства.
Теорема Колмогорова. Если верно равенство
и
- непрерывна, то для любого
справедливо соотношение
, где
- функция Колмогорова, определяемая равенством
.
Проверка гипотезы по критерию Колмогорова производится следующим образом. Задается уровень значимости
и по таблицам критерия Колмогорова находится число
, удовлетворяющее условию
. Затем проводят опыт, получают выборку
и вычисляют
и
. Если выполняется неравенство
, то гипотеза
отвергается на уровне значимости
(так как произошло событие, маловероятное при верной гипотезе
). Если же справедливо соотношение
, то гипотеза
не отвергается на уровне значимости
.
Замечание. Если верна гипотеза
и
, то верно равенство
с вероятностью 1, и, следовательно,
с вероятностью 1. Таким образом, с вероятностью 1 в данном случае
. Это означает, что при любом уровне значимости мощность критерия Колмогорова стремится к 1, когда объем выборки неограниченно увеличивается.
Критерий Смирнова. В данном случае имеются две независимые генеральные совокупности
и
. Основная гипотеза
состоит в том, что
; альтернативная гипотеза
состоит в том, что
. Предполагается что
и
непрерывны. Для проверки гипотезы в результате эксперимента получают выборку
объема
из первой генеральной совокупности и выборку
объема
из второй генеральной совокупности. Затем вычисляют
и
и определяют
равенством
. Критерий Смирнова основан на следующей теореме, которую мы сформулируем без доказательства.
Теорема Смирнова. Если
,
- непрерывна и выполняется равенство
,
, то при всех
справедливо соотношение
, где
- функция Колмогорова.
Проверка гипотезы по критерию Смирнова осуществляется следующим образом. Задается уровень значимости
и по таблицам распределения Колмогорова находится такое число
, для которого выполняется равенство
. Затем проводится опыт, получаются выборки
и
и вычисляется
. Если справедливо соотношение
, то гипотеза
отвергается на уровне значимости
. Если же справедливо соотношение
, то гипотеза
не отвергается на уровне значимости
.
Замечание. При неограниченном возрастании объема выборок мощность критерия Смирнова стремится к 1.
Контрольные вопросы
1) Как определяется доверительный интервал для неизвестного параметра?
2) Как строится доверительный интервал для параметра
, если генеральная совокупность
имеет нормальное распределение
?
3) Чему равна длина доверительного интервала для параметра
, если генеральная совокупность
имеет нормальное распределение
?
4) Как строится доверительный интервал для параметра
, если генеральная совокупность
имеет распределение
?
5) Как строится доверительный интервал для параметра
, если генеральная совокупность
имеет нормальное распределение
?
6) Как строится доверительный интервал для параметра
, если генеральная совокупность
имеет распределение
?
7) Можно ли доверительный интервал, построенный для
при ξ ~
использовать для оценивания
при ξ ~
? Почему?
8) Можно ли доверительный интервал, построенный для
при ξ ~
использовать для оценивания
при ξ ~
? Почему?
9) Какому условию должно удовлетворять критическое множество
, построенное для проверки основной гипотезы
для уровня значимости
?
10) Как определяется и интерпретируется ошибка первого рода?
11) Как определяется и интерпретируется ошибка второго рода?
12) Как определяется и интерпретируется мощность критерия?
13) Какое распределение используется для нахождения «порогов»
,
в критерии знаков?
14) Как строится
в критерии Пирсона?
15) Какое распределение используется для нахождения «порога»
в критерии Пирсона?
16) Как определяется эмпирическая функция распределения?
17) Как строится
в критерии Колмогорова?
18) Какое распределение используется для нахождения «порога»
в критерии Колмогорова?
19) Как строится
в критерии Смирнова?
20) Какое распределение используется для нахождения «порога»
в критерии Смирнова?