ТЕМА 9. Критерии Пирсона, Смирнова, Колмогорова
В прошлой теме были введены основные понятия теории проверки гипотез и рассмотрен критерий знаков проверки однородности генеральных совокупностей. Сейчас мы рассмотрим еще несколько критериев, а именно критерии Пирсона, Смирнова и Колмогорова. Критерий Пирсона (критерий хи-квадрат). Пусть имеется генеральная совокупность , распределение которой неизвестно. Относительно распределения данной генеральной совокупности выдвигаются две гипотезы: основная и альтернативная . Основная гипотеза состоит в том, что распределение задается данной функцией распределения F, то есть . Альтернативная гипотеза состоит в том, что . Для проверки данной гипотезы множество R разбивают на l непересекающихся отрезков . Для единообразия обозначим , . Подсчитаем вероятности попаданий значений случайной величины в отрезок , при верной гипотезе . Имеем, , . Затем проведем эксперимент, получим в результате данного эксперимента выборку и подсчитаем частоты попаданий выборочных значений в интервал , . Эти частоты вычисляются по формуле , где - количество попаданий выборочных значений в интервал , . При верной гипотезе частоты должны быть «близки» к вероятностям . Для оценки меры этой близости построим величину . Если положить , , то получим: . Выбор именно таких значений , , объясняется следующей теоремой, которую мы примем без доказательства. Теорема Пирсона. Если верна гипотеза и объем выборки стремится к , то распределение сходится к хи-квадрат с числом степеней свободы (). Проверка гипотезы по критерию Пирсона производится следующим образом. Строятся интервалы , и вычисляются теоретические вероятности попадания значений случайной величины в данные интервалы. Задается уровень значимости и по таблицам распределения находится такое число , для которого выполняется неравенство . Затем проводится опыт, получают выборку и вычисляют , и . Если выполняется неравенство , то гипотеза отвергается на уровне значимости (так как произошло событие, вероятность которого при верной гипотезе очень мала). Если же справедливо соотношение , то гипотеза не отвергается на уровне значимости (но может быть отвергнута на некотором другом уровне значимости). Критерий Колмогорова. Перед рассмотрением данного критерия нам понадобится ввести следующее определение. Определение. Пусть - выборка объема из генеральной совокупности . Эмпирическая функция распределения обозначается и равна отношению - количества выборочных значений, меньших , к объему выборки, то есть . Замечание. Эмпирическая функция распределения совпадает с функцией распределения случайной величины , распределение которой задается таблицей . Эмпирическая функция распределения стремится с увеличением числа опытов к функции распределения генеральной совокупности . Теперь перейдем непосредственно к рассмотрению критерия Колмогорова. Основной гипотезой здесь, как и в критерии Пирсона, является предположение, что функцией распределения генеральной совокупности является заданная функция распределения , только здесь на накладывается требование непрерывности. Альтернативная гипотеза состоит в том, что . Для проверки данной гипотезы проводится эксперимент, результатом которого является выборка объема и вычисляется . Критерий Колмогорова опирается на следующую теорему, которую мы сформулируем без доказательства. Теорема Колмогорова. Если верно равенство и - непрерывна, то для любого справедливо соотношение , где - функция Колмогорова, определяемая равенством . Проверка гипотезы по критерию Колмогорова производится следующим образом. Задается уровень значимости и по таблицам критерия Колмогорова находится число , удовлетворяющее условию . Затем проводят опыт, получают выборку и вычисляют и . Если выполняется неравенство , то гипотеза отвергается на уровне значимости (так как произошло событие, маловероятное при верной гипотезе ). Если же справедливо соотношение , то гипотеза не отвергается на уровне значимости . Замечание. Если верна гипотеза и , то верно равенство с вероятностью 1, и, следовательно, с вероятностью 1. Таким образом, с вероятностью 1 в данном случае . Это означает, что при любом уровне значимости мощность критерия Колмогорова стремится к 1, когда объем выборки неограниченно увеличивается. Критерий Смирнова. В данном случае имеются две независимые генеральные совокупности и . Основная гипотеза состоит в том, что ; альтернативная гипотеза состоит в том, что . Предполагается что и непрерывны. Для проверки гипотезы в результате эксперимента получают выборку объема из первой генеральной совокупности и выборку объема из второй генеральной совокупности. Затем вычисляют и и определяют равенством . Критерий Смирнова основан на следующей теореме, которую мы сформулируем без доказательства. Теорема Смирнова. Если , - непрерывна и выполняется равенство , , то при всех справедливо соотношение , где - функция Колмогорова. Проверка гипотезы по критерию Смирнова осуществляется следующим образом. Задается уровень значимости и по таблицам распределения Колмогорова находится такое число , для которого выполняется равенство . Затем проводится опыт, получаются выборки и и вычисляется . Если справедливо соотношение , то гипотеза отвергается на уровне значимости . Если же справедливо соотношение , то гипотеза не отвергается на уровне значимости . Замечание. При неограниченном возрастании объема выборок мощность критерия Смирнова стремится к 1. Контрольные вопросы 1) Как определяется доверительный интервал для неизвестного параметра? 2) Как строится доверительный интервал для параметра , если генеральная совокупность имеет нормальное распределение ? 3) Чему равна длина доверительного интервала для параметра , если генеральная совокупность имеет нормальное распределение ? 4) Как строится доверительный интервал для параметра , если генеральная совокупность имеет распределение ? 5) Как строится доверительный интервал для параметра , если генеральная совокупность имеет нормальное распределение ? 6) Как строится доверительный интервал для параметра , если генеральная совокупность имеет распределение ? 7) Можно ли доверительный интервал, построенный для при ξ ~ использовать для оценивания при ξ ~ ? Почему? 8) Можно ли доверительный интервал, построенный для при ξ ~ использовать для оценивания при ξ ~ ? Почему? 9) Какому условию должно удовлетворять критическое множество , построенное для проверки основной гипотезы для уровня значимости ? 10) Как определяется и интерпретируется ошибка первого рода? 11) Как определяется и интерпретируется ошибка второго рода? 12) Как определяется и интерпретируется мощность критерия? 13) Какое распределение используется для нахождения «порогов» , в критерии знаков? 14) Как строится в критерии Пирсона? 15) Какое распределение используется для нахождения «порога» в критерии Пирсона? 16) Как определяется эмпирическая функция распределения? 17) Как строится в критерии Колмогорова? 18) Какое распределение используется для нахождения «порога» в критерии Колмогорова? 19) Как строится в критерии Смирнова? 20) Какое распределение используется для нахождения «порога» в критерии Смирнова?
|