Упражнения. 10. Определите, лежит ли значение 19 внутри границ 95%-ного доверительного интервала выборки 2,3,5,7,4,9,6,4,9,10,4,7,19.
10. Определите, лежит ли значение 19 внутри границ 95%-ного доверительного интервала выборки 2,3,5,7,4,9,6,4,9,10,4,7,19. 11. Определите с уровнем значимости a = 0,05 максимальное отклонение среднего значения генеральной совокупности от среднего выборки 3,4,4,2, 5,3,4,3,5,4,3, 5,6. 12. Найдите соответствие экспериментальных данных нормальному закону распределения для следующей выборки весов детей (кг): 21, 21, 22, 22, 22, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 24, 24, 24, 24, 24, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 27, 27.
Анализ двух выборок Выявление достоверности различий. Следующей задачей статистического анализа, решаемой после определения основных выборочных характеристик и анализа одной выборки, является совместный анализ нескольких выборок. Важнейшим вопросом, возникающим при анализе двух выборок, является вопрос о наличии различий между этими выборками. Обычно для этого проводят проверку статистических гипотез о принадлежности обеих выборок одной генеральной совокупности или о равенстве генеральных средних. Рассмотрим постановки таких задач на примере 4.4. Пример 4.4. Рассматриваются ежемесячный выход годной продукции в технологическом процессе производства пленочных датчиков за периоды до и после проведения мероприятий по повышению технологической дисциплины: систематические санитарные уборки помещений, установка фильтров приточно-вытяжной вентиляции и т.д.). В таблице 4.1 приведены данные выхода годных по месяцам. Таблица 4.1
В данном примере такие различия могут выявляются путем сравнения данных выхода годных за периоды до и после проведения мероприятий по повышению технологической дисциплины. Если сопоставить средние значения выхода годных за месяц до (12,56) и после (14,57) проведения мероприятий, видно, что они различаются. Можно ли по этим данным сделать вывод об эффективности мероприятий по повышению технологической дисциплины? Для решения задач такого типа используются так называемые критерии различия. Для проверки одной и той же гипотезы могут быть использованы разные статистические критерии. Правильный выбор критерия определяется как спецификой данных и проверяемых гипотез, так и уровнем статистической подготовки исследователя.
4. Параметрические, критерии. Параметрические критерии служат для проверки гипотез о положении и рассеивании. Из параметрических критериев наибольшей популярностью при проверке гипотез о равенстве генеральных средних (математических ожиданий) пользуется -критерий Стьюдента (-критерий различия).
4.1. Критерий Стьюдента (t) наиболее часто используется для проверки гипотезы: «Средние двух выборок относятся к одной и той же совокупности». Критерий позволяет найти вероятность того, что оба средних относятся к одной и той же совокупности. Если эта вероятность р ниже уровня значимости (р < 0,05), то принято считать, что выборки относятся к двум разным совокупностям. При использовании t-критерия можно выделить два случая. В первом случае его применяют для проверки гипотезы о равенстве генеральных средних двух независимых, несвязанных выборок (так называемый двухвыборочный t-критерий). В этом случае есть контрольная группа и опытная группа, состоящие, например, из разных пациентов, количество которых в группах может быть различно. Во втором случае, когда одна и та же группа объектов порождает числовой материал для проверки гипотез о средних, используется так называемый парный -критерий. Выборки при этом называют зависимыми, связанными. Например, измеряется сопротивление резистивных элементов в процессе выходного контроля, а затем измеряется сопротивление у тех же самых резистивных элементов после проведения термообработки. В обоих случаях в принципе должно выполняться требование нормальности распределения исследуемого признака в каждой из сравниваемых групп и равенства дисперсий в сравниваемых совокупностях. Однако на практике по большому счету корректное применение t -критерия Стьюдента для двух групп часто бывает затруднительно, поскольку достоверно проверить эти условия удается далеко не всегда. Для оценки достоверности отличий по критерию Стьюдента принимается нулевая гипотеза, что средние выборок равны между собой. Затем вычисляется значение вероятности того, что изучаемые события произошли случайным образом. В MS Excel для оценки достоверности отличий по критерию Стьюдента используются специальная функция ТТЕСТ и процедуры Пакета анализа. Все перечисленные инструменты вычисляют вероятность, соответствующую критерию Стьюдента, и используются, чтобы определить, насколько вероятно, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же среднее. Функция ТТЕСТ использует следующие параметры: ТТЕСТ (массив1; массив2; хвосты; тип). Здесь: * массив 1 — это первое множество данных; * массив 2 — это второе множество данных; * хвосты — число хвостов распределения. Обычно число хвостов равно 2; * тип — это вид исполняемого -теста. Возможны 3 варианта выбора: 1 — парный тест, 2 — двухвыборочный тест с равными дисперсиями, 3 — двухвыборочный тест с неравными дисперсиями.
|