Два вида ошибок статистического вывода.Введем дополнительные термины. Наиболее важное - значимость эксперимента или его результатов. Пример: Испытание образцов стали марки A (20шт) и марки B (20шт) Вариант 1 Сталь А – разрушение при Р = 4200 ± 350 кг / см2; Сталь B – разрушение при Р = 5600 ± 350 кг / см2 сталь B имеет более высокую прочность – результат высокозначимый.
Вариант 2 Сталь B - Р = 4430 ± 350 кг / см2 - есть сомнения и с татический метод проверки необходим.
Ошибки статического вывода. Ошибка первого рода: Исследователь приписывает наблюдаемым различиям некоторый реальный эффект, а в действительности никакого эффекта нет. Пример: Принимаем решение: Сталь марки B (вар 2) прочнее стали А – приступить к закупкам. Последующие проверки на более крупных партиях – разницы нет. Ошибка второго рода: Игнорирование реального эффекта или различия, которое в действительности присутствует. Пример: Условия те же. Принимаем решение, что различие между марками стали А и В не является значимым и запускаем в производство. Последующие проверки показывают, что сталь марки В несомненно прочнее и допущена ошибка второго рода. Проверка значимости с помощью χ2 критерия (критерий Пирсона). Некоторые эксперименты могут давать различные результаты в зависимости от дня недели, смены, разных мест, разных исполнителей. Испытания такого рода можно проверять на значимость с помощью χ2 критерия. (1) где: N – наблюдаемое число событий (отказов и т.д.); о - объекта; E – математическое ожидание этого события. Когда мы говорим о математическом ожидании, то вводим гипотезу, которая может быть истинная и ложная. При любом – табличном или графическом – представлении распределении χ2 необходимо знать число степеней свободы, связанных с экспериментом. Число степеней свободы – это число независимых групп наблюдающих, охватываемых гипотезой. Пример: Приобретение маломощных двигателей на фирмах А и B (поровну).Через время Т вышли из cтроя FA и FB. Общее число постоянно и равно FA + FB. Проверим гипотезу: Число отказавших двигателей обеих фирм одинаково? Решение: Ожидаемой число FA можно принять равным FA = (E1) и FB = ( E2 ). Поскольку имеем одну группу наблюдений, то имеем одну степень свободы. Выражение (1)принимает вид: (2) Пример: Эксперимент по хронометрированию. 3 группы. Первая группа снимает половину всех данных и делает N1 ошибок:; вторая группа 1/3 данных и N 2 ошибок; третья группа – 1/6 данных – N3 ошибок, Всего ошибок: N= N1 + N2 + N3 Проверим гипотезу: Группы не отличаются по допускаемым ошибкам? Решение: Если гипотеза верна, то ожидаемые числа ошибок: первая группа – N / 2; вторая - N /3; третья - N /6. Число степеней свободы равно 2, т.к. сумма двух значений не позволяет выбирать третье. Тогда Зная две важные величины – число степеней свободы и χ2- критерий можно с помощью графика (или таблиц) найти вероятность того, что значение χ2 не меньше найденного (или уровень значимости). Если вероятность равна, например от 10%...30%, то это означает, что данные, полученные в результате эксперимента и данные, основанные на гипотезе не принадлежат к различным совокупностям (данная гипотеза приемлема). Если вероятность равна 5% - то возникает сомнение в справедливости сформулированной гипотезы и полученные данные могут не соответствовать гипотетическому распределению не менее, чем в 1 случае из 20. Если вероятность (уровень значимости) равен 1% - это событие возможно лишь в одном случае из 100. Чаще всего при анализе эксперимента пытаются опровергнуть сформулированную гипотезу. Критерий χ2 весьма чувствителен к объему выборки. Минимальное ожидаемое число событий одного рода равно 5, если меньше, то χ2 -критерий использовать нельзя. Так, если (А + В) меньше 10, то критерий использовать нельзя. Для вычисления критерия χ2 необходимо знать фактические числа, а не % и только целые.
Проверка значимости с помощью критерия t Cтьюдента позволяет использовать проценты и дробные числа и сравнить средние значения и используется для проверки гипотез различного рода. Наибольшее применение в инженерной практике для проверки гипотезы: средние двух выборок относятся к одной и той же совокупности? При проверке различия между двумя средними значениями формула для критерия t имеет вид: (3) где: - среднее для выборки А, равное ; - среднее для выборки B, равное , где nа и nb – объемы выборок А и В; Sсум – среднеквадратическое отклонение для обеих выборок, рассматриваемых совместно и полученное по формуле (4), которую можно сравнить с SI. Число степеней свободы для данной гипотезы определяется по формуле: п1 + п2 - 2 (в нашем случае па+ пb –2).
Рис. 12. График соотношения критерия t и числа степеней свободы для различных значений
|