Статистическая проверка гипотез о свойствах эксперимента
С целью повышения достоверности полученных в результате эксперимента значений функции отклика, проводят ряд параллельных опытов, число n которых определяет сам исследователь, исходя из конкретных условий проведения эксперимента, характера исследуемого объекта и выбранного плана эксперимента. Однако при проведении параллельных опытов исследователь должен быть уверен в воспроизводимости эксперимента, т. е. в том, что все полученные в n опытах значения функции отклика у 11, у 12,..., у 1 n , являются результатом случайного рассеяния, а не результатом доминирующего действия какого-либо неконтролируемого и неуправляемого воздействия, которое может возникнуть при проведении опыта. Если при проведении эксперимента отсутствует такое доминирующее воздействие, то при возрастании числа параллельных опытов распределение экспериментальных значений функции отклика будет подчиняться закону Гаусса (нормальному закону). Соответствие экспериментального распределения случайной величины предполагаемому теоретическому закону распределения можно оценить с помощью критерия Пирсона. Критерий Пирсона и его применение в общем виде для оценки соответствия экспериментального распределения предполагаемому теоретическому можно проиллюстрировать на следующем примере. Предположим, что имеется статистический ряд наблюдений над случайной величиной x. Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина имеет предполагаемый теоретический закон распределения. Первоначально статистический ряд разбивают на k интервалов и подсчитывают число значений случайной величины Y в каждом интервале. В результате получают экспериментальный ряд частот Следует сразу оговорить, что предпосылкой применения критерия χ2 является достаточная заполненность интервалов. На практике рекомендуется иметь в каждом интервале не менее 5... 10 наблюдений. Если число наблюдений в отдельных интервалах мало, имеет смысл объединить эти интервалы. Исходя из предполагаемого теоретического закона распределения вычисляют частоты mi в тех самых интервалах, на которые разбит статистический ряд. В результате получают теоретический ряд частот в k интервалах: Для проверки согласованности теоретического и экспериментального распределений подсчитывают меру расхождения или и число степеней свободы ν. Число степеней свободы в этом случае равно числу интервалов и минус число ограничений f ν = k – f Число ограничений равно числу параметров в рассматриваемом законе распределения, увеличенному на единицу. Например, для гауссовского закона имеются два параметра [ М (х) и σ]; в этом случае число ограничений равно трем, а экспоненциальный закон характеризуется одним параметром λ, т. е. число ограничений для него равно двум. Для распределения χ2 составлены специальные таблицы (см. табл. 2. Приложения). Пользуясь этими таблицами, можно для каждого значения χ2 и числа степеней свободы ν, являющихся входами, определить вероятность P того, что за счет чисто случайных причин мера расхождения теоретического и экспериментального распределения будет меньше, чем фактически наблюдаемое в данной серии опытов значение χ2. Если эта вероятность Р мала (настолько, что событие с такой вероятностью можно считать практически невозможным), то результат опыта следует считать противоречащим гипотезе о том, что закон распределения величины Y является гауссовским. Эту гипотезу следует отбросить, как неправдоподобную. Напротив, если вероятность Р сравнительно велика, можно признать расхождение между теоретическим и экспериментальным распределениями несущественным и отнести его за счет случайных причин. Гипотезу о том, что величина Y распределена по нормальному закону, можно считать в этом случае правдоподобной, по крайней мере не противоречащей экспериментальным данным. В табл. 2. Приложения входами являются значение χ2 и число степеней свободы ν. Числа, стоящие в таблице, представляют соответствующие значения Р. Насколько мала должна быть вероятность Р для того, чтобы отбросить или пересмотреть гипотезу, – вопрос неопределенный. Он не может быть решен из математических соображений, а должен базироваться на априорных сведениях о физической сущности изучаемого процесса. Аномальность крайних значений ранжированного ряда случайных величин можно проверить с помощью критерия Диксона. Критерии Диксона позволяет оценить принадлежность случайной величины к рассматриваемой генеральной совокупности случайных величин. Для этого необходимо расположить все экспериментальные значения (включая и те, которые вызывают подозрение исследователя) в ранжированный (возрастающий или убывающий) ряд. Затем вычисляется один из коэффициентов Диксона, приведенных в табл. 5, в зависимости от числа случайных величин в ранжированном ряде и от того, проверяется ли наибольшее или наименьшее экстремальное значение.
Полученный коэффициент Диксона сравнивают с его табличным значением, учитывающим экстремальное значение при заданных значениях коэффициента риска (см. табл. 3. Приложения). Если расчетный коэффициент для экстремального значения меньше табличного, то проверяемое значение случайной величины не отличается от ожидаемого его значения, расположенного в гауссовском распределении случайных величин их генеральной совокупности. Следовательно, подозреваемое значение функции отклика фактически не является аномальным, как это могло показаться исследователю с первого взгляда. Причем, достоверность вывода может быть сделана исследователем с различным уровнем риска. Так, для выбранного значения коэффициента риска β=0,1, исследователь рискует ошибиться в сделанных на основании этой таблицы выводах один раз из десяти, а при β=0,005 – в пяти из тысячи. Рассмотренный подход к оценке аномальности экспериментального значения случайной величины справедлив только при рассмотрении одного экстремального одностороннего значения. При одновременном наличии наибольшего и наименьшего экстремальных значений в исследуемом ранжируемом ряду считается, что одностороннее экстремальное значение одно. Все указанные коэффициенты могут быть повторно использованы для одного и того же ранжированного ряда экспериментальных значений, с целью проверки оставшихся «подозрительных» значений случайной величины, после устранения предыдущих. Таким образом, прежде чем на основании данных, полученных в параллельных опытах, подсчитывать среднее значение функции отклика, следует в любом случае проверить их крайние значения по критерию Диксона. Однако, как можно было убедиться, применение критерия Диксона имеет практический смысл только при большом числе параллельных опытов (m >3). Поэтому на практике, для проверки однородности дисперсии полученных экспериментальных значений чаще используют критерий Кохрена. Критерии Кохрена. Этот критерий применяется для оценки однородности дисперсий только при равном числе повторов каждого эксперимента, что и имеет место при применении методов статистического планирования и проведения эксперимента. Для применения критерия Кохрена рассчитывается дисперсия экспериментальных значений функции отклика в каждой строке матрицы планирования эксперимента. В результате получается ряд значений выборочных дисперсий Далее подсчитывается параметр при j =1... N, т. е. вычисляют отношение максимального значения изменчивости среди N опытов к сумме изменчивостей во всех N опытах. Найденное наибольшее экспериментальное значение G сравнивают с критичным его значением G кр. Критичное значение G кр представляет собою максимально возможное значение параметра G, при котором гипотеза о воспроизводимости эксперимента еще может считаться справедливой. В этом случае максимальная изменчивость функции отклика, полученная в результате проведения m параллельных опытов, не отличается от ожидаемой среди N опытов. Поэтому, если G ≤ G кр, то «подозрительное» максимальное значение изменчивости не является «инородным», а представляет собою результат случайного рассеяния исследуемой функции отклика, т. е. эксперимент воспроизводим. В противном случае, когда G > G кр—эксперимент не воспроизводим, и необходимо повторить его в анализируемой экспериментальной точке, добившись воспроизводимости, т. е. выполнения G кр≥ G. Критичное значение отношения рассматриваемой изменчивости к сумме всех изменчивостей находят из таблицы критических значений критерия Кохрена для гауссовского закона распределения значений функции отклика в генеральной их совокупности (см. табл. 4. Приложения). Задаваясь определенным значением коэффициента риска β (обычно задаются β =0,10; 0,05; 0,01), G кр определяют в столбце, соответствующем числу параллельных опытов (n) и строке, соответствующей числу опытов (N). Критерий Фишера (F -критерий). При анализе результатов эксперимента требуется не только уточнить вопрос о воспроизводимости эксперимента, оценивая однородность изменчивости и, в частности, дисперсии в различных опытах в ходе его проведения, но и оценить различие значений дисперсий для одной и той же случайной величины. Если эти различия являются случайными, то гипотеза о фактическом равенстве, этих дисперсий является справедливой. В этом случае изменчивость, например, экспериментально полученных значений функции отклика, является ожидаемой для рассматриваемой генеральной совокупности их распределения. При гауссовском законе распределения случайной величины для проверки гипотезы о равенстве двух дисперсий одной и той же случайной величины, в качестве критерия значимости используется F -параметр, который равен отношению двух рассматриваемых выборочных дисперсий s 1 и s 2, имеющих соответственно степени свободы ν1 и ν2, т. е. Числом степеней свободы –называют разность между числом экспериментов и числом значений независимых случайных величин, полученных в результате этих экспериментов, которые не позволяют оцениваемой в результате этих экспериментов величине принимать какое-либо другое значение, отличное от полученного по окончании их проведения. При расчете F -параметра должно выполняться условие s 1> s 2. В противном случае следует поменять местами рассматриваемые дисперсии. Найденное экспериментальное значение F -параметра сравнивается с его критическим значением F кр, соответствующим максимальному значению отношением двух дисперсий, при котором еще можно считать гипотезу о равенстве рассматриваемых дисперсий справедливой. Критичное значение F кр по числу степеней свободы и заданному коэффициенту риска находится из табл. 5. Приложения. Значение числа степеней свободы ν1 дисперсии, стоящей в числителе, определяет значение F кр по столбцу, а значение ν2 – по строке. Если F ≤ F кр, то гипотеза о равенстве выборочных дисперсий принимается. В противном случае, рассматриваемые дисперсии относятся к различным генеральным совокупностям исследуемой случайной величины. Критерий Стьюдента (t -критерий). Для проверки гипотезы о равенстве двух выборочных средних значений случайной величины, имеющей гауссовский закон распределения, используется критерий Стьюдента. Для применения данного критерия подсчитывают выборочные средние арифметические значения случайной величины х 1 и х 2, соответственно для выборок n 1 и n 2, и их выборочные стандартные отклонения Далее подсчитывают величину стандартного отклонения выборочных средних арифметических значений по формуле Для случая, когда среднее выборочное сравнивается с математическим ожиданием М (х) генеральной совокупности N, из которой берется выборка, и при условии, что п «N, дисперсия средних подсчитывается по формуле Если генеральная характеристика σ; неизвестна (а это наиболее часто встречающийся случай), то берется ее оценка После того, как определены стандартные отклонения выборочных средних арифметических, подсчитывают размах Стьюдента:
Найденное экспериментальное значение t сравнивают с критичным значением t кр, которое определяют по таблице распределения Стьюдента для заданного коэффициента риска β (см. табл. 6. Приложения) и числа степеней свободы ν. Если t < t кр, то гипотеза о равенстве выборочных средних арифметических значений принимается, а это значит, что выборки взяты из одной и той же генеральной совокупности. При малом объеме выборки (n <10) t – случайная величина и ее распределение не является гауссовским. Однако по мере увеличения объема выборки t -распределение приближается к гауссовскому. При n >30 его можно считать практически гауссовским. После вычисления коэффициентов имитационной модели, представленной в виде линейного полинома, оценивается их значимость для определения степени влияния различных факторов на выходной параметр (функцию отклика). Основой оценки значимости коэффициентов полинома является сопоставление абсолютного значения, например, коэффициента (ai) и дисперсии ошибки его определения s2{ ai }. В этом случае с помощью t -критерия проверяется гипотеза о незначимости рассматриваемого коэффициента, т. е. гипотеза о том, что ai = 0 (проверка нуль-гипотезы). Поэтому при подсчете экспериментального значения t -параметра в числитель ставится абсолютное значение рассматриваемого коэффициента, а в знаменатель — дисперсия ошибки его определения, т. е. для оценки коэффициентов, стоящих в линейных членах полинома, имеем При ортогональном планировании эксперимента дисперсии ошибок определения каждого из коэффициентов равны между собой где N — число номеров опытов, определяющих в соответствии с матрицей планирования, условия проведения эксперимента; m — число параллельных опытов для каждого условия (номера опыта) проведения эксперимента. Для оценки дисперсии воспроизводимости s2{ Y } можно воспользоваться группой выборочных дисперсий. Тогда Коэффициент a признается незначимым, если t для числа степеней свободы ν =N(m— 1) меньше t кр, найденному из табл. 6. Приложения для заданного значения коэффициента риска β.
|