Студопедия — Статистическая проверка гипотез о свойствах эксперимента
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Статистическая проверка гипотез о свойствах эксперимента






С целью повышения достоверности полученных в результате эксперимента значений функции отклика, проводят ряд параллельных опытов, число n которых опре­деляет сам исследователь, исходя из конкретных условий проведе­ния эксперимента, характера исследуемого объекта и выбранного плана эксперимента. Однако при проведении параллельных опы­тов исследователь должен быть уверен в воспроизводимости экс­перимента, т. е. в том, что все полученные в n опытах значения функции отклика у 11, у 12,..., у 1 n , являются результатом случайного рассеяния, а не результатом доминирующего действия какого-либо неконтролируемого и неуправляемого воздействия, которое может возникнуть при проведении опыта. Если при проведении экспе­римента отсутствует такое доминирующее воздействие, то при возрастании числа параллельных опытов распределение экспериментальных значений функции отклика будет подчиняться закону Гаусса (нормальному закону).

Соответствие экспериментального распределения случайной ве­личины предполагаемому теоретическому закону распределения можно оценить с помощью критерия Пирсона.

Критерий Пирсона и его применение в общем виде для оценки соответствия экспериментального распределения предполагаемому теоретическому можно проиллюстрировать на следующем примере.

Предположим, что имеется статистический ряд наблюдений над случайной величиной x. Требуется проверить, согласуются ли экс­периментальные данные с гипотезой о том, что случайная величина имеет предполагаемый теоретический закон распределения.

Первоначально статистический ряд разбивают на k интервалов и подсчитывают число значений случайной величины Y в каждом интервале. В результате получают экспериментальный ряд частот

Следует сразу оговорить, что предпосылкой применения крите­рия χ2 является достаточная заполненность интервалов. На прак­тике рекомендуется иметь в каждом интервале не менее 5... 10 на­блюдений. Если число наблюдений в отдельных интервалах мало, имеет смысл объединить эти интервалы.

Исходя из предполагаемого теоретического закона распределе­ния вычисляют частоты mi в тех самых интервалах, на которые разбит статистический ряд. В результате получают теоретический ряд частот в k интервалах: .

Для проверки согласованности теоретического и эксперимен­тального распределений подсчитывают меру расхождения

или

и число степеней свободы ν. Число степеней свободы в этом случае равно числу интервалов и минус число ограничений f

ν = k – f

Число ограничений равно числу параметров в рассматривае­мом законе распределения, увеличенному на единицу. Например, для гауссовского закона имеются два параметра [ М (х) и σ]; в этом случае число ограничений равно трем, а экспоненциальный закон характеризуется одним параметром λ, т. е. число ограничений для него равно двум.

Для распределения χ2 составлены специальные таблицы (см. табл. 2. Приложения). Пользуясь этими таблицами, можно для каждого значения χ2 и числа степеней свободы ν, являющихся входами, определить вероятность P того, что за счет чисто случайных при­чин мера расхождения теоретического и экспериментального рас­пределения будет меньше, чем фактически наблюдаемое в данной серии опытов значение χ2. Если эта вероятность Р мала (настолько, что событие с такой вероятностью можно считать прак­тически невозможным), то результат опыта следует считать про­тиворечащим гипотезе о том, что закон распределения величины Y является гауссовским. Эту гипотезу следует отбросить, как неправ­доподобную.

Напротив, если вероятность Р сравнительно велика, можно при­знать расхождение между теоретическим и экспериментальным распределениями несущественным и отнести его за счет случайных причин. Гипотезу о том, что величина Y распределена по нормаль­ному закону, можно считать в этом случае правдоподобной, по крайней мере не противоречащей экспериментальным данным.

В табл. 2. Приложения входами являются значение χ2 и число степеней свободы ν. Числа, стоящие в таблице, представляют соот­ветствующие значения Р.

Насколько мала должна быть вероятность Р для того, чтобы отбросить или пересмотреть гипотезу, – вопрос неопределенный. Он не может быть решен из математических соображений, а дол­жен базироваться на априорных сведениях о физической сущности изучаемого процесса.

Аномальность крайних значений ранжированного ряда случай­ных величин можно проверить с помощью критерия Диксона.

Критерии Диксона позволяет оценить принадлежность случай­ной величины к рассматриваемой генеральной совокупности слу­чайных величин. Для этого необходимо расположить все экспери­ментальные значения (включая и те, которые вызывают подозре­ние исследователя) в ранжированный (возрастающий или убы­вающий) ряд. Затем вычисляется один из коэффициентов Диксона, приведенных в табл. 5, в зависимости от числа случайных вели­чин в ранжированном ряде и от того, проверяется ли наибольшее или наименьшее экстремальное значение.

Таблица 5.
Число наблюдений Обозначение коэффициента Диксона Для наименьшего экстремального значения Для наибольшего экстремального значения
3 … 7 r 10
8 … 10 r 11
11 … 13 r 21
14 … 30 r 22
3 …10 (для двух точек и более) r 20

 

Полученный коэффициент Диксона сравнивают с его табличным значением, учитывающим экстремальное значение при заданных значениях коэффициента риска (см. табл. 3. Приложения). Если расчетный коэффициент для экстремального значения меньше таб­личного, то проверяемое значение случайной величины не отли­чается от ожидаемого его значения, расположенного в гауссовском распределении случайных величин их генеральной совокупности. Следовательно, подозреваемое значение функции отклика факти­чески не является аномальным, как это могло показаться исследо­вателю с первого взгляда. Причем, достоверность вывода может быть сделана исследователем с различным уровнем риска. Так, для выбранного значения коэффициента риска β=0,1, исследова­тель рискует ошибиться в сделанных на основании этой таблицы выводах один раз из десяти, а при β=0,005 – в пяти из тысячи.

Рассмотренный подход к оценке аномальности эксперименталь­ного значения случайной величины справедлив только при рассмот­рении одного экстремального одностороннего значения. При одновременном наличии наибольшего и наименьшего экстремальных значений в исследуемом ранжируемом ряду считается, что одностороннее экстремальное значение одно.

Все указанные коэффициенты могут быть повторно использо­ваны для одного и того же ранжированного ряда эксперименталь­ных значений, с целью проверки оставшихся «подозрительных» значений случайной величины, после устранения предыдущих.

Таким образом, прежде чем на основании данных, полученных в параллельных опытах, подсчитывать среднее значение функции отклика, следует в любом случае проверить их крайние значе­ния по критерию Диксона. Однако, как можно было убедиться, применение критерия Диксона имеет практический смысл только при большом числе параллельных опытов (m >3). Поэтому на практике, для проверки однородности дисперсии полученных экс­периментальных значений чаще используют критерий Кохрена.

Критерии Кохрена. Этот критерий применяется для оценки од­нородности дисперсий только при равном числе повторов каждого эксперимента, что и имеет место при применении методов стати­стического планирования и проведения эксперимента.

Для применения критерия Кохрена рассчитывается дисперсия экспериментальных значений функции отклика в каждой строке матрицы планирования эксперимента. В результате полу­чается ряд значений выборочных дисперсий . Очевидно, что недоверие будут вызывать именно наи­большие их значения.

Далее подсчитывается параметр

при j =1... N, т. е. вычисляют отношение максимального значения изменчивости среди N опытов к сумме изменчивостей во всех N опытах.

Найденное наибольшее экспериментальное значение G сравнивают с критичным его значением G кр.

Критичное значение G кр представляет собою максимально воз­можное значение параметра G, при котором гипотеза о воспро­изводимости эксперимента еще может считаться справедливой. В этом случае максимальная изменчивость функции отклика, полу­ченная в результате проведения m параллельных опытов, не отли­чается от ожидаемой среди N опытов. Поэтому, если GG кр, то «подозрительное» максимальное значение изменчивости не яв­ляется «инородным», а представляет собою результат случайного рассеяния исследуемой функции отклика, т. е. эксперимент воспро­изводим. В противном случае, когда G > G кр—эксперимент не вос­производим, и необходимо повторить его в анализируемой экспе­риментальной точке, добившись воспроизводимости, т. е. выполне­ния G крG.

Критичное значение отношения рассматриваемой изменчивости к сумме всех изменчивостей находят из таблицы критических значений критерия Кохрена для гауссовского закона распреде­ления значений функции отклика в генеральной их совокупности (см. табл. 4. Приложения).

Задаваясь определенным значением коэффициента риска β (обычно задаются β =0,10; 0,05; 0,01), G кр определяют в столбце, соответствующем числу параллельных опытов (n) и строке, соот­ветствующей числу опытов (N).

Критерий Фишера (F -критерий). При анализе результатов экс­перимента требуется не только уточнить вопрос о воспроизводи­мости эксперимента, оценивая однородность изменчивости и, в част­ности, дисперсии в различных опытах в ходе его проведения, но и оценить различие значений дисперсий для одной и той же слу­чайной величины. Если эти различия являются случайными, то гипотеза о фактическом равенстве, этих дисперсий является спра­ведливой. В этом случае изменчивость, например, эксперимен­тально полученных значений функции отклика, является ожидае­мой для рассматриваемой генеральной совокупности их распреде­ления.

При гауссовском законе распределения случайной величины для проверки гипотезы о равенстве двух дисперсий одной и той же случайной величины, в качестве критерия значимости исполь­зуется F -параметр, который равен отношению двух рассматриваемых выборочных дисперсий s 1 и s 2, имеющих соответственно сте­пени свободы ν1 и ν2, т. е.

Числом степеней свободы –называют разность между числом экспериментов и числом значений независимых случайных величин, полученных в результате этих экспериментов, которые не позволяют оцениваемой в результате этих экспериментов величине принимать какое-либо другое значение, отличное от полученного по окончании их проведения.

При расчете F -параметра должно выполняться усло­вие s 1> s 2. В противном случае следует поменять местами рас­сматриваемые дисперсии.

Найденное экспериментальное значение F -параметра сравни­вается с его критическим значением F кр, соответствующим макси­мальному значению отношением двух дисперсий, при котором еще можно считать гипотезу о равенстве рассматриваемых дисперсий справедливой.

Критичное значение F кр по числу степеней свободы и заданному коэффициенту риска находится из табл. 5. Приложения. Значение числа степеней свободы ν1 дисперсии, стоящей в числителе, определяет значение F кр по столбцу, а значение ν2 – по строке. Если FF кр, то гипотеза о равенстве выборочных дис­персий принимается. В противном случае, рассматриваемые диспер­сии относятся к различным генеральным совокупностям исследуе­мой случайной величины.

Критерий Стьюдента (t -критерий). Для проверки гипотезы о ра­венстве двух выборочных средних значений случайной величины, имеющей гауссовский закон распределения, используется крите­рий Стьюдента. Для применения данного критерия подсчитывают выборочные средние арифметические значения случайной вели­чины х 1 и х 2, соответственно для выборок n 1 и n 2, и их выборочные стандартные отклонения

Далее подсчитывают величину стандартного отклонения выбороч­ных средних арифметических значений по формуле

Для случая, когда среднее выборочное сравнивается с матема­тическим ожиданием М (х) генеральной совокупности N, из кото­рой берется выборка, и при условии, что п «N, дисперсия средних подсчитывается по формуле

Если генеральная характеристика σ; неизвестна (а это наиболее часто встречающийся случай), то берется ее оценка

После того, как определены стандартные отклонения выбороч­ных средних арифметических, подсчитывают размах Стьюдента:

или

Найденное экспериментальное значение t сравнивают с критичным значением t кр, которое определяют по таблице распределения Стью­дента для заданного коэффициента риска β (см. табл. 6. Приложе­ния) и числа степеней свободы ν. Если t < t кр, то гипотеза о ра­венстве выборочных средних арифметических значений прини­мается, а это значит, что выборки взяты из одной и той же генеральной совокупности.

При малом объеме выборки (n <10) t – случайная величина и ее распределение не является гауссовским. Однако по мере уве­личения объема выборки t -распределение приближается к гауссовскому. При n >30 его можно считать практически гауссовским.

После вычисления коэффициентов имитационной модели, пред­ставленной в виде линейного полинома, оценивается их значимость для определения степени влияния раз­личных факторов на выходной параметр (функцию отклика). Осно­вой оценки значимости коэффициентов полинома является сопо­ставление абсолютного значения, например, коэффициента (ai) и дисперсии ошибки его определения s2{ ai }. В этом случае с по­мощью t -критерия проверяется гипотеза о незначимости рассмат­риваемого коэффициента, т. е. гипотеза о том, что ai = 0 (проверка нуль-гипотезы). Поэтому при подсчете экспериментального зна­чения t -параметра в числитель ставится абсо­лютное значение рассматриваемого коэффициента, а в знамена­тель — дисперсия ошибки его определения, т. е. для оценки коэф­фициентов, стоящих в линейных членах полинома, имеем

При ортогональном планировании эксперимента дисперсии оши­бок определения каждого из коэффициентов равны между собой

где N — число номеров опытов, определяющих в соответствии с матрицей планирования, условия проведения эксперимента; m — число параллельных опытов для каждого условия (номера опыта) проведения эксперимента.

Для оценки дисперсии воспроизводимости s2{ Y } можно вос­пользоваться группой выборочных дисперсий. Тогда

Коэффициент a признается незначимым, если t для числа сте­пеней свободы ν =N(m— 1) меньше t кр, найденному из табл. 6. При­ложения для заданного значения коэффициента риска β.







Дата добавления: 2015-09-06; просмотров: 1471. Нарушение авторских прав; Мы поможем в написании вашей работы!



Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Медицинская документация родильного дома Учетные формы родильного дома № 111/у Индивидуальная карта беременной и родильницы № 113/у Обменная карта родильного дома...

Основные разделы работы участкового врача-педиатра Ведущей фигурой в организации внебольничной помощи детям является участковый врач-педиатр детской городской поликлиники...

Ученые, внесшие большой вклад в развитие науки биологии Краткая история развития биологии. Чарльз Дарвин (1809 -1882)- основной труд « О происхождении видов путем естественного отбора или Сохранение благоприятствующих пород в борьбе за жизнь»...

Механизм действия гормонов а) Цитозольный механизм действия гормонов. По цитозольному механизму действуют гормоны 1 группы...

Алгоритм выполнения манипуляции Приемы наружного акушерского исследования. Приемы Леопольда – Левицкого. Цель...

ИГРЫ НА ТАКТИЛЬНОЕ ВЗАИМОДЕЙСТВИЕ Методические рекомендации по проведению игр на тактильное взаимодействие...

Studopedia.info - Студопедия - 2014-2024 год . (0.013 сек.) русская версия | украинская версия