Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

О.6. Параметрическая гипотеза называется сложной, если она состоит из конечного или бесконечного числа простых гипотез.





Проверка статистических гипотез осуществляется на основе данных выборки. Для этого используют специальным образом подобранную случайную величину (выборочную статистику), являющуюся функцией наблюдённых значений, точное или приближённое распределение которой известно.

О. 7.Статистическим критерием (тестом) называют случайную величину К, с помощью которой принимаются решения о принятии или отвержении выдвинутой нулевой гипотезы.

Для проверки нулевых гипотез по выборочным данным вычисляют частные значения входящих в критерий величин и, таким образом, получают частное (наблюдаемое) значение критерия.

О. 8. Проверка гипотезы с помощью статистического критерия значимости есть правило отклонения нулевой гипотезы, заключающееся в разбиении области возможных значений К на две непересекающиеся подобласти, причём нулевая гипотеза отвергается, если наблюдаемое значение критерия К принадлежит критической подобласти, и считается согласующейся с опытом, если наблюдаемое значение критерия К не принадлежит критической подобласти.

 

50.Ошибки, допускаемые при проверке статистических гипотез

Уровень значимости статистического критерия

О. 1. Ошибкой первого рода называется ошибка отклонения верной нулевой гипотезы .

О. 2. Уровнем значимости статистического критерия называется вероятность совершения ошибки первого рода.

Отклонение нулевой гипотезы при уровне значимости означает, что, отклоняя эту гипотезу, мы или не ошибаемся (то есть гипотеза действительно ложная), или всё-таки совершаем ошибку первого рода, считая правильную гипотезу ложной. В последнем случае частота принятия ошибочного решения равна в среднем 5 из 100 случаев применения данного статистического критерия.

О. 3. Ошибкой второго рода называется ошибка принятия ложной гипотезы .

Вероятность совершения ошибки второго рода принято обозначать .

О. 4. Мощностью М критерия К называется вероятность несовершения ошибки второго рода (мощность критерия К - это вероятность отклонения неверной гипотезы ).

 

51. Проверка гипотезы о равенстве математических

ожиданий двух нормальных генеральных

совокупностей при известной дисперсии

Проверка гипотез о равенстве двух центров распределения имеет важное практическое значение. Действительно, иногда оказывается, что средний результат одной серии экспериментов заметно отличается от среднего результата другой серии. При этом возникает вопрос: можно ли объяснить обнаруженное расхождение средних случайными ошибками экспериментов или оно вызвано какими-либо незамеченными или даже неизвестными закономерностями.

Сформулируем задачу сравнения двух центров распределения в общем виде. Рассмотрим две случайные величины и , каждая из которых подчиняется нормальному закону распределения. Пусть имеются две независимые выборки объёмами и из генеральных совокупностей и . Необходимо проверить гипотезу , заключающуюся в том, что , относительно альтернативной гипотезы , состоящей в том, что .

Так как в рассматриваемом случае дисперсии генеральных совокупностей и известны, а о значениях математических ожиданий и ничего неизвестно, то для проверки гипотезы используем их оценки и . Как известно, выборочные средние и имеют нормальный закон распределения с параметрами и . Выборки независимы, поэтому и также независимы и случайная величина, равная разности между и , имеет нормальное распределение, причём . Если гипотеза справедлива, то , следовательно, нормированная разность подчиняется нормальному закону с математическим ожиданием, равным нулю, и дисперсией, равной единице. Выбирая вероятность из соотношения находим статистику , которая разделит множество на два непересекающихся подмножества: область допустимых значений и критическую область. Те значения , при которых , образуют область допустимых значений; значения , для которых , определяют критическую область. Иными словами, если - нет оснований отвергнуть нулевую гипотезу или при заданном уровне значимости можно считать, что , если - то нулевую гипотезу отвергаем в пользу конкурирующей или при заданном уровне значимости можно считать что математические ожидания генеральных совокупностей различны.

 

52. Сравнение выборочных средних при неизвестной

дисперсии генеральной совокупности.

Рассмотрим две случайные величины и , каждая из которых подчиняется нормальному закону распределения с математическими ожиданиями и . Условимся считать, что , числовое значение неизвестно. Пусть имеются две независимые выборки объёмами и из генеральных совокупностей и . Необходимо проверить гипотезу , заключающуюся в том, что , относительно альтернативной гипотезы , состоящей в том, что . Для оценки и используем их оценки и , а для оценки выборочные оценки: и .

Так как генеральные совокупности и имеют одинаковые дисперсии, то для оценки целесообразно использовать результаты обеих выборок. В математической статистике доказано, что лучшей оценкой для в данном случае является . В качестве выборочной оценки обычно принимают оценку . Известно, что если случайная величина подчиняется нормальному закону, то статистика

имеет - распределения Стьюдента с степенями свободы. Если гипотеза справедлива, то статистику t можно записать в виде: . Выбрав вероятность , по таблице -распределения можно определить критическое значение , для которого . Если вычисленное значение , то с надёжностью можно считать расхождение средних значимым (неслучайным).

Пример 46. В результате двух серий измерений с количеством измерений и получены следующие выборочные средние и а также исправленные дисперсии . Можно ли с надёжностью объяснить случайными причинами?

Решение. Вычислим исправленную дисперсию , вычисляем наблюдаемое значение статистики . Вероятности и числу степей свободы в таблице t – распределения (см. приложение табл.3) соответствует . Так как 1,38<2,649, то с надежностью 0,99 нельзя считать расхождение средних значимым, или при уровне значимости 0,99, можно считать, что математические ожидания .

 

53.Сравнение выборочных дисперсий

Гипотезы о дисперсиях имеют особенно большое значение в технике, так как измеряемая дисперсией величина рассеяния характеризует такие важные показатели, как точность машин, приборов, технологических процессов.

Сформулируем гипотезу о равенстве дисперсий двух нормально распределенных генеральных совокупностей. Рассмотрим две случайные величины и , каждая из которых подчиняется нормальному закону распределения с дисперсиями и . Пусть из генеральных совокупностей и извлечены две независимые выборки объёмами и . Проверим гипотезу о том, что относительно альтернативной гипотезы , заключающейся в том, что . Для оценки используем исправленную выборочную дисперсию , а для оценки - исправленную выборочную дисперсию , следовательно, задача проверки гипотезы сводится к сравнению дисперсий и . Как показано ранее, случайные величины и распределены по закону с и степенями свободы. Случайную величину , определяемую соотношением , называют случайной величиной с распределением Фишера-Снедекора. Заметим, что всегда можно так ввести обозначения, что , поэтому случайная величина принимает значения, не меньшие единицы. Дифференциальный закон распределения случайной величины не содержит неизвестных параметров и их оценок, а зависит лишь от числа наблюдений в выборках и . Этот факт позволяет составить таблицы распределения случайной величины , в которых различным значениям уровня значимости и различным сочетаниям величин и ставят в соответствие такие значения , для которых справедливо равенство .

Сформулируем правило вычислив исправленные выборочные дисперсии и , найдём их отношение , причём в числителе запишем большую из них. Затем, выбрав необходимый уровень значимости , по таблице -распределения находим число , которое сравниваем с вычисленным . Если окажется, что , то проверяемая гипотеза отвергается (различие между дисперсиями значимо), если , то выборочные наблюдения не противоречат проверяемой гипотезе.

Пример 47. На двух станках обрабатываются детали. Отобраны две пробы: на первом станке , на втором станке . По данным этих выборок рассчитаны исправленные выборочные дисперсии (для первого станка) и . Проверить при уровне значимости гипотезу о том, что станки обладают одинаковой точностью, или гипотезу : дисперсии равны.

Решение. Вычислим значение . Затем по уровню значимости и степеням свободы по таблице (см. приложение табл. 6) находим число . Итак имеем 1,68<2,65, следовательно, предположение о равенстве дисперсий не противоречит наблюдениям, иными словами, нет оснований считать, что станки обладают разной точностью.

 

54. Проверка гипотез о законе распределения

Критерий согласия (Пирсона)

До сих пор мы рассматривали гипотезы, относящиеся к отдельным параметрам распределения случайной величины, причём закон распределения предполагался известным. Однако во многих практических задачах закон распределения случайной величины неизвестен, то есть является гипотезой, которая требует статистической проверки.

Обозначим через исследуемую случайную величину. Пусть требуется проверить гипотезу о том, что случайная величина подчиняется закону распределения . Для проверки гипотезы произведём выборку, состоящую из п независимых наблюдений над случайной величиной . По выборке можно построить эмпирическое распределение исследуемой случайной величины. Сравнение эмпирического и теоретического распределений производится с помощью специально подобранной случайной величины - критерия согласия. Существует несколько критериев согласия: Пирсона, Колмогорова, Смирнова и др. Критерий согласия Пирсона - наиболее часто употребляемый критерий для проверки гипотезы о законе распределения.

Рассмотрим этот критерий. Разобьём всю область изменения на интервалов и подсчитаем количество элементов , попавших в каждый из интервалов . Предполагая известным теоретический закон распределения , всегда можно определить (вероятность попадания случайной величины в интервал ), тогда теоретические частоты можно рассчитать по формуле . Если эмпирические частоты сильно отличаются от теоретических, то проверяемую гипотезу следует отвергнуть, в противном случае - принять.

Сформулируем критерий, который бы характеризовал степень расхождения между эмпирическими и теоретическими частотами. В литературе по математической статистике доказывается, что статистика имеет распределение с степенями свободы. Здесь - число параметров распределения . Правило применения критерия сводится к следующему. Рассчитав теоретические частоты и вычислив значение , затем выбрав уровень значимости критерия , по таблице находим . Если , то гипотезу отвергают, если , то гипотезу принимают или, другими словами нет оснований отвергнуть гипотезу о том, что генеральная совокупность подчинена закону распределения . В заключение отметим, что необходимым условием применения критерия Пирсона является наличие в каждом из интервалов по меньшей мере 5-10 наблюдений. Если количество наблюдений мало, то нужно объединить интервалы, содержащие частоты менее 5.

Пример 48. На телефонной станции производились наблюдения над числом неправильных соединений в минуту. Наблюдения в течение часа дали следующие результаты: 3; 1; 3; 1; 4; 2; 2; 4; 0; 3; 0; 2; 2; 0; 2; 1; 4; 3; 3; 1; 4; 2; 2; 1; 1; 2; 1; 0; 3; 4; 1; 3; 2; 7; 2; 0; 0; 1; 3; 3; 1; 2; 4; 2; 0; 2; 3; 1; 2; 5; 1; 1; 0; 1; 1; 2; 2; 1; 1; 5. Определить выборочную среднюю и дисперсию неправильных соединений в минуту и проверить выполнение основного условия для распределения Пуассона . Найти теоретическое распределение Пуассона и проверить степень согласия теоретического и эмпирического распределений по критерию Пирсона при уровне значимости .

               
               

Решение. Упорядочим результаты наблюдений, записав их в таблицу:


Найдём . Вычислим выборочную дисперсию по формуле , где , тогда . Необходимое условие для распределения Пуассона практически выполняется. Запишем теоретический закон распределения Пуассона, используя вместо математического ожидания его оценку : . Найдём теоретические частоты:

;

;

;

.

Так как последних три интервала содержат частоты менее пяти, то объединим их с предыдущим. Получим

         
8,1 16,2 16,2 10,6 8,5

Вычислим значение

Примем уровень значимости . Количество интервалов после объединения . По выборке вычислен один параметр, которым определяется закон Пирсона - математическое ожидание, следовательно: . Поэтому число степеней свободы . По таблице (см. приложение табл.4) находим . Имеем 7,8>0,11, следовательно, нет оснований отвергнуть нулевую гипотезу или, другими словами, при уровне значимости можно считать, что генеральная совокупность распределена по закону Пуассона.

Пример 49. Проверить гипотезу о нормальном распределении для следующего интервального ряда:

10-14 14-18 18-22 22-26 26-30 30-34
           

Решение. Найдём выборочное среднее по формуле

и исправленную дисперсию по формуле , где

Найдем теоретические частоты по формуле , тогда

Так как последний и первый интервалы содержат частоты менее пяти, то объединим их с соседними. Получим

       
12,1 13,7 12,9 9,8

Найдём по формуле .

Число степеней свободы равно 4-3=1, следовательно, при уровне значимости имеем по таблице . Так как наблюдаемое значение меньше критического то гипотезу о нормальном распределении генеральной совокупности при заданном уровне значимости нет оснований отвергнуть.

 

55. Выборочный коэффициент корреляции и его свойства

В реальном мире многие явления природы происходят в обстановке действия многочисленных факторов, влияние каждого из них ничтожно, а число их велико. В этом случае связь теряет свою однозначность, и изучаемая физическая система переходит не в определенное состояние, а в одно из возможных для неё состояний. Здесь речь может идти лишь о статистической связи. Знание статистической зависимости между случайными переменными имеет большое практическое значение: с её помощью можно прогнозировать значение случайной переменной в предположении, что независимая переменная примет определённое значение.

Статистические связи между переменными можно изучать методом корреляционного и регрессионного анализа. Основная задача корреляционного анализа - выявление связи между случайными переменными путём точечной и интервальной оценки парных коэффициентов корреляции, вычисления и проверки значимости коэффициентов корреляции. Корреляционный анализ позволяет оценить функцию регрессии одной случайной величины на другую. Предпосылки корреляционного анализа следующие: 1) переменные величины должны быть случайными; 2) случайные величины должны иметь нормальное распределение.

Выборочный коэффициент корреляции находится по формуле

Выборочный коэффициент корреляции оценивает тесноту линейной связи.

Свойства выборочного коэффициента корреляции:

1. Коэффициент корреляции принимает значения на интервале .

Доказательство. Докажем справедливость утверждения для дискретных переменных. Запишем явно неотрицательное выражение . Возведём выражение под знаком суммы в квадрат . Первое и третье слагаемые равны единице по определению дисперсии. Таким образом: , откуда .

2. Выборочный коэффициент корреляции не зависит от выбора начала точки отсчёта и единицы измерения, то есть для любых выполнено равенство

.

3. Выборочный коэффициент можно вычислять по формуле .







Дата добавления: 2015-08-12; просмотров: 771. Нарушение авторских прав; Мы поможем в написании вашей работы!




Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...


Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...


Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Принципы, критерии и методы оценки и аттестации персонала   Аттестация персонала является одной их важнейших функций управления персоналом...

Пункты решения командира взвода на организацию боя. уяснение полученной задачи; оценка обстановки; принятие решения; проведение рекогносцировки; отдача боевого приказа; организация взаимодействия...

Что такое пропорции? Это соотношение частей целого между собой. Что может являться частями в образе или в луке...

Механизм действия гормонов а) Цитозольный механизм действия гормонов. По цитозольному механизму действуют гормоны 1 группы...

Алгоритм выполнения манипуляции Приемы наружного акушерского исследования. Приемы Леопольда – Левицкого. Цель...

ИГРЫ НА ТАКТИЛЬНОЕ ВЗАИМОДЕЙСТВИЕ Методические рекомендации по проведению игр на тактильное взаимодействие...

Studopedia.info - Студопедия - 2014-2025 год . (0.014 сек.) русская версия | украинская версия