Точечная оценка и ее свойства
Распределение случайной величины (распределение генеральной совокупности) характеризуется обычно рядом числовых характеристик:
Такие числовые характеристики, как правило, неизвестные, называются параметрами генеральной совокупности. Оценка параметра — соответствующая числовая характеристика, рассчитанная по выборке. Оценки параметров генеральной совокупности делятся на два класса: точечные и интервальные. Когда оценка определяется одним числом, она называется точечной оценкой. Точечная оценка, как функция от выборки, является случайной величиной и меняется от выборки к выборке при повторном эксперименте. Интервальные оценки определяются двумя числами – концами интервала, который накрывает оцениваемый параметр. В отличие от точечных оценок, которые не дают представления о том, как далеко от них может находиться оцениваемый параметр, интервальные оценки позволяют установить точность и надёжность оценок. В качестве точечных оценок математического ожидания, дисперсии и среднего квадратического отклонения используют выборочные характеристики соответственно выборочное среднее, выборочная дисперсия и выборочное среднее квадратическое отклонение. Свойство несмещенности оценки. Определение. Оценка называется несмещенной, если ее математическое ожидание равно истинному значению оцениваемого параметра: Выборочное среднее арифметическое является несмещенной оценкой математического ожидания, а выборочная дисперсия — смещенная оценка генеральной дисперсии D. Несмещенной оценкой генеральной дисперсии является оценка Свойство состоятельности оценки. Определение. Оценка называется состоятельной, если она сходится по вероятности к оцениваемому параметру θ при n→∞.
Свойство эффективной оценки. Определение. Несмещенная оценка является эффективной, если она имеет наименьшую среди всех несмещенных оценок дисперсию. Это означает, что эффективная оценка обладает минимальным рассеиванием относительно истинного значения параметра. Заметим, что эффективная оценка существует не всегда, но из двух оценок обычно можно выбрать более эффективную, т.е. с меньшей дисперсией. Например, для неизвестного параметра a нормальной генеральной совокупности N(a,σ) в качестве несмещенной оценки можно взять и выборочное среднее арифметическое, и выборочную медиану. Но дисперсия выборочной медианы примерно в 1.6 раза больше, чем дисперсия среднего арифметического. Поэтому более эффективной оценкой является выборочное среднее арифметическое. Пример №1. Найдите несмещенную оценку дисперсии измерений некоторой случайной величины одним прибором (без систематических ошибок), результаты измерения которой (в мм): 13,15,17.
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего - смещенная оценка). D=8/3=2.67 Пример №2. Найдите несмещенную оценку математического ожидания измерений некоторой случайной величины одним прибором (без систематических ошибок), результаты измерения которой (в мм): 4,5,8,9,11. Пример №3. Найдите исправленную дисперсию S2 для выборки объема n=10, если выборочная диспресия равна D = 180. В результате 10 независимых измерений некоторой величины Х, выполненных с одинаковой точностью, получены опытные данные, приведенные в таблице. Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины Х при помощи доверительного интервала, покрывающего истинное значение величины Х с доверительной вероятностью 0,95.
Статистическая проверка статистических гипотез. Общие принципы проверки гипотез. Понятия статистической гипотезы (простой и сложной), нулевой и конкурирующей гипотезы, ошибок первого и второго рода, уровня значимости, статистического критерия, критической области, области принятия гипотезы. Наблюдаемое значение критерия. Критические точки. Мощность критерия. Критерии для проверки гипотез о вероятности события, о математическом ожидании, о сравнении двух дисперсий. Определение 19.1. Статистической гипотезой называют гипотезу о виде неизвестного распределения генеральной совокупности или о параметрах известных распределений. Определение 19.2. Нулевой (основной) называют выдвинутую гипотезу Н 0. Конкурирую-щей (альтернативной) называют гипотезу Н 1, которая противоречит нулевой. Пример. Пусть Н 0 заключается в том, что математическое ожидание генеральной совокупности а = 3. Тогда возможные варианты Н 1: а) а ≠ 3; б) а > 3; в) а < 3. Определение 19.3. Простой называют гипотезу, содержащую только одно предположение, сложной – гипотезу, состоящую из конечного или бесконечного числа простых гипотез. Пример. Для показательного распределения гипотеза Н 0: λ = 2 – простая, Н 0: λ > 2 – сложная, состоящая из бесконечного числа простых (вида λ = с, где с – любое число, большее 2). В результате проверки правильности выдвинутой нулевой гипотезы (такая проверка называется статистической, так как производится с применением методов математичес-кой статистики) возможны ошибки двух видов: ошибка первого рода, состоящая в том, что будет отвергнута правильная нулевая гипотеза, и ошибка второго рода, заключаю-щаяся в том, что будет принята неверная гипотеза. Замечание. Какая из ошибок является на практике более опасной, зависит от конкретной задачи. Например, если проверяется правильность выбора метода лечения больного, то ошибка первого рода означает отказ от правильной методики, что может замедлить лече-ние, а ошибка второго рода (применение неправильной методики) чревата ухудшением состояния больного и является более опасной. Определение 19.4. Вероятность ошибки первого рода называется уровнем значимости α. Основной прием проверки статистических гипотез заключается в том, что по имеющейся выборке вычисляется значение некоторой случайной величины, имеющей известный закон распределения. Определение 19.5. Статистическим критерием называется случайная величина К с известным законом распределения, служащая для проверки нулевой гипотезы. Определение 19.6. Критической областью называют область значений критерия, при которых нулевую гипотезу отвергают, областью принятия гипотезы – область значений критерия, при которых гипотезу принимают. Итак, процесс проверки гипотезы состоит из следующих этапов: 1) выбирается статистический критерий К; 2) вычисляется его наблюдаемое значение Кнабл по имеющейся выборке; 3) поскольку закон распределения К известен, определяется (по известному уровню значимости α) критическое значение kкр, разделяющее критическую область и область принятия гипотезы (например, если р (К > kкр) = α, то справа от kкр распо-лагается критическая область, а слева – область принятия гипотезы); 4) если вычисленное значение Кнабл попадает в область принятия гипотезы, то нулевая гипотеза принимается, если в критическую область – нулевая гипотеза отвергается. Различают разные виды критических областей: - правостороннюю критическую область, определяемую неравенством K > kкр (kкр > 0); - левостороннюю критическую область, определяемую неравенством K < kкр (kкр < 0); - двустороннюю критическую область, определяемую неравенствами K < k 1, K > k 2 (k 2 > k 1). Определение 19.7. Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что верна конкурирующая гипотеза. Если обозначить вероятность ошибки второго рода (принятия неправильной нулевой гипотезы) β, то мощность критерия равна 1 – β. Следовательно, чем больше мощность критерия, тем меньше вероятность совершить ошибку второго рода. Поэтому после выбора уровня значимости следует строить критическую область так, чтобы мощность критерия была максимальной. На разных этапах статистического исследования возникает необходимость в формулировании и экспериментальной проверке некоторых предположительных утверждений (гипотез). Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Выдвигается основная (нулевая) гипотеза и проверяется, не противоречит ли она имеющимся эмпирическим данным. Конкурирующей (альтернативной) называют гипотезу , которая противоречит нулевой. В результате статистической проверки гипотезы могут быть допущены ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза; вероятность совершить такую ошибку обозначают и называют ее уровнем значимости. Ошибка второго рода состоит в том, что будет принята неправильная гипотеза, вероятность которой обозначают , а мощностью критерия является вероятность . Процедура обоснованного сопоставления высказанной гипотезы с имеющейся выборкой осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез. Под критической областью понимают совокупность значений критерия, при которых нулевую гипотезу отвергают. Критическую область при заданном уровне значимости следует строить так, чтобы мощность критерия была максимальной. Статистические критерии проверки гипотез разнообразны, но у них единая логическая схема построения, которую представим на рис. 103. Рис. 103 1. Сравнение двух дисперсий нормальных генеральных совокупностей. При заданном уровне значимости проверяется нулевая гипотеза, состоящая в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой: В качестве критерия проверки нулевой гипотезы принимают случайную величину отношения большей исправленной дисперсии к меньшей Величина имеет распределение Фишера-Снедекора, которое зависит только от чисел степеней свободы и . Пример 181. Исследование длительности оборотных средств двух групп предприятий (по 13 предприятий в каждой) дало следующие результаты: дня, дней, дня, дней. Можно ли считать, что отклонения в длительности оборота оборотных средств групп предприятий одинаковы для уровня значимости 0,1? Решение. В этой задаче надо проверить нулевую гипотезу о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе . Используем критерий Фишера-Снедекора со степенями свободы и вычислим наблюдаемое значение критерия (отношение большей дисперсии к меньшей)
По таблице приложения 6 по уровню значимости для двусторонней критической области и числам степеней свободы находим критическую точку
Так как , то нет оснований отвергать нулевую гипотезу о равенстве отклонений в длительности оборота оборотных средств двух групп предприятий. Пример 182. Школьникам давались обычные арифметические задачи, а потом одной случайно выбранной половине учащихся сообщалось, что они не выдержали испытания, а остальным - обратное. Затем у каждого из них спрашивали, сколько секунд ему потребуется для решения новой задачи. Экспериментатор, вычисляя разность между определенным временем решения задачи, которое называл школьник, и результатами ранее выполненного задания, получил следующие данные:
Проверьте на уровне значимости 0,01 гипотезу о том, что дисперсия совокупности детских оценок, имеющих отношение к оценке их возможностей, не зависит от того, что сообщалось детям о плохих результатах испытаний или об удачном решении первой задачи. Решение. Применим критерий Фишера-Снедекора для нулевой гипотезы и конкурирующей . Вычислим наблюдаемое значение критерия
Критическую точку находим в приложении для уровня значимости и числам степеней свободы и :
Получили, что и нулевая гипотеза на уровне значимости 0,01 отвергается. 2. Сравнение двух средних нормальных генеральных совокупностей с известными дисперсиями. Проверяется нулевая гипотеза о равенстве генеральных средних рассматриваемых совокупностей с заданными или вычисляемыми дисперсиями. В качестве критерия проверки нулевой гипотезы примем случайную величину
Пример 183. Производительность двух моторных заводов, выпускающих дизельные двигатели, характеризуется следующими данными:
Можно ли считать одинаковыми производительности дизельных двигателей на обоих заводах при уровне значимости ? Решение. Найдем выборочные числовые характеристики данных независимых выборок:
Найдем наблюдаемое значение критерия:
По условию, конкурирующая гипотеза имеет вид , поэтому критическая область - двусторонняя. Найдем критическую точку:
по таблице функции Лапласа (прил. 2) находим . Так как , то нулевая гипотеза об одинаковости производительности двух заводов отклоняется. Пусть производится n независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Вероятность наступления события во всех испытаниях постоянна и равна p (следовательно, вероятность не появления q=1 - p). Рассмотрим в качестве дискретной случайной величины X число появлений события A в этих испытаниях. Поставим задачу: найти закон распределения величины X. Для ее решения требуется определить возможные значения X и их вероятности. Очевидно, событие A в n испытаниях может либо не появиться, либо появиться 1 раз, либо 2 раза, …, либо n раз. Таким образом, возможные значения X таковы: Остается найти вероятности этих возможных значений, для чего достаточно воспользоваться формулой Бернулли: где k=0, 1, 2, …, n. Формула (2.1) и является аналитическим выражением закона распределения. Определение 2.1: Биномиальным называют распределение вероятностей, определяемое формулой Бернулли. Закон назван «биномиальным» потому, что правую часть равенства (2.1) можно рассматривать как общий член разложения бинома Ньютона: …… Таким образом, первый член разложения определяет вероятность наступления рассматриваемого события n раз в n независимых испытаниях; второй член определяет вероятность наступления события n - 1 раз; …; последний член определяет вероятность того, что событие не появится ни разу. Напишем биномиальный закон в виде таблицы 2.1:
Пример 2.1: Условие: Жарким солнечным летом во время разгара купального сезона студенту необходимо сдать пять экзаменов: по английскому языку, по математическому анализу, по электрической механике, по ТОЭ, по технической механике. Итог каждого экзамена не влияет на сдачу других. Вероятность сдачи студентом каждого экзамена с первого раза равна 0,9. Составить закон распределения числа не сданных экзаменов с первого раза. Определить наивероятнейшее число сданных экзаменов. Решение: Пусть дискретная случайная величина X - число не сданных экзаменов. Тогда X имеет следующие возможные значения: (студент сдал все экзамены), (студент не сдал 1 экзамен), (студент не сдал 2 экзамена), (студент не сдал 3 экзамена), (студент не сдал 4 экзамена), (студент не сдал ни один экзамен из пяти). Итог каждого экзамена не влияет на сдачу других, т.е. эти события независимы один от другого, вероятности не сдачи каждого экзамена равны между собой, т. к. равны вероятности сдачи каждого экзамена, поэтому применима формула Бернулли. Учитывая, что, по условию n=5, q=0,9, получим:
Проверка: Напишем искомый биномиальный закон распределения X:
Заметим, что наивероятнейшее число не сданных экзаменов является 0. Критерий согласия Пирсона (χ2) применяют для проверки гипотезы о соответствии эмпирического распределения предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100). Критерий применим для любых видов функции F(x), даже при неизвестных значениях их параметров, что обычно имеет место при анализе результатов механических испытаний. В этом заключается его универсальность. Использование критерия χ2 предусматривает разбиение размаха варьирования выборки на интервалы и определения числа наблюдений (частоты) nj для каждого из e интервалов. Для удобства оценок параметров распределения интервалы выбирают одинаковой длины. Число интервалов зависит от объема выборки. Обычно принимают: при n = 100 e = 10 ÷ 15, при n = 200 e = 15 ÷ 20, при n = 400 e = 25 ÷ 30, при n = 1000 e = 35 ÷ 40. Интервалы, содержащие менее пяти наблюдений, объединяют с соседними. Однако, если число таких интервалов составляет менее 20 % от их общего количества, допускаются интервалы с частотой nj ≥ 2. Статистикой критерия Пирсона служит величина Нулевую гипотезу о соответствии выборочного распределения теоретическому закону F(x) проверяют путем сравнения вычисленной по формуле (3.91) величины с критическим значением χ2α, найденным по табл. VI приложения для уровня значимости α и числа степеней свободы k = e 1 - m - 1. Здесь e 1 - число интервалов после объединения; m - число параметров, оцениваемых по рассматриваемой выборке. Если выполняется неравенство Недостатком критерия согласия Пирсона является потеря части первоначальной информации, связанная с необходимостью группировки результатов наблюдений в интервалы и объединения отдельных интервалов с малым числом наблюдений. В связи с этим рекомендуется дополнять проверку соответствия распределений по критерию χ2 другими критериями. Особенно это необходимо при сравнительно малом объеме выборки (n ≈ 100). Пример 3.18. Проверить с помощью критерия согласия χ2 гипотезу о нормальном распределении логарифма числа циклов до разрушения при усталостных испытаниях по данным табл. 2.3 и 2.4. Принять уровень значимости α = 0.05. Все результаты вычислений приведены в табл. 3.18, данные первых трех граф которой заимствованы из табл. 2.4. В связи с малым числом наблюдений объединяем интервалы 1-й со 2-м и 9-й с 10-м и 11-м. В 4-й графе приводим границы интервалов, выраженные через нормированную случайную величину
Сумма 9-й графы дает значение статистики χ2. В данном случае χ2 = 2.547. По табл. VI приложения для α = 0.05 и k = 8 - 2 - 1 = 5 (8 - число интервалов после объединения, 2 - число параметров, оцениваемых по выборке, (xср, s) находим критическое значение критерия χ20.05 = 11.1. Условие (3.92) выполняется, значит опытные данные не противоречат нормальному закону распределения, т. е. нулевую гипотезу не отбрасываем. К аналогичному выводу приходим и на основании графического метода (см. рис. 2.4). Наблюденная в данном случае величина χ2 = 2.547 соответствует фактическому уровню значимости α ≈ 0.75 (табл. VI приложения). Это означает, что если бы многократно повторить выборки по n = 100 из генеральной заведомо нормально распределенной совокупности, то значение χ2 ≥ 2.547 встречалось бы примерно в 75 %. Пример 3.19. Проверить с помощью критерия Пирсона нулевую гипотезу о распределении числа циклов до разрушения при усталостных испытаниях по закону Вейбулла - Гнеденко (1.46) для уровня значимости α = 0.06 по данным табл. 2.3 и 2.8. Оценки параметров функции (1.46) были произведены в примере 2.4 (b = 0.721; x H = 0.736•106 циклов и c = 3.235•106 циклов). Вычисление статистики χ2 показано в табл. 3.19. В условиях рассматриваемого примера χ2 = 35.091. По табл. VI приложения для α = 0.05 и k = 11 - 3 - 1 =7 (11 - число интервалов после объединения, 3 - число оцениваемых по выборке параметров) находим критическое визчеине критерия Пирсона χ20.05 = 14.1. Условие (3.92) не выполняется, значит опытные данные противоречат трехпараметрическому распределению Вейбулла - Гнеденко (1.46), т. е. нулевую гипотезу отвергаем. Нулевую гипотезу отбрасываем даже при уровне значимости α = 0.001, для которого критическое значение критерия χ20.001 = 24.3. К аналогичному выводу приходим и на основании графического анализа (см. рис. 2.5).
|