Для бакалавров – заочников инженерного факультета 9 страница

⇐ Предыдущая 1 2 3 4 5 6 7 8910 Следующая ⇒

Вероятность р = 1 – α называется доверительной вероятностью или надежностью оценки и задается близкой к единице, обычно 0,9; 0,95 или 0,99. Число α; называется уровнем значимости. Границы доверительного интервала находятся с помощью статистик, которые являются случайными величинами. Следовательно, случайны и границы интервала. Поэтому, говорят, что доверительный интервал накроет неизвестный параметр с доверительной вероятностью р.

В нашей задаче требуется найти доверительный интервал для неизвестного значения генеральной средней с надежностью 0,95. Как уже говорилось, оценкой генеральной средней является выборочная средняя , которая, в соответствии с ГИВД, рассматривается как сумма независимых и одинаково распределенных случайных величин . Если признак X распределен нормально с математическим ожиданием а и дисперсией , то доказано, что случайная величина распределена тоже по нормальному закону - c тем же математическим ожиданием а и дисперсией . Тогда случайная величина распределена нормально с нулевым математическим ожиданием и дисперсией, равной единице, следовательно, вероятность того, что значения этой случайной величины по абсолютной величине не превзойдут числа Z_Р, вычисляется по формуле

Значения функции Лапласа находятся из таблиц. По условию задачи задана вероятность р = 0,95, следовательно, число находится из условия , , значение находим по таблицам. Итак, с вероятностью р = 0,95 можно утверждать, что выполняется неравенство .

Преобразуем это неравенство:

<a< ,

откуда получаем доверительный интервал для неизвестного параметра а, следовательно, исходное условие можно переписать в виде:

Р ( <a< )= .

Отметим, что в эти формулы входит , следовательно, ими можно пользоваться лишь в случае, когда генеральная дисперсия известна (что на практике бывает не всегда).

Предположим сначала, что генеральная дисперсия нам известна и равна = 32184, а =179,4.

а) Выборка объема 10 включает следующие значения признака X:

535, 278,312, 368, 327, 482, 318, 531, 554,898.

Для этой малой выборки найдем выборочные числовые характеристики.

(10) = (535 + 278 + 312 + 368 + 327 + 482 + 3 18 + 53 1 + 554 + 898) = 460,3;

;

= (535² +278² +312² +368² +327² + 482² +318² +531² +554² +898²)=

= 243193,5 =>

S ²(10) = 243193,5 – 211876,1 = 31317,4,

; = 186,5

Итак, выборочная средняя арифметическая (10)= 460,3, исправленная выборочная дисперсия исправленное выборочное среднее квадратическое отклонение = 186,5. Сравнив их с соответствующими показателями генеральной совокупности, отметим, что они отличаются в сторону увеличения: а = 454, =32184, = 179,4.

б) Итак, найдем по выше приведенным формулам доверительный интервал для неизвестного матожидания а при известной дисперсии =32184:

<a< ,

Подставляем значения:

<a< ,

или

349,1 < a < 571,5.

Итак, доверительный интервал (349,1; 571,5) с надежностью 95% накроет неизвестное математическое ожидание а. Заметим, что истинное математическое ожидание а = 454 оказалось внутри доверительного интервала.

В действительности на практике чаще всего генеральная дисперсия не известна и, следовательно, вышеприведенными формулами пользоваться нельзя, т.е. нельзя пользоваться статистикой .

В этом случае воспользуемся следующей теоремой: пусть Х₁,Х₂,...,Х_п - независимые случайные величины, распределенные одинаково по нормальному закону с математическим ожиданием а и дисперсией . Тогда случайная величина имеет распределение Стьюдента с п – 1 степенями свободы.

Доверительный интервал с помощью этой теоремы строится следующим образом. Пусть признак X распределен нормально с математическим ожиданием (генеральной средней) а и дисперсией (генеральной дисперсией) . В нашем распоряжении имеется малая выборка объема п = 10. Результаты наблюдений х_1;...,х_п в соответствии с ГИВД будем понимать как независимые случайные величины Х₁,Х₂,…Х_п, одинаково распределенные по нормальному закону с математическим ожиданием а и дисперсией . Тогда случайная величина распределена по закону Стьюдента с п – 1 степенями свободы. Если задана доверительная вероятность р = 1 — α, то можно по таблицам t -распределения Стьюдента с п – 1 степенями свободы найти границы интервала, для которого выполняется следующее условие:

Р ( < < )= .

Расписав это условие подробнее, получим формулу для определения искомого доверительного интервала:

Р ( < < ) = р,

Р ( < а < ) = р.

Таким образом, с вероятностью р можно утверждать, что доверительный интервал накроет неизвестную генеральную среднюю а.

Подставим в окончательную формулу данные нашедшего примера: (10)= 460,3; = 186,5; п = 10; = 0,95; = 2,262 (найдено по таблицам распределения Стьюдента). Получим

< а <

т.е.

326,9 < а < 593,7.

Итак, теперь мы утверждаем более слабое предложение: с надежностью 95% (или с вероятностью 0,95) интервал (326,9; 593,7) накроет неизвестное математическое ожидание а (генеральную среднюю).

Утверждение это действительно более слабое, т.к. доверительный интервал оказался шире, т.е. оценка оказалась грубее. Это естественная плата за потерю информации о генеральной дисперсии.

в) Для нахождения доверительного интервала для неизвестной дисперсии проводят аналогичные рассуждения, используя ГИВД - гипотетическую интерпретацию выборочных данных. В результате для выборки объема п =10 доверительный интервал имеет вид , где и находят по таблицам распределения из условий:

и .

Учитывая, что число степеней свободы k = п –1= 9, находим по указанным таблицам ; и получаем доверительный интервал для неизвестной генеральной дисперсии

Заметим, что истинное значение генеральной дисперсии =32184, и оказалось внутри доверительного интервала.

Пример №33 (к задачам 251-260). Втаблице приведены данные опыта по изучению действия соотношения N:Р₂O₅:К₂О при питании рассады томатов на урожай плодов (ц/га). Каждое соотношение испытывалось на четырех участках. Методом дисперсионного анализа изучить влияние соотношения на урожайность плодов. Установить существенность влияния фактора при уровне значимости 0,05.

Урожайность плодов томатов в зависимости от соотношения N:Р₂O₅:К₂О при питании рассады.

Соотношение N:Р₂О5:К₂О (уровни фактора F)	Повторности
		Средние
1:1:1 (F₁)			463,5
1:2:1 (F₂)			512,25
1:2:2 (F₃)
2:1:1 (F₄)
2:2:1 (F₅)

Решение. Задачей дисперсионного анализа является изучение влияния одного или нескольких факторов на рассматриваемый признак. Факторами обычно называют внешние условия, влияющие на эксперимент. Если изучают влияние одного фактора F на результирующий признак X, то имеет место однофакторный анализ, которым нам необходимо научиться пользоваться. В условиях эксперимента фактор F может принимать различные значения, изменяться, или, как говорят, может варьировать на разных уровнях F_1,F₂,...., F_Р. Например, если требуется выяснить влияние удобрений на урожайность, то здесь результирующий признак X - урожайность, фактор F - удобрение, а уровни F_1,F₂,...., F_Р фактора - виды удобрений. Для большей достоверности на практике проводятся несколько испытаний, т.е. как говорят, осуществляют повторности. Будем предполагать, что число наблюдений для каждого уровня одинаково и равно п. Тогда результаты наблюдений можно свести в таблицу.

Исходные данные дисперсионного анализа.

Уровни фактора F	Повторности
			…….	п	Средние
F₁	х₁₁	х₁₂	х₁₃	…….	х_1п
F₂	х₂₁	х₂₂	х₂₃	…….	х_2п
^…….	…….	…….	…….	…….	…….	…….
F_р	х_р1	х_р2	х_р3	…….	х_рп

Введем обозначения:

= =1,2,…,р; = = ,

т.е. - средняя арифметическая на i - м уровне фактора, - общая средняя арифметическая всех р · п наблюдений.

Мы уже видели, что мерой вариации признака является сумма квадратов отклонений значений признака от средней. Можно доказать следующий результат: = п· , т.е. Q=Q₁+ Q_2.

Сумма Q называется полной суммой квадратов отклонений. Отдельных наблюдений от общей средней. Слагаемое Q₁ называется рассеиванием по факторам, оно характеризует отклонение средних для факторных уровней от общей средней. Слагаемое Q₂ называется остаточным рассеиванием и характеризует расхождение между наблюдениями i-ro уровня, т.е. за счет неучтенных факторов. Таким образом, формула показывает, что общее рассеивание значений признака X, измеряемое суммой Q, складывается из двух компонент Q₁ и Q₂, характеризующих рассеивание под влиянием фактора F (Q₁) и остаточное рассеивание (Q₂) под влиянием неучтенных факторов.

С помощью Q, Q₁, Q₂ производится оценка общей, межгрупповой и внутригрупповой дисперсией:

Сравнивая дисперсию по факторам с остаточной дисперсией , по величине их отношения судят, насколько рельефно проявляется влияние фактора - в этом сравнении и заключается основная идея дисперсионного анализа.

Сравнение осуществляется с помощью отношения

F(k₁,k₂) = / = / ,которое является случайной величиной, имеющей F - распределение Фишера с k₁ = р - 1, k₂ = р(n-1) степенями свободы. Критическое значение критерия на заданном уровне значимости находят по таблицам.

Теперь обратимся к нашему примеру.

В нашей задаче р = 5, п = 4, рп = 20. Вычисляем среднюю арифметическую по каждому уровню фактора F.

= (454 + 470 + 430 + 500) = 463,5; = (502 + 550 + 490 + 507) = 512,25;

= 607; =424; = 440.

Общую среднюю вычислим по формуле

= = (463,5+ 512,25 + 607 + 424 + 440) = 489,35.

При вычислении факторной = Q₁ /(p ‒ 1) и остаточной = = Q₂ /p(п ‒ 1) дисперсий рекомендуется пользоваться формулами, упрощающими вычисления:

Q₁=п· -пр()²; Q₂= -п .

Подставляя данные задачи в формулы, получим:

= 454² + 470² + 430² + 500² + 502² + 550² + 490²+ 507²+601²+670² + +550² + 607² + 407² + 412² + 475² + 402² + 41 8² + 470² + 460² + 412² = 4894209;

п· = 4(463,5² + 5 1 2,25² + 607² + 424² + 440²) = 4876229,2;

пр()² = 4 • 5 • 489,35² = 4789268,4;

= 21740,2; = 1198,65.

Теперь находим фактическое значение F_факт критерия Fпо формуле для F(k₁,k₂).
F_факт =21740,2/1 198,65 = 18,4. По таблицам F - распределения Фишера для к₁= р ‒ 1 = 5‒ 1 = 4; к₂= р(-1) = 5·3 = 15 степеней свободы при уровне значимости α = 0,05 находим критическое значение критерия: F_к_p=3,08. Оказалось F_факт > F_к_p, следовательно, факторная и остаточная дисперсии отличаются значимо на уровне значимости α = 0,05. Иначе говоря, фактор F - соотношение N:Р₂O₅:К₂О существенно влияет на урожайность плодов. В частности, из таблицы видно, что наибольшую урожайность дает соотношение 1:2:2 (третий уровень фактора F).

В заключение приведем некоторые извлечения из таблиц распределения Фишера-Снедекора, которые потребуются при выполнении контрольных работ.

р
п
k₁
k₂
F_к_p	3,08	4,9	3,7	3,9	3,5

Пример 34 (к задачам 261-270). Имеются статистические данные по группе предприятий о зависимости годовой производительности труда Y в расчете на одного рабочего (тыс. руб.) от энерговооруженности X (квт.ч. на одного рабочего) на 10 предприятиях одной отрасли:

X	3,4	3,9	4,0	4,8	4,9	5,2	5,4	5,5	6,2	7,0
Y	8,4	8,8	9,1	9,8	10,6	10,7	11,1	11,8	12,1	12,4

Методом корреляционного анализа исследовать зависимость между этими признаками. Рассчитать коэффициенты регрессии и корреляции. Построить график корреляционной зависимости.

Решение. Построим диаграмму рассеивания. Для этого на оси абсцисс откладываем значения х_i, факторного признака X, а на оси ординат - соответствующие значения y_i результирующего признака Y. Получающиеся таким образом точки с координатами (х_i;y_i) образуют диаграмму рассеивания (см. рисунок) _.

Визуальные наблюдения позволяют высказать предположение о наличии линейном корреляционной зависимости, поскольку точки диаграммы рассеивания (иначе она называется корреляционным полем) как бы выстраиваются вдоль некоторой прямой линии. Итак, предполагаем, что между энерговооруженностью X (квт.ч. на 1 рабочего) и годовой производительностью труда Y (тыс. руб. на 1 рабочего) существует линейная корреляционная зависимость. Соответствующее уравнение прямой линии называется уравнением прямой регрессии Y на X и имеет вид:

где коэффициент регрессии ,

; ;

= ; = ; = ; = .

Выборочный коэффициент корреляции r определяется по формуле:

⇐ Предыдущая 1 2 3 4 5 6 7 8910 Следующая ⇒

Дата добавления: 2015-12-04; просмотров: 223. Нарушение авторских прав; Мы поможем в написании вашей работы!

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при которых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

Понятие о синдроме нарушения бронхиальной проходимости и его клинические проявления Синдром нарушения бронхиальной проходимости (бронхообструктивный синдром) – это патологическое состояние...

Опухоли яичников в детском и подростковом возрасте Опухоли яичников занимают первое место в структуре опухолей половой системы у девочек и встречаются в возрасте 10 – 16 лет и в период полового созревания...

Способы тактических действий при проведении специальных операций Специальные операции проводятся с применением следующих основных тактических способов действий: охрана...

Постинъекционные осложнения, оказать необходимую помощь пациенту I.ОСЛОЖНЕНИЕ: Инфильтрат (уплотнение). II.ПРИЗНАКИ ОСЛОЖНЕНИЯ: Уплотнение...

Приготовление дезинфицирующего рабочего раствора хлорамина Задача: рассчитать необходимое количество порошка хлорамина для приготовления 5-ти литров 3% раствора...

Дезинфекция предметов ухода, инструментов однократного и многократного использования Дезинфекция изделий медицинского назначения проводится с целью уничтожения патогенных и условно-патогенных микроорганизмов - вирусов (в т...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия