Студопедия — Для бакалавров – заочников инженерного факультета 9 страница
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Для бакалавров – заочников инженерного факультета 9 страница






Вероятность р = 1 – α называется доверительной вероятностью или надежно­стью оценки и задается близкой к единице, обычно 0,9; 0,95 или 0,99. Число α; на­зывается уровнем значимости. Границы доверительного интервала находятся с по­мощью статистик, которые являются случайными величинами. Следовательно, слу­чайны и границы интервала. Поэтому, говорят, что доверительный интервал накроет неизвестный параметр с доверительной вероятностью р.

В нашей задаче требуется найти доверительный интервал для неизвест­ного значения генеральной средней с надежностью 0,95. Как уже говорилось, оцен­кой генеральной средней является выборочная средняя , которая, в соответствии с ГИВД, рассматривается как сумма независимых и одинаково распределенных случайных величин . Если признак X распределен нормально с математическим ожиданием а и дисперсией , то доказано, что слу­чайная величина распределена тоже по нормальному закону - c тем же математи­ческим ожиданием а и дисперсией . Тогда случайная величина распределена нормально с нулевым математическим ожиданием и дисперсией, равной единице, следовательно, вероятность того, что значения этой случайной величины по абсолютной величине не превзойдут числа ZР, вычисляется по формуле

Значения функции Лапласа находятся из таблиц. По условию задачи задана вероятность р = 0,95, следовательно, число находится из условия , , значение находим по таблицам. Итак, с вероятностью р = 0,95 можно утверждать, что выполняется неравенство .

Преобразуем это неравенство:

<a< ,

откуда получаем доверительный интервал для неизвестного параметра а, следовательно, исходное условие можно переписать в виде:

Р ( <a< )= .

Отметим, что в эти формулы входит , следовательно, ими можно пользоваться лишь в случае, когда генеральная дисперсия известна (что на практике бывает не всегда).

Предположим сначала, что генеральная дисперсия нам известна и равна = 32184, а =179,4.

а) Выборка объема 10 включает следующие значения признака X:

535, 278,312, 368, 327, 482, 318, 531, 554,898.

Для этой малой выборки найдем выборочные числовые характеристики.

(10) = (535 + 278 + 312 + 368 + 327 + 482 + 3 18 + 53 1 + 554 + 898) = 460,3;

;

= (5352 +2782 +3122 +3682 +3272 + 4822 +3182 +5312 +5542 +8982)=

= 243193,5 =>

 

S 2(10) = 243193,5 – 211876,1 = 31317,4,

; = 186,5

Итак, выборочная средняя арифметическая (10)= 460,3, исправленная выборочная дисперсия исправленное выборочное среднее квадратическое отклонение = 186,5. Сравнив их с соответствующими показателями генеральной совокупности, отметим, что они отличаются в сторону увеличения: а = 454, =32184, = 179,4.

б) Итак, найдем по выше приведенным формулам доверительный интервал для не­известного матожидания а при известной дисперсии =32184:

 

<a< ,

Подставляем значения:

<a< ,

или

349,1 < a < 571,5.

Итак, доверительный интервал (349,1; 571,5) с надежностью 95% накроет неизвест­ное математическое ожидание а. Заметим, что истинное математическое ожидание а = 454 оказалось внутри доверительного интервала.

В действительности на практике чаще всего генеральная дисперсия не из­вестна и, следовательно, вышеприведенными формулами пользоваться нельзя, т.е. нельзя пользоваться статистикой .

В этом случае воспользуемся следующей теоремой: пусть Х12,...,Хп - неза­висимые случайные величины, распределенные одинаково по нормальному закону с математическим ожиданием а и дисперсией . Тогда случайная величина имеет распределение Стьюдента с п – 1 степенями свобо­ды.

Доверительный интервал с помощью этой теоремы строится следующим об­разом. Пусть признак X распределен нормально с математическим ожиданием (ге­неральной средней) а и дисперсией (генеральной дисперсией) . В нашем распо­ряжении имеется малая выборка объема п = 10. Результаты наблюдений х1;...,хп в со­ответствии с ГИВД будем понимать как независимые случайные величины Х12,…Хп, одинаково распределенные по нормальному закону с математическим ожиданием а и дисперсией . Тогда случайная величина распределена по закону Стьюдента с п – 1 степенями свободы. Если задана доверительная вероятность р = 1 — α, то можно по таблицам t -распределения Стьюдента с п – 1 степенями свободы найти границы интер­вала, для которого выполняется следующее условие:

Р ( < < )= .

Расписав это условие подробнее, получим формулу для определения искомого дове­рительного интервала:

Р ( < < ) = р,

Р ( < а < ) = р.

Таким образом, с вероятностью р можно утверждать, что доверительный интервал накроет неизвестную генеральную среднюю а.

Подставим в окончательную формулу данные нашедшего примера: (10)= 460,3; = 186,5; п = 10; = 0,95; = 2,262 (найдено по таблицам распределения Стьюдента). Получим

< а <

т.е.

326,9 < а < 593,7.

Итак, теперь мы утверждаем более слабое предложение: с надежностью 95% (или с вероятностью 0,95) интервал (326,9; 593,7) накроет неизвестное математическое ожидание а (генеральную среднюю).

Утверждение это действительно более слабое, т.к. доверительный интервал оказался шире, т.е. оценка оказалась грубее. Это естественная плата за потерю информации о генеральной дисперсии.

в) Для нахождения доверительного интервала для неизвестной дисперсии проводят аналогичные рассуждения, используя ГИВД - гипотетическую интерпретацию выборочных данных. В результате для выборки объема п =10 доверительный интервал имеет вид , где и находят по таблицам распределения из условий:

и .

Учитывая, что число степеней свободы k = п –1= 9, находим по указанным таблицам ; и получаем доверительный ин­тервал для неизвестной генеральной дисперсии

.

Заметим, что истинное значение генеральной дисперсии =32184, и оказалось внут­ри доверительного интервала.

 

Пример №33 (к задачам 251-260). Втаблице приведены данные опыта по изучению действия соотношения N:Р2O52О при питании рассады томатов на урожай плодов (ц/га). Каждое соотношение испытывалось на четырех участках. Методом дисперси­онного анализа изучить влияние соотношения на урожайность плодов. Установить существенность влияния фактора при уровне значимости 0,05.

Урожайность плодов томатов в зависимости от соотношения N:Р2O52О при питании рассады.

 

Соотношение N:Р2О5:К2О (уровни фактора F)     Повторности
        Средние
1:1:1 (F1)         463,5
1:2:1 (F2)         512,25
1:2:2 (F3)          
2:1:1 (F4)          
2:2:1 (F5)          

Решение. Задачей дисперсионного анализа является изучение влияния одного или нескольких факторов на рассматриваемый признак. Факторами обычно называют внешние условия, влияющие на эксперимент. Если изучают влияние одного фактора F на результирующий признак X, то имеет место однофакторный анализ, которым нам необходимо научиться пользоваться. В условиях эксперимента фактор F может принимать различные значения, изменяться, или, как говорят, может варьировать на разных уровнях F1,F2,...., FР. Например, если требуется выяснить влияние удобрений на урожайность, то здесь результирующий признак X - урожайность, фактор F - удобрение, а уровни F1,F2,...., FР фактора - виды удобрений. Для большей достоверности на практике проводятся несколько испытаний, т.е. как говорят, осуществляют повторности. Будем предполагать, что число наблюдений для каждого уровня одинаково и равно п. Тогда результаты наблюдений можно свести в таблицу.

 

Исходные данные дисперсионного анализа.

 

Уровни фактора F Повторности
      ……. п Средние
F1 х11 х12 х13 ……. х1п
F2 х21 х22 х23 ……. х2п
……. ……. ……. ……. ……. ……. …….
Fр хр1 хр2 хр3 ……. хрп

Введем обозначения:

= =1,2,…,р; = = ,

т.е. - средняя арифметическая на i - м уровне фактора, - общая средняя арифметическая всех р · п наблюдений.

Мы уже видели, что мерой вариации признака является сумма квадратов отклонений значений признака от средней. Можно доказать следующий результат: = п· , т.е. Q=Q1+ Q2.

Сумма Q называется полной суммой квадратов отклонений. Отдельных наблюдений от общей средней. Слагаемое Q1 называется рассеиванием по факторам, оно характеризует отклонение средних для факторных уровней от общей средней. Слагаемое Q2 называется остаточным рассеиванием и характеризует расхождение между наблюдениями i-ro уровня, т.е. за счет неучтенных факторов. Таким образом, формула показывает, что общее рассеивание значений признака X, измеряемое суммой Q, складывается из двух компонент Q1 и Q2, характеризующих рассеивание под влиянием фактора F (Q1) и остаточное рассеивание (Q2) под влиянием неучтенных факторов.

С помощью Q, Q1, Q2 производится оценка общей, межгрупповой и внутригрупповой дисперсией:

Сравнивая дисперсию по факторам с остаточной дисперсией , по величине их отношения судят, насколько рельефно проявляется влияние фактора - в этом сравнении и заключается основная идея дисперсионного анализа.

Сравнение осуществляется с помощью отношения

F(k1,k2) = / = / ,которое является случайной величиной, имеющей F - распределение Фишера с k1 = р - 1, k2 = р(n-1) степенями свободы. Критическое значение критерия на заданном уровне значимости находят по таблицам.

Теперь обратимся к нашему примеру.

В нашей задаче р = 5, п = 4, рп = 20. Вычисляем среднюю арифметическую по каждому уровню фактора F.

= (454 + 470 + 430 + 500) = 463,5; = (502 + 550 + 490 + 507) = 512,25;

= 607; =424; = 440.

Общую среднюю вычислим по формуле

= = (463,5+ 512,25 + 607 + 424 + 440) = 489,35.

При вычислении факторной = Q1 /(p ‒ 1) и остаточной = = Q2 /p(п ‒ 1) дисперсий рекомендуется пользоваться формулами, упрощающими вычисления:

Q1=п· -пр()2; Q2= -п .

Подставляя данные задачи в формулы, получим:

= 4542 + 4702 + 4302 + 5002 + 5022 + 5502 + 4902 + 5072 +6012+6702 + +5502 + 6072 + 4072 + 4122 + 4752 + 4022 + 41 82 + 4702 + 4602 + 4122 = 4894209;

п· = 4(463,52 + 5 1 2,252 + 6072 + 4242 + 4402) = 4876229,2;

пр()2 = 4 • 5 • 489,352 = 4789268,4;

= 21740,2; = 1198,65.

Теперь находим фактическое значение Fфакт критерия Fпо формуле для F(k1,k2).
Fфакт =21740,2/1 198,65 = 18,4
. По таблицам F - распределения Фишера для к1 = р ‒ 1 = 5‒ 1 = 4; к2 = р(-1) = 5·3 = 15 степеней свободы при уровне значимости α = 0,05 находим критическое значение критерия: Fкp=3,08. Оказалось Fфакт > Fкp, следовательно, факторная и остаточная дисперсии отличаются значимо на уровне значимости α = 0,05. Иначе говоря, фактор F - соотношение N:Р2O52О существенно влияет на урожайность плодов. В частности, из таблицы видно, что наибольшую урожайность дает соотношение 1:2:2 (третий уровень фактора F).

В заключение приведем некоторые извлечения из таблиц распределения Фишера-Снедекора, которые потребуются при выполнении контрольных работ.

р          
п          
k1          
k2          
Fкp 3,08 4,9 3,7 3,9 3,5

 

Пример 34 (к задачам 261-270). Имеются статистические данные по группе предприятий о зависимости годовой производительности труда Y в расчете на одного рабочего (тыс. руб.) от энерговооруженности X (квт.ч. на одного рабочего) на 10 предприятиях одной отрасли:

 

X 3,4 3,9 4,0 4,8 4,9 5,2 5,4 5,5 6,2 7,0
Y 8,4 8,8 9,1 9,8 10,6 10,7 11,1 11,8 12,1 12,4

 

Методом корреляционного анализа исследовать зависимость между этими признаками. Рассчитать коэффициенты регрессии и корреляции. Построить график корреляционной зависимости.

 
 

Решение. Построим диаграмму рассеивания. Для этого на оси абсцисс откладываем значения хi, факторного признака X, а на оси ординат - соответствующие значения yi результирующего признака Y. Получающиеся таким образом точки с координатами (хi;yi) образуют диаграмму рассеивания (см. рисунок) .

 

Визуальные наблюдения позволяют высказать предположение о наличии линейном корреляционной зависимости, поскольку точки диаграммы рассеивания (иначе она называется корреляционным полем) как бы выстраиваются вдоль некоторой прямой линии. Итак, предполагаем, что между энерговооруженностью X (квт.ч. на 1 рабочего) и годовой производительностью труда Y (тыс. руб. на 1 рабочего) существует линейная корреляционная зависимость. Соответствующее уравнение прямой линии называется уравнением прямой регрессии Y на X и имеет вид:

,

где коэффициент регрессии ,

; ;

= ; = ; = ; = .

Выборочный коэффициент корреляции r определяется по формуле:







Дата добавления: 2015-12-04; просмотров: 218. Нарушение авторских прав; Мы поможем в написании вашей работы!



Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Эффективность управления. Общие понятия о сущности и критериях эффективности. Эффективность управления – это экономическая категория, отражающая вклад управленческой деятельности в конечный результат работы организации...

Мотивационная сфера личности, ее структура. Потребности и мотивы. Потребности и мотивы, их роль в организации деятельности...

Классификация ИС по признаку структурированности задач Так как основное назначение ИС – автоматизировать информационные процессы для решения определенных задач, то одна из основных классификаций – это классификация ИС по степени структурированности задач...

Тема: Изучение приспособленности организмов к среде обитания Цель:выяснить механизм образования приспособлений к среде обитания и их относительный характер, сделать вывод о том, что приспособленность – результат действия естественного отбора...

Тема: Изучение фенотипов местных сортов растений Цель: расширить знания о задачах современной селекции. Оборудование:пакетики семян различных сортов томатов...

Тема: Составление цепи питания Цель: расширить знания о биотических факторах среды. Оборудование:гербарные растения...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия