Студопедия Главная Случайная страница Задать вопрос

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Групповая, внутригрупповая, межгрупповая и общая дисперсия





Групповой дисперсией называют дисперсию значений признака, принадлежащих группе, относительно групповой средней:

,

где ni – частота значений xi; j – номер группы; – групповая средняя группы j; – объем группы j.

Зная дисперсию каждой группы, можно найти их среднюю арифметическую.

Внутригрупповой дисперсией называют среднюю арифметическую дисперсию, взвешенную по объемам групп:

,

где Nj – объем группы j; – объем всей совокупности

Зная групповые средние и общую среднюю, можно найти дисперсию групповых относительно общей средней.

Межгрупповой дисперсией называют дисперсию групповых средних относительно общей средней:

где – групповая средняя группы j; Nj – объем группы j; – общая средняя; – объем всей совокупности.

Общей дисперсией называют дисперсию значений признака всей совокупности относительно общей средней:

,

где nj – частота значений xi; – общая средняя; n – объем всей совокупности.

Пример 2.9. Найти групповые дисперсии, внутригрупповую дисперсию, межгрупповую дисперсию и общую дисперсию совокупности, состоящей из следующих двух групп:

 

Первая группа Вторая группа
xi ni xi ni
 

 

Решение:

1. Найдем групповые средние:

а) объем групп ; N1=1+7+2=10; N2=2+3=5;

б) ; .

2. Найдем групповые дисперсии:

;

3. Найдем внутригрупповую дисперсию:

; ;

4. Определим межгрупповую дисперсию:

а) определим общую дисперсию:

;

б) используя групповые средние и , определим искомую межгрупповую дисперсию:

5. Найдем общую дисперсию:

;

Замечание: найденная общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий:

;

Задание для самостоятельной работы:

Найти групповые дисперсии, внутригрупповую дисперсию, межгрупповую дисперсию и общую дисперсию совокупности, состоящей из следующих двух групп:

 

Первая группа Вторая группа
xi ni xi ni

2.3. Интервальные оценки. Доверительная

вероятность. Доверительный интервал

 

Интервальной называют оценку, которая определяется двумя числами-концами интервала.

Интервальные оценки позволяют установить точность и надежность оценок.

Чем точнее оценка определяет параметр , тем меньше будет абсолютная величина разности , – оценка отклонения, чем меньше , тем точнее оценка.

Поскольку статистические методы не позволяют категорически утверждать, что оценка удовлетворяет неравенству , можно лишь говорить о вероятности , с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки по называют вероятность , с которой осуществляется неравенство

Наиболее часто задают надежность, равную 0,95; 0,99; 0,999.

Неравенство можно заменить равносильным двойным неравенством:

или

Тогда .

Доверительным называют интервал , который покрывает неизвестный параметр с заданной надежностью .

Пусть количественный признак Х генеральной совокупности распределен нормально, требуется оценить математическое ожидание а по выборочной средней при заданном :

; ; - для нормального распределения случайной величины.

Для определения оценки используют:

, где ;

Окончательно рассчитанная формула имеет вид:

 

Параметр t определяется из равенства , по таблице функции Лапласа (Приложение 2) находят аргумент t.

Пример 2.10. Случайная величина Х имеет нормальное распределение с известным средним квадратическим отклонением . Найти доверительные интервалы для оценки неизвестного математического ожидания а по выборочным средним , если объем выборки n=36 и задана надежность оценки ,

Решение:

1. Из соотношения по таблице определим параметр t:

, тогда

2. Определим точность оценки:

;

3. Доверительный интервал

:

Таким образом .

Замечание. Если требуется оценить математическое ожидание с наперед заданной точностью и надежностью , то минимальный объем выборки, который обеспечит эту точность, определяют по формуле:

Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном определяются из выражения:

Доверительный интервал определяют, пользуясь распределением Стьюдента, покрывающий неизвестный параметр а с надежностью . По таблице приложения 3 по заданным n и можно найти .

Пример 2.11. Количественный признак Х генеральной совокупности распределен нормально. По выборке объема n=16 найдены выборочная средняя и исправленное среднее квадратическое отклонение . Оценить неизвестное математическое ожидание при помощи доверительного интервала с надежностью 0.95.

Решение:

1. Найдем , пользуясь таблицей приложения 3, и n=16. Находим .

2. Найдем доверительные границы:

3. С надежностью 0,95 неизвестный параметр а заключен в доверительном интервале:

.

Задания для самостоятельной работы:

1. Найти доверительный интервал для оценки с надежностью 0,99 неизвестного математического ожидания а нормального распределения признака Х генеральной совокупности, если известны генеральное среднее квадратическое отклонение , выборочная средняя , объем выборки n и выборочная средняя :

б) .

б)

2. Найти минимальный объём выборки, при котором с надёжностью 0,925 точность оценки математического ожидания нормально распределённой генеральной совокупности по выборочной средней равна 0,2, если известно среднее квадратическое отклонение генеральной совокупности

3. По данным 16 независимых равноточных измерений некоторой физической величины найдены среднее арифметическое результатов измерений и «исправленное» среднее квадратическое отклонение . Оценить истинное значение измеряемой величины с надёжностью

2.4. Статистические гипотезы. Проверка гипотез

Статической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу Н0.

Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит основной.

Простой называют гипотезу, содержащую только одно предположение.

Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

В итоге проверки могут быть допущены ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута неправильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через .

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают через .

Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки гипотезы.

Наблюдаемым (эмпирическим) значением Кнаб называют то значение критерия, которое вычислено по выборкам.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых нулевую гипотезу принимают.

Основной принцип проверки статистических гипотез:

· если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают;

· если наблюдаемое значение критерия принадлежит области принятия гипотезы, то гипотезу принимают.

Критическими точками (границами) Ккр называют точки, отделяющие критическую область от области принятия гипотезы.

Правостороннейназывают критическую область, определяемую неравенством , где :

 

Левосторонней называют критическую область, определяемую неравенством , где :

Ккр 0 К

 

Двусторонней называют критическую область, определяемую неравенством , , где .

В частности, если критическая область симметрична относительно нуля, то двусторонняя критическая область (в предположении, что ) определяется неравенством , =>

Мощностью критерия называют вероятность показания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Иначе мощность критерия есть вероятность того, что нулевая гипотеза отвергнута, если верна конкурирующая гипотеза.

Для определения критической области задаются уровнем значимости и ищут критические точки исходя из следующих соотношений:

а) для правосторонней критической области:

б) для левосторонней области:

в) для двусторонней симметричной области:

.

2.4.1. Сравнение двух дисперсий нормальных генеральных

совокупностей

По независимым выборкам, объемы которых n1 и n2, извлеченным из нормальных генеральных совокупностей, найдены исправленные выборочные дисперсии . Требуется сравнить эти дисперсии.

Правило 1. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу Н0: о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе , надо вычислить наблюдаемые значения критерия (отклонение большей исправленной дисперсии к меньшей):

.

И по таблице критических точек распределения Фишера–Снедекора, по заданному уровню значимости и числам степеней свободы , найти критическую точку (критическое значение критерия). Если , - нет оснований отвергнуть нулевую гипотезу. Если , - нулевую гипотезу отвергают.

Пример 2.12. По двум независимым выборкам, объем которых , извлеченным из нормальных генеральных совокупностей X и Y, найдены исправленные выборочные дисперсии . При уровне значимости проверить нулевую гипотезу о равенстве генеральных дисперсий, при конкурирующей гипотезе .

Решение:

1. Найдем отношение большей исправленной дисперсии к меньшей:

По условию конкурирующая гипотеза имеет вид , поэтому выбираем правую критическую область.

2. По таблице критических значений (приложение 7.), по уровню значимости и числу степеней свободы находим .

3. Так как , - нет оснований отвергнуть нулевую гипотезу. Иначе выборочные исправленные дисперсии различаются незначимо.

 

Задания для самостоятельной работы:

1. По двум независимым выборкам, объемы которых , извлеченным из нормальных генеральных совокупностей X и Y, найдены исправленные выборочные дисперсии . При уровне значимости проверить нулевую гипотезу о равенстве генеральных дисперсий при конкурирующей гипотезе .

2. По двум независимым выборкам, объемы которых , извлеченным из нормальных генеральных совокупностей X и Y, найдены выборочные дисперсии . При уровне значимости проверить нулевую гипотезу о равенстве генеральных дисперсий при конкурирующей гипотезе .

Указание: ; .

2.4.2. Проверка гипотезы о нормальном распределении

генеральной совокупности по критерию Пирсона

Эмпирическое распределение задано в виде последовательности равноотстоящих вариант и соответствующих им частот:

xi x1 x2 xk
ni n1 n2 nk

 

Требуется, используя критерий Пирсона, проверить гипотезу о том, что генеральная совокупность Х распределена нормально.

Правило. Для того чтобы при заданном уровне значимости проверить гипотезу о нормальном распределении генеральной совокупности, надо:

1. Вычислить непосредственно (при малом числе наблюдений), или упрощенным методом (при большом числе наблюдений), например, методом произведений или сумм, выборочную среднюю и выборочное среднее квадратичное .

2. Вычислить теоретические частоты:

,

где - объем выборки , - шаг

; .

3. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:

1) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия ;

2) по таблице критических точек распределения , по заданному уровню значимости и числу степеней свободы ( - число групп выборки) находят критическую точку правосторонней критической области.

Если , - нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо.

Если , - гипотезу отвергают, следовательно, эмпирические и теоретические частоты различаются значимо.

Пример 2.13. Используя критерий Пирсона, при уровне значимости 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности Х с эмпирическим распределением выборки объема :

xi
ni

 

Решение:

1. Используя метод произведений, найдем выборочную среднюю , и выборочное среднее квадратическое отклонение :

-4 -60
-3 -78
-2 -50
-1 -30
-218
         
  n=200   -37

 

Проверка:

.

Расчетные формулы:

; ; ; .

; ; ; ; ;

; , т.о. ; .

2. Вычисляем теоретические частоты, учитывая ; ; , по формуле

Составим расчетную таблицу (значения функции берем из приложения 1.):

-1,62 0,1074 9,1
-1,20 0,1942 16,5
-0,77 0,2966 25,3
-0,35 0,3752 32,0
0,08 0,3977 33,9
0,51 0,3503 29,8
0,93 0,2589 22,0
1,36 0,1582 13,5
1,78 0,0818 7,0

 

3. Сравним эмпирические и теоретические частоты:

а) расчет сведем в таблицу и определим наблюдаемые значения критерия:

.

9,1 5,9 34,81 3,8
16,5 9,5 90,25 5,5
25,3 -0,3 0,09 0,0
32,0 -2,0 4,00 0,1
33,9 -7,9 62,41 1,8
29,8 -8,8 77,44 2,6
22,0 2,0 4,00 0,2
13,5 6,5 42,25 3,1
7,0 6,0 36,00 5,1
       

 

Из таблицы наблюдаемое значение критерия ;

б) по таблице критических точек распределение (приложение 5.), по уравнению значимости и числу степеней свободы находим критическую точку (критическое значение критерия) правосторонней критической области:

.

Получим - гипотезу о нормальном распределении генеральной совокупности отвергаем. Другими словами, эмпирические частоты отличаются значимо.


Задания для самостоятельной работы:

1. Используя критерий Пирсона, при уровне значимости проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности Х с эмпирическим распределением выборки объема :

0,3 0,5 0,7 0,9 1,1 1,3 1,5 1,7 1,9 2,1 2,3

 

2. Используя критерий Пирсона, при уровне значимости установить, случайно или значимо расхождение между эмпирическими частотами и теоретическими частотами , которые вычислены исходя из гипотезы о нормальном распределении генеральной совокупности Х:

а)

б)

 

в)

 

2.5. Элементы линейной корреляции






Дата добавления: 2014-11-10; просмотров: 1309. Нарушение авторских прав

Studopedia.info - Студопедия - 2014-2017 год . (0.193 сек.) русская версия | украинская версия