Студопедия Главная Случайная страница Задать вопрос

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Определение параметров выборочного уравнения прямой линии регрессии по сгруппированным данным




Для определения параметров уравнения используем систему как и для несгруппированных данных:

Для применения этой системы воспользуемся тождеством:

(следствие из )

(следствие из )

(следствие из )

(учтено, что когда пара чисел (x,y) наблюдалась раз).

С учетом тождеств систему можно переписать:

Решив систему, получим уравнение регрессии:

,

где .

; => .

Выборочный коэффициент корреляции определяют из выражения:

.

Выборочный коэффициент корреляции является оценкой коэффициента корреляции r генеральной совокупности и поэтому служит для измерения линейной связи.

На практике приняты следующие пределы качественной характеристики тесноты связи:

- связь между X и Y отсутствует или не является линейной даже приближенно;

- связь слабая;

- связь умеренная;

- связь заметная;

- связь очень высокая;

- связь между X и Y можно считать функциональной.

Пример 2.15. По данным корреляционной таблицы:

x y
- - - -37
- - -
- - -23  
- - -

 

1. Вычислить коэффициент корреляции.

2. Найти уравнение регрессии .

3. Вычислить групповые средние и для контроля вычислить значение (по уравнению регрессии в тех же точках), результаты запишем в таблицу:

 

4. По данным таблицы построить график линейной регрессии и нанести экспериментальные точки.

Решение:

1 Вычисляем величины , а также и по формулам:

а) ; ;

;

; .

б) 4; ;

;

; ;.

в)

г) коэффициент корреляции:

; .

Так как , то между величинами X и Y имеется очень высокая линейная корреляционная связь.

2. Вычислим коэффициент регрессии ; .

Искомое уравнение регрессии имеет вид:

;

3. Вычисляем групповые средние признака при фиксированном значении по формулам

Для контроля вычисляем значения по уравнению регрессии в тех же точках:

.

Результаты запишем в таблицу

48,7 42,35 29,4
58,39 49,19 39,99 30,79 21,59

 

4. Строим график линейной регрессии

и наносим экспериментальные точки .

 

0 1 2 3 4 5 6 7 x

 

Задания для самостоятельной работы:

1. Найти по уравнению регрессии на по данным:

хi yi
- - - -
- - - -
- - -
     
       
n=80

 

2. Найти уравнение регрессии на по данным:


 

yi
- -
- - -
- - - - -
- - -
n=100

 

3. Найти уравнение регрессии на по данным:

- -
- - -
- - -
- - -
- - -
n=100

 

2.5.3. Однофакторный дисперсионный анализ

Дисперсионным анализом называется статистический метод анализа результатов испытаний, цель которого – оценить влияние одного или нескольких качественных факторов на рассматриваемую величину .

Схему однофакторного дисперсионного анализа можно рассмотреть на примере исследования влияния различных факторов рекламы на прибыль предприятия.

Если разделить виды рекламы на несколько групп (уровни фактора) и через одинаковые интервалы времени измерять прибыль, то результаты можно представить в виде таблицы:

Номер измерения Уровни фактора
Групповая средняя

 

Число измерений на каждом уровне считаем одинаковым и равным . В последней строке помещены групповые средние для каждого уровня фактора.

Общую среднюю можно получить как среднее арифметическое групповых средних:

.

На разброс прибыли относительно общей средней влияют как изменение уровня рассматриваемого фактора, так и случайные факторы.

Для того чтобы учесть влияние данного фактора, общая выборочная дисперсия разбивается на две части, одна из которых называется факторной , а вторая - остаточной .

Для учёта этих составляющих вначале рассчитывается общая сумма квадратов отклонений вариант от общей средней:

И факторная сумма квадратов отклонений групповых средних от общей средней, которая и характеризует влияние данного фактора:

Последнее выражение получено путём замены каждой варианты в выражении - групповой средней для данного фактора.

Остаточная сумма квадратов отклонений получается как разность:

Для определения общей выборочной дисперсии необходимо разделить на число измерений :

а для получения несмещённой общей выборочной дисперсии это выражение нужно умножить на :

где - число отклонений свободы несмещённой факторной выборочной дисперсии.

Для несмещённой остаточной выборочной дисперсии число степеней свободы будет равно разности:

,

и выражение дисперсии примет вид:

.

С целью оценки влияния фактора на изменения рассматриваемого параметра рассчитывается величина:

Так как отклонение двух выборочных дисперсий и распределено по закону Фишера-Снедекора, то полученное значение сравнивают со значением функции распределения в критической точке , соответствующей выбранному уровню значимости .

Если то фактор оказывает существенные воздействия и его следует учитывать, в противном случае он оказывает незначительное влияние, которым можно пренебречь.

Для расчёта и могут быть использованы также формулы:






Дата добавления: 2014-11-10; просмотров: 390. Нарушение авторских прав

Studopedia.info - Студопедия - 2014-2017 год . (0.093 сек.) русская версия | украинская версия