Студопедия — Парная линейная регрессия. Имеются данные о годовой цене программы «Мастер делового администрирования» и числе слушателей в образовательном учреждении. Цена программы, тыс
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Парная линейная регрессия. Имеются данные о годовой цене программы «Мастер делового администрирования» и числе слушателей в образовательном учреждении. Цена программы, тыс

Имеются данные о годовой цене программы «Мастер делового администрирования» и числе слушателей в образовательном учреждении.

Цена программы, тыс. долл., y     4,9   3,8 3,5 3,8 3,7 3,6 3,5 3,4    
Число слушателей, чел., x                          

I. Вводим исходные данные в документ Excel.

II. Вызываем надстройку Анализ данных в меню Сервис.

III. Выбираем инструмент Регрессия.

IV. Заполняем соответствующие позиции окна Регрессия.

V. После нажатия Ок получаем протокол решения задачи.

VI. Анализируем полученный протокол.

1) Коэффициент регрессии ;

Свободный член уравнения регрессии .

Примечание. При необходимости результаты округляются с нужной точностью. Требование по округлению можно провести изначально, задав количество знаков после запятой в меню Формат ячейки.

 

Уравнение парной линейной регрессии имеет вид: .

2) Коэффициент корреляции , что свидетельствует о тесной связи признаков y и x. Коэффициент детерминации . Полученное уравнение регрессии объясняет 53% вариации признака y, остальные 47% изменчивости этого признака обусловлены влиянием неучтенных в модели факторов.

3) Оценим статистическую значимость (надежность моделирования) уравнения в целом. Расчетное значение критерия Фишера указано в протоколе, . Критическое значение этого критерия можно найти с помощь статистической функции FРАСПОБР табличного редактора Еxcel.

Входными параметрами этой функции являются:

– уровень значимости (вероятность), имеется в виду вероятность ошибки отвергнуть верную гипотезу о статистической незначимости построенного уравнения регрессии. Как правило, выбирают уровень значимости, равный 0,05 или 0,01;

– число степеней свободы 1 – совпадает с количеством параметров при переменной в уравнении регрессии, для парной линейной регрессии это число равно единице;

– число степеней свободы 2 равно для парной линейной регрессии , где n – объем исходных статистических данных.

Выполняем действия Вставка/Функция, выбираем нужное.

Поскольку расчетное значение F-критерия больше табличного, равного 4,84, нулевая гипотеза об отсутствии значимой связи признаков x и y отклоняется и делается вывод о существенности этой связи.

4) Оценим статистическую значимость параметров a и b в уравнении регрессии с помощью t - критерия Стъюдента.

Расчетные значения статистики Стъюдента , . Соответствующее табличное значение можно определить через статистическую функцию СТЪЮДРАСПОБР, число степеней свободы равно .

Поскольку фактические значения по абсолютной величине превышают табличное, равное 2,2, гипотезу о несущественности параметров регрессии можно отклонить.

5) Определим среднюю ошибку аппроксимации, . Понадобится выполнение вспомогательных расчетов, оформленных в виде таблицы.

  x y
      5,440500341 31,99374573
      5,143440944 2,868818882
  4,9   5,024617185 2,543207862
      4,846381547 21,15953867
  3,8   4,54932215 19,71900394
  3,5   4,430498391 26,58566831
  3,8   4,252262752 11,90165138
  3,7   3,955203355 6,897387976
  3,6   3,658143958 1,615109941
  3,5   3,598732078 2,820916526
  3,4   3,361084561 1,144571747
      2,766965766 7,767807796
      2,172846972 27,57176761
Среднее 4,092307692 27,69230769   12,66070741

Таким образом, средняя ошибка аппроксимации по данному уравнению регрессии составляет 12,66%, модель парной линейной регрессии можно признать удовлетворительной и пригодной для прогнозирования.

6) Выполним количественную оценку влияния фактора x на фактор y, используя коэффициент эластичности. Для парной линейной регрессии его можно найти по формуле . Имеем

.

Следовательно, при увеличении количества слушателей на 1% годовая цена уменьшится на 0,4%.

7) Выполним расчет прогноза y при увеличении фактора x на 25% от среднего.

Прогнозное значение .

Точечный прогноз признака y: .

Средняя ошибка прогноза равна ,

где – остаточная дисперсия, –дисперсия фактора x.

Численное значение суммы в протоколе обозначено как остаточное SS.

Тогда , .

Самый быстрый способ получения вспомогательных характеристик – среднего значения фактора x и - дисперсии, воспользоваться инструментом Описательная статистика в пакете Анализ данных.

Протокол вывода результатов имеет вид

Имеем .

Тогда .

Доверительный интервал прогноза: , где – соответствующее табличное значение критерия Стъюдента (найдено ранее по функции СТЪЮДРАСПОБР, ).

Следовательно,

;

,

т.е. можно быть уверенным на 95%, что цена годового курса при 35 слушателях будет варьироваться в указанных пределах (при точечном прогнозе цены в 3,65825 тыс. долл.).

8) Для построения диаграммы выполним следующие действия:

Шаг 1 Вставка/ Диаграмма/График

Шаг 2 Далее/Диапазон/ Выделить столбец исходных значений фактора y

Шаг 3 Ряд/Добавить/Значения/ Выделить столбец регрессионных значений фактора – .

Шаг 4 Подписи оси X/ Выделить столбец значений x.

Шаг 4 Каждому из рядов присвоить имя, подписать оси координат и название диаграммы.

Примечание.

Для построения диаграммы значения фактора x должны быть отсортированы по возрастанию с сохранением соответствующего значения y. Это может быть сделано так Данные/Сортировка/ Выделить столбец, в котором необходимо сделать сортировку. Например,

 

Задания для самостоятельной работы

Вариант 1

x – энерговооруженность на 10-ти предприятиях, кВт;

y – производительность труда, тыс. руб.

x 2,8 2,2   3,5 3,2 3,7   4,8   5,4
y 6,7 6,9 7,2 7,3 8,4 8,8 9,1 9,8 10,6 10,7

Вариант 2

x – энерговооруженность на 10-ти предприятиях, кВт;

y – производительность труда, тыс. руб.

 

x 3,2 3,7   4,8   5,4 5,2 5,4    
y 8,4 8,8 9,1 9,8 10,6 10,7 11,1 11,8 12,1 12,4

Вариант 3

x – качество земли, баллы;

y – урожайность, ц/га.

x                    
y 19,5   20,5   20,8 21,4   23,3   24,5

Вариант 4

x – качество земли, баллы;

y – урожайность, ц/га.

x                    
y 24,2     26,8 27,2     30,2    

Вариант 5

x – товарооборот;

y –издержки обращения по отношению к товарообороту.

x                
y     7,5   6,3 5,8 5,4  

Вариант 6

x – электровооруженность на одного рабочего;

y – выпуск готовой продукции на одного рабочего.

x                    
y                    

Вариант 7

x –уровень доходов семьи;

y – расходы на продукты питания (в расчете на 100 руб. доходов).

x 1,4 3,3 5,5 7,6 9,8   14,7 18,9
y 1,1 1,4   2,4 2,8 3,1 3,5  

Вариант 8

x – качество земли, баллы;

y – урожайность, ц/га.

x                
y   23,3   24,5 24,2      

Вариант 9

x – производительность труда;

y – рентабельность производства.

x 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8
y 2,6 2,4 3,3 2,9 3,7 4,2 5,5 6,4

Вариант 10

x – производительность труда;

y – рентабельность производства.

x 0,9 1,5   2,5 2,8   1,2 1,4
y 3,1 5,1 5,9 6,1 7,2 8,1 3,8 5,3

 

Парная линейная регрессия

Предварительные расчеты:

; ; ; ; ;

; .

Построение таблицы вида

  x y xy
………… ………. ……… …….. ……… ………
Среднее значение          

 

Формулы для расчетов параметров:

, .

При компьютерном подборе использовать встроенную функцию Линейн

Оценка тесноты связи:

а) коэффициент корреляции , или ;

При компьютерном подборе использовать встроенную функцию Коррел

б) коэффициент эластичности ;

в) коэффициент детерминации .

Оценка значимости уравнения регрессии в целом:

Предварительные расчеты с построением таблицы вида

  x y
………… ………. ……… …….. ……… ………  

а) F -критерий Фишера при числе степеней свободы и и уровне значимости 0,05 смотреть в таблице. Расчетное значение критерия:

 

.

Если расчетное значение F- критерия больше табличного, нулевая гипотеза об отсутствии значимой связи признаков x и y отклоняется, и делается вывод о существенности этой связи.

б) Средняя ошибка аппроксимации

.

Оценка значимости параметров регрессии:

а) Стандартная ошибка параметра a рассчитывается по формуле

, где .

б) Стандартная ошибка коэффициента регрессии b рассчитывается по формуле

.

в) Стандартная ошибка коэффициента корреляции рассчитывается по формуле

.

t -критерий Стъюдента при числе степеней свободы и уровне значимости 0,05 смотреть в таблице.

Фактические значения t -статистики:

,,.

Если фактическое значение по абсолютной величине превышает табличное, гипотезу о несущественности параметра регрессии можно отклонить, параметр признается значимым.

Связь между F -критерием Фишера и t -критерием Стъюдента выражается равенством

.

Расчет доверительных интервалов для параметров регрессии:

Доверительный интервал для параметра a определяется как ;

доверительный интервал для коэффициента регрессииопределяется как .

При компьютерном анализе использовать в Excel Сервис/Анализ данных/Регрессия.

Интервальный прогноз на основе линейного уравнения регрессии:

Пусть – прогнозное значение факторного признака; – точечный прогноз результативного признака. Тогда

а) средняя ошибка прогноза :

;

б) доверительный интервал прогноза

.

Практические рекомендации по выполнению расчетов

с помощью табличного редактора MS Excel




<== предыдущая лекция | следующая лекция ==>
 | 

Дата добавления: 2015-10-19; просмотров: 1242. Нарушение авторских прав; Мы поможем в написании вашей работы!



Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Философские школы эпохи эллинизма (неоплатонизм, эпикуреизм, стоицизм, скептицизм). Эпоха эллинизма со времени походов Александра Македонского, в результате которых была образована гигантская империя от Индии на востоке до Греции и Македонии на западе...

Демографияда "Демографиялық жарылыс" дегеніміз не? Демография (грекше демос — халық) — халықтың құрылымын...

Субъективные признаки контрабанды огнестрельного оружия или его основных частей   Переходя к рассмотрению субъективной стороны контрабанды, остановимся на теоретическом понятии субъективной стороны состава преступления...

Экспертная оценка как метод психологического исследования Экспертная оценка – диагностический метод измерения, с помощью которого качественные особенности психических явлений получают свое числовое выражение в форме количественных оценок...

В теории государства и права выделяют два пути возникновения государства: восточный и западный Восточный путь возникновения государства представляет собой плавный переход, перерастание первобытного общества в государство...

Закон Гука при растяжении и сжатии   Напряжения и деформации при растяжении и сжатии связаны между собой зависимостью, которая называется законом Гука, по имени установившего этот закон английского физика Роберта Гука в 1678 году...

Studopedia.info - Студопедия - 2014-2024 год . (0.014 сек.) русская версия | украинская версия