Точечные и интервальные оценки линейной модели

⇐ Предыдущая 13 14 15 16 171819 20 21 22 Следующая ⇒

Цель работы: освоение методов оценки уравнения линейной регрессии, определения значимости её параметров и уравнения в целом и построения доверительных интервалов для параметров модели, для линии регрессии и для индивидуальных значений зависимой переменной.

Исходные положения. Для осуществления надежного прогнозирования изменения производственно-экономических процессов необходимо с определить доверительные интервалы, в которые с заданной вероятностью попадают истинные значения анализируемой величины. Порядок проведения расчетов рассмотрим на следующей ситуации.

Таблица 3.

Данные по среднедневной заработной плате у_i, руб. и среднедушевому прожиточному минимуму в день одного трудоспособного х _i, руб.

Требуется:

1. Построить выборочное уравнение линейной парной регрессии (найти значения коэффициентов b ₁, b ₀).

2. Рассчитать значение выборочного коэффициента корреляции r_xy, общую сумму квадратов Q, сумму квадратов, объясненную регрессией Q_r, остаточную сумму квадратов Q_е, несмещенные оценки соответствующих дисперсий S ², S ²_R, S ²_e_, средних квадратических отклонений S, S _R, S _e_, выборочный коэффициент детерминации R ² _yx и стандартные отклонения коэффициентов регрессии Sb ₁, Sb ₀.

3. На уровне значимости α = 0, 05 оценить значимость коэффициентов и уравнения регрессии. Найти доверительные интервалы для значимых коэффициентов регрессии и значений у_i _.

4. Построить графики зависимостей у_i, и от х_i, а также доверительные интервалы для значений у_i, и .

5. Проверить полученные результаты с помощью стандартных статистических функций ТЕНДЕНЦИЯ, ЛИНЕЙН и программы РЕГРЕССИЯ из пакета анализа Мiсrоsоft Ехсеl.

Решение

1. Для определения параметров уравнения линейной регрессии строим расчетную таблицу (Рис. 1.4).

2. Строим выборочное уравнение регрессии. Находим выборочные средние:

и, используя Мастер функций Мiсrоsоft Ехсеl, проверяем полученные значения с помощью стандартной функции СРЗНАЧ (-) из категории Статистические, подставляя в нее в качестве аргументов-столбцов векторы соответствующих переменных (например, x = (x ₁ x ₂ … x _n)^т, y = (y ₁ y ₂ … y _n)^т и т.д.).

Рис. 24. Исходные данные и доверительные интервалы

Находим значения выборочных дисперсий и средних квадратических отклонений

и проверяем полученные значения с помощью стандартных статистических функций ДИСПР (-) и СТАНДОТКЛОНП (-) соответственно.

Находим выборочный коэффициент ковариации

и проверяем полученное значение с помощью стандартной статистической функции КОВАР (х; у)

Рассчитываем значения выборочных коэффициентов регрессии

и проверяем полученные значения с помощью стандартных статистических функций НАКЛОН (у; х) и ОТРЕЗОК (у; х) соответственно.

Величина коэффициента b ₁ показывает, что с увеличением прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0, 92 руб. Параметр b ₀ мы не интерпретируем, поскольку в выборке отсутствуют значения х_i факторного признака, близкие к нулю.

3. Рассчитываем значение выборочного коэффициента корреляции по формуле

и проверяем полученное значение с помощью стандартной статистической функции КОРРЕЛ (х; у).

Подставляя рассчитанные значения b ₀ и b ₁ в формулу находим величины , (i = 1, 2,..., n). Для одного, произвольно выбранного k -го значения , отвечающего аргументу х_k, проверяем полученный результат с помощью стандартной статистической функции ПРЕДСКАЗ (х_k, y; х).

Вычисляем значения и рассчитываем соответствующие суммы квадратов, дисперсия на степень свободы и средние квадратические отклонения:

Полученное значение стандартной ошибки S_e проверяем с помощью статистической функции СТОШYХ (у; x).

Рассчитываем величину выборочного коэффициента детерминации

и проверяем полученное значение с использованием эквивалентного выражения R²_xy = r²_xy а также с помощью стандартной статистической функции КВПИРСОН (у; х).

Величина коэффициента R²_xy показывает, что 52% вариации зависимой переменной объясняется вариацией предикторной переменной, а остальные 48% - влиянием неучтенных и случайных факторов.

Находим стандартные отклонения оценок коэффициентов регрессии по формулам

Теперь выборочное уравнение регрессии можно записать в общепринятом виде (под коэффициентами в скобках указаны их стандартные отклонения):

(24, 21) (0, 2797)

4. Вычисляем статистики критерия значимости коэффициентов регрессии:

Находим значение критической точки с помощью стандартной статистической функции СТЬЮДРАСПОБР(α; n-m-1) для заданного уровня значимости α = 0, 05:

t_кр (α; k = n – m –1) = 2, 228, (n – m –1 = 12 – 2 =10).

Поскольку | tb_j |> t_кр, с уровнем значимости 0, 05 (с доверительным уровнем 95%) делаем вывод о том, что коэффициенты β ₀ и β ₁значимы.

Вычисляем Р -значения для коэффициентов с помощью статистической функции СТЬЮДРАСП (| tb_j |, n – m –1; хвосты):

Рb ₀ = 0, 0098 - для коэффициента β ₀;

Рb ₁ = 0, 0081 - для коэффициента β ₁;

хвосты = 2 – двустороннее t -распределение.

В силу того, что Рb_j < α, вывод о значимости коэффициентов регрессии подтверждается.

Определяем значение F -статистики по формуле

и проверяем полученное значение с использованием эквивалентных формул – формулы и соотношения .

Критическое значение статистики Фишера - Снедекора для заданного уровня значимости α = 0, 05 находим с помощью стандартной статистической функции FРАСПОБР (α; m; n-m-1)

F_кр = (α; k ₁= m =1; k ₂= n - m -1=10) = 4, 96,

проверяя полученное значение по формуле .

В силу того, что F > F _кр, с доверительным уровнем 0, 95 делаем вывод о том, что уравнение регрессии значимо.

Вычисляем величину Р -значения с помощью статистической функции FРАСП (F; k ₁ = m =1; k ₂ = n - m -1=10)

р = 0, 008.

Поскольку p < α, вывод о значимости уравнения регрессии подтверждается.

Рис. 25. Проверка значимости модели

Нижние и верхние границы доверительного интервала коэффициентов регрессии β _j (нижние и верхние γ •100%) согласно (1.20) найдем по формулам

β ₁ _min = b ₁ – t _кр Sb ₁ = 0, 297; β ₁ _max = b ₁ + t _кр Sb ₁ = 1, 544;

β ₀ _min = b ₁ – t _кр Sb ₀ = 23, 03; β ₀ _max = b ₀ + t _кр Sb ₀ = 130, 92.

Для получения доверительного интервала для линии регрессии находим несмещенную оценку дисперсии прогноза величин у, соответствующих значениям по формуле

и, вычисляя корень, определим значения Sе_i.

Нижние и верхние границы доверительного интервала для математического ожидания зависимой величины определяем по формуле

y_min< M_x(Y) < y_max,

где

и приводим их величины в табл. 24.

Для получения доверительного интервала для индивидуальных значений зависимой переменной находим несмещенную оценку дисперсии прогноза величин у, соответствующих значениям по формуле

и, вычисляя корень, определим значения Sе_i.

Нижние и верхние границы доверительного интервала для значений у_i определяем по формуле

y_{i min}< y_i < y_{i max},

где

и приводим их величины в табл. 24.

5. При построении графиков используем Мастер диаграмм Мiсrоsoft Ехсеl в следующем порядке.

Шаг 1 - тип диаграммы. На вкладке Стандартные выбираем Точечную диаграмму, позволяющую сравнить пары значений. Нажимаем кнопку Далее.

Шаг 2 - источник данных диаграммы. На вкладке диапазон данных выделяем диапазон (х; у) и указываем, что ряды находятся в столбцах. Переходим на вкладку Ряд. В поле Графика просматриваем полученный результат. В поле Имя указываем название «у».

Последовательно нажимая кнопку Добавить, добавляем ряды значений аналогичным образом и задаем названия «у_р», «у_min», «у_max». После просмотра результатов нажимаем кнопку Далее.

Шаг 3 - параметры диаграммы. На вкладке Заголовки в полях Название диаграммы, Ось Х (категорий) и Ось Y (значений) задаем соответствующие названия «Зависимость среднедневной заработной платы, руб. от среднедушевого прожиточного минимума в день, руб.», «Среднедушевой прожиточный минимум в день, руб.» и «Среднедневная заработная плата, руб.». На вкладке Линии сетки добавляем основные линии на оси Х (категорий). Остальные вкладки оставляем без изменения. После просмотра результатов нажимаем кнопку Далее.

Шаг 4 - размещение диаграммы. Помещаем диаграмму на имеющемся листе и нажимаем кнопку Готово.

В результате получаем диаграмму, показанную на рис. 26.

Рис. 26. Диаграмма

Y - исходные данные (y_i); Y_p - линейная регрессия (); Y_min - нижняя граница доверительного интервала для линии регрессии (); Y_max - верхняя граница доверительного интервала для линии регрессии (); Y_min_инд - нижняя граница доверительного интервала для индивидуальных значений; Y_max_инд- верхняя граница доверительного интервала для индивидуальных значений.

Параметры полученной диаграммы можно изменять, используя меню Диаграмма или контекстное меню, вызываемое щелчком правой кнопки мыши.

В частности, целесообразно задать новые значения шкалы осей, чтобы расположить графики наилучшим образом. Для этого необходимо выбрать команду Формат оси и на вкладке Шкала задать требуемые величины в полях Минимальное значение, Максимальное значение и Цена основных делений, убрав флажки из соответствующих полей Авто.

Для более наглядного представления результатов необходимо выбрать ряд у_р, с помощью контекстного меню выбрать команду Формат ряда данных и на вкладке Вид задать параметры линии н маркера (можно также вызвать команду Добавить линию тренда и в поле Линия тренда на вкладке Тип выбрать поле Линейная). Для рядов и аналогичным образом добавляется линия тренда Полиномиальная при значении степени, равном 2 (по умолчанию).

С помощью команды Формат линии тренда при необходимости на вкладке Вид выбирается тип, цвет и толщина линии, а на вкладке Параметры - название аппроксимирующей кривой и величина интервала прогноза вперед или назад на заданное число единиц. Здесь также задается возможность показать уравнение регрессии и коэффициент детерминации в поле диаграммы.

6. Для определения значений результативного признака по линейному уравнению регрессии с помощью стандартной статистической функции ТЕНДЕНЦИЯ выполняем следующие операции:

в расчетной таблице (рис. 24) озаглавливаем столбец (например, символом «у _р» или словом «тенденция» и выделяем 12 значащих позиций этого столбца (i = 1, 2,..., n);

• с помощью Мастера функций выбираем статистическую функцию ТЕНДЕНЦИЯ;

• в поля Изв_знач _ у и Изв_знач _ х вводим значения векторов у и х соответственно;

• поле Нов_знач_х оставляем пустым (при этом предполагается, что Нов_ знач_х совпадают с Изв_знач_х);

• поле Константа оставляем пустым (если Константа имеет значение ИСТИНА, 1 или опущена, то коэффициент b ₀ вычисляется обычным образом, если Константа имеет значение ЛОЖЬ или 0, то коэффициент b ₀ полагается равным нулю);

• контролируем результат решения в окне функции (первый элемент массива) = 148, 770;

• для получения массива результатов (вывода формулы массива) нажимаем комбинацию клавиш Ctrl+Shift+Enter (в выделенном столбце появятся результаты вычислений).

Для определения параметров линейного уравнения регрессии с помощью стандартной статистической функции ЛИНЕЙН выполняем следующие операции:

• с целью лучшего восприятия результатов строим вспомогательную таблицу, которая в наших обозначениях имеет вид (табл. 4), и выделяем в ней свободные ячейки;

Таблица 4.

Вспомогательная таблица для функции ЛИНЕЙН

b₁			b₀
Sb₁			Sb₀
R²_xy			S_е
F			df
Q_r			Q_e

• с помощью Мастера функций выбираем статистическую функцию ЛИНЕЙН;

• в поля Изв_знач_у и Изв_знач_х вводим значения векторов у и х соответственно;

• поле Константа оставляем пустым (если Константа имеет значение ИСТИНА, 1 или опущена, то коэффициент b ₀ вычисляется обычным образом, если Константа имеет значение ЛОЖЬ или 0, то коэффициент b ₀ полагается равным нулю);

• в поле Стат вводим значение ИСТИНА или 1 (если Стат имеет значение ИСТИНА или 1, то вычисляется дополнительная статистика - строки 3-6 в табл. 4, если Стат имеет значение ЛОЖЬ, 0 или опущена, то вычисляются только значения коэффициентов и - вторая строка в табл. 4);

• контролируем результат решения в окне функции (первый элемент массива) b ₁ = 0, 920431;

• для получения массива результатов (вывода формулы массива) нажимаем комбинацию клавиш Ctrl+Shift+Enter;

• в выделенных ячейках появятся результаты вычислений, представленные в табл. 5 (b ₁, b ₀ - выборочные оценки коэффициентов регрессии; Sb ₁, Sb ₀ - стандартные отклонения коэффициентов регрессии; R²_xy - выборочный коэффициент детерминации; S_e - значение стандартной ошибки; F - значение F -статистики для уравнения регрессии; df = n -2 - число степеней свободы; Q_r и Q_e - факторная и остаточная суммы квадратов соответственно).

Таблица 5.

Результаты расчета

b₁	0, 920431	76, 97649	b₀
Sb₁	0, 279716	24, 21156	Sb₀
R²_xy	0, 519877	12, 54959	S_е
F	10, 82801		df
Q_r	1705, 328	1574, 922	Q_e

Для получения решения с помощью подпрограммы РЕГРЕССИЯ из пакета анализа выполняем следующие операции:

• выбираем команду Анализ данных в меню Сервис (если она отсутствует, необходимо в меню Сервис выбрать команду Надстройки и в появившемся окне диалога выбрать пункт Пакет анализа);

• в окне Анализ данных выбираем инструмент Регрессия (при использовании этого инструмента данные обязательно должны быть расположены по столбцам);

• в категории Входные данные в поля Входной интервал Y и Входной интервал Х вводим значения векторов у и х соответственно, а остальные поля оставляем пустыми (флажок в поле Метки ставится, если в соответствующие входные интервалы включены названия столбцов; флажок в поле Константа - ноль ставится, когда коэффициент b ₀ полагается равным нулю; флажок в поле Уровень надежности ставится в случаях, когда необходимо задать величину доверительного уровня γ •100%, отличную от 95%);

• в категории Параметры вывода оставляем переключатель в положении Новый рабочий лист, при необходимости задавая имя листа в поле ввода рядом с параметром (этот параметр вставляет новый лист в рабочую книгу и располагает результаты, начиная с ячейки А1 нового листа; параметр Выходной интервал позволяет ввести ссылку для левой верхней ячейки интервала, в который выводятся результаты на текущем рабочем листе; параметр Новая рабочая книга создает новую рабочую книгу, добавляя в нее новый лист и вставляя результаты в ячейку А1 этого листа);

• в категории Остатки ставим флажки в полях Остатки, Стандартизированные остатки, График остатков, График подбора. Последний позволяет вывести точечные графики зависимости наблюдаемых у и теоретических результативных значений от факторных признаков x_i;

• в категории Нормальная вероятность ставим флажок в поле График нормальной вероятности. Это позволяет вывести точечный график зависимости наблюдаемых значений у от автоматически формируемых интервалов персентилей.

Результаты расчетов выводятся в виде пяти таблиц и трех диаграмм. Содержание таблиц под общим названием Вывод итогов показано на рис. 27.

Таблица Регрессионная статистика. В таблице представлены:

• Множественный R - множественный выборочный коэффициент корреляции R_xy, равный квадратному корню из коэффициента детерминации и, для парной регрессии, совпадающий с выборочным коэффициентом корреляции r_xy;

• R-квадрат - коэффициент детерминации R²_xy;

• Нормированный R-квадрат - для парной регрессии определяется выражением (вычисление этого коэффициента целесообразно только для множественной регрессии); m – число факторных признаков;

• Стандартная ошибка - корень из несмещенной оценки остаточной дисперсии

• наблюдения - число наблюдений в выборке n.

Рис. 27. Вывод итогов расчета параметров линейной регрессионной модели

Таблица Дисперсионный анализ. В таблице представлены (по столбцам соответственно для строк Регрессия, Остаток, Итого):

• df - число степеней свободы (df = m - для объясненной дисперсии, df = n - m -1 - для остаточной дисперсии, df = n – 1 - для общей дисперсии df = m + n - m -1);

• SS – сумма квадратов (, объясненная регрессией, - остаточная, - общая);

• MS – несмещенные оценки дисперсий ( - объясненная регрессией, - остаточная);

• F - вычисленное значение статистики Фишера - Снедекора

• Значимость F - величина Р -значения для выборочного уравнения регрессии,

Таблица с информацией о праметрах выборочного уравнения регрессии. В ней по столбцам соответственно для строк Y-пересечение (коэффициент b ₀) и Переменная Х1 (коэффициент b ₁) представлены:

• Коэффициенты - значения коэффициентов b ₀ и b ₁;

• Стандартная ошибка - стандартные отклонения коэффициентов регрессии Sb ₀ и Sb ₁;

• t -статистика - статистики критерия значимости tb ₀ и tb ₁ коэффициентов регрессии β ₀ и β ₁;

• Р -значения - величины Р -значений Рb ₀ и Рb ₁ для коэффициентов β ₀ и β ₁;

• Нижние 95% и Верхние 95% - значения соответствующих интервальных оценок β _j _min = b _j – t _кр Sb _j и β _{j max} = b _j + t _кр Sb _j для коэффициентов β _j при уровне значимости α = 0, 05, γ •100% = 95% (в случае задания другого доверительного уровня, например γ =1-α = 0, 9, в этих столбцах все равно будут указаны 95% границы, а в следующих двух столбцах - 90%).

Таблица Вывод остатка. В таблице представлены:

• Наблюдение - порядковые номера i выборочных значений у_i и х_i, (i = 1, 2, …, n);

• Предсказанное Y – значения рассчитанные по выборочному уравнению регрессии = b₀ + b₁ x_i;

• Остатки - значения остатков регрессии е_i (выборочная оценка возмущений ε _i);

• Стандартные остатки - значения нормированных

остатков регрессии , где ;

Таблица Вывод вероятности. В таблице представлены:

• Персентиль - рассчитывается для каждого значения у_i как сумма предшествующего вычисленного значения персентиля и шага h = 100%/n (при этом начальное и конечное значения равны h / 2 и 100% - h / 2 соответственно);

• Y - значения у_i, расположенные в неубывающем порядке.

Три диаграммы (которые здесь не показаны) включают в себя:

• диаграмму Переменная Х1 График остатков - график зависимости е_i от x_i;

• диаграмму Переменная Х1 График подбора - графики зависимостей у_i и от x_i;

• диаграмму График нормального распределения, строящуюся по данным таблицы Вывод вероятности.

Порядок выполнения работы

1.Получить у преподавателя данные для расчета.

2.Ввести исходные данные в таблицу Excel.

3.Провести на ЭВМ серию расчетов по определению параметров регрессионной зависимости, точечных и интервальных оценок.

4.Построить графическую интерпретацию доверительных интервалов для линии регрессии и индивидуальных значений зависимой переменной.

5.Зафиксировать результаты расчетов в тетради.

6.Сделать выводы по результатам моделирования и записать в тетради.

Отчет по работе должен содержать

1.Название и цель работы.

2.Основные теоретические и методические положения.

3.Исходные данные для расчета.

4.Результаты расчета.

5.Выводы по результатам моделирования.

⇐ Предыдущая 13 14 15 16 171819 20 21 22 Следующая ⇒

Дата добавления: 2014-11-10; просмотров: 3937. Нарушение авторских прав; Мы поможем в написании вашей работы!

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

В теории государства и права выделяют два пути возникновения государства: восточный и западный Восточный путь возникновения государства представляет собой плавный переход, перерастание первобытного общества в государство...

Закон Гука при растяжении и сжатии Напряжения и деформации при растяжении и сжатии связаны между собой зависимостью, которая называется законом Гука, по имени установившего этот закон английского физика Роберта Гука в 1678 году...

Характерные черты официально-делового стиля Наиболее характерными чертами официально-делового стиля являются: • лаконичность...

Понятие о синдроме нарушения бронхиальной проходимости и его клинические проявления Синдром нарушения бронхиальной проходимости (бронхообструктивный синдром) – это патологическое состояние...

Опухоли яичников в детском и подростковом возрасте Опухоли яичников занимают первое место в структуре опухолей половой системы у девочек и встречаются в возрасте 10 – 16 лет и в период полового созревания...

Способы тактических действий при проведении специальных операций Специальные операции проводятся с применением следующих основных тактических способов действий: охрана...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия