Решение. 1. Получение протокола расчета1. Получение протокола расчета. Операция проводится с помощью инструмента Анализ данных/Регрессия. Она аналогична расчету параметров парной линейной регрессии, рассмотренной выше, только в отличие от парной регрессии при заполнении строки входной интервал X в диалоговом окне следует указать сразу все столбцы значений факторных переменных. Результаты анализа имеют вид:
2. Оцениваем статистическую значимость в целом. Изучив результаты, отмечаем, что в целом полученное уравнение линейной множественной регрессии является статистически значимым. Действительно, . Сравним это число с табличным значением критерия Фишера, полученным при числе степеней свободы и , где n – число наблюдений, m – число параметров при переменной x. В нашем случае , . Табличное значение даст функция FРАСПОБР. , что существенно меньше расчетного значения. О доле вариации результативного признака y, объясненной построенным уравнением множественной регрессии лучше всего судить по значению нормированного коэффициента корреляции, в данном случае он равен 0, 9363. То есть построенное уравнение объясняет почти 94% всей вариации признака y. 3. Оцениваем статистическую значимость по отдельным параметрам. Чтобы оценить статистическую значимость параметров регрессионной модели с помощью t -критерия, найдем соответствующее нашим параметрам табличное значение с помощью функции СТЪЮДРАСПОБР при заданном уровне значимости 0, 05 и числе степеней свободы . Коэффициент признается значимым, если выполняется неравенство . Имеем
Таким образом, ни один из факторов не имеет статистически значимого коэффициента регрессии, и построенное уравнение для прогнозирования непригодно. 4. Исследуем коллинеарность между факторами. Матрицу парных коэффициентов корреляции можно получить, используя инструмент Анализ данных/Корреляция. Заполнив диалоговое окно, получим следующий результат:
Для оценки мультиколлинеарности факторов вычислим определитель матрицы парных коэффициентов корреляции факторов. . Поскольку определитель матрицы межфакторной корреляции близок к нулю, имеем мультиколлинеарность факторов и вытекающую отсюда ненадежность результатов множественной регрессии. Оценка значимости мультиколлинеарности факторов может быть проведена методом испытания гипотезы о независимости переменных, т.е. . Доказано, что величина имеет приближенное распределение с числом степеней свободы . Если фактическое значение превосходит табличное (критическое), то гипотеза отклоняется, и мультиколлинеарность считается доказанной. Имеем . Критическое значение можно найти через статистическую функцию ХИ2ОБР( ), где – уровень значимости (по условию 0, 05), а n – число степеней свободы. В нашем случае степеней свободы . Получаем . . Мультиколлинеарностью факторов пренебречь нельзя. Особенно высока коллинеарность факторов и , . Один из этих факторов следует исключить из уравнения регрессии. Логично исключить тот, который имеет меньший коэффициент парной корреляции. Поскольку , а , исключаем фактор . 5. Построим регрессию на факторах и .
Получили результаты: , , , что много больше, чем .
Таким образом, при весьма удовлетворительной значимости уравнения регрессии в целом, мы добились значимости коэффициента регрессии при переменной . 6. а) Найдем коэффициенты эластичности: , (6.18) где – коэффициент «чистой» регрессии при факторе ; – среднее значение результативного признака; – среднее значение признака . Имеем
Таким образом, при изменении фактора ( среднего возраста работников ) на 1%, производительность возрастает незначительно, на 0, 03%; при изменении фактора ( энерговооруженности ) на 1%, производительность труда увеличивается на 0, 72%. б) Выполним прогнозирование. Максимальное наблюденное значение фактора – 750. Минимальное значение фактора – 31. Прогнозные значения факторов: ;. Тогда . в) Доверительный интервал для данного прогнозного значения y можно найти, зная предельную ошибку прогноза , где – соответствующее табличное значение критерия Стъюдента, а – ошибка прогнозного значения. В нашем случае . Ошибку прогнозного значения функции регрессии получим по формуле . 1. Параметр S – стандартная ошибка регрессии приведен в последней регрессионной статистике . 2. Матрица состоит из чисел: . То есть , . 3. Матрица X состоит из чисел . Составляем вспомогательную таблицу:
В данном случае, .
4. Транспонируем матрицу X. Поскольку она симметрическая, то . 5. Найдем произведение матриц . В Exсel это можно сделать с помощью функции МУМНОЖ.
6. Найдем обратную матрицу к матрице произведения . В Exсel это можно сделать с помощью функции МОБР.
7. Найдем произведение матриц (размерность матрицы произведения ).
8. Найдем произведение матриц (размерность матрицы произведения , то есть только одно число). . 9. . 10. . 11. Таким образом, прогнозное значение результата будет с вероятностью 95% находиться в интервале . Задания. Вариант 1
Вариант 2
Вариант 3
Вариант 4
Вариант 5
Вариант 6
Вариант 7
Вариант 8
Вариант 9
Вариант 10
|