Активизация надстройки Пакет анализа
Для активизации надстройки Пакет анализа необходимо выполнить следующие действия: 1. Выбрать команду Сервис/Надстройки. 2. В появившемся диалоговом окне установить флажок Пакет анализа. В соответствии с вариантом задания, используя статистический материал, необходимо: 1. Рассчитать параметры уравнения линейной парной регрессии . 2. Оценить тесноту связи зависимой переменной (результативного фактора) с объясняющей переменной с помощью показателей корреляции и детерминации. 3. Оценить с помощью F -критерия Фишера статистическую надежность моделирования. 4. Оценить статистическую значимость параметров регрессии. 5. Определить среднюю ошибку аппроксимации. 6. Используя коэффициент эластичности, выполнить количественную оценку влияния объясняющего фактора на результат. 7. Выполнить точечный и интервальный прогноз результативного признака y при увеличении объясняющего признака x на 25% от его среднего значения (достоверность прогноза 95%). 8. На одной диаграмме изобразить поле корреляции исходных данных и прямую регрессии. Пример Имеются данные о годовой цене программы «Мастер делового администрирования» и числе слушателей в образовательном учреждении.
I. Вводим исходные данные в документ Excel. II. Значения фактора x должны быть отсортированы по возрастанию с сохранением соответствующего значения y. Это может быть сделано так Данные/Сортировка/ Выделить столбец, в котором необходимо сделать сортировку. Например, III. Вызываем надстройку Анализ данных в меню Сервис. IV. Выбираем инструмент Регрессия. V. Заполняем соответствующие позиции окна Регрессия. VI. После нажатия ОK получаем протокол решения задачи. VII. Анализируем полученный протокол. 1) Параметры уравнения линейной парной регрессии . Коэффициент регрессии ; Свободный член уравнения регрессии . Примечание. При необходимости результаты округляются с нужной точностью. Требование по округлению можно провести изначально, задав количество знаков после запятой в меню Формат ячейки.
Уравнение парной линейной регрессии имеет вид: . 2) Оцениваем тесноту связи зависимой переменной (результативного фактора) с объясняющей переменной с помощью показателей корреляции и детерминации. Коэффициент корреляции , что свидетельствует о тесной связи признаков y и x. Коэффициент детерминации . Полученное уравнение регрессии объясняет 53% вариации признака y, остальные 47% изменчивости этого признака обусловлены влиянием неучтенных в модели факторов. 3) Оцениваем с помощью F -критерия Фишера статистическую надежность моделирования. Расчетное значение критерия Фишера указано в протоколе, . Критическое значение этого критерия можно найти с помощь статистической функции FРАСПОБР табличного редактора Еxcel. Входными параметрами этой функции являются: – уровень значимости (вероятность), имеется в виду вероятность ошибки отвергнуть верную гипотезу о статистической незначимости построенного уравнения регрессии. Как правило, выбирают уровень значимости, равный 0, 05 или 0, 01; – число степеней свободы 1 – совпадает с количеством параметров при переменной x в уравнении регрессии, для парной линейной регрессии это число равно единице; – число степеней свободы 2 равно для парной линейной регрессии , где n – объем исходных статистических данных. Выполняем действия Вставка/Функция, выбираем нужное. Вывод: поскольку расчетное значение F-критерия больше критического, равного 4, 84, нулевая гипотеза об отсутствии значимой связи признаков x и y отклоняется и делается вывод о существенности этой связи. 4) Оценить статистическую значимость параметров регрессии. Оценим статистическую значимость параметров a и b в уравнении регрессии с помощью t - критерия Стъюдента. Расчетные значения статистики Стъюдента берем из протокола (графа t -статистика): , . Соответствующее критическое значение можно определить через статистическую функцию СТЪЮДРАСПОБР, число степеней свободы равно . Вывод: поскольку фактические значения по абсолютной величине превышают табличное, равное 2, 2, гипотезу о несущественности параметров регрессии можно отклонить. 5) Определяем среднюю ошибку аппроксимации. Вычисляем среднюю ошибку аппроксимации, . Понадобится выполнение вспомогательных расчетов, оформленных в виде таблицы.
Вывод: средняя ошибка аппроксимации по данному уравнению регрессии составляет 12, 66%, модель парной линейной регрессии можно признать удовлетворительной и пригодной для прогнозирования. 6) Используя коэффициент эластичности, выполним количественную оценку влияния объясняющего фактора на результат. Для парной линейной регрессии эластичность можно найти по формуле . Имеем . Следовательно, при увеличении количества слушателей на 1% годовая цена уменьшится на 0, 4%. 7) Выполним расчет прогноза y при увеличении фактора x на 25% от своего среднего значения. Среднее значение (чел). Прогнозное значение . Точечный прогноз признака y вычисляем по построенному уравнению линейной регрессии: , . Средняя ошибка прогноза вычисляем по формуле , где – остаточная дисперсия, –дисперсия фактора x. Численное значение суммы в протоколе обозначено как остаточное SS. Тогда , . Самый быстрый способ получения вспомогательных характеристик – среднего значения фактора x и - дисперсии, воспользоваться инструментом Описательная статистика в пакете Анализ данных.
Протокол вывода результатов имеет вид Имеем .+ Тогда . Доверительный интервал прогноза: , где –критическое значение критерия Стъюдента (найдено ранее по функции СТЪЮДРАСПОБР, при уровне значимости ). Следовательно, ; , т.е. можно быть уверенным на 95%, что цена годового курса при 35 слушателях будет варьироваться в указанных пределах (при точечном прогнозе цены в 3, 65825 тыс. долл.). 8) Для построения диаграммы выполним следующие действия: Шаг 1 Вставка/ Диаграмма/График
Шаг 2 Далее/Диапазон/ Выделить столбец исходных значений фактора y
Шаг 3 Ряд/Добавить/Значения/ Выделить столбец регрессионных значений фактора – .
Шаг 4 Подписи оси X / Выделить столбец значений x. Шаг 4 Каждому из рядов присвоить имя, подписать оси координат и название диаграммы.
Задания для самостоятельной работы Вариант 1 x – энерговооруженность на 10-ти предприятиях, кВт; y – производительность труда, тыс. руб.
Вариант 2 x – энерговооруженность на 10-ти предприятиях, кВт; y – производительность труда, тыс. руб.
Вариант 3 x – качество земли, баллы; y – урожайность, ц/га.
Вариант 4 x – качество земли, баллы; y – урожайность, ц/га.
Вариант 5 x – товарооборот; y –издержки обращения по отношению к товарообороту.
Вариант 6 x – электровооруженность на одного рабочего; y – выпуск готовой продукции на одного рабочего.
Вариант 7 x –уровень доходов семьи; y – расходы на продукты питания (в расчете на 100 руб. доходов).
Вариант 8 x – качество земли, баллы; y – урожайность, ц/га.
Вариант 9 x – производительность труда; y – рентабельность производства.
Вариант 10 x – производительность труда; y – рентабельность производства.
|