Определение параметров линейного однофакторного уравнения регрессии
Пусть у нас имеются данные о доходах (X) и спрос на некоторый товар (Y) за ряд лет (n)
Предположим, что между X и Y существует линейная взаимосвязь, т.е. Для того, чтобы найти уравнение регрессии, прежде всего нужно исследовать тесноту связи между случайными величинами X и Y, т.е. корреляционную зависимость. Пусть: x , х ,..., х n- совокупность значений независимого, факторного признака; y , y ..., y n – совокупность соответствующих значений зависимого, результативного признака; n – количество наблюдений. Для нахождения уравнения регрессии вычисляются следующие величины: 1. Средние значения для экзогенной переменной.
для эндогенной переменной$ 2. Отклонения от средних величин , $ 3. Величины дисперсии и среднего квадратичного отклонения ,.
Величины дисперсии и среднего квадратичного отклонения характеризуют разброс наблюдаемых значений вокруг среднего значения. Чем больше дисперсия, тем больше разброс. 4. Вычисление корреляционного момента (коэффициента ковариации): Корреляционный момент отражает характер взаимосвязи между x и y. Если , то взаимосвязь прямая. Если , то взаимосвязь обратная. 5. Коэффициент корреляции вычисляется по формуле:
. Доказано, что коэффициент корреляции находится в интервале от минус единицы до плюс единицы (). Коэффициент корреляции в квадрате () называется коэффициентом детерминации. Если , то вычисления продолжаются. 6. Вычисления параметров регрессионного уравнения. Коэффициент b находится по формуле: После чего можно легко найти параметр a: Коэффициенты a и b находятся методом наименьших квадратов, основная идея которого состоит в том, что за меру суммарной погрешности принимается сумма квадратов разности (остатков) между фактическими значениями результативного признака и его расчетными значениями , полученными при помощи уравнения регрессии . При этом величины остатков находятся по формуле: , где фактическое значение y; расчетное значение y. Пример. Пусть у нас имеются статистические данные о доходах (X) и спросе (Y). Необходимо найти корреляционную зависимость между ними и определить параметры уравнения регрессии.
Предположим, что между нашими величинами существует линейная зависимость. Тогда расчеты лучше всего выполнить в Excel, используя статистические функции; СРЗНАЧ – для вычисления средних значений; ДИСП – для нахождения дисперсии; СТАНДОТКЛОН – для определения среднего квадратичного отклонения; КОРЕЛЛ – для вычисления коэффициента корреляции. Корреляционный момент можно вычислить, найдя отклонения от средних значений для ряда X и ряда Y, затем при помощи функции СУММПРОИЗВ определить сумму их произведений, которую необходимо разделить на n-1. Результаты вычислений можно свести в таблицу.
|