Теоретические сведения. Теоретические сведенияПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ
Теоретические сведения
Парная регрессия – уравнение связи двух переменных y и x: ,
где – зависимая переменная (результативный признак), – независимая, объясняющая переменная (признак-фактор). Различают линейные и нелинейные регрессии. Линейная регрессия: . Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам. Регрессии, нелинейные по объясняющим переменным: - полиномы разных степеней ; - равносторонняя гипербола . Регрессии, нелинейные по оцениваемым параметрам: - степенная ; - показательная ; - экспоненциальная . Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонения фактически значений результативного признака от теоретических минимальна, то есть . Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно и :
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии : , и индекс корреляции - для нелинейной регрессии . Оценку качества построенной модели дает коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации. Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических: . Допустимый предел значений - не более 8 – 10 %. Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменяется результат от своей средней величины при изменении фактора на 1 % от своего среднего значения: Поскольку коэффициенты эластичности представляют экономический интерес, в таблице приведены формулы расчета коэффициентов эластичности для наиболее распространенных типов уравнений регрессии. Таблица Коэффициенты эластичности для ряда математических функций
Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной: где - общая сумма квадратов отклонений; - сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»); - остаточная сумма квадратов отклонений. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент (индекс) детерминации :
Коэффициент детерминации – квадрат коэффициента или индекса корреляции. – тест – оценивает качество уравнения регрессии – состоит в проверке гипотезы о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического и критического (табличного) значений – критерия Фишера. определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы: где - число единиц совокупности; - число парметров при переменных . – это максимальное возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости . Уровень значимости - вероятность отвергнуть правильную гипотизу при условии, что она верна. Обычно принимается равной 0,05 или 0,01. Если то - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если то гипотиза не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии. Для оценки статистической значимости коэффициентов регрессии и корреляции расчитывается - критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза о случайной природе показателей, то есть о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью - критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и критическое (табличное) значение - статистики - и - принимаем или отвергаем гипотезу . Связь между – критерием Фишера и - статистикой Стьюдента выражается равенством Если , то отклоняется, то есть и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора . Если , то гипотеза не отклоняется и признается случайная природа формирования и . Для расчета доверительного интервала определяем предельную ошибку для каждого показателя: .
Формулы для расчета доверительных интервалов имеют следующий вид
. Если в границы доверительного интервала попадает ноль, то есть нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может одновременно принимать и положительное, и отрицательное значение. Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения . Вычисляется средняя стандартная ошибка прогноза
и строится доверительный интервал прогноза: Пример По группе предприятий, выпускающих один и тот же вид продукции, рассматривается функция издержек: где - издержки производства (тыс. д. е.); - объем выпуска продукции (тыс. ед.). Исходные данные и вспомогательные вычисления для расчета оценок параметров и приведены в табл. 1. Таблица 1
|