Введение. Если расчёт корреляции характеризует силу связи между переменными, то регрессионный анализ служит для определения вида этой связи и дает возможность для
Если расчёт корреляции характеризует силу связи между переменными, то регрессионный анализ служит для определения вида этой связи и дает возможность для прогнозирования значения одной (зависимой) переменной, отталкиваясь от значения другой независимой переменной. Простая линейная регрессия является простейшей и применяется чаще всех остальных видов. Для проведения линейного регрессионного анализа зависимая переменная должна иметь интервальную (или порядковую) шкалу. Временной ряд - это последовательность чисел; его элементы - это значения некоторого протекающего во времени процесса. Они измерены в последовательные моменты времени, обычно через равные промежутки. Как правило, составляющие временной ряд числа, - элементы временного ряда, нумеруют в соответствии с номером момента времени, к которому они относятся (например, х , х , х и т.д.). Таким образом, порядок следования элементов временного ряда весьма существен. Чаще всего значения временного ряда получаются непосредственной записью значений некоторого процесса через определенные промежутки времени. Например, если ежесуточно в определенное время записывать показания термометра, то получится временной ряд со значениями температуры в том месте, в котором находится термометр. Иногда значения элементов временного ряда получаются накапливанием некоторых данных за определенный промежуток времени (например, суммарное число посетителей магазина за день), усреднением (средняя температура за день) и т.д. Целью прикладного статистического анализа временных рядов является построение математической модели ряда, с помощью которой можно объяснить поведение ряда и осуществить прогноз его дальнейшего поведения. Анализ временного ряда обычно начинается с построения и изучения его графика. Затем обычно пробуют выделить – во временном ряде тренд, сезонные и периодические компоненты. После их исключения временной ряд должен стать стационарным, т.е. таким, вероятностные свойства которого не изменяются с течением времени. Тренд – это плавно изменяющаяся во времени компонента, которая описывает долговременные процессы. Сезонная составляющая описывает поведение, изменяющееся в течение заданного периода (суток, месяца, года, десятка лет и т.д.). Например, пик пассажироперевозок на работу или дачи по дням, объем продаж подарков в декабре – это сезонные компоненты. Главная идея подхода к анализу сезонной компоненты заключается в переходе от сравнения всех значений временного ряда между собой - к сравнению значений через определенный промежуток времени. Циклическая компонента описывает длительные периоды относительного подъема и спада. Она состоит из циклов, которые меняются по амплитуде и протяженности и представляют собой нечто среднее между сезонной компонентой и трендом. Для оценки и удаления трендов из временных рядов чаще всего используется метод наименьших квадратов. Значения временного ряда xt рассматривают как отклик (зависимую переменную), а время t - как фактор, влияющий на отклик (независимую переменную): i = 1, 2,...., n где f — функция тренда (она обычно предполагается гладкой), — неизвестные нам параметры (параметры модели временного ряда), — независимые и одинаково распределенные случайные величины, распределение которых мы предполагаем нормальным. Метод наименьших квадратов состоит в том, что мы выбираем функцию тренда так, чтобы:
|