Модели регрессии с фиктивными переменными сдвига
Рассмотрим применение фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для общей совокупности наблюдений уравнение регрессии имеет вид: , где – количество потребляемого кофе; – цена. Аналогичные уравнения могут быть найдены, если рассматривать отдельно потребление кофе для категории – лица мужского пола: и категории – лица женского пола: . Различия в потреблении кофе проявятся в различии средних и . Вместе с тем сила влияния на может быть одинаковой, т.е. . Для построения общего уравнения регрессии, учитывающего различия в потреблении кофе мужчинами и женщинами, возможно включение в него фактора «пол» в виде фиктивной переменной. . В этом случае зависимая переменная рассматривается как функция не только цены , но и пола . Переменная рассматривается как бинарная переменная, принимающая всего два значения: 1 и 0. Тогда уравнение для лиц женского пола можно записать: , а для лиц мужского пола: . Сравнивая два полученных уравнения, видим, что они различаются величиной свободного члена. То есть для одного уровня неколичественной переменной уровень результата в среднем будет на единиц выше или ниже другого. Иными словами показывает сдвиг в потреблении кофе мужчинами по сравнению с женщинами.
Рис 4.1 Модель регрессии с фиктивной переменной сдвига . Если рассмотреть зависимость потребления кофе не только от цены, но и региона проживания: северные регионы, центральные и южные. В этом случае все данные разбиваются на три категории. В модель вводятся две фиктивные переменные и : Значение и принимается за эталонное и определяет среднее значение потребления кофе проживающих в центральном регионе. Линейная регрессионную модель в этом случае определяется следующим уравнением: , где коэффициенты и показывают сдвиг в объеме потребления кофе в соответствующих регионах по отношению к потреблению кофе в центральных регионах. Таким образом, построение модели с фиктивными переменными требует выполнения следующих этапов: 1. Статистические данные разбиваются на категории, число которых определяется числом значений качественного признака. Одна из категорий принимается за эталонную (выбирается произвольно). 2. Вводятся фиктивные переменные для всех категорий, кроме эталонной. Каждая из введенных фиктивных переменных принимает значение, равное единице для данных рассматриваемой категории и нуль для данных остальных категорий. 3. Фиктивные переменные вводятся в уравнение с коэффициентом , , где - число категорий. Каждый из коэффициентов характеризует сдвиг значения результативного показателя для данных - ой категории относительно эталонной. Если оказывается статистически значимым, то фактор (событие), выражаемое этой фиктивной переменной оказывает существенное влияние на результативный показатель. Модель может содержать несколько качественных признаков. В этом случае фиктивные переменные для каждого признака вводятся в соответствии с вышеприведенной методикой.
|