Коэффициенты логистической регрессии
Основная информация содержится в таблице коэффициентов регрессии (рис. 6.4). Прежде всего, следует обратить внимание на значимость коэффициентов. Наблюдаемая значимость вычисляется на основе статистики Variable B S.E. Wald df Sig R WAGE.0432.0078 30.4619 1.0000.0902 MANAG 9.9788 3.0187.0337 MANAG(1).3544.1489 5.6637 1.0173.0323 MANAG(2).5241.2328 5.0673 1.0244.0296 MANAG(3).0393.1580.0618 1.8036.0000 SMOKE.6419.1074 35.6956 1.0000.0981 DH5(1).8801.1366 41.5022 1.0000.1062 DH5(1) by WAGE -.0390.0101 14.7972 1.0001 -.0605 Constant -.0534.0767.4852 1.4861 Вальда. Эта статистика связана с методом максимального правдоподобия и может быть использована при оценках разнообразных параметров. Универсальность статистики Вальда позволяет оценить значимость не только отдельных переменных, но и в целом значимость категориальных переменных, несмотря на то что они дезагрегированы на индексные переменные. Статистика Вальда имеет распределение хи-квадрат. Число степеней свободы равно единице, если проверяется гипотеза о равенстве нулю коэффициента при обычной или индексной переменной, а для категориальной переменной – числу значений без единицы (т. е. числу соответствующих индексных переменных). Квадратный корень из статистики Вальда приближенно равен отношению величины коэффициента к его стандартной ошибке – так же выражается t -статистика в обычной линейной модели регрессии. В нашей таблице коэффициентов почти все переменные значимы на уровне значимости 5 %. Закрыв глаза на возможное взаимодействие между независимыми переменными (коллинеарность), можно считать, что вероятность употребления алкоголя повышена при высокой зарплате, а также у руководителей различного ранга. Из-за незначимости статистики Вальда нет, правда, полной уверенности относительно повышенной вероятности для начальников, имеющих более 10 подчиненных. Курение и принадлежность к мужскому полу также повышают эту вероятность, однако, взаимодействие «мужчина – зарплата» имеет обратное действие. В этой же таблице присутствует аналог коэффициента корреляции (R), также построенный на основании статистики Вальда. Для обычных и индексных переменных положительные значения коэффициента свидетельствуют о положительной связи переменной с вероятностью события, отрицательные – об отрицательной связи. Кроме того, мы выдали таблицу экспонент коэффициентов eB и их доверительные границы (см. рис. 6.5). Эта таблица выдана подкомандой /PRINT = CI(95) в команде задания логистической регрессии. 95% CI for Exp(B) Variable Exp(B) Lower Upper
WAGE 1.0441 1.0282 1.0603 MANAG(1) 1.4253 1.0645 1.9083 MANAG(2) 1.6889 1.0701 2.6654 MANAG(3) 1.0401.7630 1.4177 SMOKE 1.9001 1.5393 2.3455 DH5(1) 2.4112 1.8448 3.1515 DH5(1) by WAGE.9618.9429.9811 Согласно модели и полученным значениям коэффициентов при фиксированных прочих переменных принадлежность к мужскому полу увеличивает отношение шансов «пития» и «не пития» в 2,4 раза (точнее, в
|