Студопедия — Парный регрессионный анализ
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Парный регрессионный анализ






· Чтобы вызвать регрессионный анализ в SPSS, выберите в меню Analyze... (Анализ) Regression... (Регрессия)

Откроется соответствующее подменю.

Разделы этой главы соответствуют опциям вспомогательного меню. Причём при изучении линейного регрессионного анализа снова будут проведено различие между простым анализом (одна независимая переменная) и множественным анализом (несколько независимых переменных). Собственно говоря, никаких принципиальных отличий между этими видами регрессии нет, однако простая линейная регрессия является простейшей и применяется чаще всех остальных видов.

 

Для проведения линейного регрессионного анализа зависимая переменная должна иметь интервальную (или порядковую) шкалу. В то же время, бинарная логистическая регрессия выявляет зависимость дихотомической переменной от некой другой переменной, относящейся к любой шкале.

 

 

Те же условия применения справедливы и для пробит-анализа. Если зависимая переменная является категориальной, но имеет более двух категорий, то здесь подходящим методом будет мультиномиальная логистическая регрессия. Новшеством уже в 10 версии SPSS является порядковая регрессия, которую можно использовать, когда зависимые переменные относятся к порядковой шкале. И, наконец, можно анализировать и нелинейные связи между переменными, которые относятся к интервальной шкале. Для этого предназначен метод нелинейной регрессии.

Принципиальная идея регрессионного анализа состоит в том, что, имея общую тенденцию для переменных – в виде линии регрессии – можно предсказать значение зависимой переменной, имея значения независимой.

Этот вид регрессии лучше всего подходит для того, чтобы продемонстрировать основополагающие принципы регрессионного анализа. Рассмотрим для этого диаграмму рассеяния, которая иллюстрирует зависимость показателя удовлетворенности жильем от общей площади жилья. Можно легко заметить очевидную связь: обе переменные развиваются в одном направлении и множество точек, соответствующих наблюдаемым значениям показателей, явно концентрируется (за некоторыми исключениями) вблизи прямой (прямой регрессии). В таком случае говорят о линейной связи.

у=b*х + а

где b — регрессионные коэффициенты, a — константа, задающая смещение по оси ординат.

Смещение по оси ординат соответствует точке на оси у (вертикальной оси), где прямая регрессии пересекает эту ось. Коэффициент регрессии b через соотношение

b = tg(a) указывает на угол наклона прямой.

При проведении простой линейной регрессии основной задачей является определение параметров b и а. Оптимальным решением этой задачи является такая прямая, для которой сумма квадратов вертикальных расстояний до отдельных точек данных является минимальной.

Если мы рассмотрим показатель «удовлетворенность жильем» (var1) как зависимую переменную (у), а исходную величину «общая площадь жилья» var2 как независимую переменную (х), то тогда для проведения регрессионного анализа нужно будет определить параметры соотношения

var1 = b*var2 + a

После определения этих параметров, зная исходный показатель общей площади жилья, можно спрогнозировать показатели удовлетворенности жильем.

 

В нашем примере, простой регрессионный анализ позволяет получить следующие таблицы.

Уравнение регрессии будет выглядеть таким образом: Var1 = -0,013*var2 + 3,194

Можно вычислить какова будет удовлетворенность жилищными условиями, если общая площадь жилья составит 70 кв.м. -0,013*70+3,194 = 2,28, таким образом, удовлетворенность будет иметь значение 2 – «отчасти».

 

Одним из главных показателей регрессионного анализа является множественный коэффициент корреляции R – коэффициент корреляции между исходными и предсказанными значениями зависимой переменной. В парном регрессионном анализе он равен обычному коэффициенту корреляции Пирсона между зависимой и независимой переменной, в нашем случае – 0,368. Чтобы содержательно интерпретировать множественный R, его необходимо преобразовать в коэффициент детерминации. Это делается так же, как и в корреляционном анализе – возведением в квадрат. Коэффициент детерминации R-квадрат (R2) показывает долю вариации зависимой переменной, объяснимую независимой (независимыми) переменными.

В нашем случае, R2 = 0,136. Чем больше величина коэффициента детерминации, тем выше качество модели.

Другим показателем качества модели является стандартная ошибка оценки (Std.Error of Estimate). Это показатель того насколько точки «разбросаны» вокруг линии регрессии. Мерой разброса для интервальных переменных является стандартное отклонение. Чем выше его значение, тем сильнее разброс, тем хуже модель. В нашем случае, стандартная ошибка составляет 0,669. Именно на эту величину наша модель будет «ошибаться в среднем» при прогнозировании значения переменной «удовлетворенность жильем».

Регрессионная статистика включает в себя также дисперсионной анализ (ANOVA). С его помощью выясняем: 1) какая доля вариации (дисперсии) зависимой переменной объясняется независимой переменной; 2) какая доля дисперсии зависимой переменной приходится на остатки (необъясненная часть), 3) каково отношение этих двух величин (F-отношение). Дисперсионная статистика очень важна. Для выборочных исследований она показывает, насколько вероятно наличие связи между независимой и зависимой переменными в генеральной совокупности, для сплошных исследований - проверяют «не случайность» выявленной статистической закономерности.

В нашем случае F-отношение 51,182 значимо на уровне 0,000. Соответственно, мы можем с уверенностью отвергнуть нулевую гипотезу (что обнаруженная связь носит случайный характер).

 







Дата добавления: 2015-08-30; просмотров: 485. Нарушение авторских прав; Мы поможем в написании вашей работы!



Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

МЕТОДИКА ИЗУЧЕНИЯ МОРФЕМНОГО СОСТАВА СЛОВА В НАЧАЛЬНЫХ КЛАССАХ В практике речевого общения широко известен следующий факт: как взрослые...

СИНТАКСИЧЕСКАЯ РАБОТА В СИСТЕМЕ РАЗВИТИЯ РЕЧИ УЧАЩИХСЯ В языке различаются уровни — уровень слова (лексический), уровень словосочетания и предложения (синтаксический) и уровень Словосочетание в этом смысле может рассматриваться как переходное звено от лексического уровня к синтаксическому...

Плейотропное действие генов. Примеры. Плейотропное действие генов - это зависимость нескольких признаков от одного гена, то есть множественное действие одного гена...

Тема: Изучение фенотипов местных сортов растений Цель: расширить знания о задачах современной селекции. Оборудование:пакетики семян различных сортов томатов...

Тема: Составление цепи питания Цель: расширить знания о биотических факторах среды. Оборудование:гербарные растения...

В эволюции растений и животных. Цель: выявить ароморфозы и идиоадаптации у растений Цель: выявить ароморфозы и идиоадаптации у растений. Оборудование: гербарные растения, чучела хордовых (рыб, земноводных, птиц, пресмыкающихся, млекопитающих), коллекции насекомых, влажные препараты паразитических червей, мох, хвощ, папоротник...

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия