Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Регресійний аналіз





Регресійний аналіз полягає в прогнозуванні однієї змінної на підставі іншої. Лінійний регресійний аналіз прогнозує значення однієї змінної на підставі іншої за допомогою прямої лінії. Нахил цієї лінії, виражається в одиницях вимірювання у на одну одиницю х і характеризує крутизну підйому або спуску (якщо b негативне) лінії. Зрушення, а, дорівнює значенню, яке приймає у при х, рівному 0.

Лінія найменших квадратів характеризується найменшою зі всіх можливих ліній сумою зведених у квадрат помилок прогнозування по вертикалі й використовується як краща лінія прогнозування, заснована на даних. Нахил цієї лінії, b, називають також коефіцієнтом регресії у по х, а зрушення а (відрізок, що відсікається на осі у) називають також постійним членом регресії.

(10.7)

(10.8)

Прогнозоване значення для у при заданому значенні х визначається шляхом підстановки цього значення х в рівняння для лінії найменших квадратів. Кожна з точок даних характеризується залишком – помилкою прогнозування, яка вказує, наскільки вище або нижче за лінію знаходиться крапка.

Існують дві міри відповідності лінії найменших квадратів наявним даним. Стандартна помилка оцінки,яку позначають , приблизно указує величину помилок прогнозування (залишків) для наявних даних в тих же одиницях, в яких виміряна й змінна у. Відповідні формули приведені нижче.

Для обчислення:

(10.9)

Для інтерпретації:

(10.10)

Значення , що називається коефіцієнтом детермінації,говорить про те, який відсоток варіації у пояснюється поведінкою х.

Довірчі інтервали й перевірка гіпотез для коефіцієнта регресії пов'язані з певними припущеннями щодо аналізованої сукупності даних, які повинні гарантувати, що вона складається з незалежних спостережень, що характеризуються лінійним взаємозв'язком із рівною варіацією та приблизно нормально розподіленою випадковістю. По-перше, ці дані повинні представляти собою довільну вибірку з тієї, що цікавить нас генеральній сукупності. По-друге, лінійна модель указує, що спостережуване значення у визначається взаємозв'язком у генеральній сукупності плюс випадкова помилка, що має нормальний розподіл. Існують параметри генеральної сукупності, що відповідають нахилу та зрушенню лінії найменших квадратів, побудованої на даних вибірки:

 

(10.11)

 

де – взаємозв'язок у генеральній сукупності;

– випадковість, яка має нормальний розподіл з середнім значенням, що дорівнює 0, і постійним стандартним відхиленням .

Статистичні висновки (використання довірчих інтервалів і перевірки статистичних гіпотез) щодо коефіцієнтів лінії найменших квадратів ґрунтуються, як завжди, на їх стандартних помилках і значеннях із
t- таблицідля п – 2 ступенів свободи.

Стандартна помилка коефіцієнта нахилу, , указує приблизну величину відхилення оцінки нахилу, b (коефіцієнт регресії, обчислений на основі даних вибірки), від нахилу в генеральній сукупності, β;, викликаного випадковим характером вибірки.

(10.12)

Стандартна помилка зрушення, , указує приблизно, наскільки далеко оцінка зрушення а відстоїть від істинного зрушення α; у генеральній сукупності.

(10.13)

Довірчий інтервал для нахилу в генеральній сукупності β:

. (10.14)

Довірчий інтервал для зрушення в генеральній сукупності α;:

. (10.15)

Один із способів перевірки, чи є виявлений взаємозв'язок між х і у реальним або це просто випадковий збіг, полягає в порівнянні β з заданим значенням β0 = 0. Про значущий зв'язок можна говорити в тому випадку, якщо 0 не потрапляє в довірчий інтервал, що базується на b і Sb, або якщо абсолютне значення t = b/ Sb перевершує відповідне t- значенняв t- таблиці. Ця перевірка еквівалентна перевірці значущості коефіцієнта кореляції й означає, по суті, те ж саме, що і F- тестдля випадку, коли рівняння містить тільки одну змінну х. Зрозуміло, будь-який із коефіцієнтів (а або b ) можна порівняти з будь-яким відповідним заданим значенням, скориставшись одно - або двосторонньою перевіркою (залежно від конкретних обставин) і з використанням тих же методів перевірки, що були розглянуті для середнього генеральній сукупності.

Для прогнозування середнього значення нового спостереження у за умови, що х = х0, невизначеність прогнозу оцінюють за допомогою стандартної помилки , яка також має п, – 2 ступенів свободи. Це дозволяє побудувати довірчі інтервали й перевірити гіпотези для нового спостереження:

(10.16)

Довірчий інтервал для прогнозованого (середнього) значення у при заданому значенні х0 має наступний вигляд:

від до . (10.17)

 

 

Питання для самоконтролю







Дата добавления: 2015-07-04; просмотров: 885. Нарушение авторских прав; Мы поможем в написании вашей работы!




Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...


Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...


Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Кишечный шов (Ламбера, Альберта, Шмидена, Матешука) Кишечный шов– это способ соединения кишечной стенки. В основе кишечного шва лежит принцип футлярного строения кишечной стенки...

Принципы резекции желудка по типу Бильрот 1, Бильрот 2; операция Гофмейстера-Финстерера. Гастрэктомия Резекция желудка – удаление части желудка: а) дистальная – удаляют 2/3 желудка б) проксимальная – удаляют 95% желудка. Показания...

Ваготомия. Дренирующие операции Ваготомия – денервация зон желудка, секретирующих соляную кислоту, путем пересечения блуждающих нервов или их ветвей...

Метод архитекторов Этот метод является наиболее часто используемым и может применяться в трех модификациях: способ с двумя точками схода, способ с одной точкой схода, способ вертикальной плоскости и опущенного плана...

Примеры задач для самостоятельного решения. 1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P   1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P...

Дизартрии у детей Выделение клинических форм дизартрии у детей является в большой степени условным, так как у них крайне редко бывают локальные поражения мозга, с которыми связаны четко определенные синдромы двигательных нарушений...

Studopedia.info - Студопедия - 2014-2025 год . (0.009 сек.) русская версия | украинская версия