Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Регресійний аналіз





Регресійний аналіз полягає в прогнозуванні однієї змінної на підставі іншої. Лінійний регресійний аналіз прогнозує значення однієї змінної на підставі іншої за допомогою прямої лінії. Нахил цієї лінії, виражається в одиницях вимірювання у на одну одиницю х і характеризує крутизну підйому або спуску (якщо b негативне) лінії. Зрушення, а, дорівнює значенню, яке приймає у при х, рівному 0.

Лінія найменших квадратів характеризується найменшою зі всіх можливих ліній сумою зведених у квадрат помилок прогнозування по вертикалі й використовується як краща лінія прогнозування, заснована на даних. Нахил цієї лінії, b, називають також коефіцієнтом регресії у по х, а зрушення а (відрізок, що відсікається на осі у) називають також постійним членом регресії.

(10.7)

(10.8)

Прогнозоване значення для у при заданому значенні х визначається шляхом підстановки цього значення х в рівняння для лінії найменших квадратів. Кожна з точок даних характеризується залишком – помилкою прогнозування, яка вказує, наскільки вище або нижче за лінію знаходиться крапка.

Існують дві міри відповідності лінії найменших квадратів наявним даним. Стандартна помилка оцінки,яку позначають , приблизно указує величину помилок прогнозування (залишків) для наявних даних в тих же одиницях, в яких виміряна й змінна у. Відповідні формули приведені нижче.

Для обчислення:

(10.9)

Для інтерпретації:

(10.10)

Значення , що називається коефіцієнтом детермінації,говорить про те, який відсоток варіації у пояснюється поведінкою х.

Довірчі інтервали й перевірка гіпотез для коефіцієнта регресії пов'язані з певними припущеннями щодо аналізованої сукупності даних, які повинні гарантувати, що вона складається з незалежних спостережень, що характеризуються лінійним взаємозв'язком із рівною варіацією та приблизно нормально розподіленою випадковістю. По-перше, ці дані повинні представляти собою довільну вибірку з тієї, що цікавить нас генеральній сукупності. По-друге, лінійна модель указує, що спостережуване значення у визначається взаємозв'язком у генеральній сукупності плюс випадкова помилка, що має нормальний розподіл. Існують параметри генеральної сукупності, що відповідають нахилу та зрушенню лінії найменших квадратів, побудованої на даних вибірки:

 

(10.11)

 

де – взаємозв'язок у генеральній сукупності;

– випадковість, яка має нормальний розподіл з середнім значенням, що дорівнює 0, і постійним стандартним відхиленням .

Статистичні висновки (використання довірчих інтервалів і перевірки статистичних гіпотез) щодо коефіцієнтів лінії найменших квадратів ґрунтуються, як завжди, на їх стандартних помилках і значеннях із
t- таблицідля п – 2 ступенів свободи.

Стандартна помилка коефіцієнта нахилу, , указує приблизну величину відхилення оцінки нахилу, b (коефіцієнт регресії, обчислений на основі даних вибірки), від нахилу в генеральній сукупності, β;, викликаного випадковим характером вибірки.

(10.12)

Стандартна помилка зрушення, , указує приблизно, наскільки далеко оцінка зрушення а відстоїть від істинного зрушення α; у генеральній сукупності.

(10.13)

Довірчий інтервал для нахилу в генеральній сукупності β:

. (10.14)

Довірчий інтервал для зрушення в генеральній сукупності α;:

. (10.15)

Один із способів перевірки, чи є виявлений взаємозв'язок між х і у реальним або це просто випадковий збіг, полягає в порівнянні β з заданим значенням β0 = 0. Про значущий зв'язок можна говорити в тому випадку, якщо 0 не потрапляє в довірчий інтервал, що базується на b і Sb, або якщо абсолютне значення t = b/ Sb перевершує відповідне t- значенняв t- таблиці. Ця перевірка еквівалентна перевірці значущості коефіцієнта кореляції й означає, по суті, те ж саме, що і F- тестдля випадку, коли рівняння містить тільки одну змінну х. Зрозуміло, будь-який із коефіцієнтів (а або b ) можна порівняти з будь-яким відповідним заданим значенням, скориставшись одно - або двосторонньою перевіркою (залежно від конкретних обставин) і з використанням тих же методів перевірки, що були розглянуті для середнього генеральній сукупності.

Для прогнозування середнього значення нового спостереження у за умови, що х = х0, невизначеність прогнозу оцінюють за допомогою стандартної помилки , яка також має п, – 2 ступенів свободи. Це дозволяє побудувати довірчі інтервали й перевірити гіпотези для нового спостереження:

(10.16)

Довірчий інтервал для прогнозованого (середнього) значення у при заданому значенні х0 має наступний вигляд:

від до . (10.17)

 

 

Питання для самоконтролю







Дата добавления: 2015-07-04; просмотров: 885. Нарушение авторских прав; Мы поможем в написании вашей работы!




Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...


Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...


Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...


Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Условия, необходимые для появления жизни История жизни и история Земли неотделимы друг от друга, так как именно в процессах развития нашей планеты как космического тела закладывались определенные физические и химические условия, необходимые для появления и развития жизни...

Метод архитекторов Этот метод является наиболее часто используемым и может применяться в трех модификациях: способ с двумя точками схода, способ с одной точкой схода, способ вертикальной плоскости и опущенного плана...

Примеры задач для самостоятельного решения. 1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P   1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P...

СПИД: морально-этические проблемы Среди тысяч заболеваний совершенно особое, даже исключительное, место занимает ВИЧ-инфекция...

Понятие массовых мероприятий, их виды Под массовыми мероприятиями следует понимать совокупность действий или явлений социальной жизни с участием большого количества граждан...

Тактика действий нарядов полиции по предупреждению и пресечению правонарушений при проведении массовых мероприятий К особенностям проведения массовых мероприятий и факторам, влияющим на охрану общественного порядка и обеспечение общественной безопасности, можно отнести значительное количество субъектов, принимающих участие в их подготовке и проведении...

Studopedia.info - Студопедия - 2014-2025 год . (0.013 сек.) русская версия | украинская версия