Це система двох лінійних рівнянь із двома невідомими. Коефіцієнти цієї системи – це числові характеристики, підраховані для наявних вихідних даних, даних спостережень
Знайдемо параметр b із другого рівняння:
Другий параметр a можна одержати за формулою
.
Коефіцієнт детермінації і його властивості Перевірка адекватності нелінійної кореляційної моделі Коефіцієнт детермінації Коефіцієнт кореляції використовується для оцінки якості рівняння лінійної регресії. Характеризує ступінь щільності лінійної залежності між випадковими величинами x та y і змінюється в межах від –1 до 1. Якщо значення коефіцієнта | r| близьке до 1, то існує сильний зв’язок. Якщо r=0, зв’язок відсутній. де
Для парної лінійної регресії коефіцієнт детермінації точно дорівнює квадратові коефіцієнта кореляції:
R 2 = r2
Якщо ж рівняння нелінійне, то аналогічну роль грає коефіцієнт детермінації R2.
У чисельнику розташовані теоретичні значення , що підраховуються по побудованій теоретичній формулі, по рівнянню регресії. У знаменнику – дані спостережень yi В ідеальному випадку, коли всі дані спостережень лежать точно на побудованій лінії регресії, теоретичні значення і дані спостережень yi просто збігаються. Чисельник при цьому буде дорівнює знаменникові і коефіцієнт детермінації R2 дорівнює 1.
Чим більше розкид даних спостережень щодо побудованої лінії регресії, тим менше коефіцієнт детермінації R 2 Властивості коефіцієнта детермінації: 1. 2. Якщо R 2 близький до 1, це означає, що залежність між факторами близька до функціонального і розкид даних спостережень відносно побудованої лінії регресії дуже малий. Рівняння описує результати спостережень. 3. Якщо R 2 зменшується, це значить, що збільшується розкид точок на кореляційному полі щодо побудованої лінії регресії (або статистична залежність дуже слабка, або рівняння регресії підібране невірно).
Коефіцієнт детермінації R 2 характеризує ступінь тісноти будь-якої кореляційної залежності,(не обов'язково лінійної) т. т. показує, наскільки розкидані статистичні данінавколо побудованої лінії регресії.
Перевірка адекватності кореляційної моделі Як для r, так і для R 2 необхідно проводити дослідження його статистичної значимості. При цьому тут використовують F-критерій Фішера:
Тут R 2 - коефіцієнт детермінації, n - обсяг вибірки; (n–2) – число ступенів свободи.
Технологія перевірки така: · Підраховуємо значення критерію Фішера, що спостерігається
· По таблицях критичних точок розподілу Фішера знаходимо критичне значення критерію
· Порівнюючи, робимо висновок про адекватність (або неадекватності) лінійної кореляційної моделі. Чим більше Fр у порівнянні з Fкр, тим вище адекватність. Тому висновок повинний містити оцінку ступеня адекватності. Нелінійна регресія. Метод лінеаризації Якщо застосувати МНК безпосередньо до нелінійного рівняння регресії, то нормальна система, що ми одержимо, виявиться набагато складніше, це будуть нелінійні рівняння, що вирішити точно, узагалі говорячи, не можна. Нехай кореляційне поле показує, що залежність повинна бути нелінійною. Потрібно спробувати зробити таку заміну змінних, щоб у нових змінних залежність стала лінійною. І тоді коефіцієнти кореляційної залежності будуть визначатися як і раніше із системи рівнянь.
Для квазілінійних регресій заміну і лінеаризацію можна зробити завжди. Для власне нелінійних регресій це зовсім не обов'язково.
Квадратична регресія
Рівняння параболічної регресії має вигляд . Якщо використовувати метод найменших квадратів (МНК), то для коефіцієнтів складається і вирішується нормальна система лінійних рівнянь з матрицею
Вхідні сюди величини підраховуються за даними спостережень. Ліва частина – це середні значення різних ступенів фактора Х. Права – це середні значення добутків: або Полічивши ці числа і вирішуючи систему рівнянь, знаходимо коефіцієнти регресії. Можна підраховувати кожну з цих величин окремо. Але можна застосувати для цей і інший спосіб, матричний. При цьому вся матриця коефіцієнтів системи підраховується відразу.
|