Розв'язання
Важливою задачею є вибір раціонального типу регресійної моделі. Конкретна аналітична форма зв’язку між економічними показниками згідно з простою регресійною моделлю вибирається на підставі змістовного тлумачення цього зв’язку. Якщо регресійна модель вимірює зв’язок між двома змінними, то кожну пару спостережень над цими змінними можна зобразити у двовимірній системі координат:
Рис. 10.5.1. Кореляційне поле точек
Аналіз зображеної множини точок дозволяє зробити висновок про наявність лінійного зв’язку між кількістю клієнтів банку та кредитовим оборотом, тобто для характеристики даної залежності варто обрати лінійну функцію. Нехай залежність між кредитовим оборотом та чисельністю клієнтів банку описується простою лінійною моделлю y = β 0 + β 1x+ u, де y − кредитовий оборот; х − чисельність клієнтів банку; u – стохастична складова, яка вводиться до моделі з метою врахувати наявність впливу факторів, які не входять до моделі, β 0, β 1 – параметри моделі. Згідно з гіпотезою про лінійний зв’язок через кореляційне поле точок можна провести принаймні кілька прямих ліній, які різняться своїми параметрами b0 та b1. Щоб певна пряма адекватно описувала фактичну залежність, необхідно обрати такий метод оцінювання параметрів моделі, щоб відхилення фактичних значень від розрахункових били мінімальними. У цьому разі мінімізації підлягає сума квадратів відхилень: Це є сутністю методу найменших квадратів. Розрахункові значення кредитового обороту можна знайти, скориставшись такою моделлю парної лінійної регресії: = b0+b1x. Щоб оцінити параметри моделі b0 та b1 методом 1 МНК, запишемо систему нормальних рівнянь Параметри регресії розраховуються за формулами: , Параметр b1 вказує на скільки одиниць у середньому зміниться у зі зміною х на одиницю, а параметр b0 – чому дорівнює у, якщо х =0 (при умові, що змінна х може набувати нульових значень). Необхідні розрахунки:
Таблиця 10.5.2
Маємо: Модель лінійної парної регресії має вигляд: у =0, 98 х +2. Оскільки вільний член b0 = 2≠ 0, то величина кредитового обороту не є строго пропорційною до кількості клієнтів банку. Кількісна оцінка параметра b1 = 0, 98показує, що граничне збільшення кредитового обороту при зростанні чисельності клієнтів банку на одного становить 0, 98 млн. грн. Еластичність кредитового обороту щодо кількості клієнтів банку визначається коефіцієнтом еластичності Значення цього коефіцієнта слід тлумачити так: при збільшенні кількості клієнтів банку на 1% кредитовий оборот гранично зросте на 0, 73 %. Параметри регресії у невеликих за обсягом сукупностях здатні до випадкових коливань. Тому здійснимо перевірку їх істотності або статистичної значимості за допомогою t – критерію Стьюдента:
де оцінки дисперсій помилок та параметрів відповідно; значення критерію для кожного з параметрів. Критичне значення критерію Стьюдента для рівня значимості α = 0, 05 (задається дослідником) та n – k = 10-2 ступенів вільності (k – кількість параметрів) знаходимо за допомогою таблиць t – розподілу Стьюдента. Оскільки tкр .< tфак., то коефіцієнт регресії вважається статистично значимим, тобто з ймовірністю 0, 95 вплив чисельності клієнтів банку на кредитовий оборот визнається істотним. Для перетину b0 критичне значення більше фактичного значення критерію Стьюдента, тобто оцінка перетину статистично не значима. Для того, щоб визначити, як оцінки параметрів пов’язані з параметрами, потрібно побудувати інтервали довіри для параметрів узагальненої регресійної моделі, тобто інтервали в які з заданою ймовірністю потрапляють їхні оцінки. Довірчі межі коефіцієнта регресії: зі ймовірністю 0, 95. Довірчі межі вільного члена: зі ймовірністю 0, 95. Щоб відповісти на питання наскільки значним є вплив змінної х на у, знайдемо значення коефіцієнта кореляції, значення якого знаходиться між –1 та +1: Значення лінійного коефіцієнта кореляції 0, 91 близьке до одиниці, тому можна зробити висновок про досить тісний прямий (r > 0 ) зв’язок між кількістю клієнтів банку та величиною кредитового обороту. Загальну дисперсію результативної ознаки можна розкласти на дві частини –дисперсію, що пояснює регресію, та дисперсію помилок: Поділивши обидві частини на загальну дисперсію, отримаємо: Перша частина цього виразу являє собою частину дисперсії, яку не можна пояснити через регресійний зв’язок, друга – частину дисперсії, яку можна пояснити, виходячи з регресії. Вона називається коефіцієнтом детермінації і використовується як критерій адекватності моделі, бо є мірою пояснювальної сили незалежної змінної: Постільки значення коефіцієнта детермінації близьке до одиниці, то можна вважати, що побудована модель адекватна тобто зв’язок між кредитовим оборотом та чисельністю клієнтів банку істотний. (). Інший критерій істотності зв’язку – критерій Фішера. Він використовується найчастіше і дає відповідь на питання щодо адекватності моделі, коли значення коефіцієнта детермінації має не явно виражене граничне значення, наприклад, 0, 5: 0, 45: 0, 44 і ін. Перевірка моделі на адекватність за F – критерієм Фішера складається з таких етапів: 1. Розраховуємо величину F – критерію: В цій формулі n, k – кількість спостережень та кількість параметрів відповідно. 2. Задаємо рівень значимості, наприклад, α = 0, 05. Тобто, ми вважаємо, що можлива помилка для нас становить 0, 05, це означає, що ми можемо помилитися не більш, ніж у 5%випадків, а в 95% випадків наші висновки будуть правильними. 3. На цьому етапі за статистичними таблицями F – розподілу Фішера з (k -1, n - k) ступенями вільності та рівнем значимості 100(1- α)% знаходимо критичне значення: Fкр = 5, 32, 4. Оскільки, Fкр < Fфакт, то зі ймовірністю 0, 95 ми стверджуємо, що побудована нами модель є адекватною тобто зв’язок істотний. 3. За даними про рівень ефективності економіки та надійність ділового партнерства для семи країн східної Європи оцінити щільність зв’язку між цими ознаками. Таблиця 10.5.3
|