Уравнение множественной линейной регрессии
Пусть зависимая переменная Y связана с p (p> 1) независимыми переменными X 1, X 2, …, Xp соотношением: Y =b0+b1 X 1+b2 X 2+…+b pXp +e, (24) где b0, b1, b2, …, b p – детерминированные величины, e – случайное возмущение. Если математическое ожидание возмущения равно нулю (M ε =0), то соотношение (24) называется уравнением линейной множественной регрессии. Пусть проведено n наблюдений величин X 1, X 2, …, Xp и Y. Значение отклика в i -ом наблюдении (i =1, 2, …, n) обозначим yi, значения факторов – xi 1, xi 2, …, xip, значение возмущения – e i. Тогда соотношение (24) примет вид: yi =b0+b1 xi 1+b2 xi 2+…+bp xip +e i, (24а) Далее через Y будем обозначать вектор-столбец наблюдений отклика: Y=(y 1, …, yn) ′.Также обозначим: b=(b0, b1,, b p)′ – вектор-столбец неизвестных коэффициентов регрессии, e=(e1, …, e n)′ – вектор-столбец возмущений, – матрица наблюдений независимых переменных размера n ´ (p +1). Тогда соотношение (24а) можно записать в матричном виде: Y= X b+ε. (25) Обратите внимание, что введение в матрицу X первого столбца из единиц равносильно умножению коэффициента b0 на фиктивную переменную x 0, которая во всех наблюдениях принимает значение 1 (xi 0=1, i =1, 2, …, n). Требуется по наблюдениям найти в некотором смысле наилучшие оценки b =(b 1 ,, bp)′ коэффициентов b. Если оценки b получены, то оценку отклика по известному значению факторов x 1, x 2 ,..., xp можно определить по формуле: . (26)
|