СВЯЗИ ДВУХ СЛУЧАЙНЫХ ВЕЛИЧИН
КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
Пусть X, Y - случайные величины на Ω. - функция распределения случайной величины X, - функция распределения случайной величины Y, - совместная функция распределения случайной величины (X, Y). X, Y независимы условные вероятности = безусловным вероятностям)
X, Y – функционально зависимы ó существует функция f: Y = f (X). X, Y – стохастически (вероятностно) зависимы ó X и Y не являются независимыми, но не являются и функционально зависимыми.
Как правило, стохастическая зависимость X и Y возникает, когда X и Y формируются под действием ряда случайных факторов, часть из которых действует одновременно на X и на Y. Например, пусть U, V, W - случайные факторы, Тогда X и Y могут быть стохастически зависимы.
Как описать зависимость X и Y и её силу?
Корреляционная зависимость X и Y (та часть зависимости X и Y, которая описывается функционально). Описывается двумя линиями регрессии:
- условное математическое ожидание случайной величины Y при фиксированной X = x, - условное математическое ожидание случайной величины X при фиксированной Y = y.
Определение. Если то случайная величина Y не коррелирует с X. Аналогично, не коррелирует с Y. Тогда линии регрессии – прямые параллельные осям Ox или Oy. В случае некоррелированных случайных величин X и Y их стохастическая зависимость (если она существует) не имеет функционального компонента.
График.
По теореме об устойчивости средних уравнение регрессии дает наилучшее описа-ние функциональной зависимости Y от Х (см. ниже экстремальное свойство условного мате-матического ожидания из учебника Плехановки, с.258).
Уравнения линий регрессии Для непрерывных X и Y так как
Для дискретных X и Y - центр масс расположенных на прямой в точках
Насколько точно это функциональной описание зависимости Y от Х соответствует реальной стохастической зависимости Y от Х показывают условные дисперсии: - скедастические (изменчивые) линии.
Т.о. отражают точность описания зависимости Y от Х и X от Y с помощью регрессий - СКО сл.в. от . Графики
Учебник Плехановки: Экстремальное свойство условного математического ожидания. M (Y | X) отражает (в среднем) зависимость Y от Х с минимальной среднеквадратичной погрешностью (т.е. с минимальной дисперсией!): для любой функции y = f (x) Если т.е. не зависит от х, то Y не коррелирует с Х.
Точность описания функциональной зависимости X и Y линиями регрессии характеризуют скедастические линии – условные дисперсии .
|