Выборочный коэффициент корреляции
Как следует из предыдущего параграфа, выборочный коэффициент корреляции определяется равенством 'Enj'yxy — nxy Гв — ~ 9 пахОу где х, у —варианты (наблюдавшиеся значения) признаков X и У; пху —частота пары вариант (х, у); п —объем выборки (сумма всех частот); ах, а у—выборочные средние квадратические отклонения; х, у —выборочные средние. Известно, что если величины Y и X независимы, то коэффициент корреляции г=0 (см. гл. XIV, § 17); если / = ±1,тоУ и X связаны линейной функциональной зависимостью (см. гл. XIV, § 20). Отсюда следует, что коэффициент корреляции г измеряет силу (тесноту) линейной связи между Y и X. Выборочный коэффициент корреляции гв является оценкой коэффициента корреляции г генеральной совокупности и поэтому также служит для измерения линейной связи между величинами—количественными признаками Y и X. Допустим, что выборочный коэффициент корреляции, найденный по выборке, оказался отличным от нуля. Так как выборка отобрана случайно, то отсюда еще нельзя заключить, что коэффициент корреляции генеральной совокупности также отличен от нуля. Возникает необходимость проверить гипотезу о значимости (существенности) выборочного коэффициента корреляции (или, что то же, о равенстве нулю коэффициента корреляции генеральной совокупности). Если гипотеза о равенстве нулю генерального коэффициента корреляции будет отвергнута, то выборочный коэффициент корреляции значим, а величины X и V коррелированы; если гипотеза принята, то выборочный коэффициент корреляции незначим, а величины X и Y не коррелированы. Проверка гипотезы о значимости выборочного коэффициента корреляции для случая нормальной корреляции изложена далее (см. гл. XIX, § 21). Если выборка имеет достаточно большой объем и хорошо представляет генеральную совокупность (репрезентативна), то заключение о тесноте линейной зависимости между признаками, полученное по данным выборки, в известной степени может быть распространено и на генеральную совокупность. Например, для оценки коэффициента корреляции гг нормально распределенной генеральной совокупности (при п ^ 50) можно воспользоваться формулой гв—3 < гг < гв + 3 l±d, в /л г в V п Замечание 1. Знак выборочного коэффициента корреляции совпадает со знаком выборочных коэффициентов регрессии,> что следует из формул (см. § 6): Pyx = ra^i; рж = гв?£. (*) ах " оу Замечание 2. Выборочный коэффициент корреляции равеи среднему геометрическому выборочных коэффициентов регрессии. Действительно, перемножив левые и правые части равенств (*), получим РхуРху—'В' Отсюда гь i г РухРху'
|