Достоверность выборочного коэффициента корреляции
Критерий выборочного коэффициента корреляции определяется по формуле: (11.9) где: – критерий достоверности коэффициента корреляции; r – выборочный коэффициент корреляции; n – число коррелированных пар данных; tst – стандартное значение критерия Стьюдента, определяемое по таблице для установленного числа степеней свободы и порога вероятности безошибочных прогнозов. При t ≥ tst коэффициент корреляции достоверен. В этом случае с определенной вероятностью можно считать, что между коррелируемыми признаками имеется связь и в генеральной совокупности такая же по знаку, какая получилась в выборке (прямая или обратная). При t < tst выборочный коэффициент корреляции недостоверен, что не дает возможности сделать какое-либо заключение о связи признаков в генеральной совокупности. Для выяснения этого вопроса требуется провести повторные исследования на более многочисленном материале.
Пример При проверке гипотезы о связи крупноплодности с жирномолочностью был рассчитан коэффициент корреляции между процентом жира в молоке у 50 коров и весом при рождении телят от этих же коров. Получено: коэффициент корреляции: r = +0, 21; его ошибка: ; критерий достоверности: ; n = 48; tst = {2, 0 – 2, 7 –3, 5}. Выборочный коэффициент оказался явно недостоверным. На основе проведенного исследования нельзя ожидать связи между крупноплодностью и жирномолочностью у всех коров вообще. Определение достоверности коэффициента корреляции можно значительно упростить, используя свойства особой функции предложенной Фишером: (11.10) При помощи этой функции можно заранее определить, при каком объеме выборки коэффициент корреляции определенной величины будет достоверен по требуемому порогу вероятности безошибочных прогнозов, по следующей формуле: , (11.11) где: – количество пар значений, достаточное для достоверности выборочного коэффициента корреляции, t – критерий Стьюдента для каждого из трех порогов вероятности безошибочных прогнозов (b1 = 0, 95, b2 = 0, 99, b3 = 0, 999), для больших групп: t1 = 1, 96, t2 =2, 58, t3 = 3, 30. z – функция Фишера По этой формуле рассчитано значение z и количество пар значений, достаточное для достоверности выборочного коэффициента корреляции для каждого из трех порогов вероятности безошибочных прогнозов. В примере в выборке объемом n = 50 получен коэффициент корреляции r = +0, 21. При r = 0, 21, рассчитаны три числа: 87 – 149 – 242. Это значит, что выборочный коэффициент корреляции, равный r = 0, 21, может стать достоверным в том случае, если объем выборки (число коррелируемых пар данных) будет: для первого порога вероятности 87, для второго – 149, для третьего – 242. Так как фактический объем выборки n = 50 далеко не достигает первого, максимальною порога, то полученный коэффициент корреляции оказался недостоверным, что было найдено и обычным способом. Объем выборки для первого порога вероятности безошибочных прогнозов b1 = 0, 95 можно оценить, воспользовавшись простым соотношением:
|