Предварительные соображения к введению меры любой корреляционной связи
Выше рассматривалась оценка тесноты линейной корреляционной связи. Как оценить тесноту любой корреляционной связи? Пусть данные наблюдений над количественными признаками X и Y сведены в корреляционную таблицу. Можно считать, что тем самым наблюдаемые значения У разбиты на группы; каждая группа содержит те значения Y, которые соответствуют определенному значению X. Например, дана корреляционная табл. 17. К первой группе относятся те 10 значений Y (4 раза наблюдалось уг = 3 и 6 раз у2 = 5), которые соответствуют xt = 8. Ко второй группе относятся те 20 значений Y (13 раз наблюдалось ух = 3 и 7 раз уг = 5), которые соответствуют *а = 9.
Условные средние теперь можно назвать групповыми средними: групповая средняя первой группы у, = = (4.3 6• 5)/Ю = 4,2; групповая средняя второй группы у9 = (13 • 3 + 7 • 5)/20 = 3,7. Поскольку все значения признака У разбиты на группы, можно представить общую дисперсию признака в виде суммы внутригрупповой и межгрупповой дисперсий (см. гл. XVI, § 12): ^общ ~ ^внгр + ^межгр' (*) Покажем справедливость следующих утверждений: если У связан с X функциональной зависимостью, То ^иежгр/^общ = если У связан с X корреляционной зависимостью, То ^иежгр/^общ 1 • Доказательство. 1) Если У связан с X функциональной зависимостью, то определенному значению X соответствует одно значение У. В этом случае в каждой группе содержатся равные между собой значения У*\ поэтому групповая дисперсия каждой группы равна нулю. Следовательно, средняя арифметическая *> Например, если значению дсх = 3 соответствует yi = 7, причем хх = 3 наблюдалось 5 раз, то в группе содержится 5 значений У\ = 7. групповых дисперсий (взвешенная по объемам групп), т. е. внутригрупповая дисперсия £>в„гр = 0 и равенство (*), имеет вид А>«щ= ^иежгр* Отсюда ^иежгр/^общ ” 1 • Если У связан с X корреляционной зависимостью, то определенному значению X соответствуют, вообще говоря, различные значения У (образующие группу). В *том случае групповая дисперсия каждой группы отлична от нуля. Следовательно, средняя арифметическая групповых дисперсий (взвешенная по объемам групп) Атгр*5*0- Тогда одно положительное слагаемое Д«ЖГ| меньше суммы двух положительных слагаемых DBHrp+ ^межгр ^овщ* ^кежгр ^общ* Отсюда ■^иежгр/^общ ^ Уже из приведенных рассуждений видно, что чем связь между признаками ближе к функциональной, тем меньше DBirrp и, следовательно, тем больше приближается DMe>Krp к £)ойщ, а значит, отношение Д,ежгр/Ообщ—к единице. Отсюда ясно, что целесообразно рассматривать в качестве меры тесноты корреляционной зависимости отношение межгрупповой дисперсии к общей, или, что то же, отношение межгруппового среднего квадратического отклонения к общему среднему квадратическому отклонению.
|