В. Отыскание параметров выборочного уравнения прямой линии регрессии по сгруппированным данным
В § 4 для определения параметров уравнения прямой линии регрессии У на X была получена система уравнений (2 ха) + (2х) ь “ 2 *У> (2*)Р»*+"& = 2 У- Предполагалось, что значения X и соответствующие им значения У наблюдались по одному разу. Теперь же допустим, что получено большое число данных (практически для удовлетворительной оценки искомых параметров должно быть хотя бы 50 наблюдений), среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы. Запишем систему (*) так, чтобы она отражала данные корреляционной таблицы. Воспользуемся тождествами: 2 х = пх (следствие из х = 2 х/п): 2 У “ пУ (следствие из у = 2 У/пУ> 2х[5] = «х* (следствие из х* = 2 ■**/«)» 2Х0“2Я*»Х0 (учтено, что пара чисел ( х, у) наблюдалась пЖу раз). Подставив правые части тождеств в систему (*) и сократив обе части второго уравнения на п, получим (пх1) ру, + (пх) 6 = 2 пху ху, (*)Р Ух+Ь=у. Решив эту систему, найдем параметры pv* и ft и, следовательно, искомое уравнение Уж^РужХ + Ь. Однако более целесообразно, введя новую величину — выборочный коэффициент корреляции, написать уравнение регрессии в ином виде. Сделаем это. Найдем Ь из второго уравнения (**): Ь = у—рухх. Подставив правую часть этого равенства в уравнение Ух=Рухх + Ь, получим Ух—У = Рух (х — х). (***) Найдем *> из системы (*) коэффициент регрессии, учитывая, что х * — (х)2 = о* (см. гл. XVI, § 10): Пхуху—пху _ ^пхуху — пху 9ух~ п[х*—(£)*] “ nal Умножим обе части равенства на дробь ox/oyi Ъх S пху*У—пху р = __—, (****) Оу по^ву Обозначим правую часть равенства через гв и назовем ее выборочным коэффициентом корреляции (см. замечание 3):
|