линейная регрессия.
Первое представление о наличие и виде связи между выборками дает облако рассеивания-совок точек (Хi,Yi). при отсутствии тесных связей имеет место беспорядочное расположение точек на графике. чем сильнее связь тем теснее будут группироваться точки вокруг опред линии выражающей форму связи. задача линейной регрессии состоит в том чтобы построить прямую у=ах+б которая бы наилучшим образом приближалась к точкам (Xi,Yi). Будем использовать метод наименьших квадратов-минимизировать сумму квадратов отклонений от точек до прямой: S=Е(Yi-(aXi+b))^2->min. для нахождения минимума решается "система"dS/da=0, ds/db=0; dS/da=-2E(Yi-(a*Xi+b))*xi, ds/db=-2E(Yi-(a*Xi+b));Txi*yi-a*Exi^2-b*Exi, Eyi-a*Exi+b; 1/n*Exi*yi-a*1/n*Exi^2-b*1/n*Exi=0, 1/n*Eyi-a*1/n*Exi-b=0; b=y".."-a*x"..", x*y"оба счерт"-a*X^2".."-b*x".."=0; a=x*y"оба с черт"-x".."*y".."/(x^2)".."-(x"..")^2;"конец" x*y"оба с черт"=1/n*EXi*yi, x^2)".."=1/n*Exi^2, (x^2)".."-(x"..")^2=Sx^2, x*y"оба счерт"-x".."*y".."=cor(x;y), решением является a=rxy*корень(Se^2/Sx^2) b=Y".."-a*X"..", где rxy=cov(x;y)/корень(Sx^2*sy^2). y"c крышкой"=a*x+b - регрессия у/х можно так же х/у: S=E(xi-(c*yi+d))^2->min тогда система примет вид:ds/dc=0, ds/dd=0 а решением будет c=rxy*корень(Sx^2/Sy^2) и d=x".."-c*y"..".
|