Общая факторная и остаточная суммы квадратов отклонений
Пусть на количественный нормально распределенный признак X воздействует фактор F, который имеет р постоянных уровней. Будем предполагать, что число Таблица 30
наблюдений (испытаний) на каждом уровне одинаково и равно q. Пусть наблюдалось n = pq значений xtJ признака X, где i — номер испытания (i — 1,2,.. q), /—номер уровня фактора (/=1, 2,...,р). Результаты наблюдений приведены в табл. 30. Введем, по определению, 50бщ=2 2 (xfj—х)г (общая сумма квадратов отклонений наблюдаемых значений от общей средней х), Р _ _ ^*факт 5=1 Я 2 (-^гр j -*)2; = 1 (i факторная сумма квадратов отклонений групповых средних от общей средней, которая характеризует рассеяние «между группами»), Q _ ^ост~ 2 (-^/l ^-rpi)* Ч" I = 1 Ч _ <7 _ + 2 (х1г — хгрг)г + • • • + 2 (х{р — хгрр)г 1 =1 i =1 г (остаточная сумма квадратов отклонений наблюдаемых значений группы от своей групповой средней, которая характеризует рассеяние «внутри групп»). Практически остаточную сумму находят по равенству (см. § 3, следствие) С с с ‘-'ост ^факт* Элементарными преобразованиями можно получить формулы, более удобные для расчетов: “ [(yli ~ [ (,! *') /<«•]■ <**> <7 где Pj= 2 Aj —сумма квадратов значений признака на я уровне Fj; Rj — 2 xij ~сумма значений признака на уровне Fj. Замечание. Для упрощения вычислений вычитают из каждого наблюдаемого значения одно и то же число С, примерно равное общей средней. Если уменьшенные значения «/,/=*,у— С, то Sofiu. = 2 Qj ~ £ (2 T^j j (pq) J, (***) S*aKT= 2 7> J - ^ 2 ГЛ j <W) J ’ <****> Q где Q/= 2 уЬ — сУмма квадратов уменьшенных значений признака f= 1 q на уровне Fj\ Tj—^^yij — сумма уменьшенных значений признака t= 1 на уровне Fj. Для вывода формул (***) и (****) достаточно подставить хп = уп-\-С Q q q в соотношение (*) и Яу = 2 •*</= 2 &// + с> = ^1У//+9С^Т/ + ЯС t= 1»=1 <= 1 в соотношение (-**). Пояснения. 1. Убедимся, что S^aKT характеризует воздействие фактора F. Допустим, что фактор оказывает существенное влияние на X. Тогда группа наблюдаемых значений признака на одном определенном уровне, вообще говоря, отличается от групп наблюдений на других уровнях. Следовательно, различаются и групповые средние, причем они тем больше рассеяны вокруг общей средней, чем большим окажется воздействие фактора. Отсюда следует, что для оценки воздействия фактора целесообразно составить сумму квадратов отклонений групповых средних от общей средней (отклонение возводят в квадрат, чтобы исключить погашение положительных и отрицательных отклонений). Умножив эту сумму на q, получим ■^факт- Итак, 5факх характеризует воздействие фактора. Убедимся, что 50ст отражает влияние случайных причин. Казалось бы, наблюдения одной группы не должны различаться. Однако, поскольку на X, кроме фактора F, воздействуют и случайные причины наблюдения одной и той же группы, вообще говоря, различны и, значит, рассеяны вокруг своей групповой средней. Отсюда следует, что для оценки влияния случайных причин целесообразно составить сумму квадратов отклонений наблюдаемых значений каждой группы от своей групповой средней, т. е. SOCT. Итак, 5осх характеризует воздействие случайных причин. Убедимся, что 5о6щ отражает влияние и фактора и случайных причин. Будем рассматривать все наблюдения как единую совокупность. Наблюдаемые значения признака различны вследствие воздействия фактора и случайных причин. Для оценки этого воздействия целесообразно составить сумму квадратов отклонений наблюдаемых значений от общей средней, т. е. So6lu. Итак, So6l4 характеризует влияние фактора и случайных причин. Приведем пример, который наглядно показывает, что факторная сумма отражает влияние фактора, а остаточная—влияние случайных причин. Пример. Двумя приборами произведены по два измерения физической величины, истинный размер которой равен х. Рассматривая в качестве фактора систематическую ошибку С, а в качестве его уровней — систематические ошибки Сг и С2 соответственно первого н второго прибора, показать, что S<j,aKX определяется систематическими, a Socx — случайными ошибками измерений. Решение. Введем обозначения: аь а2 — случайные ошибки первого и второго измерений первым прибором; рх, р2— случайные ошибки первого и второго измерений вторым прибором. Тогда наблюдаемые значения результатов измерений соответственно равны (первый индекс при х указывает номер измерения, а второй — номер прибора): = + -*81 = X -j- Сх -j- а2; *12 =JC-{-Cj + Pi, *22==JC-f-C2-bP2- Средине значения измерений первым и вторым приборами соответственно равны: *гр i = * + Ci + [(ai.-f-a 2)/ 2)=* + Ci + a, *гр 2— -*+Сг + [(Р1+Р2)/2] = * + С2 + р.
|