Вариация альтернативного признака
Альтернативные признаки – два противоположных, взаимоисключающих друг друга качественных признака, которыми одни единицы совокупности обладают (значение варианта 1), а другие не обладают (значение варианта 0) (например, пол – мужской и женский, население – городское и сельское, продукция – годная и бракованная). Частостью (p) является доля единиц, обладающих данным признаком, в общей численности совокупности и (q = 1 – p) – доля единиц, не обладающих данным признаком, в общей численности совокупности.
Средняя арифметическая альтернативного признака . (2.18) Дисперсия альтернативного признака , (2.19) т.е. дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, и доли единиц, не обладающих этим признаком. Исходя из того, что p + q = 1: ; . (2.20) Вариацию между группами за счет признака-фактора, положенного в основу группировки, отражает межгрупповая дисперсия, которая исчисляется как средний квадрат отклонений групповой средней от общей средней: . (2.25) Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, т.е. вариацию между группами за счет признака-фактора, положенного в основу группировки.Вариацию внутри каждой группы изучаемой совокупности отражает внутригрупповая дисперсия, которая исчисляется как средний квадрат отклонений значений признака х от частной средней : или . (2.26) Для всей совокупности внутригрупповую вариацию будет выражать средняя из внутригрупповых дисперсий, которая рассчитывается как средняя арифметическая из внутригрупповых дисперсий: . (2.27) Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основу группировки.Между представленными видами дисперсий существует определенное соотношение, которое известно как правило сложения дисперсий: . (2.28) Правило сложения дисперсий позволяет выявить зависимость результатов от определяющих факторов с помощью соотношения межгрупповой и общей дисперсий. Это соотношение называется эмпирическим коэффициентом детерминации (η2) и показывает долю вариации результативного признака под влиянием факторного. . (2.29) Эмпирическое корреляционное отношение (η) показывает тесноту связи между исследуемым явлением и группировочным признаком. . (2.30) η2 и η [0, 1]. (2.31) Если связь отсутствует, то h = 0. В этом случае межгрупповая дисперсия равна нулю (δ2=0), т.е. все групповые средние равны между собой и межгрупповой вариации нет. Это означает, что группировочный признак не влияет на вариацию исследуемого признака х. Если связь функциональная, то h = 1. В этом случае дисперсия групповых средних равна общей дисперсии (). Это означает, что группировочный признак полностью определяет характер изменения изучаемого признака.Чем больше значение корреляционного отношения приближается к единице, тем полнее (сильнее) корреляционная связь между признаками (таблица 2.3).
Таблица 2. - Качественная оценка связи между признаками (шкала Чэддока)
Пример 1. Определим групповые дисперсии, среднюю из групповых дисперсий, межгрупповую дисперсию, общую дисперсию по данным о производительности труда в двух бригадах:
Промежуточные расчеты занесем в таблицы:
Средняя производительность труда для 1-й бригады: = 13,8 шт./ч. Средняя производительность труда для 2-й бригады: = 17,8 шт./ч. Средняя производительность труда для 1-й и 2-й бригады: = 15,8 шт./ч.
Эмпирический коэффициент детерминации: = 0,457 = 45,7%. Отсюда можно сделать вывод, что общая вариация производительности труда на 45,7% обусловлена вариацией между группами. Эмпирическое корреляционное отношение = 0,6757. Значение h = 0,6757 показывает заметную связь по шкале Чэддока (см. таблицу 2.3) между исследуемым явлением (производительностью труда) и группировочным признаком (бригады).
|