Взаимосвязь показателей вариации
В нормальном ряду распределения между показателями вариации имеются следующие примерные соотношения: 5.3. Основные свойства дисперсии 1. Если все значения признака уменьшить или увеличить на какое-то постоянное число а, то дисперсия не изменится. 2. Если все значения признака уменьшить или увеличить в К раз, то дисперсия изменится в К 2 раз. 3. Сумма квадратов отклонений индивидуальных значений признака x от их средней
4. Дисперсия признака равна разности между средним квадратом значения признака и квадратом их средней:
Дисперсия альтернативного признака В ряде случаев возникает необходимость измерить вариацию альтернативного признака, то есть такого, который может принимать только два значения. Обозначив отсутствие интересующего нас признака через 0, его наличие через 1, долю единиц, обладающих данным признаком - через р, не обладающих — через q, дисперсию этого признака можно определить как Например, если 64% работников предприятия имеют высшее образование р, то дисперсия будет равна:
5.4. Правило сложения дисперсий На вариацию признака влияют различные причины и факторы, которые делятся на случайные и систематические. Поэтому и вариация может быть случайной, вызванной действием случайных причин и систематической, обусловленной воздействием постоянных причин и факторов. В связи с этим возникает необходимость в определении случайной систематической составляющей и её роли в общей вариации. Общую дисперсию мы уже рассматривали. Она характеризует общую вариацию признака под влиянием всех условий, всех причин, вызывающих эту вариацию и исчисляется по формуле: Для определения влияния постоянного фактора на величину вариации пользуются аналитической группировкой. Вариация, обусловленная фактором, положенным в основание группировки, называется межгрупповой вариацией. Размеры ее определяются при помощи дисперсии групповых средних или межгрупповой дисперсии, которая характеризует колеблемость групповых или частных средних
где Таким образом, межгрупповая дисперсия (дисперсия групповых средних) равна средней арифметической из квадратов отклонений частных средних от общей средней. Она характеризует систематическую вариацию, которая возникает под влиянием фактора, признака, положенного в основание группировки. Для определения влияния случайных факторов и их роли в общей вариации определяют дисперсию в пределах каждой группы, т.е. внутригрупповую дисперсию, а затем и среднюю из внутригрупповых дисперсий:
В математической статистике доказано, что общая дисперсия признака равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий. Это правило называется правилом сложения дисперсий. 5.5. Ряды распределения и их моделирование а) Моменты распределения Одной из важных задач анализов рядов распределения является выявление закономерности распределения, определение ее характера и количественного выражения. Эта задача решается при помощи показателей, характеризующих форму, тип распределения. Кроме рассмотренных выше важной характеристикой рядов распределения являются моменты распределения. Моментом распределения (М к) называется средняя арифметическая из отклонений значений признака x от некоторой постоянной величины а в степени к: Величина к определяет порядок момента. В зависимости от величины а различают начальные, центральные и условные моменты (табл. 5.2).
Таблица 5.2 Значение моментов распределения
Условные моменты используются для определения дисперсий высоких степеней. Практически используются моменты первых четырех порядков. Если в качестве весов взять не частоты, а вероятности, то получим теоретические моменты распределения. б) Кривые распределения Для обобщенной характеристики особенностей формы распределения применяются кривые распределения, которые выражают закономерность распределения единиц совокупности по величине варьирующего признака. Эмпирическая кривая - это фактическая кривая, полученная по данным наблюдения, в которой отражаются как общие, так и случайные условия, определяющие распределение (кривая 1, рис.5.3) Теоретическая кривая распределения - это кривая, выражающая функциональную связь между изменением варьирующего признака и изменением частот и характеризующая определенный тип распределения (кривая 2, рис.5.3). По форме кривые распределения бывают симметричными и асимметричными. В зависимости от того, какая ветвь кривой вытянута, различаютправостороннюю асимметрию илевостороннюю асимметрию (рис.5.1). Кривые распределения также могут иметь различную островершинность (рис.5.2). Для характеристики степени асимметрии кривой используют коэффициент асимметрии, который представляет собой отношение центрального момента третьего порядка к среднему квадратическому отклонению в кубе
Если А >0, то асимметрия правосторонняя, а если А <0, то асимметрия левосторонняя, в симметричном распределении - А = 0. Кроме этого коэффициента для характеристики асимметрии применяют и соотношение между
Для характеристики островершинности кривой распределения применяют коэффициент эксцесса, который равен отношению центрального момента четвертого порядка к дисперсии в квадрате
В нормальном распределении Е =3, поэтому, если Е >3, то эксцесс выше нормального (островершинная кривая), Е <3, эксцесс ниже нормального (плосковершинная кривая). в) Моделирование рядов распределения Все рассмотренные выше показатели характеризуют отдельные свойства совокупности. Общую характеристику ряда распределения можно представить аналитически, в виде функции, характеризующей зависимость между изменениями признака и частотами. Если имеется эмпирический ряд распределения, то необходимо найти функцию распределения, т. е. подобрать такую теоретическую кривую, которая наиболее полно бы раскрывала закономерность распределения. Нахождение функции кривой распределения называется моделированием. Для аппроксимации (выравнивания) эмпирических кривых распределения в статистике часто пользуются нормальным распределением, функция которого где F (x) - интегральная функция распределения; t - нормированное отклонение; e - основание натуральных логарифмов. Теоретическое распределение вероятностей и частот дает представление о форме, типе распределения, о закономерности, свойственной изучаемому явлению.
Правосторонняя Симметричная Левосторонняя Асимметрия кривая асимметрия
Рис.5.1. Типы кривых распределения (по асимметрии)
Рис. 5.2. Типы кривых распределения (по островершинности) Эмпирическое и теоретическое распределение рабочих по степени выполнения норм приведено в табл.5.3 и на рис.5.3. Таблица 5.3 Распределение рабочих по степени выполнения норм выработки
г) критерии согласия Для оценки близости эмпирического и теоретического распределения используются специальные показатели, которые называются критериями согласия. Критерии согласия как правило тем или иным способом оценивают степень расхождения между эмпирическими и теоретическими частотами. Наиболее часто используется критерий, который называется хи-квадрат Пирсона и рассчитывается где f’ -теоретические частоты, f -эмпирические частоты. Чем меньше значение Для проверки согласия с помощью Также применяется и критерий согласия Колмогорова Вычислив фактический критерий В явлениях общественной жизни асимметричные распределения встречаются гораздо чаще, чем симметричные. Некоторые асимметричные распределения могут быть приведены к симметричному путем преобразования признака Х, например логарифмированием. В этом случае распределение называется логарифмически нормальным. Такое преобразование производится, как правило, для сильно асимметричных распределений.
|