Анализ эмпирических данных.
Построение рядов распределения – составная часть сводной обработки данных статистического наблюдения (ДСН) для выявления основных свойств и закономерностей статистической совокупности (СС). Признак: качественный, количественный. Соответственно – Ряды: атрибутивный, вариационный. На формирование уровня признака влияет большое число факторов, которые при изучении относят в 2 группы: 1) общие для всех единиц изучаемой совокупности; 2) свойственные конкретным единицам СС и определяющие их индивидуальные особенности. Важнейший вопрос статистического исследования (СИ) – изучение характера и степени вариации у отдельных единиц СС. Важно определить роль каждой группы факторов на вариацию признака, а также роль отдельных факторов в группе. Схема исследования СС: - первичный ряд данных, - его ранжирование, определение: макс, мин, размах значений признака, выделение наиболее часто появляющихся значений, разделение данных по группам, определение частоты повторений отдельных вариантов значений. Признаки могут быть: дискретные и непрерывные. Ряд распределения принято оформлять в виде таблицы.
Частость - частота, представленная в относительном выражении Wi = fi/SUM fi. Для того, чтобы разделить данные наблюдений по группам, можно выбрать равные или неравные интервалы разбиения.
Определение величины интервала h для построения вариационного ряда с равными интервалами: R = Xmax – Xmin; Количество групп определяется приближенно по формуле Стэрджесса: k = 1 + 3.322 lg n, где n – общее число единиц изучаемой СС; h = R/k. Количество групп для него к= 5, интервал между группами h = 0.9
Для вариационного ряда с неравными интервалами рассчитывают относительную плотность распределения. Для сравнительной оценки данных, собранных по различным СС и по-разному обработанных, преобразуют интервалы и при этом используют показатели: mi(a) = fi/hi – абсолютная плотность mi(o) = Wi/hi - относительная плотность
Основные характеристики вариационного ряда для анализа и сравнения различных рядов распределения: 1) показатели центра группирования: центры группировки - мода, медиана (при одинаковых размахе вариации и характере распределения частот); 2) показатели вариации признака: пределы варьирования признака; 3) показатели формы распределения: симметричность расположения частот относительно центра (показатели асимметрии). Графическое изображение дискретного ряда – полигон распределения (величины вариантов значения признака X, частота f (частость w) этих вариантов, например – количество купленных пар обуви 39, 40, 41 и др. размеров). Графическое изображение интервального ряда – гистограмма, например, помесячные субсидии по квартплате. Для неравноинтервального ряда по оси ординат – показатели плотности интервалов. При n ® ¥ увеличивается число групп интервального ряда, уменьшается величина интервала, полигон превращается в кривую распределения, которая характеризует вариацию признака и закономерности распределения частот внутри однокачественной совокупности. При сравнении вариационных рядов, для анализа концентрации (производства в экономических исследованиях) используется кумулятивная кривая (кумулята), построенная по рассчитанным накопленным частотам и частостям. Она показывает, сколько единиц СС имеют значение признака не больше, чем рассматриваемое значение.
|