Методические указания и решение типовых задач. Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной
Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики объекта в целом при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала. Сводка – это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. По глубине и точности обработки материала различают сводку простую и сложную. Простая сводка – это операция по подсчету общих итогов по совокупности единиц наблюдения. Сложная сводка – это комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц. Проведение сводки необходимо осуществлять по следующим этапам: - выбор группировочного признака; - определение порядка формирования групп; - разработка системы статистических показателей для характеристики групп и объекта в целом; - разработка макетов статистических таблиц для представления результатов сводки. По форме обработки материала сводка бывает централизованной, когда весь первичный материал поступает в одну организацию, подвергается в ней обработке от начала до конца; децентрализованной, когда отчеты предприятий сводятся статистическими органами субъектов РФ, а полученные итоги поступают в Госкомстат РФ и там определяются итоговые показатели в целом по народному хозяйству страны. По технике выполнения статистическая сводка бывает механизированной (с использованием электронно-вычислительной техники) и ручной. Метод группировки и его место в системе статистических методов. Группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным, существенным для них признакам. Группировка является важнейшим статистическим методом обобщения статистических Данных, основой для правильного исчисления статистических показателей. С помощью метода группировок решаются следующие задачи: - выделение социально-экономических типов явлений; - изучение структуры явления и структурных сдвигов, происходящих в нем; - выявление связи и зависимости между явлениями. Виды статистических группировок. В соответствии с задачами группировки различают следующие ее виды: типологическая, структурная, аналитическая. Типологическая группировка – это расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений. При построении группировки этого вида основное внимание должно быть уделено идентификации типов социально-экономических явлений и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого явления. Структурной называется группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку. Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой. В статистике признаки можно разделить на факторные и результативные. Факторными называются признаки, оказывающие влияние на изменение результативных. Результативными называются признаки, изменяющиеся под влиянием факторных. Взаимосвязь проявляется в том, что с возрастанием значения факторного признака систематически возрастает или убывает значение признака результативного. Особенностями аналитической группировки является то, что единицы группируются по факторному признаку; каждая выделенная группа характеризуется средними значениями результативного признака. Все рассмотренные группировки могут быть построены по какому-то одному или нескольким существенным признакам. Группировка, в которой группы образованы по одному признаку, называется простой. Сложной называется группировка, в которой расчленение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации). Сначала группы формируются по одному признаку, затем эти группы делятся на подгруппы по другому признаку, которые, в свою очередь, делятся по третьему признаку, и т.д. Итак, сложные группировки дают возможность изучить единицы совокупности одновременно по нескольким признакам. При построении сложной группировки возникает вопрос о последовательности разбиения единиц объекта по видам признаков. Как правило, рекомендуется сначала производить группировку по атрибутивным признакам, значения которых имеют ярко выраженные качественные различия, а затем – по количественным. Принципы построения статистических группировок и классификаций. Построение группировки начинается с определения состава группировочных признаков. Выбор группировочного признака, т.е. признака, по которому производится объединение единиц исследуемой совокупности в группы, - один из самых существенных и сложных вопросов теории группировки и статистического исследования. Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные обоснованные признаки. В основание группировки могут быть положены как количественные, так и атрибутивные признаки. Первые имеют числовое выражение (объем торгов, возраст человека, доход семьи и т.д.), а вторые отражают состояние единицы совокупности (пол человека, семейное положение, отраслевую принадлежность предприятия, его форму собственности и т.д.). После того как определено основание группировки, следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, численности совокупности, степени вариации признака. Если группировка строится по атрибутивному признаку, то групп, как правило, будет столько, сколько имеется градаций, видов состояний у этого признака. Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов Федерации. Если группировка проводится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака. При небольшом объеме совокупности не следует образовывать большое число групп, так как группы будут включать недостаточное число единиц объекта. Поэтому показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления. Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В этом случае количество групп зависит в первую очередь от степени колеблемости группировочного признака: чем она больше, тем больше можно образовать групп. Чем больше групп, тем точнее будет воспроизведен характер исследуемого объекта. Однако слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономических явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенностей объекта и цели исследования. Определение числа групп можно осуществить и математическим путем с использованием формулы Стерджесса: n = 1 + 3, 322 * lgN, (3.1) где n – число групп; N – число единиц совокупности Согласно формуле (3.1) выбор числа групп зависит от объема совокупности. Недостаток формулы (3.1) состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основание группировки, близко к нормальному. Другой способ определения числа групп основан на применении среднего квадратического отклонения. Если величина интервала равна 0, 5σ, то совокупность разбивается на 12 групп, а когда величина интервала равна 2/3σ и σ, то совокупность делится соответственно на 9 и 6 групп. Однако при определении групп данными методами существует большая вероятность получения «пустых», или малочисленных, групп. Когда определено число групп, то следует определить интервалы группировки. Интервал – это значение варьирующего признака, лежащее в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала. Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строятгруппировку с равными интервалами. Величина равного интервала определяется по следующей формуле: (3.2) где xmax и xmm – максимальное и минимальное значения признака в совокупности: n – число групп. Если максимальное и минимальное значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное и минимальное значения, а значения, несколько превышающиеминимум и несколько меньше, чем максимум. Существуют следующие правила записи числа шага интервала. Если величина интервала, рассчитанная по формуле (3.2), представляет собой величину, которая имеет один знак до запятой (например, 0, 88; 1, 585; 4, 71), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. В приведенном выше примере это будут соответственно значения: 0, 9; 1, 6; 4, 7. Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой (например, 15, 985), то это значение необходимо округлить до целого числа (до 16). В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 557 следует округлить до 600. Если размах вариации признака совокупности велик и значения признака варьируются неравномерно, то необходимо использовать группировку с неравными интервалами. Неравные интервалы могут быть прогрессивно-возрастающими или прогрессивно-убывающими в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом: hi+1 = hi + a, (3.3) а в геометрической прогрессии: hi+1 = hi · q, (3.4) где а – константа, имеющая для прогрессивно-возрастающих интервалов знак «+», а для прогрессивно-убывающих интервалов знак «-»; q – константа (для прогрессивно-убывающих интервалов q > 1; в другом случае – q < 1). Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница несущественна. Например, при построении группировки малых и крупнейших предприятий отрасли по показателю численности промышленно-производственного персонала, который варьирует от 200 до 2000 человек, целесообразно рассматривать неравные интервалы. Поэтому следует образовывать неравные интервалы: 200-500; 500-1100; 1100-2000, т.е. величина каждого последующего интервала больше предыдущего на 300 человек и увеличивается в арифметической прогрессии. Интервалы группировок могут быть закрытыми и открытыми. Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы. У открытых интервалов указана только одна граница: верхняя – у первого, нижняя – у последнего. Например, группы коммерческих банков по уровню дохода работающих в них сотрудников (чел.): до 2200, 2200-2300, 2300-2400, 2400 и более. При группировке единиц совокупности по количественному признаку границы интервалов могут быть обозначены по-разному в зависимости от того, непрерывный это признак или прерывный. Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему работ (тыс. руб.): 1200-1400, 1400-1600, 1600-1800, 1800-2000), то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого и нижнюю границу второго интервалов; 1600 тыс. руб. – соответственно второго и третьего и т.д., т.е. верхняя граница 1-го интервала равна нижней границе (i + 1) интервала. При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должна войти строительная фирма с объемом работ 1600 тыс. руб. Если нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в противном случае – ко второй. Для того чтобы правильно отнести к той или иной группе единицу объекта, значение признака у которой совпадает с границами интервалов, можно использовать открытые интервалы (по нашему примеру группы строительных фирм по объему работ преобразуются в следующие: до 1400, 1400-1600, 1600-1800, 1800 и более). В данном случае вопрос отнесения отдельных единиц совокупности, значения которых являются граничными, к той или иной группе решается на основе анализа последнего открытого интервала. Возможны два случая обозначения открытого последнего интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае строительные фирмы с объемом работ 1600 тыс. руб. попадут в третью группу; во втором случае – во вторую группу. Если в основании группировки лежит прерывный признак, то нижняя граница 1-го интервала равна верхней границе (i – 1) интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала будут иметь вид (чел.): 100-150, 151-200, 201-300. При определении границ интервалов статистических группировок необходимо исходить из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала должна устанавливаться там, где происходит переход от одного качества в другое. Это достигается путем использования группировок со специализированными интервалами. Специализированными называются интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях. Например, группировка по отраслям народного хозяйства. При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными и, как правило, используются при группировке предприятий, например, по уровню рентабельности. Пример. Произведем анализ 30 самых надежных среди малых и средних коммерческих банков одного из регионов (на 01.01.98 г.), применяя метод группировок (табл. 3.1).
Таблица 3.1 Основные показатели деятельности коммерческих банков одного из регионов на 01.01.98 г. (цифры условные) (тыс. руб.)
В качестве группировочного признака возьмем уставный капитал. Образуем четыре группы банков с равными интервалами. Величину интервала определим по формуле: Обозначим границы групп: 2100-7350 – 1-я группа; 7350-12600 – 2-я группа; 12600-17850 – 3-я группа; 17850-23100 – 4-я группа. После того как определен группировочный признак - уставный капитал, задано число групп – 4 и образованы сами группы, необходимо отобрать показатели, которые характеризуют группы, и определить их величины по каждой группе. Показатели, характеризующие банки, разносятся по указанным группам, и подсчитываются итоги по группам. Результаты группировки заносятся в таблицу, и определяются общие итоги по совокупности единиц наблюдения по каждому показателю (табл. 3.2). Таблица 3.2 Группировка малых и средних коммерческих банков одного из регионов по величине уставного капитала на 01.01.98 г.
Структурная группировка коммерческих банков на основе данных табл. 3.2 представлена в табл. 3.3. Таблица 3.3 Группировка малых и средних коммерческих банков одного из регионов по величине уставного капитала на 01.01.98 г.
Из табл. 3.3 видно, что в основном преобладают малые банки – 60%, на долю которых приходится 42, 5% всего капитала. Более конкретный анализ взаимосвязи показателей можно сделать на основе аналитической группировки (табл. 3.4). Таблица 3.4 Группировка малых и средних коммерческих банков одного из регионов по величине уставного капитала на 01.01.98 г.
Величины капитала и работающих активов прямо взаимозависимы, и чем крупнее банк, тем эффективнее управление работающими активами. Мы рассмотрели примеры группировок по одному признаку. Однако в ряде случаев для решения поставленных задач такая группировка является недостаточной. В этих случаях переходят к группировке исследуемой совокупности по двум и более существенным признакам во взаимосвязи (сложной группировке). Произведем группировку данных коммерческих банков по двум признакам: величине капитала и работающих активов. Каждую группу и подгруппу охарактеризуем следующими показателями: число коммерческих банков, капитал, работающие активы (табл. 3.5).
Таблица 3.5 Группировка коммерческих банков одного из регионов по величине капитала и работающих активов на 01.01.98 г.
От группировок следует отличать классификацию. Классификацией называется систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основании их сходства и различия. Отличительной чертой классификации является то, что в основу ее кладется атрибутивный признак. Классификации стандартны, устойчивы, т.е. остаются неизменными в течение длительного периода времени, и, как правило, разрабатываются органами государственной и международной статистики. Ряды распределения – это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу ряда распределения, различают атрибутивные и вариационные ряды распределения. Атрибутивными называют ряды распределения, построенные по качественным признакам, т.е. признакам, не имеющим числового выражения. Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов эти данные позволяют исследовать изменение структуры. Примером атрибутивного ряда распределения может служить распределение студентов группы ДС-301 по полу (табл. 3.6). Таблица 3.6 Распределение студентов группы ДС-301 факультета статистики по полу
Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, т.е. конкретное значение варьирующего признака. Частотами называются численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1, или 100 %. В зависимости от характера вариации признака различают дискретные и интервальные ряды. Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, распределение семей по числу детей (чел.) (данные условные) (табл. 3.7).
Таблица 3.7 Распределение семей города по числу детей
В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенных пределах любые значения, отличающиеся друг от друга на сколь угодно малую величину. Построение интервальных вариационных рядов целесообразно прежде всего при непрерывной вариации признака, а также если дискретная вариация проявляется в широких пределах, т.е. число вариантов прерывного признака достаточно велико. Примером такого ряда распределения может служить распределение работников строительной фирмы «Скат» по уровню дохода (табл. 3.8). Правила построения рядов распределения аналогичны правилам построения группировки. Таблица 3.8 Распределение работников строительной фирмы «Скат» по уровню дохода в январе 1998 г.
Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения. Полигон используется при изображении дискретных вариационных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот. Полученные на пересечении абсцисс и ординат точки соединяют прямыми линиями и получают ломаную линию, называемую полигоном частот. Для замыкания полигона крайние точки (слева и справа на ломаной линии) соединяют с точками на оси абсцисс и получают многоугольник. По данным табл. 3.8 построим полигон (рис. 3.1). Рис. 3.1. Полигон распределения работников строительной фирмы «Скат» по уровню дохода в январе 1998 г.
Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам. В результате мы получим гистограмму-график, на котором ряд распределения изображен в виде смежных друг с другом столбиков. Если середины верхних сторон прямоугольников соединить прямыми, то гистограмма может быть преобразована в полигон распределения (рис. 3.2). Рис. 3.2. Гистограмма и полигон распределения работников строительной фирмы «Скат» по уровню дохода в январе 1998 г.
При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Это необходимо сделать для того, чтобы устранить влияние величины интервала на распределение интервала и получить возможности сравнивать частоты. Плотность распределения – это частота, рассчитанная на единицу ширины интервала, т.е. сколько единиц в каждой группе приходится на единицу величины интервала. Для графического изображения вариационных рядов может использоваться также кумулятивная кривая. При помощи кумуляты (кривой сумм) изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам. Накопленные частоты показывают, сколько единиц совокупности имеют значения признака, не большие, чем рассматриваемое значение. При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда, а по оси ординат – накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, т.е. кумуляту. Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то получим огиву. Сравнимость статистических группировок. Вторичная группировка. Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. Вторичная группировка, или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления (в случае когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности) либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа. Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки. Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Проиллюстрируем методику вторичной группировки на следующем примере. Например, необходимо произвести перегруппировку данных, образовав новые группы с интервалами до 500, 500-1000, 1000-2000, 2000-3000, свыше 3000 руб. по данным о распределении персонала строительной фирмы по уровню дохода (табл. 3.9). Таблица 3.9 Распределение работников строительной фирмы по уровню дохода (данные условные)
В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 500 руб., необходимо от интервала второй группы взять 100 руб. Величина интервала этой группы составит 600 руб. Следовательно, необходимо взять от нее 1/6 (100: 600) часть. Аналогичную же часть во вновь образуемую новую группу надо взять и от численности работников, т.е. 20 · 1/6 = 3 человека. Тогда в первой группе будет работающих: 16 + 3 = 19 человек. Вторую новую группу образуют работники второй группы за вычетом отнесенных к первой, т.е. 20 – 3 = 17 человек. Во вновь образованную третью группу войдут все работники третьей группы и часть работников четвертой. Для определения этой части от интервала 1800-3000 (ширина интервала равна 1200 человека) нужно добавить к предыдущему 200 человек (чтобы верхняя граница интервала была равна 2000 руб.). Следовательно, необходимо взять часть интервала, равную 200: 1200, т.е. 1: 6. В этой группе 74 человека, значит, надо взять 74 · (1: 6) = 12 человек. В третью новую группу войдет: 44 + 12 = 56 человек. Во вновь образованную четвертую группу войдет: 74 – 12 = 62 человека, оставшихся от прежней четвертой группы. Пятую, вновь образованную группу составят работающие пятой и шестой прежних групп: 37 + 9 = 46 человек. По результатам перегруппировки получены следующие данные:
Метод группировок и многомерные классификации. На практике на изменение величины результативного признака оказывает влияние множество факторов, действующих в разных направлениях. Для исследования таких многофакторных связей используются многомерные группировки. Целью таких группировок является расчленение совокупности социально-экономических явлений на качественно однородные группы по большому числу признаков одновременно и на их основе определение связи и влияния факторных признаков на результативный. В основу построения многомерной группировки положен принцип перехода от величин, имеющих определенную размерность (рубли, тонны, гектары и т.д.) к безразмерным относительным величинам. Так, абсолютные значения результативного признака заменяются отношениями: , (3.5) где , а абсолютные значения факторных признаков – отношениями: , (3.6) где . В результате такой замены получается матрица отношений (табл. 3.10). Таблица 3.10 Матрица отношений
Если связь между результативным и факторным признаками обратная, то для каждой единицы объекта исследования определяется величина . На основе отношений Pij исчисляется показатель , (3.7) где k – число факторных признаков. Этот показатель и будет основанием многомерной группировки, которая покажет в
|