При проведении любой группировки сначала определяется группировочный признак.
Следующим этапом группировки является определение числа групп. В группировках с атрибутивным признаком в основании число групп зависит от количества типов, а интервал соответствует переходу явления из одного качества в другое. В группировках с количественным признаком в основании число групп рекомендуется брать с таким расчетом, чтобы в каждую группу попало достаточно большое число единиц совокупности. Интервалы таких группировок могут быть равными и неравными, а неравные в свою очередь - возрастающими и убывающими. В группировках с равным интервалом (таблица 2.2) число групп можно рассчитать математическим путем. С использованием, например, формулы Стерджесса: n=l+3.322lgN, где n - число групп, a N - число единиц, совокупности. Согласно этой формуле выбор числа групп зависит от объема совокупности. Недостаток этой формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и если распределение единиц по группировочному признаку близко к нормальному. Поэтому есть ряд других формул, но каждая имеет свои недостатки. Если размах вариации группировочного признака (разность между максимальным и минимальным его значениями в совокупности) велик и значения признака изменяются (варьируют) неравномерно, то надо использовать группировку с неравным интервалом, (таблица 2.1.). Возрастающий интервал может возрастать в арифметической профессии, а может - в геометрической. Использование неравного интервала более обосновано, но представляет большую трудность. Такую группировку можно составить только на основе знания исходного материала, его анализа и личного опыта специалиста. Главное условие и в этом случае, чтобы не было "пустых" или малочисленных групп. Когда определено число групп, то следует определить интервалы группировки. Величина интервала - это разность между верхними или нижними его границами. Величину равновеликого интервала можно определить по формуле: I = xmax - xmin / n, где xmax – максимальное значение группировочного признака в совокупности, а хmin – минимальное, предварительно исключив аномальные наблюдения. При образовании интервалов необходимо точно обозначить границы групп. По непрерывно варьирующим признакам образуют непрерывный интервал, т.е. такой, в котором верхняя граница предыдущего интервала равна нижней границе последующего интервала (таблица 1.3.1.). По прерывно варьирующим признакам образуют прерывный интервал, где верхняя граница предыдущего интервала не равна нижней границе последующего интервала (таблица 1.3.2.). Границы интервала могут быть закрытыми и открытыми. Закрытые интервалы имеют обе (верхнюю и нижнюю) границы (таблица 1.3.2.). Открытые только одну из них (таблица 13.1..). Таблица 1.3.1. Распределение персонала строительной фирмы по уровню среднемесячного дохода.
При непрерывном интервале встает вопрос, в какую группу, например в таблице 2.1. включить работников с уровнем дохода в 3000 рублей во вторую или третью? Включается по принципу "до" в третью группу. Таблица 1.3.2 Распределение персонала строительной фирмы по уровню среднемесячного дохода.
Все сказанное выше о группировках относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, имеющиеся группировки могут быть несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. Для приведения таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группировки. Вторичная группировка — образование новых групп на основе ранее осуществленной группировки. Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (по величине прежнею интервала).
|