Сводка и группировка статистических данных
Основой в статистике является статистическое исследование. Статистическое исследование проходит в два этапа. Первый этап статистического исследования называется статистическим наблюдением. На данной стадии получают сведения о каждой единице совокупности. Задача второй стадии статистического исследования состоит в том, чтобы упорядочить и обобщить первичный материал, свести его в группы и на этой основе дать обобщенную характеристику совокупности. Этот этап в статистике называется сводкой. Выделяют простую сводку – подсчет только общих итогов - и статистическую группировку, которая сводится к расчленению совокупности на группы по соответствующему признаку. Группировка позволяет получить такие результаты, по которым можно выявить состав совокупности, характерные черты и свойства типичных явлений, обнаружить закономерности и взаимосвязи. Результаты сводки могут быть представлены в виде статистических рядов распределения. Статистическим рядом распределения называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку. В зависимости от признака ряды могут быть вариационными и атрибутивными. Если признак – количественный, то ряд – вариационный. Например, распределение рабочих по тарифному разряду, по заработной плате, по стажу работы. Если признак имеет качественное выражение, ряд - атрибутивный, например, деление совокупности по полу, формирование бюджета по источникам финансирования – прибыль, спонсоры, кредиты банка и т. д., а также деление по отрасли народного хозяйства, по виду продукции, по профессии рабочих. Вариационные ряды могут быть дискретными и интервальными. Дискретный ряд распределения – это ряд, в котором варианты (значения признаков) выражены целым числом. Интервальный ряд распределения – это ряд, в котором значения признака представлены в виде интервала. Первичная группировка Группировки могут быть с равными и неравными интервалами. Величина интервала при равномерной группировке определяется по формуле где i – величина интервала; хmax – максимальное значение признака; хmin – минимальное значение признака; n – число групп. Число групп может назначаться исследователем или определяться по формуле n = 1 + 3, 21 lg N, где N – число единиц совокупности. Типовая задача 1. Имеются следующие данные о возрасте рабочих цеха № 3 механического завода. Таблица 1.1 Исходные данные
Провести группировку рабочих цеха № 3 по возрасту. Для изучения состава рабочих по возрасту целесообразно провести группировку с неравными интервалами, выделив группу молодых рабочих в возрасте до 20 лет, группы рабочих в наиболее трудоспособном возрасте (от 20 до 30 лет; от 30 до 40 лет; от 40 до 50 лет) и, наконец, старшую возрастную группу 50 лет и старше. Можно организовать и другое число групп в иных границах интервалов. Для проведения группировки построим вспомогательную таблицу для подсчета численности рабочих в каждой из этих групп. Таблица 1.2 Вспомогательная таблица для подсчета численности рабочих
Результат сводки занесем в табл. 1.3. Таблица 1.3 Результаты сводки
Вторичная группировка Вторичная группировка или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления (когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для проведения к сопоставимому виду группировок с различными интервалами в целях их сравнения. Типовая задача 2. Имеется группировка предприятий по размеру реализованной продукции, млн.р. Таблица 1.4 Исходные данные для типовой задачи 2
Провести перегруппировку данных, образовав следующие интервалы: до 50; 50 – 100; 100 – 200; 200 – 300; свыше 300. В первую новую группу войдут полностью первые две группы предприятий и часть третьей. Чтобы образовать группу до 50, нужно от интервала третьей группы взять 10. Величина этой группы составляет (100 – 40 = 60) 60, следовательно, надо взять от нее 10/60 (1/6) часть числа предприятий (1110 × (1/6) = = 185). Тогда в первой группе будет 92 + 329 + + 185 = 606 предприятий. Во вторую новую группу войдет оставшееся число предприятий 3-й группы (1110 – 185 = 952). Во вновь образованную 3-ю группу войдут все предприятия четвертой группы и часть пятой. Для образования интервала 100 – 200 из пятой группы необходимо взять 20 из величины интервала 300 – 180 = 120, т.е. 20/120 = 1/6 числа предприятий 5 группы (931 × (1/6) = 155). Третья группа будет включать 1269 + 155 = 1424 предприятий, оставшихся от 5 группы. Пятую, вновь образованную группу, составят предприятия прежних шестой и седьмой групп: 182 + 65 = 247. В результате получим следующие данные, представленные в табл. 1.5. Таблица 1.5 Полученные данные
Задачи 1.1 Имеются данные о стоимости основных фондов у 50 предприятий, млн. р.:
Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).
1.2. Имеются следующие данные о тарифных разрядах 50 рабочих: 5 2 3 1 1 4 2 3 5 4 6 1 2 4 5 6 4 2 3 4 2 3 5 6 4 5 2 3 1 6 4 2 3 2 1 4 5 6 1 2 3 5 2 4 6 2 1 4 3 Построить ряд распределения по тарифному разряду.
1.3. Имеются следующие данные о возрасте студентов: 16 17 18 19 20 16 15 17 18 19 21 17 18 18 21 17 18 17 20 21 17 18 16 17 16 19 20 16 19 20 Построить ряд распределения студентов по возрасту.
1.4. Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.
Построить вариационный, ранжированный, дискретный ряд распределения, обозначив элементы ряда.
1.5. Определить по формуле Стерджеса постоянные интервалы группировки рабочих завода по заработной плате, если общая численность рабочих завода - 5000 человек, максимальная и минимальная заработная плата соответственно составляет 70 и 200 рублей. lg 5000 = 3, 69897.
1.6. Имеются следующие данные по полу, возрасту, образованию, квалификации и заработной плате 40 рабочих. Требуется произвести: 1) первичную группировку а) по полу, б) по образованию, в) квалификации, г) по возрасту, образовав пять групп с равными интервалами, д) по заработной плате, образовав пять групп с равными интервалами; 2) группировку по двум признакам: а) по полу и образованию, б) по полу и возрасту, в) по полу и квалификации; 3) группировку по трем признакам – по полу, образованию и квалификации; 4) аналитическую группировку зависимости заработной платы от: а) возраста, б) образования, в) квалификации. Таблица 1.6 Исходные данные к задаче 1.6
1.7. Имеются следующие данные по 25 предприятиям. Произвести группировку предприятий по размеру ОПФ, образовав следующие группы: до 3, 5; 3, 6 – 5, 6; 5, 7 – 6, 74, 6, 8 и выше. По каждой группе определить число заводов, размер ОПФ всего и в среднем на одно предприятие; стоимость продукции всего и в среднем на одно предприятие. Таблица 1.7 Исходные данные к задаче 1.7
1.8. Произвести вторичную группировку, образовав следующие группы рабочих по оплате труда 7 – 9; 9- 11; 11 – 13; 13 - 17; 17 – 20; свыше 20. Определить по каждой группе число рабочих, фонд заработной платы и среднюю заработную плату на одного рабочего. Таблица 1.8 Исходные данные к задаче 1.8
1.9. В целях сравнения структуры посевных площадей двух фермерских хозяйств провести перегруппировку, образовав следующие группы: до 20; 20 – 22; 22 – 24; 24 – 26; 26 – 30; свыше 30. Определить процентное соотношение посевных площадей в группах по каждому хозяйству. Таблица 1.9 Исходные данные к задаче 1.9
1.10. Провести перегруппировку, образовав следующие группы предприятий по размеру реализованной продукции: до 50; 50 – 100; 100 – 200; 200 – 300; свыше 300. Таблица 1.10 Исходные данные к задаче 1.10
Домашнее задание Задача 1. Имеются следующие данные о тарифных разрядах 60 рабочих: 5, 4, 2, 1, 6, 3, 3, 4, 3, 2, 2, 5, 6, 4, 3, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 1, 3, 4, 3, 5, 4, 3, 3, 4, 4, 6, 4, 4, 3, 1, 5, 4, 3, 2, 6, 3, 4, 5, 5, 3, 3, 3, 3, 4, 5, 5, 6, 2, 4, 5. Постройте: 1) ряд распределения рабочих по тарифному разряду; 2) ряд распределения рабочих по уровню квалификации, выделив в нем три группы рабочих: низкой, средней, высокой квалификации.
Задача 2. Число и земельная площадь Дании и ФРГ распределяются следующим образом (табл. 1.11): Таблица 1.11 Исходные данные к задаче 2
Для сравнительного анализа степени дифференциации хозяйств по размеру земельной площади произвести вторичную группировку.
|