Группировка данных.
По предоставленным данным необходимо построить интервальный ряд распределения.
Первоначально нужно определить число групп. Определение числа групп можно осуществить, используя формулу Стерджесса: k = 1 + 3,322lqN k – число интервалов; N – объем совокупности. Так как объем совокупности 28, то: k = 1 + 3,322lq28=1+3,322* 1,447158=5,8 т.е. количество групп будет равно 6. Когда определена численность групп, строится ранжированный ряд – т.е. все значения располагаются в порядке возрастания или убывания. Построим ранжированный ряд по цене за 1 кв.м.
После данного анализа следует определить интервалы группировки. Проще всего работать с равными интервалами, которые находятся следующим образом: 1) ; 2) ; 3) …до . Где h:
В данном ряду максимальное значение стоимости 66666,67, а минимальное 39787,798. Таким образом: = = 4479,812
Округляем в большую сторону. В случае, когда рассчитанная величина интервала представляет собой 3 - х, 4 - х и более значащее число, величину следует округлять до ближайшего числа, кратного 100 или 50. Таким образом h целесообразнее принять за 4500 рублей. Интервалы будут следующими:
Далее необходимо рассчитать, сколько квартир попало в каждую группу:
Составим итоговую таблицу:
В случае, когда нужно составить комбинационную группировку необходимо разбить данные еще по одному признаку можно составить таблицу следующим образом (пример):
Если второй признак количественный, то количество групп находят по формуле Стерджесса. В случае качественного признака, количество групп берется по числу значений. Произведем группировку по второму признаку:
Составим общую таблицу:
По этой группировке можно сделать вывод не только о том, сколько квартир входят в группу, но и сделать выводы о втором признаке: структура явления по этому признаку, каких квартир больше не только по всей совокупности, но и по каждой группе и т.д..
|