Студопедия — Принципы построения статистических группировок
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Принципы построения статистических группировок






При разделении совокупности на группы необходимо решить три основные задачи:

1) определение группировочного признака;

2) определение числа групп;

3) определение величины интервала.

Выбор группировочного признака зависит прежде всего от задач исследования.

Число групп зависит:

- от задач исследования;

- вида признака, положенного в основание группировки;

- численности совокупности;

- степени вариации признака.

Число групп тесно связано с объемом совокупности. Здесь нет строго научных приемов, однако при равенстве интервалов для определения оптимального числа групп может быть использована формула Стерджесса:

n = 1 + 3,322 lgN,

где n –число групп;

N - численность единиц совокупности.

Например, при 200 единицах совокупности число групп определяется следующим образом:

1+3,322 lg200 = 9.

Данной формулой нельзя пользоваться механически. На практике необходимо избегать «пустых» (в которые не попала ни одна единица совокупности) и малочисленных групп.

После определения числа групп решается задача определения интервалов.

Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в интервале. Величина интервала - разность между верхней и нижней границами интервала.

Интервалы группировки бывают равные и неравные. Неравные интервалы делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные (и специализированные). Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом:

h i+1 = h i + a;

в геометрической прогрессии:

h i+1 = h i · q,

где a - константа - число, которое будет положительным при прогрессивно возрастающих интервалах и отрицательным при прогрессивно убывающих интервалах;

q - константа - положительное число, которое при прогрессивно возрастающих интервалах будет больше 1, а при прогрессивно убывающих - меньше 1.

Намечаемые при группировке интервалы бывают открытые (у них указана одна граница: верхняя - у первого, нижняя – у последнего) и закрытые (имеющие нижнюю и верхнюю границы). Необходимость в открытых интервалах обусловлена большой колеблемостью изучаемого признака, разбросом его количественных значений, требующих образования множества групп, если отделять их обеими границами.

Величина равного интервала определяется по следующей формуле:

,

где i – величина интервала;

xmax, xmin – максимальное и минимальное значение признака в совокупности;

n –число групп.

Полученную по формуле величину округляют. Она является шагом интервала. Существуют следующие правила определения шага интервала.

Если величина интервала, рассчитанная по формуле, представляет собой величину, имеющую один знак до запятой (например, 0,66; 1,372; 5,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. В приведенном выше примере шагом интервала будут соответственно значения 0,7; 1,4; 5,8.

Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой, то это значение надо округлить до целого числа. Пусть величина интервала, исчисленная по формуле, равна 12,785. Тогда это значение следует округлить до целого числа, т. е. до 13.

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину необходимо округлить до ближайшего числа, кратного 100 или 50. Например, 248 следует округлить до 250.

При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смежных интервалов (например, табл. 3). При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов (например, значение 9 млн. руб.). При ответе на него можно руководствоваться принципом «включительно» верхняя граница или принципом «исключительно». Если в нашем примере (табл. 3) верхняя граница формируется по принципу «включительно», то магазин с объемом продаж 9 млн. руб. необходимо отнести ко второй группе, в противном случае – к третьей. Применение этих принципов зависит от формы написания интервалов, особенно первой и последней групп (употребление слов «свыше», «до», «по», «включительно») или оговаривается отдельно.

Если в основании группировки лежит дискретный признак, то нижняя граница i –го интервала равна верхней границе (i -1)-го интервала, увеличенной на 1.

 







Дата добавления: 2015-08-12; просмотров: 812. Нарушение авторских прав; Мы поможем в написании вашей работы!



Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Этические проблемы проведения экспериментов на человеке и животных В настоящее время четко определены новые подходы и требования к биомедицинским исследованиям...

Классификация потерь населения в очагах поражения в военное время Ядерное, химическое и бактериологическое (биологическое) оружие является оружием массового поражения...

Факторы, влияющие на степень электролитической диссоциации Степень диссоциации зависит от природы электролита и растворителя, концентрации раствора, температуры, присутствия одноименного иона и других факторов...

Задержки и неисправности пистолета Макарова 1.Что может произойти при стрельбе из пистолета, если загрязнятся пазы на рамке...

Вопрос. Отличие деятельности человека от поведения животных главные отличия деятельности человека от активности животных сводятся к следующему: 1...

Расчет концентрации титрованных растворов с помощью поправочного коэффициента При выполнении серийных анализов ГОСТ или ведомственная инструкция обычно предусматривают применение раствора заданной концентрации или заданного титра...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия