Студопедия — Построение интервального ряда
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Построение интервального ряда






Если признак непрерывно варьируется или принимает дискретные значения, но их число очень велико, то строится интервальный вариационный ряд.

Интервальный вариационный ряд представляет собой таблицу, состоящую из двух граф (или строк) – интервалов признака, вариация которого изучается, и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа от общей численности совокупности. Интервальные вариационные ряды делятся на равноинтервальные и неравноинтервальные. Неравноинтервальные группировки, в свою очередь, подразделяют на прогрессивно возрастающие/убывающие, равночастотные, специализированные и произвольные. Наиболее часто используются два вида интервальных вариационных рядов: равноинтервальный и равночастотный.

Равноинтервальный ряд применяется, если вариация признака не очень сильна, т.е. для однородной совокупности, распределение которой по данному признаку близко к нормальному закону. Равночастотный ряд применяется, если вариация признака очень сильна, однако распределение не является нормальным, а, например, гиперболическим.

При построении равноинтервального ряда число групп выбирается так, чтобы в достаточной мере отразились разнообразие значений признака в совокупности и в то же время закономерность распределения, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.

Определение числа групп для количественного признака зависит от степени однородностистатистической совокупности. Если исходная совокупность качественно разнородна, то при построении группировки по количественному признаку границы групп определяются там, где количество переходит в новое качество. Если исследуемая совокупность качественно однородна, то решающее значение для определения количества групп имеют численность совокупности и уровень колеблемости группировочного признака. Итоговым критерием при этом является получение максимально однородных при этом достаточно наполненных групп.

При прочих равных условиях, чем больше степень изменчивости признака, тем больше следует образовывать групп, так как это будет способствовать более точному описанию характера изучаемого объекта/процесса. Однако, слишком большое число групп затрудняет выявление закономерностей и автоматически приводит к тому, что в каждую группу попадет меньшее число наблюдений, что снизит статистическую устойчивость рассчитанных впоследствии показателей.

Для выбора оптимального числа групп (при которой вариационный ряд с равными интервалами будет не очень громоздким) применяют формулу Стерджеса (Herbert Arthur Sturges, 1882—1958):

(4.3)

Или:

Ограничением формулы Стэрджеса является необходимость большого числа наблюдений и близости распределения группировочного признака к нормальному.

Существуют и другие формулы для нахождения оптимального числа групп, например формула Брукса и Каррузера:

Данную формулу рекомендуется использовать при объеме выборки больше 100.

После определения числа групп формируются интервалы группировки – значения признака, лежащие в определенных границах.

Величина интервала – это разница между верхней и нижней границами интервала, т.е. максимальным и минимальным значениями соответственно.

Величина интервала (в случае равноинтервальных групп) находится по формуле:

(4.4)

где и – соответственно наибольшее и наименьшее значения вариантов ряда.

Если величина равных интервалов определялась по формуле Стэрджеса, то (4.4.) примет вид:

(4.5)

Определение 4.7. Разность между максимальным и минимальным элементами выборки называется размахом выборки:

(4.6)

Обозначение границ интервалов зависит от характера группируемого признака. Если в основание группировки положен непрерывный признак, то верхняя граница i -го интервала совпадает с нижней границей i+1 -го. Если же группируется дискретный признак, то нижняя граница i+1 -го интервала равна верхней границе i -го плюс 1. В таблице представлены границы групп при распределении людей по возрасту. В варианте I возраст понимается как непрерывная величина, а в варианте II – как дискретная. В этом примере в обоих случаях ширина интервалов одинакова и равна 10 годам.

 

Таблица 4.1. Варианты построения групп для признака «возраст».

№ группы Вариант I № группы Вариант II
Возраст, лет Возраст, лет
  До 30   20 – 29
  30 – 40   30 – 39
  40 – 50   40 – 49
  50 и выше   50 и выше
Границы групп, если возраст измеряется с точностью больше года. Границы групп, если под возрастом понимается число исполнившихся лет.

 

По наличию границ различают открытые и закрытые интервалы. Открытыми называются интервалы, для которых определена только одна граница: верхняя (если интервал первый) или нижняя (если интервал последний). В закрытых интервалах определены обе границы.

Для последующих расчетов величина открытого интервала принимается равной величине интервала, смежного с ним (правило «ближнего соседа»). Так, в варианте I таблицы величина первого интервала принимается равной величине второго, а последнего – величине предпоследнего, т.е. десяти годам.

Если по данному правилу получается, что открытый интервал начинает включать в себя теоретически невозможные значения, то его ширина должна определяться логикой явления/процесса (экспертный метод оценки величины интервала). Например, в таблице величина второго интервала равна четырем минутам. В этом случае величина открытого интервала не может быть равна также четырем минутам, так как это означало бы, что нижняя граница первого интервала была бы отрицательна, что применительно к временной характеристике невозможно. Значит, в качестве первого интервала логично принять диапазон от нуля до трех минут.

 

Таблица 4.2. Группировка операторов диспетчерской по среднему времени обработки заказа (цифры условные).

№ группы Среднее время обработки заказа, мин Количество операторов, чел
  До 3  
  3 – 7  
  7 и выше  
ВСЕГО  

 

Если полученное значение величины интервала требует округления, то оно должно производиться в большую, а не в меньшую сторону, иначе часть наблюдений может не попасть и итоговую группировку.

Далее определяются границы каждого интервала по следующей схеме:

№ интервала Границы интервала
 
 
 
k

Например, пусть статистическая совокупность состоит из 40 туристических компаний, показатели выручки которых варьируют от 50 млн. долл до 650 млн. долл, что является, соответственно, минимальным и максимальным значениями признака. Тогда по формуле Стэрджеса получаем: . Величина интервала для построения равноинтервальной группировки определяется следующим образом: (млн.долл.). Таким образом, совокупность компаний будет разделена по показателю выручки на шесть равных групп: [50-150], [150-250], [250-350], [350-450], [450-550], [550-650] (млн. долл.).

Хотя группировки с равными интервалами предпочтительнее ввиду простоты их последующей обработки, характер изменения большинства социально-экономических явлений не отвечает требованиям, предъявляемым к равноинтервальной группировке. Если исследуемый признак варьирует значительно и неравномерно, возникает необходимость строить неравноинтервальную группировку.

Один из возможных подходов к формированию границ групп основан на использовании арифметической или геометрической прогрессии. В этом случае величина интервалов определяется формулами соответственно:

, (4.5)

где – величина го интервала; а – константа; при прогрессивно возрастающих интервалах , при прогрессивно убывающих интервалах .

, (4.5)

где – величина го интервала; q – константа; при прогрессивно возрастающих интервалах , при прогрессивно убывающих интервалах .

Данный подход к определению величины интервалов может быть использован, например, при группировке городов по числу жителей. Невозможность построения равноинтервальной группировки в данном случае связана с большим количеством малонаселенных городов и незначительным числом «городов-миллионников».

Как правило, при исследовании выручки по результатам деятельности компании любой отрасли «прогрессивный» подход оказывается более целесообразным, чем формирование равных интервалов. Это продиктовано тем, что число малых предприятий с небольшой выручкой значительно превышает число крупных предприятий с высокими показателями.

Описанные выше технические способы определения величины интервалов не гарантируют, что не появятся группы малочисленные или вообще «пустые», в которые не попало ни одно наблюдение. Если это произошло, необходимо изменить число групп и/или величины интервалов, так как подобная группировка является некорректной.

Если для реализации задач исследования необходимо устанавливать границы групп там, где количество переходит в новое качество, пользуются специализированными интервалами. Так, в группировке населения по возрасту для оценки трудовых ресурсов границы групп возрастов могут устанавливаться согласно категориям: моложе трудоспособного возраста (до 16 лет), трудоспособный возраст (для женщин с 16 до 54 лет, для мужчин с 16 до 59 лет) и старше трудоспособного возраста (для женщин старше 54 лет, для мужчин старше 59 лет).

Границы групп могут определяться и произвольно, когда ни один из вышеописанных методов не дал хороших результатов.

Заключительным этапом построения группировки является разделение единиц исследуемой статистической совокупности на группы по выбранному (одному или нескольким) группировочному признаку.

Графическим изображением интервального ряда является гистограмм (см. рис. 4.1 б). Гистограмма представляет собой прямоугольники, ширина которых определяется интервалами на оси абсцисс, а высота – значениями абсолютных или относительных частот на оси ординат.

 







Дата добавления: 2015-06-12; просмотров: 3169. Нарушение авторских прав; Мы поможем в написании вашей работы!



Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Случайной величины Плотностью распределения вероятностей непрерывной случайной величины Х называют функцию f(x) – первую производную от функции распределения F(x): Понятие плотность распределения вероятностей случайной величины Х для дискретной величины неприменима...

Схема рефлекторной дуги условного слюноотделительного рефлекса При неоднократном сочетании действия предупреждающего сигнала и безусловного пищевого раздражителя формируются...

Уравнение волны. Уравнение плоской гармонической волны. Волновое уравнение. Уравнение сферической волны Уравнением упругой волны называют функцию , которая определяет смещение любой частицы среды с координатами относительно своего положения равновесия в произвольный момент времени t...

Понятие метода в психологии. Классификация методов психологии и их характеристика Метод – это путь, способ познания, посредством которого познается предмет науки (С...

ЛЕКАРСТВЕННЫЕ ФОРМЫ ДЛЯ ИНЪЕКЦИЙ К лекарственным формам для инъекций относятся водные, спиртовые и масляные растворы, суспензии, эмульсии, ново­галеновые препараты, жидкие органопрепараты и жидкие экс­тракты, а также порошки и таблетки для имплантации...

Тема 5. Организационная структура управления гостиницей 1. Виды организационно – управленческих структур. 2. Организационно – управленческая структура современного ТГК...

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия