Студопедия — Программа. Сущность, значение структурных характеристик вариационного ряда; способы расчета, графическая интерпретация
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Программа. Сущность, значение структурных характеристик вариационного ряда; способы расчета, графическая интерпретация






Сущность, значение структурных характеристик вариационного ряда; способы расчета, графическая интерпретация.

Понятие вариации, необходимость ее статистического изучения. Основные показатели вариации.

Дисперсия альтернативного признака. Применение показателей вариации в социально - экономическом анализе.

Показатели формы распределения. Типы распределений. Комплексный анализ рядов распределения.

 

Рассматривая зарегистрированные в процессе статистического наблюдения величины того или иного признака у отдельных единиц совокупности, можно обнаружить между ними различия. Колеблемость, многообразие, изменяемость величины признака у единиц совокупности называют вариацией. Статистические показатели, характеризующие вариацию, широко применяются в практической деятельности.

Первым этапом статистического изучения вариации является построение вариационного ряда. Построение вариационных рядов и их графических изображений позволяет детально и наглядно представлять и исследовать особенности вариации каждого признака у единиц совокупности. Однако, если необходимо сравнить вариацию одного и того же признака в разные периоды времени или в разных совокупностях, то нагляднее и удобнее сравнивать не сами вариационные ряды, а их обобщенные характеристики.

Обобщающие показатели вариационных рядов распределения можно разбить на три группы: показатели структуры распределения; показатели степени вариации; показатели формы распределения.

Мода и медиана - описательные характеристики совокупности с варьирующими признаками. В некоторых случаях их используют вместо средней для обобщающей характеристики совокупности. Однако при этом надо помнить, что только средняя отражает качество совокупности и только в средней отражаются закономерности данной совокупности. Величина моды и медианы могут отличаться от средней и могут совпадать в случае симметрии вариационного ряда. В зависимости от цели исследования должна выбираться одна из упомянутых характеристик, для сравнения - все три.

Соотношение моды, медианы и средней арифметической указывает на характер распределения признака в совокупности, позволяет оценить его асимметрию. В симметричных распределениях все три характеристики совпадают . Чем больше расхождение между модой и средней арифметической, тем больше асимметричен ряд.

Кроме показателей центра распределения в вариационном ряду существуют и другие структурные средние. К вартили - значения признака, делящие ранжированную статистическую совокупность на 4 равные части. Квинтили - варианты, делящие ранжированный ряд на 5 равных частей. Децили - варианты, делящие ранжированный ряд на 10 равных частей.

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Но два ряда распределения, имеющие одинаковую среднюю арифметическую величину, могут значительно отличаться друг от друга по степени колеблемости и величине изучаемого признака и для изучения вариации применяются различные показатели вариации.

Показатели вариации делятся на две группы: абсолютные и относительные. К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, квартильное отклонение.

Относительные показатели вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане). Относительными показателями вариации являются: коэффициенты осцилляции, вариации, относительное линейное отклонение и т.д.

Самым простым абсолютным показателем является размах вариации. Размах вариации R = xmax - xmin представляет собой разность между наибольшими и наименьшим значением признака.

Иногда в изучаемой совокупности минимальные и максимальные значения резко отличаются от основной массы значений признаков. Это может быть вызвано случайными обстоятельствами (т.е. эти явления являются аномальными в совокупности). Поэтому следует очистить совокупность от случайных признаков, а затем вычислять размах вариации и остальные показатели.

Гораздо более точной является характеристика вариации, при которой учитываются отклонения каждой из вариант от их средней величины. Отклонений при этом получается столько, сколько и самих вариантов. Поэтому для обобщенной характеристики размера этих отклонений необходимо рассчитать их среднюю величину.

Необходимо помнить, что сумма всех отклонений вариант от средней равна нулю, поэтому находят среднюю из модулей отклонений, получая при этом среднее линейное отклонение

или из квадратов отклонений, получая при этом дисперсию

.

Корень квадратный из дисперсии называют средним квадратическим отклонением от средней.

.

Среднее квадратическое отклонение представляет собой величину, на которую все варианты в среднем отклоняются в ту и другую сторону от средней арифметической. Среднее квадратическое отклонение имеет ту же размерность, что и варианты. Среднее квадратическое отклонение по величине в реальных совокупностях всегда больше среднего линейного отклонения. Соотношение s: d зависит от наличия в совокупностях резких, выделяющихся отклонений и может служить индикатором “засоренности” совокупности; чем больше отклонение, тем неоднороднее совокупность. Если фактическое распределение близко к нормальному, то s @ 1, 25 d.

Среднее квадратическое отклонение играет важную роль в анализе рядов распределения; оно показывает, как расположена основная масса единиц совокупности относительно средней арифметической.

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической пользуются относительными показателями вариации. Эти показатели вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане):

- коэффициент осцилляции (относительный размах вариации)

КR = ;

- относительное линейное отклонение

Кd = ;

- коэффициент вариации (относительное квадратическое отклонение)

V = ;

- относительный показатель квартильной вариации

КQ = ,

учитывая, что Q = , а Ме= Q2 можно записать:

КQ = .

Наиболее часто применяемый показатель относительной колеблемости - коэффициент вариации. Его используют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному).

Коэффициент вариации является критерием точности средней. Если коэффициент вариации больше 40%, то средняя характеризует совокупность по признаку, который существенно изменяется у отдельных ее единиц. Типичность такой средней невелика. Говорят, что при коэффициенте вариации меньше 10% вариация слабая, от 10% до 25% - умеренная, при коэффициенте вариации больше 25% - вариация сильная.

В ряде случаев возникает необходимость измерить вариацию альтернативного признака: признака, который имеется или не имеется у единиц данной совокупности. Количественно вариация альтернативного признака проявляется в значении 0 у единиц, которые им не обладают, или в значении 1 у единиц, обладающих этим признаком. Доля единиц, обладающих признаком, в численности всей совокупности обычно обозначается буквой p, а доля единиц, не обладающих этим признаком, q. Ясно, что p+q =1. Отсюда q =1- p. Вычислим среднее значение альтернативного признака и его дисперсию:

.

Таким образом, среднее значение альтернативного признака равно доле, которая и является обобщающей характеристикой совокупности по этому варьирующему признаку.

Дисперсия альтернативного признака:

.

Таким образом, дисперсия альтернативного признака равна произведению доли на число, дополняющее эту долю до единицы.

Если совокупность состоит из нескольких частей (групп), то для оценки влияния различных факторов, которые определяют колеблемость индивидуальных значений признака, можно воспользоваться разложением дисперсии на составляющие: межгрупповую и внутригрупповую дисперсии.

Выяснение общего характера распределения предполагает оценку степени его однородности, вычисление показателей асимметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариант, равно отстающих в обе стороны от центра распределения, равны между собой. (Мо = Ме = ). Для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель АS.

As = ; As = .

При As > 0 имеет место правосторонняя асимметрия (Мо< Me< ).

При As < 0 имеет место левосторонняя асимметрия (Мо> Me > ).

Эксцесс представляет собой смещение вершины эмпирического распределения вверх (Ех > 0) или вниз (Ех < 0) от вершины кривой нормального распределения. Необходимо отметить, что показатели асимметрии и эксцесса характеризуют непосредственно форму распределения признака в изучаемой совокупности.

Использование в анализе вариационных рядов распределения рассмотренных выше характеристик позволяет более глубоко и детально исследовать изучаемую совокупность.

Пример. Стаж работы в торговле 30-ти продавцов магазина характеризуется следующими данными: 1, 7, 7, 9, 12, 5, 4, 8, 5, 1, 11, 6.5, 4, 9, 1, 1, 11, 0.5, 5, 2, 6, 8, 9, 12, 9, 6, 3, 8, 15, 12.5.

Провести анализ исходной совокупности.

Решение. Составной частью анализа является построение рядов распределения. Цель его – выявление основных свойств и закономерностей исследуемой статистической совокупности. Признак, который берем за основу – стаж работы продавцов – количественный. Следовательно, будем строить вариационный ряд.

Первым этапом в построении вариационных рядов является ранжирование элементов исходной совокупности в возрастающем или убывающем порядке.

0.5 1 1 1 2 3 4 4 5 5 5 6 6 6.5 7 7 8 8 8 9 9 9 9 10 11 11 12 12 12.5 15

Получили ранжированный ряд, который позволяет увидеть наименьшее и наибольшее значение признака в совокупности.

Вторым этапом в анализе является непосредственное построение интервального (дискретного) ряда в виде таблицы. Для этого необходимо определить интервал, который указывает определенные пределы значений варьирующего признака и обозначается нижней и верхней границами интервала.

При построении интервальных рядов распределения необходимо установить число групп, на которые следует разбить все единицы изучаемой совокупности. Допустим, что число групп равно 5 и интервалы равные. Определение величины интервала h производится по формуле: , где R = x max- x min - размах вариации R =15 - 0.5 = 14.5 (лет); n - число групп. Получим величину интервала, равную . Для простоты вычисления округлим величину интервала до целого числа, т.е h =3. В результате группировки получим интервальный ряд распределения продавцов по величине стажа их работы.

Группировка продавцов по стажу работы

Стаж работы 0-3 3-6 6-9 9-12 12-15 Всего
Число продавцов            

 

Дальнейшему анализу помогает графическое изображение рядов распределения, по которому можно судить о форме распределения. Для графического изображения интервальных вариационных рядов служит гистограмма. Для ее построения на оси абсцисс откладываются интервалы ряда; на интервалах строят прямоугольники, высота которых соответствует частотам ряда.

Для графического изображения дискретного ряда применяют полигон распределения. Для его построения на оси абсцисс отмечаются значения признака, на оси ординат - соответствующие частоты. Полученные точки соединяют отрезками прямых.

Чтобы перейти от интервального ряда к дискретному, необходимо заменить интервал его средним значением.

Дискретное распределение продавцов по стажу работы

Х 1.5 4.5 7.5 10.5 13.5 Всего
F            

 

Графически дискретные ряды распределения могут быть так же представлены в виде кумуляты и огивы. Для построения кумуляты (кривая сумм) на оси абсцисс откладывают значение признака, на оси ординат - накопленные частоты. Полученные точки соединяют плавной линией.

Кумулятивное распределение продавцов по стажу работы

 

Х 1.5 4.5 7.5 10.5 13.5
S          

 

Для построения огивы на оси абсцисс откладывают значения накопленных частот, на оси ординат - значения признака Для характеристики среднего значения признака в вариационном ряду используются средняя арифметическая, мода и медиана (показатели центра распределения).

Средняя арифметическая для дискретного ряда:

.

Средний стаж работы продавцов составляет 6, 5 лет.

В отличие от средней арифметической, которая использует все значения признака, мода и медиана характеризуют величину признака, занимающего определенное (центральное) положение в ранжированном ряду. Для дискретного ряда медиана соответствует варианте, расположенной в середине ряда, если ряд состоит из нечетного числа вариант, и средней арифметической простой из двух вариант, расположенных в середине ряда - если в ряду четное число вариант.

Графически медиану можно определить по кумуляте и огиве. Мода для дискретного ряда - это значение варианты с наибольшей частотой. Графически моду можно определить по гистограмме и полигону. Более точно моду и медиану определяют по аналитическим формулам:

,

где - начальное значение интервала, содержащего моду; h - величина интервала; - частота модального интервала; - частота интервала, предшествующего модальному; - частота интервала, следующего за модальным.

,

где - начальное значение медианного интервала; h - величина медианного интервала; - сумма частот ряда; - сумма накопленных частот, предшествующих медианному интервалу; - частота медианного интервала.

Мода, медиана и средняя арифметическая являются показателями центра распределения или структурными средними. Поскольку в примере Мо> Me> ; 7, 12> 6, 6> 6, 5, то мы имеем левостороннюю асимметрию. Следующим этапом в анализе рядов распределения является расчет показателей вариации:

- размах вариации R = xmax-xmin;

- среднее линейное отклонение = года;

- дисперсия года;

- среднее квадратическое отклонение = года;

- коэффициент осцилляции ;

- относительное линейное отклонение = 44.6%;

- коэффициент вариации .

Для расчета показателей вариации использовалась рабочая таблица.

 

Интервалы стажа работы Число продавцов х
0-3   1, 5 9, 0      
3-6   4, 5 31, 5      
6-9   7, 5 75, 0      
9-12   11, 5 52, 5      
12-15   13, 5 27, 0      
Итого   -   -    

 

Рассчитав показатели вариации, можно сделать вывод, что стаж работы 30-ти продавцов колеблется от 0, 5 года до 15 лет (R =14, 5), при этом средний стаж работы составляет 6, 5 лет. В среднем отклонение значений стажа работы продавцов от среднего стажа составляет 2, 9 года. Это отклонение по сравнению со средним значением признака очень большое, что свидетельствует о том, что данная совокупность по отношению к признаку неоднородна, а средняя нетипична. В среднем отклонение квадратов значений стажа работы от их средней составляет 3, 5 года.

Если эмпирическое (фактическое) распределение близко к нормальному, то между средним линейным отклонением существует соотношение s = 1, 25 d. Проверим это, используя полученные результаты.

3, 5 = 1, 25× 2, 9 = 3, 625 ¹ 3, 5.

Соотношение не выполняется, поэтому можем сказать, что фактическое распределение отлично от нормального. Это подтверждает и коэффициент вариации , т.е. вариация сильная, следовательно, исследуемая совокупность неоднородная. (Совокупность считается однородной, если коэффициент вариации не превышает 33% - для распределений близких к нормальному).

Пример. По данным социологических исследований общеобразовательных школ района, проведенных в декабре 2005 г., получены следующие данные о распределении учителей школ по возрасту.

 

Возраст учителей, лет До 30 30-35 35-40 40-45 45-50 50-55 Свыше 55 Всего
Численность, чел.                

 

По данным обследования определить: средний возраст учителей; среднее квадратическое отклонение возраста; коэффициент вариации. Сделайте выводы.

Решение. В исходных данных задан интервальный ряд распределения. Первый и последний интервалы в ряду распределения полуоткрытые. Поэтому, во-первых, закрываем эти интервалы (h = 5). Средний возраст учителей рассчитываем по формуле средней арифметической взвешенной, для этого интервальный ряд необходимо превратить в дискретный.

 

Возраст учителей, лет 25-30 30-35 35-40 40-45 45-50 50-55 55-60 Всего
Х 27.5 32.5 37.5 42.5 47.5 52.5 57.5 -
F                

 

Средняя арифметическая для дискретного ряда:

 

Средний возраст учителей составляет 44.36 лет при размахе вариации R=xmax-xmin= 6 0 -2 5= 35

- среднее линейное отклонение = года

- дисперсия лет;

- среднее квадратическое отклонение

= лет;

- коэффициент вариации.

.

 

 

Для расчета показателей вариации использовалась рабочая таблица.

 

Интервалы возраста учителей f х
25-30   27.5 5445.0 16.85 3336.30 56216.655
30-35   32.5 7085.0 11.85 2583.30 30612.105
35-40   37.5 13087.5 6.85 2390.65 16375.952
40-45   42.5 12410.0 1.85 540.20 999.370
45-50   47.5 20092.5 3.15 1332.45 4197.218
50-55   52.5 30922.5 8.15 4800.35 39122.852
55-60   57.5 11960.0 13.15 2735.20 35967.880
Итого   - 101002.5 - 17718, 45 183492.02
Средняя - -   - 7, 78  

 

Возраст учителей колеблется от 25 до 60 лет, при этом средний возраст учителей составляет 44.36 года. Коэффициент вариации равен , т.е. вариация умеренная (10% < V £ 25%), а исследуемая совокупность однородная. (коэффициент вариации не превышает 33%.)

Лекция 5, 6. При изучении вопроса о вариации нужно четко представлять себе условия, порождающие вариацию признаков, а также суть и значение измерения вариации признаков. Рассматривая зарегистрированные в процессе статистического наблюдения величины того или иного признака у отдельных единиц совокупности, можно обнаружить между ними различия.

Исследование вариации в статистике имеет важное значение. Изменение вариации дает возможность оценить степень воздействия на данный признак других варьирующих признаков; установить, какие факторы и в какой степени влияют на смертность населения, финансовое положение предприятий, урожайность пшеницы и т.д. Статистические показатели, характеризующие вариацию, широко применяются в практической деятельности для оценки ритмичности работы предприятий, контроля за ходом производственных процессов, устойчивости урожайности сельскохозяйственных культур различных сортов или одного и того же сорта в определенных почвенно-климатических условиях. Колеблемость различных параметров рынка характеризуется показателями вариации объема продаж, цен, товарных запасов.

Практическое занятие 4. Решение задач по теме.

Задание 1. С целью выявления потребительского спроса на рынке стройматериалов было распродано 100 партий цемента весом от 40 до 120 кг. Данные представлены в таблице.

Вес, кг -50 -60 -70 -80 -90 -100 -110 -120 Всего
Кол-во партий                  






Дата добавления: 2014-11-10; просмотров: 1905. Нарушение авторских прав; Мы поможем в написании вашей работы!



Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Принципы резекции желудка по типу Бильрот 1, Бильрот 2; операция Гофмейстера-Финстерера. Гастрэктомия Резекция желудка – удаление части желудка: а) дистальная – удаляют 2/3 желудка б) проксимальная – удаляют 95% желудка. Показания...

Ваготомия. Дренирующие операции Ваготомия – денервация зон желудка, секретирующих соляную кислоту, путем пересечения блуждающих нервов или их ветвей...

Билиодигестивные анастомозы Показания для наложения билиодигестивных анастомозов: 1. нарушения проходимости терминального отдела холедоха при доброкачественной патологии (стенозы и стриктуры холедоха) 2. опухоли большого дуоденального сосочка...

Общая и профессиональная культура педагога: сущность, специфика, взаимосвязь Педагогическая культура- часть общечеловеческих культуры, в которой запечатлил духовные и материальные ценности образования и воспитания, осуществляя образовательно-воспитательный процесс...

Устройство рабочих органов мясорубки Независимо от марки мясорубки и её технических характеристик, все они имеют принципиально одинаковые устройства...

Ведение учета результатов боевой подготовки в роте и во взводе Содержание журнала учета боевой подготовки во взводе. Учет результатов боевой подготовки - есть отражение количественных и качественных показателей выполнения планов подготовки соединений...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия