Студопедия — Частота– повторяемость индивидуальных значений признака – обозначается буквой «f», .
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Частота– повторяемость индивидуальных значений признака – обозначается буквой «f», .






Формулы средних величин могут быть получены на основе степенной средней, для которой определяющей функций является уравнение:

, откуда ;

В дальнейшем при написании формул средних подстрочные значки «i,n» использоваться не будут, но подразумевается, что суммируются все произведения .

В зависимости от степени «k» получаются различные виды средних величин.

Таблица 4- Формулы различных видов степенных средних величин

Наименование Средней Показа- тель степени (k) Формула расчета
Простая Взвешенная
Гармоническая -1
Геометрическая  
Арифметическая  
Хронологическая     -
Квадратическая  
Кубическая  

Взвешенные средние учитывают, что отдельные варианты значений признака имеют различную численность, поэтому каждый вариант () «взвешивают» по своей частоте, т.е. умножают на неё. Частоты «f» при этом называются статистическими весами или просто весами средней.

В качестве веса могут применяться какие-либо другие величины (в таблице обозначены буквой w).

Частоты отдельных вариантов могут быть выражены не только абсолютными величинами, но и относительными – частостями.

Вопрос 4. Структурные средние величины

К структурным средним относят моду и медиану.

Модой называют наиболее часто встречающееся значение признака в совокупности.

Медианой называется значение признака, которое лежит в середине ранжированного ряда и делит этот ряд пополам.

Ранжированный ряд – ряд, расположенный в порядке возрастания или убывания значений признака.

Определение моды зависит от того, в каком ряду представлен варьирующий признак. Если варьирующий признак представлен в виде дискретного ряда распределения, то для определения моды не требуется никаких вычислений. В таком ряду модой будет то значение признака, которое обладает наибольшей частотой.

Если значение признака представлены в виде интервального вариационного ряда, то моду определяют расчетным путем по формуле:

, где - мода

-начало (нижняя граница) модального интервала (с наибольшей численностью);

-величина интервала (модального);

-частота интервала, предшествующего модальному;

- частота модального интервала;

- частота интервала, следующего за модальным.

Для определения медианы,сначала определяют ее место в ряду, т.е. порядковый номер по формуле: .

Медиана для интервального вариационного ряда рассчитывается по формуле: , где - медиана

-нижняя граница медианного интервала;

-величина медианного интервала;

-сумма частот ряда;

-частота медианного интервала;

-сумма накопленных частот интервалов, предшествующих медианному.

К структурным средним относят:

Квартили ( ) - значение признака делящие упорядочную совокупность на 4 равные части.

Децили ( ) - значение признака делящие упорядочную совокупность на 10 равных частей.

Процентили ( ) – значение признака делящие упорядочную совокупность на 100 равных частей.

Контрольные вопросы по теме 3

1. Какие величины называются абсолютными? Как классифицируются абсолютные величины по единицам измерения?

2. Какие величины называются относительными? Назвать виды относительных величин.

3. Какая в статистике величина называется средней? Назвать виды степенных средних величин и способы их вычисления.

4. Что относится к структурным средним величинам? Назвать способы их вычисления.

Тема 4. Показатели вариации и ряды распределения

 

Вопрос 1. Показатели вариации (колеблемости) признака

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако два ряда распределения, имеющие одинаковую среднюю арифметическую величину, могут значительно отличаться друг от друга по степени колеблемости.

а)

б)

Рис. 2

Если индивидуальные значения признака ряда мало отличаются друг от друга (рис. 1,а), то средняя арифметическая будет достаточно надежной показательной характеристикой типичного уровня в данной совокупности.

Если же ряд распределения характеризуется значительным рассеиванием индивидуальных значений признака (рис.2,б), то средняя арифметическая будет ненадежной характеристикой типичного уровня этой совокупности и ее практическое применение будет ограничено.

Для измерения рассеяния (вариации) признака применяются различные абсолютные и относительные показатели.

К абсолютным показателям вариации относятся следующие:

Размах вариации R (размах колебаний), который представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности:

Недостатком данного показателя является то, что размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов значений признака. Пример:

Таблица 5 - Посевные площади зерновых культур по хозяйствам

Хозяйство Посевная площадь, га (х)
    -300  
    +200  
    +400  
    -400  
    +100  
Итого      

Для нашего примера размах вариации будет равен: R=1700-900=800 га.

Средняя площадь посева составит: =6500/5=1300 га.

Среднее линейное отклонение (l)

- простое;

- взвешенное, в нашем примере =1400/5=280 га

Дисперсия ( ) - средняя из квадратов отклонений вариантов значений признака от их средней величины.

- простая (для не сгруппированных данных);

- взвешенная (для сгруппированных данных);

- при использовании этой формулы исключается дополнительная процедура по расчету отклонений признака от и исключается ошибка в расчете, связанная с округлением отклонений .

В нашем примере дисперсия равна:

=460000/5=92000.

Основные свойства дисперсии:

1. Дисперсия постоянной величины равна нулю.

2. Если все значения вариантов признака уменьшить на одно и то же число, то дисперсия не изменится.

3. Если все значения вариантов уменьшить в раз, то дисперсия уменьшится в раз.

На практике часто используют более простую формулу для расчета дисперсии: , где - среднее квадратов вариантов; - квадрат средней.

Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии.

-для не сгруппированных данных;

-для сгруппированных данных (для вариационного ряда).

Размах вариации, среднее линейное, среднее квадратическое отклонение являются величинами именованными. Они имеют те же единицы измерения, что и индивидуальные значения признака.

Среднее линейное и среднее квадратическое отклонение показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности.

• Коэффициент вариации ( ). Самым распространенным относительным показателем рассеяния (колеблемости) является коэффициент вариации. Он представляет собой процентное отношение абсолютных величин:

-вариационного размаха (R);

-среднего линейного отклонения (l);

-среднего квадратического отклонения () к средней ():

-этот коэффициент иначе называют коэффициентом осцилляции;

; .

Последний коэффициент наиболее употребителен, если нет других указаний, то под коэффициентом вариации имеют в виду именно его.

Его используют не только для сравнительной оценки вариации, но и для характеристики однородности совокупности.

Совокупность считается однородной, если коэффициент вариации не превышает 33%.

 

Вопрос 2. Сложение дисперсий при группировании

Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих колеблемость индивидуальных значений признака, можно воспользоваться разложением дисперсии на составляющие: межгрупповую и внутригрупповую дисперсию.

-Данное равенство называется правилом сложения дисперсии.

Общая дисперсия рассчитывается по формуле простой дисперсии и показывает величину вариации признака, обусловленную всеми факторами, влияющими на данный признак:

- где f – частоты (веса) вариантов признака в общей совокупности.

Межгрупповая дисперсия характеризует ту часть общей вариации признака, которая обусловлена делением совокупности на группы, т.е. характеризует вариацию признака, обусловленную факторами, с которыми связано деление совокупности на группы. Она представляет собой средний квадрат отклонений групповых средних от общей средней и вычитается по формуле: - где - межгрупповая дисперсия,

- средние по отдельным группам,

- общая средняя,

или - численность единиц в i группе (отдельных групп совокупности).

Внутригрупповая дисперсия показывает влияние случайных не учитываемых условий на вариацию признака, характеризует вариацию признака обусловленную прочими факторами, не связанными с делением совокупности на группы. Вычисляется как средняя взвешенная из внутригрупповых дисперсий:

, где или n - число единиц в i группе.

-дисперсия признака i группы.

Чем больше межгрупповая дисперсия , тем лучше проведена группировка (выделенные при группировке группы сильнее различаются между собой). Поэтому межгрупповая дисперсия является критерием группирования для группировок с одинаковым числом групп. Лучшей будет та группировка, у которой величина больше.

Пользуясь правилом сложения дисперсии, можно всегда по двум известным дисперсиям отыскать третью-неизвестную, а также судить о силе влияния группировочного признака.

 

Вопрос 3. Ряды распределения и показатели центра и формы распределения

Ряд распределения – это групповая таблица, имеющая две графы: группы по выделенному признаку (графа вариант) и численность групп (графа частот).

Ряды распределения делятся: вариационные и атрибутивные.

Вариационный ряд - групповая таблица, построенная по количественному признаку, в сказуемом которой показывается число единиц в каждой группе.

В атрибутивных рядах представлена группировка по атрибутивным (качественным) признакам (например, деление рабочих предприятия по полу, профессиям и т.д.) и численность каждой группы.

Главное предназначение рядов распределения – изучение вариации признаков. Изучение вариации в пределах однородной группы предполагает использование следующих приемов: построение ряда распределения, его графическое изображение, исчисление основных характеристик распределения.

Вариационные ряды бывают:

• дискретными, если значение признака задано как дискретное (точечное);

• интервальными, если значение признака задано интервалом.

Для признака имеющего непрерывное изменение, строится интервальный вариационный ряд, состоящий, как и дискретный из двух граф (варианты и частоты). При его построении в первой графе отдельные значения признака указываются в интервалах «от – до», во второй графе число единиц, входящих в интервал. Интервалы образуются, как правило, равные и закрытые. Величина интервала определяется по формуле:

, где R размах колебаний (), число групп приближенно определяется по формуле Стерджесса:n=1+3,322lgN, где N- общее число единиц совокупности.

Далее выделяем группы по интервалам как в методике проведения группировки (2 тема, 3 вопрос).

Пример:

Таблица 6 – Группы рабочих по выполнению норм выработки

 

Группы рабочих по выполнению норм вы-работки, х(варианты) Число рабочих, f (частоты) Частости, w Накопленная частота,S
В долях В %
80-90 (-)   0,022 2,2  
90-100   0,245 24,5  
100-110   0,533 53,3  
110-120   0,178 17,8  
120-130   0,022 2,2  
Итого:   1,00 100,0  

(+)- включаются

 

Ряд распределения, состоящий из двух граф (варианты, частоты), иногда дополняются другими графами, необходимыми для вычисления отдельных статистических показателей.

Часто в ряд вводится графа, в которой подсчитываются накопленные частоты (S). Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше чем данное значение, и исчисляются путем последовательного прибавления к частоте первого интервала частот последующих интервалов.

Частоты ряда (f) могут быть заменены частостями (w),которые представляют собой частоты, выраженные в относительных числах (долях или процентах) и рассчитываются путем деления частоты каждого интервала на их общую сумму: , и т.д.

В нашем примере частости в долях: 2/90=0,022, 22/90=0,245

В процентах: 0,022·100%=2,22%

Накопленные частоты: (см. графу f) 2+22=24; 24+48=72; 72+16=88; 88+2=90.

В вариационных рядах распределения можно заметить определенную зависимость между изменением варьирующего признака и частот. Частоты в этих рядах с увеличением варьирующего признака первоначального увеличиваются, а затем после достижения какой-то максимальной величины в середине ряда уменьшаются. Это свидетельствует о том, что частоты в вариационных рядах изменяются закономерно в связи с изменением варьирующего признака. Такие закономерности изменения частот в вариационных рядах называются закономерностями распределения.

Одна из важных целей статистического изучения вариационных рядов состоит в том, чтобы выявить закономерность распределения и определить ее характер.

Статистическая закономерность распределения отчетливо проявляется только при массовом наблюдении, поэтому основной путь в выявлении закономерности распределения состоит в построении вариационных рядов для достаточно больших по численности совокупностей.

Для анализа вариационных рядов используются три группы показателей:

• показатели центра распределения;

• показатели степени вариации (1 вопрос этой темы);

• показатели формы распределения.

Показатели центра распределения.

Для характеристики среднего значения признака в вариационном ряду применяются: средняя арифметическая, медиана, мода.

Средняя арифметическая для дискретного ряда распределения исчисляется по формуле: , где

х - варианты значений признака,

f- частоты повторения данного варианта

Средняя арифметическая для интервального ряда распределения:

, где

- середина соответствующего интервала значения признака, вычисляется как средняя из значений границ интервала.

Медиана (Ме) – соответствует варианту, стоящему в середине ранжированного ряда.

В дискретном ряду определяют порядковый номер: .

В интервальном ряду распределения сначала указывают интервал, в котором находится медиана. Медианным является первый интервал, в котором сумма накопленных частот превысит половину общего числа наблюдений. Численное значение медианы определяется по формуле (3 тема, 4 вопрос):

;

Мода ( Мо) - наиболее часто встречающее значение признака.

В дискретном ряду – это вариант с наибольшей частотой.

В интервальном ряду сначала определяется модальный интервал, т.е. интервал который имеет наибольшую частоту. Конкретное значение моды определяется по формуле (3 тема, 4 вопрос):

.

Моду и медиану можно определить на основе графического изображения ряда.

Медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты (у) делят пополам, через полученную точку проводят прямую параллельную оси абсцисс, до пересечения с кумулятой. Абсцисса точки пересечения является медианой величиной.

Мода определяется по гистограмме. Для этого правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника – с левым верхним углом следующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

S f 8

       
 
   


16 6

12

8 4

4

х

3,7-4,6 4,6-5,5 5,5-6,4 3,7-4,6 4,6-5,5 5,5-6,4 6,4-7,3

Медиана Мода

Показатели формы распределения

Для получения приблизительного представления о форме распределения строят графики распределения (полигон, гистограмму).

f

6

4

3

1

1 2 3 4 5 6 7 х

Рис. 3 Полигон распределения

 

Число наблюдений, по которому строится эмпирическое распределение, обычно невелико и представляет собой выборку из исследуемой генеральной совокупности. Поэтому эмпирические данные в определенной степени связаны со случайными ошибками наблюдения, величина которых неизвестна. Влияние этих случайностей затемняет основную закономерность изменения величины признака. С увеличением числа наблюдений и одновременным уменьшением величины интервала зигзаги полигона начинают сглаживаться, и в пределе мы приходим к плавной кривой, которая называется кривой распределения.

Таким образом, под кривой распределения понимается графическое изображение в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариант.

Теоретической кривой распределения,называется кривая, выражающая общую закономерность данного типа распределения в чистом виде, исключающего влияние случайных для закономерности факторов. Но получение кривой распределения из эмпирических данных (полигон, гистограмм) возможно лишь для описательно идеального случая. Поэтому, при проведении анализа вариационных рядов целесообразно свести эмпирическое распределение к одному из хорошо исследованных видов теоретического распределения, рассматриваемых математической статистикой.

В статистической практике встречаются разнообразные распределения. Различают следующие разновидности кривых распределения:

•одновершинные кривые: симметричные, умеренно асимметричные и крайне асимметричные;

• многовершинные кривые.

Для однородных совокупностей характерны одновершинные распределения. Многовершинность свидетельствует о неоднородности изучаемой совокупности и необходимости перегруппировки данных с целью выделения более однородных групп.

Для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель асимметрии

или (коэффициент асимметрии)

Положительная величина показателя асимметрии указывает на наличие правосторонней асимметрии, отрицательная – на наличие левосторонней асимметрии.

f(x) <0 f(x) >0

 

 

       
   


Величина коэффициента асимметрии может изменяться от –1до + 1 (для одновершинных распределений), чем ближе по модулю к единице асимметрия существеннее. Асимметрия выше о,5 (независимо от знака) считается значительной, если она меньше 0,25, то незначительной.

 

Контрольные вопросы по теме 4

  1. Что такое вариация? Абсолютные и относительные показатели вариации.
  2. Что такое дисперсия? Назвать основные свойства дисперсии.
  3. Что собой представляет ряд распределения? Основные элементы ряда распределения.
  4. Как графически представляют ряд распределения? Показатели центра и формы распределения.

 

Тема 5. Выборочное наблюдение

 

Вопрос 1. Понятие о выборочном наблюдении

 

Наиболее совершенным и научно-обоснованным способом не сплошного наблюдения является выборочное наблюдение.

При проведении выборочного наблюдения, обследуются не все единицы изучаемого объекта, т.е. не все единицы генеральной совокупности, а лишь некоторая, так или иначе отобранная часть этих единиц.

Часть единиц генеральной совокупности, подлежащей непосредственному наблюдению, называют выборочнойсовокупностью.

Однако вычисленные по материалам выборочного наблюдения статистические показатели не будут точно совпадать с соответствующими характеристиками для всей (генеральной) совокупности. Величина этих отклонений называется ошибкой наблюдения,это ошибки регистрации и ошибки репрезентативности.

(Ошибки регистрации вызываются несовершенством измерительных приборов, недостаточной квалификацией наблюдения, неточностью подсчетов.

Ошибки репрезентативности характеризуют размер расхождения между величинами показателя, полученного в выборочной и генеральной совокупности в условиях одинаковой точности единичных наблюдений.)

По способу формирования выборочной совокупности различают следующие виды выборочного наблюдения:

· Простая случайная выборка (собственно-случайная);

· Расслоенная (типическая, районированная);

· Серийная;

· Механическая;

· Комбинированная;

· Ступенчатая;

· Многофазная.

По степени охвата единиц исследуемой совокупности различают большие и малые выборки.

Совокупность единиц, из которых производится отбор, принято называть генеральной совокупностью.

Совокупность отобранных единиц из генеральной совокупности называется выборочной совокупностью.

N – объем генеральной совокупности (число входящих в нее единиц);

n – объем выборочной совокупности (число единиц, попавших в выборку);

- генеральная средняя (среднее значение признака в генеральной совокупности);

х – выборочная средняя (среднее значение в выборочной совокуп-ности);

p – генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности);

w - выборочнаядоля (доля единиц, обладающих данным признаком в выборочной совокупности);

- генеральная дисперсия (дисперсия признака в генеральной сово-купности);

- выборочная дисперсия (дисперсия признака в выборочной совокуп-ности);

- среднее квадратическое отклонение признака в генеральной совокупности

- среднее квадратическое отклонение признака в выборочной сово-купности.

 

Вопрос 2 Основные способы формирования выборочной совокупности

Одним из важных условий научной организации выборочного наблюдения является правильное формирование выборочной совокупности.

Все виды выборочного наблюдения могут быть повторными и бес-повторными.

Повторным называется отбор, когда каждая единица генеральной совокупности может попасть в выборку несколько раз.

Без повторным называется отбор, когда каждая единица генеральной совокупности может попасть в выборочную совокупность только один раз.

Собственно-случайным называется отбор, при котором каждая единица имеет равную возможность попасть в выборку. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.

Механический отбор - это разновидность случайного отбора. Он заключается в том, что отбор единиц производится в каком-либо механическом порядке, например, отбирается каждая пятая, каждая десятая.

Характеристики выборочной совокупности (средняя и доля) близки к характеристикам генеральной совокупности, но отличаются от них на величину ошибки выборки (). Величина , обозначенная , называется предельной ошибкой выборки.

;

где - предельная (максимально возможная) ошибка средней;

- предельная (максимально возможная) ошибка доли;

- величина средней квадратической стандартной ошибкой;

- коэффициент доверительной вероятности.

Величина средней и предельной ошибок рассчитываются по формулам.

 

Таблица 8 - Формулы ошибок простой случайной выборки

 

  Способ отбора единиц
повторный бесповторный
Средняя ошибка : для средней
для доли  
Предельная ошибка : для средней
для доли  

 

 

Типическим называется отбор, при котором генеральная совокупность предварительно разбивается на более или менее однородные группы, из которых в случайном порядке производят отбор необходимой численности единиц.

- общая численность в генеральной совокупности

где , - численность отдельных групп генеральной совокупности

- общий объем выборочной совокупности.

Объем выборки для каждой группы: ,

где - удельный вес данной ( -й) группы в генеральной совокупности

При оптимальном размещении число наблюдений в группе определяется по формуле: .

Формулы для расчета ошибок типической выборки приведены в таблице, где - средняя групповая выборочная дисперсия средней:

;

- внутригрупповая дисперсия данной ( -й) группы в выборочной совокупности;

⇐ Предыдущая123456789Следующая ⇒




Дата добавления: 2015-09-19; просмотров: 3059. Нарушение авторских прав; Мы поможем в написании вашей работы!



Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

САНИТАРНО-МИКРОБИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ ВОДЫ, ВОЗДУХА И ПОЧВЫ Цель занятия.Ознакомить студентов с основными методами и показателями...

Меры безопасности при обращении с оружием и боеприпасами 64. Получение (сдача) оружия и боеприпасов для проведения стрельб осуществляется в установленном порядке[1]. 65. Безопасность при проведении стрельб обеспечивается...

Весы настольные циферблатные Весы настольные циферблатные РН-10Ц13 (рис.3.1) выпускаются с наибольшими пределами взвешивания 2...

Травматическая окклюзия и ее клинические признаки При пародонтите и парадонтозе резистентность тканей пародонта падает...

Подкожное введение сывороток по методу Безредки. С целью предупреждения развития анафилактического шока и других аллергических реак­ций при введении иммунных сывороток используют метод Безредки для определения реакции больного на введение сыворотки...

Принципы и методы управления в таможенных органах Под принципами управления понимаются идеи, правила, основные положения и нормы поведения, которыми руководствуются общие, частные и организационно-технологические принципы...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия