Вариационные ряды распределения
Факультета Очно-заочного образования Отделения Ветеринарной Медицины Гурьева Валерия Вячеславовна
Преподаватель: (должность, звание, ФИО)
Москва 2014 г. Оглавление Часть 1. ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛЕНИЯ.. 3 1.1 Вариационные ряды распределения. 3 1.2 Обработка данных понастригу шерсти и длине волоса шерсти. 6 1.3 Графическое представление данных. 10 ЧАСТЬ 2. АНАЛИЗ РЯДОВ РАСПРЕДЕЛЕНИЯ.. 13 2.1.1 Расчет средних величин. Теоретическая часть. 13 2.1.2 Расчет средних величин. Практическая часть. 16 2.2.1 Показатели вариации и распределения. Теоретическая часть. 18 2.2.2 Показатели вариации и распределения. Практическая часть. 21 ЧАСТЬ 3. ВЫБОРОЧНЫЙ МЕТОД.. 22 3.1 Определение предельной ошибки выборочной средней и доверительных пределов генеральной средней. 22 3.2 Определение вероятности осуществления заданной ошибки. 24 ЧАСТЬ 4. КОРРЕЛЯЦИОННЫЙ АНАЛИЗ. 25 4.1Парная корреляция. Теоретическая часть. 25 4.2 Парная коррелячия. Практическая часть. 30
Часть 1. ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛЕНИЯ
Вариационные ряды распределения
Вариационным рядом или рядом распределения называют упорядоченное распределение единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака. Существует 3 вида ряда распределения: 1) ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака; если численность единиц совокупности достаточно велика ранжированный ряд становится громоздким, и в таких случаях ряд распределения строится с помощью группировки единиц совокупности по значениям изучаемого признака (если признак принимает небольшое число значений, то строится дискретный ряд, а в противном случае – интервальный ряд); 2) дискретный ряд – это таблица, состоящая из двух столбцов (строк) – конкретных значений варьирующего признака Xi и числа единиц совокупности с данным значением признака fi – частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака; 3) интервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака Xi и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей). Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой латинского алфавита f. Общая сумма частот вариационного ряда равна объему данной совокупности, т. е. где k – число групп, n – общее число наблюдений, или объем совокупности. Частоты (веса) выражают не только абсолютными, но и относительными числами – в долях единицы или в процентах от общей численности вариант, составляющих данную совокупность. В таких случаях веса называют относительными частотами или частостями. Общая сумма частностей равна единице
если частоты выражены в процентах от общего числа наблюдений п. Замена частот частостями не обязательна, но иногда оказывается полезной и даже необходимой в тех случаях, когда приходится сопоставлять друг с другом вариационные ряды, сильно отличающиеся по их объемам. В зависимости от того, как варьирует признак – дискретно или непрерывно, в широком или узком диапазоне, – статистическая совокупность распределяется в безынтервальный или интервальный вариационные ряды. В первом случае частоты относятся непосредственно к ранжированным значениям признака, которые приобретают положение отдельных групп или классов вариационного ряда, во втором – подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам (от – до), на которые разбивается общая вариация признака в пределах от минимальной до максимальной варианты данной совокупности. Эти промежутки, или классовые интервалы, могут быть равными и не равными по ширине. Отсюда различают равно- и неравноинтервальные вариационные ряды. В неравноинтервальных рядах характер распределения частот меняется по мере изменения ширины классовых интервалов. Неравноинтервальную группировку в биологии применяют сравнительно редко. Как правило, биометрические данные распределяются в равноинтервальные ряды, что позволяет не только выявлять закономерность варьирования, но и облегчает вычисление сводных числовых характеристик вариационного ряда, сопоставление рядов распределения друг с другом. Приступая к построению равноинтервального вариационного ряда, важно правильно наметить ширину классового интервала. Дело в том, что грубая группировка (когда устанавливают очень широкие классовые интервалы) искажает типичные черты варьирования и ведет к снижению точности числовых характеристик ряда. При выборе чрезмерно узких интервалов точность обобщающих числовых характеристик повышается, но ряд получается слишком растянутым и не дает четкой картины варьирования. Для получения хорошо обозримого вариационного ряда и обеспечения достаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака (в пределах от минимальной до максимальной варианты) на такое число групп или классов, которое удовлетворяло бы обоим требованиям. Эту задачу решают делением размаха варьирования признака на число групп или классов, намечаемых при построении вариационного ряда:
где h – величина интервала; Xмax и Xmin – максимальное и минимальное значения в совокупности; k – число групп. При построении интервального ряда распределения необходимо выбирать оптимальное число групп (интервалов признака) и установливать длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной. Если приходится иметь дело с интервальным рядом распределения с неравными интервалами, то для сопоставимости нужно частоты или частости привести к единице интервала, полученное значение называется плотностью ρ, то есть Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения. Чаще всего число групп в ряду распределения определяют по формуле Стерждесса: где n – численность совокупности. Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс, – это интервалы значений варьирующего признака, а высоты столбиков – частоты, соответствующие масштабу по оси ординат. Диаграмма такого типа называется гистограммой. Если имеется дискретный ряд распределения или используются середины интервалов, то графическое изображение такого ряда называется полигоном, которое получается соединением прямыми точек с координатами Xi и fi. Если по оси абсцисс откладывать значения классов, а по оси ординат – накопленные частоты с последующим соединением точек прямыми линиями, получается график, называемый кумулятой. Накопленные частоты находят последовательным суммированием, или кумуляцией частот в направлении от первого класса до конца вариационного ряда.
|