Глава 3. Выборочный метод
Пусть требуется изучить некоторую совокупность объектов. Множество всех изучаемых объектов называется генеральной совокупностью. Выборочной совокупностью (или просто выборкой) называется совокупность объектов, отобранных для исследования из генеральной совокупности. Объемом совокупности (генеральной или выборочной) называют число объектов этой совокупности. Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы объем выборки был достаточно велик, и, кроме того, объекты выборки должны правильно представлять генеральную совокупность (т.е. выборка должна быть репрезентативной). Выборки подразделяются на повторные (отобранный объект перед отбором следующего возвращается в генеральную совокупность) и бесповторные (отобранный объект не возвращается в генеральную совокупность). Пусть из генеральной совокупности извлечена выборка объемом n. Упорядоченная выборка, записанная в порядке возрастания, называется вариационным рядом. Разность между крайними членами вариационного ряда (наибольшим и наименьшим значениями выборки) называется размахом вариационного ряда. Вариационный ряд называется дискретным, если значения признака отличаются друг от друга на некоторую постоянную величину (например, ряд распределения рабочих по тарифному разряду). Вариационный ряд называется непрерывным, если значения признака могут отличаться один от другого на сколь угодно малую величину (например, ряд распределения рабочих по уровню заработной платы). Наблюдаемые значения Наряду с понятием частоты существует понятие накопленной частоты
При большом числе наблюдений статистическое распределение выборки можно задать в виде последовательности интервалов, обычно равной длины и соответствующих им частот (в качестве частоты интервалов принимают сумму частот вариант, попавших в этот интервал). При построении интервального вариационного ряда распределения необходимо определить: 1) число групп k по формуле Стерджесса
где n – объем выборки; 2) длину интервала
3) за начало первого интервала рекомендуется брать величину xнач = хmin – 0, 5× h. Для наглядного представления статистического распределения пользуются графическим изображением вариационных рядов (полигоном, гистограммой и кумулятой). Полигоном частот называют ломанную, отрезки которой соединяют точки (xi; mi), где xi – варианты выборки, mi – соответствующие им частоты или точки (xi; Кумулята – графическое изображение накопленных частот. Кумулята строится по точкам (xi; Гистограмма строится только для интервального вариационного ряда. На каждом из интервалов значений как на основании, строят прямоугольник с высотой, пропорциональной частоте mi. Для оценки интегральной функции распределения генеральной совокупности служит эмпирическая функция распределения. Эмпирической функцией распределения называют функцию
где Эмпирическая функция распределения 1) 2) 3) если х 1 – наименьшая варианта, а хk – наибольшая, то Примеры 73. В случайном порядке было отобрано 25 студентов экономического факультета и выписан их возраст: 19 17 22 18 17 17 23 21 18 19 17 22 18 18 18 20 17 19 21 17 21 17 18 23 18 Составить статистическое распределение студентов по возрасту. Построить полигон и кумуляту. Найти эмпирическую функцию распределения и дать ее графическое изображение. Решение. 1. По исходным данным составим статистическое распределение выборки.
2. Вычислим относительные частоты, и результаты вычислений внесем в третий столбец таблицы. Относительные частоты находим по формуле
В данном случае объем выборки
3. Вычислим накопленные частоты и результаты внесем в четвертый столбец таблицы.
Вычисленные относительные накопленные частоты указаны в пятом столбце таблицы.
4. Для построения полигона распределения отложим на оси абсцисс варианты xi, на оси ординат – частоты mi. Для построения кумуляты отложим на оси абсцисс варианты xi, на оси ординат – накопленные частоты. 5. Найдем эмпирическую функцию F *(x) по данному распределению выборки. Объем выборки Наименьшая варианта Эмпирическая функция имеет вид Построим график этой функции 74. Наблюдения за жирностью молока у 50 коров дали следующие результаты (в %). 3, 86 3, 84 3, 69 4, 00 3, 81 3, 73 4, 14 3, 76 4, 06 3, 94 3, 76 3, 46 4, 02 3, 52 3, 72 3, 67 3, 98 3, 71 4, 08 4, 17 3, 89 4, 33 3, 97 3, 57 3, 94 3, 88 3, 72 3, 92 3, 82 3, 61 3, 87 3, 82 4, 01 4, 09 4, 18 4, 03 3, 96 4, 07 4, 16 3, 93 3, 78 4, 26 3, 46 4, 04 3, 99 3, 76 3, 71 4, 02 4, 03 3, 91 По этим данным построить интервальный вариационный ряд с равными интервалами и изобразить его графически (построить полигон, гистограмму, кумуляту). Решение. 1. Выполним разбиение данного ряда на интервалы:
Число интервалов длина каждого интервала за начало первого интервала примем величину
2. Для построения гистограммы откладываем на оси абсцисс интервалы длинной Для построения кумуляты на оси абсцисс отложим середины интервалов, а на оси ординат – накопленные частоты.
|