Выборочное наблюдение
Большая выборка Соотношение между генеральной и выборочной средними: `х = где`х – генеральная средняя; - выборочная средняя; D - предельная ошибка выборки. Предельная ошибка выборки D = t × m, где t – коэффициент доверия; m - средняя ошибка выборки. Средняя ошибка выборки при собственно случайном и механическом отборе: при повторном методе отбора ; при бесповторном методе отбора , где - дисперсия выборочных данных. Средняя ошибка выборки при гнездовом или серийном отборе: при повторном отборе ; при бесповторном отборе , где - межгрупповая вариация; s – количество отобранных серий; S – количество серий в генеральной совокупности. Численность выборки При повторном отборе: При бесповторном отборе: Типовая задача 1. Из 25000 вкладчиков в сберегательных кассах города подвергнуто пропорциональному типическому отбору по общественным группам 2000 вкладчиков, которые по размеру вклада распределились следующим образом: Таблица 7.1
Определить: 1) возможные пределы среднего вклада для всех вкладчиков (с вероятностью 0, 997); 2) возможные пределы доли вкладчиков с размером вклада до 310 р. (с вероятностью 0, 954). 1) Средняя ошибка выборки при типичном бесповторном отборе определяется по формулам: , Выборочная средняя Дисперсии типических групп и средняя внутригрупповая дисперсия: Средняя ошибка выборки С вероятностью F(t) = 0, 997 (t = 3) предельная ошибка выборки D = 4, 858 × 3 = 14, 6. Средний вклад всех вкладчиков находится в пределах 370 ± 14, 6 р. 2) Средняя ошибка выборочной доли при типическом бесповторном отборе определяется по формуле:
где w(1-w) – средняя внутригрупповая дисперсия, равная средней взвешенной из дисперсии отдельных типических групп. Выборочная доля вкладчиков с размером вклада до 310 р., в процентах: Дисперсии типических групп и средняя внутригрупповая дисперсия: w1 (1 – w1) = 75 × 25 = 1875, w2 (1 – w2) = 40 × 60 = 2400, w3 (1 – w3) = 50 × 50 = 2500.
Средняя ошибка доли С вероятностью F(t) = 0, 954 коэффициент доверия t = 2; D = 1, 03 × 2 = 2, 06. Доля вкладчиков, вклад которых не превышает 310 р., находится в пределах 50 ± 2, 06 %.
Типовая задача 2. Из 100 ящиков по 400 деталей в каждом, в порядке случайной бесповторной серийной выборки отобрано 5 ящиков, все детали которых проверены на вес. Были получены следующие результаты: Таблица 7.2
Определить: 1) возможные пределы среднего веса детали в ящиках, поступивших на склад (с вероятностью 0, 954); 2) объем случайной бесповторной серийной выборки, чтобы с вероятностью 0, 683 предельная ошибка выборки при определении среднего веса детали не превышала 0, 7 г. 1) Средняя ошибка серийной бесповторной выборки определяется по формуле: . где - средние показатели серий. Межсерийная выборочная дисперсия равна:
С вероятностью 0, 954 (t = 2) D = 2 × 0, 95 = 1, 9. Средний вес деталей в ящиках находится в пределах: `х = 52 ± 1, 9 (г). 2) Объем выборки при исчислении выборочной средней методом серийной выборки с равновеликими сериями определяется по формуле При заданной вероятности F (t) = 0, 683 t = 1. Межсерийная дисперсия – 4, 8; предельная ошибка выборки по условию задачи равна 0, 7 г. Малая выборка Средняя ошибка малой выборки: Предельная ошибка малой выборки: Dмв = mмв × tc, где tс – коэффициент Стьюдента. Коэффициент Стьюдента определяется по таблицам распределения Стьюдента для вероятности S (t) и n. Вероятность Стьюдента связана с доверительной вероятностью следующим образом:
Типовая задача 3. Отобрано 10 рабочих для определения времени выполнения ими определенной операции. Среднее время у них оказалось равным 10, 4 мин, а дисперсия выборки – 4. С вероятностью 0, 984 определить среднее время на данную операцию у всех рабочих.
Средняя ошибка малой выборки: Вероятность Стьюдента: По таблице распределения Стьюдента находим для S (t) = 0, 992 и n = 10, t = 3. Предельная ошибка малой выборки: Dмв = mмв × tc, Dмв = 0, 67 × 3 = 2, 01. С вероятностью 0, 984 можно утверждать, что среднее время на данную операцию находится в пределе 10, 4 ± 2, 01 минуты. Задачи 7.1. Имеется информация о выпуске продукции (работ, услуг), полученной на основе 10% выборочного наблюдения по предприятиям области: Таблица 7.3
Определить: 1) по предприятиям, включенным в выборку: а) средний размер произведенной продукции на одно предприятие; б) дисперсию объема производства; в) долю предприятий с объемом производства продукции более 400 млн. р.; 2) в целом по области с вероятностью 0, 954 пределы, в которых можно ожидать: а) средний объем производства продукции на одно предприятие; б) долю предприятий с объемом производства продукции более 400 млн. р.; 3) общий объем выпуска продукции по области.
7.2. В районе А проживает 2500 семей. Для установления среднего числа детей в семье была проведена 2%-ная случайная бесповторная выборка. В результате получены следующие данные: Таблица 7.4
С вероятностью 0, 997 определить границы, в которых будет находиться среднее число детей в семье в генеральной совокупности (в городе А).
7.3. Методом собственно случайной (повторной) выборки обследована жирность молока у 100 коров. По данным выборки средняя жирность молока оказалась равной 3, 64 %, а дисперсия составила 2, 56. Определить: а) среднюю ошибку выборки; б) с вероятностью, равной 0, 954, предельные значения генеральной средней.
7.4. При обследовании 100 образцов изделий, отобранных из партий в случайном порядке, оказалось 20 нестандартных. С вероятностью 0, 954 определите пределы, в которых находится доля нестандартной продукции в партии.
7.5. По результатам контрольной проверки налоговыми службами 400 бизнес-структур, у 140 из них в налоговых декларациях не полностью указаны доходы, подлежащие налогообложению. Определите в генеральной совокупности (по всему району) долю бизнес-структур, скрывших часть доходов от уплаты налогов, с вероятностью 0, 954.
7.6. Посредством случайной бесповторной выборки было обследовано 100 рабочих по стажу работы из общей численности 950 чел. На основе обследования был составлен ряд распределения: Таблица 7.5
Определите с вероятностью 0, 997, в каких пределах находится доля рабочих со стажем свыше 20 лет в общей численности рабочих по предприятию.
7.7. В целях изучения стажа рабочих одного из цехов завода проведена 10%-ная механическая выборка, в результате которой получено следующее распределение рабочих по стажу работы: Таблица 7.6
На основании этих данных вычислите: 1) средний стаж рабочих цеха; 2) средний квадрат отклонений (дисперсию) и среднее квадратическое отклонение; 3) коэффициент вариации; 4) с вероятностью 0, 997 предельную ошибку выборочной средней и возможные границы, в которых ожидается средний стаж рабочих цеха; 5) с вероятностью 0, 997 предельную ошибку выборочной доли и границы удельного веса числа рабочих со стажем работы от 10 до 20 лет. Сделайте выводы.
7.8. Для определения средней длины детали необходимо провести выборочное обследование методом случайного повторного отбора. Какое количество деталей нужно отобрать, чтобы ошибка выборки не превышала 2 мм, с вероятностью 0, 954 при среднем квадратическом отклонении 8 мм? Решить задачу при условии, что отбор повторный.
7.9. Сколько рабочих завода нужно отобрать в порядке случайной выборки для определения средней заработной платы, чтобы с вероятностью 0, 954 можно было бы гарантировать ошибку не более 50 рлей? Предполагаемое среднее квадратическое отклонение заработной платы s2 = 200 рлей.
Домашнее задание Задача 1. Из партии электроламп взята 20%-ная случайная бесповторная выборка для определения среднего веса спирали. Результаты представлены в табл. 6.4: Таблица 7.7
Определить с вероятностью 0, 95 (t = 1, 96) доверительные интервалы, в которых лежит средний вес спирали, для всей партии электроламп.
Задача 2. Для определения среднего возраста студентов вуза с числом студентов 1250 был зафиксирован возраст 87 студентов
Таблица 7.8
Определите: 1) средний возраст студентов выборки; 2) среднеквадратическое отклонение возраста по выборке; 3) 99% доверительный интервал для среднего возраста студентов вуза.
Задача 3. Для определения средней величины заработной платы работников малых предприятий необходимо провести выборочное обследование методом случайного повторного отбора. Какое количество работников нужно отобрать, чтобы ошибка выборки с вероятностью 0, 954 не превышала 2 млн. р. при среднем квадратическом отклонении 10 млн. р.
Задача 4. В городе проводится обследование семей с целью выявления доли расходов семейных бюджетов на оплату жилья. Предыдущее аналогичное обследование дало результат в 21, 6%. Сколько нужно обследовать семей, чтобы с вероятностью 0, 99 и точностью не менее 0, 5% определить эту долю?
|