Интервальное оценивание
Пусть . Если Δ представляет собой предел, которым ограничена сверху абсолютная величина |ε | < Δ, то \Х -X | < Δ. Следовательно,
Мы получили интервальную оценку генеральной средней. Из теоремы Чебышева следует, что
Интервальной оценкой называют оценку, которая определяется 2 числами — концами интервала, который с определенной вероятностью накрывает неизвестный параметр генеральной совокупности. Интервал, содержащий оцениваемый параметр генеральной совокупности, называют доверительным интервалом. Для его определения вычисляется предельная ошибка выборки Δ, позволяющая установить предельные границы, в которых с заданной вероятностью (надежностью) должен находиться параметр генеральной совокупности. Коэффициент t позволяет установить, насколько надежно высказывание о том, что заданный интервал содержит параметр генеральной совокупности. Если мы выберем коэффициент таким, что высказывание в 95% случаев окажется правильным и только в 5% - неправильным, то мы говорим: со статистической надежностью в 95% доверительный интервал выборочной статистики содержит параметр генеральной совокупности. Статистической надежности в 95% соответствует доверительная вероятность — 0,95. В 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, т. е. 5% задает уровень значимости (α) или 0,05 вероятность ошибки. Обычно в статистике уровень значимости выбирают таким, чтобы он не превысил 5% (α; < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания. С помощью доверительного интервала можно оценить не только генеральную среднюю, но и другие неизвестные параметры генеральной совокупности. Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Х по выборочной средней Х при известном среднем квадратическом отклонении α генеральной совокупности (на практике — при большом объеме выборки, т. е. при п 30) и собственно-случайном повторном отборе формула () примет вид где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Фo(t) = γ; а— среднее квадратическое отклонение; п — объем выборки (число обследованных единиц). Для оценки математического ожидания а (генеральной средней) нормально распределенного количественного признака Х по выборочной средней Х при известном среднем квадратическом отклонении а генеральной совокупности (при большом объеме выборки, т. е. при n >. 30) и собственно-случайном бесповторном отборе формула () примет вид
где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Фo(t) = γ; w — выборочная доля; п — объем выборки (число обследованных единиц); Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле w = т/п (при большом объеме выборки, т. е. при п >. 30) и собственно-случайном повторном отборе формула () будет иметь вид
Для оценки генеральной доли р нормально распределенного количественного признака по выборочной доле w = т/п (при большом объеме выборки, т. е. при п >. 30) и собственно-случайном,бесповторном отборе формула () будет иметь вид
где t определяется по таблицам функции Лапласа (приложение 2) из соотношения 2Фo(t) = γ; w — выборочная доля; п — объем выборки (число обследованных единиц);
Пример 3. Владелец автостоянки опасается обмана со стороны своих служащих (охраны автостоянки). В течение года (365 дней) владельцем автостоянки проведено 40 проверок. По данным проверок среднее число автомобилей, оставляемых на ночь на охрану, составило 400 единиц, а среднее квадратическое (стандартное) отклонение их числа - 10 автомобилей. Считая отбор собственно-случайным, с вероятностью 0,99 оцените с помощью доверительного интервала истинное среднее число автомобилей, оставляемых на ночь на охрану. Обоснованы ли опасения владельца автостоянки, если по отчетности охранников среднее число автомобилей, оставляемых на ночь на охрану, составляет 395 автомобилей? Решение. По условию задачи выборочное обследование проведено с помощью собственно-случайного отбора. Очевидно, что отбор - бесповторный, так как не имеет смысла производить проверку более 1 раза в сутки. Объем выборки n = 40, что больше 30 единиц, т. е. выборка большая. Объем генеральной совокупности N = 365. Найдем границы доверительного интервала для оценки среднего числа автомобилей, оставляемых на ночь на охрану, т.е. границы доверительного интервала для генеральной средней. По условию Х= 400; σ = 10; п = 40; = 0,99; N=365. Используем формулу Найдем t из соотношения 2Фo(t) = γ. 2Ф o(t) = 0,99; Фo(t) = 0,99/2 = 0,495. По таблице функции Лапласа (приложение 2) найдем, при каком t 2Фo(t) = 0,495. Фo (2,58) = 0,495. Следовательно, t= 2,58. Найдем предельную ошибку выборки: 396,1507 <Х< 403,8493. Ответ. С уверенностью в 99% можно ожидать, что среднее число автомобилей, оставляемых на ночь на охрану, находится в интервале от 396 до 404. Таким образом, можно утверждать, что служащие автостоянки обманывают ее владельца. Пример 4. В 24 из 40 проверок число автомобилей на автостоянке не превышало 400 единиц. С вероятностью 0,98 найдите доверительный интервал для оценки истинной доли дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц. Решение. Определим границы доверительного интервала для доли дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц. По условию т = 24; п = 40; у= 0,98. Выборочная доля w = 24/40 = 0,60. Так как Фo(t) = γ/2 = 0,98/2 = 0,49. По таблице функции Лапласа (приложение 2) найдем, при каком t Фo(t) = γ 0,49. Фо (2,33) = 0,49. Следовательно, t == 2,33. Найдем предельную ошибку выборки: 0,6 - 0,1703 <p < 0,6 + 0,1703; 0,4297 <p< 0,7703. Ответ. С вероятностью 0,98 можно ожидать, что доля дней в течение года, когда число оставляемых на стоянке автомобилей не превышало 400 единиц, находится в интервале от 0,4297 до 0,7703. Пример 5. Изменим условие примера 3. С помощью собственно-случайного бесповторного отбора определяется среднее число автомобилей, оставляемых на ночь на охрану. Предполагается, что оно подчиняется нормальному закону. Каким должен быть объем выборки, чтобы с вероятностью 0,95 можно было утверждать, что когда принимается полученное среднее число автомобилей по выборке за истинное, совершается погрешность, не превышающая 3 автомобилей, если среднее квадратическое отклонение а равно 10 автомобилям? Решение. Дано: Д = 3; <т= 10; у= 0,95;.N=365. Воспользуемся формулой расчета необходимой численности выборки для средней при собственно-случайном бесповторном отборе: Найдем t из соотношения 2Фд(() = у. 2Фу(1) = 0,95; Фд(() = 0,95/2 = 0,475. По таблице функции Лапласа (приложение 2) найдем, при каком t Фу(1) == 0,475. Фд(1,96) = 0,475. Следовательно, t = 1,96. Рассчитаем объем выборки: Так как п — целое число, округлим полученный результат до большего целого, учитывая, что необходимо не превышать заданную ошибку. Следовательно, необходимо провести не менее 39 проверок. Ответ. Для определения среднего числа автомобилей, оставляемых на ночь на охрану с вероятностью 0,95 и Д = 3, необходимо провести не менее 39 проверок
|