Дискретной случайной величины
Цель работы: выработать практические навыки элементарной статистической обработки результатов эксперимента. Теоретический материал для лабораторных работ 4–5. Часто исследователю приходится обрабатывать большие массивы данных, полученных в результате эксперимента путём измерений, наблюдений, анализа, проб и т.п. Обычно экспериментатор имеет возможность многократно повторить свой опыт и получить большое количество однородных данных. Затем перед исследователем встаёт задача обработки этих данных, чтобы извлечь как можно более точную информацию об измеряемой величине. Изучением методов решения таких задач, в частности, занимается математическая статистика. Таким образом, в общих чертах математическая статистика разрабатывает математические методы, позволяющие делать существенные выводы об изучаемом объекте на основе статистических данных. В теории вероятностей считаются известными законы распределения изучаемых случайных величин, и на их основе изучаются другие свойства случайных величин. В математической статистике сама с.в. считается неизвестной, и целью исследования является получение более или менее достоверной информации об этом распределении на основе данных, собранных в результате наблюдений. Более точно о некоторых задачах математической статистики скажем ниже после введения основных понятий. Генеральной совокупностью (сокращённо г.с.) называется случайная величина, над которой происходит наблюдение. Пусть X – г.с. Выборкой из г.с. X называется конечная последовательность независимых с.в.
распределённых так же, как и X. Число n называется объёмом выборки. Если в результате опыта случайные величины выборки (1) получили числовые значения Рассмотрим пример. Имеется большая партия однотипных электрических лампочек. Требуется установить время безотказной работы лампы (время от включения и до перегорания лампы). Г.с. является с.в. X – время безотказной работы лампочек из этой партии. Можно выбрать наугад 10 лампочек из этой партии и измерить время безотказной работы каждой из выбранных лампочек: Теперь рассмотрим подробнее некоторые задачи математической статистики. 1. Оценивание параметров. Эта задача состоит в том, чтобы по реализации выборки найти приближённые значения характеристик г.с., таких, как параметры, входящие в закон распределения г.с., математическое ожидание и дисперсию г.с. и т.п. 2. Проверка статистических гипотез. Бывает, что по реализации выборки из г.с. можно выдвинуть гипотезу о неизвестных параметрах или о функции распределения этой г.с. Задача состоит в том, чтобы разработать методы проверки (принятия или отвержения) таких гипотез. 3. Регрессионный анализ. Имеются результаты наблюдения над двумя случайными величинами. Требуется по ним установить, существует ли статистическая связь между ними. Если связь существует, то установить вид этой связи.
Точечные оценки неизвестных параметров г.с. У г.с. неизвестными могут быть параметры, связанные с законом её распределения, её числовые характеристики (математическое ожидание, дисперсия и т.п.). Например, если предположить, что г.с. X имеет показательное распределение, то неизвестным может быть параметр l. В примере с электрическими лампочками неизвестным параметром является номинальное значение времени безотказной работы лампы из партии, т.е. математическое ожидание г.с. M [ X ]. Под оцениванием неизвестного параметра понимается нахождение его приближённого значения или диапазона его изменения. В первом случае оценка называется точечной, во втором – интервальной. Пусть имеется выборка (1). Обозначим q неизвестный параметр г.с. X. С татистикой называется функция, зависящая от выборки (1). Например, Точечной оценкой неизвестного параметра qг.с. X называется некоторая статистика Свойства точечных оценок. Понятно, что точечная оценка неизвестного параметра должна обладать некоторыми «хорошими» свойствами по отношению к оцениваемому параметру. Рассмотрим эти свойства. 1. Несмещённость. Точечная оценка 2. Состоятельность. Точечная оценка 3. Эффективность. Точечная оценка О методах получения точечных оценок. Есть различные способы получения точечных оценок. О трёх из них (методе моментов, методе максимального правдоподобия и методе наименьших квадратов) можно прочитать в [1, 2, 5], а о методе наименьших квадратов подробно написано в [3]. Выборочной средней г.с. X называется статистика Выборочным начальным моментом k-го порядка называется величина Выборочным центральным моментом k-го порядка называется величина Метод моментов состоит в том, что точечная оценка получается при замене неизвестных моментов г.с. (их ещё называют теоретическими моментами) на соответствующие выборочные моменты. Так, точечной оценкой м.о. по этому методу является выборочное среднее, а точечной оценкой дисперсии – выборочный центральный момент второго порядка. Этот момент называется выборочной дисперсией и обозначается Точечные оценки математического ожидания и дисперсии. По всем перечисленным выше методам в качестве оценки математического ожидания M [ X ] получается выборочное среднее Обозначим m = M [ X ] и 1. 2. 3. 4. Свойство 1 означает, что выборочное среднее является несмещённой оценкой для м.о. По закону больших чисел выборочное среднее является состоятельной оценкой для м.о. Выборочное среднее не всегда является эффективной оценкой для м.о. Так, если г.с. распределена по нормальному закону, то эта оценка эффективна, но для равномерно распределённой г.с. это не так. Выборочная дисперсия Наконец, приведём ещё несколько фактов. 1) 2) Dв и 3) Перечисленные в предыдущих пунктах 1) и 2) оценки не являются эффективными, но при больших объёмах выборки они становятся почти эффективными. Интервальные оценки. Основной недостаток точечной оценки состоит в том, что по нему нельзя сказать, насколько точно найдено приближённое значение неизвестного параметра. Интервальная оценка указывает промежуток, в который с некоторой вероятностью может попасть неизвестный параметр. Пусть q – неизвестный параметр г.с. X, g– значение вероятности (т.е.0< g< 1), Величина a=1–gназывается уровнем значимости. На практике доверительные вероятности обычно выбирают равными 0.90, 0.95, 0.99. Смысл доверительного интервала состоит в том, что если провести большую серию опытов с одним и тем же объёмом выборки, то примерно в 100g % опытах доверительный интервал будет содержать неизвестный параметр. Рассмотрим три закона распределения, которые часто используются в теории вероятностей. 1. Распределение 2. Распределение Стьюдента Т (k). С.в. 3. С.в.
Рис. 4. График плотности распределения
В математической статистике важную роль играет понятие квантили. Квантилью порядка a (0< a< 1) называется такое число x a, что F (x a) = a. В случае непрерывно распределённой с.в. с плотностью распределения p (x), F (x a) = P (X < x a) =
1 Доверительный интервал для м.о. нормально распределённой с.в. 1) Пусть г.с. X Î N(m, s) и известна дисперсия s2. Воспользуемся тем фактом, что с.в. Теперь, решив неравенства
2) Пусть г.с. X Î N(m, s) и дисперсия s2 неизвестна. Тогда аналогично, используя точечную оценку S 2 для дисперсии, получим доверительный интервал:
где 2 Доверительный интервал для дисперсии нормально распределённой г.с. Пусть м.о. m неизвестно. Воспользуемся известным фактом, что с.в.
Решив двойное неравенство в скобках относительно
Извлекая корень квадратный из этих неравенств, получим доверительный интервал для среднеквадратического отклонения:
|