Точечные оценки числовых характеристик экспериментальных законов распределения
Теоретические законы распределения характеризуются числовыми характеристиками: начальными и центральными моментами разных порядков, характеристиками положения. Для экспериментальных законов можно получить оценки этих характеристик. Так как эти оценки на числовой оси могут быть представлены в виде точек, их принято называть точечными в отличие от интервальных, изображаемых на числовой оси с помощью интервалов. В противовес самим числовым характеристикам их оценки являются случайными величинами, причем их значения и рассеянность зависят от числа экспериментальных данных. Точечные оценки числовых характеристик должны удовлетворять 3-м требованиям: они должны быть состоятельными, несмещенными и эффективными. Состоятельной называется оценка, которая с увеличением выборки приближается к истинному значению характеристики ; По определению математического ожидания . Так как каждое значение xi появляется один раз при общем объеме выборки n, то , откуда При конечном п оценкой MX является среднее арифметическое (1.11) Поскольку появилось из MX при ограничении объема выборки, то является состоятельной оценкой математического ожидания. По определению дисперсии т. е. состоятельной оценкой Dх является так называемая выборочная дисперсия (1.12) На практике МX неизвестно, поэтому при расчете математическое ожидание MX заменяют оценкой : Это не влияет на состоятельность , поскольку , однако, как будет показано далее, является причиной смещения оценки дисперсии (1.12). Несмещенной называется оценка, математическое ожидание которой равно самой характеристике. . Проверим несмещенность среднего арифметического Таким образом, среднее арифметическое является несмещенной оценкой математического ожидания результатов многократных наблюдений при любом законе распределения. Проверим несмещенность оценки дисперсии (1.12) Так как (1.13) то Таким образом, замена математического ожидания на среднее арифметическое в выражении (1.12) приводит к смещению оценки дисперсии. Несмещенную оценку дисперсии получают, домножая на коэффициент , то есть несмещенной оценкой дисперсии является При коэффициент , поэтому оценка (1.14) оказывается также состоятельной, как и оценка (1.12). Оценка среднеквадратического отклонения результата наблюдения определяется, как правило, по формуле . Однако, ввиду нелинейности операции извлечения квадратного корня, такая оценка является смещенной для малого числа наблюдений п, поэтому для устранения этого смещения для п < 6 применяют выражение . Общий вид коэффициента К„ для нормального распределения представлен на рис. 1.8. Рисунок 1.8 - Зависимость поправочного коэффициента для расчета СКО при малом числе измерений п и хорошо аппроксимируется выражением (1.17) Эффективной называется оценка, обладающая наименьшей дисперсией (рассеянием) по сравнению с остальными. Для выбора наиболее эффективной оценки существует целый ряд методов. Наиболее распространенным является метод максимального правдоподобия, теоретически обоснованный Р. Фишером. Идея метода заключается в отыскании таких оценок параметров распределения, при которых достигает максимума так называемая функция правдоподобия. Последняя определяется как вероятность появления всех независимых результатов наблюдения x1, x2, …xn. Поскольку вероятность появления результата xi, лежащего в интервале , равна , то для независимых результатов наблюдения вероятность появления всего ряда наблюдений x1, x2, …xn есть произведение этих вероятностей (1.18) В соответствии с принципом максимального правдоподобия необходимо найти такие оценки параметров дифференциальной функции распределения , при которых выражение (1.18) достигает наибольшего значения. Для упрощения вычислений пользуются логарифмической функцией правдоподобия . (1.19) Условие максимума (1.19) получают в результате решения системы уравнений, образуемой при приравнивании нулю производных от (1.19) по тем параметрам, оценки которых мы хотим определить. Эту задачу можно решить только для конкретного вида дифференциальной функции распределения. Нормальное распределение. Плотность распределения (рис. А.1, в) Отсюда логарифмическая функция правдоподобия имеет вид . (1.20) Отыщем наиболее эффективную оценку математического ожидания для нормального распределения т. е. . Отсюда . Таким образом, среднее арифметическое является не только состоятельной и несмещенной оценкой математического ожидания, но и для нормального распределения еще и самой эффективной. Дисперсия среднего арифметического, как уже было показано в (1.13), равна (1.21) т. е. в п раз меньше дисперсии результата наблюдения. Определим эффективную оценку дисперсии для нормального распределения , откуда и , то есть для нормального распределения полученная оценка дисперсии является эффективной.
|