ВВЕДЕНИЕ. Данное пособие является второй частью курса «Теория вероятностей и математическая статистика» и посвящено изложению основных идей и методов математическойДанное пособие является второй частью курса «Теория вероятностей и математическая статистика» и посвящено изложению основных идей и методов математической статистики. Пособие состоит из трех модулей, каждый из которых содержит теоретический материал, контрольные вопросы, позволяющие проверить усвоение теории, и тестовые задания для подготовки к итоговому тестированию. Первый модуль посвящен основным задачам и понятиям математической статистики и статистическому оцениванию параметров распределений. В первой теме модуля введены понятия генеральной совокупности, выборки, группировки данных, рассмотрены методы построения интервального и вариационного ряда и их графические представления в виде гистограммы и полигона. Во второй теме дается определение оценок параметров, рассматриваются несмещенные и состоятельные оценки, определяются эмпирическое среднее и дисперсия и изучаются их свойства. Третья тема модуля посвящена формулировке и доказательству неравенства Рао-Крамера, определению и исследованию эффективных оценок. Во втором модуле рассматриваются основные распределения математической статистики и их приложения. В первой теме приведены два основных метода нахождения оценок параметров – метод моментов и метод наибольшего правдоподобия. Вторая тема посвящена определению и изучению распределений хи-квадрат и Стьюдента. В третьей теме формулируется и доказывается теорема о распределении выборочных характеристик нормальной совокупности, находящая широкое применение при построении доверительных интервалов и проверке статистических гипотез. Третий модуль посвящен таким важнейшим разделам математической статистики, как интервальное оценивание и проверка статистических гипотез. В первой теме модуля вводится понятие доверительного интервала и приведены примеры построения доверительных интервалов для параметров нормальной совокупности. Вторая тема посвящена основным идеям проверки статистических гипотез и их иллюстрации на примере критерия знаков. В третьей теме рассматриваются критерии Пирсона, Смирнова и Колмогорова. Следует заметить, что в пособии намеренно не рассматриваются вопросы регрессионного и дисперсионного анализа, поскольку они подробно излагаются в курсе общей теории статистики, который обычно читается параллельно с данным курсом. МОДУЛЬ 1. Основные задачи математической статистики. Оценки параметров, их свойства
ТЕМА 1. Основные понятия математической статистики. Генеральная совокупность, выборка, группировка данных, интервальный и вариационный ряды Основная задача теории вероятностей – изучение вероятностных свойств случайных величин в предположении, что их распределение известно. Например, если задана случайная величина , имеющая нормальное распределение с плотностью , то можно вычислить математическое ожидание , дисперсию , вероятность попадания значений случайной величины в некоторый интервал. Параметры и считаются известными. Задачи математической статистики в некотором смысле противоположны. Распределение случайной величины неизвестно, а известны только результаты независимых измерений ее значений. На основе этих опытных данных нужно сделать выводы о распределении случайной величины, ее параметрах и т.п. Например, в случае нормальной случайной величины можно решать задачу об оценке параметров и по результатам наблюдений. Можно оценить вероятность того, что параметры находятся в некоторых интервалах. Наконец, можно поставить задачу проверки гипотезы, что имеет нормальное распределение или что . Основой для всех процедур математической статистики является набор опытных данных или выборка. Определение. Пусть имеется случайная величина , называемая генеральной совокупностью. Выборкой объема называется вектор полученный в результате независимых измерений случайной величины . Замечание. Часто рассматривают как независимые случайные величины, имеющие то же распределение, что и генеральная совокупность . Определение. Если среди выборочных значений имеются повторяющиеся, то рассматривают вариационный ряд, то есть таблицу , где - выборочные значения, а - их кратности, то есть количества повторений. Должно выполняться условие , где - объем выборки. Пример. Пусть - выборка объема . Тогда данной выборке соответствует следующий вариационный ряд: . Графически вариационный ряд можно представить с помощью полигона. Если на координатной плоскости на оси абсцисс откладывать выборочные значения , на оси ординат – кратности или частоты , отметить точки с координатами , , и последовательно соединить их отрезками прямых линий, то полученная ломаная линия называется полигоном. Для нашего примера полигон выглядит следующим образом: (По разным осям масштаб может быть различным.) Если объем выборки большой, то прибегают к группировке данных. Пусть - выборка объема . Находят наименьшее выборочное значение и наибольшее выборочное значение . Число называется размахом выборки. Интервал , содержащий все выборочные значения, делят на интервалов равной длины. Количество интервалов можно вычислять по формуле , называемой формулой Стэрджеса. Тогда длина каждого интервала определяется равенством . Вычислим числа , по формуле . Заметим, что при этом , . Обозначим через количество выборочных значений, попавших в интервал (при рассматривается интервал ). Получим следующую таблицу, называемую интервальным рядом.
Должно выполняться условие . Из интервального ряда можно получить вариационный ряд, положив , . Графически интервальный ряд представляется с помощью гистограммы. Для построения гистограммы на оси абсцисс откладывают границы интервалов , , на оси ординат – частоты или относительные частоты , . Затем над каждым интервалом строят прямоугольник высота (или ) с данным основанием, . Полученная фигура называется гистограммой частот (или гистограммой относительных частот). Пример. Пусть имеется интервальный ряд
Здесь m =4+23+48+17+8=100. Гистограмма частот для данного интервального ряда выглядит следующим образом.
|