Теоретический материал
Рассмотрим генеральную совокупность объема N. Для изучения количественного признака из этой совокупности произведена выборка объема n. Выборочной средней называется среднее арифметическое значение признака выборочной совокупности. Если все значения признака выборки различны, то
Если же значения признака имеют соответственно частоты , где , то или . Модой Мо называется значение признака, имеющего наибольшую частоту. Для интервального ряда мода определяется по формуле: , где x0 и hi – нижняя граница и величина модального интервала (интервала, имеющего наибольшую частоту), nMo, nMo-1, nMo+1 – частоты модального, предмодального и постмодального интервалов. Медианой Ме называется значение признака, делящего изучаемую совокупность на две равные части. Половина элементов совокупности имеет значение признака меньшее, либо равное медиане, половина – большее, либо равное медиане. Для интервального ряда медиана определяется по формуле: , где x0 и hi – нижняя граница и величина медианного интервала (интервала, куммулятивная частота которого содержит половину единиц совокупности), nMe – частота медианного интервала, SMe-1 – кумулятивная частота предмедианного интервала. Размах вариации R – это разность между наибольшим и наименьшим значением признака . Выборочной дисперсией называется среднее арифметическое квадратов отклонений наблюдаемых значений признака Х от выборочной средней . Если все значения признака выборки различны, то . Если же значения признака имеют соответственно частоты , где , то или . Выборочным средним квадратическим отклонением называется квадратный корень из выборочной дисперсии . Коэффициент вариации характеризует относительную величину отклонения значений признака от среднего и определяется по формуле . Пример 5. Найти , , и вариационного ряда (таблица 3). Вычисления удобно оформить в следующую таблицу: Таблица 5.
.
Для расчета средних величин интервальный вариационный ряд преобразуют в дискретный, заменяя каждый интервал его средним значением. Оценки параметров генеральной совокупности. Пусть Х – изучаемый количественный признак генеральной совокупности. Как известно, исчерпывающую информацию о генеральной совокупности дает распределение вероятностей. Естественно, возникает задача оценки (приближенного нахождения) параметров, которыми определяется это распределение. Например, для нормального распределения таких параметров два – математическое ожидание и среднее квадратическое отклонение. Как правило, известны лишь выборочные данные из генеральной совокупности, например, значения изучаемого признака , полученные в результате n наблюдений. На их основании и делается вывод относительно всей генеральной совокупности. Точечные оценки. Точечной называют оценку, которая определяется одним числом. Пусть - статистическая оценка неизвестного параметра Q теоретического распределения. Для того, чтобы оценка была в определенном смысле наилучшей, к ней предъявляется ряд требований: - Состоятельность. Точечная оценка называется состоятельной, если при неограниченном увеличении объема выборки (n®¥) она стремится к истинному значению параметра Q. - Несмещенность. Оценка называется несмещенной, если она не содержит систематической ошибки, т.е. среднее значение оценки, определенное по многократно повторенной выборке объема n из одной и той же генеральной совокупности, стремится к истинному значению соответствующего генерального параметра. Другими словами, математическое ожидание М (Q*)=Q. - Эффективность. Эффективной называют статистическую оценку, которая (при заданном объеме выборки) имеет наименьшую возможную дисперсию D (Q*)= D min. Доказано, что наилучшей в указанном смысле оценкой математического ожидания является , т.е. М(Х)» В качестве оценки дисперсии признака Х в генеральной совокупности D(Х) берется исправленная выборочная дисперсия , где . , где - исправленное выборочное среднеквадратическое отклонение.
Интервальные оценки. При выборке малого объема точечная оценка неизвестного параметра может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом числе наблюдений следует пользоваться интервальными оценками. Интервальной называют оценку, определяемую двумя числами – концами интервала, которые находят по известной величине выборочной характеристики. Интервальные характеристики позволяют установить точность и надежность оценок. Пусть Q* оценка Q неизвестного параметра генеральной совокупности. Вероятности, признанные достаточными для того, чтобы уверенно судить о параметрах генеральной совокупности на основании выборочных характеристик называются доверительными. Надежностью (доверительной вероятностью) оценки Q по Q* называется вероятность g, с которой осуществляется неравенство: или , т.е. . Интервал , в котором с заданной доверительной вероятностью находится оцениваемый параметр генеральной совокупности называется доверительным интервалом,d - точность оценки. Обычно в качестве доверительных вероятностей выбирают значения 0.95, 0.99, 0.999. Интервал является доверительным интервалом, в котором с вероятностью g находится математическое ожидание нормально распределенного признака Х генеральной совокупности, если среднее квадратическое отклонение признака Х неизвестно. Интервал , если q <1 и , если q ³ 1, являются доверительными интервалами для среднего квадратического отклонения генеральной совокупности. Коэффициенты tg, q находятся по таблицам для заданной доверительной вероятности g и объема выборки n.
Вопросы для подготовки к выполнению и защите работы: 1. Дать понятие генеральной совокупности и выборки. 2. Перечислить задачи выборочного метода. 3. Записать формулы для вычисления и указать статистический смысл статистических показателей: – средняя арифметическая (невзвешенная, взвешенная); – мода; – медиана; – дисперсия (невзвешенная, взвешенная); – среднее квадратическое отклонение; – размах вариации; – коэффициент вариации; 4. Дать определение точечных оценки параметров генеральной совокупности. 5. Дать определение интервальных оценок параметров генеральной совокупности. 6. Описать метод нахождения доверительного интервала. 7. Указать смысл доверительной вероятности.
Задание к работе: По сгруппированным данным, полученным в практической работе №1: 1. Рассчитать выборочные характеристики: , , , , , , . 2. Дать точечные оценки параметров генеральной совокупности , , . 3. Дать интервальную оценку для (доверительную вероятность принять равной 0,95).
Пример выполнения практической работы № 2 в Excel:
|