Анализ одной выборки
Анализ однородности выборки. Одним из важных вопросов, возникающих при анализе выборки, является вопрос: относится та или иная варианта к данной статистической совокупности? Решение вопроса не представляет сложности, если распределение в этой совокупности является нормальным. Для этого достаточно использовать правило трех сигм. Согласно этому правилу, в пределах М ± 3s. находится 99,7% всех вариант. Поэтому, если варианта попадает в этот интервал, то она считается принадлежащей к данной совокупности. Если не попадает, то она может быть отброшена. Хотя этот метод и предполагает нормальность исходного распределения, на практике он успешно работает и может быть использован в большинстве других случаев. При числе элементов в выборке < 30 способ более точного определения границ доверительного интервала по формуле , (4.1) будет показан ниже в примере 4.1. В формуле (4.1) М — среднее значение, s — стандартное отклонение, ( — табличное значение распределения Стьюдента с числом степеней свободы и доверительной вероятностью р. Построение доверительных интервалов для среднего. Еще одной важной задачей, возникающей при анализе одной выборки, является сравнение выборочного среднего арифметического со средним значением генеральной совокупности. Эта задача решается с помощью статистических критериев. При этом выясняется, значимо ли отличие выборочного среднего значения от среднего значения генеральной совокупности, из которой предположительно взята выборка, или наблюдаемое различие является случайным. Действительно, средние значения, получаемые по выборочным данным, обычно не совпадают с генеральным средним (математическим ожиданием). В связи с этим возникает вопрос: можно ли по результатам выборочной оценки судить о свойствах всей генеральной совокупности? Поскольку каждую оценку, полученную в отдельной выборке, можно рассматривать как случайную величину, то при увеличении числа выборок распределение отдельных оценок будет принимать характер нормального распределения. Это значит, что в случае средних арифметических значения выборочных средних относительно генерального среднего распределяются по нормальному закону. То есть так же, как относительные отклонения нормально распределенных вариант от среднего арифметического выборки. Отсюда, в частности, следует, что 68,3% всех выборочных средних находятся в пределах , где — предельная ошибка выборки, М — среднее выборочное, — стандартное отклонение среднего значения. Иными словами, имеется вероятность 0,683, что выборочное среднее отличается от генерального не более, чем на ± . Здесь 0,683 — доверительная вероятность, 1 - 0,683 = 0,317 — уровень значимости a, — 68% доверительный интервал. Для принятой в большинстве исследований доверительной вероятности 0,95, доверительный интервал для средних при достаточно большом числе наблюдений ( > 30) примерно равен ±2 . При доверительной вероятности 0,997, доверительный интервал составит примерно ±3 . Для более точного определения границ доверительного интервала можно воспользоваться формулой , где М — среднее значение, s — стандартное отклонение, tn,p — табличное значение распределения Стьюдента с числом степеней свободы и доверительной вероятностью р, — количество элементов в выборке. В MS Excel для более точного вычисления границ доверительного интервала и при числе элементов в выборке < 30 можно воспользоваться функцией ДОВЕРИТ или процедурой Описательная статистика. Функция ДОВЕРИТ(алъфа; станд_откл; размер) определяет полуширину доверительного интервала и содержит следующие параметры: * Альфа — уровень значимости, используемый для вычисления доверительной вероятности. Доверительная вероятность равняется 100*(1 - альфа)% процентам, или, другими словами, альфа, равное 0,05, означает 95%-ный уровень доверительной вероятности; * Станд_откл — стандартное отклонение генеральной совокупности для интервала данных, предполагается известным; * Размер — это размер выборки. Пример 4.1. Найти границы 95%-ного доверительного интервала для среднего значения, если у 25 телефонных аккумуляторов среднее время разряда в режиме ожидания составило 140 часов, а стандартное отклонение — 2,5 часа.
|