Распределение Стъюдента
При отсутствии грубых и систематических ошибок математическое ожидание случайной величины совпадает с истинным результатом наблюдений. Легче всего оценить математическое ожидание при известной дисперсии генеральной совокупности. Однако значение σ2 нельзя получить из наблюдений, ее можно только оценить при помощи выборочной дисперсии s2. Ошибка от этой замены будет тем меньше, чем больше объем выборки n. На практике эту погрешность не учитывают при n ≤ 50 и в формуле (4.7) для доверительного интервала генеральный параметр σ заменяют выборочным стандартом. В дальнейшем примем, что наблюдаемая случайная величина имеет нормальное распределение. При небольших объемах выборок для построения доверительного интервала математического ожидания используют распределение Стьюдента, или
с плотностью вероятности где Г(f) — гамма-функция Эйлера:
f — число степеней свободы выборки. Если дисперсия s2 и среднее x определяются по одной и той же выборке, то f = n – 1. Распределение Стъюдента зависит только от числа степеней свободы f, с которым определена выборочная дисперсия. На рис. 14 приведены графики плотности t-распределения для нескольких чисел свободы f и нормальная кривая. Рис. 14. Плотность распределения Стъюдента. Кривые t-распределения по своей форме напоминают нормальную кривую, но при малых f они медленнее сближаются с осью абсцисс при t →∞. При f →∞ s2 →σ2, поэтому распределение Стъюдента сближается (в пределе соответствует) с нормальным распределением. Вероятность того, что случайная величина попадет в интервал (tp/2; t1-p/2), определяется выражением P(t p/2 ≤ t ≤ t1− p/2) =1− p = β. (4.14) Распределение Стъюдента симметрично относительно нуля, поэтому t p/2 = −t1- p/2. (4.15) Учитывая симметрию t-распределения, часто пользуются обозначением tp(f), где f — число степеней свободы, р — уровень значимости, т. е. вероятность того, что t находится за пределами интервала (tp/2; t1-p/2). Подставляя в (4.14) выражение для t (4.11) с учетом (4.15), получаем неравенство
и после преобразований имеем
Значения квантилей t1-p/2 для различных чисел степеней свободы f и уровней значимости р приведены в приложении 3. Выражение (4.17) означает, что интервал с доверительными границами (x − s (x) t1− p/2) ÷ (x + s (x) t1− p/2) (4.18) накрывает с вероятностью β генеральное среднее измеряемой величины. Величина доверительного интервала (4.18) определяет надежность среднего выборки. Величину
т. е. половину доверительного интервала, называют случайной ошибкой. С учетом только случайной ошибки результат измерений некоторой величины следует записывать так:
|