С помощью центральной статистики
Общий прием, с помощью которого можно построить доверительный интервал, состоит в следующем. Пусть модель F абсолютно непрерывна и существует случайная величина. G(;q), зависящая от q такая что: 1) распределение с.в. G(;q) не зависит от q, 2) при каждом Î функция G(;q) непрерывна и строго монотонна по q. Такую случайную величину называют центральной статистикой (для q). Будем рассматривать только случай скалярного параметра q. Пусть для модели F построена центральная статистика G(;q) и fG(g) ее плотность распределения. Функция fG(g) от параметра q не зависит (условие 1), поэтому для любого gÎ(0,1) можно выбрать величины g1<g2 (многими способами) так, чтобы Pq(g1<G(;q)<g2)= =g. (.2) Определим теперь при каждом Î числа Ti(), i=1,2, где T1()<T2(), как решения относительно q уравнений G(;q)= g k, k=1,2 (3) (однозначность определения этих чисел обеспечивается условием 2, наложенным на функцию G(;q)). Тогда неравенства g1<G(;q)<g2 эквивалентны неравенствам T1()<q<T2() (Рис. 5.1). Следовательно, формулу (2) можно переписать в виде Pq(T1()<q<T2())=g, "q. Таким образом, построенный интервал (T1(),T2()) является g - доверительным для q.
В конкретных задачах при построении центральной статистики для оцениваемой характеристики приходится учитывать специфику рассматриваемой модели. Однако, можно выделить класс моделей, для которых центральная статистика всегда существует и имеет простой вид. Именно: если функция распределения F(x,q) непрерывна и монотонна по параметру q, то можно положить (4) Действительно, непрерывность и монотонность по q здесь очевидны, а так как L q(F(Xi;q))=R(0,1) при любом q, то распределение G(;q) не зависит от q. Из L (h)=R(0,1) следует, что L (-ln h)=Г(1,1). Таким образом, слагаемые в (4) независимы и каждое из них имеет распределение Г(1,1). Используя свойства гамма-распределения, окончательно получаем, что плотность распределения Г(1,n), т.е. , g>0. Отсюда и из формулы (2) получаем следующий метод построения доверительного интервала для q: при заданном g выбираем числа g1<g2 так, чтобы Решая уравнения , (5) находим корни T1()<T2(). Тогда (T1(),T2()) - искомый доверительный интервал для q. Наибольшая трудность в применении этой модели к конкретным задачам возникает при нахождении решений уравнений (5).
Вопрос Доверительный интервал для среднего
Пусть по выборке =(Х1,....,Xn) требуется построить доверительный интервал для неизвестного среднего q.в нормальной модели N(q,.s2). Известно, что в соответствии с теоремой Фишера L q =N(0,1). Следовательно, в данном случае центральная статистика G(,q)= . Решения уравнений (3) имеют вид , поэтому g-доверительным для q. является любой интервал , (6) где g1<g2 - любые числа, удовлетворяются условию Ф(g1) - Ф(g2)=g. (7) Отметим, что хотя интервал Dg() случаен, его длина постоянна и равна Lg(g1,g2) = , поэтому, чтобы среди всех интервалов вида (6) выбрать кратчайший, надо минимизировать функцию Lg(g1,g2) при условии (7). Применяя метод Лагранжа нахождения условного экстремума, получаем следующую систему уравнений где l - множитель Лагранжа; . Отсюда находим, что j(g1)=j(g2). Так как функция j(x) - чётная, то g1=g2. Учитывая это, а также последнее уравнение и соотношение Ф(-х)=1-Ф(х), получаем равенство Ф(g2)=(1+g)/2. Из него находим, что g2=Ug=Ф-1((1+g)/2), где (1+g)/2 - квантиль стандартного нормального распределения N(0,1) Итак, оптимальным [среди интервалов Dg()] g-доверительным интервалом для параметра q. в модели N(q.,s2) является интервал , (8) т.е. симметричный относительно случайной точки интервал длины , – квантиль стандартного нормального распределения порядка (1+g)/2.
Вопрос Доверительный интервал для дисперсии
Построим доверительный интервал для неизвестной дисперсии q2 в модели N(m, q2). Легко найти центральную статистику для t=t(q)=q2: . Действительно, так как L q =N(0,1), то L q (1) - стандартное c2- распределение. Следовательно, L q (G (; t)) = c2(n). Здесь , - решения (относительно t) уравнений G(;t)=g1,g2. Следовательно g-доверительным для t=q2 является в данном случае любой интервал.
Dg()= , (5.9) где g1<g2 находят из условия [ - плотность распределения хи-квадрат]. Как правило, g1 и g2 надо выбирать так, чтобы выполнялись равенства , , (5.10) т.е. ; , где – р - квантиль распределения c2(n). В этом случае соответствующий доверительный интервал называют иногда центральным. Соотношения (5.9), (5.10) определяют правила доверительного оценивания неизвестной дисперсии в модели N(m, q2). Задача отыскания наикратчайшего интервала среди интервалов вида (5.9) сводится к минимизации отношения g2/g1 при условии или, если положить ; (где a1+a2=1-g) к уравнению: . (5.11) Значения a1 и a2, удовлетворяющие (5.11), определяют оптимальный g-доверительный интервал вида (5.9) . (5.9’) Таким образом, центральный интервал в данном случае не является наикратчайшем. Нужно заметить, что центральной статистикой для оценивания среднеквадратичного отклонения q2 является, очевидно .
Вопрос Доверительные интервалы для среднего и дисперсии
Рассмотрим доверительное оценивание параметров в общей нормальной модели N(; ). Из теоремы Фишера следует, что центральная статистика для оценивания дисперсии . Здесь - выборочная дисперсия. Доверительный интервал для находим по схеме предыдущего параграфа. Окончательно получаем: центральным g – доверительным интервалом для является интервал . В частности, для выборки объёма n=10 и доверительной вероятности g =0.9 имеем =3.3251; =16.919. Поэтому центральный 0.9 - доверительный интервал для имеет вид (0.5911 , 3.007 ). Наикратчайший в данном случае интервал , a1+a2=1-g, (5.12) где и определяются соотношением (5.11), в котором n заменено на (n-1). В силу теоремы 4.2 центральной статистикой для оценивания среднего q1 является , где - выборочное среднее, - выборочное среднеквадратичное отклонение, причём распределение этой статистики (распределение Стьюдента S(n-1)) симметрично относительно своей средней точки. Расчёт доверительного интервала проводится также как и в параграфе 5.3. Окончательно получаем: g - доверительным для q1 является интервал , , (5.13) где tg,n-1 - (1+g)/2 - квантиль распределения S(n-1). Построенный интервал имеет минимальную длину среди всех g-доверительных интервалов вида , Например, t0,95;9=2.262, поэтому для выборки объёма n=10 и доверительной вероятности g=0.55 интервал (5.13) имеет вид , . Итак, получены формулы доверительных интервалов для параметров нормально распределённой генеральной совокупности. Эти формулы представлены в таблице.
Вопрос
|