Сравнение двух вероятностей биномиальных распределений
Пусть в двух генеральных совокупностях производятся независимые испытания; в результате каждого испытания событие А может появиться либо не появиться. Обозначим неизвестную вероятность появления события А в первой совокупности через рх, а во второй — через р2. Допустим, что в первой совокупности произведено п1 испытаний (извлечена выборка объема п t), причем событие А наблюдалось mt раз. Следовательно, относительная частота появления события в первой совокупности wx (Л) —тх1пх. Допустим, что во второй совокупности произведено п% испытаний (извлечена выборка объема nt), причем событие А наблюдалось тг раз. Следовательно, относительная частота появления события во второй совокупности ша (Л) = mjnt. Примем наблюдавшиеся относительные частоты в качестве оценок неизвестных вероятностей появления события A: ptc^w1, pt~wt. Требуется при заданном уровне значимости а проверить нулевую гипотезу, состоящую в том, что вероятности рг и р„ равны между собой: Но'.рг^р^р. Заметим, что, поскольку вероятности оцениваются по относительным частотам, рассматриваемую задачу можно сформулировать и так: требуется установить, значимо или незначимо различаются относительные частоты шх и wt. В качестве критерия проверки нулевой гипотезы примем случайную величину if MJrti—М2/П2 ~ V p(l-p)(l/n1+l/n2) * W Величина U при справедливости нулевой гипотезы распределена приближенно нормально о параметрами М (U) *=0ио (t/) = 1 (см. далее пояснение), В формуле (*) вероятность р неизвестна, поэтому заменим ее оценкой наибольшего правдоподобия (см. гл. XVI, § 21, пример 2); р*^{т1 + тг)/(п1 + пгу, кроме того, заменим случайные величины Мг и их возможными значениями т1 и т„, полученными в испытаниях. В итоге получим рабочую формулу для вычисления наблюдаемого значения критерия: и mjn-L—т2/пл = ■; / mt+ т2 / / 1 1 \ ' /ti + n* \ Я1 + и2 / \ rti я2 / Критическая область строится в зависимости от вида конкурирующей гипотезы так же, как в § 10, поэтому ограничимся формулировкой правил проверки нулевой гипотезы. Правило 1«Для того чтобы при заданном уровне значимости а проверить нулевую гипотезу Н0гр1 — р2=^р о равенстве вероятностей появления события в двух генеральных совокупностях (имеющих биномиальные распределения) при конкурирующей гипотезе Н1\р1Фр„, надо вычислить наблюдаемое значение критерия: тх!пх — тг/пг ^набл / mi +т2 Л т1 + т2\ /_1 j 1_\ П1~\~П2 \ я1 + я2/ \Я1 П2) и по таблице функции Лапласа найти критическую точку ыкр по равенству Ф(икр) = (1—а)/2. Если | £/„абл | < Икр—нет оснований отвергнуть нулевую гипотезу. Если |£/Иабя(>ыкр—нулевую гипотезу отвергают. Правило 2. При конкурирующей гипотезе Н1:р1 > Рг находят критическую точку правосторонней критической области по равенству Ф(ыкр) — (1—2а)/2. Если UBa6a < «кр—нет оснований отвергнуть нулевую гипотезу. Если ияа6я > «кр—нулевую гипотезу отвергают. Правило 3, При конкурирующей гипотезе Я1:р1<ра находят критическую точку икр по правилу 2, а затем полагают границу левосторонней критической области Икр =* Ицр, Если U »абл <—«кр — нулевую гипотезу отвергают. Пример. Из первой партии изделий извлечена выборка объема ni=IOOO изделий, причем mx = 20 изделий оказались бракованными; из второй партии извлечена выборка объема п = 900, причем т, = 30 изделий оказались бракованными. При уровне значимости а = 0,05 проверить нулевую гипотезу H0:pi — p2 — p о равенстве вероятностей лоявления брака в обеих партиях при конкурирующей гипотезе Нх' Pi Ф Рг- Решение. По условию, конкурирующая гипотеза имеет вид Pi Ф Рг. поэтому критическая область — двусторонняя. Найдем наблюдаемое значение критерия: и тх!пх — т2Щг -ж/~т\ ^ тг (j т\ Ч~ тг\ (_] г |_\ V tli -}- л2 \ п1 + п2) \ п1 па) Подставив данные задачи и выполнив вычисления, получим ^ найл = 1,81. Найдем критическую точку: Ф (“кр) = (1 — а)/2 = (1 — 0,05)/2 = 0,475. По таблице функции Лапласа (см. приложение 2) находим ыкр=1,96. Так как | ^навл | < «кр—нет оснований отвергнуть нулевую гипотезу. Другими словами, вероятности получения брака в обеих партиях различаются незначимо. Замечание. Для увеличения точности расчета вводят так называемую поправку на непрерывность, а именно вычисляют наблюдаемое значение критерия по формуле [mi/n1—]/2n1] — [m2/n2+l/2n2] набл —■' f wt+ т2 Л ОТц + стЛ /J, J_\ V «l + n2 \ + / \П1 П2) В рассмотренном примере по этой формуле получим |//набл| =1,96. Поскольку и ыкр=1,96, необходимо провести дополнительные испытания, причем целесообразно увеличить объем выборок. Пояснение. Случайные величины Мх и М2 распределены по биномиальному закону; при достаточно большом объеме выборок их можно считать приближенно нормальными (практически должно выполняться неравенство npq~>9), следовательно, и разность U' = Ml/n1 — М2/п2 распределена приближенно нормально. Для нормирования случайной величины W надо вычесть из нее математическое ожидание М (U') и разделить результат на среднее квадратическое отклонение a(U'). Покажем, что М (U') = 0. Действительно, А1 (Л1г) == = п1р1 (см. гл. VII, § 5, замечание); при справедливости нулевой гипотезы ( р1 = р2 = р ) М (Мг) = пхр и аналогично М (М г) = п2р. Следовательно, 1 1 Л = — niP — —n2p = 0. I* 1»*2 Покажем, что среднее квадратическое отклонение а (£/') = P)[(l/ni) + (l/«a)]. Действительно, дисперсия D (Afj) = n1pl (1—рг) (см. гл. VIII, § 6, замечание); при справедливости нулевой гипотезы (Pt = рг — р) D(Mt) = n1p(1 — р) и аналогично D (М2) = п2р (1—р). Следовательно, D (t/')= D [^—^1 =Л^(Л*1) + -тО(Л1|) = L Л1 Л2 J «1 П2 = -T«lP (1—Р)+Л«2Р(1“Р)=Р(1--Р) (—+—) ■; «1 «2 \ «1 л2 /
|