Теорема Байеса дает количественный способ вычисления апостериорной(после проведения опыта) вероятности с использованием априорной вероятности, а также чувствительности и специфичности теста. Теорема эта следует из определения условной вероятности и свойств вероятности (доказательство теоремы Байеса дано в приложении в конце главы).
Напомним, что условная вероятность – это вероятность события А при условии, что произойдет событие В (см. раздел 2). Мы же, вообще говоря, хотим знать вероятность того, что пациент болен (событие А) при условии, что результат теста положительный (событие В). Если обозначить присутствие болезни как D, отсутствие – как -D, нужный нам результат теста как R, то вероятность болезни будет обозначаться p[D], а вероятность болезни при условии положительного результата теста – как p[D|R].
Теорема Байеса гласит, что:
Мы можем переформулировать это общее уравнение для положительного результата теста (+), заменив p[D|R] на p[D|+], p[R|D] – на p[+|D], p[R|-D] – на p[+|-D], и p[-D] – на (1 - p[D]). Вспомнив (из пункта 3), что p[+|D] = TPR, а p[+|-D] = FPR, получаем:
Вспомнив, что p[D|+] и PV+ – одно и то же, и заменив p[D] на распространенность, получаем, что отсюда следует формула для PV+ из пункта 4.1.
Аналогично выводим теорему Байеса для отрицательного результата теста:
Пример 9. Теперь мы можем сосчитать вероятность болезни сердца у мистера Рубенстайна из примера 4 после получения положительных результатов ЭКГ при физической нагрузке. В конце раздела 2 мы, основываясь на распространенности болезни сердца среди пациентов с типичными симптомами и ее распространенности среди пациентов с семейной предрасположенностью, оценим априорную вероятность болезни в 0,95. Допустим, что TPR и FPR для ЭКГ при физической нагрузке равны 0,65 и 0,20 соответственно. Применяя формулу Байеса для положительных результатов теста, получаем:
Получается, что положительный результат теста повышает вероятность болезни с 0,95 до 0,98 – изменение довольно скромное. Причина этого – высокая априорная вероятность (0,95) и высокое значение FPR (0,20). Повторив вычисления для априорной вероятности, равной 0,75, получаем апостериорную вероятность 0,91; предположив, что FPR теста было равно 0,05 вместо 0,20, а априорная вероятность – снова 0,95, получаем p[D|+] = 0,996.
Теорема Байеса для отношений шансов
Хотя формула теоремы Байеса и проста, она неудобна для устного вычисления. Можно вывести более удобную форму теоремы Байеса, выразив вероятность через шансы и использовав другие меры характеристики теста.
Вероятность и шансы соотносятся формулами:
шансы = р / (1-р)
p = шансы / (1+шансы)
Другими словами, если вероятность дождя 0,75, то шансы равны 3:1.
Меры характеристики теста, которые мы обсудили раньше, можно скомбинировать и получить другой показатель – коэффициент правдоподобия), равный отношению вероятности результата для больного к вероятности результата для здорового.
Коэффициент правдоподобия может быть использован для характеристики полученных клинических данных (таких, как распухшая нога) или результатов теста. Мы опишем два коэффициента правдоподобия, один для положительных результатов теста (или наличия признака), другой – для отрицательных результатов (или отсутствия признака); они обозначаются соответственно LR+ и LR-.
LR+ – это отношение вероятности положительного результата для больного к вероятности положительного результата для здорового:
Если тест хорошо различает болезнь, TPR будет высоким, а FPR – низким, и LR+ будет много больше единицы. Коэффициент правдоподобия, равный единице, означает, что вероятность результата для больного и здорового одинакова, и тест не имеет смысла.
Подобным же образом, LR- равен отношению вероятности отрицательного результата для больного к вероятности отрицательного результата для здорового:
У хорошего теста FNR низко, а TNR – высоко, то есть LR- много меньше единицы.
Между шансами до и после теста существует простое соотношение:
Шансы после теста = (шансы до теста) x LR,
то есть:
Это теорема Байеса для отношений шансов [Некоторые авторы называют ее формой "шансы-правдоподобие” теоремы Байеса]. Она может быть напрямую получена из теоремы Байеса и определения условной вероятности, введенных нами ранее. Таким образом, для получения шансов после теста надо просто перемножить шансы перед тестом и соответствующий коэффициент правдоподобия.
Пример 10. Мы можем сосчитать апостериорную вероятность при положительном результате ЭКГ при физической нагрузке у 60-летнего мужчины, априорная вероятность у которого была равна 0,75. Шансы до теста были
Коэффициент правдоподобия теста равен
Шансы после теста, по теореме Байеса для отношений шансов, равны:
шансы после теста = 3 x 3,25 = 9,75: 1.
Выразим, наконец, вероятность через шансы: p = (шансы)/(1 - шансы) =Как и ожидалось, результат согласуется с полученным ранее
Теорема Байеса для отношений шансов дает возможность проводить вычисления быстро, так что можно вычислить вероятность, например, прямо у постели больного. Доступны вероятностные значения многих тестов Зная шансы до теста, шансы после него можно сосчитать в один прием.
Теорема Байеса обеспечивает средства для корректировки оценки вероятности (полученной до теста) с целью учета новой информации. Однако точность вычисления апостериорной вероятности ограничена точностью оцененной априорной вероятности. Точность же априорной оценки достигается с помощью правильного использования опубликованных значений распространенности, эвристических методов и правил клинических прогнозов, и обычно может быть сделана приемлемой. В анализе решений, как мы увидим, часто достаточно знать интервал априорной вероятности. Тем не менее, если ненадежна оценка априорной вероятности, теорема Байеса вряд ли будет иметь ценность.