Оценка вероятности результатов исследования
Изучение любой проблемы, обычно, сопровождается необходимостью дать ответ на ряд вопросов для достоверности полученных результатов: 1. Всегда необходимо оценивать их достоверность? 2. Насколько достоверно распределение определенного признака в данной совокупности - или достоверен полученный показатель? 3. Отображает распределение определенного параметра в исследуемой группе аналогичного распределения параметра в генеральной совокупности (среди всех больных)? 4. Существенна ли разница между аналогичными показателями в разных группах (больных, населения и др.)?
Необходимость оценки достоверности полученных результатов определяется объемом информации. Она не проводится при непрерывном исследовании (для анализа отобраны все возможные единицы наблюдения), поскольку для всей генеральной совокупности можно получить только одно значение определенного показателя. Однако в системе медико-биологических исследований (кроме данных официальной статистики) редко пользуются непрерывным методом сбора информации - большая часть исследований бывает выборочной. При проведении выборочного исследования можно встретится с общими ошибками и ошибками выборки. Общие ошибки могут иметь систематический характер (методические, недочеты измерительной аппаратуры), так и случайный (ошибки исследователя). Ошибки выборочного наблюдения связаны с отбором его единиц. Это ошибки типичности, репрезентативности. В процессе анализа учитываемые показатели (средняя продолжительность лечения, частота осложнений, уровень летальности и др.) рассматривают как обобщающие величины. Если результат получен на основе достаточного по количеству и качеству однородного материала, то можно считать, что они достаточно точно характеризуют исследуемые явления. Например, при изучении эффективности нового метода лечения, апробированного на 400 больных, установлено, что у 12 из них возникли осложнения. Частота их составляет 3%. Значения обобщающего результата заключается в том, что при проведении аналогичных выборочных исследований, или для оценки всей совокупности больных с данной патологией (генеральной совокупности) мы могли бы предвидеть получение аналогичных данных. Однако не исключена ситуация, когда при проведении повторных исследований показатель, который был определенный путем выборочного наблюдения, в незначительной мере может отличаться от результата непрерывного наблюдения. Итак, оценить вероятность результатов выборочного исследования означает определить, в какой мере сделанные выводы (результаты) можно перенести на генеральную совокупность. То есть, часть явления принимать как явление в целом и основные присущие ему закономерности. Для оценки вероятности результатов любых выборочных исследований определяют среднюю ошибку относительной (mp) или средней величины (mx). Средняя ошибка для соответствующих показателей при значительном числе наблюдений (n> 30) можно быть рассчитана по следующим формулам:
- средняя ошибка средней величины;
- - средняя ошибка относительной величины. Где: σ - среднее квадратическое отклонение; n- число наблюдений в выборочной совокупности. При малом числе наблюдений (n< 30) в знаменателе вместо n используется n-1. P - относительный показатель; q- величина обратная для показателя, то есть вероятность того, что данное явление не будет зарегистрировано. Сумма двух противоположных вероятностей равна единице: (P+q)=1. Если показатель рассчитан на 100 (%), то
q = 1000 - P, если на 1000 (%о), то q = 1000 - P и т.д. Для приведенного выше примера средняя ошибка показателя получается:
0, 85 %
Средняя ошибка отображает размеры случайных колебаний показателя при выборочных исследованиях и зависит от числа наблюдений и качественных характеристик явления. Чем больше число наблюдений и чем однородней является отобранная для анализа группа, тем меньше границы достоверных колебаний показателя. Средняя ошибка позволяет определить доверительные границы, в которых с определенной достоверностью находится истинное значение показателя. Интервал, расположенный между ними, носит название доверительного интервала. Доверительные границы средней и относительной величины определяются по формуле:
1) ген и Рген - значения средних и относительных величин для генеральной совокупности; 2) выб и Р выб - значения средних и относительных величин, посчитанные для выборочной совокупности; 3) и - средние ошибки относительных показателей (ошибки репрезентативности); 4) t - критерий вероятности или доверительный критерий. Он может быть задан с разными степенями точности и зависит от достоверности безошибочного прогноза составляет t=2, t=3. Границы вероятности (доверительные границы) (P ±2 m) (при t=2) дают возможность определить границы колебания показателя с достоверностью 95, 5 % (р=0, 05), а доверительные границы (P ±3 m) (при t=3) дают возможность определить границы колебания показателя с достоверностью 99, 7 % (р=0, 01). Достоверность безошибочного прогноза и доверительный критерий определяют на этапе планирования статистического исследования. При заданных степенях достоверности доверительный критерий (t) имеет неизменную величину, а доверительный интервал зависит от величины средней ошибки (m), значение которой уменьшается при увеличении числа и качественного состава наблюдений. Для нашего примера, при использовании приведенного метода лечения частота осложнений для генеральной совокупности с вероятностью 95, 5 % (t=2) может находиться в границах: =3, 0±2 0, 85% - от 1, 3 % до 4, 7 %. С вероятностью 99, 7 % доверительный интервал составляет от 0, 45% до 5, 55%. Практическая ценность использования средней ошибки средней или относительной величины лежит не только в определенных доверительных границах достоверного показателя, однако и в оценки его сущности ()вероятности. Если она достаточно велика, мы может получить значения доверительного интервала в диапазоне, который не подлежит логичной оценке. Например, при использовании определенной методики кормления новорожденных прирост массы тела составил (800+300) грамм. Доверительный интервал безошибочного прогноза 99 % составляет от -100 до 1700 граммов. Итак, наглядность результата не позволяет в полной мере по данным показателям оценить степень влияния данной методики на прирост массы тела новорожденных. В указанной ситуации для увеличения вероятности оценки необходимо уменьшить доверительный интервал путем увеличения числа наблюдений и, соответственно, уменьшения средней ошибки показателя. Сущность (вероятность) показателя определяется на основе взаимоотношения между абсолютным его значением и средней ошибкой, которое должно быть не менее трех - P/mp≥ 3. В медико-биологических исследованиях часто возникают ситуации, когда при сравнении отдельных параметров необходимо оценить сущность разницы между ними. Существенная разница между отдельными показателями выборочного исследования свидетельствует о возможности перенесения полученных выводов на генеральную совокупность. Критерием оценки сущности разницы является коэффициент вероятности (критерий Стьюдента), которые определяются по формуле: - для средних величин;
- для относительных величин.
При большом числе наблюдений (n> 30) разница между показателями является существенной, если: 1) t≥ 2 (соответствует вероятности безошибочного прогноза 95, 5 %); 2) t> 3 (соответствует вероятности безошибочного прогноза 95, 5 %). При условии t< 2 степень вероятности безошибочного прогноза составляет менее 95 %, В этом случае мы не можем утверждать, что разница между показателями является существенной. Например, в школе № 1 учится 1200 детей. Профилактические прививки против гриппа проведено 900 ученикам. В следующем году заболело 350 детей, в том числе 150 из них была сделана прививка. Для того, чтоб сравнить и оценить сущность разницы между уровнями заболевания среди привитых детей, и тех, которым прививка не проводилась, необходимо: 1) определить уровни заболеваний в школе №1 среди первой (без прививок) и другой (с прививкой) групп. Они составляют, соответственно: P1 = 150: 300*100 = 50%. Р2 = (350-150): 900*100 = 22, 2%. 2) определить средние ошибки указанных показателей:
3) оценить существенную разницу по критерию Стьюдента:
Вывод: разница между показателями существенна, поскольку t> 3, что отвечает уровню безошибочного прогноза 99, 7 %. Часто при клинических или экспериментальных исследованиях приходится иметь дело с малым числом наблюдений (30 и меньше): 5-6 лабораторных животных, 10-12 больных и др. Если исследование правильно организовано, отобраны однородные группы, их можно рассматривать как выборочные с малым числом наблюдений. Однако при малом числе наблюдений (n< 30) оценка вероятности разницы между параметрами отдельных групп проводится на основе сравнения результата не с граничными значениями критерия Стьюдента, а с его табличными значениями для соответствующего числа наблюдений (n'=n1+n2-2). Если определенный t-критерий превышает табличное значение или равно ему - разница между показателями статистически доказана. Критерий вероятности (t) используют при паном сравнении исследуемых параметров. Однако при проведении статистического анализа иногда необходимо оценить вероятность разницы больше чем двух количеств показателей клинико-статистических групп. По-парное сравнение их не позволяет получить обобщающую оценку. В таком случае необходимо провести сравнение совокупности не только по обобщающим показателям, а и по характеру распределения признаков в исследуемых группах. В указанных ситуациях наиболее целесообразным является использование критерия соответствия - (критерий Пирсона), который определяется по формуле:
где p - реальные числа; p1 - теоретические частоты. В обобщенном виде практическое значение критерия соответствия состоит в следующем: · оценка вероятности разницы между несколькими сравниваемыми группами при нескольких возможных результатах с разной степенью достоверности (например, три или четыре группы больных с разными методами лечения и их последствиями - разной частотой осложнений); · определения наличия связи между двумя факторами (зависимость результатов лечения от возраста больных, тяжести заболевания, связи между отягощенностью патологии и состоянием их физического развития; · оценка идентичности распределения частот в двух и более совокупностях (аналогичность распределения больных по уровню клинических параметров при разных степенях тяжести патологии). Основой метода является определение существенной разницы (отклонений) фактических данных от теоретических (ожидаемых) данных. Расчет теоретических данных базируется на допущении, что в сравниваемых группах разница между исследуемыми факторами отсутствует. Такое допущение определяется как " нулевая гипотеза". На ее основе определяют " ожидаемые" результаты, и сравнивают их с фактическими данными. Если разница отсутствует, можно сделать вывод, что как " нулевая гипотеза" подтвердилась. При наличии отличий фактических данных от теоретического распределения определяют существенную разницу между сравниваемыми группами. Оценка результатов () проводится по специальной таблице. Существенной считается разница в том случае, когда величина рассчитанного коэффициента превышает табличное значение при вероятности не ниже 95 % (достоверность ошибки меньше 5 % - р < 0, 05). Методика расчета коэффициента соответствия рассмотрим на примере оценки влияния метода лечения на его результаты. Приведем фактические результаты по трем методам лечения (табл.1) Таблица 1
|