Оценить достоверность результатов выборочного исследования. означает определить, с какой вероятностью можно перенести сделанные для него выводы (результаты изучения признаков) с выборочной совокупности на всю
Актуальность темы.
Непараметрические методы оценки и анализа статистического гипотеза необходимы в практической деятельности врачей, связанных c аналитической работой, внедрением новых методов лечения в организации лечебного процесса, для оценки достоверности исследований, для определения степени необходимости использования новых форм.
означает определить, с какой вероятностью можно перенести сделанные для него выводы (результаты изучения признаков) с выборочной совокупности на всю генеральную совокупность (т.е., по части явления судить о явлении в целом, о его закономерностях). При проведении выборочного|избирательного| исследования мы можем| сталкиваться с общими погрешностями и погрешностями выборки. Общие погрешности (ошибки) могут иметь как систематический|систематичный| характер| (методические, недостатки|недостаток| измерительной аппаратуры), так и случайный (ошибки|ошибка| исследователя). Погрешности выборочного наблюдения связаны|повязал| с отбором его единиц. Это погрешности типичности, репрезентативности. В процессе анализа рассчитанные показатели рассматривают как обобщающие величины|. Если результаты получены на основе достаточного по количеству и качественно однородного материала, то можно считать, что они достаточно точно характеризуют исследуемые явления.
Нулевая и альтернативная гипотезы Проверка гипотезы имеет огромное значение в медицинских исследованиях, потому что позволяет исследователю делать обобщения о генеральной совокупности на основе вероятностей из результатов выборочного исследования. Цель исследователя – доказать, что данные наблюдения, полученные при исследовании статистически значимы. Проверка гипотезы подтверждает (или опровергает) утверждение, что данные наблюдения не возникли случайно, а отражают подлинную связь между зависимыми и независимыми событиями. Нулевая гипотеза (Но) утверждает, что нет разницы между попавшими и не попавшими под воздействие факторов (риска) субъектами в отношении риска развития события (заболевания и т.п.). Наблюдаемая разница является случайной. Альтернативная гипотеза (НА) утверждает, что есть разница между попавшими и не попавшими под воздействие факторов (риска) субъектов в отношении риска развития события (заболевания и т.п.). Наблюдаемая разница не является случайной. Если данные исследования статистически значимы и нулевая гипотеза не получила подтверждения, она может быть отвергнута и принимается альтернативная.
Ошибки первого и второго типа Правдивость Но правдива Но ложна
Но правдива = статистически не значима Но ложна = статистически значима Допускание Но = статистически не значимо Отвергание Но = статистически значимо Ошибки I типа (α – альфа) Если Но правдива в действительности и, полученные в ходе исследования данные статистически не значимы, правильное решение – принять нулевую гипотезу. С другой стороны: если Но правдива, а полученные данные статистически значимы, решение отвергнуть Но будет не верным и будет сделана ошибка. Ее называют ошибкой I типа (альфа). Т.о., ошибка I типа отвергает Но, когда последняя верна. Ошибки II типа (β – бета) Если в действительности Но ложна и полученные данные статистически значимы, правильным будет отвергнуть Но. С другой стороны, если Но ложна и полученные данные статистически не значимы, решение принять Но будет неправильным и будет сделана ошибка. Это ошибка II типа (бета). Т.о., ошибка II типа принимает Но, когда последняя ложна. Для оценки достоверности результатов выборочных исследований определяют: 1) среднюю ошибку относительной (mр) или средней величины (mх). Средняя ошибка отображает размеры случайных колебаний показателя при выборочных исследованиях и зависит от числа наблюдений и качественных характеристик явления. Средняя ошибка при (n > 30) рассчитывается по формулам: mx= - средняя ошибка средней величины; mр= - средняя ошибка относительной величины; – среднее квадратичное отклонение; n – число наблюдений в выборочной совокупности; P – относительный показатель; q – величина обратная показателю, т.е. вероятность того, что данное явление не будет зарегистрировано. Сумма двух противоположных вероятностей равняется единице: Р + q = 1. Если показатель рассчитан на 100 (%), тогда: q = 100 — Р, если на 1000 (%о), то q = 1000 - Р и так далее. При п < 30 в знаменателе| вместо n используется n - 1|.
2) Доверительные границы|граница| для средних и относительных величин определяют формулами:
Pген=Pвыб t *mp, где:
· и Pген - значение средних и относительных величин, рассчитанных для генеральной совокупности; · и Pвыб – значение средних и относительных величин, рассчитанных для выборочной совокупности; · mx и mp – средние ошибки соответствующих показателей; · t – критерий достоверности или доверительный коэффициент. Он может быть задан с разными степенями точности и в зависимости| от вероятности безошибочного прогноза составлять t = 2 и t = 3.
Средняя ошибка позволяет определить доверительные пределы, в которых с определенной вероятностью находится истинное значение показателя. Интервал, размещенный между ними, называется доверительный интервал (t˟m). Границы |граница| достоверности (доверительные границы|граница|):
· Р ± 2m| (при t = 2) дают возможность определить пределы|границу| колебания показателя с вероятностью 95,5 % (р = 0,05); (t = 2 является округленным результатом. Точное значение t = 1,96); · Р ±3m| (при t = 3) дают возможность определить пределы|границу| колебания показателя с вероятностью 99,7 % (р = 0,01). Не менее важным, чем знание сути параметрического критерия достоверности t, есть осознание значения риска погрешности Р, которое нуждается в понимании логики проверки статистической гипотезы. Р – это вероятность достоверности нулевой гипотезы или вероятность погрешности, а именно погрешности первого типа – ошибочное утверждение существования расхождений, которых в действительности нет. Вероятность безошибочного прогноза (p) и доверительный критерий (t) определяют на этапе планирования статистического исследования. При заданных степенях вероятности доверительный критерий (t) имеет неизменную|неизменяемую| величину, а доверительный интервал (tm) зависит от величины средней ошибки (m), значение которой|какой| уменьшается при увеличении числа и качественного состава наблюдений.
В медико-биологических исследованиях часто возникают ситуации, когда при сравнении отдельных параметров необходимо оценить существенность (достоверность) разницы между ними. Существенная разница между отдельными показателями выборочного исследования свидетельствует о возможности перенесения полученных выводов на генеральную совокупность. Параметрическим критерием оценки существенности разности является коэффициент достоверности (критерий Госсета (Стьюдента): для средних величин;
для относительных величин
При |n > 30 разность |разность| между показателями является существенной, если: 1) t > 2 (отвечает достоверности безошибочного прогноза 95,5 %); 2) t > 3 (отвечает достоверности безошибочного прогноза 99,7 %).
При условии t<2| степень достоверности безошибочного прогноза составляет менее|меньше| 95 %. В этом случае мы не можем утверждать, что разница|разность| между показателями является существенной.
Часто при клинических или экспериментальных исследованиях приходится иметь дело с малыми наблюдениями (если исследование правильно организовано, отобраны однородные группы, которые можно использовать, как выборочные с малым числом наблюдений). Но при n<30 оценка достоверности разницы между параметрами отдельных групп проводится на основе сравнения результата не с предельными значениями критерия Госсета (Стьюдента), а с его табличными значениями для соответствующего числа степеней свободы (n`= n1+ n2 - 2). Если определенный t-критерий превышает табличное значение— разница между показателями становится статистически доказана. Критерий достоверности (t) используют при попарном| сравнении исследуемых параметров. Однако при проведении статистического анализа иногда необходимо оценить|оценивать| достоверность разницы|разности| более двух показателей клинико-статистических| групп. Их попарное сравнение не позволяет получить обобщающую оценку. Другими словами, необходимо провести сравнение совокупности| не только по обобщающим показателям, но и по характеру распределения|деления| признаков в исследуемых группах. Для данной цели используют другие критерии.
|