Анализ данных
Клиническая и статистическая достоверность. Статистический анализ не может подтвердить или опровергнуть правоту экспериментальной гипотезы. Он только показывает вероятность того, что гипотеза верна. Если статистический анализ показывает, что вероятность того, что различия между группами были вызваны случайной вариацией, составляет менее 5% (р < 0,05), гипотеза считается верной (или, согласно процедуре, отрицательная форма гипотезы не верна). Существует много возможных источников ошибки в статистическом анализе. В клинических исследованиях наиболее вероятная ошибка возникает при применении статистики, основанной на нормальном распределении, к серии данных, которые не распределены согласно этой колоколовидной кривой. Неправильно примененная статистика дает неправильные значения вероятности, которые могут привести к неправильной интерпретации данных. Другими словами, плохая статистика приводит к плохим выводам. Трансформация данных до их статистического анализа (путем перевода каждой величины в логарифм) может сделать обычную статистику нормального распределения (параметрическую) более приемлемой. Однако многие исследования требуют статистики, не основанной на нормальном распределении (непараметрической). Ортодонтия — это отличный пример клинической области, в которой теоретическая и практическая базы значительно изменились за последние 25 лет. Тот же прогресс наблюдался и в статистике. Поэтому применение t-тестов для статистического анализа в клиническом исследовании равноценно использованию золотых коронок и дуг в лечении — не неправильно, но не самое лучшее, что можно сделать. Современный клиницист должен подозрительно относиться к результатам исследований, основанных на поверхностном статистическом анализе. К счастью, клинические журналы все чаще и чаще требуют от автора статьи адекватного статистического анализа. Однако к остальной неконтролируемой информации (например в Интернете) следует относиться с осторожностью. Важно помнить, что статистическая и клиническая значимость — это не одно и то же. Тесты на статистическую достоверность отвечают на вопросы типа: «Вероятно ли, что различия между этими группами случайны?» Клиническая достоверность спрашивает: «Имеет ли это значение для результата лечения?» Иногда исследования показывают статистически достоверные различия, которые не имеют никакой клинической значимости. Например, изучение размеров нижней челюсти после стимуляции роста и без лечения практически никогда не показывает различий в конечном размере челюсти (табл. 8-1). В некоторых публикациях различия статистически достоверны, в других — недостоверны. Вопрос в том, являются ли различия в I—2 мм при общем размере челюсти 12 см клинически значимыми (т.е. связаны ли они с лечением), а также что было бы, если бы они были таковыми. Ответ на вопрос «Можно ли стимулировать рост нижней челюсти?» должен быть основан на величине изменений, а также на данных статистического анализа. И ответ, скорее всего, будет следующим: «Если можно, то не намного». Таблица 8-1 Клиническое исследование Университета Северной Каролины, класс II: изменения входе I фазы (15 мес.)
Могут ли клинически значимые различия быть незамеченными при статистическом анализе? Конечно да, особенно если выборка небольшая и/или плохо подобранная. Однако если статистический анализ не подтверждает того, что заметил клиницист, скорее всего клиницист не прав. Человеку свойственно помнить необычное, а не обычное. Публикации о результатах лечения обычно фокусируются на очень хороших или очень плохих результатах, что заставляет врачей думать, что эти крайние формы встречаются чаще, чем на самом деле. Статистически достоверные данные, не имеющие клинической значимости, чаще встречаются в литературе, чем клинически значимые данные без статистической достоверности. Вариабельность результатов и презентация данных. Как описать то, что произошло с группой? Обычно это делается при помощи среднего значения (или медианы) и разброса в группе или стандартного отклонения. Обычно это выглядит так: «В среднем группа А показала статистически достоверные/недостоверные различия с группой В». Проблема описания данных такого типа может быть проиллюстрирована сравнением таблицы 8-1 и рисунка 8-2, которые представляют одни и те же данные, но производят (по крайней мере, для многих врачей) разное впечатление того, что происходит. Данные взяты из случайного клинического исследования по изучению раннего лечения аномалий окклюзии класса II, в котором были исключены дети с длинным и коротким типами лица (это важное исследование рассмотрено в главе 15). Многие врачи, анализируя таблицу, сделают вывод, что, как и ожидалось, с контрольной группой нелеченых детей ничего не произошло. Таблица показывает, что у пациентов, использовавших внеротовую тягу, наблюдалось некоторое уменьшение сагиттальной щели, но резцовое перекрытие не изменялось, в то время как при использовании функционального аппарата сагиттальная щель уменьшилась почти вдвое, а также произошло уменьшение резцового перекрытия. Таблица 8-2 Случайное клиническое исследование, класс Il Скелетные эффекты: угол ANB (стандартное отклонение)
Рис. 8-2. Этот график отражает данные клинического исследования Университета Северной Каролины, класс II. Средние значения для каждой группы представлены по линии, делящей каждый квадрат пополам. Размеры квадратов отражают 25-й и 75-й перцентиль группы, а линия показывает разброс. Этот график позволяет легче визуализировать вариабельность данных в группах, чем таблица (см. табл. 8-1). Обратите внимание, что хотя согласно среднему значению изменения в контрольной группе были близки к нулю, у некоторых детей наблюдалось увеличение сагиттальной щели, а у других - увеличение. Хотя уменьшение сагиттальной щели в обеих группах леченых было статистически достоверно по сравнению с контрольной группой, не все дети благоприятно реагировали на лечение.
Рисунок 8-2 подтверждает, что средние данные таблицы верны, однако он также четко показывает вариабельность в группах. Хотя стандартное отклонение и разброс также были представлены в таблице, они не так наглядны, как на рисунке. На рисунке видно, что в контрольной группе у многих детей наблюдалось уменьшение сагиттальной щели, но у многих наблюдалось и ее увеличение, поэтому среднее значение было близко к нулю. У некоторых пациентов, использовавших внеротовую тягу, наблюдалось значительное улучшение, в то время как другие не реагировали на лечение, а у некоторых ситуация даже ухудшилась. Также наблюдалась большая вариабельность в группе использовавших функциональные аппараты. Очень важно при оценке таких данных принимать во внимание не только средние значения, но и вариации, и особенно важно не считать, что среднее значение — это то, что Вы получите у каждого пациента. График, представленный на рисунке 8-2, помогает врачу видеть не только средние значения, но и вариации. Распознавание синдрома: чувствительность и специфичность диагностических данных. По определению синдром - это набор параметров, который формирует определенный стереотип. Многие синдромы аномалий развития были уже распознаны и продолжают выявляться в настоящее время. Выявление синдрома очень важно в клинических исследованиях, поскольку пациенты, которые могут быть сгруппированы по определенному стереотипу, более предсказуемы, чем те, которых не удается классифицировать на таком уровне. Например, Вы получите более точный ответ на вопрос «Как пациенты с синдромом Crouzon реагируют на использование внеротовой тяги?», чем на вопрос «Как пациенты с недоразвитием верхней челюсти реагируют на использование внеротовой тяги?», просто потому, что существует много видов недоразвития верхней челюсти, а синдром Crouzon только один. Клинический прогресс требует признания типов аномалий, независимо от того, называют их синдромами или нет. Мы уже отмечали важность использования в ортодонтической диагностике более расширенную, чем классификации Angle, классификацию. Одним из преимуществ классификации Ackerman—Proffit является то, что она разделяет пациентов на более гомогенные группы, которые более предсказуемы. С этой точки зрения важно учитывать два дополнительных научных термина, чувствительность и специфичность, которые относятся к диагностическим критериям и критериям оценки реакции на лечение. Чувствительность показывает способность данного критерия (например, угла ANB) дифференцировать степень выраженности или степень изменений (угол ANB: диагностически — степень выраженности соотношения челюстей по II классу, реакция на лечение — степень улучшения или ухудшения соотношения челюстей по II классу). Специфичность обозначает степень, до которой критерий отражает то, что он должен отражать независимо от других параметров (в случае с углом ANB — насколько хорошо он показывает сагиттальные взаимоотношения челюстей, не завися от вертикального положения челюстей, протрузии или ретрузии резцов и других факторов). Очень чувствительный параметр всегда положителен при наличии условия. Специфичность иногда особенно отражает, насколько хорошо критерий может отделить норму от аномалии (для угла ANB это способность отличить скелетный класс II от нормального соотношения челюстей). Очень специфичный параметр всегда отрицателен при отсутствии условия. Почему эти определения так важны? Мы знаем, что угол ANB чувствителен для определения изменений в сагиттальном соотношении челюстей (т.е. даже небольшие изменения в сагиттальном положении одной или другой челюсти вызовут измеримые изменения угла). Его специфичность не так высока, поскольку угол изменяется при изменении высоты лица, даже если при этом положение челюстей по сагиттали остается прежним. Он также изменяется при перемещении резцов орально или вестибулярно как следствие костного ремоделирования и изменения положение точек А и В. Можете ли Вы принимать изменения угла ANB как показатель скелетных изменений у пациентов с аномалией окклюзии класса II, проходящих альтернативные виды лечения? Только если Вы уверены, что не было больших изменений в высоте лица и положении корней резцов. Понятно, что такие рассуждения должны проводиться применительно к любому параметру в любом клиническом исследовании. Чем выше чувствительность и специфичность используемых параметров, тем легче интерпретировать результаты, и наоборот. Однако ни один из критериев не может быть достаточно чувствительным и специфичным, чтобы показать все, что вы хотите. Компьютерные записи и возможность мета-анализа. Клинические данные в форме записей о результатах лечения имеются не только в университетах и других подобных учреждениях, но и в каждой частной клинике. Трудностью клинических исследований всегда является сбор достаточного объема информации о достаточном количестве пациентов. Распространенность использования компьютера для хранения информации, а также все растущая тенденция заносить в компьютер диагностические данные каждого пациента и результаты его лечения позволяют расширить горизонты клинических исследований до еще недавно не вообразимой степени. Большинство исследователей сталкивались с двумя основными проблемами в ходе сбора необходимой информации: 1) переносить в электронный вид информацию с рукописных анкет и форм, вручную анализировать рентгенограммы и гипсовые модели челюстей было очень сложно и занимало много времени; 2) у большинства врачей не было четкого руководства, как это делать. Компьютеризация имеет потенциал к решению этих проблем. Если вся информация заносится не в бумажные анкеты, а в компьютер, стандартным образом (что обеспечивается программным обеспечением компьютера), если рентгенограммы и гипсовые модели сканируются и анализируются компьютером (что все чаще и чаще применяется в каждой клинике), информация становится легкодоступной и ее не нужно больше выискивать в картах и анкетах. Одной из основных проблем при наборе пациентов является его селективная природа. Нередко основной причиной, почему некоторые пациенты не включаются в исследование, является то, что включить всех пациентов, которые прошли то или иное лечение, очень трудоемко. С использованием компьютерного ввода данных эта проблема исчезает. Кроме того, стандартным протоколом сбора информации также можно сделать компьютер, на который информация будет присылаться из частных клиник. Передавать и обновлять данные также можно через Интернет, что уже используется в некоторых исследованиях в медицине. Такой оперативный сбор информации со многих частных клиник позволит собрать достаточный объем информации, необходимый для ответа на многие важные клинические вопросы. Доступность информации при этом стимулирует начало новых и новых исследований. Еще одним способом оценки эффективности лечения является объединение результатов нескольких исследований, посвященных одному и тому же феномену. Это относится к современному методу мета-анализа, который позволяет проводить статистическую обработку большого количества различных исследований1. В ортодонтии по одной и той же проблеме проводится большое количество маленьких разрозненных исследований, нередко с совершенно разными протоколами, что делает их сравнение чрезвычайно сложным. Мета-анализ не заменяет необходимости стандартизации протоколов дальнейших исследований, но позволяет уменьшить неопределенность по многим важным клиническим вопросам. Эра ортодонтии, основанной на мнениях и суждениях, прошла. В будущем она будет опираться на данные проведенных исследований. В настоящее время клинические решения должны приниматься на основании доступной информации. Однако когда по чьему-то настоянию появляется новый метод лечения и серия сообщений подтверждает его эффективность, важно помнить, что «работам, выполненным с большим энтузиазмом, недостает контроля, а хорошо контролируемым работам недостает энтузиазма». Уменьшение неопределенности в планировании лечения Даже при наличии данных клинических исследований очень сложно предсказать, как тот или иной пациент будет реагировать на планируемое лечение. Реакция на лечение очень вариабельна. В ортодонтии такая вариабельность определяется в основном двумя факторами: типом роста и эффектом лечения на проявление роста. В настоящее время реакция на лечение у нерастуших пациентов вполне предсказуема, рост — нет.
|