Типы данных биомедицинских исследований и их характеристики
Всю совокупность данных МБИ и, как следствие, методов; их автоматизированного анализа можно разделить на; большие группы: детерминированные и статистические. Детерминированные данные имеют место в тех случаях, когда известен вид функциональной зависимости, связывающей значения исследуемых клинико-биохимических показателей. Лишь в сравнительно немногих случаях, да и то в виде первого приближения, можно считать, что реальная зависимость, связывающая некоторые исследуемые показатели биологического объекта, носит детерминированный характер. Причем, если вид функциональной зависимости определен полностью, то с информационной точки зрения он не представляет интереса для исследователя и не может выступать в качестве объекта автоматизированного анализа, так как не несет никакой новой информации. Поэтому практически речь идет о задачах, когда вид функциональной зависимости известен с точностью до некоторой совокупности параметров, получение оценок которых и является предметом анализа. В абсолютном большинстве случаев оказывается, что анализируемые показатели являются недетерминированными, статистическими. Именно такая природа данных представляет наибольший интерес и наибольшую сложность с точки зрения методов анализа, целью которых в этом случае является выявление некоторых объективных закономерностей, отражающих связь исследуемых показателей для принятия дальнейших решений. Существует большое число различных классификаций статистических данных. Представляется целесообразным выделить те из них, которые встречаются в МБИ или полезны как удобная математическая модель, достаточно адекватная исследуемому процессу. Причем, поскольку в дальнейших разделах мы более подробно остановимся на статистических моделях данных медико-биологических исследований, сейчас ограничимся лишь кратким их перечислением. По своей физической природе статистические данные могут представлять собой: 1) случайные величины X, принимающие в каждом новом опыте, проводимом в неизменных условиях, новое значение (где -номер опыта), причем заранее неизвестно какое. Случайные величины бывают скалярными и векторными. Несколько скалярных случайных величин рассматриваемых совместно, образуют векторную случайную величину размерности т. В свою очередь, скалярные и векторные случайные величины могут быть дискретными и непрерывными. Непрерывной называется случайная величина, возможные значения которой непрерывно заполняют некоторый интервал на числовой оси. Дискретной называется случайная величина, которая может принимать только конечное, счетное число возможных значений. Примерами непрерывных случайных величин могут служить данные биохимического исследования, например, концентрации ферментов, аминокислот или органических кислот в биологическом материале пациентов, которые могут принимать любые случайные значения на действительной оси. Примером дискретных случайных данных медико-биологических исследований могут служить результаты клинического обследования пациента, заключающиеся в выявлении определенной совокупности клинических симптомов и признаков, регистрируемых по принципу "есть"- "нет ". То есть факт наличия/отсутствия каждого из клинических признаков может интерпретироваться с точки зрения последующего анализа как случайная величина, способная принимать два дискретных значения: 1 — если признак регистрируется в процессе обследования, и 0 - в противном случае. Существенный объем данных МБИ представляют результаты субъективной регистрации степени проявления некоторых показателей состояния биологического объекта, количественно выражаемые тестовыми баллами (типичный пример - результаты врачебного осмотра по выявлению степени проявления тех или иных клинических симптомов). Особенностью анализа такой группы данных (случайных по своей природе) является то, что для них предпосылки классических статистических методов (например, предположения о каком-либо конкретном, чаще всего нормальном законе распределения) не выполняются. Единственной надежной основой для выводов в такой ситуации являются соотношения между значениями исследуемого показателя на уровне "больше - меньше". Для анализа таких данных используется переход от их числовых значений к рангам, представляющим номер, который занимает то или иное значение в упорядоченной по какому-либо правилу совокупности измерений; 2) случайные функции. Если некоторая случайная переменная X зависит от скалярного аргумента t и при каждом фиксированном значении последнего является случайной величиной, то переменная X(t) называется случайной функцией. Примерами случайных функций, регистрируемых в процессе медико-биологических исследований, могут служить зависимости основных антропометрических показателей (рост, вес, окружность головы) от возраста; 3) случайные поля. При анализе результатов МБИ возникает необходимость анализа показателей, значения которых изменяются случайным образом в зависимости от координат рассматриваемой точки в пространстве и времени. Случайные факторы, аргументом которых являются векторы, называются случайными полями. Причем, если компоненты вектора представлены только координатами пространства, то такое случайное поле называется пространственным. Если же в состав аргументов случайного поля входит также и время, то такое случайное поле называется пространственно-временным. Примером случайного поля в процессе обработки и анализа данных МБИ может служить обработка рентгенорадиологических изображений, задаваемых случайными значениями интенсивности видеосигнала R(x,y) в определенной точке изображения с координатами (х,у).
4. Медико-биологические данные и их классификация. Медико-биологические данные, касающиеся здоровых людей и больных, могут быть систематизированы в следующие группы: 1. 2. Качественные данные - признаки; они не поддаются точной оценке, хотя и могут быть ранжированы (т.е. систематизированы по условным баллам: один балл, два балла и т.д.). К таким данным относятся, например, цвет кожных покровов, наличие болей, качество жизни человека и др. Качественные признаки, которые могут быть отнесены только к двум категориям (их наличию или отсутствию), называются дихотомическими. 3. Статические картины органов человека или всего его тела; они отображают картину пациента человека, различных участков патологически измененных тканей, чаще всего с помощью средств лучевой диагностики - рентгенологической, радионуклидной, ультразвуковой, магнитно-резонансной; например, патологические изменения на рентгенограмме грудной клетки, сонограмме, изображение головного мозга на компьютерной томограмме. К статическим картинам относят фотографии макропрепаратов и гистологических срезов, эндоскопические изображения. 4. Динамические картины органов человека; они получаются при непрерывной регистрации (на мониторе или жестком диске компьютера) движущихся органов, например, сердца, легких, при изучении быстроменяющихся картин прохождения по организму рентгеноконтрастных или радионуклидных веществ (при рентгенологическом исследовании пищеварительного тракта, радионуклидном исследовании сердца). 5. Динамические данные физиологических функций: электрокардиограмма, электроэнцефалограмма, кривые, зарегистрированные при прохождении радиоактивного вещества по организму и др.
5. Шкалы измерения.
При подготовке медико-биологических данных для их последующей обработки, в том числе компьютерной, нередко возникает необходимость применения различных шкал измерения. Существует несколько таких шкал. Шкала наименований - это группировка объектов и их производных в ряд непересекающихся классов. При этом считается, что все объекты, принадлежащие к одному классу, являются идентичными, а к разным классам - различными. К шкале наименований относятся симптомы и синдромы заболеваний. Так, к шкале наименования относится, например, классификация патологических затемнений легочных полей на рентгенограмме грудной клетки: они могут быть округлыми, треугольными, иметь очаговый или тотальный характер. Цвет кожных покровов может иметь обычную, желтушную, красную или синюшную окраску. Шкала наименования представляет собою наиболее простое деление свойств объектов. Шкала порядка - это упорядоченная шкала наименований, на которой отражена, в основном, тенденция процесса. На такой шкале признаки объектов представлены в восходящем либо в нисходящем значении. На такой шкале, например, можно расположить в возрастающем порядке концентрацию гормонов в крови у больных с тиреотоксикозом, степень желтушности кожных покровов, скорость оседания эритроцитов крови. Интервальная шкала - это шкала с наличием единицы измерения. Примером такой шкалы является шкала температур термометра, в котором единицей измерения является один градус (или его доля). Шкала отношений - это интервальная шкала с нулевой точкой, т.е. имеющей такую точку, в которой данный параметр практически отсутствует. Примерами такой шкалы являются измерительная линейка, ростомер, весы.
6. Типовые функции и структуры компьютерных систем сбора и обработки данных биомедицинских исследований
Ниже, на рис. 1.2, приведена типовая структура биотехнической системы автоматизации МБИ, основу которой составляют компьютерные средства обработки и анализа данных.
7. Основные этапы научного исследования.
Удобство такого представления заключается в том, что данная схема позволяет рассматривать медико-биологическое экспериментальное исследование в виде биотехнической системы, представляющей собой комплекс элементов, взаимодействующих в интересах решения задач эксперимента. К ним относятся: 1. Программы проведения эксперимента. 2. Исследуемый биологический объект. 3. Технические средства (оборудование), обеспечивающие получение измерительной информации. 4. Вычислительные средства, обеспечивающие автоматизированную обработку измерительной информации, представление и интерпретацию полученных результатов в соответствии с целями исследования. 5. Экспериментатор, осуществляющий на основе автоматизированной обработки данных эксперимента принятие решения о завершении исследования, либо в случае необходимости коррекции программы и изменения состава используемого оборудования. Различные этапы медико-биологического исследования, представленные на приведенной структурной схеме, в разной степени поддаются автоматизации. В большей степени возможности современных компьютерных технологий распространяются на процессы сбора, накопления измерительной информации, её обработки и наглядного (в соответствии с целями и задачами медико-биологического исследования) представления результатов. В существенно меньшей степени эти возможности распространяются на процессы интерпретации результатов и принятия решений, которые остаются пока недостаточно формализованными.
8. Определение понятия «статистическая совокупность», «единица наблюдения», примеры.
Под объектом наблюдения понимают статистическую совокупность, состоящую из отдельных предметов или явлений - единиц наблюдений, взятых в определённых границах времени и пространства. Единица наблюдения - первичный элемент статистической совокупности, являющейся носителем признаков, подлежащих регистрации, изучению в ходе исследования. Например, группа пациентов, на которых проводится исследование будет являться объектом наблюдения, т.е. статистической совокупностью, а каждый пациент, входящий в эту группу и являющийся носителем интересующих исследователя признаков, будет единицей наблюдения. 9. Классификации признаков единиц наблюдения. Учитывая необходимость использования современных математических методов и вычислительной техники для обработки данных, вместо привычного деления всех признаков на количественные и качественные в настоящее время используется более подробная классификация признаков: • количественные признаки (масса тела, рост, возраст, лабораторные данные и т.п.); • качественные; • номинальные или классификационные признаки (пол, место жительства, должность, профессия и т.п.); • порядковые признаки, у которых можно выделить различные степени выраженности изучаемого явления и которые в свою очередь, делятся на расплывчатые (например, результаты лечения: хорошие, удовлетворительные, неудовлетворительные; самооценка здоровья: отличное, очень хорошее, хорошее, удовлетворительное, плохое) и ранговые (например, порядковый номер родов).
10. Виды исследований. Существует много различных классификаций видов научных исследований. В зависимости от времени регистрации различают следующие виды исследований: ■ Единовременные (в виде пролонгированного исследования или моментного среза; ■ Текущее; • Ретроспективное; • Проспективное В зависимости от целей исследования выделяют: ■ Дескриптивное (для описания и прогнозирования тенденций) ■ Оптимизационное (для решения проблемы и принятия управленческих решений В зависимости от методического подхода к исследованию со стороны исполнителя различают: ■ Пассивные исследования (без активного вмешательства исследователя в изучаемую совокупность или окружающую ее среду) ■ Активные исследования ■ Поисковые эксперименты (создание специальных условий для совокупности или устранение действия факторов внешней среды) ■ Управляемые эксперименты (внесение коррекции в методику исследования в зависимости от получаемых результатов) Важное место при решении организационных вопросов исследования принадлежит так называемому пробному, предварительному (пилотажному) исследованию. Это небольшое по численности исследование позволяет решить следующие основные задачи: ■ отработать программу исследования; ■ проверить различные варианты сбора данных; ■ оценить вариабельность (разнообразие) признаков; ■ оценить затраты (время, деньги, штаты), необходимые для проведения исследования.
11. Надежность, состоятельность, чувствительность и специфичность метода.
12. Основные виды ошибок научного исследования.
|