Надежность и валидность теста
Первоначальный набор суждений, использованных для построения теста (первичная форма), состоял из 47 самооценок индивидом своего психического состояния, с известной долей условности рассматривавшихся как симптомы. Выделение последних осуществлено на основе анализа психиатрической литературы и концепции предболезненных психических расстройств таким образом, чтобы этот набор в достаточной мере отражал «движения» индивида от абсолютной нормы к болезненному расстройству. Выбор симптомов в качестве индикаторов нервно-психической адаптации индивида основан на подходе, выдвинутом еще В. Гризингером, который утверждал, что диагностическое значение имеют не столько сами симптомы, сколько их истолкование наблюдателем. Применительно к формализованной психодиагностической процедуре получается: значение симптома в составе теста может не совпадать с его клиническим значением и фактически полностью определяется показателями надежности и валидности. Для приближения формулировок симптомов к языковому опыту респондентов первичная форма теста была апробирована в пилотажном исследовании, охватившем 31 работника объединения (квотная выборка по полу, возрасту и образованию). Чтобы оценить весь круг необходимых характеристик надежности и валидности теста, была использована исследовательская выборка объемом в 60 человек — пациентов дневного стационара и ночного профилактория клиники Института. Дискриминативность тестовых суждений. В данной процедуре она соотносится с наличием или отсутствием существующего в действительности нервно-психического заболевания. Поэтому коэффициенты дискриминации рассчитывались по результатам исследовательской выборки, где болезнь была клинически верифицирована, а «правильными» считались ответы о наличии симптомов, отличные от нуля, «неправильными» — равные нулю. Коэффициенты дискриминации, отражающие меру соответствия между ответом на один вопрос и ответами на все вопросы теста, по всем шкалам окончательной формы высоки и приближаются к 1. Таким образом, шкалы окончательной формы теста обладают высокой способностью разделять лиц с высокой и низкой «сырой» оценкой, а тест имеет значительную «внутреннюю» валидность. Надежность теста. Она определялась путем расчета соответсвующих статистических показателей по результатам деления первичной формы теста на две части с критическим значением коэффициента дискриминации, равным 0, 85. Коэффициенты надежности определялись по формуле Фланагана; практически для всех симптомов окончательной формы теста они высоки. Валидность по содержанию. Устанавливалась при помощи личностных тестов — MMPI (основные шкалы), теста Кеттелла (форма С)[1] и теста Айзенка (форма А). Полученные коэффициенты валидности выявили значительную опосредованность линейных корреляций признаков друг другом. Поэтому для определения валидности по содержанию был применен факторный анализ (метод главных компонент, с ротацией), т. е. этот вид валидности представлен факторной валидностью. Валидность по критерию. Критерием валидности теста выступала врачебная оценка психического состояния пациентов, вошедших в исследовательскую выборку. Психиатрическая квалификация состояния больных, находящихся на лечении, верифицировалась в условиях клиники Института, поэтому такая оценка выступает как экспертная. Методика оценки была формализованной, использовалась специально разработанная «Карта врачебной оценки». Параметрами оценки были следующие 12 психопатологических радикалов: • шизоидия; • мания; • депрессия; • эпилептоидность; • паранойя (включая параноидию и парафрению); • эксплозивность; • «органичность»; • астения; • истерия; • неврастения; • ананкастия; • деменция (включая малоумие). Оценка давалась по шкале: 0— полностью отсутствует; 1— слабо выражено, присутствует в виде кратковременных эпизодов, незначительных нарушений, изменений; определенно не требует психиатрической помощи; 2— выражено заметно, является относительно постоянным фоном основного состояния либо присутствует в форме очерченных клинических состояний; само по себе может не вызывать потребности в психиатрической помощи; 3— выражено на уровне развернутой клинической симптоматики, наряду с другими проявлениями характеризует болезненное психопатологическое состояние; определенно требует психиатрической помощи — амбулаторной или в дневном стационаре; 4— выражено ярко, характеризует патологию значительной тяжести, в наибольшей мере определяет клиническое состояние; требует помощи, как правило, в условиях закрытого пспхиатрического стационара. Большинство радикалов, как показало предварительное обсуждение, понимались врачами одинаково. Трактовавшиеся неоднозначно были подробно описаны в «Инструкции по заполнению карты». Полученный «профиль» врачебной оценки коррелировал (коэффициенты линейной корреляции Пирсона) с результатами заполнени первичной формы теста. Конструктная валидность. Она рассматривалась как соответствие вы деленных симптомов в их связи с показателями по валидизирующи методикам теоретическим психиатрическим взглядам. Симптомы, имею щие высокую внутреннюю и внешнюю валидность по формальны признакам, но противоречащие признанным общепсихиатрическим нозографическим концепциям, отбраковывались. Ситуационная валидность. Оценивалась путем наблюдения за реакциями респондентов в процессе заполнения первичной форм теста на стандартизационой выборке. Некоторые суждения (симш\ мы), адекватно воспринимавшиеся в терапевтической ситуации стационара или амбулаторного приема, вызывали негативные реакции популяции и были исключены. Диагностическая валидность. Определялась непосредственно на м териале клинического обследования 78 имеющих психиатричес симптомы представителей популяции. Она равна 0, 69. Таким образом, приведенные данные о надежности и валидности теста позволяют сказать, что его применение в качестве диагностического инструмента вполне обоснованно.
|