Измеряемых переменных
В классической теории тестов [G. A. Lienert, 1967] основные критерии тестовой методики определяются объективностью проведения и обработки результатов тестирования, а также надежностью и валидностью полученных показателей. Критерии объективности и надежности — это предпосылки, а валидность непосредственное доказательство того, что измеряемые переменные отражают личностные конструкты в постулированном теорией смысле. Исчерпывающий обзор имеющихся в классической теории тестов критериев добротности методик в их многочисленных вариантах, применяемых для измерения мотивов, был проведен Файнеманом [S. Fineman, 1977], а позднее Хекхаузеном, Шмальтом и Шнайдером [Н. Heckhausen, H.-D. Schmalt, К. Schneider, 1980].
Таблица 6.6 Результаты факторного анализа 18 высказываний LM-решетки по их принадлежности к различным мотивационным тенденциям (N=279 9 — 10-летних детей; суммарная дисперсия=43%) [H.-D. Schmalt, 1976]
В современных вероятностных моделях тестирования наподобие той, которую построил Раш [G. Rasch, 1960], делается попытка прямо связать друг с другом тестируемые свойства и характеристики теоретических конструктов. С помощью этих моделей проверяется, действительно ли и в какой мере ответы по тесту отражают одномерный континуум интенсивности некоторого латентного личностного измерения. В этом смысле тестовые ответы одномерны, когда они эквивалентны (а) для различных особенностей заданий и ситуаций (к примеру, для различных картинок ТАТ), и (Ь) для различных групп испытуемых (например, для разных по возрасту, полу или выраженности некоторых психологических признаков), т. е. как в содержательном, так и в метрическом отношении дают сравнимый индекс латентной личностной диспозиции. К этому мы еще вернемся. Поскольку, как мы уже в этом убедились, методики ТАТ весьма чувствительны к различного рода ситуационным влияниям, скажем к воздействиям имевших место ранее переживаний и условий побуждения мотива, особенностям инструкции, поведению экспериментатора и т. п., то объективность проведения теста представляется особенно важным моментом, который требует большой тщательности в отборе стандартных условий проведения теста, ибо в противном случае тестовые показатели внутри групп испытуемых или между ними окажутся несопоставимыми из-за различий в побуждениях мотива. Объективность обработки теста оказалась вполне удовлетворительной, поскольку ключевые категории анализа содержания достаточно легко усваиваются и используются лицами, проводящими подобные исследования. Существует несколько курсов тренировочных упражнений [для nAch: С. P. Smith, S. С. Feld, 1958; для НУ и БН: Н. Heckhausen, 1963a]. Для обеих методик ТАТ коэффициент корреляции между суждениями двух экспертов, независимо друг от друга осуществлявших анализ содержания, колеблется в пределах от 0,80 до 0,95. Были разработаны программы для компьютерной обработки содержания рассказов по ТАТ [для nAch: P. J. Stone et al., 1966; для НУ и БН: G. Seidenstucker, E. Seidenstucker, 1974]. В случае LM-решетки, как и любой диагностической методики с заранее фиксированными вариантами ответов, объективность обработки показателей теста проблемы не составляет. Надежность прежде всего означает стабильность тестовых показателей при повторных измерениях. По сравнению с опросниками корреляция методик ТАТ, определенная методом повторного тестирования, незначительна и колеблется в пределах от 0,40 до 0,60 в том случае, когда повторное предъявление теста производится с интервалом в 3 — 5 нед [R H. Haber, R. Alpert, 1958; Н. Heckhausen, 1963а; М. Sader, H. Specht, 1967]. И все же для НУ и БН стандартная ошибка измерения позволяет использовать эту методику как средство различения по тестовым показателям от 3 до 4 групп испытуемых. Шмальт [H.-D. Schmalt,.1976] указал, что корреляция, определенная для LM-решетки методом повторного тестирования, составляет от 0,67 до 0,85 при интервале между испытаниями от 2 до 8 нед. Конечно, в случае методик ТАТ необходимо иметь в виду, что повторение теста не воспроизводит исходных условий, поскольку картинки и первоначально составленные рассказы сохраняются в памяти, а это может вызвать у некоторых испытуемых желание не дублировать их содержания. Повторение теста как бы обнаруживает его неудовлетворительную надежность. Мак-Клелланд [D. С. McClelland, 1958] в этой связи рекомендовал судить о надежности по валидности. Уинтер и Стюарт [D. G. Winter, A. J. Stewart, 1977] попытались внести ясность в эту проблему, давая при повторном тестировании спустя неделю группам испытуемых одну из трех инструкций: (1) представить себя в прежней ситуации тестирования и написать рассказы, как можно более похожие на те, что были составлены в первый раз; (2) не особенно задумываться над сходством рассказов, которые будут писаться, с предыдущими, не придавать этому сходству особого значения; (3) постараться составить рассказы, как можно более отличающиеся от написанных ранее. Корреляции повторного тестирования по трем различным инструкциям составили для методики ТАТ, предназначенной для измерения мотива власти, соответственно 0,61; 0,58 и 0,27. Корреляции при двух первых инструкциях значимы и значительно превышают корреляции при обычных условиях применения методик ТАТ. Автор этой книги [Н. Heckhausen, 1963a, S. 79] при повторном тестировании, дававшем относительно высокие корреляции, использовал второй вариант инструкций, предложенных Уинтером и Стюартом. Вместо корреляций, определяемых методом повторного тестирования, в качестве критерия надежности часто используют корреляционную связь между разными половинами тестовых заданий при одном и том же проведении теста, хотя корреляция, полученная методом расщепления, свидетельствует не о стабильности тестовых показателей (поскольку интервал между сравниваемыми измерениями здесь фактически равен нулю), а, скорее, об однородности заданий теста. Высокая однородность или внутренняя согласованность теста в классической теории тестирования долгое время ошибочно принималась за предварительное условие его валид-ности. Еще не так давно эту точку зрения отстаивал Энтвисл [D. R. Entwisle, 1972], критиковавший предназначенные для измерения мотивов методики ТАТ. Действительно, эти методики отличает незначительная внутренняя согласованность — корреляции для НУ и БН по двум половинам теста едва значимы, а для nAch они хотя и выше, но их значимость также не очень существенна. Это не удивительно, поскольку уже при разработке методик приходится исходить из определенной внутренней неоднородности: на картинках представлены различные сферы деятельности, они наводят на мысль об успехе или о неудаче изображенных персонажей. Аткинсон, Бонгорт и Прайс [J. W. Atkinson, К. Bongort, L. H. Price, 1977] при помощи моделирования на ЭВМ доказали, что незначительная или недостаточная внутренняя согласованность (измеренная по приходящемуся на одну картинку времени продуцирования высказываний, тематически связанных с достижениями) не мешает тестовым показателям по картинкам ТАТ обладать кон-структной валидностью (см. гл. 12, раздел «Динамическая модель действия»).
|