В ТРИДЕВЯТОМ ЦАРСТВЕ» ТЕСТ
(The «Once Upon a Time» Test) — проективная методика исследования личности. Предназначена для оценки у детей способности испытывать эмоции тревоги и удовольствия. Предложена Т. Фагула в 1994 г. Испытуемому предъявляют 9 рисунков-сцен из мультфильмов и просят упорядочить их и составить рассказ. Результаты оценивают в соответствии с реакцией испытуемого на тестовые ситуации, изменчивостью выбора картинок, частотой выбранных сцен, что выражает чувства тревоги или удовольствия, а также последовательность размещения сцен. Сообщаются данные о валидности теста на выборке из 5-10-летних детей. Данные, полученные по тесту, используются для дифференциации нормальных, агрессивных, тревожных или изолированных детей. Сообщается о достаточно высокой валидности и надежности методики. Сведений об использовании в СНГ не имеется. ВАЙНЛЕНДСКАЯ СОЦИАЛЬНОЙ ЗРЕЛОСТИ ШКАЛА (Vineland Social Maturity Scale) — методика определения степени овладения социальными навыка- ми, предназначена для детей в возрасте от 3 до 9 лет. Разработана Е. А. Доллом в 1935 г. Автор исходил из понимания социальных навыков как свойств, присущих всем людям, «как общих предпосылок уровня наблюдаемой активности индивида, имеющей социальное значение». Эта активность проявляется в первую очередь в способности следить за своими потребностями и ощущать ответственность за свои действия. Комплекс этих атрибутов ЕгДолл обозначил как «социальная зрелость». Сущность тестирования состоит в описании активности ребенка и соотнесении конкретных форм его поведения с нормативами. Экспериментатор получает в ходе беседы сведения о ребенке и затем оценивает их по стандартной схеме. Применение шкалы не требует участия испытуемого, данные чаще всего получают от других лиц, обладающих информацией о его развитии (родители, воспитатели и т. д.). Ориентиром для беседы и оценки действий является бланк для ответов, который содержит 36 пунктов, касающихся поведения ребенка. Пункты сформулированы таким образом, чтобы выявить, спо- собен ли ребенок самостоятельно удовлетворить свои потребности в соответствии с нормативными требованиями для данного возраста. В первую очередь нормативы касаются «социальных способностей», например: самостоятельность, способность к общению, социальная включенность и т.д. Формулировка нормативов примерно такова: — для возраста 3-4 года: сам застегива-" ет одежду, сам одевается, кроме завязывания шнурков; — для возраста 4-5 лет: играет в простые настольные игры, имеет представление о деньгах и их значении. Нормативы объединяются в следующие категории: 1. Способность к самообслуживанию; 2. Самостоятельность во время еды; 3. Самостоятельность при одевании; 4. Способность к саморегуляции поведения; 5. Уровень активности; 6. Уровень общения; 7. Физическая активность; 8. Степень социализации. Беседа как форма получения информации от лиц, знающих ребенка, оказывается вполне адекватной для определения степени овладения социальными навыками, но предъявляет повышенные требования к экспериментатору, который должен уметь выделить сведения, относящиеся к нормативным показателям. Выполнение каждого нормативного требования оценивается в 1 балл. Оценка первичная с учетом хронологического возраста переводится в условный показатель, позволяющий отнести испытуемого к определенной «зоне развития». В каждой возрастной категории выделяется пять таких зон. Исходя из характера тестовых заданий методика пригодна для обследования лиц от рождения до 25 и даже до 30 лет. Однако из-за отличий в культурных условиях в разных возрастных выборках автор определил зону применимости шкалы от 3 до 9 лет (хотя стандартизация ее проводилась на испытуемых в возрасте от нескольких месяцев до 11 лет). Для обсле- дования детей в возрасте до 3 лет рекомендуется использовать шкалу развития Гезелла (см. Психодиагностика раннего детства). В процессе рестандартиза-ции шкалы (Й. Кожены, 1974) была установлена внутренняя согласованность заданий (коэффициенты для отдельных возрастных категорий находились в диапазоне от 0,59 до 0,86). Возможности использования шкалы достаточно широки. Она может быть с успехом применена в детской клинической психодиагностике, при контроле развития детей младшего возраста. Данных об использовании в СНГ нет. ВАЛИДИЗАЩШ КРИТЕРИЙ — непосредственная и независимая от вали-дизируемого теста мера психического свойства, на исследование которого направлена психодиагностическая методика. Сравнение результатов теста с В. к. является непременным условием процедуры определения валидности критериальной. В качестве В. к. на практике обычно используют: — объективные социально-демографические и биографические данные (стаж, образование, профессия, прием или увольнение с работы); — показатели успеваемости, чаще всего являющиеся критериальной мерой тестов способности к обучению, достижений в отдельных дисциплинах, тестов интеллекта; — производственные показатели эффективности выполнения отдельных видов профессиональной деятельности, имеющие наибольшее значение при валидизации методик, используемых в профотборе и профориентации; — результаты реальной деятельности (рисование, моделирование, музыка, составление рассказа и т. д.) при испытании тестов общих и специальных способностей, тестов личности; - врачебный диагноз или другие заключения специалиста; — контрольные испытания знаний и умений; — данные других методик и тестов, ва-лидность которых считается установленной. Среди многообразия видов В. к. можно в самом общем виде выделить объективные (относительно независимые от субъективных мнений, оценок людей) и субъективные критерии. Последние в психодиагностике используются более часто. К числу таких критериев относятся оценки, суждения, заключение об объекте исследования, сделанные экспертом (специалистом, педагогом, руководителем, психологом). При таком методе индивидуальной оценки эксперт дает заключение на основе предложенной ему разработчиком теста оценочной шкалы. Объективизация В. к. достигается увеличением числа экспертов. Использование экспертных оценок в качестве В. к. включает четыре возможных метода проведения процедуры валидизации; коллективная оценка, средневзвешенная оценка, ранжирование, парное сравнение. При коллективной оценке эксперты совместно оценивают объект с помощью оценочной шкалы. Выбор оценочных шкал чаще всего осуществляется по принципу наибольшего удобства для эксперта. Так, педагогам удобней оценить учащихся по 5-балльной шкале. Условием коллективной оценки является выработка общего компромиссного мнения. При таком способе оценивания результат весьма зависим от личностных особенностей и характера группового взаимодействия экспертов. Распространенным методом получения В. к. является метод средневзвешенной оценки. В этом случае каждый испытуемый оценивается несколькими экспертами, так что оценки, данные ие- пытуемому одним экспертом, неизвестны другим. Затем полученные оценки усредняются. Вместо оценочной шкалы можно применить метод ранжирования,заключающийся в том, что несколько экспертов независимо друг от друга или совместно распределяют всех членов выборки на группы по степени выраженности оцениваемого признака. Полученные ранговые места при независимом оценивании могут быть также усреднены. При определении рангового места или оценке по шкале нередко эксперты встречаются с трудностью соотнесения выраженности признака с тем или иным уровнем или положением на шкале. Эта трудность возрастает при оценивании малодифференцированных признаков или при низкой квалификации экспертов. В этом случае определенными преимуществами обладает метод парного сравнения. Задача экспертов состоит в попарной расстановке субъектов по позициям альтернативных признаков («общительный—замкнутый» или выраженность большая—меньшая предложенного для оценки качества и т. п.). Субъективно задача экспертов облегчается благодаря отсутствию количественной оценки качеств субъекта. Показателем места, занимаемого испытуемым в ряду других, служит общее число предпочтений этого суббъекта по сравнению с остальными по данным всех экспертов. Этот показатель может быть приведен к числу экспертов и числу сравниваемых испытуемых и вычислен в процентах. Для расчета применяется формула Дж. Гилфорда где В — число предпочтений, N — число экспертов, п — количество сравниваемых объектов. Выбор В. к. является ответственным и важным этапом конструирования теста и его валидизации. Чем более сложным, комплексным является изучаемое психическое явление, тем шире, обобщеннее, должен быть критерий. Напр., при обосновании теста на общий интеллект в качестве В. к. может выступать эффективность учебной, производственной или научной деятельности в целом; при валидизации методики для исследования экстраверсии—интроверсии — экспертные оценки таких личностных характеристик, как общительность, жизнерадостность, социальная ответственность и др. Более узкие и частные критерии применяются для обоснования тестов, направленных на измерение уровня развития конкретных профессиональных знаний, умений, навыков, напр.: мануальной ловкости, памяти на числа и т. д. Узость выбираемого критерия определяется областью психологических явлений, охватываемых тестом, однородностью (гомогенностью) задач методики, конкретностью, однозначностью интерпретации результатов. Напротив, чем шире В. к., тем разнородней (гетеро-геннее) по характеру могут быть задачи теста и тем менее однозначна интерпретация результатов. В реальной практической деятельности успех или неуспех человека в любой области определяется не каким-нибудь изолированным фактором, а их комплексом. Поэтому в принципе каждый В. к. является многокомпонентным. Для адекватной оценки объекта его следует считать комплексным, составным, что не только расширяет сферу реальной валидизации, но и делает ее результаты более точными и обоснованными. Разделение критерия на элементы в соответствии с элементами изучаемого тестом сложного качества, области поведения осуществляется при характеристике синтетической валидности (см. Валидность критериальная). Ана- лиз и интерпретация связи тестовых оценок с В. к. опирается на количественные и качественные методы и вместе с выбором критерия является ключевым аспектом, определяющим достоверность характеристики валидности теста (см. Валидности коэффициенты). ВАЛИДНОСТИ КОЭФФИЦИЕНТЫ — статистические показатели валидности эмпирической теста. В качестве меры валидности наиболее часто на практике применяются разные виды корреляционного анализа связи между индивидуальными оценками по тесту и оценками по валидизации критерию (либо связь между результатами ва-лидизируемого теста и эталонной методики). В большинстве случаев распределение тестовых оценок в репрезентативной выборке валидизации близко к нормальному. Оценки по критерию чаще бывают дихотомическими, ранговыми (см. Шкалы измерительные) или распределяются по закону, отличному от нормального. Если оба ряда переменных (тестовые и критериальные оценки) носят континуальный характер, используют коэффициент корреляции произведения моментов Пирсона (см. Корреляционный анализ). В зависимости от шкалы представления переменных в сравниваемых рядах применяют те или иные методы корреляционного анализа (см. Корреляция качественных признаков, Корреляция бисериальная, Корреляция ранговая). Наряду с В. к., определяемыми традиционным способом, существуют и некоторые другие меры количественной оценки валидности теста, в частности с помощью /-коэффициента, цредложенного Э. При-мовым (Е. S. Primoff, 1975). /-Коэффициент является одним из методов характеристики синтетической валидности (см. Валидность критериальная). Процедура его определения предусматривает нали- чие перечня элементов сложной деятельности или способности, выраженных языком профессиональных или других специальных действий, и экспертной оценки относительной значимости этих элементов для осуществления данной сложной деятельности. Окончательный анализ проводится на базе корреляции оценок теста и отдельных элементов реальной деятельности с учетом их удельных весов. Статистическая обработка основана на применении уравнения множественной регрессии. Для каждого элемента деятельности его корреляция с деятельностью в целом умножается на «вес» в тесте, и полученные произведения суммируются по всем элементам деятельности. В. к. являются важными, но далеко не определяющими и не исчерпывающими характеристиками валидности методики. В. к. являются лишь элементом в сложном процессе характеристики валидности теста. Приблизительность отдельно вычисленного В. к. обусловлена многими факторами. Во-первых, условия валидности теста не представляется возможным определить полностью. Всегда остается множество неучтенных факторов, ситуаций, условий и т. д. Во-вторых, логика критериальной валидизации предполагает валидность самого критерия. Проверка такой валидности представляет собой весьма трудную проблему. К тому же очень часто тесты валидизируются относительно доступного, а не наиболее соответствующего критерия. Так, тесты интеллекта сопоставляются с показателями академической успеваемости, которая несомненно связана с интеллектом, но его далеко не исчерпывает. В-третьих, условия валидизации по критерию предполагают, что выборка полностью репрезентативна в популяции, для которой позже будут делаться заключения. В реальной ситуации это требование осуществить трудно, и репрезентативность выборки валидизации все- гда требует дополнительной проверки статистическими и качественными методами. На практике обычно весьма сложно охватить адекватно большое количество случаев, особенно при определении валидности прогностической. Наибольшая сложность интерпретации В. к. с т. з. определяемой реальной валидности теста заключается в следующем. Критериальная валидизация опирается, как правило, на круг внешних для психологии социально-прагматических критериев. Это оправдывается тем, что важнейшая цель валидизации — определение практической ценности разрабатываемой методики. Критерии в этом случае выступают как показатели, обладающие непосредственной ценностью для определенных областей практической деятельности, напр.: «успеваемость», «производительность*, «преступность», «состояние здоровья» и т. д. При ориентации на эти категории в ходе валидизации решаются сразу две задачи: собственно задача измерения валидности и оценка прагматической эффективности психодиагностической методики. Если получен значимый коэффициент корреляции, то можно считать, что с той или иной степенью достоверности решены с позитивным результатом сразу две эти задачи. Но если корреляция не обнаружена, то остается неопределенность: либо не валидна сама процедура (тестовый балл не отражает, напр., стрессоустойчивость оператора), либо не верна гипотеза о наличии причинно-следственной связи между психическим свойством и социально ценным показателем (стрессоустойчивость не влияет на процент аварийных ситуаций). Наряду с перечисленными теоретическими и методическими сложностями применения и интерпретации В. к. необходимо помнить и об обеспечении статистической значимости рассчитываемых коэффициентов. Делая вывод о валидности теста с привлечением В. к., нужно быть уверенным в том, что данный коэффициент не появился в результате случайных отклонений в выборке. Установив значимость корреляции между тестовыми показателями и критерием, необходимо оценить величину стандартной ошибки тестовых оценок. Применяемый при этом статистический показатель ошибки измерения указывает на допустимые пределы ошибки в индивидуальных показателях вследствие ог-- раниченной надежности теста. Аналогично ошибка в оценке указывает на допустимые пределы возможной ошибки в прогнозируемой величине индивидуального критериального показателя, возникающей в результате ограниченной валидности теста. Ошибка оценки находится по формуле Особенности интерпретации В. к. как статистических мер аналогичны другим мерам связи. ВАЛИДНОСТЬ (англ. valid — действительный, пригодный, имеющий силу) — комплексная характеристика методики (теста), включающая сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним. В наиболее простой и общей формулировке В. теста это «...понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает» (А. Анастази, 1982). В стандартных требованиях к психологическим и образовательным тестам (Standarts..., 1974) В. определяется как комплекс сведений о том, относительно каких групп психологических свойств личности могут быть сделаны выводы с помощью методики, а также о степени обоснованности выводов при использовании конкретных тестовых оценок или других форм оценивания. В психологической диагностике В. — обязательная и наиболее важная часть сведений о методике, включающая (наряду с указанными выше) данные о степени согласованности результатов теста с другими сведениями об исследуемой личности, полученными из различных источников (теоретические ожидания, наблюдение, экспертные оценки, результаты других методик, достоверность которых установлена и- т. д.), суждение об обоснованности прогноза развития исследуемого качества, связь изучаемой области поведения или особенности личности с определенными психологическими конструктами. В. описывает также конкретную направленность методики ~ (контингент испытуемых по возрасту, уровню образования, социально-культурной принадлежности-и т.д.) и степень обоснованности выводов в конкретных условиях использования теста. В совокупности сведений, характеризующих В. теста, содержится информация об адекватности применяемой модели деятельности с т. з. отражения в ней изучаемой психологической особенности, о степени однородности заданий (субтестов), включенных в тест, их сопоставимости при количественной оценке результатов теста в целом. Важнейшая составляющая В. — определение области изучаемых свойств — имеет принципиальное теоретическое и практическое значение при выборе методики исследования и интерпретации ее данных. Содержащаяся в названии теста информация, как правило, недостаточна для суждения о сфере его применения. Это лишь обозначение, «имя» конкретной процедуры исследования. В качестве примера можно привести широко известную корректурную пробу. Область изучаемых свойств личности включает устойчивость и концентрацию внимания, психомоторную подвижность. Данная методика позволяет получать оценки выраженности этих психологических качеств у испытуемого, хорошо согласуется с показателями, полученными другими методами и, следовательно, обладает высокой В. Наряду с этим результаты выполнения корректурной пробы подвержены влиянию большого количества других факторов (нейродинамические особенности, характеристики кратковременной и оперативной памяти, индивидуальная переносимость монотонии, развитие навыка чтения, особенности зрения и т. д.), по отношению к которым методика не является специфичной. В случае применения корректурной пробы для их измерения В. будет невелика или сомнительна. Таким образом, очерчивая сферу применения методики, В. отражает и уровень обоснованности результатов измерения. Очевидно, что при небольшом количестве сопутствующих факторов, влияющих на результат исследования, а значит, при их незначительном воздействии на результат теста достоверность тестовых оценок будет выше. Еще в большей степени достоверность данных теста определяется набором измеряемых свойств, их значимостью для осуществления диагностируемой сложной деятельности, полнотой и существенностью отражения в материале теста предмета измерения. Так, чтобы удовлетворить требованиям В., диагнос- тическая методика, предназначенная для профотбора, должна включать анализ широкого круга нередко различных по своей природе показателей, наиболее важных для достижения успеха в данной профессии (уровень внимания, особенности памяти, психомоторика, эмоциональная устойчивость, интересы, склонности и т. д.). Как видно из вышеизложенного, в понятие В. входит большое количество самой разнообразной информации о тесте. Различные категории этих сведений и способы их получения образуют типы В. Диагностическая (конкурентная) В. отражает способность теста дифференцировать испытуемых по изучаемому признаку. Анализ диагностической В. имеет отношение к установлению соответствия показателей теста реальному состоянию психологических особенностей испытуемого в момент обследования (см. Валив-ность текущая). Примером определения этого типа В. может быть исследование по методу контрастных групп. Проведение теста интеллекта у нормально развивающихся детей и их сверстников с нарушениями в интеллектуальном развитии может выявить глубокие количественные и качественные различия в выполнении заданий сравниваемыми группами. Степень надежности дифференциации детей первой и второй групп по данным теста будет характеристикой диагностической В. оценки умственного развития, получаемой с помощью данной методики. Сведения, характеризующие степени обоснованности и статистической надежности развития исследуемой психологической особенности в будущем, составляют валидность прогностическую методики. Заключение об этом типе В. может быть получено, напр., путем сравнения тестовых оценок в одной и той же группе испытуемых спустя определенное время. Основой прогностической В. является определение того, насколько важен исследу- емый признак с т. з. деятельности испытуемого в будущем с учетом закономерно изменяющихся обстоятельств, перехода на другой уровень развития. Большинство методик, особенно тестов способностей и интеллекта, исследуется на предмет диагностической и прогностической В. Два этих типа В. нередко объединяют в понятие валидности эмпирической. Здесь подчеркивается общность подхода к их определению, который осуществляется путем статистического коррелирования баллов (оценок) по тесту и показателей по внешнему параметру, избранному в качестве валидизации критерия (см. Валидностъ критериальная). Критерий В. выступает в качестве меры, показателя исследуемых психологических особенностей. Так, тесты специальных способностей проверяются путем сопоставления с результатами обучения по другим предметам, достижениями в музыке, рисовании и т. д. Тесты общих интеллектуальных способностей валиди-зируются сравнением с еще более широкими характеристиками школьных достижений (общая успеваемость, овладение сложными системами знаний и навыков). Критерий В. является независимым от теста показателем, обладающим непосредственной ценностью для определенных областей практической деятельности. Напр., в области педагогической психологии это «успеваемость», в психологии труда — «производительность», в медицинской психологии — «состояние здоровья» и т. д. В качестве непосредственных критериев часто используются экспертные оценки и характеристики лиц, обследованных с помощью валидизируемого теста, данные педагогами, сотрудниками, руководителями. Во многих случаях бывает сложно или невозможно подобрать адекватный критерий валидизации. При этом особую важность приобретает комплекс характерис- тик, входящих в тип теоретической В. При разработке и использовании теста может быть сформулирован ряд гипотез о том, как будет коррелировать исследуемый тест с другим тестом, измеряющим родственные или противоположные психологические характеристики испытуемых. Эти гипотезы выдвигаются на основании теоретических представлений об измеряемых свойствах как о психологическом конструкте. Подтверждение гипотез свидетельствует о теоретической обоснованности методики, т. е. о степени ее конструктной валидности. Этот тип В. является наиболее сложным и комплексным. Для подтверждения соответствия получаемых с помощью теста результатов теоретическим ожиданиям и закономерностям используется самая различная информация, в том числе и относящаяся к другим типам В. Валидность содержательная (внутренняя, логическая) — комплекс сведений о репрезентативности заданий теста по отношению к измеряемым свойствам и особенностям. Одним из основных требований при валидизации методики в этом направлении является отражение в содержании теста ключевых сторон изучаемого психологического феномена. Если область поведения или особенность очень сложна, то содержательная В. требует представления в заданиях теста всех важнейших составных элементов исследуемого явления. Так, при разработке теста «вербального интеллекта» необходимо ввести группы заданий (субтестов) для проверки довольно разнородных по своему операциональному составу навыков письма и чтения. Наряду с перечисленными основными типами В. (содержательной, критериальной и конструктной) на практике выделяют факторную, перекрестную (конвергентную) и дискриминантную В. (см. Валидность конструктная). Классификация типов В. в достаточной мере условна, так как нередко для различных критериев В. применяются общие методы определения, а с другой стороны, одни и те же исходные данные могут интерпретироваться с т. з. различных типов В. На рис. 9 приведена примерная схема, отражающая виды и связи валидности. Рис. 9. Основные виды валидности В психологической диагностике не существует универсального подхода к характеристике В. Для валидизации каждого вида психодиагностических процедур и отдельных тестов могут применяться различные, типы В. Сведения, входящие в комплекс В., можно оценить качественно и количественно (при помощи коэффициента валидности), нередко их можно описать. Однако в силу сложности, комплексности, ситуативности по отношению к конкретным условиям применения методики В. в целом невозможно измерить, о ней можно лишь судить. Реальная В. раскрывается только в результате накопления значительного опыта работы с тестами. Получение новых, расширенных данных о В. может радикально изменить представление о сфере приложения и эффективности методики. Так, некоторые методики, разработанные для диагностики вербальных факторов интеллекта, с достаточной В. отражают лишь уровень осведомленности. Сфера применения теста в ходе его длительной валидизации может быть, напротив, расширена. В качестве примера можно привести Равена прогрессивные матрицы, которые были разработаны для изучения определенных сторон перцептивной деятельности, однако оказались в значительной степени насыщены фактором, общим для тестов интеллекта (см. Фактор G). Реальная В. ряда психодиагностических методик, особенно тестов интеллекта, достижений в обучении, профессиональной пригодности, опросников личностных изменяется со временем. Это объясняется устареванием возрастных статистических норм, изменением социальных норм и образцов поведения, методов обучения и содержания заданий, требований к профессиям. Данное обстоятельство создает необходимость периодического контроля В. методик. ВАЛИДНОСТЬ ДИФФЕРЕНЦИАЛЬНАЯ — ъка, валидности конструктной, рассматривающей внутренние взаимоотношения между психологическими факторами, диагностируемыми с помощью психодиагностической методики. Содержание В. д. может быть иллюстрировано на примере тестов интересов, которые в своем большинстве обычно умеренно коррелируют с показателями общей академической успеваемости,однако в различной степени связаны с успеваемостью по отдельным дисциплинам. В. д. особенно важна как показатель диагностической ценности методик, используемых в профотборе. ВАЛИДНОСТЬ ИЛЛЮЗОРНАЯ (ложная) — иллюзия соответствия заключения по результатам тестирования личностным характеристикам обследуемого. Возникает как следствие использования предельно общих, а поэтому применимых практически ко всем обследуемым формулировок, таких, например, как «разумный в выборе цели», «стремящийся к лучшей жизни» и т. п. Такого рода утверждения принимаются почти всеми людьми в качестве точного описания их личности, что создает почву для деятельности различного рода прорицателей и предсказателей. В. и. названа Барнума эффектом по имени Финиса Барнума, популярного организатора публичных зрелищ, говорившего, что «глупец рождается ежеминутно».
|