Стандартизация, надежность и валидность.
Измерения и методы, которые мы используем для изучения поведения ребенка и семьи, должны пройти тщательное исследование, с тем чтобы можно было определить, насколько точно они оценивают определенные конструкты, такие как депрессия, тревога или умственная отсталость. Использование хорошо стандартизованных, надежных и валидных единиц измерения и процедур крайне важно для подлинно научного исследования, как это показано на рис. 3.4.
Рис. 3.4.Понятия, которые определяют ценность наших методов измерения и оценки. Стандартизация — это процесс, который определяет набор стандартов или норм для процедуры измерения, с тем чтобы его можно было систематически использовать при различных оценках конструкта. Эти стандарты и нормы относятся к процедурам, которым необходимо следовать во время проведения исследования, сбора и оценки данных. В некоторых случаях измерение может проводиться на больших группах детей, которые различаются по определенным характеристикам, таким как возраст, пол, раса, социально-экономический статус или диагноз. Эти оценки можно затем использовать в целях сравнения. Например, тестовые оценки 8-летнего мальчика из среды с низким социально-экономическим статусом следует сравнивать оценками других детей, подобных ему, а не с оценками 16-летней девушки из среды с высоким социально-экономическим статусом. Надежность относится к согласованности или повторяемости измерений. Чтобы быть надежными, измерения не должны зависеть от какого-то одного наблюдателя или клинициста; разные люди должны приходить к согласию в отношении того, что они видят. Это называют согласием между оценивающими (interrater agreement). Представьте свою реакцию, если вы покажете ребенка трем различным психологам, и они поставят ему три разных диагноза и порекомендуют три разных метода лечения. Как вам определить, какой из диагнозов вереи? В этом случае диагнозы не будут надежными, поскольку два психолога или более не пришли к согласию. Аналогичным образом различные измерения, такие как тесты или интервью, когда они повторяются в течение короткого интервала времени, должны давать схожие результаты в обоих случаях. Другими словами, результаты должны быть стабильными во времени; это называют надежностью теста и повторного теста (test-retest reliability). Одной надежности недостаточно для определения того, отражает ли метод цели исследователя — должна быть продемонстрирована и валидность. Валидность метода показывает, в какой степени он действительно измеряет параметр или конструкт, который исследователь собирается измерить. Валидность можно оценить рядом способов. Во-первых, измерение можно проверить на его лицевую валидность (face validity), или степень, в которой оно, как представляется, оценивает интересующий конструкт. Конструктная валидностъ (construct validity) относится к тому, ведут ли себя при измерении оценки так, как предсказывают теория или прошлые исследования — к значению, вкладываемому в оценки. Конвергентная валидность (convergent validity) отражает корреляцию между измерениями, которые, как ожидается, связаны между собой, — показатель степени, в которой два измерения оценивают схожие или связанные конструкты. С этой валидностью контрастирует дискриминантная валидностъ (discriminant validity), которая относится к степени корреляции между измерениями, которые, как ожидается, не связаны друг с другом. Наконец, связанная с критерием валидность (criterion-related validity) относится к тому, насколько точно измерение предсказывает поведение в условиях, где, как мы ожидаем, оно должно это делать либо в то же самое время (конкурентная валидность — concurrent validity), либо в будущем (предиктивная валидностъ — predictive validity). Например, высокие показатели ребенка при измерении социальной тревожности должны предсказывать, что ребенок проявит тревогу или избежание в текущих социальных ситуациях и, возможно, будет испытывать трудности с установлением дружеских отношений в будущем. Связанная с критерием валидность говорит, можно ли использовать показатели, полученные при измерении, для той цели, для которой они предназначены, — обладает или нет измерение практической пригодностью.
|