Распределение ошибки измерений общего показателя теста Векслера
Колебания результатов измерений в определенном интервале значений могут быть связаны с систематическими и случайными факторами. К причинам систематических ошибок можно отнести какое-либо отклонение от стандартного проведения теста, неточность в процедуре обработки эмпирической информации (напр., технические ошибки в «ключе»), применение методики вне пределов ее валидности по возрастному критерию. В этих случаях результаты измерений отличаются от истинных на более или менее постоянную величину. Случайные ошибки возникают по самым разнообразным объективным и субъективным причинам. Их величина в основном и характеризует точность метода. При большом количестве повторных наблюдений индивидуальные оценки или средние величины образуют свой тип распределения, статистические показатели которого и отражают О. и., полученные при использовании данного метода. О. и. характеризуется величиной квад-ратической ошибки, связанной с дисперсией распределения отдельных измере- ний. Благодаря случайным ошибкам, зависящим от большого количества различных факторов, распределение эмпирических ошибок и средних оценок при повторных наблюдениях подчиняется нормальному закону. Исходя из основных свойств нормального распределения, можно считать, что 68% измерений попадут в интервал ± 1а, около 95% — в интервал ± 2а и 99% — в пределы ± 2,58а распределения оценок повторяющихся наблюдений. Таким образом, для того чтобы установить, в каких пределах с заданной вероятностью будет находиться «истинная» оценка, необходимо определить стандартное отклонение такого распределения. В табл. 20 приведены данные 10-кратного обследования испытуемого с помощью теста общих способностей. Полученная в этом случае величина стандартного отклонения результата Sx = 3. Следовательно, с вероятностью Р = 0,05 (95% случаев) можно ожидать, что «истинное» значение величины определяемого показателя попадает в интервал значений 100 ± 6 баллов, что составляет 94-106 баллов по шкале данной методики. Показатели О. и. имеют большое значение при оценке надежности методики.. Надежность теста можно выразить в виде стандартной О. и. (ат), называемой также стандартной ошибкой показателя. При интерпретации индивидуальных показателей эта мера более полезна, чем коэффициент надежности (г,). Исходя из коэффициента надежности, стандартная О. и. определяется по формуле: где Sx — стандартное "отклонение результатов теста в выборке, rt — коэффициент надежности. Стандартная О. и. и коэффициент надежности — взаимосвязанные способы выражения надежности. При этом О. и. не зависит от однородности выборки. Важным аспектом применения критерия О. и. в психодиагностике являются анализ и интерпретация различий между результатами теста. Представление результатов в виде интервальных вероятностных значений предотвращает их ошибочное толкование как отражения реальной динамики измеряемого свойства у испытуемого, а также необоснованность констатации различий между средними показателями в сопоставляемых выборках (см. Достоверность различий, Критерий Хг) при сравнении результатов нескольких обследуемых или группы тестовых оценок у одного испытуемого. В последнем случае при сопоставлении разных тестовых оценок, зная стандартные ошибки показателей для одного и другого теста (или субтестов), стандартную ошибку различий (стд) можно определить следующим образом: где Sx — стандартное отклонение, одинаковое для двух тестов, поскольку перед сопоставлением оценок они переводятся в одну и ту же шкалу (см. Стандартизация, Оценки шкальные). Предположим, необходимо удостовериться, существует ли у испытуемого различие по оценкам вербальных и практических субтестов шкалы. Для Векслера интеллекта измерения шкалы г. вербальных субтестов составляет 0,96, практических — 0,93, значение стандартного отклонения для той и другой шкалы — 15. Тогда Таким образом, для установления различий между оценками с доверительной вероятностью примерно 68% необходимо, чтобы разность в оценках по названным шкалам не превышала 5 баллов. При доверительной вероятности Р - 0,05 значение Од удваивается, приближаясь к 10 баллам. П
|