Студопедия — ТЕСТИРОВАНИЕ
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

ТЕСТИРОВАНИЕ






1) сущность и особенности метода тестов

2) основные характеристики качества измерения

3) виды психодиагностических тестов

В переводе с английского языка «тест» - испытание, проба, проверка. В психологии, социологии, педагоги­ке и других науках о человеке это слово употребляет ­ ся в качестве термина, обозначающего систему заданий, по­добранных с таким расчетом, чтобы можно было точно и обоснованно охарактеризовать конкретные особенности лиц, выполнивших эти задания. Они конструируются, выверя­ются, используются и интерпретируются по строгим и не­зависящим от специфики той или иной науки правилам, призванным обеспечить качество выводов.

Рассмотрим метод исследования, предусматривающий анализ деятельности испытуемых с такими заданиями. В психодиагностике под тестированием понимают стандар­тизированное испытание, предназначенное для установле­ния количественных (и качественных) индивидуально-психологических различий. Подчеркивая точность вычисления результатов и максимальную изолированность их от влия­ния людей, организующих данную процедуру, о тестировании часто говорят как об «измерении» особенностей психики.

Следует заметить, что ключевое понятие в приведенном выше определении - стандартизированность. Что это та­кое?

Во-первых, это обозначение единообразия требований ко всем условиям тестирования и инструкциям по его проведению и обработке результатов. В отношении разных лиц тест применяется унифицировано, по одному и тому же стандарту. Тем самым обеспечивается определенная гаран­тия уравнивания ситуативных факторов, способных поста­вить часть испытуемых в более выгодное положение по срав­нению с остальными. Без стандартизации становится не­возможным сопоставление индивидуальных результатов.

Так, например, инструкции обычно предъявляются в письменном виде или (реже) зачитываются, но никак не формулируются по памяти, своими словами. После этого никому не дается персональных пояснений, индивидуаль­ных комментариев и т. п.

Во-вторых, стандартизированностью называют перевод первичных («сырых») тестовых баллов, отражающих коли­чество выполненных заданий в более обобщенную шкалу, характеризующую степень индивидуальной выраженности данного психического свойства или функции.

Допустим, при выполнении теста интеллекта испытуе­мый успешно решил определенное количество заданий. Зная только это, мы не можем еще ничего сказать о том, каков уровень его интеллекта. В самом деле, много им сделано или мало? Хорошо прошло для него испытание или плохо? Часто ли такой показатель встречается у других? А сколь­ко заданий следовало бы выполнить, чтобы засвидетель­ствовать высокий уровень интеллекта? На все эти вопросы невозможно дать ответ, не имея еди­ной для всех системы отсчета, некоего эталона. В качестве последнего обычно выступают итоги тестирования много­численной и репрезентативной выборки. Сравнивая одного испытуемого с другими, делавшими ранее тот же тест, мы осуществляем стандартизацию по статистической нор­ме. В последнее время все чаще применяется и несколько иной вид стандартизации, когда результаты испытуемого сопоставляют не с другими результатами, а с описанием требований общества к развитию данной функции или свойства, то есть с социально-психологическим нормати­вом. Как бы то ни было, стандартизация обеспечивает возможность перехода от сведений по выполнению конкретного теста тем или иным лицом к психологическим харак­теристикам, лежит в основе единообразия интерпретации.

Обратимся к истории начального этапа развития мето­да тестов.

Известно, что уже в глубокой древности существовали более или менее типовые процедуры выявления индиви­дуальных различий между людьми. Так, в Китае более четы­рех тысяч лет назад, высшие чиновники обязаны были вы­держать в присутствии императора строгий экзамен по зна­нию ритуалов и церемоний, стрельбе излука, верховой езде, умению писать, считать, музицировать. В древнем Вавилоне и в Египте претендент на должность писца должен был доказать обладание соответствующими навыками, разбирать­ся в финансах, законах, сельском хозяйстве. В библии опи­саны своеобразные способы отбора воинов на особо труд­ные и опасные задания в зависимости от их действий на привале. В античной Греции и Риме разрабатывались весь­ма подробные классификации характеров и закономерно­сти их определения по поведенческим признакам...

Несмотря на то, что все это и многое другое историчес­ки предшествовало тестированию, возникновение науч­ных тестов следует отнести лишь к концу девятнадцатого века. Сам термин был введен создателем первых антропо­метрических тестов Френсисом Гальтоном (1822 -1911), за­нимавшимся исследованием остроты зрения и слуха, мус­кульной силы и т. п. Однако наибольшую популярность этот термин приобрел после выхода в свет в 1890 году статьи «Умственные тесты и измерения», написанной аме­риканским психологом, родоначальником современного тестирования Джеймсом Кеттеллом (1860-1944). В этой статье Кеттелл писал о том, что применение серии стати­стически обрабатываемых заданий к большому количе­ству индивидов как ничто другое способствует преобра­зованию психологии в точную науку. Им же впервые была высказана мысль о необходимости стандартизации ситуа­ции обследования.

Кеттелл разработал несколько десятков тестов, направ­ленных на оценку элементарных сенсомоторных процессов (чувствительности, времени реакции, количества воспроиз­водимых звуков после разового прослушивания и др.).

Довольно быстро возникла потребность в ориентации тестов на высшие психические функции. Качественный рывок в этом направлении связан с именем Альфреда Бине (1857-1911), составившего по поручению министерства об­разования Франции в 1905 году серию тестов интеллекта.

Тестирование по шкале Бине начиналось с предъявле­ния заданий, соответствующих хронологическому возрасту ребенка (то есть тех, которые успешно решались подавляю­щим большинством его сверстников). Если он успешно справлялся с работой, предлагался материал, рассчитанный на более старших детей. В случае если ребенок решал, лишь часть новых заданий, испытание прекращалось. При этом к количеству лет базового умственного возраста (тому, где были все задания, решены) прибавлялось несколько меся­цев умственного возраста (пропорционально количеству решенных заданий для более старших). Если же ребенок не справлялся со всеми заданиями своей возрастной группы, ему давался материал для более младших, пока не доходи­ли до возраста, все задания которого успешно решались.

По А. Бине, характеристикой интеллекта являлась раз­ность между умственным и хронологическим возрастами. Однако, как легко заметить, одна и та же разность для той или иной возрастной ступени приобретает неодинаковое значение. Такое обстоятельство весьма неудобно. Для его устранения немецкий психолог Вильям Штерн (1875-1938) предложил в 1912 году определять не разность, а соотно­шение (частное) умственного и хронологического возрас­тов, то есть делить показатели один на другой. Полученное число, умноженное на 100, он назвал величиной коэффи­циента интеллекта (IQ).

Заметим, что в большинства современных тестов интел­лекта принята иная процедура определения коэффициен­та, предложенная американским психологом и психиатром Дэвидом Векслером (1896-1981). Она основана на приме­нении единицы стандартных отклонений, показывающей, как соотносятся результаты испытуемого с интеллектом группы его сверстников.

Тесты, созданные в начале века, были индивидуальными. Использовать их могли лишь высококвалифицированные психологи. В период первой мировой войны в Америке воз­никла необходимость массовых обследований призывни­ков на предмет оптимального распределения их с учетом индивидуальных особенностей. По поручению военного ведомства Артур Отис (1888-1963) разработал первые груп­повые тесты - «альфа» и «бета». Одна из форм предназна­чалась для определения интеллекта у лиц, хорошо знающих английский язык, а другая была ориентирована на мало­грамотных и иностранцев. Эти тесты были значительно уп­рощены по процедуре применения и оценке результатов.

С 20-х гг. началось широкое распространение тестирова­ния во всем мире. При этом, наряду с тестами общего ин­теллекта, стало активно развиваться и более конкретное, приближенное к потребностям повседневной диагности­ческой практики тестирование специальных способностей и профессиональных достижений. В 30-е - 40-е гг. происхо­дит становление психодиагностики личности, осуществля­емой при помощи тестов, опросников, проективных мето­дик.

Именно тогда на несколько десятилетий были прекра­щены все психодиагностические исследования в СССР. Это стало следствием постановления ЦК ВКП(б), осудившего (1934 г.) существовавшую в то время педологию - науку о целостном изучении ребенка с помощью комплекса мето­дов психологии, анатомии, физиологии, медицины и педа­гогики.

В настоящее время в нашей стране, как и во всем мире, тестирование является одним из основных методов психо­логического исследования. Динамично развивается его ин­струментарий, непрерывно совершенствуются способы об­работки и интерпретации информации.

 

Одним из наиболее важных вопросов разработки теста следует признать необходимость тщательного выявления качества измерения. На последних страницах журналов иног­да печатают так называемые «популярные тесты». В отече­ственной школе все чаще применяются «тесты учителей». В строгом смысле слова те и другие нельзя отнести к тестам, так как показатели их надежности и валидности не уста­новлены.

Надежность - это помехоустойчивость теста, независи­мость его результатов от действия случайных факторов.

Можно ли в дальнейшем применять тест, если на этапе проверки его качества испытуемые каждый раз получают оценки, значительно расходящиеся с предыдущими свои­ми оценками? Ведь если исследуемый признак по своей природе стабилен, то результаты повторных тестирований одних и тех же лиц должны быть сходными, почти не отли­чающимися от полученных ранее.

Надежность является ха­рактеристикой точности измерения. Она позволяет судить о том, в какой мере можно доверять данным тестирования.

Причинами недостаточной надежности тестов являются:

v разнообразие ситуационных условий испытания, ме­няющихся от одного случая к другому (различия в манере поведения тестирующего лица, наличие посторонних по­мех, непредусмотренное присутствие других людей, вариа­тивность освещенности помещения и температуры воздуха и т. д.);

v несовершенство разработанного теста (нечеткость ин­струкций, принципиальная разнородность заданий, допуще­ние элементов субъективизма при интерпретации выпол­нений и т. д.);

v изменения внутренних состояний испытуемых (уста­лость, раздражение, апатия, нервозность и др.), а также их отношений к тестированию.

Максимальное устранение названных причин способ­ствует достижению приемлемой надежности теста.

Количественным выражением данной характеристики служат коэффициенты надежности. Каждый из них осве­щает какую-либо сторону, определенный аспект точности измерения. Прежде чем мы перейдем к рассмотрению ти­пов надежности, заметим, что процедура исчисления значе­ний коэффициентов обычно предполагает установление корреляции рангов всех членов выборки, в отношении ко­торых тест проверяется составителями перед внедрением его в психодиагностическую практику. В связи с тем, что корреляционный анализ в дальнейшем изучается как са­мостоятельный метод, укажем лишь одно: величина коэф­фициента надежности тем больше, чем неизменнее место (ранг) испытуемых по отношению ко всем другим рангам в выборке. Иначе говоря, положение результатов каждого испытуемого в общем ряду показателей выполнения теста должно всякий раз сохраняться.

На практике применяются чаще всего следующие типы данной характеристики теста:

1.Ретестовая надежность, определяемая при повторном обследовании тестом одних и тех же лиц.

Здесь есть одна проблема: если интервал времени меж­ду тестированиями небольшой, то заметно влияние эффек­та тренировки, если же временной промежуток значителен, то за этот период вполне может измениться сам исследуе­мый признак. Тем не менее, ретестовая надежность являет­ся важной характеристикой, она позволяет установить сте­пень независимости результатов тестирования от воздей­ствий проводящих его людей, а также от возможных изме­нений ситуаций обследования.

Считается необходимым, чтобы коэффициент такой на­дежности был не ниже 0, 80. В противном случае точность измерения недостаточна, процедура тестирования нужда­ется в дополнительной стандартизации.

2.Надежность частей теста, которая характеризует сте­пень однородности (или, как говорят, гомогенности) всех его заданий. Это свидетельство, что разработанный тест от­ражает актуальное состояние только одного психического феномена, а все его задания взаимно согласованы, непро­тиворечивы и неразнонаправленны.

Чаще всего для применения этого способа задания де­лятся на четные и нечетные. Результаты выполнения людь­ми тех и других обрабатываются отдельно, а затем сопос­тавляются.

Тест считается надежным, если полученный при сопос­тавлении коэффициент превышает 0, 75. В том случае, когда данный показатель не достигает указанной величины (а это не редкость при разработке теста), составителю необходи­мо выявить, какие именно задания следует переделать или изъять из употребления.

3. Надежность параллельных форм устанавливается, если составителем разработано несколько взаимозаменяемых наборов заданий, то есть тех, которые по своему содержа­нию являются весьма сходными, но не идентичными, напо­миная варианты заданий школьной контрольной работы.

Принятая процедура определения такой надежности предусматривает, что выборка делится на две равные части, затем одной из них предлагается первая форма теста, а дру­гой - вторая. Через некоторое время производится повтор­ное тестирования, но в обратном порядке. Коэффициент надежности устанавливается методом корреляционного анализа результатов обоих тестирований. Его величина не должна быть менее 0, 75. В противном случае становится необходимой проверка степени стандартизированности испытания и изменение содержания тех заданий, которые оказались несоответствующими своим аналогам из парал­лельной формы.

Итак, надежность теста характеризует степень точности измерения, не сообщая о том, что же именно измеряется. Она является предпосылкой наличия другого важного ка­чества - валидности.

Валидность (от англ. «действительный», «пригодный», «име­ющий силу») - комплексная характеристика теста, указыва­ющая на обоснованность и эффективность его применения.

По словам американского психолога, автора фундамен­тального труда «Психологическое тестирование» Анны Анастази (р. 1908): «Валидность теста – понятие указывающие нам, что тест измеряет и на сколько хорошо он это де­лает» [2, с. 126].

В классической тестологии выделяется множество ти­пов валидности. Проанализируем наиболее распространен­ные из них.

1. Содержательная валидность характеризует меру пред­ставленности в тестовых заданиях всего объема измеряе­мой области психических свойств. Ее коэффициент опре­деляется путем экспертного оценивания.

Такая валидность имеет особое значение в критериаль­но-ориентированных тестах (КОРТ) и тестах достижений, о которых речь пойдет ниже.

2. Конструктная валидность отражает степень соотнесе­ния результатов теста с базовыми для него теоретически­ми понятиями (конструктами). Определяется, когда пред­мет измерения существует в неявном, комплексном виде, требует специального анализа.

Например, если тест разрабатывается для установления степени пони­мания речи, то необходимо, как минимум, представлять, какие компоненты образуют этот конструкт. Выберите из предложенного здесь перечня толь­ко те пункты, которые относятся к «пониманию речи»:

v ребенок может ответить на вопросы;

v он очень внимателен при слушании;

v он может пересказать услышанное своими словами;

v он может дословно запомнить текст с первого раза;

v он может составить план текста;

v он задает экспериментатору много вопросов по услышанному...

Очевидно, что только часть из них имеет отношение к рассматривае­мому конструкту. Осуществив анализ проблемы, мы можем в дальнейшем составить задания, отражающие разные аспекты понимания речи.

После этого формулируется ряд гипотез о том, каким образом данные разрабатываемого теста будут коррелиро­вать с широким кругом других тестов, направленных как на близкие конструкты, так и на отдаленные. Гипотезы прове­ряются методами корреляционного и факторного анализа. Подтверждение или опровержение совокупности теорети­чески ожидаемых связей становится характеристикой конструктной валидности теста.

3.Критериальная валидность показывает, как результаты тестирования соотносятся с теми оценками измеряемого качества или свойства, которые получены другими (нетестовыми) способами, а именно: с мнениями специалистов, данными наблюдений и экспериментов, анализом продуктов деятельности испытуемых и т. д.

Она может быть двух типов:

v валидностью текущей, когда результаты теста сопос­тавляются с данными из других источников, собираемых одновременно с тестированием;

v валидностью прогностической (предсказывающей), когда результаты теста сопоставляются с более поздним поведе­нием испытуемого в данной сфере. К примеру, итоги тести­рования учебных достижений в выпускном классе могут быть подтверждены, а могут быть и опровергнуты фактами о поступлении членов выборки в высшие учебные заведе­ния.

Иногда применительно к некоторым из описанных ти­пов валидности употребляют обозначение «эмпирическая валидность». Так называют те из них, при определении степени, выраженности которых использовались статистичес­кие способы анализа данных, то есть коэффициенты вы­числялись путем корреляций.

Каким образом соотносятся между собой характерис­тики эмпирической валидности и надежности?

Если высокая надежность теста свидетельствует, что он точно измеряет нечто, то высокая валидность указывает, что тест измеряет именно то, для чего он был разработан. По­этому коэффициенты валидности не могут превышать зна­чений коэффициентов надежности.

Обе рассмотренные характеристики непременно опре­деляются составителями в ходе подготовки теста. Психолог, использующий тест в своей работе, благодаря этому полу­чает представление о качестве измерения. Следует сказать и о том, что повторную проверку на надежность и валид­ность обычно проходят тесты, заимствованные, переведен­ные на другой язык. Без этого невозможно судить о каче­стве их социокультурной адаптации к новым условиям ис­пользования.

Бывает так, что тест обладает адекватной валидностью и надежностью, но тем не менее, почти не находит примене­ния в исследовательской практике. Это может быть обус­ловлено излишней сложностью процедуры интерпретации, чрезмерно высокими требованиями к квалификации тес­тирующего, значительной трудоемкостью и длительностью применения и т. д. Необходимо считать существенной еще одну характеристику психологического измерения - его экономичность.

Под экономичностью понимают целесообразность применения теста, определяемую наличием допустимого соотношения затрат на тестирование (времени, труда, финансов) и пользы от него.

Сказанное, разумеется, не означает, что тестирование непременно должно быть легким, коротким и «дешевым», пусть даже в ущерб другим качествам измерения. Речь идет именно о допустимом соотношении надежности, валидности и экономичности.

Перейдем к изучению основных видов тестов. Для этого воспользуемся одной из наиболее распространенных классификаций. В зависимости от особенностей интерпретации выполнения тесты подразделяются на два вида:

v ориентированные на статистическую норму;

v критериально-ориентированные (КОРТ).

Первые из них предполагают использование традиционного приема математической статистики - «нормирования» результатов. Что это такое?

Процедура разработки такого теста обязательно предусматривает установление норм его выполнения путем предварительного тестирования репрезентативной выборки лиц, для которых он предназначен. При этом выявляется диапазон тестовых баллов, характерный для низкого уровня развития данного психического свойства или функции, среднего уровня и высокого. В дальнейшем результаты испытуемого сравнивают с данными, полученными при тестировании выборки, определяя тем самым относительное его место в общем ряду.

Следует заметить, что задания ориентированного на ста­тистическую норму теста подбираются таким образом, что­бы итоги их выполнения выборкой приближались к кривой нормального распределения Гаусса. Она имеет такой вид:

Описание подобного распределения результатов может быть сделано с помощью двух показателей: среднего ариф­метического ) и стандартного отклонения (). Оба они получается путем несложных расчетов:

 

 

Где п - число членов выборки, ∑ N- сумма полученных ими результатов, ∑ d сумма значений всех индивидуаль­ных отклонений от среднего арифметического.

Нормальным считается такое распределение результа­тов, при котором в пределах одного стандартного отклоне­ния ) находится 68% испытуемых (то есть 34% мень­ше среднего, 34% больше среднего). Тогда в пределах двух стандартных отклонений останется 94, 45 % испытуемых, а в пределах трех стандартных отклонений - почти все из них (99, 73%). Зачем это все необходимо?

Тем самым и достигается возможность классифициро­вать испытуемых по отношению ко всей популяции, то есть судить о том, что они входят в группу людей с показателя­ми выше или ниже нормы.

Для удобства работы осуществляют преобразование " сы­рых" баллов в стандартные единицы (стандартизацию). Сохраняя относительные позиции испытуемых, изменяют среднее арифметическое и стандартное отклонение путем добавления некоей константы к каждой отдельной вели­чине. В психологии широко используется несколько таких 70 шкал стандартных норм. Например, шкала Т- величин име­ет среднее арифметическое 50 и стандартное отклонение 10, а, скажем, шкала коэффициента интеллекта имеет сред­нее равным 100, со стандартным отклонением 15 и т.д.

Интерпретируются эти показатели следующим образом: все результаты, которые не выходят за границы ), на­ходятся в пределах нормы. Те же лица, кто по тесту ин­теллекта получил значение К) менее 85, находятся ниже нормы, а те, чьи результаты более 115 - выше нормы, далее, результаты от 115 до 130 интерпретируются как «несколько выше нормы», а от 130 до 145 - «значительно выше нормы». Соответственно классифицируются и результаты, распола­гающиеся ниже нормы.

Критериально-ориентированные тесты не предполага­ют подобного сопоставления данных испытуемых с ито­гами предварительного тестирования выборки. За точку отсчета в них принято не нормальное распределение, а оп­ределенный объем требований общества к психическому и личностному развитие его членов. Этот весьма обоб­щенный по своей природе феномен выражается в разра­батываемой составителями совокупности конкретных кри­териев.

В формулировке каждого такого критерия выделяется две части:

v содержательно-операциональная, четко характеризу­ющая особенности действий испытуемых при выполнении тестовых заданий (типа «объясняет», «вычисляет», «подраз­деляет», «выбирает» и т. д.);

v соотносительно-предметная, детально описывающая гот или иной фрагмент области содержания знания, на ма­териале которого составлены тестовые задания. Обычно эта часть получает конкретизацию в ходе анализа составителя­ми учебных программ, образовательных стандартов, действу­ющих учебно-методических пособий и указаний.

Другими словами, одна часть критерия определяет, как надо сделать работу (каким образом), а другая - что надо сделать из предназначенного для усвоения (какой мате­риал).

Разумеется, не каждая область знания поддается после­довательной формализации для выражения в виде сово­купности критериев. КОРТы, как правило, разрабатываются для диагностики сформированности умственных действий, а также для контроля за состоянием знаний, умений и на­выков обучаемых. В этих случаях их применение позволяет, по словам А. Анастази, осуществлять интерпретацию с упо­ром на то «что индивид может делать и что он делает, а не на то, как он выглядит на фоне других» [2, с. 93].

Заметно большее распространение в настоящее время имеют тесты, интерпретация выполнения которых ориен­тирована на статистическую норму.

В зависимости от предмета измерения выделяют тесты:

v интеллекта, обеспечивающие изучение уровня разви­тия мышления и познавательных процессов в целом;

v способностей, оценивающие обучаемость, возможность и легкость овладения определенными знаниями, умениями и навыками. Сюда относят тесты общих и специальных спо­собностей;

v достижений, определяющие обученность, то есть уро­вень овладения знаниями, умениями и навыками в какой- либо области (учебной, профессиональной, спортивной);

v личности, направленные на изучению различных ас­пектов личностного развития, таких как интересы, мотивы, эмоции, отношения и др.;

v межличностные, предусматривающие оценку челове­ческих отношений в группе, выявление специфики комму­никативных процессов.

По характеру тестовых заданий различают следующие виды тестов:

v вербальные, материал которых представлен в словес­ной форме;

v образные, где работа испытуемых производится с ри­сунками, схемами на основе возникающих при этом на­глядных представлений;

v практические, выполняемые при манипулировании реальными объектами или их заместителями;

v комбинированные, объединяющие в себе как вербаль­ный, так и невербальный материал заданий.

По форме предъявления заданий тесты подразделяются на бланковые («бумаги и карандаша»), аппаратурные, рису­ночные и устные.

В зависимости от количества испытуемых тесты делятся па индивидуальные и групповые.

По времени выполнения тесты бывают двух видов:

v скорости, в которых основным показателем работы испытуемых является темп решения заданий. Оценивается либо общее количество правильно выполненных заданий за отведенное время, либо объем времени, затраченного на выполнение теста;

v результативности, где показатель скорости работы ис­пытуемых не имеет соотнесения с результатами тестирова­ния, не влияет на них. Временное ограничение (если оно есть) не является жестким, оно служит лишь целям обес­печения стандартизации процедуры измерения.

Следует заметить, что в психодиагностической практике наряду с тестами находят активное применение личност­ные опросники. Это методики, задания которых представлены в виде вопросов или утверждений. Задача испытуемого - дать письменные или устные ответы, сообщить информа­цию о себе, выразить отношение, сформулировать мнения.

По своей сути, опросники предполагают осуществление испытуемым субъективного самоотчета. От анкет, которые будут детально рассмотрены нами в дальнейшем, личност­ные опросники отличаются следующим:

1) направленностью на изучение психологических осо­бенностей;

2) стандартизацией процедур применения и интерпре­тации;

3) опорой на содержание определенной научной кон­цепции, теории;

4) наличием норм выполнения или соответствующих критериев развития, по отношению к которым осуществ­ляется стандартизация индивидуальных результатов.

5) проверкой степени валидности и надежности.

Все это, а также нередко более искусная постановка воп­росов, маскирующая их диагностическую специфику, и тща­тельная разработка контроля за достоверностью и искрен­ностью ответов («шкалы лжи»), позволяют считать их «тестами-опросниками» [10, с. 53], а не методиками самонаблюдения или традиционного опроса.

Примерами таких тестов-опросников являются Миннесотский многоаспектный личностный перечень (ММРI), раз­работанный С. Хатуэем и Дж. Маккинли в 1940 году и до сих пор широко использующийся в клинической психоди­агностике. Патохаракгерологический диагностический опросник (ПДО), предложенный А.Е. Личко (1970) для определения психопатического развития личности и акцентуа­ций характера, методика многофакторного исследования личности Р. Кеттелла (16-ти факторный опросиик) и т. д.

В заключение, необходимо отметить следующее: исполь­зование метода тестов для исследований требует наличия, как общепсихологических знаний, так и компетентности в области теории и практики измерения. Дело в том, что изучение сложных психических феноменов не сводится к чи­сто «технической» деятельности по предъявлению заданий и регистрации решений. Недостаток квалификации неред­ко оборачивается потерей индивидуального подхода, грубейшими дефектами интерпретации результатов, увеличе­нием числа ошибок при организации процедуры испыта­ния.

 

ОСНОВНЫЕ ПОНЯТИЯ: тестирование; тест; стандартизированность; коэффициент интеллекта; надёжность; типы надёжности: ретестовая, параллельных форм, частей теста; валидность; типы валидности: содержательная, конструктная, критериальная, текущая, прогностическая, эмпи­рическая; экономичность; ориентированные на статисти­ческую норму тесты; критериально-ориентированные тес­ты; тесты: интеллекта, способностей, достижений, личности, межличностные, вербальные, образные, практические, комбинированные, бланковые, скорости, результативности; личностные опросники.

 

Вопросы для обсуждения:

1. Чем отличается тестирование от эксперимента? Како­вы его основные особенности?

2. Какие характеристики качества измерения Вам извес­тны? О чем информируют исследователя значения коэф­фициентов каждой из них?

3. Какие существуют разновидности тестов?

 







Дата добавления: 2014-11-10; просмотров: 2788. Нарушение авторских прав; Мы поможем в написании вашей работы!



Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Неисправности автосцепки, с которыми запрещается постановка вагонов в поезд. Причины саморасцепов ЗАПРЕЩАЕТСЯ: постановка в поезда и следование в них вагонов, у которых автосцепное устройство имеет хотя бы одну из следующих неисправностей: - трещину в корпусе автосцепки, излом деталей механизма...

Понятие метода в психологии. Классификация методов психологии и их характеристика Метод – это путь, способ познания, посредством которого познается предмет науки (С...

ЛЕКАРСТВЕННЫЕ ФОРМЫ ДЛЯ ИНЪЕКЦИЙ К лекарственным формам для инъекций относятся водные, спиртовые и масляные растворы, суспензии, эмульсии, ново­галеновые препараты, жидкие органопрепараты и жидкие экс­тракты, а также порошки и таблетки для имплантации...

ИГРЫ НА ТАКТИЛЬНОЕ ВЗАИМОДЕЙСТВИЕ Методические рекомендации по проведению игр на тактильное взаимодействие...

Реформы П.А.Столыпина Сегодня уже никто не сомневается в том, что экономическая политика П...

Виды нарушений опорно-двигательного аппарата у детей В общеупотребительном значении нарушение опорно-двигательного аппарата (ОДА) идентифицируется с нарушениями двигательных функций и определенными органическими поражениями (дефектами)...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия