Студопедия — Критерии качества измерения.
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Критерии качества измерения.






Достоверность результатов исследования зависит, в основном, от качества первичного измерения социальных характеристик. Качество отдельных индикаторов, суммарных показателей (индексов) и шкал определяются их надежностью и валидностью.

2.

Надежность измерения – его устойчивость и воспроизводимость.

Повторяемость (диахронная, ретестовая надёжность)

Отражает результаты повторного применения одного и того же показателя для одной и той же выборки случаев в разные моменты времени.

Повторное измерение

Согласованность

Отражает меру согласованности результатов измерения одного показателя несколькими индикаторами

Расщепление шкалы

Проверка корреляции с суммарным баллом

Факторный анализ

Путевой анализ

Повторное измерение: Один и тот же объект измеряется дважды с двух-трехнедельным временным интервалом с помощью одинаковой процедуры. Шкала считается устойчивой, если совпадения между первой и второй сериями измерений будут достаточно высокими (коэффициент корреляции должен быть не ниже 0,8).

Недостатки повторного измерения:

1. Сложность проведения повторных замеров на больших выборках.

2. Не учитывается тот факт, что истинное значение переменной с течением времени может изменяться.

3. Влияние на ответы респондентов психологической установки, возникшей после предыдущего замера (стремление дать исследователю “новые данные”).

Расщепление шкалы: Индикаторы - вопросы, предположительно измеряющие ту или иную характеристику, в случайном порядке разбиваются на два равных списка и предъявляется группе испытуемых. Далее подсчитывается коэффициент корреляции между результатами одних и тех же испытуемых по разным "половинам" теста: чем выше его значение, тем согласованнее оценки истинного значения интересующей социолога переменной. В случае необходимости "выпадающие" индикаторы следует заменить, чтобы получить приемлемую корреляцию.

Проверка корреляции с суммарным баллом: определяется величина коэффициента корреляции каждого из индикаторов с суммарным значением индекса, высокое значение коэффициента говорит о пригодности конкретного индикатора.

Валидность (обоснованность) измерения, - соответствие измерения его цели.

Таким образом, валидность инструмента измерения состоит в однозначности и правильности получаемых результатов относительно измеряемого свойства объектов, т.е. относительно предмета измерения.

Валидность по содержанию

Определяет полноту операционализации теоретического понятия

1. Экспертная оценка

2. Метод параллельных панелей

3. Метод нескольких судей

Критериальная валидность

Показывает, насколько хорошо результаты по одному тесту или индикатору согласуются с результатами другого показателя, называемого критерием

1. Тест по "эталонной группе"

2. Поиск независимого критерия

3. Конструктная валидность

Метод параллельных панелей: Используется две или три группы специалистов, которые проводят всю процедуру валидации по содержанию, т.е. сравнивают существующие дефиниции, составляют список возможных индикаторов и оценивают их репрезентативность по отношению к исследуемой концептуально области. Если сравнение индикаторов, независимо отобранных в двух и более группах экспертов обнаруживает много совпадений, можно говорить о высокой содержательной валидности.

Метод нескольких судей: Используется в случаях, когда переменная-признак, которую предполагается измерить имеет многомерную структуру, т.е. относится сразу к нескольким предметным областям. Использование экспертов в каждой из этих областей позволяет выявить существенные факторы, входящие в шкалу, оценить их сравнительную значимость и найти релевантные эмпирические показатели.

Тест по "эталонной группе";: Состоит в сопоставлении данных, полученных путем измерения по шкале, с достоверными сведениями об объекте измерения (переменная-предиктор). В качестве показателя критериальной валидности используется точность, с которой значения переменной, полученные по проверяемой шкале, могут быть предсказаны на основании текущих значений переменной-предиктора. Поэтому другое название процедуры валидации - прогностическая критериальная валидность. Например, шкала измеряющая отношение к соблюдению норм права может быть обоснована опросом осужденных правонарушителей (они рассматриваются как "эталон" негативного полюса шкалы), в сравнении с "эталонной" группой законопослушных граждан. Дихотомизация полярных групп по шкале должна совпадать с фактической поляризацией эталонной группы.

Поиск независимого критерия: Определяется степень соответствия между значениями измеряемой переменной и индикатором, имеющим доказанную обоснованность (сравнение ответов респондентов с данными статистики, и т.п). В качестве критерия могут быть использованы и результаты измерения интересующей социолога характеристики, полученные по другой шкале, поэтому этот способ называют также конкурентной валидностью.

Конструктная валидность: Оценка индикатора основана на том, насколько хорошо его результаты соответствуют "теоретическим ожиданиям". Так, при проверке валидности шкалы групповой сплоченности, основываясь на существующих теоретических представлениях, социолог предполагает, что большей сплоченности соответствует меньшая частота открытых конфликтов и большая интенсивность коммуникаций. Сравнив различные по уровню сплоченности группы и определив для них значения других двух переменных (частота конфликтов и коммуникаций), исследователь может сделать вывод о том, насколько хорошо его шкала отражает интересующую социальную характеристику. Если связи переменных соответствуют предсказаниям теории, считается, что шкала валидна, т.е. измеряет именно интересующую теоретическую переменную.

4.

Понятие качества измерения тесно связано с так называемыми случайными и систематическими ошибками измерения.

Случайные ошибки - ошибки, которые никаким систематическим образом не связаны друг с другом или какими-то систематически действующими внешними переменными (пол, возраст и т.д.). Типичные источники таких ошибок - колебание внимания респондента, неоднозначность формулировки вопроса, ведущей к различию к его восприятию в разных случаях; несистематические отличия в проведении интервью; различия в кодировании открытых вопросов; ошибки ввода данных.

Систематические ошибки обычно связывают с понятиями правильности измерения и дифференцирующей способности шкалы (это относится к качеству инструментария).

Свидетельством и проявлением систематических ошибок служат показатели:

· Отсутствие разброса ответов по значениям шкалы. Попадание ответов в один пункт свидетельствует о полной непригодности измерительного инструмента—шкалы. Такая ситуация может возникнуть или из-за “нормативного” давления в сторону общепринятого мнения, или из-за того, что градации (значения) шкалы не имеют отношения к распределению данного свойства у рассматриваемых объектов (нерелевантны).

· Использование части шкалы. Довольно часто обнаруживается, что практически работает лишь какая-то часть шкалы, какой-то один из ее полюсов с прилегающей более или менее обширной зоной. Для вопросов, имеющих качественные градации ответов, каждая из градаций должна набирать не менее 5% ответов, в противном случае считаем этот пункт шкалы неработающим. Требование 5%-ного уровня наполнения каждой градации шкалы не следует рассматривать как строго обязательное в зависимости от задач исследования могут быть выдвинуты большие или меньшие значения этих уровней.

· Неравномерное использование отдельных пунктов шкалы. Случается, особенно при использовании упорядоченных шкал, что некоторое значение переменной (признака) систематически выпадает из поля зрения респондентов, хотя соседние градации, характеризующие более низкую и более высокую степень выраженности признака, имеют существенное наполнение.

5,

Определение грубых ошибок

В процессе измерения иногда возникают грубые ошибки, причиной которых могут быть неправильные записи исходных данных, плохие расчеты, неквалифицированное использование измерительных средств и т. п. Это обнаруживается в том, что в рядах измерений попадаются данные, резко отличающиеся от совокупности всех остальных значений. Чтобы выяснить, нужно ли эти значения признать грубыми ошибками, устанавливают критическую границу, так чтобы вероятность того, что крайние значения превысят ее, была бы достаточно малой и соответствовала бы некоторому уровню значимости а. Это правило основано на том, что появление в выборке чрезмерно больших значений хотя и возможно как следствие естественной вариабельности значений, но маловероятно.

Если окажется, что какие-то крайние значения совокупности принадлежат ей с очень малой вероятностью, то такие значения признаются грубыми ошибками и исключаются из дальнейшего рассмотрения. Выявление грубых ошибок особенно важно проводить для выборок малых объемов: не будучи исключенными из анализа, они существенно искажают параметры выборки.

 

29. Анализ количественных данных: понятие, цели, последовательность этапов.

. Понятие "анализ данных"

Достаточно глубокое исследование социальной реальности невозможно без опоры на изучение конкретных фактов. Судить о сущности различных социальных явлений или процессов можно лишь на основе имеющихся или специально собранных эмпирических данных.

Эмпирический материал, собранный социологом, подвергается процедуре анализа, главной целью которого является поиск закономерностей функционирования и развития той или иной социальной общности, социального института и т.п. В самом общем виде анализом данных (АД) можно назвать совокупность действий, осуществляемых исследователем в процессе изучения полученных тем или иным образом данных с целью формирования определенных представлений о характере явления, описываемого этими данными. Сфера применения АД в социологии чрезвычайно широка, однако здесь это понятие будет употребляться в узком смысле - в связи с изучением данных с применением математических (статистических) методов.

Применение математического аппарата в анализе данных позволяет достичь следующих целей:

● четко сформулировать свои представления об изучаемом объекте;

● абстрагироваться от множества реальных свойств объекта;

● анализировать большие объемы информации;

● получить научно обоснованное подтверждение содержательных предположений (гипотез) исследования, делать выводы, не лежащие "на поверхности";

● получить возможность экстраполировать (переносить) выводы, полученные в ходе обследования ограниченного числа объектов (выборочной совокупности) на более широкую совокупность (генеральную).

Однако необходимо отметить ряд обстоятельств, которые обуславливают определенную специфику использования статистических методов в анализе социологических данных.

Во-первых, на практике часто нарушается условие вероятностного порождения анализируемых данных. В социологии само определение вероятности в некоторых ситуациях может не иметь смысла.

Во-вторых, не всегда бывает ясно, каковы границы изучаемой генеральной совокупности. Имеется в виду, что даже в рамках одного исследования бывают альтернативные и множественные решения вопроса о генеральной совокупности.

В-третьих, для многих методов анализа не разработаны способы перенесения результатов их применения с выборки на генеральную совокупность.

В-четвертых, интересующие социолога данные, как правило, получены по шкалам низких типов - номинальной или порядковой, таким образом, с конструктами, полученными в результате измерения, исследователь не может обращаться также как с обычными числами.







Дата добавления: 2015-08-27; просмотров: 419. Нарушение авторских прав; Мы поможем в написании вашей работы!



Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Краткая психологическая характеристика возрастных периодов.Первый критический период развития ребенка — период новорожденности Психоаналитики говорят, что это первая травма, которую переживает ребенок, и она настолько сильна, что вся последую­щая жизнь проходит под знаком этой травмы...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Решение Постоянные издержки (FC) не зависят от изменения объёма производства, существуют постоянно...

Ведение учета результатов боевой подготовки в роте и во взводе Содержание журнала учета боевой подготовки во взводе. Учет результатов боевой подготовки - есть отражение количественных и качественных показателей выполнения планов подготовки соединений...

Сравнительно-исторический метод в языкознании сравнительно-исторический метод в языкознании является одним из основных и представляет собой совокупность приёмов...

Концептуальные модели труда учителя В отечественной литературе существует несколько подходов к пониманию профессиональной деятельности учителя, которые, дополняя друг друга, расширяют психологическое представление об эффективности профессионального труда учителя...

Studopedia.info - Студопедия - 2014-2024 год . (0.046 сек.) русская версия | украинская версия