Выделение единиц отбора и анализа
Единицы отбора - элементы выборочной совокупности, выступающие единицами счета в различных процедурах отбора, формирующих выборку. Единицы наблюдения - элементы сформированной выборочной совокупности, с которых непосредственно ведется сбор социальной информации. ЕО и ЕН могут совпадать (это происходит, когда схема отбора достаточно проста) и различаться (в случае сложных, комбинированных схем отбора). Репрезентативность выборки (представительность) – свойство выборки отражать наиболее важные, с точки зрения исследования, характеристики ген. совокупности. Каждый элемент генеральной совокупности должен иметь равные возможности попасть в выборку! Выбор типа выборки. Существует три больших класса выборок: А) Сплошные выборки (переписи, референдумы) - опрашиваются все единицы из генеральной совокупности. В) Случайные: • Вероятностная выборка. Основной принцип вероятностной выборки – все элементы ГС должны иметь равные возможности попасть в выборку. При соблюдении этого принципа согласно закону больших чисел элементы ГС будут представлены в выборке с вероятностями, приближенными к их распределению в ГС. Методы собственно случайного отбора: Основой выборки является полный список всех единиц отбора. Далее осуществляется выбор единиц при использовании одного из двух способов. 1. Случайная повторная выборка. Выбор единиц осуществляется путем вытаскивания карточек из общей массы (карточки тщательно перемешаны) по одной, причем каждая карточка после записывания ее номера возвращается на место. Процедура повторного отбора практически не используется в социологии, но в практических расчетах используются формулы для оценки параметров ГС, полученные в предположении, что осуществляется повторный отбор. 2. Простая бесповторная выборка. Респонденты отбираются точно так же, но карточки не возвращаются в колоду, а откладываются в сторону. • Систематическая выборка - упрощенный вариант вероятностного отбора. Основой выборки являются списки всех элементов ГС. Отбор единиц осуществляется через один и тот же интервал k = N/n, причем первая единица определяется случайным образом (например, по таблице случайных чисел). Ошибка репрезентативности рассчитывается по формулам простой случайной выборки. Это экономный и удобный способ формирования ВС, однако, необходимо учитывать возможность систематического распределения в списках единиц различного типа. Если такое распределение имеется, выборка может оказаться существенно искаженной. • Гнездовая выборка (серийная). Единицы отбора в данном случае представляют собой статистические «гнезда», т.е. совокупности статистически различимых единиц (семья, бригада, школьный класс и т.д.). Отобранные в выборку «гнезда» подвергаются сплошному обследованию. Основное преимущество: значительно легче произвести отбор и изучение нескольких коллективов, находящихся в одном месте, чем нескольких сотен людей, разбросанных в пространстве. Отбор коллективов может производиться по схемам простой случайной и систематической выборок, а также после предварительного районирования ГС. Метод маршрутного опроса - одна из разновидностей гнездовой выборки, когда единицей наблюдения выступает семья. На карте населенного пункта нумеруются все улицы. С помощью таблицы случайных чисел отбираются большие числа, идентифицирующие семьи или квартиры. Пример: число 42253 указывает на 42 улицу, 25 дом, квартиры под номерами 3, 13, 23 и Т.д. Если улицы очень длинны, можно также выбирать дома под номерами 25, 125 и Т.д. В выбранной квартире опрашиваются все люди. • Районированная выборка (стратификационная, расслоенный отбор) - это вероятностная выборка с любой техникой отбора, когда процедурам отбора ЕН предшествует разделение ГС на однородные части. Районирование в статистическом смысле - это выделение такого числа и таких статистически однородных групп, чтобы колебание изучаемых признаков внутри этих групп была меньше, чем между ними. Дифференциация внутри ГС на качественно более однородные группы содержательно связана с предметом исследования. В качестве типических группировок районирования могут быть использованы: 1. естественные образования: экономико-географические регионы, области, классификация городов по численности; 2. специально формируемые образования: выделение в ГС нескольких групп по содержанию труда (исследование отношения молодежи к труду). Признак, на основании которого производится расслоение ГС, называется признаком расслоения или районирования. С) Неслучайная выборка: • Стихийная выборка - выборка "первого встречного" или опросы с помощью радио-, теле- и анкет в печатных СМИ. Невозможно уточнить, какую ГС представляет такая выборка, поэтому оценка ее репрезентативности также невозможна. • Метод основного массива: применяется в разведывательных исследованиях, для зондажа какого-нибудь контрольного вопроса в тех случаях, когда ГС не слишком велика и более-менее компактно локализована территориально и во времени. Опрашивается примерно 50-60% ГС. • Метод "снежного кома": используется в тех случаях, когда необходимо провести опрос какой-либо специфичной группы респондентов, определить границы которой, а также людей, входящих в нее, невозможно. Исследователь находит нескольких респондентов (например, на улице или по телефону при помощи вопросов-фильтров) и просит их назвать других людей, подходящих для исследования. Репрезентативность этой выборки оценить сложно, но она является оптимальной (по соотношению точности и затрат) для исследования различных неформальных групп, религиозных конфессии, потребителей специфичных товаров и т.д. Иногда из совокупности, сформированной методом "снежного кома", респонденты выбираются при помощи вероятностных методов. • Квотная выборка - модель, воспроизводящая структуру ГС в виде квот (пропорций) распределения изучаемых признаков. Число единиц (элементов ВС) с различным сочетанием изучаемых признаков определяется с таким расчетом, чтобы оно соответствовало их доле (пропорции) в ГС. Для формирования такой выборки необходимо иметь подробную информацию о ГС, причем самым сложным моментом является географическое соотнесение выборки, Т.е. определение, какие конкретно населенные пункты включать в выборку. Два способа задания квот: 1. задание обязательного набора признаков, которым должен обладать каждый респондент и нужного числа респондентов; 2. перечисление независимых характеристик контингента, подлежащего опросу в определенном населенном пункте. Формирование модели квотной выборки полностью соответствует условиям вероятностного отбора, однако при сборе информации возникает опасность систематических смещений, т.е. интервьюеры могут свободно выбирать респондентов, руководствуясь лишь заданными параметрами. Можно придумать многочисленные ВС, например, пациенты больниц или путешествующие по железной дороге, которые по своему половому, возрастному, профессиональному, региональному составу будут в точности соответствовать пропорциям взрослого населения страны, однако такие ВС, естественно, не будут репрезентативными. Действительная функция квот заключается в том, чтобы содействовать интервьюеру в проведении случайного отбора. Для того, чтобы обеспечить статистически нейтральный состав респондентов, необходимо давать интервьюеру как можно более трудные квоты, заставляющие его, во-первых, выходить за пределы своей социальной группы, во-вторых, производить более случайный отбор. Однако слишком строгие предписания могут направить интервьюера по пути фальсификации результатов. Оптимальное число квотируемых признаков - четыре. • Панельный метод - опрашивают одних и тех же через определенное время. Обоснование объема выборки. Объем выборки - общее число единиц наблюдения, включенных в ВС. Универсального решения в данном случае нет. Основные требования: 1. Чем более однородной является ГС, т.е. чем ниже ее дисперсия, тем меньше может быть объем выборки. 2. Чем более точными должны быть результаты, т.е. чем ниже требуется ошибка репрезентативности, тем больше должен быть объем выборки. 3. Если объекты выборки должны быть классифицированы достаточно подробно, объем должен быть велик настолько, чтобы в каждую выделенную группировку попало достаточно количество элементов. Информация о распределении признаков в ГС, о дисперсии, о необходимой подробности классификации имеется далеко не всегда. Существует ряд эмпирических правил определения объема выборки: 1. если величина ГС составляет менее 5000 человек, достаточный объем ВС - не менее 500 человек; 2. если величина ГС 5000 человек и более, достаточный объем ВС -10% ее состава, но не более 2000-2500 человек; 3. выборки объемом 3000 респондентов и более используются лишь для комплексных исследований, а также при сложной структуре ГС. В практике массовых социологических опросов чаще всего применяются выборки объемом от 1000 до 2000 человек, независимо от того, какой объем имеет ГС. Наиболее эффективна в соотношении точности результатов и стоимости опроса выборка в 2000 человек, позволяющая утверждать, что с вероятностью 95% доля исследуемого признака в ГС отличается от полученного значения доли этого признака в ВС не более чем на 2,24%. Для увеличения точности в 2 раза необходимо увеличить объем выборки до 7000 человек, что значительно удорожает исследование. В то же время выборка объемом 1000 респондентов дает с вероятностью 95% отклонения величиной в 5%. Погрешность выборки. Случайные и систематические ошибки. Ошибки выборки - отклонение статистической структуры выборки от структуры соответствующей ГС. Основные типы ошибок: Случайные ошибки: 1. статистические погрешности, органически присущие выборочному методу; их причина - различие размеров ГС и ВС; их величина поддается измерению - это ошибка репрезентативности; ее нельзя избежать, но всегда необходимо учитывать; некоторые социологи полагают, что максимально допустимая величина ошибки репрезентативности - 5%, однако это справедливо не для любого исследования и часто является слишком грубой погрешностью; 2. ошибки, вызываемые случайными нарушениями в процедурах сбора информации; причины: • ошибки подстановки - замена намеченных по плану ЕН другими, более доступными; например, если интервьюер должен обращаться в каждую 10-ю квартиру, он может, не застав в нужной квартире никого дома, постучать в соседнюю; в этом случае может оказаться перевес пенсионеров, больших семей, и недостача одиноких лиц и малочисленных семей; необходимо строго контролировать интервьюеров; • неполный охват выборочной совокупности: недополучение анкет, не полностью заполненные анкеты и т.д. Систематические ошибки: основные причины: - неадекватность сформированной выборки задачам исследования; - незнание характера распределений в ГС и выбор неадекватных процедур отбора; -сознательный отбор наиболее удобных и «выигрышных» элементов ГС, не представляющих ее в целом.
Тема 59. Контент-анализ как один из методов анализа документов Контент-анализ (от английского contens - содержание) - специальный достаточно строгий метод качественноколичественного анализа содержания документов в целях выявления или измерения социальных фактов и тенденций, отраженных этими документами. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Применять контент-анализ начал еще в 30-х годах известный социолог Г. Лассуэл в сфере политики и пропаганды, но широкое распространение он получил, начиная с 50-х годов, когда в США вышел фундаментальный труд Б. Берельсона «Контент-анализ в коммуникационных исследованиях». Этот вид анализа документов был ориентирован на извлечение социологической информации из больших массивов документальных источников, трудно поддающихся традиционному интуитивному анализу. Он основан на выявлении определенной совокупности количественных, статистических характеристик текстов (или сообщений). При этом предполагается, что количественные характеристики, содержания изучаемых массивов документов отражают некоторые существенные особенности изучаемых социальных явлений, например, тематика телепередач, время, отводимое для тех или иных тем телевизионными компаниями, отражают в то или иной степени интересы зрительской аудитории. Не все документы могут выступать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования посредством контент-анализа выступают сообщения печати, радио, ТВ, массовой устной агитации и пропаганды, протоколы собрания, письма, приказы, распоряжения и т. д., а также данные свободных интервью и открытые вопросы анкет. В социологических исследованиях используют два метода контент-анализа: качественный и количественный. Качественный контент-анализ основан на использовании нечастотной модели содержания текста, позволяет выявить типы качественных характеристик содержания текста вне зависимости от частоты встречаемости каждого из этих типов. Количественный контент-анализ основан на использовании количественных мер, его задача - получить количественную характеристику содержания изучаемого текста. Основные направления использования. Существуют три основных направления применения контент-анализа: 1. Выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта - окружающей действительности, автора, адресата); 2. Определение того, что существует только в тексте как в таковом (различные характеристики формы - язык, структура, и жанр сообщения, ритм и тон речи); 3. Выявление того, что будет существовать после текста, т. е. после его восприятия адресатом (оценка различных эффектов воздействия). Инструментарий метода контент-анализа, его основные параметры. В разработке и практическом применении к-а. выделяют несколько стадий: формулировка темы исследования, объекта, предмета, целей, задач и гипотез исследования приступают к определению логической модели анализа. Содержательным ядром контент-анализа выступает логическая модель предмета анализа, в которую включены 3 элемента: 1) категориальная модель предмета анализа; 2) система единиц анализа; 3) меры (единицы) измерения. 1) Категориальная модель предмета анализа включает в себя параметры и категории анализа, отражающие признаки изучаемого объекта, их основные характеристики и аспекты, соответствующие целям и задачам социологического исследования. При этом параметры - соответствуют признаку объекта исследования, а категории анализа - значению данного признака. Например, в coц. исследовании «Активизация экономического поведения различных групп населения Беларуси, одним из параметров может служить «Предпринимательство», а категориями будут «Предприниматель», «Средний бизнес», «Малый бизнес», «Рынок товаров» и т. д. Выбранные категории должны быть: - исчерпывающими (охватывать все части содержания текста); - взаимоисключающими (одни и те же части не должны принадлежать разным категориям); - надежными; - уместными (соответствовать поставленной задачи). При выборе категорий анализа необходимо избегать 2-ух крайностей: выбора слишком многочисленных и дробных категорий, и выбора слишком крупных категорий это может привести к упрощенному, поверхностному анализу. 2) Система единиц контент-анализа (смысловые единицы) – иерархизированная совокупность единиц анализа. К числу наиболее часто употребляемых относятся: - понятие, выраженное отдельным словом, термином или словосочетанием; - тема, выраженная в единичных суждениях, смысловых абзацах, целостных текстах; - персонаж - герой некоего действия или отношений, отраженных в изучаемом тексте; - ситуация (экологическая, экстремальная и т. д.); - действие, осуществляемое отдельными индивидами или группами, в пределах избранной для к.а. темы. 3) Меры (единицы) измерения (единицы счета). Это могут быть единицы протяженности, располагаемые в координатной сети пространство-время. Т. е. измерение текста в сантиметрах, либо в числе отведенных на него строк, а также измерение в количестве минут, которые занимает эфирное время телевизионного сообщения. Единицей измерения может служить частота появления искомого признака в тексте. Выбор источников, подвергаемых к-а. Проблема выборки содержит в себе выбор источника, числа сообщений, даты сообщения, и исследуемого содержания. Все параметры выборки определяются задачами и масштабами исследования. Чаще всего к-а. проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев); если это изучение сообщений СМИ - 12, 16 номеров газет или теле-, радиодней. Обычно выборка сообщений СМИ составляет 200-600 текстов. Процедура контент-анализа, включает в себя ряд операций: 1. Разработка таблицы контент-анализа - основной рабочий документ. Таблица это система скоординированных и субординированных категорий анализа. 2. Инструкция кодировщика - система правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя заданные единицы анализа. В инструкции точно определяется алгоритм действий кодировщика, дается операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, и как следует поступать в спорных случаях. Регистрация единиц анализа проводится в специальных таблицах, кодированных карточках или матрицах. 3. Кодированная карточка - третий документ для проведения к.-а. Она содержит все единицы анализа - параметры и категории, обозначаемые определенным кодом. В этой кодировочной матрице каждый вертикальный столбец означает отдельный документ (присвоенный ему номер), а каждая горизонтальная строчка - категории единицы измерения, выраженные в кодах. Также существуют специальные процедуры подсчета - формула коэффициента Яниса, предназначенного для вычисления соотношения положительных и отрицательных оценок, суждений, аргументов. Слабые и сильные стороны контент-анализа и его соотношение с другими приемами социологического анализа документов. «+» 1. Использование контент-анализа при изучении больших текстовых массивов. Чаще всего к.-а. используется при изучении сообщений, транслируемых на массовую аудиторию газетами, радио, телевидением. «-» 1. Главный недостаток - проблема получения достоверной информации из биографических материалов, а при изучении человеческой деятельности в документах почти не отражается ее процесс, только результаты. Как и всякое иное методическое средство к.-а. может дать положительный эффект, если он соответствует целям и задачам изучения определенного социального процесса или явления, если он проводится квалифицированно с соблюдением все правил.
62.. Анкета как базовый инструмент социологического исследования Анкетирование - письменная форма опроса, осуществляющаяся, как правило, заочно, Т.е. без прямого и непосредственного контакта интервьюера с респондентом. Анкетирование - процедура заполнения анкеты респондентом. Для повышения качества информации следует соблюдать ряд требований, касающихся организации анкетных опросов (выбор объекта, учет ситуации и виды опроса) и правил поведения анкетера на объекте при проведении анкетных опросов. Особенности поведения анкетера: анкетер не должен допускать дискуссий по теме, навязывать свою точку зрения по проблеме, а также комментировать ответы на вопросы анкеты. Запрещать заставлять принимать участие в исследовании, торопить респондентов с ответами. Социологическая анкета как опросный документ. Анкета - социологический инструментарий, представляющий собой определенным образом структурированную систему вопросов, логически связанную между собой, а также с задачами и целями исследования. Логико-концептуальная схема анкеты. Анкета должна состоять из трех частей: 1. Вводная часть. Главная функция вводной части - пробудить желание респондента отвечать на вопросы анкеты. Вводная часть начинается с обращения к опрашиваемому и содержит: 1. Обращение. 2. Данные организации (учреждения), проводящей опрос. 3. Цель и задачи исследования, а также практическое значение решения этих задач. 4. Значимость роли респондента для решения этих задач. 5. Гарантию анонимности 6. Указание о технике заполнения анкеты. 7. Выражение благодарности, высказываемое авансом опрашиваемому, которое побуждает его заполнить анкету. Вводная часть не должна быть очень большой, но обязательно ясной и понятной для любого респондента, мотивирующей его на участие в опросе. Хотя эта часть небольшая по объему, она очень важная. От того, как составлено обращение, зависит отношение к анкете респондента.
|