Зачем нужна выборка
Правильная выборка — залог успеха и необходимая предпосылка любого опроса, если это не общенациональная перепись населения. Если социолог неправильно составил выборочную совокупность, т.е. группу людей, которую собирается опросить, результаты исследования окажутся неверными, а потому и никому не нужными. Почему нерационально и практически невозможно опрашивать всех людей, составляющих объект исследования? Можно приблизительно рассчитать, во что обойдется сплошной опрос взрослых жителей хотя бы одного городского района с численностью населения, скажем, 200 тыс. чел. Учитывая, что один анкетер (интервьюер) в состоянии опросить не более трех человек в час, при семичасовом рабочем дне его выработка соста- 84 ящих президентских выборах для них предпочтительнее. В течение ряда лет результаты опроса, проводившегося журналом, оказывались настолько точными, что опрос, проведенный в сентябре, казалось, делал ноябрьские выборы малосущественными. Да и как при такой большой выборке могла произойти ошибка? Однако в 1936 г. именно это и случилось: с большим перевесом голосов (60:40) победа была предсказана кандидату от республиканской партии Альфу Ландону. Однако когда выборы состоялись, он потерпел сокрушительное поражение. Иначе говоря, Ландон проиграл Франклину Д. Рузвельту практически с тем же результатом, с которым должен был победить. Доверие читателей к «Литэрари дайджест» было серьезно подорвано, вскоре журнал перестал выходить. Такой оказалась цена методической ошибки. Что же произошло? Все очень просто: в голосовании, проведенном «Дайджест», использовалась смещенная выборка. Почтовые открытки рассылались людям, чьи имена были извлечены из двух источников: телефонных справочников и списков регистрации автомобилей. И хотя прежде этот метод отбора не слишком отличался от других методов, совсем по-другому обстояло дело теперь, после Великой депрессии в 1936 г., когда менее состоятельные избиратели, наиболее вероятная опора Рузвельта, не могли позволить себе иметь телефон, не говоря уж об автомобиле. Таким образом, выборка, использовавшаяся в опросе, организованном «Дайджест», была смещена в сторону тех, кто, скорее всего, должен был выступать за республиканцев, и при этом еще удивительно, что у Рузвельта оказался такой хороший результат. Выборочный метод имеет очевидные преимущества перед сплошным изучением генеральной совокупности, так как сокращает объем работы (за счет уменьшения числа наблюдений), позволяет экономить силы и средства, получать информацию о таких совокупностях, полное обследование которых практически невозможно или нецелесообразно. Но происходит все это лишь в том случае, если соблюдаются научные правила выборочного исследования. Опыт показал, что правильно произведенная выборка довольно хорошо представляет или репрезентирует (от лат. represento — представляю) структуру и состояние генеральной совокупности. Однако полного совпадения выборочных данных с данными обработки генеральной совокупности, как правило, не бывает. В этом и заключается недостаток выборочного метода, на фоне которого видны преимущества сплошного описания генеральной совокупности. Ввиду неполного отображения выборкой статистических характеристик (параметров) генеральной совокупности перед исследователем возникает важная задача: во-первых, учитывать и соблюдать те условия, при которых выборка наилучшим образом репрезентирует генеральную совокупность, а во-вторых, в каждом конкретном случае устанавливать, с какой уверенностью можно перенести результаты выборочного наблюдения на всю генеральную совокупность, из которой выборка взята. Репрезентативность выборки зависит от целого ряда условий, и прежде всего от того, как она осуществляется — или планомерно (т.е. по заранее намеченной схеме), или путем непланомерного отбора элементов из генеральной совокупности. В любом случае выборка должна быть типичной и вполне объективной. Эти требования должны выполняться неукоснительно как наиболее существенные условия репрезентативности выборки. Прежде чем обрабатывать выборочный материал, его нужно тщательно проверить и освободить выборку от всего лишнего, что нарушает условия репрезентативности. В то же время при образовании выборки нельзя поступать по произволу, включать в ее состав только те варианты, которые кажутся типичными, а все остальные браковать. Доброкачественная выборка должна быть объективной, т.е. производиться без предвзятых побуждений, при исключении субъективных влияний на ее состав. Выполнению этого условия репрезентативности отвечает принцип рандомизации (от англ. randomization), или случайного отбора элементов из генеральной совокупности. Этот принцип положен в основу теории выборочного метода и должен соблюдаться во всех случаях образования репрезентативной выборочной совокупности, не исключая и случаев планомерного или преднамеренного отбора. 2.2. Основные понятия и сущность выборочного метода При построении социологической выборки используется множество специальных терминов, в том числе два важнейших — генеральная и выборочная совокупности. Совокупность, из которой отбираются варианты для совместного изучения, называется генеральной, а отобранная из генеральной совокупности часть ее членов носит название выборки, или выборочной совокупности. Объем генеральной совокупности обозначается символом N, а объем выборочной совокупности — п. Обычно эти символы размещают в заголовке таблице, которая получилась у социолога после анализа данных, либо в подлежащем3 таблицы. Генеральной совокупностью считают все население или ту его часть, которую социолог намерен изучить, совокупность людей, обладающих одним или несколькими свойствами, подлежащими изучению. Часто генеральная совокупность (еще называемая популяцией) настолько крупная, что опрос каждого представителя чрезвычайно обременителен и дорогостоящ. Это те, на кого направлен теоретический интерес социолога (в том смысле, что узнать о каждом представителе генеральной совокупности ученый может только косвенно — на основе информации о выборочной совокупности). В англоязычной литературе дословного аналога термину «репрезентативность» не существует. Вместо него используется другой — «популяция» (population), который, как и русское слово «генеральная совокупность», имеет два значения. Первое — генеральная совокупность, т.е. все люди, на которых мы хотим распространить полученные в своем исследовании выводы и на которых направлен наш теоретический интерес. В англоязычных источниках так и пишут: «population of interest»4. Второе значение — список людей, на основании которого составляется позже выборочная совокупность. Их называют единицами наблюдения. Они считаются элементами генеральной совокупности. Список единиц наблюдения, который нумеруется с использованием таблицы случайных чисел, в отечественной литературе специального названия не имеет, как не имеет он такового и в англоязычной социологии. Выборкой называется совокупность элементов объекта социологического исследования, подлежащая непосредственному изучению. Понятие выборки в статистике и социологии рассматривается в двух значениях. ♦ Выборка (как результат действия) — представительная часть генеральной совокупности, в которой закон распределения признака соответствует закону распределения этого признака в генеральной совокупности. ♦ Выборка (как способ или процесс действия) — способ отбора объектов генеральной совокупности в выборочную. Выборка должна наилучшим образом репрезентировать объект исследования (генеральную совокупность). Выборочная совокупность — уменьшенная модель генеральной совокупности. Иначе говоря, это множество людей, которых социолог опрашивает. В выборку, или выборочную совокупность, входят только те, кого социолог намеревается непосредственно опросить. Представим, что предметом его исследования, т.е. темой, выступает экономическая активность пенсионеров. Все пенсионеры — пожилые люди в возрасте старше 55 (женщины) и 60 (мужчины) лет — будут составлять генеральную совокупность. По специальным формулам социолог рассчитал, что ему достаточно опросить 2,5 тыс. пенсионеров. Это и станет его выборочной совокупностью. Основное правило ее составления гласит: каждый элемент генеральной совокупности должен иметь одинаковые шансы попасть в выборку. Но как этого добиться? Прежде всего надо узнать как можно больше свойств, или параметров генеральной совокупности, например разброс в возрасте, доходах, национальности, местах проживания респондентов. Разброс в возрасте респондентов называется вариацией, конкретные величины возраста — значениями, а совокупность всех значений образует переменную. Таким образом, переменная «возраст» имеет значения от 0 до 70 (средняя продолжительность жизни) и более лет. Значения группируются в интервалы: 0—5, 6—10, 11—15 лет и т.д. Их можно группировать иначе, все зависит от задач исследования. Интервалы значений переменной «возраст» в случае с пенсионерами начинаются с 55 и 60 лет. Все население, целая нация или очень большая социальная группа редко выступают генеральной совокупностью. В большинстве эмпирических исследований социолога интересует частная проблема, например рост числа разводов среди молодых семей в крупных городах или интерес к инвестиционной деятельности среди представителей среднего класса столичного города. Разводы и инвестиционная деятельность — это те темы, которые интересуют конкретного исследователя в данный период времени. Соответственно все люди, втянутые в этот процесс или участвующие в данном событии, будут называться группой интереса5. Их могут быть тысячи или десятки тысяч человек. Они составляют исходную популяцию или генеральную совокупность, из которой социолог строит выборочную совокупность и опрашивает ее. Итак, совокупность людей, на которую вы распространяете свои выводы, называется генеральной совокупностью, популяци- ей, группой интереса (такое название происходит от направленности теоретического интереса ученого). Кого именно относить к генеральной совокупности, определяют цели исследования, а кого включать в выборочную совокупность, решают математические методы. Если социолог намеревается взглянуть на Афганскую войну глазами ее участников, в генеральную совокупность войдут все воины-афганцы, но опрашивать придется небольшую часть — выборочную совокупность. Для того чтобы выборка точно отражала генеральную совокупность, социолог придерживается правила: любой воин-афганец, независимо от места жительства, места работы, состояния здоровья и других обстоятельств, возможно, затрудняющих его поиск, должен иметь одинаковую вероятность попасть в выборочную совокупность. Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам элементов — об их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым. Репрезентативной выборкой в социологии считается такая выборочная совокупность, основные характеристики которой полностью совпадают (представлены в той же пропорции или с той же частотой) с такими же характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентатив- ной выборки — наличие информации о генеральной совокупности, т.е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования. Под репрезентативностью в социологии понимают такие свой-ства выборки, которые позволяют ей выступать на момент опро- са моделью, представителем6 генеральной совокупности. Иными словами, репрезентативная выборка представляет собой микро-косм, меньшую по размеру, но точную модель генеральной сово-купности, которую она должна отражать (по значимым для иссле-дования параметрам). В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выбор- ки, можно без всяких опасений считать применимыми к исходной совокупности. Такое распространение результатов в зарубежной литературе называют генерализуемостью7. Репрезентативным считается такое исследование, при котором отклонение в выборочной совокупности по контрольным признакам не превышает 5%. Практика работы социологов позволяет с достаточной надежностью проводить репрезентативные опросы, руководствуясь элементарными правилами. При пилотажном опросе небольшой генеральной совокупности (например, в рамках факультета численностью до 100—250 чел.) репрезентативным будет сплошное анкетирование. В масштабах вуза достаточно будет опросить 25% от общего числа студентов. Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки. После чего решается вопрос о типе выборки. Типами выборки называются основные разновидности статистической выборки: случайная (вероятностная) и неслучайная (невероятностная). Вместо термина «тип выборки» часто употребляют слова «вид» и «разновидность», что также правильно. Тип выборки говорит о том, как люди попадают в выборочную совокупность, объем выборки сообщает о том, какое их количество туда попало. Методом выборки будем называть способ построения того типа выборки, название которого этот метод носит, например метод вероятностной выборки. В социологии методом называют основной способ сбора, обработки или анализа данных; правила и процедуры, с помощью которых устанавливается связь между фактами, гипотезами и теориями. Для каждого типа выборки разработаны свои математические аппараты и процедуры. Так, в простой случайной выборке все элементы из списка людей, составляющих основу выборки, пронумеровываются и с помощью таблицы случайных чисел из них отбирается искомая совокупность. Для обеспечения репрезентативности требуется полный и точный перечень единиц выборочной совокупности. Этот перечень образует основу выборки. Элементы, предназначенные для отбора, называются единицами отбора. Элемент генеральной совокупности, с которого непосредственно ведется сбор информации, называется единицей наблюдения. Обычно единица наблюдения — это отдельный человек. Отбор из списка лучше всего производить, нумеруя единицы и используя таблицу случайных чисел, хотя ча- сто применяется квазислучайный метод, когда из перечня простого берется каждый w-й элемент. Если основа выборки включает список единиц отбора, то структура выборки подразумевает их группировку, отражающую процентное распределение генеральной совокупности по каким-то важным признакам, например распределение индивидов по профессии, квалификации, полу или возрасту. Структура выборки— процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность. Если в генеральной совокупности, например, 30% молодежи, 50% людей среднего возраста и 20% пожилых, то и в выборочной совокупности должны соблюдаться те же самые процентные пропорции трех возрастов. К возрастам могут добавиться классы, пол, национальности и т.д. Для каждого признака устанавливаются процентные пропорции в генеральной и выборочной совокупностях. Расхождение структуры двух совокупностей ведет к ошибке репрезентативности. Таким образом, структура выборки — процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность. Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объем выборки сообщает о том, какое их количество попало сюда. В программе эмпирического исследования тщательно описывается проект выборки, который в последующем может уточняться. В проекте выборки указываются принципы выделения из объекта той совокупности людей (либо иных источников информации), которые впоследствии будут охвачены опросом; обосновывается техника проведения опроса; указываются подходы к определению достоверности полученной информации (это необходимо для того, чтобы удостовериться в степени правомерности распространения полученных выводов на весь объект исследования). Составление выборки — процесс выбора единиц (людей, организаций и т.п.) из интересующей социолога генеральной совокупности с таким условием, чтобы, проведя свое исследование, ученый мог обобщить полученные результаты снова на всю генеральную совокупность, из которой осуществлялась выборка. Составление выборки — очень сложная процедура, включающая множество действий и этапов, на каждом из которых социолог может допустить ошибку. Ранняя ошибка порождает последующие, нарастает снежный ком искаженной информации, который способен парализовать исследование или свести его ценность к нулю. Цепочка ошибок, сделанных самим ученым, либо одна из них называется систематической ошибкой. Например, даже если вы четко определились с генеральной совокупностью, очень сложно установить, сколько именно человек ее составляют. Или предположим, социолог установил общую численность генеральной совокупности, но он никак не может составить список лиц, представляющих собой основу выборочной совокупности. Если и эта трудность устранена, возникает новая: из списка подлежащих опросу лиц далеко не все доступны опросу. Если все респонденты готовы подвергнуться испытанию, то и в этом случае никто не даст гарантии, что они в последний момент не откажутся, дадут истинные сведения, что на их мнение никто не повлияет и т.п. Таким образом, социологический опрос превращается в рисковый бизнес, где ученого подстерегает множество трудностей, неожиданностей и неприятностей. И все надо уметь преодолевать. Высшей пробой профессионально выполненной работы служит то обстоятельство, что социолог из одной и той же генеральной совокупности может сделать две или три выборки, которые, будучи разными по составу респондентов, дают одинаковые статистические распределения ответов. Если в первой выборке от 60 до 70% респондентов не удовлетворены трудом, то и в трех других процент неудовлетворенных должен быть таким же. Если это так, то вы сделали правильную выборку. В практике эмпирических исследований широко употребляется понятие целевой выборки. Целевые выборки — группы физических или юридических лиц, отвечающие одному или нескольким определенным критериям, устанавливаемым ученым при организации исследования. Респонденты в целевую группу отбираются на основании фильтрующих вопросов, которые и позволяют определить соответствие этим критериям. Например, при исследованиях среди населения критерием отбора в целевую выборку может являться уровень доходов свыше 5 тыс. руб., использование компьютера не реже трех раз в неделю, наличие дома бытовой техники определенной марки. Критерии отбора зависят от задач исследования. Выборка в количественном и качественном исследованиях строится на противоположных принципах. В первом случае она является статистической и основана на поиске гомогенной группы респондентов, совпадающих по главным признакам (например, возраст, пол, класс). Во втором случае стремятся найти непохожих людей, сделать группу респондентов гетерогенной; выбор нового респондента, объекта или ситуации происходит по принципу их противоположности и вариативности. Избегая однородности (гомогенности) выборочной совокупности, ученые таким 92 способом стараются отразить как можно больше аспектов изучаемого явления, осветить его с разных сторон, добиваясь комплексного и всестороннего изучения. Выборка в качественном исследовании называется теоретической. Численность выборочной совокупности варьируется здесь в диапазоне от 20 до 50 единиц. Строгих количественных параметров не существует — они зависят от задач исследования. Правда, негласно социологи используют определенный верхний предел — порог насыщения, который достигается, когда каждое последующее интервью не привносит в изучаемое явление никакого разнообразия, но лишь повторяет данные предыдущих интервью. Это не только порог насыщения, но и точка расхождения двух стратегий. Представители количественной методологии радуются тому моменту, когда каждое последующее интервью начинает повторять предыдущее. С этой точки открываются захватывающие перспективы, как вид из окна, — социолог предчувствует появление тенденции, а возможно, и статистической закономерности. А вот его сопернику тенденции и статистика не нужны. Он ищет несхожесть, разнообразие, неповторяемость. 2.3. Типы и методы выборки К сожалению, в социологической литературе, причем не только в отечественной, но и в зарубежной, не наведен порядок в отношении четкой классификации типов выборки и методов ее получения. Можно встретить самые разные названия для одного и того же типа выборки. Нет единого взгляда на то, как разделяются выборки на главные и второстепенные типы, что куда относится. Кратко охарактеризуем точку зрения группы известных социологов. В ставшей уже классическим учебником книге «Социологическое исследование» В.А. Ядов не дает четкой схемы распределения типов выборки по группам и видам. Однако из контекста ясно, что автор выделяет: 1) репрезентативную статистическую выборку и 2) целевую аналитическую выборку8. При небольших по численности генеральных совокупностях применяют одну из разновидностей первого типа — случайную бесповторную выборку, при больших генеральных совокупностях используют многоступенчатый отбор по районам. Г.Г. Соколова9 различает следующие способы формирования выборочной совокупности: а) метод типичных отдельных случаев, называемый также монографическим; б) статистические выборочные методы. Последние можно разделить на две основные группы: выбор по усмотрению (неслучайный) и случайный (вероятностный) выбор. Выбор по усмотрению подразделяется на целенаправленный и выбор по квотам. Квотная выборка строится как модель, воспроизводящая структуру генеральной совокупности в виде квот (пропорций) распределения изучаемых признаков. При целенаправленной выборке из генеральной совокупности выбираются типичные элементы с тем, чтобы таким образом получить уменьшенную модель генеральной совокупности. Случайный (вероятностный) выбор подразделяется на: чисто случайный, выбор слоями (районирование), выбор гнездами (серийный). Н.Н. Чурилов предлагает типологию выборки, которую с некоторыми оговорками можно считать наиболее распространенной в отечественной социологии или, скажем так, популярной. К случайным выборкам он относит: 1) вероятностную, 2) систематическую, 3) районированную (стратифицированную), 4) гнездовую, а к неслучайным — 1) «стихийную», 2) квотную, 3) метод «основного массива»10. Сюда же следует добавить метод «снежного кома». Известный специалист по тендерной социологии Г.Г. Силласте1' предлагает иную классификацию. У нее выборка подразделяется на вероятную (случайную) и целенаправленную. К первой относятся четыре метода: 1) собственно случайный отбор (для генсовокупности не более 800 единиц), который подразделяется на а) случайно-бесповторный и б) случайно-повторный методы; 2) механическая выборка; 3) серийная выборка; 4) гнездовая выборка. Во вторую включены: 1) репрезентативная, 2) квотная и 3) стихийная выборки (рис. 2.1). В статистической науке в зависимости от способа отбора различают выборки следующих типов: 1) случайная выборка с возвратом; 2) случайная выборка без возврата; 3) механическая; 4) типическая; 5) серийная В маркетинге, по мнению Е.П. Голубкова, при формировании выборки используются вероятностные (случайные) и невероятностные (неслучайные) методы. Если все единицы выборки имеют известный шанс (вероятность) быть включенными в выборку, то выборка называется вероятностной. Если эта вероятность неизвестна, то выборка называется невероятностной. Вероятностные методы включают: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор. Простой случайный отбор может осуществляться с помощью следующих методов: формирование выборки вслепую и с помощью таблицы случайных чисел12. Обобщив разнообразные точки зрения, можно заключить, что во всех случаях типы выборки делятся на вероятностные (случайные) и невероятностные (неслучайные, целевые, целенаправленные). Ярких представителей каждого типа немного, например, случайная безвозвратная выборка явно принадлежит первому 95 типу, а квотная наилучшим образом характеризует достоинства и недостатки второго, невероятностного типа. Гораздо больше таких видов и методов выборки, которые можно отнести к смешанным. Их можно включить и в первый и во второй типы, а можно отнести лишь к одному из них. Ошибки не будет и в том случае, если придумать некий третий тип, назвать его, допустим, комбинационным и занести туда смешанные виды. Их особенность состоит в том, что вероятностные приемы отбора в них присутствуют частично — на одном из этапов, в нарушенном виде (смещенная выборка), в одном из элементов или приемов отбора. Их недостаток заключается в том, что репрезентативность получаемой информации находится под вопросом. Хотя это вовсе не означает, что смешанные типы выборки всегда нерепрезентативны. Они могут быть репрезентативными, а могут и не быть, поэтому объявлять такие типы выборки нерепрезентативными нельзя. В них сложно установить репрезентативность, используя классические статистические приемы. Но кто говорит, что в будущем наука не шагнет дальше, прибавив к традиционным какие-либо нетрадиционные способы определения репрезентативности данных? Описав кратко проблему типологии выборочных методов, перейдем к характеристике наиболее распространенных. 2.4. Методы вероятностной (случайной) выборки Случайная (вероятностная) выборка — это выборка, для которой каждый элемент генеральной совокупности имеет определенную, заранее заданную вероятность быть отобранным. Это позволяет исследователю рассчитать, насколько правильно выборка отражает генеральную совокупность, из которой она выделена (спроектирована). Такую выборку иногда называют еще случайной. Вероятностные методы включают: ♦ простой случайный отбор, ♦ систематический отбор, ♦ кластерный отбор, ♦ стратифицированный отбор. Реализовать случайную выборку можно двумя приемами: лотерейным методом и с помощью таблицы случайных чисел. С помощью случайной выборки строится подавляющее большинство телефонных опросов и опросов на основе избирательных списков. Для построения такой выборки необходимо иметь полный список всех элементов генеральной совокупности. 2.4.1. Простой случайный отбор Простой случайный отбор предполагает, что вероятность быть включенным в выборку известна и является одинаковой для всех единиц совокупности. Он реализуется двумя методами: ♦ отбор вслепую (другое название — метод лотереи или жребия), ♦ отбор не вслепую (происходит с помощью таблицы случайных чисел). Итак, в одном случае вы осуществляете свой выбор не глядя, в другом — все осознавая, но для того, чтобы самому не вмешаться и ничего не испортить, обращаетесь к специальным таблицам. Кроме того, простой случайный отбор подразделяется на две разновидности уже по другому критерию, а именно — возвращению или невозвращению лотерейного шара (вместо него может быть фамилия респондента) обратно в корзину. В этом случае выделяют: ♦ случайный повторный (с возвращением) отбор, ♦ случайный бесповторный (без возвращения) отбор. В чем сходство и различие двух классификаций? В первом случае — вслепую/не вслепую — ученый мог смотреть на то, как осуществляется отбор, хотя никак не мог ему помешать (если отбор проводился вслепую), или выбор осуществляли не его руки, вынимающие из корзины шар, а таблица случайных чисел. Во втором случае — повторный/бесповторный — дело заключается не в исследователе (если отбор проводился не вслепую), а в лотерейном шаре: его либо возвращают для нового выбора, либо не возвращают и продолжают процесс без него. Соединив оба членения простого случайного метода в декар-тову систему координат, получим четыре модальности (рис. 2.2). Сразу оговоримся, что получившаяся схема не является в строгом смысле изображением логического квадрата, с помощью которого принято показывать отношения совместимости, эквивалентности, противоположности (контрарности), частичной совместимости (субконтрарности), подчинения и противоречивости суждений. В нашей схеме лишь некоторые квадраты дают новый тип случайного отбора или свидетельствуют о том, что данная комбинация действий осуществима. При использовании метода выборки вслепую единицы генеральной совокупности (фамилии, названия или просто номера из списка) можно вносить в карточки, а карточки в перемешанном виде поместить в какую-то непрозрачную емкость (ящик, коробку). Из этой емкости кто-то случайным образом вы-тягивает число карточек, определяемое объемом выборки. После каждого вытягивания и регистрации карточки ее можно возвра-97 щать, а можно не возвращать назад. В первом случае говорят о повторном, во втором — о бесповторном отборе. Их комбинация дает два квадрата, имеющих реальное содержание: можно вслепую выбирать из корзины шары и возвращать их для нового выбора, а можно их откладывать в сторону. Однако выборка не вслепую предполагает использование таблицы случайных чисел. Возвращать в нее выбранный номер невозможно, стало быть, образуемые вдоль этой оси квадраты не являются реальными. Предлагаемая схема выполняет скорее мнемоническую функцию, помогая лучше запомнить материал. Можно также считать, что она имеет демонстративный смысл, но никак не логический. Она придумана для того, чтобы внести какую-то ясность в типологию разновидностей простого случайного отбора. Вероятностную выборку целесообразно применять только при наличии соответствующих условий. Первое условие осуществления вероятностной выборки — наличие полного списка всех элементов генеральной совокупности (отсутствие или недоступность которого чаще всего и препятствует ее реализации) от 1 до N, где N— общее число всех элементов. Если же он имеется, то производится нумерация, после чего можно использовать вышеописанные методики. При использовании лотерейного метода (или метода жребия) жетоны с номерами всех элементов помещают в урну, тщательно перемешивают и извлекают последовательно п жетонов, где п — число элементов выборочной совокупности. Элементы генеральной совокупности, имеющие номера, оказавшиеся на извлеченных жетонах, будут составлять выборочную совокупность. Это довольно рудоемкая и продолжительная (при больших размерах выборки) операция, к тому же достаточно трудоемкая, поскольку «для обеспечения равного шанса выбора требуется тщательное перемешивание жетонов»13 после каждой выемки очередного номера. Второе условие вероятностной выборки —хорошая перемешан-ность элементов генеральной совокупности. Если выборка элементов производится из ящика, то его содержимое следует тщательно перемешать и уже после этого брать карточки случайным образом. Только при таких условиях все они имеют одинаковую вероятность попасть в выборку. Часто для образования случайной выборки элементы генеральной совокупности предварительно нумеруются, а каждый номер записывается на отдельной карточке. В результате получается пачка карточек, число которых совпадает с объемом генеральной совокупности. После тщательного перемешивания из этой пачки берут по одной карточке. Объект (респондент), имеющий одинаковый номер с карточкой, считается попавшим в выборку. При этом возможны два принципиально различных способа образования выборочной совокупности. Первый— вынутая карточка после фиксации ее номера возвращается в пачку, после чего карточки снова тщательно перемешиваются. Повторяя такие выборки по одной карточке, можно образовать выборочную совокупность любого объема. Выборочная совокупность, образованная по такой схеме, получила название случайной возвратной выборки. Второй— каждая вынутая карточка после ее записи обратно не возвращается. Повторяя по такой схеме выборки по одной карточ-ке, можно получить выборочную совокупность любого заданного объема. Выборочную совокупность, образованную по данной схе-ме называют случайной безвозвратной выборкой. Она возможна лишь в том случае, если из тщательно перемешанной пачки сразу берут нужное число карточек. Заметим, что различие между случайными выборками с возвра-том и без возврата стирается, если они составляют незначитель-ную часть большой генеральной совокупности. Однако при большом объеме генеральной совокупности этот метод оказывается очень трудоемким, и поэтому гораздо удобнее пользоваться таблицей случайных чисел. Она доказала свою эф-фективность при формировании равновероятностной выборки из больших совокупностей. Фрагмент такой таблицы случайных чи-сел приведен в табл. 2.1.
В таблицах случайных чисел все числа включены в таблицу случайным образом. Единицам совокупности присваивают порядковые номера. В таблице выбирают любую начальную точку и, двигаясь в произвольном направлении и произвольно меняя направление движения, выбирают необходимое количество номеров из числа присвоенных, равное заранее установленному объему выборки. Если мы имеем, скажем, популяцию (т.е. генеральную совокупность) из 1507 элементов и хотим спроектировать выборку из 150, мы можем выбирать любые четыре смежных столбца в таблице случайных чисел. Каждый раз, когда будет появляться число от 0001 до 1507, мы будем считать, что оно обозначает номер отбираемого элемента. Если число появляется более чем один раз, этот номер игнорируется после первого раза. Если мы начнем с первых четырех столбцов в табл. 2.1, спускаясь по столбцам, то в выборку будут включены элементы под номерами 0799,1016,0084, 480 и 1306. Поскольку мы не стремимся умышленно отыскать определенное число, мы можем начать с любого места таблицы и использовать любую систему для движения по таблице. Сегодня таблицу случайных чисел могут заменить машинные устройства, например компьютер, снабженный специальной программой. Их называют генераторами случайных чисел. При телефонном интервьюировании компьютер, имеющий генератор случайных чисел, может подавать на экран случайным образом отобранные телефонные номера. 2.4.2. Систематический отбор Систематический отбор является вторым по научной значимости, но первым по популярности употребления видом простого случайного отбора. Его называют еще механическим отбором и считают упрощенным вариантом простого случайного отбора. 100 Примером служат разного рода квартирные выборки: выбираются улицы, на которых интервьюер проводит квартирный опрос. Квартиры выбираются по определенной схеме (крайняя квартира справа от лестницы на последнем этаже первого подъезда и т.д.). Если под рукой таблицы случайных чисел нет, а генсовокупность относительно невелика14, то можно воспользоваться алфавитным списком, например, персонала предприятия (картотека всегда есть в отделе кадров) или избирательного участка (при опросе по месту жительства). Процедура систематического отбора проста: количество единиц генеральной совокупности, предположим 2000 работников предприятия, делится на количество анкет, скажем 200, и определяется шаг выборки. Он предполагает, что, начиная с любого номера из списка, опрашивается каждый десятый (2000:200 = 10). В формализованном виде данная процедура выглядит так. Из пронумерованного списка через равные интервалы £ отбирается заданное число респондентов. При этом шаг выборки к рассчитывается по простой формуле:
где N— численность генеральной совокупности, п — численность выборочной совокупности. Таким образом, шаг выборки, а его еще называют «интервалом скачка» или просто «интервалом», — это математический показа-тель, рассчитанный как отношение объема генеральной совокуп-ности к объему выборки. Он показывает, сколько номеров в спис-ке фамилий людей, вошедших в генеральную совокупность, надо пропустить (через сколько перешагнуть), чтобы в итоге получить список выборочной совокупности. Буквально шаг выборки озна-я чает расстояние между соседними фамилиями респондентов, из меренное количеством отбракованных фамилий из списка гене-ральной совокупности (рис. 2.3). Другой пример. Предположим, что нам нужно спроектировать выборку численностью 100 из списка 5000 студентов какого-то вуза. Если мы намерены использовать систематическую выборку, то должны вначале рассчитать интервал выборки делением числа элементов в списке на размер выборки. В данном случае, разделив 5000 имен на требуемый размер выборки 100 ед., мы получим интервал (шаг) выборки 50. Так что мы будем систематически двигаться по списку и отбирать каждого пятидесятого студента (отобрав таким образом 100 имен). Определение того места в списке, с которого мы начнем, проводится случайным образом, по таблице случайных чисел (это называется случайным стартом). Таким образом, если случайно выбрана точка старта под номером 31, то в выборку будут включены студенты, стоящие под номерами 31, 81, 131, 181 и т.д. Итак, в основу систематической выборки положены не вероятностные процедуры, а алфавитные списки, картотеки, схемы, которые обеспечивают равновероятное попадание в выборку всех единиц генеральной совокупности. Несмотря на свои преимущества, систематическая выборка может иногда иметь своим результатом предубежденную выборку. Такая ситуация возникает, например, когда элементы размещены в списке, ранжированном по каким-то характеристикам. В этой ситуации определение места начала случайного отбора будет влиять на средние характеристики всей выборки. Например, если студенты расставлены в списке в соответствии со средним оценочным баллом от высшего к низшему, систематическая выборка, включающая студентов, стоящих в списке под номерами 1,51,101, будет иметь более низкий средний балл, чем выборка, включаю-Щая студентов под номерами 50, 100 и 150. Каждая новая выборка будет давать другой средний балл, который представляет собой предубежденную картину студенческой популяции.
|