Простая случайная выборка.
В простой случайной выборке каждый элемент, включаемый в выборку, обладает одной и той же заданной вероятностью попадания в число исследуемых элементов, и любая комбинация элементов исходной популяции может потенциально стать выборкой. Например, если мы захотим составить простую случайную выборку всех студентов, числящихся в определенном колледже, нам достаточно будет составить список всех студентов, присвоить каждой значащейся в нем фамилии свой номер и с помощью компьютера произвести случайный отбор заданного количества элементов. Представьте, что исследуемой генеральной совокупностью является все взрослое население Гомеля. Для описания этой совокупности может быть использован ряд параметров: средний возраст, доля населения с высшим образованием, уровень доходов и так далее. Обратите внимание на то, что все эти показатели имеют определенное значение. Разумеется, мы можем рассчитать их, проведя полную перепись изучаемой совокупности. Обычно же мы опираемся не на ценз, а на отбираемую нами выборку и используем полученные при выборочном наблюдении значения для определения искомых параметров совокупности. Параметр определенная характеристика или показатель генеральной или изучаемой совокупности. Приведем пример гипотетической совокупности, состоящей из 20 человек (см. табл. 1). Таблица 1
Работа с небольшой гипотетической совокупностью имеет ряд преимуществ. Во-первых, небольшой объем выборки дает возможность легко вычислить параметры совокупности, которые могут использоваться для ее описания. Во-вторых, этот объем позволяет понять, что может произойти при принятии того или иного плана выборочного контроля. Обе эти особенности делают простым сравнение результатов выборки с «истинным» (известным) значением совокупности, чего нельзя сказать о типичной ситуации, при которой действительное значение совокупности неизвестно. Сравнение оценки с «истинным» значением приобретает в этом случае особую наглядность. Оценка параметров проводится по средней элементов, составляющих совокупность и дисперсии генеральной совокупности. Производная совокупность – совокупность всех возможных различимых выборок, которые могут быть выделены из генеральной совокупности по заданному плану выборочного контроля. Значение статистики, используемое для оценки определенного параметра, зависит от выборки, определяемой планом. Статистика – характеристика или показатель выборки. Различные выборки дают различные статистики или оценки одного и того же параметра совокупности. Например, рассмотрим произвольную совокупность всех возможных выборок, которые могут быть выделены из гипотетической генеральной совокупности, состоящей допустим из 20 индивидов, где у каждого будут свой средний доход и имя. По плану выборочного контроля, предполагающему, что выборка объемом n=2 может быть получена путем случайного бесповторного отбора. Данные индивидов записывают на диск, после чего все диски опускают в емкость и перемешивают. Затем извлекают диск из емкости, списывают с него информацию и откладывают его в сторону. Тоже проделывают и со вторым диском. Потом возвращают оба диска в емкость, опять перемешивают и повторяют ту же последовательность действий. Для 20 дисков возможны 190 таких парных комбинаций. Для каждой комбинации вычисляют среднюю величину дохода и величину ошибки (см. табл.2). Таблица 2
Недостатки производной совокупности. Во-первых, составление совокупностей такого рода требует слишком большой траты времени и сил. Во-вторых, совокупность определяется как совокупность всех возможных различных выборок, которые могут быть выделены из генеральной совокупности по заданному плану выборочного контроля. При изменении любой части выборочного контроля производная совокупность также меняется. Например, если возвращать в емкость первый диск прежде чем вынуть второй, производная совокупность будет включать выборки АА, ВВ, СС и так далее (должно быть АВ, АС, ВС). Если объем бесповторных выборок будет равен 3, а не 2, появятся выборки типа АВС, и их будет не 190, а 1140. В-третьих, при изменении простого случайного отбора на любой другой метод определения элементов выборки производная совокупность также изменится. Формирование простой случайной выборки. В выше приведенном примере отбор элементов выборки осуществлялся с помощью емкости, в которой находились все элементы исходной совокупности. Это позволило наглядно представить понятия производной совокупности и выборочного распределения. Применять же подобный метод на практике не рекомендуется, т.к. при этом повышается вероятность ошибки. Диски могут отличаться и размерами, и фактурой, что в известных случаях может приводить к предпочтению одних дисков другим. Предпочтительный метод формирования простой случайной выборки основан на использовании таблицы случайных чисел. Использование такой таблицы предполагает следующую последовательность шагов. Во-первых, элементам генеральной совокупности должны быть присвоены последовательные номера от 1 до N. В нашей гипотетической совокупности элементу А был присвоен номер 1, элементу В — номер 2 и так далее. Во-вторых, количество разрядов таблицы случайных чисел должно быть таким же, как у номера N. Для N = 20 будут использоваться двузначные числа; для N между 100 и 999 — трехзначные числа и так далее. В-третьих, начальная позиция должна определяться случайным образом. Можно раскрыть соответствующую таблицу случайных чисел и методом тыка формировать выборку. Поскольку числа в таблице случайных чисел следуют в случайном порядке, начальная позиция не имеет особого значения. И, наконец, можно двигаться в любом произвольно выбранном направлении — вверх, вниз или поперек — отбирая те элементы, номера которых будут соответствовать случайным числам из таблицы.
Вопрос 3. Стратифицированная выборка. Стратифицированная выборка — это вероятностная выборка, для которой характерна следующая двухшаговая процедура: 1. Генеральная (исходная) совокупность делится на ряд непересекающихся, исчерпывающих ее подмножеств, 2. В каждом подмножестве или группе производится независимый отбор элементов простых случайных выборок. Подмножества, на которые подразделяется генеральная совокупность, называются слоями или частными совокупностями. Данное определение требует, чтобы выделяемые подмножества не пересекались и исчерпывали исходную совокупность. Это означает, что каждый элемент совокупности должен входить в один и только один из слоев; при этом процедура распределения должна охватывать все без исключения элементы генеральной совокупности. Вернемся к рассматривавшейся в предыдущем вопросе гипотетической совокупности, состоящей из 20 индивидов. Эта совокупность может быть описана несколькими параметрами, такими как средний уровень доходов, образовательный уровень, часть совокупности, подписавшаяся на то или иное издание. Предположим, мы хотим разделить генеральную совокупность на два слоя на основе образовательного уровня (см. табл.1). Элементы А-J образуют первую страту или слой (уровень образования соответствует не более чем 11-летнему сроку обучения), элементы К-T образуют вторую страту или слой (уровень образования соответствует более чем 11-летнему сроку обучения). Число страт не обязательно должно равняться двум. Генеральная совокупность может быть разделена на любое другое количество страт. Мы остановились на числе 2 только потому, что оно позволяет наглядно продемонстрировать технический аспект обсуждаемой процедуры. Таблица 1
На втором этапе должен быть произведен отбор элементов простой случайной выборки из каждой страты. Пусть объем выборок и на сей раз будет равен 2; это означает, что мы должны выбрать по одному элементу из каждой страты (в общем случае количество элементов из того или иного слоя не обязательно должно быть одинаковым). Процедура отбора элементов внутри стратифицированной выборки ничем не отличается от аналогичной процедуры для простой случайной выборки. Элементам генеральной совокупности каждой страты присваиваются порядковые номера от 1 до 10. Далее для отбора элементов может быть использована таблица случайных чисел. Первый элемент отбирается из 10 элементов первой страты, второй — из 10 элементов второй страты; при этом возможен как повторный «вход» в таблицу случайных чисел, так и продолжение движения по избранной ранее строке или столбцу, которое в любом, случае должно продолжаться до появления первого числа от 1 до 10. Рассмотрим производную совокупность. Хотя реально может быть отобрана только одна выборка с объемом 2, рассмотрим производную совокупность всех возможных выборок с объемом 2, которые можно сформировать по заданному плану выборочного отбора (см. табл.2). Таблица 2
При заданном плане выборочного отбора возможны только 100 парных комбинаций элементов, тогда как при отборе простой случайной выборки существовало 190 таких вариантов. Причина в том, что при таком виде выборочного наблюдения из каждой страты может быть выбран только один элемент. При формировании же простой случайной выборки из генеральной совокупности могли быть отобраны любые 2 элемента. В этом отношении стратифицированная выборка отличается от случайной большим числом ограничений. Каждый элемент имеет одинаковую вероятность включения в выборку, равную 1/10, поскольку каждый из них может стать элементом, отбираемым из той или иной страты, т.е. в пределах страты речь идет о простой случайной выборке. Равновероятный отбор элементов может быть присущ и другим способам. Равновероятный отбор является необходимым, но не достаточным условием простого случайного выбора, его необходимо дополнить условием равной вероятности любой возможной комбинации из n элементов. Одно из преимуществ стратифицированной выборки - такая выборка обеспечивает большую точность выборочных статистик, чем простая случайная выборка. Если количественным признаком стратификации будет образование, то количество выборочных средних, сильно отклоняющихся от генерального среднего, существенно сократится. Второй довод в пользу стратифицированных выборок состоит в том, что разделение позволяет обследовать интересующие исследователя характеристики определенных подмножеств. Так, при стратификации можно гарантировать представление лиц с образованием не выше среднего и с образованием выше среднего. Эта возможность приобретает особую значимость при отборе элементов генеральной совокупности, включающей в себя редкие сегменты. Представим, например, что производитель колец с бриллиантами хочет изучить социальный состав потребителей его продукции. Если не будут приняты специальные меры, окажется, что высшие слои общества, составляющие всего около 3 % населения, либо вообще не будут представлены в выборке, либо окажутся представленными недостаточно полно. Тем не менее, производителя ювелирных изделий должен интересовать именно этот немногочисленный сегмент совокупности. В маркетинге возможны ситуации, когда поведение совокупности, например, уровень потребления какой-то продукции, определяется ее небольшим подмножеством. В этих случаях становится важным адекватное представление этого подмножества в обследуемой выборке. Стратифицированное выборочное наблюдение является одним из вариантов обеспечения названного представления. Предпочтение стратифицированной выборки по отношению к простой случайной, определяется стоимостью и точностью, т.к. хотя стратифицированные выборки дают более точные оценки, они имеют и большую стоимость. Поэтому при выборе стратифицированной выборке необходимо сделать выбор между пропорционально и непропорционально стратифицированными выборками. Пропорционально стратифицированная выборка – стратифицированная выборка, в которой межслойное соотношение наблюдений пропорционально относительной доле элементов в каждом слое генеральной совокупности. Непропорционально стратифицированная выборка – стратифицированная выборка, в которой объем отдельных слоев или подмножеств зависит от объема и изменчивости соответствующих слоев генеральной совокупности, т.е. слои с большей изменчивостью количественного признака получают в выборке большее, а слои, близкие к гомогенности, меньшее представление, чем в пропорционально стратифицированной выборке. Преимущество пропорционального распределения состоит в том, что здесь достаточно знать только относительные размеры каждой страты для определения количества выборочных наблюдений, которые должны быть отобраны из каждого слоя для заданного объема выборки. Однако, непропорционально стратифицированная выборка может давать более точные результаты. При ее составлении одновременно учитывают два критерия: объем страты и ее изменчивость. Очень часто путают стратифицированные выборки с квотными. У тех и других есть ряд сходств. В обоих случаях генеральная совокупность делится на сегменты, и элементы отбираются из каждого сегмента. Но между ними существует существенное различие. В стратифицированных выборках элементы выборки выбираются вероятностными методами; что касается квотных выборок, то их отбор обусловлен позицией исследователя.
|