Студопедия — Простая случайная выборка.
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Простая случайная выборка.






В про­стой случайной выборке каждый элемент, включаемый в выборку, обладает одной и той же заданной вероятно­стью попадания в число исследуемых элементов, и лю­бая комбинация элементов исходной популяции может потенциально стать выборкой. Например, если мы за­хотим составить простую случайную выборку всех студентов, числящихся в определенном колледже, нам достаточно будет составить список всех студентов, присвоить каждой значащейся в нем фамилии свой но­мер и с помощью компьютера произвести случайный отбор заданного количества элементов.

Представьте, что исследуемой генеральной совокупностью является все взрослое население Гомеля. Для описания этой совокупности может быть использован ряд параметров: средний возраст, доля населения с высшим образовани­ем, уровень доходов и так далее. Обратите внимание на то, что все эти показатели имеют определенное значе­ние. Разумеется, мы можем рассчитать их, проведя пол­ную перепись изучаемой совокупности. Обычно же мы опираемся не на ценз, а на отбираемую нами выборку и используем полученные при выборочном наблюдении значения для определения искомых параметров сово­купности.

Параметр определенная характеристика или показатель генеральной или изучаемой совокупности.

Приведем пример гипотетической совокупности, состоящей из 20 человек (см. табл. 1).

Таблица 1

Элемент Доход Образование лет Подписка на газету Элемент Доход Образование лет Подписка на газету
4D 5E 6F 7G 8H 9I 10J 5600 6000 6400 6800 7200 7600 8000 8400 8800 9200 7 8 9 9 10 11 1 11 11 11 X Y X Y X Y X Y X Y 11K 12L 13M 14N 15O 16P 17Q 18R 19S 20T 9600 10000 10400 10800 11200 11600 12000 12400 12800 13200 12 12 13 13 14 15 15 16 17 17 X Y X Y X Y X Y X Y

Работа с небольшой гипотети­ческой совокупностью имеет ряд преимуществ. Во-первых, небольшой объем выборки дает возможность легко вычислить параметры сово­купности, которые могут использоваться для ее опи­сания. Во-вторых, этот объем позволяет понять, что может произойти при принятии того или иного плана выборочного контроля. Обе эти особенности делают простым сравнение результатов выборки с «истин­ным» (известным) значением совокуп­ности, чего нельзя сказать о типичной ситуации, при которой действительное значение совокупности не­известно. Сравнение оценки с «истинным» значением приобретает в этом случае особую наглядность. Оценка параметров проводится по средней элементов, составляющих совокупность и дисперсии генеральной совокупности.

Производная совокупность – совокупность всех возможных различимых выборок, которые могут быть выделены из генеральной совокупности по заданному плану выборочного контроля. Значение статистики, используе­мое для оценки определенного параметра, зависит от выборки, определяемой планом.

Статистика – характеристика или показатель выборки.

Различные выборки дают различные статистики или оценки одного и того же параметра совокупности. Например, рассмотрим произвольную совокупность всех возможных выборок, которые могут быть выделены из гипотетической генеральной совокупности, состоящей допустим из 20 индивидов, где у каждого будут свой средний доход и имя. По плану выборочного контроля, предполагающему, что выборка объемом n=2 может быть получена путем случайного бесповторного отбора. Данные индивидов записывают на диск, после чего все диски опускают в емкость и перемешивают. Затем извлекают диск из емкости, списывают с него информацию и откладывают его в сторону. Тоже проделывают и со вторым диском. Потом возвращают оба диска в емкость, опять перемешивают и повторяют ту же последовательность действий. Для 20 дисков возможны 190 таких парных комбинаций. Для каждой комбинации вычисляют среднюю величину дохода и величину ошибки (см. табл.2).

Таблица 2

Выборка Выборка Выборка
K пара среднее K пара среднее K пара Среднее
1 2 19 20 21 37 38 39 54 55 56 70 71 72 85 86 87 99 100 C C C D D D E E E F F F G 5800 6000 9400 6200 6400 9600 6600 6800 9800 7000 7200 10000 7400 7600 10200 7800 8000 10400 8200 101 112 113 114 124 125 126 135 136 137 145 146 147 154 155 156 162 163 164 G G H H H I I I J J J K K K L L L M M 8400 10600 8600 8800 10800 9000 9200 11000 9400 9600 11200 9800 10000 11400 10200 10400 11600 10600 10800 169 170 171 175 176 177 180 181 182 183 184 185 186 187 188 189 190 M N N N O O O P P P P Q Q Q R R S 11800 11000 11200 12000 11400 11600 12200 11800 12000 12200 12400 12200 12400 12600 12600 12800 13000

Недостатки производной совокупности. Во-первых, составление совокупностей такого рода требует слишком большой траты времени и сил. Во-вторых, совокупность определяется как совокупность всех возможных различных выборок, которые могут быть выделены из генеральной совокупности по заданному плану выборочного контроля. При изменении любой части выборочного контроля производная совокупность также меняется. Например, если возвращать в емкость первый диск прежде чем вынуть второй, производная совокупность будет включать выборки АА, ВВ, СС и так далее (должно быть АВ, АС, ВС). Если объем бесповторных выборок будет равен 3, а не 2, появятся выборки типа АВС, и их будет не 190, а 1140. В-третьих, при изменении простого случайного отбора на любой другой метод определения элементов выборки производная совокупность также изменится.

Формирование простой случайной выборки. В выше приведенном примере отбор элементов выборки осуществлялся с помощью емкости, в которой находились все элемен­ты исходной совокупности. Это позволило нагляд­но представить понятия производной совокупности и выборочного распределения. Применять же подобный метод на практике не рекомендуется, т.к. при этом повышается вероятность ошибки. Диски могут отли­чаться и размерами, и фактурой, что в известных слу­чаях может приводить к предпочтению одних дисков другим.

Предпочтительный метод формирования простой случайной выборки основан на использовании таблицы случайных чисел. Использование такой таблицы пред­полагает следующую последовательность шагов.

Во-первых, элементам генеральной совокупности долж­ны быть присвоены последовательные номера от 1 до N. В нашей гипотетической совокупности элементу А был присвоен номер 1, элементу В — номер 2 и так далее.

Во-вторых, количество разрядов таблицы слу­чайных чисел должно быть таким же, как у номера N. Для N = 20 будут использоваться двузначные числа; для N между 100 и 999 — трехзначные числа и так далее.

В-третьих, начальная позиция должна опреде­ляться случайным образом. Можно раскрыть со­ответствующую таблицу случайных чисел и методом тыка формировать выборку. Посколь­ку числа в таблице случайных чисел следуют в случай­ном порядке, начальная позиция не имеет особого значения. И, наконец, можно двигаться в любом про­извольно выбранном направлении — вверх, вниз или поперек — отбирая те элементы, номера которых бу­дут соответствовать случайным числам из таблицы.

 

Вопрос 3. Стратифицированная выборка.

Стратифицированная выборка — это вероятно­стная выборка, для которой характерна следующая двухшаговая процедура:

1. Генеральная (исходная) совокупность делится на ряд непересекающихся, исчерпывающих ее под­множеств,

2. В каждом подмножестве или группе производит­ся независимый отбор элементов простых слу­чайных выборок.

Подмножества, на которые подразделяется гене­ральная совокупность, называются слоями или част­ными совокупностями. Данное определение требует, чтобы выделяемые подмножества не пересе­кались и исчерпывали исходную совокупность. Это означает, что каждый элемент совокупности должен входить в один и только один из слоев; при этом проце­дура распределения должна охватывать все без исклю­чения элементы генеральной совокупности.

Вер­немся к рассматривавшейся в предыдущем вопросе гипо­тетической совокупности, состоящей из 20 индивидов. Эта совокупность может быть описана несколькими параметрами, таки­ми как средний уровень доходов, образовательный уровень, часть совокупности, подписавшаяся на то или иное издание. Предположим, мы хотим разделить ге­неральную совокупность на два слоя на основе обра­зовательного уровня (см. табл.1). Элементы А-J образуют первую страту или слой (уровень образо­вания соответствует не более чем 11-летнему сроку обучения), элементы К-T образуют вторую стра­ту или слой (уровень образования соответствует бо­лее чем 11-летнему сроку обучения). Число страт не обязательно должно равняться двум. Генеральная со­вокупность может быть разделена на любое другое количество страт. Мы остановились на числе 2 толь­ко потому, что оно позволяет наглядно продемонст­рировать технический аспект обсуждаемой процедуры.

Таблица 1

Элементы 1 страты Элементы 2 страты
A B C D E F G H I J K L M N O P Q R S T
       

На втором этапе должен быть произведен отбор эле­ментов простой случайной выборки из каждой страты. Пусть объем выборок и на сей раз будет равен 2; это означает, что мы должны выбрать по одному эле­менту из каждой страты (в общем случае количество элементов из того или иного слоя не обязательно дол­жно быть одинаковым).

Процедура отбора элементов внутри стратифициро­ванной выборки ничем не отличается от аналогичной процедуры для простой случайной выборки. Элемен­там генеральной совокупности каждой страты присва­иваются порядковые номера от 1 до 10. Далее для от­бора элементов может быть использована таблица случайных чисел. Первый элемент отбирается из 10 элементов первой страты, второй — из 10 элементов второй страты; при этом возможен как повторный «вход» в таблицу случайных чисел, так и продолжение движения по избранной ранее строке или столбцу, ко­торое в любом, случае должно продолжаться до появ­ления первого числа от 1 до 10.

Рассмотрим производную совокупность.

Хотя реально может быть отобрана только одна вы­борка с объемом 2, рассмотрим производную совокупность всех возможных выборок с объемом 2, которые можно сформировать по заданному плану выборочного отбора (см. табл.2).

Таблица 2

K пара среднее K пара среднее K пара среднее K пара среднее
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 AK AL AM AN AO AP AQ AR AS AT BK BL BM BN BO BP BQ BR BS BT CK CL CM CN CO 7600 7800 8000 8200 8400 8600 8800 9000 9200 9400 7800 8000 8200 8400 8600 8800 9000 9200 9400 9600 8000 8200 8400 8600 8800 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 CP CQ CR CS CT DK DL DM DN DO DP DQ DR DS DT EK EL EM EN EO EP EQ ER ES ET 9000 9200 9400 9600 9800 8200 8400 8600 8800 9000 9200 9400 9600 9800 10000 8400 8600 8800 9000 9200 9400 9600 9800 10000 10200 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 FK FL FM FN FO FP FQ FR FS FT GK GL GM GN GO GP GQ GR GS GT HK HL HM HN HO 8600 8800 9000 9200 9400 9600 9800 10000 10200 10400 8800 9000 9200 9400 9600 9800 10000 10200 10400 10600 9000 9200 9400 9600 9800 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 HP HQ HR HS HT IK IL IM IN IO IP IQ IR IS IT JK JL JM JN JO JP JQ JR JS JT 10000 10200 10400 10600 10800 9200 9400 9600 9800 10000 10200 10400 10600 10800 11000 9400 9600 9800 10000 10200 10400 10600 10800 11000 11200

При заданном плане выборочного отбора возможны только 100 парных комбинаций эле­ментов, тогда как при отборе простой случайной вы­борки существовало 190 таких вариантов. Причина в том, что при таком виде выборочного наблюдения из каждой страты может быть выбран только один эле­мент. При формировании же простой случайной вы­борки из генеральной совокупности могли быть отобраны любые 2 элемента. В этом отно­шении стратифицированная выборка отличается от случайной большим числом ограничений. Каждый элемент имеет одинако­вую вероятность включения в выборку, равную 1/10, поскольку каждый из них может стать элементом, от­бираемым из той или иной страты, т.е. в пределах страты речь идет о простой случайной выборке. Равновероят­ный отбор элементов может быть присущ и другим спо­собам. Равновероятный отбор является необходимым, но не достаточным условием простого случайного вы­бора, его необходимо дополнить условием равной ве­роятности любой возможной комбинации из n элемен­тов.

Одно из преимуществ стратифицирован­ной выборки - такая выборка обеспечивает большую точность выборочных статистик, чем простая слу­чайная выборка. Если количественным признаком стратификации будет образование, то количество выбо­рочных средних, сильно отклоняющихся от генераль­ного среднего, существенно сократится.

Второй довод в пользу стратифицированных выбо­рок состоит в том, что разделение позволяет обследо­вать интересующие исследователя характеристики оп­ределенных подмножеств. Так, при стратификации можно гарантировать представление лиц с образова­нием не выше среднего и с образованием выше средне­го. Эта возможность приобретает особую значимость при отборе элементов генеральной совокупности, включающей в себя редкие сегменты. Представим, на­пример, что производитель колец с бриллиантами хочет изучить социальный состав потребителей его про­дукции. Если не будут приняты специальные меры, окажется, что высшие слои общества, составляющие всего около 3 % населения, либо вообще не будут представлены в выборке, либо окажутся представлен­ными недостаточно полно. Тем не менее, производите­ля ювелирных изделий должен интересовать именно этот немногочисленный сегмент совокупности.

В марке­тинге возможны ситуации, когда поведение совокупности, например, уровень потребления какой-то продук­ции, определяется ее небольшим подмножеством. В этих случаях становится важным адекватное представление этого подмножества в обследуемой вы­борке. Стратифицированное выборочное наблюдение является одним из вариантов обеспечения названного представления.

Предпочтение стратифицированной выборки по отношению к простой случайной, определяется стоимостью и точностью, т.к. хотя стратифицированные выборки дают более точные оценки, они имеют и большую стоимость. Поэтому при выборе стратифицированной выборке необходимо сделать выбор между пропорционально и непропорционально стратифицированными выборками.

Пропорционально стратифицированная выборка – стратифицированная выборка, в которой межслойное соотношение наблюдений пропорционально относительной доле элементов в каждом слое генеральной совокупности.

Непропорционально стратифицированная выборка – стратифицированная выборка, в которой объем отдельных слоев или подмножеств зависит от объема и изменчивости соответствующих слоев генеральной совокупности, т.е. слои с большей изменчивостью количественного признака получают в выборке большее, а слои, близкие к гомогенности, меньшее представление, чем в пропорционально стратифицированной выборке.

Преимущество пропорционального распределения состоит в том, что здесь достаточно знать только относительные размеры каждой страты для определения количества выборочных наблюдений, которые должны быть отобраны из каждого слоя для заданного объема выборки. Однако, непропорционально стратифицированная выборка может давать более точные результаты. При ее составлении одновременно учитывают два критерия: объем страты и ее изменчивость.

Очень часто путают стратифицированные выборки с квотными. У тех и других есть ряд сходств. В обоих случаях генеральная совокупность делится на сегменты, и элементы отбираются из каждого сегмента. Но между ними существует существенное различие. В стратифицированных выборках элементы выборки выбираются вероятностными методами; что касается квотных выборок, то их отбор обусловлен позицией исследователя.

 







Дата добавления: 2015-08-12; просмотров: 1138. Нарушение авторских прав; Мы поможем в написании вашей работы!



Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Типовые ситуационные задачи. Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт. ст. Влияние психоэмоциональных факторов отсутствует. Колебаний АД практически нет. Головной боли нет. Нормализовать...

Эндоскопическая диагностика язвенной болезни желудка, гастрита, опухоли Хронический гастрит - понятие клинико-анатомическое, характеризующееся определенными патоморфологическими изменениями слизистой оболочки желудка - неспецифическим воспалительным процессом...

Признаки классификации безопасности Можно выделить следующие признаки классификации безопасности. 1. По признаку масштабности принято различать следующие относительно самостоятельные геополитические уровни и виды безопасности. 1.1. Международная безопасность (глобальная и...

Устройство рабочих органов мясорубки Независимо от марки мясорубки и её технических характеристик, все они имеют принципиально одинаковые устройства...

Ведение учета результатов боевой подготовки в роте и во взводе Содержание журнала учета боевой подготовки во взводе. Учет результатов боевой подготовки - есть отражение количественных и качественных показателей выполнения планов подготовки соединений...

Сравнительно-исторический метод в языкознании сравнительно-исторический метод в языкознании является одним из основных и представляет собой совокупность приёмов...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия