Студопедия — Ошибки выборки
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Ошибки выборки






При правильном формировании выборки величину ее ошибки можно рассчитать заранее. В общем случае под ошибкой выборки понимают объективно возникающее расхождение между характеристиками выборки и генеральной совокупности.

Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают из-за неправильных или неточных сведений. Их источником является невнимательность регистратора, неправильное заполнение формуляров, описки или же непонимание существа исследуемого вопроса.

Ошибки репрезентативности возникают вследствие несоответствия структуры выборки структуре генеральной совокупности. Источником их существования является разная вариация признака у статистических единиц, в результате которой распределение единиц в выборочной совокупности отличается от распределения единиц в генеральной совокупности.

Ошибки репрезентативности делятся на систематические и случайные.

Систематические ошибки репрезентативности возникают из-за неправильного формирования выборки, при котором нарушается основной принцип научно организованной выборки – принцип случайности.

Случайные ошибки репрезентативности означают, что даже при соблюдении принципа случайности отбора единиц, расхождения между характеристиками выборки и генеральной совокупности все же имеют место.

Ошибка выборочного наблюдения – это разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения. Для среднего значения ошибка будет определяться так:

, где (6.1)

хi – вариант (значение варьирующего признака)

fi – частота, вес

N – объем генеральной совокупности (= сумме fi)

(6.2)

хi – вариант (значение варьирующего признака)

ti – частота, вес

n – объем выборочной совокупности

Рассмотрим пример: Даны две 10-ти процентные выборки успеваемости студентов (табл. 6.1).

Таблица 6.1 – Исходные данные

Оценка Число студентов
Генеральная совокупность 1-я выборка 2-я выборка
       
       
       
       
Итого:      

 

Рассчитаем ошибку выборки.

1. Средний балл рассчитываем по средней арифметической взвешенной:

По генеральной совокупности:

а) =

По выборочным совокупностям:

б) =

в) = 3,54

Разность между показателями выборочной и генеральной совокупности и будет случайной ошибкой репрезентативности:

= 3,58 - 3,65 = -0,07

= 3,58 - 3,54 = +0,04

Величина ошибки выборки зависит от следующих факторов:

- Степени колеблемости признака в генеральной совокупности

Чем однороднее исследуемая совокупность, тем меньше величина средней ошибки при той же самой численности выборки.

- Объема (численности) выборки

Увеличивая или уменьшая объем выборки n, можно регулировать величину средней ошибки. Чем больше единиц будет включено в выборку, тем меньше будет величина ошибки, так как тем точнее в выборке будет представлена генеральная совокупность.

- Способа отбора единиц в выборочную совокупность

Для каждого способа формирования выборки величина ее ошибки определяется по разному. В практической деятельности используются различные способы формирования выборочной совокупности, но принципиальное значение имеет их деление на способы случайного (повторного и бесповторного) отбора.

При собственно случайном повторном отборе общее число единиц генеральной совокупности в процессе выборке не меняется.

Статистическая единица, попавшая в выборку, после регистрации изучаемого признака возвращается в генеральную совокупность и можетвновь попасть в выборку. Таким образом, для всех единиц генеральнойсовокупности обеспечивается равная вероятность отбора.

В математической статистике доказывается, что средняя ошибка выборки определяется по формуле: (6.3)

где - дисперсия генеральной совокупности;

n – объем выборочной совокупности.

Дисперсия – отклонение признака от средней величины. Генеральная дисперсия, также как и остальные параметры генеральной совокупности, является неизвестной величиной, но известно соотношение между генеральной и выборочной дисперсией: ~ , тогда при достаточно большом объеме выборки (n>30), является величиной близкой к 1, и можно считать, что ~ . В случаях малой выборки при n<30 необходимо учитывать отношение .

На практике показатель дисперсии по генеральной совокупности заменяют на аналогичный показатель по выборочной совокупности на базе закона больших чисел. По этому закону выборочная совокупность при достаточно большом ее объеме точно воспроизводит характеристики генеральной совокупности.

Следовательно, , (6.4)

где - выборочная дисперсия количественного признака, .

n – объем выборочной совокупности.

Средняя ошибка выборки для доли определяется по формуле: (6.5)

где - выборочная дисперсия доли альтернативного признака,

Применение простой случайной повторной выборки на практике весьма ограниченно. Это связано с тем, что практически нецелесообразно, а иногда и невозможно повторное наблюдение одних и тех же единиц, и поэтому однажды обследованная единица повторному учету не подвергается. Поэтому чаще на практике применяется бесповторный отбор.

При бесповторном собственно случайном отборе общее количество статистических единиц в генеральной совокупности в процессе формирования выборки меняется, уменьшаясь каждый раз на единицу, попавшую в выборку, поскольку отобранные единицы в генеральную совокупность не возвращаются. Таким образом, вероятность попадания отдельных единиц в выборку при бесповторном случайном отборе также меняется (для оставшихся единиц она возрастает). В целом вероятность попадания любой статистической единицы в выборку при бесповторном отборе может быть определена как . На эту величину должна быть скорректирована и средняя ошибка выборки при бесповторном отборе.

Таким образом, расчетные формулы средней ошибки выборки при бесповторном отборе принимают вид:

для средней количественного признака (6.6)

для доли альтернативного признака (6.7)

На практике при применении выборочного метода определяются пределы, за которые не выйдет величина конкретной ошибки выборочногоисследования. Величина пределов конкретной ошибки определяетсястепенью вероятности, с которой измеряется ошибка выборки.

Ошибка выборки, исчисленная с заданной степенью вероятности, называется предельной ошибкой выборки.

Предельная ошибка выборки является максимально возможной при данной вероятности ошибкой. Это означает, что с заданной вероятностью гарантируется, что ошибка любой выборки не превысит предельную ошибку. Такая вероятность называется доверительной.

Предельная ошибка выборки рассчитывается по формуле:

,

где t – коэффициент доверия, значения которого определяются доверительной вероятностью F (t).

Значения коэффициента доверия t задаются в таблицах нормального распределения вероятностей. Чаще всего используются следующие сочетания:

 

t F(t)
  0,683
1,5 0,866
  0,954
2,5 0,988
  0,997
3,5 0,999

 

Так, если t = 1, то с вероятностью 0,683 можно утверждать, что расхождение между выборочными характеристиками и параметрами генеральной совокупности не превысит одной средней ошибки.

Предельные ошибки выборки для разных параметров при разных методах отбора статистических единиц рассчитываются по формулам, приведенным в таблице 6.2.

 

Таблица 6.2 – Формулы расчета предельных ошибок выборки при собственно-случайном отборе единиц выборочной совокупности

 

Метод отбора Предельные ошибки выборки
Для средней характеристики Для доли
Повторный
Бесповторный

 

Зная величину предельной ошибки выборки, можно рассчитать интервалы, в которых будут находиться характеристики генеральной совокупности:

(6.8)

Пределы, в которых с данной степенью вероятности будет заключена неизвестная величина изучаемого показателя в генеральной совокупности, называют доверительными интервалами, а вероятность F(t) – доверительной вероятностью. Чем выше значение ошибки выборки , тем больше величина доверительного интервала и, следовательно, ниже точность оценки.

Рассмотрим нахождение средних и предельных ошибок выборок, определение доверительных интервалов для средней и доли на следующем примере:

Пример: При оценке спроса на товар А было проведено пятипроцентное бесповторное обследование регионального рынка. При этом было выяснено, что в 90 из 100 обследованных семей данный товар потребляется. В среднем каждая из обследованных семей потребляла 5 единиц товара ( = 5) при стандартном отклонении 0,5 единицы ( =0,5 ед.).

С вероятностью p = 0,954 необходимо установить долю семей, потребляющих данный товар и среднее его потребление (спрос).

Для получения статистических оценок параметров генеральной совокупности выполним следующие процедуры:

1.Определим характеристики выборочной совокупности:

- выборочную долю (удельный вес семей в выборке, потребляющих товар А):

- выборочную среднюю (средний объем потребления товара А одной семьей в выборке): = 5 единиц.

2.Определим предельные ошибки выборки:

для доли

где

для средней

3. Рассчитаем доверительные интервалы характеристик генеральной совокупности:

для доли:

0,9-0,059 ≤ P ≤ 0,9+0,059,

0,841≤ P ≤ 0,959;

для средней:

5-0,1≤ ≤5+0,1,

4,9 ≤ ≤5,1.

Таким образом, с вероятностью 0,954 можно утверждать, что доля семей потребляющих данный товар не меньше 84,1%, но не более 95,9%, а среднее потребление товара в семьях находится в пределах от 4,9 до 5,1 единиц. На основании проведенных расчетов можно определить границы потребления (спроса) товара А на данном рынке:

Таким образом, с вероятностью в 95% можно утверждать, что спрос на товар А не будет ниже 8240 единиц, но и не превысит 9780 единиц.







Дата добавления: 2015-06-16; просмотров: 1606. Нарушение авторских прав; Мы поможем в написании вашей работы!



Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

Различие эмпиризма и рационализма Родоначальником эмпиризма стал английский философ Ф. Бэкон. Основной тезис эмпиризма гласит: в разуме нет ничего такого...

Индекс гингивита (PMA) (Schour, Massler, 1948) Для оценки тяжести гингивита (а в последующем и ре­гистрации динамики процесса) используют папиллярно-маргинально-альвеолярный индекс (РМА)...

Методика исследования периферических лимфатических узлов. Исследование периферических лимфатических узлов производится с помощью осмотра и пальпации...

Краткая психологическая характеристика возрастных периодов.Первый критический период развития ребенка — период новорожденности Психоаналитики говорят, что это первая травма, которую переживает ребенок, и она настолько сильна, что вся последую­щая жизнь проходит под знаком этой травмы...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Решение Постоянные издержки (FC) не зависят от изменения объёма производства, существуют постоянно...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия