Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Ошибки выборки





При правильном формировании выборки величину ее ошибки можно рассчитать заранее. В общем случае под ошибкой выборки понимают объективно возникающее расхождение между характеристиками выборки и генеральной совокупности.

Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают из-за неправильных или неточных сведений. Их источником является невнимательность регистратора, неправильное заполнение формуляров, описки или же непонимание существа исследуемого вопроса.

Ошибки репрезентативности возникают вследствие несоответствия структуры выборки структуре генеральной совокупности. Источником их существования является разная вариация признака у статистических единиц, в результате которой распределение единиц в выборочной совокупности отличается от распределения единиц в генеральной совокупности.

Ошибки репрезентативности делятся на систематические и случайные.

Систематические ошибки репрезентативности возникают из-за неправильного формирования выборки, при котором нарушается основной принцип научно организованной выборки – принцип случайности.

Случайные ошибки репрезентативности означают, что даже при соблюдении принципа случайности отбора единиц, расхождения между характеристиками выборки и генеральной совокупности все же имеют место.

Ошибка выборочного наблюдения – это разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения. Для среднего значения ошибка будет определяться так:

, где (6.1)

хi – вариант (значение варьирующего признака)

fi – частота, вес

N – объем генеральной совокупности (= сумме fi)

(6.2)

хi – вариант (значение варьирующего признака)

ti – частота, вес

n – объем выборочной совокупности

Рассмотрим пример: Даны две 10-ти процентные выборки успеваемости студентов (табл. 6.1).

Таблица 6.1 – Исходные данные

Оценка Число студентов
Генеральная совокупность 1-я выборка 2-я выборка
       
       
       
       
Итого:      

 

Рассчитаем ошибку выборки.

1. Средний балл рассчитываем по средней арифметической взвешенной:

По генеральной совокупности:

а) =

По выборочным совокупностям:

б) =

в) = 3,54

Разность между показателями выборочной и генеральной совокупности и будет случайной ошибкой репрезентативности:

= 3,58 - 3,65 = -0,07

= 3,58 - 3,54 = +0,04

Величина ошибки выборки зависит от следующих факторов:

- Степени колеблемости признака в генеральной совокупности

Чем однороднее исследуемая совокупность, тем меньше величина средней ошибки при той же самой численности выборки.

- Объема (численности) выборки

Увеличивая или уменьшая объем выборки n, можно регулировать величину средней ошибки. Чем больше единиц будет включено в выборку, тем меньше будет величина ошибки, так как тем точнее в выборке будет представлена генеральная совокупность.

- Способа отбора единиц в выборочную совокупность

Для каждого способа формирования выборки величина ее ошибки определяется по разному. В практической деятельности используются различные способы формирования выборочной совокупности, но принципиальное значение имеет их деление на способы случайного (повторного и бесповторного) отбора.

При собственно случайном повторном отборе общее число единиц генеральной совокупности в процессе выборке не меняется.

Статистическая единица, попавшая в выборку, после регистрации изучаемого признака возвращается в генеральную совокупность и можетвновь попасть в выборку. Таким образом, для всех единиц генеральнойсовокупности обеспечивается равная вероятность отбора.

В математической статистике доказывается, что средняя ошибка выборки определяется по формуле: (6.3)

где - дисперсия генеральной совокупности;

n – объем выборочной совокупности.

Дисперсия – отклонение признака от средней величины. Генеральная дисперсия, также как и остальные параметры генеральной совокупности, является неизвестной величиной, но известно соотношение между генеральной и выборочной дисперсией: ~ , тогда при достаточно большом объеме выборки (n>30), является величиной близкой к 1, и можно считать, что ~ . В случаях малой выборки при n<30 необходимо учитывать отношение .

На практике показатель дисперсии по генеральной совокупности заменяют на аналогичный показатель по выборочной совокупности на базе закона больших чисел. По этому закону выборочная совокупность при достаточно большом ее объеме точно воспроизводит характеристики генеральной совокупности.

Следовательно, , (6.4)

где - выборочная дисперсия количественного признака, .

n – объем выборочной совокупности.

Средняя ошибка выборки для доли определяется по формуле: (6.5)

где - выборочная дисперсия доли альтернативного признака,

Применение простой случайной повторной выборки на практике весьма ограниченно. Это связано с тем, что практически нецелесообразно, а иногда и невозможно повторное наблюдение одних и тех же единиц, и поэтому однажды обследованная единица повторному учету не подвергается. Поэтому чаще на практике применяется бесповторный отбор.

При бесповторном собственно случайном отборе общее количество статистических единиц в генеральной совокупности в процессе формирования выборки меняется, уменьшаясь каждый раз на единицу, попавшую в выборку, поскольку отобранные единицы в генеральную совокупность не возвращаются. Таким образом, вероятность попадания отдельных единиц в выборку при бесповторном случайном отборе также меняется (для оставшихся единиц она возрастает). В целом вероятность попадания любой статистической единицы в выборку при бесповторном отборе может быть определена как . На эту величину должна быть скорректирована и средняя ошибка выборки при бесповторном отборе.

Таким образом, расчетные формулы средней ошибки выборки при бесповторном отборе принимают вид:

для средней количественного признака (6.6)

для доли альтернативного признака (6.7)

На практике при применении выборочного метода определяются пределы, за которые не выйдет величина конкретной ошибки выборочногоисследования. Величина пределов конкретной ошибки определяетсястепенью вероятности, с которой измеряется ошибка выборки.

Ошибка выборки, исчисленная с заданной степенью вероятности, называется предельной ошибкой выборки.

Предельная ошибка выборки является максимально возможной при данной вероятности ошибкой. Это означает, что с заданной вероятностью гарантируется, что ошибка любой выборки не превысит предельную ошибку. Такая вероятность называется доверительной.

Предельная ошибка выборки рассчитывается по формуле:

,

где t – коэффициент доверия, значения которого определяются доверительной вероятностью F (t).

Значения коэффициента доверия t задаются в таблицах нормального распределения вероятностей. Чаще всего используются следующие сочетания:

 

t F(t)
  0,683
1,5 0,866
  0,954
2,5 0,988
  0,997
3,5 0,999

 

Так, если t = 1, то с вероятностью 0,683 можно утверждать, что расхождение между выборочными характеристиками и параметрами генеральной совокупности не превысит одной средней ошибки.

Предельные ошибки выборки для разных параметров при разных методах отбора статистических единиц рассчитываются по формулам, приведенным в таблице 6.2.

 

Таблица 6.2 – Формулы расчета предельных ошибок выборки при собственно-случайном отборе единиц выборочной совокупности

 

Метод отбора Предельные ошибки выборки
Для средней характеристики Для доли
Повторный
Бесповторный

 

Зная величину предельной ошибки выборки, можно рассчитать интервалы, в которых будут находиться характеристики генеральной совокупности:

(6.8)

Пределы, в которых с данной степенью вероятности будет заключена неизвестная величина изучаемого показателя в генеральной совокупности, называют доверительными интервалами, а вероятность F(t) – доверительной вероятностью. Чем выше значение ошибки выборки , тем больше величина доверительного интервала и, следовательно, ниже точность оценки.

Рассмотрим нахождение средних и предельных ошибок выборок, определение доверительных интервалов для средней и доли на следующем примере:

Пример: При оценке спроса на товар А было проведено пятипроцентное бесповторное обследование регионального рынка. При этом было выяснено, что в 90 из 100 обследованных семей данный товар потребляется. В среднем каждая из обследованных семей потребляла 5 единиц товара ( = 5) при стандартном отклонении 0,5 единицы ( =0,5 ед.).

С вероятностью p = 0,954 необходимо установить долю семей, потребляющих данный товар и среднее его потребление (спрос).

Для получения статистических оценок параметров генеральной совокупности выполним следующие процедуры:

1.Определим характеристики выборочной совокупности:

- выборочную долю (удельный вес семей в выборке, потребляющих товар А):

- выборочную среднюю (средний объем потребления товара А одной семьей в выборке): = 5 единиц.

2.Определим предельные ошибки выборки:

для доли

где

для средней

3. Рассчитаем доверительные интервалы характеристик генеральной совокупности:

для доли:

0,9-0,059 ≤ P ≤ 0,9+0,059,

0,841≤ P ≤ 0,959;

для средней:

5-0,1≤ ≤5+0,1,

4,9 ≤ ≤5,1.

Таким образом, с вероятностью 0,954 можно утверждать, что доля семей потребляющих данный товар не меньше 84,1%, но не более 95,9%, а среднее потребление товара в семьях находится в пределах от 4,9 до 5,1 единиц. На основании проведенных расчетов можно определить границы потребления (спроса) товара А на данном рынке:

Таким образом, с вероятностью в 95% можно утверждать, что спрос на товар А не будет ниже 8240 единиц, но и не превысит 9780 единиц.







Дата добавления: 2015-06-16; просмотров: 1664. Нарушение авторских прав; Мы поможем в написании вашей работы!




Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...


Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...


Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...


Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Методика исследования периферических лимфатических узлов. Исследование периферических лимфатических узлов производится с помощью осмотра и пальпации...

Роль органов чувств в ориентировке слепых Процесс ориентации протекает на основе совместной, интегративной деятельности сохранных анализаторов, каждый из которых при определенных объективных условиях может выступать как ведущий...

Лечебно-охранительный режим, его элементы и значение.   Терапевтическое воздействие на пациента подразумевает не только использование всех видов лечения, но и применение лечебно-охранительного режима – соблюдение условий поведения, способствующих выздоровлению...

Экспертная оценка как метод психологического исследования Экспертная оценка – диагностический метод измерения, с помощью которого качественные особенности психических явлений получают свое числовое выражение в форме количественных оценок...

В теории государства и права выделяют два пути возникновения государства: восточный и западный Восточный путь возникновения государства представляет собой плавный переход, перерастание первобытного общества в государство...

Закон Гука при растяжении и сжатии   Напряжения и деформации при растяжении и сжатии связаны между собой зависимостью, которая называется законом Гука, по имени установившего этот закон английского физика Роберта Гука в 1678 году...

Studopedia.info - Студопедия - 2014-2025 год . (0.011 сек.) русская версия | украинская версия