Студопедия — 6 страница
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

6 страница






.

Очевидно, что .

Т.е. является несмещенной и состоятельной оценкой генеральной дисперсии .

40. Понятие об интервальном оценивании. Доверительная ве­роятность и доверительный интервал. Предельная ошибка выбор­ки. Ошибки репрезентативности выборки (случайные и систематические).

Интервальной оценкой параметра θ называется числовой интервал , к-ый с заданной вероятностью γ накрывает неизвестное значение параметра θ.

Обращаем внимание на то, что границы интервала и его величина находятся по выборочным данным и потому являются случайными величинами в отличие от оцениваемого параметра θ - величины неслучайной, поэтому правильнее говорить о том, что интервал «накрывает», а не «содержит» значение θ.

Такой интервал называется доверительным, а вер-ть γ - доверительной вер-тью, уровнем доверия или надежностью оценки.

Величина доверительного интервала существенно зависит от объема выборки n (уменьшается с ростом n) и от значения доверительной вер-ти γ (увеличивается с приближением γ к 1).

Очень часто (но не всегда) доверительный интервал выбирается симметричным относительно параметра θ, т.е. (θ-Δ,θ+Δ).

Наибольшее отклонение Δ оценки от оцениваемого параметра θ, в частности, выборочной средней (или доли) от генеральной средней (или доли), к-ое возможно с заданной доверительной вер-тью γ, называется предельной ошибкой выборки.

Ошибка Δ является ошибкой репрезентативности (представительства) выборки. Она возникает только вследствие того, что исследуется не вся совок-ть, а лишь часть, ее (выборка), отобранная случайно. Эту ошибку часто называют случайной ошибкой репрезентативности. Ее не следует путать с систематической ошибкой репрезентативности, появляющейся в рез-те нарушения принципа случайности при отборе элементов в выборку.

41. Формула доверительной вероятности при оценке генеральной доли признака. Средняя квадратическая ошибка повторной и бесповторной выборок и построение доверительного интервала для генеральной доли признака.

42. Формула доверительной вероятности при оценке генеральной средней. Средняя квадратическая ошибка повторной и бес­повторной выборок и построение доверительного интервала для генеральной средней.

Построение доверительного интервала для гeнеральной средней и гeнеральной доли по большим выборкам. Для построения доверительных интервалов для параметров генеральных совокупностей м.б. реализованы 2 подхода, основанных на знании точного (при данном объеме выборки n) или асимптотического (при n → ∞) распределения выборочных характеристик (или некоторых функций от них). Первый подход реализован далее при построении интервальных оценок параметров для малых выборок. В данном параграфе рассматривается второй подход, применимый для больших выборок (порядка сотен наблюдений).

Теорема. Вер-ть того, что отклонение выборочной средней (или доли) от генеральной средней (или доли) не превзойдет число Δ > 0 (по абсолютной величине), равна:

Где , Где .

Ф(t) - функция (интеграл вероятностей) Лапласа.

Формулы получили название формул доверительной вер-ти для средней и доли.

Среднее квадратическое отклонение выборочной средней и выборочной доли собственно-случайной выборки называется средней квадратической (стандартной) ошибкой выборки (для бесповторной выборки обозначаем соответственно и ).

Следствие 1. При заданной доверительной вер-ти γ предельная ошибка выборки равна t-кратной величине средней квадратической ошибки, где Ф(t) = γ, т.е.

,

.

Следствие 2. Интервальные оценки (доверительные интервалы) для генеральной средней и генеральной доли могут быть найдены по формулам:

,

.

43. Определение необходимого объема повторной и бесповтор­ной выборок при оценке генеральной средней и доли.

Для проведения выборочного наблюдения весьма важно правильно установить объем выборки n, к-ый в значительной степени определяет необходимые при этом временные, трудовые и стоимостные затраты для определения n необходимо задать надежность (доверительную вер-ть) оценки γ и точность (предельную ошибку выборки) Δ.

Если найден объем повторной выборки n, то объем соответствующей бесповторной выборки n' можно определить по формуле:

.

Т.к. , то при одних и тех же точности и надежности оценок объем бесповторной выборки n' всегда меньше объема повторной выборки n.

44. Статистическая гипотеза и статистический критерий. Ошибки 1-го и 2-го рода. Уровень значимости и мощность критерия. Принцип практической уверенности.

Определение. Статистической гипотезой называется любое предположение о виде или параметрах неизвестного закона распределения.

Различают простую и сложную статистические гипотезы. Простая гипотеза, в отличие от сложной, полностью определяет теоретическую функцию распределения СВ.

Проверяемую гипотезу обычно называют нулевой (или основной) и обозначают Н0. Наряду с нулевой гипотезой рассматривают альтернативную, или конкурирующую, гипотезу H1, являющуюся логическим отрицанием Н0. Нулевая и альтернативная гипотезы представляют собой 2 возможности выбора, осуществляемого в задачах проверки статистических гипотез.

Суть проверки статистической гипотезы заключается в том, что используется специально составленная выборочная характеристика (статистика) , полученная по выборке , точное или приближенное распределение которой известно.

Затем по этому выборочному распределению определяется критическое значение - такое, что если гипотеза Н0 верна, то вер-ть мала; так что в соответствии с принципом практической уверенности в условиях данного исследования событие можно (с некоторым риском) считать практически невозможным. Поэтому, если в данном конкретном случае обнаруживается отклонение , то гипотеза Н0 отвергается, в то время как появление значения , считается совместимым с гипотезой Н0, которая тогда принимается (точнее, не отвергается). Правило, по которому гипотеза Н0 отвергается или принимается, называется статистическим критерием или статистическим тестом.

Принцип практической уверенности:

Если вер-ть события А в данном испытании очень мала, то при однократном выполнении испытания можно быть уверенным в том, что событие А не произойдет, и в практической д-ти вести себя так, как будто событие А вообще невозможно.

Т.о., множество возможных значений статистики - критерия (критической статистики) разбивается на 2 непересекающихся подмножества: критическую область (область отклонения гипотезы) W и область допустимых значений (область принятия гипотезы) . Если фактически наблюдаемое значение статистики критерия попадает в критическую область W, то гипотезу Н0 отвергают. При этом возможны четыре случая:

Определение. Вероятность α допустить ошибку l-го рода, т.е. отвергнуть гипотезу Н0, когда она верна, называется уровнем значимости, или размером критерия.

Вероятность допустить ошибку 2-го рода, т.е. принять гипотезу Н0, когда она неверна, обычно обозначают β.

Определение. Вероятность (1-β) не допустить ошибку 2-го рода, т.е. отвергнуть гипотезу Н0, когда она неверна, называется мощностью (или функцией мощности) критерия.

Следует предпочесть ту критическую область, при которой мощность критерия будет наибольшей.

45. Построение теоретического закона распределения по опыт­ным данным. Понятие о критериях согласия.

Одной из важнейших задач матем-кой статистики является установление теоретического закона распределения случайной величины, характеризующей изучаемый признак по опытному (эмпирическому) распределению, представляющему вариационный ряд.

Для решения этой задачи необходимо определить вид и параметры закона распределения.

1. Предположение о виде закона распределения м.б. выдвинуто исходя из теоретических предпосылок, опыта аналогичных предшествующих исследований и, наконец, на основании графического изображения эмпирического распределения.

2. Параметры распределения, как правило, неизвестны, поэтому их заменяют наилучшими оценками по выборке.

Критерии согласия отвечают на вопрос: объясняются ли расхождения между эмпирическим и теоретическим распределениями только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они являются существенными и связаны с тем, что теоретический закон распределения подобран неудачно.

Пусть необходимо проверить нулевую гипотезу Н0 о том, что исследуемая СВ Х подчиняется определенному закону распределения. Для проверки гипотезы Н0 выбирают некоторую СВ U, характеризующую степень расхождения теоретического и эмпирического распределений, закон распределения которой при достаточно больших n известен и практически не зависит от закона распределения СВ Х.

Зная закон распределения U, можно найти вероятность того, что U приняла значение не меньше, чем фактически наблюдаемое в опыте u, т.е. U ≥ u.

Если Р(U ≥ u) = α мала, то это означает в соответствии с принципом практической уверенности, что такие, как в опыте, и большие отклонения практически невозможны. В этом случае гипотезу Н0 отвергают.

Если же вероятность Р(U ≥ u) = α не мала, расхождение между эмпирическим и теоретическим распределениями несущественно и гипотезу Н0 можно считать правдоподобной или по крайней мере не противоречащей опытным данным.

46. Критерий согласия х2-Пирсона и схема его применения.

Критерии - Пирсона в качестве меры расхождения U берется величина , равная сумме квадратов отклонений частостей (статистических вер-тей) от гипотетических , рассчитанных по предполагаемому распределению, взятых с некоторыми весами :

.

Веса вводятся т.о., чтобы при одних и тех же отклонениях больший вес имели отклонения, при которых мала, и меньший вес - при которых велика. Очевидно, этого удается достичь, если взять обратно пропорциональными вер-тям . Взяв в качестве весов , можно доказать, что при n → ∞ статистика.

, или .

имеет -распределение с k = m - r - 1 степенями свободы, где m - число интервалов эмпирического распределения (вариационного ряда); r - число параметров теоретического распределения, вычисленных по экспериментальным данным.

Числа и называются соответственно эмпирическими и теоретическими частотами.

Схема применения критерия для проверки гипотезы Н0 сводится к следующему:

1. Определяется мера расхождения эмпирических и теоретических частот по

2. Для выбранного уровня значимости α по таблице -распределения находят критическое значение при числе степеней свободы k = m - r - 1.

3. Если фактически наблюдаемое значение больше критического, т.е. то гипотеза Н0 отвергается, если гипотеза Н0 не противоречит опытным данным.

3амечание. Статистика имеет -распределение лишь при n → ∞, поэтому необходимо, чтобы в каждом интервале было достаточное количество наблюдений, по крайней мере 5 наблюдений. Если в каком-нибудь интервале число наблюдений ni< 5, имеет смысл объединить соседние интервалы, чтобы в объединенных интервалах было не меньше 5.

47. Функциональная, статистическая и корреляционная зависимости. Различия между ними. Основные задачи теории корреляции.

Функциональная зависимость (связь), когда каждому значению одной переменной соответствует вполне определенное значение другой.

Функциональная зависимость может иметь место как между детерминированными (неслучайными) переменными, так и между случайными величинами.

Статистическая (или стохастическая, вероятностная) зависимость - каждому значению одной переменной соответствует определенное (условное) распределение другой переменной.

Т.е. когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной.

Возникновение понятия статистической связи обусловливается тем, что зависимая переменная подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что измерение значений переменных неизбежно сопровождается некоторыми случайными ошибками.

В силу неоднозначности статистической зависимости между Y и Х для исследователя, в частности, представляет интерес усредненная по х схема зависимости, т.е. закономерность в изменении среднего значения - условного математического ожидания (математического ожидания случайной переменной Y, вычисленного в предположении, что переменная Х приняла значение х) в зависимости от х.

Определение. Статистическая зависимость между 2мя переменными, при которой каждому значению 1 переменной соответствует определенное условное математическое ожидание (среднее значение) другой, называется корреляционной.

Иначе, корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.

Корреляционная зависимость м.б. представлена в виде:

(1)

(2)

Предполагается, что и , т.е. если при изменении х или у условные математические ожидания и не изменяются, то говорят, что корреляционная зависимость между переменными Х и Y отсутствует.

Сравнивая различные виды зависимости между Х и Y, можно сказать, что с изменением значений переменной Х при функциональной зависимости однозначно изменяется определенное значение переменной Y, при корреляционной - определенное среднее значение (условное математическое ожидание) Y, а при статистической - определенное (условное) распределение переменной Y. Т.о., из рассмотренных зависимостей наиболее общей выступает статистическая зависимость. Каждая корреляционная зависимость является статистической, но не каждая статистическая зависимость является корреляционной. Функциональная зависимость представляет частный случай корреляционной.

Уравнения (1) и (1) называются модельными уравнениями регрессии (или просто уравнениями регрессии) соответственно Y по Х и Х по Y, функции и - модельными функциями регрессии (или функциями регрессии), а их графики - модельными линиями регрессии (или линиями регрессии).

48. Линейная парная регрессия. Система нормальных уравне­ний для определения параметров прямых регрессии. Выборочная ковариация. Формулы для расчета коэффициентов регрессии.

Данные о статистической зав-ти удобно задавать в виде корреляционной таблицы.

(В таблице через и обозначены середины соответствующих интервалов, а и - соответственно их частоты).

Изобразим полученную зав-ть графически точками координатной плоскости. Такое изображение статистической зав-ти наз-ся полем корреляции.

Для каждого значения (i = 1,2,..., l), т.е. для каждой строки корреляционной таблицы вычислим групповые средние

где - частоты пар (, ) и ; m - число интервалов по переменной Y.

Вычисленные групповые средние графически в виде ломаной, называемой эмпирической линией регрессии У по Х.

Аналогично для каждого значения (j = 1,2,...,m):

.

где ; l - число интервалов по переменной Х.

По виду ломаной можно предположить наличие линейной корреляционной зав-ти У по Х между двумя рассматриваемыми переменными, которая графически выражается тем точнее, чем больше объем выборки n:

Поэтому уравнение регрессии будем искать в виде:

.

Применим метод наименьших квадратов, согласно которому неизвестные параметры и выбираются таким образом, чтобы сумма квадратов отклонений эмпирических групповых средних , от значений , найденных по уравнению регрессии, был минимальной:

Система нормальных уравнений для определения параметров линейной регрессии:

Или

.

где соответствующие средние определяются по формулам:

, , .

.

Подставляя значение из первого уравнения системы в уравнение регрессии, получим:

, или .

Коэффициент в уравнении регрессии, называемый выборочным коэффициентом регрессии (или просто коэффициентом регрессии) Y по Х, будем обозначать символом . Теперь уравнение регрессии У по Х запишется так:

.

Коэффициент регрессии У по Х показывает, на сколько единиц в среднем изменяется переменная У при увеличении переменной Х на одну единицу.

Решая систему, найдем

где - выборочная дисперсия переменной Х:

μ - выборочный корреляционный момент или выборочная ковариация:

Рассуждая аналогично и полагая уравнение регрессии линейным, можно привести его к виду:

.

Где - выборочный коэффициент регрессии (или просто коэффициент регрессии) Х по Y, показывающий, на сколько единиц в среднем изменяется переменная Х при увеличении переменной У на одну единицу;

- выборочная дисперсия переменной У.

Упрощенный способ:

От значений переменных и переходят к новым значениям

и

где k и k' - величины интервалов, а с и с' - середины серединных интервалов соответственно по переменной Х или У. Тогда:

В этом случае формула для ковариации примет вид:

49. Оценка тесноты связи. Коэффициент корреляции (выбороч­ный), его свойства и оценка достоверности.

 







Дата добавления: 2015-08-12; просмотров: 614. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Эндоскопическая диагностика язвенной болезни желудка, гастрита, опухоли Хронический гастрит - понятие клинико-анатомическое, характеризующееся определенными патоморфологическими изменениями слизистой оболочки желудка - неспецифическим воспалительным процессом...

Признаки классификации безопасности Можно выделить следующие признаки классификации безопасности. 1. По признаку масштабности принято различать следующие относительно самостоятельные геополитические уровни и виды безопасности. 1.1. Международная безопасность (глобальная и...

Прием и регистрация больных Пути госпитализации больных в стационар могут быть различны. В цен­тральное приемное отделение больные могут быть доставлены: 1) машиной скорой медицинской помощи в случае возникновения остро­го или обострения хронического заболевания...

Толкование Конституции Российской Федерации: виды, способы, юридическое значение Толкование права – это специальный вид юридической деятельности по раскрытию смыслового содержания правовых норм, необходимый в процессе как законотворчества, так и реализации права...

Значення творчості Г.Сковороди для розвитку української культури Важливий внесок в історію всієї духовної культури українського народу та її барокової літературно-філософської традиції зробив, зокрема, Григорій Савич Сковорода (1722—1794 pp...

Постинъекционные осложнения, оказать необходимую помощь пациенту I.ОСЛОЖНЕНИЕ: Инфильтрат (уплотнение). II.ПРИЗНАКИ ОСЛОЖНЕНИЯ: Уплотнение...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия