Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Проверка статистических гипотез, критерии значимости, ошибки первого и второго рода





Под статистическими гипотезами понимаются некоторые предположения относительно распределений генеральной совокупности той или иной случайной величины. Под проверкой гипотезы понимают сопоставление некоторых статистических показателей, критериев проверки (критериев значимости), вычисляемых по выборке, с их значениями, определенными в предположении, что данная гипотеза верна. При проверке гипотез обычно подвергается испытанию некоторая гипотеза в сравнении с альтернативной гипотезой .

Чтобы решить вопрос о принятии или непринятии гипотезы, задаются уровнем значимости р. Наиболее часто используются уровни значимости, равные 0.10, 0.05 и 0.01. По этой вероятности, используя гипотезу о распределении оценки (критерия значимости), находят квантильные доверительные границы, как правило, симметричные и . Числа и называются критическими значениями гипотезы; значения и образуют критическую область гипотезы (или область непринятия гипотезы) (рис. 12) .

Рис. 12. Критическая область Рис. 13. Проверка статистических

гипотезы. гипотез.

 

Если найденное по выборке попадает между и , то гипотеза допускает такое значение в качестве случайного и поэтому нет оснований ее отвергать. Если же значение попадает в критическую область, то по данной гипотезе оно является практически невозможным. Но поскольку оно появилось, то отвергается сама гипотеза. При проверке гипотез можно совершить ошибки двух типов.

Ошибка первого рода состоит в том, что отвергается гипотеза, которая на самом деле верна. Вероятность такой ошибки не больше принятого уровня значимости. Ошибка второго рода состоит в том, что гипотеза принимается, а на самом деле она неверна. Вероятность этой ошибки тем меньше, чем выше уровень значимости, так как при этом увеличивается число отвергаемых гипотез. Если вероятность ошибки второго рода равна α, то величину (1 - α) называют мощностью критерия.

На рис. 13 приведены две кривые плотности распределения случайной величины , соответствующие двум гипотезам и . Если из опыта получается значение , то отвергается гипотеза и принимается гипотеза , и наоборот, если . Площадь под кривой плотности вероятности, соответствующей справедливости гипотезы Н0 вправо от значения , равна уровню значимости р, т. е. вероятности ошибки первого рода. Площадь под кривой плотности вероятности, соответствующей справедливости гипотезы влево от , равна вероятности ошибки второго рода α, а вправо от — мощности критерия (1 - α). Таким образом, чем больше р, тем больше (1 - α). При проверке гипотезы стремятся из всех возможных критериев выбрать тот, у которого при заданном уровне значимости меньше вероятность ошибки второго рода.

Обычно в качестве оптимального уровня значимости при проверке гипотез используют p = 0,05, так как если проверяемая гипотеза принимается с данным уровнем значимости, то гипотезу, безусловно, следует признать согласующейся с экспериментальными данными; с другой стороны, использование данного уровня значимости не дает оснований для отбрасывания гипотезы.

Например, найдены два значения и некоторого выборочного параметра, которые можно рассматривать как оценки генеральных параметров и . Высказывается гипотеза, что различие между и случайное и что генеральные параметры и равны между собой, т. е. . Такая гипотеза называется нулевой, или нуль-гипотезой. Для ее проверки нужно выяснить, значимо ли расхождение между и в условиях нулевой гипотезы. Для этого обычно исследуют случайную величину и проверяют, значимо ли ее отличие от нуля. Иногда удобнее рассматривать величину , сравнивая ее с единицей. Отвергая нулевую гипотезу, тем самым принимают альтернативную, которая распадается на две: . Если одно из этих равенств заведомо невозможно, то альтернативная гипотеза называется односторонней, и для ее проверки применяют односторонние критерии значимости (в отличие от обычных, двусторонних). При этом необходимо рассматривать лишь одну из половин критической области (рис. 12).

Например, р = 0,05 при двустороннем критерии соответствуют критические значения Θ0.025 и Θ0.975, т. е. значимыми (неслучайными) считаются Θ*, принявшие значения Θ* < Θ0.025 и Θ* > Θ0.975. При одностороннем критерии одно из этих неравенств заведомо невозможно (например, Θ* < Θ0.025) и значимыми будут лишь Θ* > Θ0.975. Вероятность последнего неравенства равна 0,025, и, следовательно, уровень значимости будет равен 0,025. Таким образом, если при одностороннем критерии значимости использовать те же критические числа, что и при двустороннем, этим значениям будет соответствовать вдвое меньший уровень значимости.

Обычно для одностороннего критерия берут тот же уровень значимости, что и для двустороннего, так как при этих условиях оба критерия обеспечивают одинаковую ошибку первого рода. Для этого односторонний критерий надо выводить из двустороннего, соответствующего вдвое большему уровню значимости, чем тот, что принят. Чтобы сохранить для одностороннего критерия уровень значимости р = 0,05, для двустороннего необходимо взять р = 0,10, что дает критические значения Θ0.05 и Θ0.95. Из них для одностороннего критерия останется какое-нибудь одно, например, Θ0.95. Уровень значимости для одностороннего критерия равен при этом 0.05. Этому же уровню значимости для двустороннего критерия соответствует критическое значение Θ0.975. Но Θ0.95 < Θ0.975, значит, при одностороннем критерии большее число гипотез будет отвергнуто и, следовательно, меньше будет ошибка второго рода.







Дата добавления: 2015-03-11; просмотров: 2589. Нарушение авторских прав; Мы поможем в написании вашей работы!




Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...


Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...


Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...


Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

ТЕХНИКА ПОСЕВА, МЕТОДЫ ВЫДЕЛЕНИЯ ЧИСТЫХ КУЛЬТУР И КУЛЬТУРАЛЬНЫЕ СВОЙСТВА МИКРООРГАНИЗМОВ. ОПРЕДЕЛЕНИЕ КОЛИЧЕСТВА БАКТЕРИЙ Цель занятия. Освоить технику посева микроорганизмов на плотные и жидкие питательные среды и методы выделения чис­тых бактериальных культур. Ознакомить студентов с основными культуральными характеристиками микроорганизмов и методами определения...

САНИТАРНО-МИКРОБИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ ВОДЫ, ВОЗДУХА И ПОЧВЫ Цель занятия.Ознакомить студентов с основными методами и показателями...

Меры безопасности при обращении с оружием и боеприпасами 64. Получение (сдача) оружия и боеприпасов для проведения стрельб осуществляется в установленном порядке[1]. 65. Безопасность при проведении стрельб обеспечивается...

Этические проблемы проведения экспериментов на человеке и животных В настоящее время четко определены новые подходы и требования к биомедицинским исследованиям...

Классификация потерь населения в очагах поражения в военное время Ядерное, химическое и бактериологическое (биологическое) оружие является оружием массового поражения...

Факторы, влияющие на степень электролитической диссоциации Степень диссоциации зависит от природы электролита и растворителя, концентрации раствора, температуры, присутствия одноименного иона и других факторов...

Studopedia.info - Студопедия - 2014-2025 год . (0.014 сек.) русская версия | украинская версия