Студопедия — МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ






Множественные сравнения являются одной из труднейших проблем в математической статистике. В действительности при анализе данных исследователи сталкиваются с ними на каждом шагу.

Пусть, например, мы рассматриваем 100 независимых таблиц сопряженности пар переменных, отбирая среди них "интересные" для анализа с использованием критических значений хи-квадрат 5%-го уровня значимости. Тогда при отсутствии связи переменных мы будем в среднем в таких испытаниях получать 5 "интересных" (значимых) таблиц, даже если связь между всеми переменными отсутствует. Таким образом, какие бы ни были плохие данные, мы что-либо будем интерпретировать. Но при повторном сборе данных - мы можем получить противоположные результаты. Вот что значит множественные сравнения!

Сравнение групповых средних это одна из немногих задач, где удалось справиться с этой проблемой.

Суть задачи состоит в отборе значимых различий множества пар групп, определяемых переменной группирования. Сравнение пары средних мы научились делать с помощью процедуры T-TEST и, казалось бы, можно, задавшись уровнем значимости, пропустить через этот тест все пары групп и отобрать различающиеся по за данному уровню. Однако, перебирая группы, мы перебираем множество случайных чисел, и, благодаря этому, можем наткнуться на значимое отличие с гораздо большей вероятностью, чем при рассмотрении одной пары групп. В частности, если группы независимы и не связаны с тестируемой переменной, при 10 сравнениях по уровню значимости 0.05 мы с вероятностью 1-(1-0.05)10=0.4 случайно получим хотя бы одно "значимое" различие.

Для пояснения механизма работы тестов множественных сравнений остановимся на 3-х из 20 тестах, реализованных в SPSS.

Согласно методу Бонферрони, в случае множественных сравнений назначается более строгий уровень значимости для попарных сравнений. Он определяется так: задается уровень значимости для множественных сравнений am и в качестве попарного уровня значимости берется a=(1/k)am., где k - число сравнений. Пусть Ai - событие, состоящее в том, что мы в i -том сравнении выявили существенное отличие средних, когда средние совпадают, тогда, в соответствии с заданным уровнем значимости, P{Ai}<a. Ясно, что P{A1+A2+…+Ak}≤P{A1}+P{A2}+…+P{Ak}<ka=am, поэтому метод Бонферрони гарантирует нас от ошибки с вероятностью, не меньшей am. В независимых сравнениях неравенство P{A1+A2+…+Ak}<ka, будет выполняться почти точно, так как 1-(1-a)k»ka. Критерий несколько жестче, чем необходимо, так как средние в группах связаны - их взвешенная сумма равна общему среднему.

Метод Шеффе построен на контрастах. С его помощью проверяется гипотеза равенства нулю сразу всех контрастов, не только тех, что сравнивают пары групп. В результате он часто оказывается еще строже, чем критерий Бонферрони.

Таблица 4.10. Oneway, сравнение среднего промедианного логарифма доходов.

  N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean Minimum Maximum
Lower Bound Upper Bound
1.00 Высшее   0.048 0.511 0.032 -0.016 0.111 -1.050 2.015
2.00 н/высш   -0.248 0.606 0.100 -0.450 -0.046 -1.386 1.099
3.00 ср спец   0.009 0.479 0.032 -0.055 0.073 -1.386 1.740
4.00 среднее   -0.093 0.619 0.054 -0.200 0.015 -2.254 1.504
5.00 ниже сред.   -0.107 0.530 0.092 -0.295 0.081 -0.916 1.099
Total   -0.016 0.534 0.021 -0.057 0.024 -2.254 2.015

Таблица 4.11. Oneway, проверка однородности дисперсий

Levene Statistic df1 df2 Sig.
2.282     0.059

Таблица 4.12. Oneway, обычный дисперсионный анализ

  Sum of Squares df Mean Square F Sig.
Between Groups 4.187   1.047 3.724 0.005
Within Groups 187.202   0.281    
Total 191.389        

Таблица 4.13. Oneway, группы неразличимых средних

  W10 образование      
Tukey HSD 2.00 н/высш   -0.248  
  5.00 ниже среднего   -0.107 -0.107
  4.00 среднее   -0.093 -0.093
  3.00 ср спец     0.009
  1.00 Высшее     0.048
  Sig.   0.429 0.436
Scheffe 2.00 н/высш   -0.248  
  5.00 ниже среднего   -0.107 -0.107
  4.00 среднее   -0.093 -0.093
  3.00 ср спец   0.009 0.009
  1.00 Высшее     0.048
  Sig.   0.093 0.579

 

Критерий Тьюки основан на одновременных доверительных интервалах разности матожиданий в группах. Этот критерий из трех рассматриваемых, пожалуй, наиболее разумен. Предположение об одновременном равенстве разностей всех групповых матожиданий - слишком сильное предположение, в критерии Тьюки такого не предполагается.

Таблица 4.14. Oneway, множественные попарные сравнения

      Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval
  (I) W10 образование (J) W10 образование       Lower Bound Upper Bound
Tukey HSD 1.00 Высшее 2.00 н/высш 0.296* 0.093 0.013 0.041 0.551
    3.00 ср спец 0.039 0.049 0.934 -0.095 0.172
    4.00 среднее 0.140 0.057 0.102 -0.016 0.297
    5.00 ниже среднего 0.154 0.098 0.516 -0.113 0.422
  2.00 н/высш 1.00 Высшее -0.296* 0.093 0.013 -0.551 -0.041
    3.00 ср спец -0.257 0.094 0.050 -0.514 0.000
    4.00 среднее -0.155 0.099 0.515 -0.425 0.114
    5.00 ниже среднего -0.142 0.127 0.799 -0.488 0.205
  3.00 ср спец 1.00 Высшее -0.039 0.049 0.934 -0.172 0.095
    2.00 н/высш 0.257 0.094 0.050 0.000 0.514
    4.00 среднее 0.102 0.059 0.412 -0.058 0.262
    5.00 ниже среднего 0.116 0.099 0.769 -0.154 0.386
  4.00 среднее 1.00 Высшее -0.140 0.057 0.102 -0.297 0.016
    2.00 н/высш 0.155 0.099 0.515 -0.114 0.425
    3.00 ср спец -0.102 0.059 0.412 -0.262 0.058
    5.00 ниже среднего 0.014 0.103 1.000 -0.268 0.296
  5.00 ниже среднего 1.00 Высшее -0.154 0.098 0.516 -0.422 0.113
    2.00 н/высш 0.142 0.127 0.799 -0.205 0.488
    3.00 ср спец -0.116 0.099 0.769 -0.386 0.154
    4.00 среднее -0.014 0.103 1.000 -0.296 0.268

 

В качестве примера рассмотрим различие среднего промедианного логарифма доходов в группах по образованию, группы которого несколько укрупнены:

recode v10 (4 5 =4) (6 7 8=5) (else=copy) into w10.

var lab w10 "образование";.

value lab w10 1 "Высшее" 2 "н/высш" 3 "ср. спец" 4 "среднее" 5 "ниже среднего";.

ONEWAY lnv14m BY w10 /STATISTICS DESCRIPTIVES HOMOGENEITY /POSTHOC = BTUKEY SCHEFFE BONFERRONI ALPHA(.05).

На основании полученной выдачи видим, что:

- доверительные интервалы для высшего и неполного высшего образования не пересекаются (см. табл.4.10);

- дисперсии в группах различаются не существенно (см. тест Ливиня, табл.4.11);

- в целом наблюдается связь душевого дохода с образованием (гипотеза о равенстве средних - отвергается, см. таблицу 4.12);

- выделились следующие две группы по образованию с неразличимыми средними: 2 н/высшее, 5 ниже среднего, 4 среднее и 5 ниже среднего, 4 среднее, 3 среднее спец, 1 высшее (табл.4.13);

- попарные множественные сравнения показали, что единственная пара отличающихся по средним групп - это группы с неполным высшим и респондентов с высшим образованием (наблюдаемая значимость - 0.013, таблица 4.14).

Следует заметить, что мы не показали здесь часть таблицы попарных сравнений с результатами для метода Бонферрони и Шеффе; результаты аналогичны, но для указанной пары групп значимость различия по Шеффе - 0.041, по Бонферрони - 0.016. Это показывает большую чуствительность теста Тьюки.







Дата добавления: 2015-08-30; просмотров: 355. Нарушение авторских прав; Мы поможем в написании вашей работы!



Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Краткая психологическая характеристика возрастных периодов.Первый критический период развития ребенка — период новорожденности Психоаналитики говорят, что это первая травма, которую переживает ребенок, и она настолько сильна, что вся последую­щая жизнь проходит под знаком этой травмы...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Решение Постоянные издержки (FC) не зависят от изменения объёма производства, существуют постоянно...

Опухоли яичников в детском и подростковом возрасте Опухоли яичников занимают первое место в структуре опухолей половой системы у девочек и встречаются в возрасте 10 – 16 лет и в период полового созревания...

Способы тактических действий при проведении специальных операций Специальные операции проводятся с применением следующих основных тактических способов действий: охрана...

Искусство подбора персонала. Как оценить человека за час Искусство подбора персонала. Как оценить человека за час...

Studopedia.info - Студопедия - 2014-2024 год . (0.015 сек.) русская версия | украинская версия