Студопедия — Двухвыборочный t-тест для связанных выборок (Paired sample T-TEST)
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Двухвыборочный t-тест для связанных выборок (Paired sample T-TEST)






Если на одних и тех же объектах дважды измеряется некоторое свойство, то проверка значимости различия средних по измеренным переменным осуществляется этим тестом. Пример задания команды:

T-TEST PAIRS = x WITH y (PAIRED) /CRITERIA = CIN(.95).

Переменные x и y могут быть характеристиками мужа и жены при исследовании семей; по данным RLMS – измерениями, связанными с потреблением напитков в 1996 и 1998 г., и т. п. Поэтому данная процедура полезна для анализа панельных данных.

Почему же здесь нельзя воспользоваться таким же анализом, как и для двух несвязанных выборок, считая, что имеются две выборки одинакового объема?

Проверка значимости различия матожиданий x и y эквивалентна проверке гипотезы о равенстве нулю математического ожидания разности x - y. Дисперсия разности x - y равна D (x - y)= D (x) + D (y) - 2 cov (X,Y). Отсюда точность оценки матожиданий x - y связана с ковариацией x и y.

Поэтому наряду с соответствующей статистикой в выдачу по этому тесту входит и коэффициент корреляции этих переменных и наблюдаемая значимость.

Для примера взгляните на выдачу, в которой сравниваются вес 1995 и 1996 г. женщин от 30 до 40 лет (в 1995 г.), табл. 4.5 – 7, данные RLMS.

Таблица4. 5

T-тест на связанных выборках, описательные статистики

  Mean N Std. Deviation Std. Error Mean
AM1 Вес 1995 67,59   13,72 0,49
BM1 Вес 1996 68,12   14,22 0,50

Таблица4. 6

T-тест на связанных выборках, корреляции

  N Correlation Sig.
AM1 Вес 1995 & BM1 Вес 1996   0,914 0,0000

Таблица4. 7

T-тест на связанных выборках, сравнение средних

  Paired Differences Mean Std. Deviation Std. Error Mean 95 % Con­fi­dence Interval of the Difference t df Sig. (2-tailed)
Lower Upper
AM1 Вес 1995 & BM1 Вес 1996 –0,53 5,81 0,21 –0,93 –0,12 –2,547   0,011

Женщины в среднем набрали по полкилограмма веса, и этот прирост статистически значим. Значим и коэффициент корреляции – вес в целом имеет свойство сохраняться.

4.1.4. Команда MEANS – сравнение характеристик числовой переменной по группам

Процедура вычисляет одномерные статистики в группах – все описательные статистики, которые вычислялись командами DESCRIPTIVES и FREQUENCIES, а также гармоническое среднее, среднее геометрическое, проценты сумм значений переменных в группах и др. – всего 20 харак­те­ристик. Поэтому имя команды MEANS (cредние) сохранилось лишь «исторически», оно пришло из ранних версий SPSS, где ее назначением, действительно, было сравнение средних. В диалоговом окне для назначения статистик используется кнопка Options. Проводится также одномерный дисперсионный анализ.

MEANS TABLES = v14 BY v11 BY v8 /CELLS MEAN STDDEV MEDIAN COUNT /STATISTICS ANOVA.

В команде указывается список зависимых переменных, BY и список переменных, определяющих группы. Каждое дополнительное слово BY порождает следующий нижний уровень группирования, в диалоговом режиме слову BY соответствует кнопка Next.

Анализ результатов (табл. 4.8) позволяет сделать следующие выводы. Самый высокий среднемесячный доход (332 р.) имеют разведенные мужчины, при этом он значительно превосходит среднемесячный доход, полученный всеми разведенными (249 р.) и всеми мужчинами (238 р.). На втором месте по доходам находятся вдовцы (276 р.), но их всего 5 человек, поэтому цифра ненадежна. Среди женщин наиболее высокие среднемесячные доходы (226 р.) у состоящих в браке, что почти равно доходам женатых мужчин. Это естественно – ведь это же душевой доход в семье.

Мы можем сколько угодно описывать эту таблицу, но описание не будет доказательством какой-либо истины, пока оно не подтверждено статистическим выводом. Такая таблица может быть только источником гипотез о взаимосвязи, которые в дальнейшем следует проверить.

Одномерный дисперсионный анализ здесь проводится только по переменным первого уровня задания групп.

Напомним, что суть этого анализа состоит в вычислениии межгруппового квадратичныого разброса зависимой переменной SSв (Between groups) и внутригруппового разброса, обозначается SSw (Within groups). Величина SSв характеризует, насколько сильно отклонились от общего среднего средние между группами, а SSw – отклонения от центров групп. Статистика в условиях гипотезы равенства средних и дисперсий распределения при нормальном распределении X в группах имеет распределение Фишера. F представляет собой в определенном смысле расстояние наблюдаемой таблицы от таблицы, в которой нет никаких зависимостей, т. е. средние в группах совпадают. Чем больше F, тем существеннее зависимость, однако сама по себе величина F ни о чем не говорит. Ответ на вопрос дает, как обычно, величина наблюдаемой значимости F -критерия: Significance – вероятность случайно получить значение F, большее выборочного Sig=P{ F > F выб. }.

Таблица4. 8

Среднемесячный душевой доход в семье

V11 Cостояние в браке V8 Пол Mean Std. Deviation Median N
1 женат 1 муж. 228,4 152,9    
2 жен. 225,7 140,8    
Total 227,1 147,2    
2 вдовец 1 муж. 276,0 111,0    
2 жен. 192,8 112,7    
Total 209,4 115,1    
3 разведен 1 муж. 331,9 230,0    
2 жен. 195,9 86,1    
Total 249,0 169,7    
4 не был 1 муж. 263,3 223,0    
2 жен. 212,2 118,6    
Total 240,2 183,9    
Total 1 муж. 238,4 167,8    
2 жен. 219,9 133,4    
Total 229,3 152,0    

Еще раз обратим внимание на то, что в таком анализе используется предположение о нормальности распределения зависимой переменной. Не следует проводить непосредственно дисперсионный анализ переменных с существенно отличающимся от нормального распределением.

В табл. 4.9. приведена выдача одномерного дисперсионного анализа после выполнения команды

MEANS TABLES = lnv14m BY v11 BY v8 /STATISTICS ANOVA.

Наблюдаемый уровень значимости 0,707 свидетельствует о том, что на наших данных указанным методом связь не обнаруживается.

Таблица4. 9

Результаты однофакторного дисперсионного анализа

    Sum of Squares df Mean Square F Sig.
LNV14M Логарифм душевого дохода * V11 Cостояние в браке Between Groups 0,40   0,13 0,465 0,707
Within Groups 188,51   0,29    
Total 188,92        






Дата добавления: 2015-08-30; просмотров: 399. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Йодометрия. Характеристика метода Метод йодометрии основан на ОВ-реакциях, связанных с превращением I2 в ионы I- и обратно...

Броматометрия и бромометрия Броматометрический метод основан на окислении вос­становителей броматом калия в кислой среде...

Метод Фольгарда (роданометрия или тиоцианатометрия) Метод Фольгарда основан на применении в качестве осадителя титрованного раствора, содержащего роданид-ионы SCN...

Типология суицида. Феномен суицида (самоубийство или попытка самоубийства) чаще всего связывается с представлением о психологическом кризисе личности...

ОСНОВНЫЕ ТИПЫ МОЗГА ПОЗВОНОЧНЫХ Ихтиопсидный тип мозга характерен для низших позвоночных - рыб и амфибий...

Принципы, критерии и методы оценки и аттестации персонала   Аттестация персонала является одной их важнейших функций управления персоналом...

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия