Статистика вывода
Критерий Стъюдента Прочитайте текст и решите предложенную в конце задачу.
Чтобы полученные результаты исследования можно было применить не только к данным, собранным в ходе экспериментов, но и для всей популяции необходимо использовать статистику вывода. Ведь задача исследовательской работы в целом и заключается в открытии общих законов поведения. Чтобы проиллюстрировать применение статистики вывода, рассмотрим гипотетическое исследование, в котором сравнивается поведение в лабиринте двух групп крыс: одних кормят сразу после прохождения лабиринта, а других через 10 секунд. Эмпирический вопрос: способствует ли немедленное подкрепление запоминанию лабиринта? Предположим, что при исследовании 10 крыс (по 5 в каждой группе) получены следующие результаты. Каждая оценка означает количество попыток, потребовавшихся для запоминания лабиринта. Запоминание операционально определено как безошибочное прохождение лабиринта. Таблица 3 Результаты исследования
Обратите внимание, что оценки в каждой колонке не совсем одинаковы — это результат небольших различий между пятью крысами из каждой группы и, возможно, других случайных факторов. Однако, несмотря на отсутствие полного сходства, видно, что получавшие немедленное подкрепление крысы запомнили лабиринт быстрее (т. е. за меньшее количество попыток). Но общего впечатления от чисел недостаточно. Первый шаг анализа — вычисление таких величин описательной статистики, как среднее арифметическое и стандартное отклонение: Таблица 4 Величины описательной статистики эксперимента Немедленное подкрепление Отсроченное подкрепление Среднее арифметическое 13, 2 17, 6 Стандартное отклонение (S) 1, 9 2, 1 Дисперсия (S) 3.61 4.41 В среднем, по крайней мере, в этом примере, на запоминание лабиринта требуется больше попыток, если пищевое вознаграждение задерживается. Так же как показывает стандартное отклонение, изменчивость оценок в каждом наборе довольно низкая и практически одинакова для обеих групп. Можем ли мы заключить, что немедленное подкрепление в целом ускоряет запоминание лабиринта? Пока нет. Необходим заключительный анализ данных, в данном случае включающий проверку гипотезы. Проведите проверку по критерию Стъюдента. Будут ли крысы, получающие немедленное подкрепление, запоминать лабиринт быстрее? Образец расчета по критерию Стъюдента для независимых групп приведен ниже. Предположим, исследователь проводит простой эксперимент с памятью и с помощью случайного распределения сформировал две группы испытуемых. Одна группа изучает список из 25 слов при скорости показа 2 с на слово, а другая — при скорости 4 с на слово. Ниже приведено количество слов, запомненных пятью членами каждой группы. Таблица 5 Результаты эксперимента по изучению памяти N субъекта 2 с/слово (X,) N субъекта 2 с/слово (Х2) 1 14 6 18 2 11 7 23 3 12 8 19 4 17 9 17 5 13 10 22 Сумма 67 99 Среднее арифметическое 13.4 19.8 Стандартное отклонение 2.3 2.6 Дисперсия 5.3 6.7
В ходе проверки по критерию Стьюдента разница между двумя средними арифметическими, полученными по результатам эксперимента, делится на «стандартную ошибку различия» — предположительную оценку того, как сильно должны сходиться значения среднего арифметического при влиянии случайных факторов или возникновении ошибки. Исследователь надеется на то, что числитель будет большим, а знаменатель — маленьким, а следовательно, будет большим значение t. В таком случае различия между средними арифметическими будут больше, чем ожидается при воздействии только случайных факторов. Формула для вычисления коэффициента Стьюдента для независимых групп следующая: Шаг 2. Подставьте составляющие в формулу и вычислите значение t. Шаг 3. Определите, является ли найденное значение t значимым. Степень свободы для коэффициента Стьюдента для независимых групп равняется: В табл. критических значений для оценки результатов проверки по критерию Стьюдента в строке, где df= 8, находим критические значения. Они равняются 2, 31 (уровень значимости 0, 05) и 3, 36 (уровень значимости 0, 01). Найденное значение 4, 13 превосходит оба из них (знак минус не учитывается), а следовательно, t значимо для уровня 0, 01. В данном случае будет разумно отвергнуть нулевую гипотезу и заключить, что у испытуемых, которым демонстрировали слова с разной скоростью, запоминание различается. Шаг 4. Оцените силу эффекта. Как вы помните, обычно исследователи не только выясняют, являются ли различия между значениями среднего арифметического статистически значимыми, но также определяют относительную силу эффекта, вызываемого экспериментальным воздействием. При проверке по критерию Стьюдента сила эффекта равняется величине изменчивости зависимой переменной, вызываемой независимой переменной. Существуют различные способы оценки силы эффекта; один из наиболее распространенных — коэново d. Чтобы его вычислить, необходимо найти разность между значениями среднего арифметического и разделить ее на предполагаемое стандартное отклонение в популяции, значение которого находится для обоих групп: Чтобы найти предполагаемое стандартное отклонение в популяции, необходимо сложить значения дисперсии для двух групп и из полученного значения извлечь квадратный корень. Получаем:
Тогда сила эффекта равняется: Что означает такой результат? Согласно общим принципам, предложенным Коэном, силу эффекта можно разделить на малую (около 0, 2), среднюю (около 0, 5) и большую (около 0, 8) По этому стандарту 1, 85 — это очень большой эффект (знак минус можно не учитывать, он лишь показывает, какое из значений среднего арифметического стоит первым в числителе). Статистические гипотезы Прочитайте текст, разберитесь в особенностях ошибок первого и второго рода и выполните предлагаемое задание. Из лекционного курса вам известно, что гипотеза в процессе исследования подвергается изменению: общая гипотеза, операционализированная гипотеза, статистическая гипотеза. Для проверки гипотезы сначала необходимо сделать предположение о том, что разница между двумя изучаемыми условиями не сказывается на выполнении заданий, в данном случае разница между немедленным и отсроченным вознаграждением. Это предположение называется нулевой гипотезой (нуль = ничто), обозначается Н0 (читается «аш нулевое»). Гипотеза исследования (меньшее количество попыток у крыс, получающих немедленное подкрепление), тот результат, который вы надеетесь получить, называется альтернативной гипотезой, или Н1. Проводя исследование, вы будете стараться опровергнуть Н0 и соответственно подтвердить (но не доказать) Н1. Если эти слова звучат для вас странно, представьте, что дело происходит в суде. Обвиняемый человек считается невиновным, т. е. сделано предположение, что он ничего не совершал (нуль). Задача обвинения состоит в том, чтобы убедить суд в альтернативной гипотезе, а именно в том, что обвиняемый совершил преступление. Как и прокурор, исследователь должен показать, что нечто в действительности имеет место, а именно что в рассматриваемом случае задержка подкрепления влияет на запоминание лабиринта. Заключительный анализ может привести к одному из двух результатов. Обнаруженные вами различия в поведении двух групп крыс могут быть вызваны настоящими, действительными и несомненными причинами или быть игрой случая. Это означает, что различия в пределах выборки могут отражать действительные явления, но могут и не делать этого, и соответственно результатом заключительного статистического анализа будет либо отказ от гипотезы Н0, либо ее подтверждение. Невозможность отвергнуть гипотезу Н0 означает, что все найденные вами различия (а разница между группами почти всегда обнаруживается в ходе исследования), вероятнее всего, вызваны случайностью, ведь вам не удалось найти действительной закономерности, которую можно обобщить для случаев, выходящих за пределы выборки. Отказ от Н0 значит, что вы считаете, что некое явление действительно имело место в вашем исследовании и его результаты можно обобщить. В примере с лабиринтом отказаться от Н0 значит найти статистически значимые различия, свидетельствующие о существовании общей закономерности: немедленное подкрепление способствует запоминанию лабиринта. Абсолютную истинность гипотезы исследования доказать невозможно, так же как нельзя целиком и полностью доказать виновность подсудимого: считается, что вина доказана тогда, когда не возникает обоснованных сомнений. Таким образом, Н0 может быть отвергнута (и в то же время может быть подтверждена Н1,) с определенной степенью уверенности, описываемой как значение альфа. Формально альфа означает вероятность получения определенных результатов, если Н0 истинна. Условно альфа принимается равной 0, 05 (а = 0, 05), но можно задать также и другие значения альфа (например, а = 0, 01). Отказ от Н0 при значении альфа, равном 0, 05, означает, что вы считаете вероятность того, что результаты вашего исследования вызваны случайными факторами, очень низкой (5 из 100). Если они не являются игрой случая, то должна быть какая-то другая причина, а именно (как вы надеетесь) изучаемое вами явление, в данном случае задержка подкрепления. Выбор значения 0, 05 связан с особенностями нормальной кривой, которые рассматривались выше. Вспомните, что для нормального распределения оценок вероятность того, что конкретная оценка будет лежать на расстоянии, превышающем два стандартных отклонения от среднего арифметического по оси X, довольно низкая — 5% или меньше. Такое случается редко. Аналогично при сравнении двух наборов оценок, как в случае с лабиринтом, нас интересует вероятность обнаружения различий между значениями среднего арифметического, если в действительности никаких различий не существует (т. е. если гипотеза Н0 истинна). Если вероятность достаточно низкая, мы отвергаем Н0 и считаем, что обнаружены действительные различия. «Достаточно низкая» — это вероятность, равная 5%, или 0, 05. Другими словами, если Н0 истинна, то обнаружение различий между значениями среднего арифметического настолько маловероятно (редкое событие), что мы просто не можем поверить, что Н0 истинна. Мы считаем, что произошло что-то другое (т. е. задержка подкрепления действительно снижает скорость запоминания лабиринта), а поэтому отвергаем Н0 и заключаем, что между группами существуют «статистически значимые» различия. Ошибки 1 -го и 2-го рода Из предыдущего примера ясно, что мы можем неверно решить, нужно отвергать или нет Н0. В действительности есть два вида таких ошибок. Во-первых, можно отвергнуть Н0 и считать подтвержденным Н и при этом ошибиться. Отказ от Н0, когда по сути она истинна, называется ошибкой 1 рода. Получение статистического ответа: четыре возможных результата исследования со сравнением двух условий, Х и Y с учетом замен, названных выше, правильное решение означает, что а) действительных различий не существует, и вы их не обнаружили или б) действительные различия существуют, и вы их обнаружили. Ошибка 1-го рода значит, что действительных различий нет, но на основании результатов исследования вы считаете, что они есть. Ошибка 2-го рода означает, что различия есть, но, проводя исследование, вы их не обнаружили.
Таблица 6 Определение типа ошибки исследования Действительное положение дел
Упражнение Для каждого из следующих исследований: а) определите нулевую гипотезу, б) сделайте предположение об альтернативной гипотезе, т. е. изложите возможный ход исследования, в) опишите результаты исследования при ошибке 1 -го рода и г) охарактеризуйте результаты при ошибке 2-го рода. 1. В исследовании способности людей опознать ложь женщины и мужчины — участники исследования пытаются обнаружить обман в записанных на видео высказываниях женщин (в одних случаях они говорят правду, а в других — обманывают). 2. В исследовании восприятия младенцам дают привыкнуть к обычным изображениям человеческих лиц, а затем им показывают несколько неправильные лица, чтобы определить, видят ли они разницу. 3. Пациентов с депрессией и без нее просят высказать предположение о том, смогут ли они преодолеть лабиринт в человеческий рост. 4. Несколько спортсменов проходят тренинг формирования зрительных образов по новой методике непосредственно перед тем, как бить пенальти. Их результаты сравниваются с результатами других спортсменов, не проходивших тренинг.
Домашнее задание.
Используя лекционный материал и статью «Валидность» //Экспериментальная психология К.Д. Зароченцев, А.И. Кудрявцев, М., 2005 с 62- 69 ответьте на следующие вопросы: 1. Какие выды валидности используют в экспериментальной психологии? 2. Какой смысл вкладывается в понятие внешней валидности? Приведите примеры примеры исследований с нарушением внешней валидности. 3. Какой смысл вкладывается в понятие внешней валидности? Перечислите факторы, представляющие угрозу внутренней валидности. 4. Приведите пример эксперимента с нарушением операциональной валидности. 5. Какой смысл вкладывается в понятие экологической валидности? 6. Как соотносятся между собой понятия «операциональная» и «конструктная» валидность?
|