Уровни статистической значимости
Формулирование гипотез систематизирует предположения исследователя и представляет их в четком и лаконичном виде. Благодаря гипотезам исследователь не теряет путеводной нити в процессе расчетов и ему легко понять после их окончания, что, собственно, он обнаружил. Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные. · Нулевая гипотеза – это гипотеза об отсутствии различий. Она обозначается как H0 и называется нулевой потому, что содержит число 0: X1–Х2 = 0, где X1 и Х2 – сопоставляемые значения признаков. Нулевая гипотеза – это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий. · Альтернативная гипотеза – это гипотеза о значимости различий. Она обозначается как H1. Альтернативная гипотеза – это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой. Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.
· Направленные гипотезы – H0: X1 не превышает Х2 H1: X1 превышает Х2 · Ненаправленные гипотезы – H0: X1 не отличается от Х2 H1: X1 отличается от Х2
Если вы заметили, что в одной из групп индивидуальные значения испытуемых по какому-либо признаку, например по социальной смелости, выше, а в другой ниже, то для проверки значимости этих различий нам необходимо сформулировать направленные гипотезы. Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, чем в группе Б, то нам тоже необходимо сформулировать направленные гипотезы. Если же мы хотим доказать, что различаются формы распределения признака в группе А и Б, то формулируются ненаправленные гипотезы. Проверка гипотез осуществляется с помощью критериев статистической оценки различий. Статистический критерий – это решающее правило, обеспечивающее надежное поведение, т. е. принятие истинной и отклонение ложной гипотезы с высокой вероятность. Статистические критерии обозначают также метод расчета определенного числа и само это число. Статистические критерии бывают эмпирические (полученные опытным путем в нашем исследовании) и критические (определяются по специальным таблицам). По соотношению эмпирического и критического значений критерия мы можем судить о том, подтверждается ли или опровергается нулевая гипотеза. В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий Манна–Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила. В некоторых случаях расчетная формула критерия включает в себя количество наблюдений в исследуемой выборке, обозначаемое как п. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице мы определяем, какому уровню статистической значимости различий соответствует данная эмпирическая величина. В большинстве случаев, однако одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в исследуемой выборке (п) или от так называемого количества степеней свободы, которое обозначается как ν или как df. Число степеней свободы ν равно числу классов вариационного ряда минус число условий, при которых он был сформирован. К числу таких условий относятся объем выборки (п), средние и дисперсии. Критерии делятся на параметрические (критерии, включающие в формулу расчета параметры распределения, т. е. средние и дисперсии) и непараметрические (критерии, не включающие в формулу расчета параметров распределения и основанные на оперировании частотами или рангами). И те, и другие критерии имеют свои преимущества и недостатки. Параметрические критерии несколько более мощные, чем непараметрические, но только в том случае, если признак измерен по интервальной шкале и нормально распределен. Непараметрические критерии лишены всех этих ограничений и не требуют таких длительных и сложных расчетов. По сравнению с параметрическими критериями они ограничены лишь в одном, с их помощью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака. Уровни статистической значимости. Уровень значимости – это вероятность того, что мы сочли различия существенными, а они на самом деле случайны. Это вероятность отклонения нулевой гипотезы, в то время как она верна. · Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при р≤ 0, 05, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0, 05. · Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при р≤ 0, 01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0, 01. Исторически сложилось так, что в психологии принято считать низшим уровнем статистической значимости 5%-ый уровень (р≤ 0, 05): достаточным – 1%-ый уровень (р≤ 0, 01) и высшим 0, 1%-ый уровень (р≤ 0, 001), поэтому в таблицах критических значений обычно приводятся значения критериев, соответствующих уровням статистической значимости р≤ 0, 05 и р≤ 0, 01, иногда – р≤ 0, 001. Для некоторых критериев в таблицах указан точный уровень значимости их разных эмпирических значений. До тех пор, однако пока уровень статистической значимости не достигнет р=0, 05, мы еще не имеем права отклонить нулевую гипотезу. Следует придерживаться следующего правила отклонения гипотезы об отсутствии различий (Н0) и принятия гипотезы о статистической достоверности различий (H1). · Если эмпирическое значение критерия равняется критическому значению, соответствующему р≤ 0, 05 или превышает его, то H0 отклоняется, но мы еще не можем определенно принять H1. Если эмпирическое значение критерия равняется критическому значению, соответствующему р≤ 0, 01 или превышает его, то H0 отклоняется и принимается H1. · Исключения: критерий знаков G, критерий Т Вилксона и критерий U Манна-Уитни. Для них устанавливаются обратные соотношения. ПРАКТИЧЕСКИЙ БЛОК Задание 1. В результате опроса 200 испытуемых получены данные, которые распределены по четырем характерным возрастным группам: 50 человек в возрасте 21–25 лет; 50 человек в возрасте 26–30 лет; 50 человек в возрасте 31–40 лет; 50 человек в возрасте 41–50 лет. Рассчитайте среднюю арифметическую величину возраста. Решение Предварительно заполните таблицу, подобрав к каждому алгоритму соответствие из данной ситуации.
Таким образом, средняя арифметическая величина возраста – 33 года. Этот расчет основан на предположении, что в каждом из выделенных возрастных периодов насчитывается одинаковое количество испытуемых, т.е. их возраст равномерно распределен во всем наблюдаемом диапазоне – от 21 до 50 лет. Решите самостоятельно следующие ситуации. В эксперименте принимало участие 100 человек. Получены следующие данные темпа усвоения знаний (ТУЗ), которые распределены по пяти характерным интервалам: 20 человек показали ТУЗ 1-10'Линков в ак.час; 20 человек показали ТУЗ 11–20 линков в ак.час; 20 человек показали ТУЗ 21–30 линков в ак.час; 20 человек показали ТУЗ 31–40 линков в ак.час; 20 человек показали ТУЗ 41–50 линков в ак.час. Рассчитайте среднюю арифметическую величину темпа усвоения знаний. По результатам исследования скорости чтения у 60 испытуемых получены данные, которые распределены по четырем характерным интервалам: 15 человек показали скорость 1–500 знаков в минуту; 15 человек показали скорость 501–1000 знаков в минуту; 15 человек показали скорость 1001–1500 знаков в минуту; 15 человек показали скорость 1501–2000 знаков в минуту. Рассчитайте среднюю арифметическую величину скорости чтения. В тестировании принимали участие 75 испытуемых. Получены следующие данные по интеллектуальным способностям (IQ), которые распределены по трем характерным интервалам: 25 человек показали IQ 91–100 баллов; 25 человек показали IQ 101–110 баллов; 25 человек показали IQ 111–120 баллов. Рассчитайте среднюю арифметическую величину коэффициента интеллектуальных способностей.
|