К Р И Т Е Р И Й З Н А К О В
Статистикой критерия является число знаков «+» или «-» в последовательности знаков разностей парных выборок. Пример. Предполагается, что один из двух приборов, определяющий скорость автомобиля, имеет систематическую ошибку. Для проверки этого предположения определили скорость 10 автомобилей, причём скорость каждого фиксировалась одновременно двумя приборами. В результате получены следующие данные: V1, км/час 70 85 63 54 65 80 75 95 52 55 V2,км/час 72 86 62 55 63 80 78 90 53 57 Позволяют ли эти результаты утверждать, что второй прибор действительно даёт завышенные значения скорости. Принять α= 0,10. В предположении, что скорости движения автомобилей не зависят друг от друга, задачу можно решить, применяя критерий знаков. Составим последовательность знаков разностей V1–V2: -, -, +, -, +, 0, -, +, -, -. Число ненулевых разностей l=9, число положительных разностей r = 3. Проверим гипотезу о том, что различие в показаниях приборов вызвано случайными ошибками, т.е. гипотезу Ho: p= 1/2. Альтернативная гипотеза предполагает, что показания второго прибора имеют положительное смещение; в этом случае вероятность появления положительных разностей должна быть меньше ½. Таким образом, альтернативная гипотеза формулируется так: H1: p<½. Для проверки гипотезы Ho используем неравенство Fв = F1-α(k1, k2), где k1=2(r+ 1), k2 = 2 (l–r). Имеем: k1= 2 · (3+1) = 8, k2 = 2 ·(9- 3) = 12, Fв = = 1,5. Так как по таблице квантилей распределения Фишера F 0. 90(8,12)=2,24, гипотеза Ho не противоречит результатам наблюдений. Следует считать что различие в показаниях приборов вызваны случайными ошибками.
Критерий знаков (G-критерий) Критерий предназначен для сравнения состояния некоторого свойства у членов двух зависимых выборок на основе измерений, сделанных по шкале не ниже ранговой. Имеется две серии наблюдений над случайными переменными X и У, полученные при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (хi, уi), где хi, уi — результаты двукратного измерения одного и того же свойства у одного и того же объекта. В педагогических исследованиях объектами изучения могут служить учащиеся, учителя, администрация школ. При этом хi, уi могут быть, например, балловыми оценками, выставленными учителем за двукратное выполнение одной и той же или различных работ одной и той же группой учащихся до и после применения некоторого педагогическою средства. Элементы каждой пары хi, уi сравниваются между собой по величине, и паре присваивается знак «+», если хi < уi, знак «—», если хi > уi и «0», если хi = уi. Нулевая гипотеза формулируются следующим образом: в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях. Альтернативная гипотеза: законы распределения величин X и У различны, т. е. состояния изучаемого свойства существенно различны в одной и той же совокупности при первичном и вторичном измерениях этого свойства. Статистика критерия (Т) определяется следующим образом: допустим, что из N пар (х, у,) нашлось несколько пар, в которых значения хi и уi равны. Такие пары обозначаются знаком «0» и при подсчете значения величины Т не учитываются. Предположим, что за вычетом из числа N числа пар, обозначенных знаком «0», осталось всего n пар. Среди оставшихся n пар подсчитаем число пар, обозначенных знаком «-», т.е, пары, в которых xi<yi. Значение величины Т и равно числу пар со знаком минус. Нулевая гипотеза принимается на уровне значимости 0,05, если наблюдаемое значение T<n-ta, где значение n-ta определяется из статистических таблиц для критерия знаков. Пример. Учащиеся выполняли контрольную работу, направленную на проверку усвоения некоторого понятия. Пятнадцати учащимся затем предложили электронное пособие, составленное с целью формирования данного понятия у учащихся с низким уровнем обучаемости. После изучения пособия учащиеся снова выполняли ту же контрольного работу, которая оценивалась по пятибалльной системе. Результаты двукратного выполнения работы представляют измерения по шкале порядка (пятибалльная шкала). В этих условиях возможно применение знакового критерия для выявления тенденции изменения состояния знаний учащихся после изучения пособия, так как выполняются все допущения этого критерия. Результаты двукратного выполнения работы (в баллах) 15 учащимися запишем в форме таблицы: Таблица
Проверяется гипотеза H0: состояние знаний учащихся не повысилось после изучения пособия. Альтернативная гипотеза: состояние знаний учащихся повысилось после изучения пособия. Подсчитаем значение статистики критерия Т равное числу положительных разностей отметок, полученных учащимися. Согласно данным табл. Т=10, n=12. Для определения критических значений статистики критерия n—ta используем табл. Приложения 2. Для уровня значимости а = 0,05 при n=12 значение n—ta=9. Следовательно выполняется неравенство Т> n—ta (10>9). Поэтому в соответствии с правилом принятия решения нулевая гипотеза отклоняется на уровне значимости 0,05 и принимается альтернативная гипотеза, что позволяет сделать вывод об улучшении знаний учащихся после самостоятельного изучения пособия. Пример 5. Предполагается, что изучение курса математики способствует формированию у учащихся одного из приемов логического мышления (например, приема обобщения) даже в том случае, если его формирование не проводится целенаправленно. Для проверки этого предположения был проведен следующий эксперимент. Учащимся VII класса было предложено 5 задач, решение которых основано на использовании данного приема мышления. Считалось, что учащийся владеет этим приемом, если он дает верный ответ на 3 и более задачи. Была разработана следующая шкала измерений: верно решена 1 или 2 задачи — оценка «0»; верно решено 3 задачи — оценка «1»; верно решено 4 задачи— оценка «2»; верно решено 5 задач — оценка «3». Работа проводилась дважды: в конце сентября и конце мая следующего года. Ее писали 35 одних и тех же учащихся, отобранных методом случайного отбора из 7 разных школ. Результаты двукратного выполнения работы запишем в форме таблицы В соответствии с целями эксперимента формулируем нулевую гипотезу следующим образом: Н0 — изучение математики не способствует формированию изучаемого приема мышления. Тогда альтернативная гипотеза будет иметь вид: Н1 — изучение математики способствует овладению этим приемом мышления. Таблица 5. Согласно данным табл. 5, значение статистики Т=15 — число разностей со знаком «+». Из 35 пар 12 имеют знак «0»; значит, n = 35-12 = 23. По таблице Приложения 2 для n=23 и уровня значимости 0,025 находим критическое значение статистики критерия, равное 16. Следовательно, верно неравенство Т<n—ta (15<16). Поэтому в соответствии с правилом принятия решений приходится сделать вывод о том, что полученные результаты не дают достаточных оснований для отклонения нулевой гипотезы, т. е. мы не располагаем достаточными основаниями для отклонения утверждения о том, что изучение математики само по себе не способствует овладению выделенным приемом мышления. КРИТЕРИЙ ВИЛКОКСОНА Критерий Вилкоксона служит для проверки однородности двух независимых выборок: x 1, x 2,…, x n1 и y 1, y 2,…, y n2. Достоинство этого критерия состоит в том, что он применим к случайным величинам, распределения которых неизвестны; требуется лишь, чтобы величины были непрерывными. Если выборки однородны, то считают, что они извлечены из одной и той же генеральной совокупности и, следовательно, имеют одинаковые, причём неизвестные, непрерывные функции распределения F 1(x) и F 2 (x). Таким образом, нулевая гипотеза состоит в том, что при всех значениях аргумента функции распределения равны между собой F 1(x) = F 2 (x). Конкурирующими гипотезами являются: F 1(x) F 2 (x), F 1(x) F 2 (x), и F 1(x) F 2 (x). Далее предполагается, что объём первой выборки меньше объёма второй. 1. Расположить варианты обеих выборок в возрастающем порядке, т. е. в одного вариационного ряда, и найти в этом ряду наблюдаемое значение критерия W набл – сумму порядковых номеров вариант первой выборки; 2. найти по таблице нижнюю критическую точку w нижн. кр. (Q; n 1, n 2), где Q= α/2; 3. найти верхнюю критическую точку по формуле w верхн. кр.= (n 1 + n 2 + 1) n 1 - w нижн. кр.. Если w нижн. кр.< W набл< w верхн. кр. – нет оснований отвергнуть нулевую гипотезу. Если W набл< w нижн. кр. или W набл > w верхн. кр.- нулевую гипотезу отвергают. ПРИМЕР. При уровне значимости 0,05 проверить нулевую гипотезу об однородности двух выборок объёмов n 1= 6 и n 2= 8: xi 15 23 25 26 28 29 yi 12 14 18 20 22 24 27 30 при конкурирующей гипотезе H1: F1 (x) ≠ F 2 (x). РЕШЕНИЕ. Расположим варианты обеих выборок в виде одного вариационного ряда и перенумеруем их: порядковые номера … 1 2 3 4 5 6 7 8 910 11 12 13 14 варианты … 12 14 15 18 20 22 23 24 25 26 27 28 29 30 Найдём наблюдаемое значение критерия Вилкоксона – сумму порядковых номеров (они набраны курсивом) вариант первой выборки: W набл= 3+7+9+10+12+13= 54. По таблице находим нижнюю критическую точку, учитывая, что Q = α/2=0.05/ 2=0.025, n 1= 6 и n 2= 8: w нижн. кр.(0,025; 6, 8) = 29. Находим верхнюю критическую точку: w верхн. кр.= (n 1+ n 2 +1) n 1 - w нижн. кр. = (6+ 8+ 1)·6 – 29 = 61. Так как 29 < 54 < 61, т.е. w нижн. кр.< W набл< w верхн. кр. – нет оснований отвергнуть нулевую гипотезу об однородности выборок.
|