Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Ранговый критерий Спирмена




Доверь свою работу кандидату наук!
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой

Пусть имеется случайная выборка (X1,Y1),…,(Xn,Yn) генеральной совокупности двумерной непрерывной случайной величины (X, Y) с функцией распределения F(t,τ), a FX(t) и FY(τ) — функции распределения случайных величин X и Y соответственно. Если случайные величины X и У имеют нормальные распределения, то для проверки статистической гипотезы об их независимости H0: F(t,τ) = FX(t)FY(τ) можно использовать процедуру, связанную с вычислениями выборочного коэффициента корреляции (По формуле: , где - значение точечной оценки коэффициента корреляции).

Если же о распределениях непрерывных случайных величин X и Y ничего не известно, то для проверки основной гипотезы (1) при альтернативной гипотезе Н1: F(t,τ) ≠ FX(t)FY(τ) для некоторых (t, τ) € R2 используют ранговый критерий Спирмена, основанный на следующем понятии.

Пусть задана конечная числовая последовательность (1)

Определение 1. Рангом Ri элемента zi числовой последовательности (1) называют его порядковый номер в вариационном ряду z(1),…,z(N).

Множество результатов измерений {x1, x2, … , xn} величины X называется выборкой объема n. Для того чтобы иметь возможность воспользоваться аппаратом теории вероятностей, целесообразно наблюдаемую величину X рассматривать как случайную величину, функцию распределения которой F(x)=P{X<x}следует определить.

Полученный статистический материал x1, x2, ...xn наблюдений представляет собой первичные данные о величине, подлежащей статистической обработке. Обычно такие статистические данные оформляются в виде таблицы, графика, гистограммы и т.д.

Если выборка объема n содержит k различных элементов , причем встречается mi раз, то число mi называется частотой элемента , а отношение называется относительной частотой элемента . Очевидно, что

Вариационным (статистическим) рядом называется таблица, первая строка которой содержит в порядке возрастания элементы , а вторая - их частоты mi (относительные частоты ).

Согласно определению, Ri — это число элементов последовательности z1, ..., zN, не больших чем zi, которое можно записать следующим образом:

Ri = 1+ , где ŋ(t) — функция Хевисайда. Ранг любого элемента последовательности (1) — это натуральное число в диапазоне от 1 до N, причем ранг наименьшего элемента последовательности равен 1, а ранг наибольшего — N.

Пример 1. Рассмотрим выборку z4=(3,8, 4,7, —2,6,17,3). Ее вариационный ряд имеет вид —2,6; 3,8; 4,7; 17,3. Поэтому R1(z4) = 2, R2(z4) = 3, R3(z4) = 1, R4(z4) = 4. #

Определение 2. Рангом элемента Zi случайной выборки ZN = (Z1, ..., ZN) называют случайную величину Ri(ZN), реализация которой Ri(zN) есть ранг реализации zi случайной величины Zi, в вариационном ряду z(1),…,z(N).

Обозначим через Ri = Ri(Xn) — ранг элемента Хi случайной выборки Х1,..., Хn, а через Si = Si(Yn) — ранг элемента Yi случайной выборки Y1, ..., Yn.

Ранговым коэффициентом корреляции Спирмена назовем случайную величину

 

где

Статистика (2) является выборочным коэффициентом корреляции последовательностей рангов R1,…,Rn и S1,…,Sn.

Согласно определению рангов Ri, Si, i=, и можно показать, что

Без ограничения общности можно считать, что значения пар наблюдений (xi, yi), i =, занумерованы в порядке возрастания их первых элементов, т.е. так, что выполняются неравенства x1<x2<…<xn.

В этом случае реализация ri ранга Ri равна i, i = , и значение статистики можно вычислить по формуле

где — реализация ранга , i =.

Пусть выборочный коэффициент корреляции используется для нахождения линейной зависимости между случайными величинами X и Y. И если же между X и Y имеется функциональная, но не линейная зависимость, то выборочный коэффициент корреляции может быть равен нулю. Аналогично выгладит ситуация с ранговым коэффициентом (2), главным отличием является то, что он выявляет не только линейную, но и любую монотонную зависимость.

Доказательство этого начнем с исследования статистики при линейной зависимости Y = аХ + b, a R, b R, между случайными величинами X и Y.

Если, а > 0, то большим значениям xi соответствуют большие значения yi, и, наоборот, меньшим значениям xi — меньшие значения yi, . Если пары наблюдений (xi, yi), i =, занумерованы по возрастанию первых элементов, то будут иметь место неравенства y1<y2<…<yn. Поэтому ri = si для всех i =, и из (4) следует, что = 1.

Если же, а < 0, то большим значениям xi соответствуют меньшие значения yi, а меньшим значениям xi — большие значения yi, i =. В этом случае ri=sn-i+1, si=rn-i+1, i =, и = -1.

Заметим, что если (х) — возрастающая функция, то ранг элемента xi в последовательности x1<x2<…<xn равен рангу i) в последовательности (x1)< (x2)<…< (xn). Поэтому если случайные величины X и Y связаны функциональной зависимостью Y= (х), то = 1.

Аналогично, если Y = (X), где (х) — убывающая функция, то = -1.

Условие выполняется всегда, так как оно выполняется для выборочного коэффициента корреляции, а— это выборочный коэффициент корреляции, построенный по последовательностям рангов наблюдений.

Рассмотрим теперь другой крайний случай, когда случайные величины X uY независимы, т.е. когда основная гипотеза H0 является истинной. В этой ситуации случайный вектор (Si, ..., Sn) принимает с равной вероятностью любое свое возможное значение, являющееся одной из n! перестановок, составленной из чисел 1, 2, ...,n. Следовательно, вероятность того, что статистика примет любое из своих возможных значений при истинности основной гипотезы (1), не зависит от распределений случайных величин X и Y.

Можно показать, что при истинности основной гипотезы (1)

M = 0, D

и, следовательно, при этом выборочные значения статистики невелики и группируются около нуля. Поэтому (и это кажется достаточно естественным) ранговый критерий Спирмена отклоняет H0 на уровне значимости α, если где — квантиль уровня 1 —α/2 распределения случайной величины при истинности основной гипотезы (1).

При небольших n это распределение табулировано. Известно, что при n и при истинности основной гипотезы (1)

т.е. квантили случайной величины можно приближенно вычислять при помощи таблиц квантилей стандартного нормального распределения.







Дата добавления: 2015-10-15; просмотров: 537. Нарушение авторских прав; Мы поможем в написании вашей работы!

Studopedia.info - Студопедия - 2014-2022 год . (0.021 сек.) русская версия | украинская версия