Теоретический материал. Две случайные величины находятся в корреляционной зависимости, если каждому возможному значению любой из этих случайных величин соответствует определенной
Две случайные величины находятся в корреляционной зависимости, если каждому возможному значению любой из этих случайных величин соответствует определенной распределение вероятностей другой величины. Корреляционная зависимость характеризуется формой и теснотой связи. Корреляционныйанализсостоит в определении степени связи между двумя случайными величинами Х и Y. Корреляция изучается на основании экспериментальных данных, представляющих собой измеренные значения двух признаков X и Y. При корреляционной зависимости условное математическое ожидание одной случайной величины является функцией значений другой случайной величины: , здесь - условное математическое ожидание случайной величины Х при условии, что случайная величина Y приняла значение ; - условное математическое ожидание случайной величины Y при условии, что случайная величина X приняла значение . Для дискретных случайных величин Х и Y выражения для условных математических ожиданий имеют вид:
где - условная вероятность равенства при условии, что ; - условная вероятность равенства при условии, что . Для непрерывных случайных величин Х и Y имеют место выражения:
где - плотность вероятности случайной величины Х при условии, что ; - плотность вероятности случайной величины Y при условии, что . Функция f(y) называется функцией регрессии величины Х на величину Y, уравнение x=f(y) называется уравнением регрессии Х на Y. Аналогично, Функция g(x) называется функцией регрессии величины Y на величину X, уравнение y=g(x) называется уравнением регрессии Y на X. Функция регрессии характеризует форму корреляционной зависимости (линейная, показательная и т.д.). Для характеристики тесноты связи используется безразмерная величина, называемая коэффициентом корреляции. Коэффициент линейной корреляции определяется соотношением . Свойства коэффициента корреляции: 1. Коэффициент корреляции характеризует тесноту и направление корреляционной связи; 2. ; 3. В случае, когда Х и Y – независимые случайные величины, коэффициент корреляции равен 0. 4. Если , то между величинами Х и Y имеет место функциональная зависимость, а именно, линейная. 5. При связь между величинами прямая (положительная корреляция), при - связь обратная (отрицательная корреляция). Коэффициенты ранговой корреляции применяются при оценке степени взаимосвязи качественных признаков. Для практических целей использование ранговой корреляции может быть полезно, например, в случае, когда установление высокой ранговой корреляции между двумя качественными признаками позволяет контролировать только один из них, что может существенно ускорить и удешевить контроль. Допустим, что объекты генеральной совокупности обладают двумя качественными признаками. Под качественным подразумевается признак, который невозможно измерить точно, но позволяющий сравнивать объекты между собой и, следовательно, располагать их в порядке возрастания или убывания качества. Пусть выборка объема n содержит независимые объекты, которые обладают двумя качественными признаками А и В. Рассмотрим случай, когда все объекты имеют различное качество по обоим признакам. Проранжируем объекты в порядке ухудшения качества по признаку А и присвоим им ранги Далее расположим объекты в порядке убывания качества по признаку В и припишем каждому ранг yi. Получим две последовательности рангов:
Выборочный коэффициент ранговой корреляции Спирмена определяется следующим образом: , где . Возможны следующие крайние случаи по признакам А и В: 1) xi=yi. Т.е. ухудшение качества по одному признаку влечет за собой ухудшение качества по другому признаку. Полная прямая зависимость. 2) x 1=1 и y 1= n; x 2=2 и y 2= n -1…, т.е. ранги по признакам А и В противоположны. Ухудшение качества по одному признаку ведет к улучшению качества по другому признаку. Противоположная зависимость.
Чтобы при уровне значимости проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе необходимо рассчитать наблюдаемое значение - критерия Стьюдента: , затем найти критическое значение по таблице критических точек распределения Стьюдента для уровня значимости и числа степеней свободы k=n –2. Если – нет оснований отвергать нулевую гипотезу. Ранговая связь между качественными признаками незначимая. Если – нулевую гипотезу следует отвергнуть. Между качественными признаками существует значимая ранговая корреляционная связь. Вопросы для подготовки к выполнению и защите работы: 1. Дать определение корреляционно-регрессионного анализа. 2. Дать классификацию взаимосвязи (по степени зависимости; по направлению; по форме зависимости). 3. Дать понятия ранжирования, ранга. 4. Записать формулу коэффициента ранговой корреляции. 5. Сформулировать этапы проверки гипотезы о значимости коэффициента корреляции.
Задание к работе: По имеющимся данным провести корреляционный анализ. Для этого: 1. Проранжировать исходные данные по двум признакам. 2. Рассчитать коэффициент ранговой корреляции Спирмена, указать его статистический смысл. 4. С помощью t -критерия Стьюдента проверить гипотезу о значимости коэффициента корреляции. 6. Сделать вывод по работе.
Пример выполнения практической работы № 4 в Excel:
|