Теоретический материал. Две случайные величины находятся в корреляционной зависимости, если каждому возможному значению любой из этих случайных величин соответствует определенной
Две случайные величины находятся в корреляционной зависимости, если каждому возможному значению любой из этих случайных величин соответствует определенной распределение вероятностей другой величины. Корреляционная зависимость характеризуется формой и теснотой связи. Корреляционныйанализсостоит в определении степени связи между двумя случайными величинами Х и Y. Корреляция изучается на основании экспериментальных данных, представляющих собой измеренные значения При корреляционной зависимости условное математическое ожидание одной случайной величины является функцией значений другой случайной величины:
здесь Для дискретных случайных величин Х и Y выражения для условных математических ожиданий имеют вид:
где Для непрерывных случайных величин Х и Y имеют место выражения:
где Функция f(y) называется функцией регрессии величины Х на величину Y, уравнение x=f(y) называется уравнением регрессии Х на Y. Аналогично, Функция g(x) называется функцией регрессии величины Y на величину X, уравнение y=g(x) называется уравнением регрессии Y на X. Функция регрессии характеризует форму корреляционной зависимости (линейная, показательная и т.д.). Для характеристики тесноты связи используется безразмерная величина, называемая коэффициентом корреляции. Коэффициент линейной корреляции определяется соотношением
Свойства коэффициента корреляции: 1. Коэффициент корреляции характеризует тесноту и направление корреляционной связи; 2. 3. В случае, когда Х и Y – независимые случайные величины, коэффициент корреляции равен 0. 4. Если 5. При Коэффициенты ранговой корреляции применяются при оценке степени взаимосвязи качественных признаков. Для практических целей использование ранговой корреляции может быть полезно, например, в случае, когда установление высокой ранговой корреляции между двумя качественными признаками позволяет контролировать только один из них, что может существенно ускорить и удешевить контроль. Допустим, что объекты генеральной совокупности обладают двумя качественными признаками. Под качественным подразумевается признак, который невозможно измерить точно, но позволяющий сравнивать объекты между собой и, следовательно, располагать их в порядке возрастания или убывания качества. Пусть выборка объема n содержит независимые объекты, которые обладают двумя качественными признаками А и В. Рассмотрим случай, когда все объекты имеют различное качество по обоим признакам. Проранжируем объекты в порядке ухудшения качества по признаку А и присвоим им ранги Далее расположим объекты в порядке убывания качества по признаку В и припишем каждому ранг yi. Получим две последовательности рангов:
Выборочный коэффициент ранговой корреляции Спирмена определяется следующим образом:
где Возможны следующие крайние случаи по признакам А и В: 1) xi=yi. Т.е. ухудшение качества по одному признаку влечет за собой ухудшение качества по другому признаку. Полная прямая зависимость. 2) x 1=1 и y 1= n; x 2=2 и y 2= n -1…, т.е. ранги по признакам А и В противоположны. Ухудшение качества по одному признаку ведет к улучшению качества по другому признаку. Противоположная зависимость.
Чтобы при уровне значимости
затем найти критическое значение Если Если Вопросы для подготовки к выполнению и защите работы: 1. Дать определение корреляционно-регрессионного анализа. 2. Дать классификацию взаимосвязи (по степени зависимости; по направлению; по форме зависимости). 3. Дать понятия ранжирования, ранга. 4. Записать формулу коэффициента ранговой корреляции. 5. Сформулировать этапы проверки гипотезы о значимости коэффициента корреляции.
Задание к работе: По имеющимся данным провести корреляционный анализ. Для этого: 1. Проранжировать исходные данные по двум признакам. 2. Рассчитать коэффициент ранговой корреляции Спирмена, указать его статистический смысл. 4. С помощью t -критерия Стьюдента проверить гипотезу о значимости коэффициента корреляции. 6. Сделать вывод по работе.
Пример выполнения практической работы № 4 в Excel:
|