Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Коэффициент корреляции Пирсона





Еще один часто используемый коэффициент корреляции, называемый коэффициентом корреляции Пирсона (r), используется для измерения связи между двумя переменными на интервальных шкалах. Используется только в случае линейной зависимости. Формула для приблизительного вычисления r.

.

´ Задача 2.28. Какова корреляция между количеством отработанных часов (X7) и СБ осенним (X5) испытуемого? Начните анализ с построения столбцов для номера, СБ (Xi) и отработанных часов (Yi). Далее найдите отклонения DX и DY, затем квадраты отклонений DX 2 и DY 2. Затем вычислите суммы квадратов отклонений ΣDX 2 и ΣDY 2, а также сумму произведений отклонений ΣDXDY.

X1 X5 X7          
СБ Отработанные часы          
  Xi Yi DX DY DX 2 DY 2 DXDY
  3,9 38,0 0,5 14,5 0,3 209,4 7,5
  4,6 15,0 0,2 8,5 0,0 72,8 1,6
  4,7 10,0 0,3 13,5 0,1 183,0 3,8
  4,2 30,0 0,2 6,5 0,0 41,9 1,4
  5,0 12,0 0,6 11,5 0,3 132,9 6,7
  3,7 35,0 0,7 11,5 0,5 131,6 8,2
  3,7 30,0 0,7 6,5 0,5 41,9 4,6
  4,4 30,0 0,0 6,5 0,0 41,9 0,1
  4,6 20,0 0,2 3,5 0,0 12,5 0,6
  4,9 10,0 0,5 13,5 0,2 183,0 6,5
  5,0 20,0 0,6 3,5 0,3 12,5 2,1
  4,0 35,0 0,4 11,5 0,2 131,6 4,8
  4,6 30,0 0,2 6,5 0,0 41,9 1,2
  4,2 30,0 0,2 6,5 0,0 41,9 1,4
  4,0 35,0 0,4 11,5 0,2 131,6 4,8
  4,9 10,0 0,5 13,5 0,2 183,0 6,5
  4,7 10,0 0,3 13,5 0,1 183,0 3,8
n = 17 4,4 23,5 0,0 0,0 3,3 1776,2 63,4

Полученные значения подставьте в формулу

.

Примечание. Знак «минус» перед коэффициентом корреляции отражает направление связи, а не значение. В данном случае зависимость обратная – чем больше человек занимается, тем ниже его СБ осенний (естественно, это шуточный пример). Чтобы найти уровень значимости для r, нам необходимо подсчитать степени свободы, или df = (n – 2), а затем обратиться к табл. П 3.2. Имея df = 15 и используя уровень значимости 0,05, мы можем определить, превышает ли полученная нами величина r = 0,846 критическое значение, приведенное в таблице. Критическое значение равно 0,456 и меньше полученной нами величины 0,846; таким образом, между количеством отработанных часов и СБ осенним имеет место статистически значимая отрицательная корреляция.

Регрессионно-корреляционный анализ

 

Графическое решение задачи выявляет регрессию (форму зависимости) и уравнение связи. Линейная зависимость описывается уравнением

y = a + bx,

где: а и b – коэффициенты, определяемые по формулам:

a = y – bx,

.

 

´ Задача 2.2.18. Для задачи 2.1.4построить график и определить уравнение регрессии.

r2 = 0,719 как на графике.

, a = 23,5 – 4,4(–20,15) = 112,54.

Итак, уравнение регрессии

y = 112,54 – 20,15 x.


Но так ли это на самом деле? Оказывается, в данном примере была (умышленно) допущена неточность. Все уравнения, по которым проводились расчеты, применяются только в случае линейной зависимости. На графике же точки расположены явно не на одной линии, и мы можем предположить, что регрессия может быть иной, нелинейной. Если зависимость y от x нелинейная, то иногда эту зависимость можно линеаризовать с помощью преобразования переменных x и y. Линеаризацию можно провести с помощью формул табл. П 3.8. Но для данного случая остановимся на полигональной зависимости

y = b 0 x 0 + b 1 x 1 + b 2 x 2 + b 3 x 3 + … + bn xn

где n – степень функции. Используя электронную таблицу MS Excel, строим полигональную линию тренда (n = 3) и получаем r =– 0,906 (r2 = 0,820). Это выше, чем при расчетах линейной зависимости. Если вы не можете принять решение, какую формулу подобрать для конкретной регрессии, то выберете ту, при которой получается максимальный коэффициент корреляции.


Контрольные вопросы

1. Опишите схему классического экспериментального плана с большими объемами выборок n.

2. Перечислите и охарактеризуйте шкалы представления данных.

3. Что такое совокупность исходных данных «объекты-признаки»?

4. Как пользоваться таблицей случайных чисел?

5. Как строится полигон распределения частот?

6. Как строится гистограмма распределения частот?

7. Как строится кумулята распределения частот?

8. Как выявляется аномальность числа в выборке?

9. Как группируются данные в вариационный ряд?

10. Перечислите меры центральной тенденции.

11. Вычисление средней арифметической (простой и взвешенной).

12. Вычисление средней гармонической (простой и взвешенной).

13. Вычисление средней квадратической (простой и взвешенной).

14. Вычисление средней кубической (простой и взвешенной).

15. Вычисление средней геометрической (простой и взвешенной).

16. Вычисление коэффициента вариации.

17. Определение медианы.

18. Определение моды.

19. Как оценивается изменчивость параметра?

20. Какой критерий используется для определения того, отличается ли наблюдаемая частота результатов от ожидаемой частоты?

21. Нормальное распределение и его определение по эксцессу и асимметрии.

22. Нормальное распределение и его определение по z-критерию Колмогорова-Смирнова.

23. Параметрические критерии, условия их применения.

24. Как вычисляется уровень статистической достоверности различия между двумя средними по критерию Стьюдента (для одной выборки)?

25. Как вычисляется уровень статистической достоверности различия между двумя средними по критерию Стьюдента (для независимых выборок)?

26. Как вычисляется уровень статистической достоверности различия между двумя средними по критерию Стьюдента (для зависимых выборок)?

27. Какой вид анализа используется в экспериментах с межгрупповыми и внутригрупповыми планами?

28. Какой вид анализа используется в экспериментах, которые имеют несколько уровней категориальной независимой переменной, но только одну количественную зависимую переменную?

29. Непараметрические критерии, условия их применения.

30. Сравнение двух независимых выборок (критерий U-Манна-Уитни).

31. Сравнение двух связанных выборок (критерий W-Вилкоксона).

32. Как оценивается связь между двумя переменными (в ранговых шкалах)?

33. Как оценивается связь между двумя переменными (в интервальных шкалах)?

34. Регрессионный анализ.

35. Корреляционный анализ.

36. Линеаризация функций.








Дата добавления: 2015-08-29; просмотров: 467. Нарушение авторских прав; Мы поможем в написании вашей работы!




Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...


Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...


ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Типовые ситуационные задачи. Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт. ст. Влияние психоэмоциональных факторов отсутствует. Колебаний АД практически нет. Головной боли нет. Нормализовать...

Эндоскопическая диагностика язвенной болезни желудка, гастрита, опухоли Хронический гастрит - понятие клинико-анатомическое, характеризующееся определенными патоморфологическими изменениями слизистой оболочки желудка - неспецифическим воспалительным процессом...

Признаки классификации безопасности Можно выделить следующие признаки классификации безопасности. 1. По признаку масштабности принято различать следующие относительно самостоятельные геополитические уровни и виды безопасности. 1.1. Международная безопасность (глобальная и...

Случайной величины Плотностью распределения вероятностей непрерывной случайной величины Х называют функцию f(x) – первую производную от функции распределения F(x): Понятие плотность распределения вероятностей случайной величины Х для дискретной величины неприменима...

Схема рефлекторной дуги условного слюноотделительного рефлекса При неоднократном сочетании действия предупреждающего сигнала и безусловного пищевого раздражителя формируются...

Уравнение волны. Уравнение плоской гармонической волны. Волновое уравнение. Уравнение сферической волны Уравнением упругой волны называют функцию , которая определяет смещение любой частицы среды с координатами относительно своего положения равновесия в произвольный момент времени t...

Studopedia.info - Студопедия - 2014-2025 год . (0.009 сек.) русская версия | украинская версия