Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

СТАТИСТИЧЕСКОЕ ПРИЛОЖЕНИЕ: КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ





 

Стандартные оценки

 

Самая простая формула для вычисления коэффициента корреляции между двумя выборками оценок задается с помощью стандартных оценок. Эта формула дает также наиболее ясное представление о значении коэффициента корреляции. Вот почему в этом приложении вводится понятие стандартной оценки. Кроме того, стандартные оценки, полученные в различных тестах, можно сравнить между собой. Так, если вы скажете кому-либо, что по истории вы получили тестовую оценку 38, а по английскому языку — 221, он мало что поймет. Однако этот «кто-то», если он читал данное приложение, получит точную информацию из сообщения, что ваша стандартная оценка по истории ранка +2,1, а по английскому языку —1,3.

 

Вы уже знаете, что (первичная) тестовая оценка какого-либо испытуемого в группе обозначается через X. Тестовая же оценка данного конкретного испытуемого обозначается с помощью индекса. Так, например, тестовая оценка испытуемого 3 записывается как Х3. Вы также знакомы с отклонением оценки от среднего х=Х—Мх. Отклонение оценки испытуемого 3 записывается как xз=Хз—Мх. Если отклонение оценки испытуемого разделить на стандартное отклонение σх распределения оценок, то оно преобразуется в стандартную оценку (или z-оценку).

 

Допустим, что испытуемый 3 имеет (первичную) тестовую оценку 60. Средняя оценка для группы равна 49 и стандартное отклонение оценок равно 12, т. е. Х3=60, Мх=49, σх=12. Прежде всего xз=60—49=+11. Давайте теперь вычислим zx, т. е. найдем стандартную оценку для испытуемого 3:

 

zx=x/σх. (9.1)

 

Следовательно,

Поскольку стандартные оценки редко имеют величину больше +2 и меньше —2, то вы узнаете, что оценка именно этого испытуемого лежит примерно посередине между средней и наивысшей оценкой в группе.

 

Рабочие оценки, такие, например, как оценки качества работы контролеров, которые необходимо скоррелировать с тестовыми оценками, обычно обозначаются символом Υ вместо X. Тогда отклонение оценки обозначается через у, а стандартная рабочая оценка — zY. Итак, мы говорим о нахождении корреляции между X и Υ тогда, когда каждый испытуемый в группе имеет оценку X и оценку Υ. Коэффициент корреляции обозначается символом rXY.

 

Вычисление Rxy

 

Для вычисления коэффициента оды снова воспользуемся ранее приводившимися данными. Возьмем данные для условия А как тестовые оценки 17 испытуемых, а данные для условия Б как рабочие оценки для тех же испытуемых. Однако чтобы подчеркнуть относительный характер стандартных оценок, умножим каждое значение для условия Б на 10. К счастью, мы уже сделали много вычислений, необходимых для (получения rXY· Для тестовых оценок «мы просто используем полученные ранее — среднее и стандартные отклонения. Для условия Б полученные — среднее и стандартные отклонения нужно просто умножить на 10.

 

Вы видите, что тестовая оценка (X) первого испытуемого S1 была 223, а его рабочая оценка —1810. Сдвинувшись по этой строке от обоих концов к середине, мы обнаружим, что x равно +38 (т. е. 223—185) и у равно +190 (т. е. 1810—1620). Далее, видим, что zX равно 2,054 (т. е. +38, деленное на 18,5), a zy равно + 1,195 (т. е. 190, деленное на 159). И наконец, в среднем столбце мы находим произведение zx на zy, которое равно +2,455.

 

Тестовые оценки помещены в приводимой ниже таблице во втором столбце слева, а рабочие оценки — во втором столбце справа. Они обозначены как X и У соответственно

  X χ; Zx ZxZy Zy y γ;  
    +38 +2,054 +2,455 + 1,195 + 190    
    — 1 —,054 —,109 --2,013 +320    
    +24 + 1,297 +,898 —,692 + 110    
    — 2 +,108 —,061 —,566 — 90    
    — 5 —,270 —,102 +,377 + 60    
    — 17 —,919 —,810 +,881 + 140    
    +30 + 1,622 +,102 +,063 + 10    
    -13 —,703 +,442 —,629 — 100    
    + 15 +,811 —,357 —,440 — 70    
    + 6 +,324 —,143 —,440 — 70    
    + 12 +,649 +,653 + 1,006 + 160    
    + 3 +,162 —,020 —,126 — 20    
    — 11 —,595 —,075 +,126 + 20    
    — 9 —,486 —,214 +,440 + 70    
    —30 — 1,622 +,714 —,440 — 70    
    —20 — 1,081 +2,720 —2,516 —400    
    —22 —1,189 + 1,346 —1,132 —180    
Μ;                
σ; 18,5              

Σzxzy = +7,336;

rxy= +0,432.

Такие же вычисления, сделанные для остальных 16 испытуемых, заполняют всю остальную таблицу. Ниже этих данных приведены величины средних и стандартных отклонений. Еще ниже в центре дается сумма по столбцу zxzy, равная +7,336. Это число, деленное на число испытуемых — 17, и дает величину коэффициента корреляции, равную +0,432.

В случае, если вам не хочется запоминать все эти термины, вы можете обратиться к следующей формуле для расчета коэффициента корреляции:

(9.2)

или для наших данных

Диаграмма разброса (корреляционное поле)

На рис. 9.4 показана диаграмма разброса, каждая точка которой представляет одного испытуемого. Значения шкал даны в единицах стандартных оценок г.

 

Рис. 9.4. Корреляционное поле. Масштабы осей равны и представлены в единицах стандартных оценок

При таких осях наклон линии предсказывания прямо показывает величину rXY. В нашем случае rXY равно +0,432. Это значение наклона линии: на каждое смешение на единицу вправо точки линии поднимаются вверх на 0,432 единицы. Так, если данный испытуемый имеем значение zX, равное +1, то предсказываемое значение zX для него равно +0,432. Таким образом, предсказываемая величина значительно ближе к среднему распределения, чем та величина, на основе которой делалось предсказание. Поэтому говорят, что предсказания стремятся (регрессируют) к среднему, и линия предсказания называется линией регрессии X на Y. Более точно, это предсказание zY по zX.

Вы можете заметить, что линия предсказания проходит через пересечение точек zX = 0 и zY = 0. Обе эти точки представляют средние значения соответствующих распределений. Это справедливо, независимо от значения величины rXY. Если испытуемый оказывается в точке среднего по X, то наилучшим.предсказанием всегда будет среднее по Y. Далее видно, что если оценка будет выше среднего по X (положительное значение zX), то предсказываемая оценка будет также выше среднего по Y (положительное значение zY). Точно так же для X ниже среднего значения предсказываемая оценка Y будет ниже среднего значения по Y.

И наконец, чем выше величина rXY. тем меньше регрессия предсказания. В случае полной корреляции линия предсказания будет иметь наклон +1. Так, если, например, zX равно +1,5, то предсказываемое zY тоже будет равно +1,5, а если zX равно —0,8, то zY тоже будет равно —0,8. При полной корреляции регрессия к среднему отсутствует. С другой стороны, если корреляция равна 0, то линия будет иметь нулевой наклон, т. е. она будет представлять собой горизонтальную линию. Она будет проходить на уровне zY=0, т. е. среднего значения по Y. Поэтому, какая бы ни была величина zX, наилучшее предсказание всегда будет zY = 0. Следовательно, при нулевой корреляции все предсказываемые значения регрессируют к среднему.

Все это может быть представлено посредством следующей формулы:

(9.3)

Эта формула показывает, что стандартную оценку для выборки Y можно получить, умножив стандартную оценку для выборки X на коэффициент корреляции между X и Y. Например, для испытуемого, имеющего стандартную оценку zX, равную +0,50 с коэффициентом корреляции 0,70, получим

Задача: Вычислите rXY для данных в задаче, приведенной в статистическом приложении к главе 6. Используйте условие В для X и условие Г для Y.

Ответ: rXY = 0,576.

 







Дата добавления: 2015-10-19; просмотров: 400. Нарушение авторских прав; Мы поможем в написании вашей работы!




Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...


Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...


ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Упражнение Джеффа. Это список вопросов или утверждений, отвечая на которые участник может раскрыть свой внутренний мир перед другими участниками и узнать о других участниках больше...

Влияние первой русской революции 1905-1907 гг. на Казахстан. Революция в России (1905-1907 гг.), дала первый толчок политическому пробуждению трудящихся Казахстана, развитию национально-освободительного рабочего движения против гнета. В Казахстане, находившемся далеко от политических центров Российской империи...

Виды сухожильных швов После выделения культи сухожилия и эвакуации гематомы приступают к восстановлению целостности сухожилия...

Метод архитекторов Этот метод является наиболее часто используемым и может применяться в трех модификациях: способ с двумя точками схода, способ с одной точкой схода, способ вертикальной плоскости и опущенного плана...

Примеры задач для самостоятельного решения. 1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P   1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P...

Дизартрии у детей Выделение клинических форм дизартрии у детей является в большой степени условным, так как у них крайне редко бывают локальные поражения мозга, с которыми связаны четко определенные синдромы двигательных нарушений...

Studopedia.info - Студопедия - 2014-2025 год . (0.011 сек.) русская версия | украинская версия