Студопедия — Другие коэффициенты
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Другие коэффициенты






 

Для ситуации, когда Х – дихотомия, основанная на нормальном распределении, a Y измерен в шкале порядка, подходят только коэффициенты, которые были введены Кертеном (1956) и Глассом (1966).

При измерениях такого рода, мы исходим из гипотезы о нормальном распределении, лежащем в основе дихотомии для X, и обращаемся к вычислению бисериального рангового коэффициента корреляции Кертена, который обсуждается ниже в п. 5.3.

Мера связи, когда одна переменная измеряется дихотомически на основе нор­мального распределения, а другая – в шкале интервалов или отношений, – это бисериальный коэффициент корреляции rbis.

Предположим, что переменная Y измеряется дихотомически, хотя более тщательная или более совершенная методика могла бы дать приблизительно нормальное распределение значений Y. Мы говорим, что измерение Y привело к дихотомии, основанной на нормальном распределении. Таким образом, Y измеряется точ­но тем же способом, что и переменные, участвующие в вычисле­нии тетрахорического коэффициента корреляции. Однако в этом случае данные измерений Х надо рассматривать как значения в шкале интервалов или отношений, которые распределены при­близительно нормально. Например, значения Х могут быть результатами теста на симпатии и антипатии учащихся к педагогам, а Y, при­нимающий значения 0 и 1, – результатами ответа на вопросы, оценивающие усвоение знаний. При более тщательно разработанных проверках успеваемости можно было бы обеспечить бо­лее широкий диапазон оценок успеваемости (оценок Y), которые были бы распределены приблизительно нормально. Тогда два массива нормально распределенных данных для Х и Y привели бы к определению rху. Что же говорят о величине rху оценки Х и дихотомические оценки Y? Ответ на этот вопрос дает бисериальный коэффициент корреляции rbis.

Бисериальный коэффициент корреляции – это корреляция произведения моментов между Х и нормально распределенными значениями Y, что, по предположению, лежит в основе дихото­мии
(0 или 1). Это аналогично ситуации, в которой возник rtet, за исключением того, что для rtet обе переменные были дихото­мическими с нормальными распределениями.

Допустим, что преподаватель хочет установить связь времени (X), затраченного учащимися на изучение уравнивания химиче­ских реакций, и их навыками (Y) уравнивания таких реакций. Измерения значения Х ведутся по данным сообщений учащихся о времени, необходимом для выполнения домашнего задания. Вероятно, Y можно было оценить при более основательной проверке успевае­мости так, чтобы обеспечивалось приблизительно нормальное распределение; но допустим, что время, которым располагал пре­подаватель, позволяет предложить учащимся рассмотреть только один вопрос — хими­ческую реакцию для уравнивания. Поэтому предполагается, что в основе нулевых (неверный ответ) и единичных (правильное решение) лежит нормальное распределение ответов. Данные, ко­торые можно было бы получить в результате такого исследова­ния, приводятся в табл. 20. Они показывают, что 11 из 18 уча­щихся верно выполнили задание и их оценки в среднем более высоки, чем у 7 учащихся, которые решили задачу неправильно.

Объяснение, на основе которого выводится rbis, следует из теории регрессии. Коэффициент регрессии для предсказания Х по нор­мально распределенному Y есть:

,

где sy – стандартное отклонение гипотетически нормально рас­пределенного Y, причем Y – не дихотомическая переменная. На­клон линии регрессии для предсказания Х по Y можно аппрокси­мировать наклоном линии, проходящей через среднее значение Х для объектов, имеющих нули по Y (обозначим их ), и среднее Х для объектов, имеющих единицы по Y (обозначим их ). Та­кая линия проведена на диаграмме рассеивания в табл. 20. Это линия наименьших квадратов в том смысле, что среднее группы представляет собой точку, относительно которой сумма квадра­тов отклонений минимальна.

Таблица 20

Пример вычисления бисериального коэффициента корреляции

Время, затраченное на изучение Ответ на контрольный вопрос Диаграмма рассеивания
    n1 =11, n0 = 7, n = 18   = 12,36, = 10,00, = 11,44, Sx = 2,55, u = 0,3836, rbis = 0,60

 

Наклон этой линии равен разности ( 1 0), деленной на расстояние между средними значениями нормально распределенного Y для объектов, имеющих нули и единицы по дихотомии. Последнее расстояние трудно найти элементарным способом. Искомое расстояние предполагает введение высоты и нормированной нормальной кривой над точкой с абсциссой (здесь осью Y), за кото­рой лежит 100 (n1/n) процентов площади (n1 – число объектов, имеющих “1” по дихотомии). Комбинирование этих фактов дает следующую формулу для вычисления rbis:

rbis = ,

где и являются средними значениями Х для объектов, имеющих соответственно единицы и нули по Y; sx – стандарт­ное отклонение значений X; n1 и n0 – число единиц и нулей для Y, соответственно (n1 + n0 = n); и u — ордината (т.е. вы­сота) нормированного нормального распределения в точке, за которой лежит 100 – (n1/n) процентов площади под кривой (см. рис. 3).

Пример вычисления rbis приведен в табл. 20.

Вычисление rbis можно упростить, пользуясь следующей экви­валентной, но слегка отличаю-щейся формулой, позволяющей получать то же, что и предыдущее уравнение:

 

rbis = .

 

В отличие от любого другого коэф­фициента корреляции, rbis иногда может принимать значения ниже –1 и выше +1. Но это лишь означает, что либо некоррект­но предположение о нормальности распределения X, либо что имеет место флуктуация выборки, когда значение n мало, что приводит к распределению значений Х в выборке с эксцессом меньше нор­мального.

Вероятно, вы уже заметили, что данные, по которым вычис­лялись и точечно-бисериальный коэффициент корреляции rpb и rbis, похожи. Единственная разница между постановками двух задач состоит в том, что в случае rbis выдвигаются некоторые ги­потезы относительно распределения, лежащего в основе дихото­мии. В том, что касается свойств данных, rpb и rbis су­щественно различны. Поэтому беспредметны вопросы типа: «Как сравнить rpb и rbis для одной совокупности данных?» Области применения коэффициентов не пересекаются: каждый соответ­ствует своей цели.

Для одних и тех же данных отношение rpb и rbis равно

 

.

 

Минимальная величина отношения в этом уравнении есть 1,25, когда ни rbis, ни rpb не равны нулю. Поэтому, если rpb положительно, rbis будет положительным и большим; если rpb отрицательно, rbis будет отрицательным и ближе к –1. Если rpb равно нулю, то rbis также равен нулю. Таким образом, одни и те же данные дают основание для фиксации более сильной связи между Х и Y, если относительно нее делается больше предположений, т.е. если допустить, что дихотомия основана на нормальном распределении.

Понятия, лежащие в основе бисериальной корреляции, можно обобщить для применения при определении (установлении) трисериальной и полисериальной корреля­ции. Если значения Y измеряются трихотомически (О, 1, 2), можно исполь­зовать трисериальный коэффициент корреляции для оценки корреляции произведения моментов между Х и нормально распре­деленным Y, который, по предположению, трихотомичен. Обоб­щение rbis до полисериальной корреляции содержится в работе Джаспена (1946). Практика свидетельствует о том, что часто величина коэффициента полисериальной корреляции намного от­личается от величины rbis , которая была бы получена при объ­единении нескольких категорий в две (так, например, при замене трихотоми­ческой переменной на дихотомическую переменную совмещением двух смежных категорий).

 

5.3. Бисериальная ранговая корреляция rbis

 

Коэффициент бисериальной ранговой корреляции тесно связан с τ Кендалла, в определении используются понятия совпадения и инверсии. Обозначим его как рангово-бисериальный коэффициент rb.

Пусть Х дихотомическая переменная, а Y – переменная, име­ющая n рангов 1, 2,..., n. Кертен искал такой коэффициент, описывающий связь между Х и Y, чтобы: а) при любых условиях он мог достигнуть границы +1; б) был бы равен +1, когда все n наивысших рангов являются единицами по дихотомии; в) был бы строго непараметричным, т.е. полностью определимым в терминах инверсий и совпадений без использования таких понятий, как среднее, дисперсия, регрес­сия и т.д.

Гласс (1966) показал, что rb алгебраически эквивалентен коэффициенту для порядковых переменных. Практическое значение этого факта заключается в том, что появляется простой способ вычисления rb без подсчета совпаде­ний и инверсий, но используют Fi – средний ранг объектов, имеющих 1 по X; a Fo – сред­ний ранг объектов с 0 по X.

Уайтфилд (1947) вывел коэффициент корреляции одной ди­хотомической и одной порядковой переменной. Его подход сво­дился к тому, чтобы рассматривать дихотомическую переменную как ранжируемую переменную, связанную на двух рангах. Далее он применил формулу τ Кендалла для связанных рангов. Получившийся коэффициент имеет тот же числитель, что и rb, но другой знаменатель. В качестве меры корреляции предпочтитель­нее рангово-бисериальный коэффициент, поскольку коэффициент Уайтфилда не достигает +1, когда между Х и Y существуют некоторые строгие взаимосвязи.

 







Дата добавления: 2015-09-18; просмотров: 993. Нарушение авторских прав; Мы поможем в написании вашей работы!



Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Дезинфекция предметов ухода, инструментов однократного и многократного использования   Дезинфекция изделий медицинского назначения проводится с целью уничтожения патогенных и условно-патогенных микроорганизмов - вирусов (в т...

Машины и механизмы для нарезки овощей В зависимости от назначения овощерезательные машины подразделяются на две группы: машины для нарезки сырых и вареных овощей...

Классификация и основные элементы конструкций теплового оборудования Многообразие способов тепловой обработки продуктов предопределяет широкую номенклатуру тепловых аппаратов...

Йодометрия. Характеристика метода Метод йодометрии основан на ОВ-реакциях, связанных с превращением I2 в ионы I- и обратно...

Броматометрия и бромометрия Броматометрический метод основан на окислении вос­становителей броматом калия в кислой среде...

Метод Фольгарда (роданометрия или тиоцианатометрия) Метод Фольгарда основан на применении в качестве осадителя титрованного раствора, содержащего роданид-ионы SCN...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия