Студопедия — Корреляция
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Корреляция

Различные явления, происходящие в процессе сельскохозяйственного производства, находятся в причинно-следственной однофакторной связи, которая может быть функциональной или корреляционной. При функциональной связи каждому значению факторного признака соответствует строго определенное значение результата. Например, связь средней площади питания сельскохозяйственных растений с плотностью их посадки, выручки с количеством проданной продукции при данных ценах и т.п. В отличие от этого при корреляционной связи одному и тому же значению факторного признака могут соответствовать множество различных результатов. Например, связь между уровнем внесения удобрений и урожайностью сельскохозяйственных культур; уровнем кормления, качеством кормов, породностью коров и их молочной продуктивностью; квалификацией работников, обеспеченностью средствами производства и производительностью труда и т.п.

Статистикой выработаны специальные приемы установления и измерения такого вида связей, получившие названия метода корреляционного анализа. Они применимы к измерению связей между двумя признаками- парная корреляция или к измерению связей между тремя и большим числом признаков- множественная корреляция.

Методы корреляции позволяют решить следующие основные задачи:

1) определить среднее изменение результативного признака под влиянием одного или комплекса факторов (в абсолютном или относительном измерении); 2) охарактеризовать меру зависимости результативного признака и одного из факторов при среднем значении других; 3) определить тесноту связи результативного признака со всем комплексом включенных в анализ факторов или с отдельным фактором при исключении влияния других;

4) статистически оценить выборочные показатели корреляционной связи. Каждая из этих задач решается путем расчета определенных показателей.

Применение метода корреляционного анализа включает ряд этапов:

1.Постановка задачи и установление причин связи. Для этого требуется глубокое понимание сущности изучаемых взаимосвязей, так как сам метод не позволяет установить причины возникновения связей между явлениями, его назначение заключается в их количественном измерении. На данном этапе осуществляется общее ознакомление с изучаемым объектом, уточняются задачи исследования, устанавливается теоретическая возможность причинно-следственной связи.

2. Отграничение объекта исследования и отбора необходимых признаков. При отграничении объекта следует иметь в виду, что корреляционный анализ должен проводится лишь в пределах качественно однократных (в социальном, экономическом или производственно-техническом отношении) достаточно многочисленных совокупностей. Отбираемые для корреляционной модели факторные и результативные признаки должны быть существенными, первые должны оказывать непосредственное влияние на вторые. Нежелательно включение в одну модель частных и общих факторов, а также нескольких факторных признаков, находящихся в тесной связи друг с другом.

Серьезную помощь для отбора показателей могут оказать результативные и факторные статистические группировки с соответствующим анализом влияния факторов на результативный признак.

3. Установление формы связи и подбор математического уравнения модели связи. Этот вопрос решается на основании теоретического анализа или предшествующим практическим опытом соответствующих исследований. Если форма связи неизвестна, то проводится группировка статистических данных и изучение изменения средних по группам, сопоставление параллельных рядов, построение графиков и таблиц распределения численностей. Уравнения, выражающие статистическую связь, называются уравнениями регрессии или корреляции.

Связь между результативным и факторным признаками может носить линейный или криволинейный (параболический, синусоидальный и т.п.) характер. При линейной парной связи между признаками используется уравнение прямой: = + , где - зависимая переменная, - независимая переменная, - начало отсчета, - коэффициент регрессии, показывающий среднее изменение при изменении на единицу. При этом единицы измерения коэффициента регрессии соответствуют единицам измерения величин .

В случае линейной взаимосвязи результативного признака с несколькими факторами используется множественное линейное уравнение:

= + + + +…+ ,

где -зависимая переменная; - факторные признаки; -начало отсчета; - коэффициенты регрессии, показывающие степень среднего изменения зависимой переменной при изменении факторного признака на единицу при условии, что остальные факторы, включенные в уравнение, остаются неизменными.

При нелинейной форме связи подбирается соответствующее уравнение криволинейной зависимости, способное наиболее точно отразить имеющуюся связь. Например, форму связи между возрастом коров и их молочной продуктивностью, характеризующуюся тем, что с изменением возраста вначале продуктивность растет, а затем постепенно снижается, можно отразить уравнение параболы второго порядка = + + , где коэффициент регрессии показывает скорость прироста продуктивности коров, а характеризует замедление.

4. Расчет числовых характеристик корреляционной связи. Этот этап заключается в нахождении параметров корреляционного уравнения . Для этого составляется система нормальных уравнений, при этом сумма квадратов отклонений фактических данных от исчисленных по уравнению должна быть минимальной, т.е. )²= min, где - фактическое значение зависимой переменной; - значение зависимой переменной, исчисленное по сравнению. Этот способ называют методом наименьших квадратов.

Для получения системы нормальных уравнений записывается исходное корреляционное уравнение. Например, при парной линейной связи уравнение имеет вид: = + . Затем каждый его член перемножается на коэффициент при первом неизвестном () и перед всеми членами уравнения ставится знак суммы. В результате получается первое из нормальных уравнений:

=n + .

Для получения второго уравнения каждый член исходного уравнения перемножается на коэффициент при втором неизвестном () и произведения складываются:

= + .

Руководствуясь этими правилами, можно составить любую необходимую систему уравнений.

Величины , , , и т.д. рассчитывают по фактическим данным, подставляют их в уравнения и решают систему уравнений, находя неизвестные параметры , , ,… . В настоящее время созданы специальные стандартные программы для решения этих задач на ЭВМ.

Теснота связи при наличии различных формах зависимости определяется специальными показателями. При парной линейной зависимости- коэффициентом корреляции (), при множественной линейной корреляции- коэффициентом множественной корреляции (), при парной криволинейной зависимости- индексом корреляции (i) или корреляционным отношением (ŋ). Во всех случаях показатель тесноты связи определяется отношением:

= ,

где

 

= - дисперсия результативного признака под влиянием одного или нескольких факторных;

= - общая дисперсия результативного признака под влиянием всех факторов(учтенных и неучтенных).

При соотношении дисперсий и одинаковом числе наблюдений формула имеет вид:

= .

На основе формулы = выведен ряд рабочих формул.

Наиболее употребительной при парной линейной зависимости является:

= .

При множественной линейной зависимости, если известны коэффициенты парных связей , , , используют следующую формулу:

= .

Линейный парный коэффициент корреляции меняется в пределах от -1 до +1, а множественный коэффициент и индекс корреляции рассматривается только как положительная величина и изменяется в пределах от 0 до 1. Квадрат коэффициента корреляции и индекса корреляции называется коэффициентом детерминации и показывает, на сколько процентов результативный признак зависит от одного или нескольких факторных признаков, включенных в анализ.

При изучении связи по выборочным данным полученные коэффициенты регрессии и корреляции должны быть подвергнуты специальной оценке соответствия их показателям генеральной совокупности, так называемой оценке на достоверность.

Задача 1. Определение показателей связи при парной линейной зависимости по не сгруппированным данным.

По данным об урожайности зерновых культур и качестве (табл.) необходимо составить и решить корреляционное уравнение, определив параметры уравнения, а также тесноту связи.

Решение

Для определения формы связи между урожайностью зерновых культур и качеством почвы построим график (рис.3). На оси абсцисс нанесем значение независимой переменной (качество почвы), на оси ординат- зависимой (урожайность). Расположение точек на поле графика показывает, что связь между признаками линейная, прямо пропорциональная и может быть выражена уравнением прямой линии = , где - урожайность зерновых, ц с 1 га; -качество почвы, баллы; - параметры уравнения связи, которые следует определить на основе решения системы нормальных уравнений с двумя неизвестными:

Все наблюдаемые расчеты сделаны в табл. 6.1. Подставив их в уравнения, получим:

 

 

Таблица. Данные для управления связи и коэффициента корреляции

Номер хозяйства Урожайность зерновых, ц с 1 га Качество почвы, баллы Расчетные данные     Ожидаемое значение урожайности от качества почвы
  18,1 21,1 22,9 18,9 18,6 30,5 23,4 27,6 20,9 18,2 18,9 25,9 18,5 24,0 17,4 23,9 23,8 20,4 29,2 23,5   327,61 3 025 995,5 445,21 2 500 1055,0 524,41 4 624 1557,2 357,21 2 304 907,2 345,96 7 569 1618,2 930,25 10 000 3050,0 547,56 5 625 1755,0 761,76 7 744 2428,8 436,81 6 400 1672,0 331,24 4 356 1201,2 357,21 3 364 1096,2 670,81 9 604 2538,2 342,25 3 600 1110,0 576,00 10 000 2400,0 302,76 1 600 696,0 571,21 8 836 2246,6 566,44 8 836 2237,2 416,16 8 100 1836,0 852,64 10 000 2920,0 552,25 8 464 2162,0 19,05 18,32 20,95 18,03 23,72 25,62 21,97 23,87 22,70 20,66 19,49 25,33 19,78 25,62 16,86 24,74 24,74 24,16 25,62 24,45  
Сумма 445,7   10215,75 126 551 35482,3 445,70

 

10 20 30 40 50 60 70 80 90 100

Рис.3. зависимость урожайности от качества почвы

Разделим два уравнения на коэффициенты при , т.е. первое на 20, второе- на 1543:

Вычтем из большего уравнения меньшее, в данном случае из второго первое: 0,711=4,87 , откуда = = 0,146. Подставим полученное значение в любое уравнение и определим : 22,285= +77,15 ∙ 0,146, отсюда = 22,285-11,264= 11,021, или 11,02. Уравнение парной линейной зависимости между урожайностью зерновых культур и качеством почвы примет следующий вид: =11,02+0,146 . Коэффициент регрессии (параметр ), равный 0,146, показывает, что с увеличением балла почвы на единицу урожайность возрастает на 0,146 ц с 1 га в данных конкретных условиях.

Определим тесноту связи между изучаемыми признаками, рассчитав коэффициент корреляции по формуле:

= .

Для определения коэффициента корреляции надо определить среднее значение , и , а также средние квадратические отклонения по результативному и факторному признакам. Все исходные и расчетные данные имеются в табл.

= = = 1774,11;

= = = 22,285; = = = 77,15;

= = = =

= = 3,764;

= = = = =19,376

Подставим полученные данные в формулу коэффициента корреляции:

= = = = 0,752.

Коэффициент парной линейной корреляции можно рассчитать и по другой форме, если известен коэффициент регрессии:

= = = 0,752.

Рассчитанный коэффициент корреляции показал существенную зависимость урожайности зерновых от качества почв. Коэффициент детерминации ( = 0,565) показывает, что на 56,5 % урожайность в данных условиях зависит от качества почвы, а на 44,5 %- от других факторов, которые не были приняты во внимание.

 




<== предыдущая лекция | следующая лекция ==>
Стратегический контроллинг. | 

Дата добавления: 2015-08-12; просмотров: 925. Нарушение авторских прав; Мы поможем в написании вашей работы!



Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Уравнение волны. Уравнение плоской гармонической волны. Волновое уравнение. Уравнение сферической волны Уравнением упругой волны называют функцию , которая определяет смещение любой частицы среды с координатами относительно своего положения равновесия в произвольный момент времени t...

Медицинская документация родильного дома Учетные формы родильного дома № 111/у Индивидуальная карта беременной и родильницы № 113/у Обменная карта родильного дома...

Основные разделы работы участкового врача-педиатра Ведущей фигурой в организации внебольничной помощи детям является участковый врач-педиатр детской городской поликлиники...

Именные части речи, их общие и отличительные признаки Именные части речи в русском языке — это имя существительное, имя прилагательное, имя числительное, местоимение...

Интуитивное мышление Мышление — это пси­хический процесс, обеспечивающий познание сущности предме­тов и явлений и самого субъекта...

Объект, субъект, предмет, цели и задачи управления персоналом Социальная система организации делится на две основные подсистемы: управляющую и управляемую...

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия