Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Правило сложения дисперсий.Если данные представлены в виде аналитической группировки, то можно вычислить дис­персию общую, межгрупповую и внутригрупповую





Общая дисперсия измеряет вариацию признака во всей со­вокупности под влиянием всех факторов, обусловливающих эту вариацию:

Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возни­кающие под влиянием признака-фактора, положенного в основа­ние группировки. Она рассчитывается по формуле:

,

где хi и ni – соответственно средние и численности по отдельным группам

Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:

Средняя из внутригрупповых дисперсий

.

Существует закон, связывающий три вида дисперсий. Общая дисперсия равна сумме средней из внутригрупповых и межгруп­повых дисперсий:

.

Данное соотношение называют правилом сложения диспер­сий. Согласно этому правилу общая дисперсия, возникающая под влиянием всех факторов, равна сумме дисперсий, возникающих под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака.

Зная любые два вида дисперсий, можно определить или про­верить правильность расчета третьего вида.

Пример. Определим групповые дисперсии, среднюю из груп­повых дисперсий, межгрупповую дисперсию, общую дисперсию по данным табл. 7.4.

Таблица 7.4

Производительность труда двух бригад рабочих-токарей

 

1-я бригада 2-я бригада
№ п/п   Изготовлено деталей за час, шт. хi № п/п   Изготовлено деталей за час, шт. хi
    -2       -3  
    -1       -2  
               
            -1  
               
               
           

Решение. Для расчета групповых дисперсий вычислим сред­ние по каждой группе:

Промежуточные расчеты дисперсий по группам представле­ны в табл. 7.4. Подставив полученные значения в формулу, по­лучим:

;

.

Средняя из групповых дисперсий

Затем рассчитаем межгрупповую дисперсию. Для этого предварительно определим общую среднюю как среднюю взвешен­ную из групповых средних:

Теперь определим межгрупповую дисперсию:

Таким образом, общая дисперсия по правилу сложения дис­персий

.

Проверим полученный результат, исчислив общую дисперсию обычным способом:

На основании правила сложения дисперсий можно опреде­лить показатель тесноты связи между группировочным (фактор­ным) и результативным признаками. Он называется эмпиричес­ким корреляционным отношением, обозначается η («эта») и рассчитывается по формуле . Для нашего примера эмпирическое корреляционное отношение .

Величина 0, 86 характеризует существенную связь между группировочным и результативным признаками.

Наряду с вариацией индивидуальных значений признака вок­руг средней может наблюдаться и вариация индивидуальных долей признака вокруг средней доли. Такое изучение вариа­ции достигается посредством вычисления и анализа следующих видов дисперсий.

Внутригрупповая дисперсия доли определяется по формуле

.

Средняя из внутригрупповых дисперсий

Формула межгрупповой дисперсии имеет вид:

где ni – численность единиц в отдельных группах;

р – доля изучаемого признака во всей совокупности, которая определяет­ся по формуле

Общая дисперсия имеет вид:

Три вида дисперсии связаны между собой следующим образом:

Данное соотношение дисперсий называется теоремой сложе­ния дисперсии доли признака. Эта теорема широко используется в изучении колеблемости качественных признаков.

Пример. Определим групповые дисперсии, среднюю из груп­повых, межгрупповую и общую дисперсии по данным табл. 7.5.

 

 

Таблица 7.5

Численность и удельный вес одной из категорий крупного рогатого скота фермерских хозяйств района

 

Хозяйство   Удельный вес дойных коров, % pi Всего коров ni
     
     
     
Итого    

Решение. Определим долю дойных коров в целом по трем хозяйствам:

Общая дисперсия доли дойных коров:

Внутригрупповые дисперсии:

Средняя из внутригрупповых дисперсий:

Межгрупповая дисперсия:

Используя правило сложения дисперсий, получаем: 0, 1025 + 0, 0031 = 0, 1056. Пример решен правильно.

Выяснение общего характера распределения предполагает не только оценку степени его однородности, но и оценку его симметричности, остро- или плосковершинности. Симметричным называется распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. В статистике для характеристики асиммет­рии пользуются несколькими показателями.

Показатели асимметрии и эксцесса. Степень асимметрии может быть определена с помощью коэффициента асимметрии:

,

где – средняя арифметическая ряда распределения,

Мо – мода;

σ – среднее квадратическое отклонение

При симметричном (нормальном) распределении = Мо, следовательно, коэффициент асимметрии равен нулю. Если As > 0, то больше моды, следовательно, имеется правосторонняя асиммет­рия.

Если As < 0, то меньше моды, следовательно, имеется ле­восторонняя асимметрия. Коэффициент асимметрии может из­меняться от -3 до +3.

В практических расчетах часто в качестве показателя асим­метрии применяется отношение центрального момента третьего порядка к среднему квадратическому отклонению данного ряда в кубе, т.е. .

Это дает возможность определить не только величину асим­метрии, но и проверить наличие асимметрии в генеральной сово­купности. Принято считать, что асимметрия выше 0, 5 (независи­мо от знака) считается значительной. Асимметрия меньше 0, 25 – незначительная.

Пример. Рассчитаем коэффициент асимметрии по дан­ным о распределении фирм по стоимости основных фондов (табл. 7.6).

Таблица 7.6

Расчет коэффициента асимметрии

 

Группы фирм по стоимости основных фондов, млн. руб. х Количество фирм fi     Середина интервала xi k= 0, 5 x’fi (x’)2fi (x’)3fi (x’)4fi
0, 5-1, 0   0, 75 -2 -40   -160  
1, 0-1, 5   1, 25 -1 -40   -40  
1, 5-2, 0   1, 75          
2, 0-2, 5   2, 25          
Итого   - - -60   -180  

Решение. Определяем условные моменты m1, m2и m3, а так­же центральные моменты μ 2 и μ 3, необходимые для вычисления коэффициента асимметрии:

Коэффициент асимметрии для данного ряда

Полученный результат свидетельствует о наличии незначи­тельной правосторонней асимметрии.

Для симметричных распределений может быть также рассчи­тан показатель эксцесса:

.

При симметричном распределении Ek = 0. Если Ek > 0, рас­пределение является островершинным; если Ek < 0 - плосковер­шинным.

Вычислим Ek по данным табл. 7.6, определив вначале вели­чину четвертого центрального момента: . Тогда . Таким образом, исследуемое распределе­ние является островершинным.

Оценка существенности показателей асимметрии и эксцесса позволяет сделать вывод о том, можно ли отнести данное эмпи­рическое распределение к типу нормального распределения.

Построение нормального распределения по эмпирическим данным.Имея дело с эмпирическим распределением, можно предположить, что данному распределению соответствует опре­деленная, характерная для него теоретическая кривая. Выдвинув гипотезу о той или иной форме распределения, стремятся опи­сать эмпирический ряд с помощью математической модели, выражающей некоторый теоретический закон распределения. Среди различных кривых распределения особое место занимает нормальное распределение.

Нормальное распределение чаще всего выражается следую­щей стандартизованной кривой нормального распределения:

,

где уt – ордината кривой нормального распределения;

– стандартизованная (нормированная) величина;

е и π – математические постоянные:

хi – значения изучаемого признака,

– средняя арифметическая ряда,

σ – среднее квадратическое отклонение изучаемого признака.

Как видно из уравнения, два параметра – средняя арифмети­ческая () и среднее квадратическое отклонение (σ) - определя­ют черты симметричной кривой нормального распределения. В зависимости от их значения она может иметь разный центр груп­пирования, быть более удлиненной или сжатой.

Пример. Рассчитаем значения частот теоретического ряда распределения на основании эмпирических данных об урожай­ности зерна в 500 фермерских хозяйствах, представленных в табл. 7.7.

Таблица 7.7

Расчет теоретических частот нормального распределения

 

Урожай­ность, ц/га Сере­дина интер- вала xi Кол-во хоз-в fi xifi Теоретические частоты
А                  
До 38, 25 38, 0   76, 0     -3 -3 0, 004  
38, 25-38, 75 38, 5   115, 0     -2, 5 -2, 5 0, 017  
38, 75-39, 25 39, 0   390, 0     -2, 0 -2, 0 0, 054  

Продолжение таблицы 7.7

 

А                  
39, 25-39, 75 39, 5   1224, 5     -1, 5 - 1, 5 0, 130  
39, 75-40, 25 40, 0   2880, 0     -1, 0 -1, 0 0, 242  
40, 25-40, 75 40, 5   3442, 5     -0, 5 -0, 5 0, 352  
40, 75-41, 25, 41, 0   3854, 0         0, 399  
41, 25-41, 75 41, 5   3652, 0     0, 5 0, 5 0, 352  
41, 75-42, 25 42, 0   2604, 0     1, 0 1, 0 0, 242  
42, 25-42, 75 42, 5   1572, 5     1, 5 1, 5 0, 130  
42, 75-43, 25 43, 0   516, 0     2, 0 2, 0 0, 054  
43, 25-43, 75 43, 5   130, 5     2, 5 2, 5 0, 017  
Свыше 43, 75 44, 0   44, 0     3, 0 3, 0 0, 004  
Итого -   20501, 5 -       -  

 

Для данного эмпирического распределения находим сначала значения = 41 ц/га и σ = 1, 0 (они рассчитаны обычным спосо­бом и не воспроизведены в табл. 7.7).

Затем находим отклонения хi (табл. 7.7 гр. 6) и стандар­тизованные отклонения (табл. 7.7 гр. 7) для данного варианта. Значения же теоретической частоты для нее исчисляются по известной уже формуле: .

Так как величина остается одной и той же для всего распределения с равными интервалами, в частности в нашем примере , то достаточно ее найти один раз и умножить на величину φ (t) при данном t, тогда получим искомую теоретическую частоту (табл. 7.7 гр. 9).

Критерии согласия. Количественная характеристика соответ­ствия может быть получена с помощью особых статистических показателей-критериев согласия. Известны критерии согласия К. Пирсона (хи-квадрат), В.И. Романовского, Б.С. Ястремского и А.Н. Колмогорова.

Критерий согласия Пирсона2) вычисляется по формуле

,

где fЭ и fT – эмпирические и теоретические частоты соответственно.

С помощью величины χ 2 по специальным таблицам прило­жения определяется вероятность Р (χ 2). Входами в таблицу явля­ются значения χ 2 и число степеней свободы γ = n – 1. На основе Р выносится суждение о существенности расхождения между эм­пирическим и теоретическим распределениями. При Р > 0, 5 счи­тается, что эмпирическое и теоретическое распределения близ­ки. При РÎ (0, 2; 0, 5) совпадение между ними удовлетворитель­ное, в остальных случаях недостаточное.

Критерий Романовского (С), также используемый для про­верки близости эмпирического и теоретического распределений, определяется следующим образом:

,

где χ 2 – критерий Пирсона:

γ – число степеней свободы.

При С < 3 различие несущественно, что позволяет считать эмпирическое распределение близким к нормальному.

Критерий Ястремского (L) может быть найден на основе следующего соотношения:

,

где N – объем совокупности:

pq – дисперсия альтернативного признака;

k – число вариантов или групп;

Q – принимает значение 0, 6, при числе вариантов или групп от 8 до 20.

Если L < 3, то эмпирическое распределение соответствует теоретическому.

Критерий Колмогорова (λ) вычисляется по формуле

,

где D – максимальное значение разности между накопленными эмпиричес­кими и теоретическими частотами;

Σ f – сумма эмпирических частот.

Необходимым условием использования этого критерия явля­ется достаточно большее число наблюдений (не меньше ста).

Пример. Рассчитаем критерии Колмогорова и Пирсона по данным табл. 7.8.

Таблица 7.8

Расчет критерия Колмогорова по данным об урожайности зерновых

в 500 фермерских хозяйствах

 

Урожайность, ц/га xi   Частоты ряда распределения Накопленные частоты |fЭ – fT|
эмпирические fЭ теоретические fT эмпирические fЭ теоретические fT
До 38, 25          
38, 25-38, 75          
38, 75-39, 25          
39, 25-39, 75          
39, 75-40, 25          
40, 25-40, 75          
40, 75-41, 25          
41, 25-41, 75          
41, 75-42, 25          
42, 25-42, 75          
42, 75-43, 25          
43, 25-43, 75          
Свыше 43, 75          
Итого     - -

 

Как видно из табл. 7.8, максимальное значение разности между эмпирическими и теоретическими частотами составляет 7, т.е. D=7.

Следовательно, в нашем примере величина критерия Колмо­горова

.

По таблицам вероятностей Р (λ) определяем, что λ = 0, 31 соответствует Р(х), близкая к 1, 00. Это означает, что с вероятно­стью, близкой к 1, можно утверждать, что отклонения фактичес­ких частот от теоретических в нашем примере являются случай­ными. Следовательно, можно считать, что в основе фактического распределения фермерских хозяйств по урожайности лежит нормальное распределение.

Этот же вывод подтверждается расчетом χ 2-критерия Пирсо­на (табл. 7.9).

Таблица 7.9

Расчет критерия Пирсона по данным об урожайности зерновых

в 500 фермерских хозяйствах

 

Урожайность, ц/ га хi   Частоты распределения ряда fЭ – fТ    
эмпирические fЭ теоретические fТ
До 38, 25 2 1    
         
38, 25-38, 75        
38, 75-39, 25       1, 70
39, 25-39, 75       0, 03
39, 75-40, 25       2, 00
40, 25-40, 75       0, 05
40, 75-41, 25       0, 16
41, 25-41, 75       0, 01
41, 75-42, 25       0, 02
42, 25-42, 75       0, 78
42, 75-43, 25       0, 10
43, 25-43, 75 3 4   0, 20
         
Свыше 43, 75        
Итого     - 5, 05

 

Из данных табл. 7.9 видно, что χ 2 = 5, 05. По таблицам веро­ятностей Р(χ 2) = 0, 9834. Таким образом, эмпирическое и теоре­тическое распределения близки.

Критерий Романовского . Следовательно, теоретическое распределение эмпирического ряда удов­летворительное.

Для характеристики структуры вариационных рядов приме­няются показатели особого рода, которые можно назвать струк­турными средними.







Дата добавления: 2014-11-10; просмотров: 2806. Нарушение авторских прав; Мы поможем в написании вашей работы!




Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...


Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Примеры задач для самостоятельного решения. 1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P   1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P...

Дизартрии у детей Выделение клинических форм дизартрии у детей является в большой степени условным, так как у них крайне редко бывают локальные поражения мозга, с которыми связаны четко определенные синдромы двигательных нарушений...

Педагогическая структура процесса социализации Характеризуя социализацию как педагогический процессе, следует рассмотреть ее основные компоненты: цель, содержание, средства, функции субъекта и объекта...

Гносеологический оптимизм, скептицизм, агностицизм.разновидности агностицизма Позицию Агностицизм защищает и критический реализм. Один из главных представителей этого направления...

Функциональные обязанности медсестры отделения реанимации · Медсестра отделения реанимации обязана осуществлять лечебно-профилактический и гигиенический уход за пациентами...

Определение трудоемкости работ и затрат машинного времени На основании ведомости объемов работ по объекту и норм времени ГЭСН составляется ведомость подсчёта трудоёмкости, затрат машинного времени, потребности в конструкциях, изделиях и материалах (табл...

Studopedia.info - Студопедия - 2014-2025 год . (0.013 сек.) русская версия | украинская версия