Студопедия — Статистическая обработка опытных данных
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Статистическая обработка опытных данных






Статистическая обработка опытных данных

 

1.1 исходные данные

Исходными данными для первого раздела являются два ряда измерений, являющихся реализациями случайных величин (СВ) Х, У с одинаковыми объемами n. Размер n рекомендуется брать в пределах 50-120. Значения СВ Х, У берутся из выборок, приведенных в [1], §7.

пример 1.1 В качестве СВ X берется 76 значений (с 577 по 550) из столбца Z выборки С0, помещенной в [1] на стр. 105. В качестве СВ У берется полностью столбец Z выборки С8 на стр. 117. Значения х1, х2,…, х76 и у1, у2,…, у76 образуют две исходные последовательности и в том же порядке заносятся в таблицу 1.1

Таблица 1.1 Исходные данные

вариант 26 СВ Х СВ У
Выборка С0 Выборка С8
Столбец Z Столбец Z
n=76 х1=577 х76=550 у1=44 у76=47
N X Y N X Y N X Y N X Y
1 2 577 548 44 39 20 21 574 454 55 39 39 40 566 558 46 47 58 59 76 546 582 550 59 39 47
                           
1.2 составление первичной таблицы распределения

В таблицу 1.2 заносятся упорядоченные значения СВ Х от xmin до xmax и СВ У от уmin до уmax. Значения xi и уi берутся с интервалом, соответствующим точности измерения, в данном случае этот интервал равен единице.

В эту же таблицу заносятся абсолютные частоты, т.е. количества значений xi и уi, которые приняли соответственноСВ Х и СВ У. Напротив тех значений xi и уi, которых в действительности нет, проставляются нули или же эти значения не заносятся в таблицу.

Таблица 1.2 Первичное распределение

xi Абс. час-тоты уi Абс. час-тоты xi Абс. час-тоты уi Абс. час-тоты xi Абс. час-тоты уi Абс. час-тоты
437 443 446 517 1 1 2 1 23 24 25 42 1 0 1 2 518 519 520 558 1 1 1 2 43 44 45 62 4 6 2 0 559 560 564 635 2 1 1 1 63 64 65 66 0 0 0 1
Анализ таблицы 1.2 показывает:

xmin = 437, xmax = 635, размах Rx = 635-437=198;

уmin = 23, уmax = 66, размах Rx = 66-23=43.

1.3 составление вторичной таблицы распределения

Для компактного представления опытных данных каждую выборку делят на разряды. Число разрядов определяется по формуле:

,

где k – число разрядов; n – объем выборки.

В случае n=76 , т.е. , и можно принять k=9.

Затем определяют границы разрядов, при этом рекомендуется выполнить условия:

1) протяженность разряда должна выражаться целым числом;

2) значения границ разрядов не должны совпадать со значениями случайной величины.

Если первое условие не выполняется, то выбирают ближайшее к R значение , обеспечивающее равенство целое.

Здесь возможны следующие варианты.

а) является нечетным положительным числом. Тогда левую границу распределения, например, xmin сдвигают влево по оси x на0,5 , правую границу xmax настолько же сдвигают вправо, и границы разрядов принимают вид:

xmin –0,5 ; xmin –0,5 ; …; xmax +0,5 .

б) является четным положительным числом. Сдвиг границ распределения нельзя осуществлять на 0,5 , потому что границы разрядов будут целыми числами и могут совпасть со значениями случайной величины.

Пусть =2. Тогда левую границу xmin сдвигают влево на 0,5, правую границу xmax – вправо на 1,5 (или наоборот), и границы разрядов будут иметь вид:

xmin–0,5; xmin–0,5 ; …; xmax+1,5,

или xmin–1,5; xmin–1,5 ; …; xmax+0,5.

в) является отрицательным числом.

В этом случае сдвиг границ распределения осуществляется внутрь области распределения.

Так, при нечетном границы разрядов определяют из выражений

xmin +0,5 ; xmin +0,5 ; …; xmax 0,5 ,

а при четном (например, = 2) из выражений

xmin+0,5; xmin+0,5 ; …; xmax–1,5,

или xmin+1,5; xmin+1,5 ; …; xmax–0,5.

Необходимо заметить, что значения случайной величины, оказавшиеся при <0 за пределами новых границ распределения, относят к левому и правому крайним рядам.

пример 1.2 Для значений СВ х, приведенных в таблице 1.2, имеем:

xmin = 437, xmax = 635, Rx = 198,

= целое,

поэтому изменения размаха Rx не требуется.

Чтобы границы разрядов не совпадали со значениями случайной величины, сдвинем область распределения влево на 0,5, тогда получим дробные границы разрядов:

436,5; 458,5; 480,5; …; 634,5.

Для значений СВ У имеем:

уmin = 23, уmax = 66, Rx =43, =дробное.

Выберем R'у=45, тогда и =45-43=2.

Сдвинем левую границу уmin влево на 1,5, правую границу уmax – вправо на 0,5, тогда границы разрядов примут вид:

21,5; 26,5; 31,5; …; 66,5.

Ниже приведена вторичная таблица распределения, в которую наряду с границами разрядов занесены следующие данные:

hi и hj – количество элементов в i-м разряде СВ Х и j-м разряде СВ У (абсолютные частоты разрядов);

- относительные частоты;

и - накопленные частоты или эмпирические вероятности.

Таблица 1.3 Вторичное распределение

Х У
Границы разрядов hi ,% ,% Границы разрядов hj ,% ,%
436,5…458,5 458,5…480,5 480,5…502,5 502,5…524,5 524,5…546,5 546,5…568,5 568,5…590,5 590,5…612,5 612,5…634,5 5 7 9 9 13 20 8 2 3 6,58 9,21 11,84 11,84 17,11 26,32 10,53 2,63 3,95 6,58 15,79 27,63 39,47 56,58 82,89 93,42 96,05 100,00 21,5…26,5 26,5…31,5 31,5…36,5 36,5…41,5 41,5…46,5 46,5…51,5 51,5…56,5 56,5…61,5 61,5…66,5 2 5 10 18 15 14 10 1 1 2,63 6,58 13,16 23,68 19,74 18,42 13,16 1,32 1,32 2,63 9,21 22,37 46,05 65,79 84,21 97,37 98,68 100,00
По данным таблицы 1.3 строят гистограммы СВ Х и СВ У. Для этого в прямоугольной системе координат по оси абсцисс откладывают границы разрядов. Затем на длине каждого разряда, как на основании, строят прямоугольник с высотой hi или для СВ Х и с hj или для СВ У.

 

1.4 построение диаграммы рассеивания. Составление корреляционной таблицы

Для выявления корреляционной связи между СВ Х и У используют два способа.

Первый способ заключается в построении диаграммы рассеивания (или корреляционного поля). С этой целью из таблицы 1.1 берут парные значения и на плоскость х0у наносят n точек с координатами xi и уi. По виду корреляционного поля можно судить о наличии и характере корреляционной связи между случайными величинами.


Так, диаграмма рассеивания, изображенная на рисунке 1.1, свидетельствует о положительной корреляции, на рисунке 1.2 - об отрицательной корреляции, на рисунке 1.3 – об отсутствии корреляционной зависимости между СВ Х и У.

Второй способ требует определения оценки коэффициента корреляции rxy и проверки гипотезы о его нулевом значении. Для этого составляют корреляционную таблицу, приведенную ниже.

Таблица 1.4 Корреляционная таблица

СВ У υj СВ Х hj
436,5 458,5 458,5 480,5 480,5 502,5 502,5 524,5 524,5 546,5 546,5 568,5 568,5 590,5 590,5 612,5 612,5 634,5
ui
447,5 469,5 491,5 513,5 535,5 557,5 579,5 601,5 623,5
61,5…66,5                      
56,5…61,5                      
51,5…56,5                      
46,5…51,5                      
41,5…46,5                      
36,5…41,5                      
31,5…36,5                      
26,5…31,5                      
21,5…26,5                      
hi                      
В двух столбцах левой части таблицы даны границы разрядов у и средние значения разрядов υj. В Верхней части таблицы даны границы разрядов Х и средние значения ui.

Из таблицы 1.1 берут пары значений xi, уi. Например, первая пара х = 577, у = 44. Значение 577 попадает в седьмой слева разряд Х, значение 44 – в пятый снизу разряд У, поэтому ставится штрих или точка в клетке на пресечении этих разрядов. Вторая пара х = 548, у = 39 дает штрих в клетке на пересечении шестого слева разряда Х и четвертого снизу разряда У.

Всего в таблицу заносятся n штрихов, после чего, найдя общее число штрихов в каждой клетке, получают коэффициенты hij и заносят их в соответствующие клетки. Сумма коэффициентов hij в j -й строке дает частоту hj, эти частоты помещают в правом столбце таблицы; сумма коэффициентов hij в i ‑м столбце дает частоту hi, эти частоты помещают в нижней строке таблицы.

Значения ui, υj, hi, hj, hij используют для определения статистических характеристик.

При выполнении курсовой работы применяют оба способа выявления корреляционной связи между случайными величинами Х и У.

 

1.5 определение выборочных числовых характеристик

Для нахождения коэффициента корреляции необходимо определить следующие выборочные (статистические) числовые характеристики СВ Х и У:

выборочные средние

,

;

выборочные дисперсии и СКО

, ;

, ;

ковариацию или выборочный корреляционный момент

.

 

Затем находят коэффициент корреляции

.

пример 1.3 Используя данные таблицы 1.4, подсчитаем статистические числовые характеристики случайных величин Х и У.

mx=531,4 =1958,1; =69,58; =4,82; my=42,68; =44,25; =8,34; =0,013.
Найденное значение коэффициента корреляции достаточно близко к нулю, поэтому можно предположить, что в действительности корреляционная зависимость между СВ Х и У отсутствует, а ненулевое значение объясняется чисто случайными причинами, главным образом, малым объемом выборок.

Чтобы убедиться в правильности этого предположения, следует выполнить проверку статистической гипотезы.

1.6 проверка статистической гипотезы. нахождение регрессионной прямой

По результатам статистической обработки СВ Х, У определяют коэффициент корреляции, который должен находиться в пределах

В случае =±1 Х и У связаны линейной функциональной зависимостью, в случае =0 Х и У не коррелированны.

Чаще коэффициент корреляции принимает промежуточное значение, и тогда возникает вопрос: связаны ли Х и У корреляционной зависимостью или же событие ≠0 объясняется случайными причинами. Чтобы ответить на этот вопрос, выдвигают гипотезу Но: =0, для проверки которой формируют выборочную функцию

Значение сравнивают с критическим значением tα, которые берут в таблице распределения Стьюдента [1]. Для входа в таблицу используют два параметра: число степеней свободы n-2 и уровень значимости α (0,005; 0,01; 0,02; 0,05).

Если n-2 находится между двумя табличными значениями, для нахождения размера tα применяют линейную интерполяцию.

По результатам сравнения возможны два вывода:

1) , в этом случае считают, что гипотеза Но не противоречит опытным данным, т.е. Х и У не коррелированны.

2) , гипотеза Но отклоняется, это означает, что Х и У коррелированны, т.е. СВ У в среднем линейно зависит от СВ Х.

Эта зависимость выражается с помощью так называемой регрессионной прямой

(1.1)

коэффициенты которой определяются по правилам теории регрессии [2]

Определив коэффициенты , , строят прямую (1.1) в той же системе координат, где построена диаграмма рассеивания. Заметим, что в случае принятия гипотезы Но прямая (1.1) не строится.

пример 1.4 Для данных примера 1.3 выдвигаем гипотезу Но: rху=0. Зададимся уровнем значимости α=0,01 и найдем число степеней свободы 76-2=74.

Определим значение выборочной функции:

Пользуясь таблицей распределения Стьюдента, находим =2,65.

Поскольку z< , делаем вывод, что гипотеза Но не противоречит опытным данным, т.е. СВ Х и У не коррелированны.

пример 1.5 Статистическая обработка двух выборок с объемом п=150 дает: mx=7,82; my=7,86; sx=4,86; sy=5,5; sxy=14,2; rxy=0,53. задаемся уровнем значимости α=0,02 и для числа степеней свободы 150-2=148 находим в таблице Стьюдента =2,33. Поскольку выборочная функция превосходит , гипотеза Но отклоняется, т.е. СВ Х и У коррелированны.

Подсчитаем коэффициенты регрессионной прямой

и запишем ее уравнение у=3,17+0,6 х.

1.7 выбор теоретического закона распределения для описания опытных данных

На практике часто ставится задача описать полученный опытным путем статистический ряд с помощью подходящего теоретического закона распределения. Обычно такой закон выбирается исходя из физической сущности исследуемого процесса или по внешнему виду эмпирического распределения, например, по виду гистограммы. Решение этой задачи рассмотрим на примере СВ У, статистические характеристики которой приведены в таблицах 1.3 и 1.4.

Так как между теоретической кривой и эмпирическим распределением неизбежны расхождения, то возникает вопрос: являются ли эти расхождения случайными вследствие ограниченного числа наблюдений или же подобранная кривая плохо описывает опытные данные. Для ответа на этот вопрос используют критерии согласия, из них наиболее распространенным является критерий Пирсона.

В соответствии с критерием Пирсона формируется мера расхождения

(1.2)

где hj – абсолютная частота в j-м разряде;

рj – теоретическая вероятность попадания случайной величины в j-й разряд.

Распределение зависит от числа степеней свободы

r=k-S,

где k – число разрядов;

S – число связей, наложенных на относительные частоты hj /п.

Такими связями могут быть:

- условие равенства единице суммы относительных частот, т.е.

(1.3)

- условия равенства важнейших выборочных и теоретических числовых характеристик (моментов), например:

а) выборочное среднее должно совпадать с математическим ожиданием

m*y=my; (1.4)

б) должны совпадать выборочная и теоретическая дисперсии

Sy2=Dyy2; (1.5)

в) должны совпадать третий и четвертый центральные моменты (это условие используется значительно реже).

Далее поступают следующим образом.

1) Выдвигается гипотеза о том, что случайная величина У, представленная статистическим рядом, подчиняется некоторому теоретическому закону распределения.

2) Определяется мера расхождения по формуле (1.2).

3) Определяется число степеней свободы r=k-S.

4) По значениям r и в таблице распределения определяется вероятность того, что гипотеза Н не противоречит опытным данным (для этого должно быть р ≥ 5…10 %).

В.И. Романовский предложил очень простое правило для применения критерия Пирсона: если ввести обозначение

то при z ≥ 3 гипотеза Н отвергается, а при z <3 эта гипотеза не противоречит опытным данным.

пример 1.6 Подобрать теоретический закон распределения для упомянутой выше случайной величины У.

1) Исходя из внешнего вида гистограммы, принадлежащей СВ У, выдвигается гипотеза Н: случайная величина У подчиняется нормальному закону распределения. В качестве числовых характеристик этого закона берутся выборочные числовые характеристики, подсчитанные в п. 1.5:

my = m*y=42,68≈42,7;

Dy=Sy2=69,58; σy= Sy=8,34.

2) Определяется мера расхождения . С этой целью вычисляются теоретические вероятности рj и произведения прj.

Для первого разряда

пр1=76 · 0,0206=1,57.

Аналогично

пр2=76 · 0,0636=4,83.

………………………………………………………………

пр8=76 · 0,0503=3,82

пр8=76 · 0,0099=0,75.

Результаты вычислений сведены в таблицу 1.5. Как видно из этой таблицы, в первый разряд попадают два значения, а в восьмой и девятый разряды – по одному значению СВ У. Автор книги [2] рекомендует объединять соседние малочисленные разряды, чтобы в каждом разряде было не менее пяти значений. В данном случае следует объединить первый и второй разряды, при этом получается h1;2=2+5=7; np1;2=6,4. Далее объединяем седьмой, восьмой и девятый разряды, при этом h7;8;9=10+1+1=12; np7;8;9=10,91.

Суммарное значение равно 0,805.

Таблица 1.5 Применение критерия Пирсона

N Границы интервалов hj рj рj
1 2 3 4 5 6 7 8 9 21,5…26,5 26,5…31,5 31,5…36,5 36,5…41,5 41,5…46,5 46,5…51,5 51,5…56,5 56,5…61,5 61,5…66,5 10 18 15 14 0,0206 0,0636 0,1392 0,2140 0,2328 0,1786 0,0834 0,0503 0,0099 6,40 10,58 16,24 17,69 13,57 10,91 0,0563 0,0318 0,1853 0,4090 0,0136 0,1090
  Мера расхождения =0,805
Определим число степеней свободы. После объединения разрядов их число сократилось до шести с учетом трех связей, описываемых формулами (1.3)-(1.5), получаем

r=6-3=3.

4)По значениям r и в таблице распределения с помощью линейной интерполяции находим, что р=0,85.

Правило Романовского дает

< 3.

Оба результата говорят о том, что гипотеза Н о нормальном распределении СВ У не противоречит опытным данным.







Дата добавления: 2015-08-30; просмотров: 473. Нарушение авторских прав; Мы поможем в написании вашей работы!



Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Гносеологический оптимизм, скептицизм, агностицизм.разновидности агностицизма Позицию Агностицизм защищает и критический реализм. Один из главных представителей этого направления...

Функциональные обязанности медсестры отделения реанимации · Медсестра отделения реанимации обязана осуществлять лечебно-профилактический и гигиенический уход за пациентами...

Определение трудоемкости работ и затрат машинного времени На основании ведомости объемов работ по объекту и норм времени ГЭСН составляется ведомость подсчёта трудоёмкости, затрат машинного времени, потребности в конструкциях, изделиях и материалах (табл...

Кишечный шов (Ламбера, Альберта, Шмидена, Матешука) Кишечный шов– это способ соединения кишечной стенки. В основе кишечного шва лежит принцип футлярного строения кишечной стенки...

Принципы резекции желудка по типу Бильрот 1, Бильрот 2; операция Гофмейстера-Финстерера. Гастрэктомия Резекция желудка – удаление части желудка: а) дистальная – удаляют 2/3 желудка б) проксимальная – удаляют 95% желудка. Показания...

Ваготомия. Дренирующие операции Ваготомия – денервация зон желудка, секретирующих соляную кислоту, путем пересечения блуждающих нервов или их ветвей...

Studopedia.info - Студопедия - 2014-2024 год . (0.013 сек.) русская версия | украинская версия