Статистическая обработка опытных данных

Статистическая обработка опытных данных

1.1 исходные данные

Исходными данными для первого раздела являются два ряда измерений, являющихся реализациями случайных величин (СВ) Х, У с одинаковыми объемами n. Размер n рекомендуется брать в пределах 50-120. Значения СВ Х, У берутся из выборок, приведенных в [1], §7.

пример 1.1 В качестве СВ X берется 76 значений (с 577 по 550) из столбца Z выборки С0, помещенной в [1] на стр. 105. В качестве СВ У берется полностью столбец Z выборки С8 на стр. 117. Значения х₁, х₂,…, х₇₆и у₁, у₂,…, у₇₆образуют две исходные последовательности и в том же порядке заносятся в таблицу 1.1

Таблица 1.1 Исходные данные

вариант 26

СВ Х

СВ У

Выборка С0

Выборка С8

Столбец Z

n=76

х₁=577

х₇₆=550

у₁=44

у₇₆=47

1 2 …

577 548 …

44 39

20 21 …

574 454 …

55 39 …

39 40 …

566 558 …

46 47 …

58 59 … 76

546 582 … 550

59 39 … 47

1.2 составление первичной таблицы распределения

В таблицу 1.2 заносятся упорядоченные значения СВ Х от x_min до x_max и СВ У от у_min до у_max. Значения x_i и у_i берутся с интервалом, соответствующим точности измерения, в данном случае этот интервал равен единице.

В эту же таблицу заносятся абсолютные частоты, т.е. количества значений x_i и у_i, которые приняли соответственноСВ Х и СВ У. Напротив тех значений x_i и у_i, которых в действительности нет, проставляются нули или же эти значения не заносятся в таблицу.

Таблица 1.2 Первичное распределение

x_i	Абс. час-тоты	у_i	Абс. час-тоты	x_i	Абс. час-тоты	у_i	Абс. час-тоты	x_i	Абс. час-тоты	у_i	Абс. час-тоты
437 443 446 … 517	1 1 2 … 1	23 24 25 … 42	1 0 1 … 2	518 519 520 … 558	1 1 1 … 2	43 44 45 … 62	4 6 2 … 0	559 560 564 … 635	2 1 1 … 1	63 64 65 66	0 0 0 1

Анализ таблицы 1.2 показывает:

x_min = 437, x_max = 635, размах R_x = 635-437=198;

у_min = 23, у_max = 66, размах R_x = 66-23=43.

1.3 составление вторичной таблицы распределения

Для компактного представления опытных данных каждую выборку делят на разряды. Число разрядов определяется по формуле:

где k – число разрядов; n – объем выборки.

В случае n=76 , т.е. , и можно принять k=9.

Затем определяют границы разрядов, при этом рекомендуется выполнить условия:

1) протяженность разряда должна выражаться целым числом;

2) значения границ разрядов не должны совпадать со значениями случайной величины.

Если первое условие не выполняется, то выбирают ближайшее к R значение , обеспечивающее равенство целое.

Здесь возможны следующие варианты.

а) является нечетным положительным числом. Тогда левую границу распределения, например, x_min сдвигают влево по оси x на0,5 , правую границу x_max настолько же сдвигают вправо, и границы разрядов принимают вид:

x_min –0,5 ; x_min –0,5 ; …; x_max +0,5 .

б) является четным положительным числом. Сдвиг границ распределения нельзя осуществлять на 0,5 , потому что границы разрядов будут целыми числами и могут совпасть со значениями случайной величины.

Пусть =2. Тогда левую границу x_min сдвигают влево на 0,5, правую границу x_max – вправо на 1,5 (или наоборот), и границы разрядов будут иметь вид:

x_min–0,5; x_min–0,5 ; …; x_max+1,5,

или x_min–1,5; x_min–1,5 ; …; x_max+0,5.

в) является отрицательным числом.

В этом случае сдвиг границ распределения осуществляется внутрь области распределения.

Так, при нечетном границы разрядов определяют из выражений

x_min +0,5 ; x_min +0,5 ; …; x_max– 0,5 ,

а при четном (например, = – 2) из выражений

x_min+0,5; x_min+0,5 ; …; x_max–1,5,

или x_min+1,5; x_min+1,5 ; …; x_max–0,5.

Необходимо заметить, что значения случайной величины, оказавшиеся при <0 за пределами новых границ распределения, относят к левому и правому крайним рядам.

пример 1.2 Для значений СВ х, приведенных в таблице 1.2, имеем:

x_min = 437, x_max = 635, R_x = 198,

= целое,

поэтому изменения размаха R_x не требуется.

Чтобы границы разрядов не совпадали со значениями случайной величины, сдвинем область распределения влево на 0,5, тогда получим дробные границы разрядов:

436,5; 458,5; 480,5; …; 634,5.

Для значений СВ У имеем:

у_min = 23, у_max = 66, R_x =43, =дробное.

Выберем R'_у=45, тогда и =45-43=2.

Сдвинем левую границу у_min влево на 1,5, правую границу у_max – вправо на 0,5, тогда границы разрядов примут вид:

21,5; 26,5; 31,5; …; 66,5.

Ниже приведена вторичная таблица распределения, в которую наряду с границами разрядов занесены следующие данные:

h_i и h_j – количество элементов в i-м разряде СВ Х и j-м разряде СВ У (абсолютные частоты разрядов);

- относительные частоты;

и - накопленные частоты или эмпирические вероятности.

Таблица 1.3 Вторичное распределение

Х	У
Границы разрядов	h_i	,%	,%	Границы разрядов	h_j	,%	,%
436,5…458,5 458,5…480,5 480,5…502,5 502,5…524,5 524,5…546,5 546,5…568,5 568,5…590,5 590,5…612,5 612,5…634,5	5 7 9 9 13 20 8 2 3	6,58 9,21 11,84 11,84 17,11 26,32 10,53 2,63 3,95	6,58 15,79 27,63 39,47 56,58 82,89 93,42 96,05 100,00	21,5…26,5 26,5…31,5 31,5…36,5 36,5…41,5 41,5…46,5 46,5…51,5 51,5…56,5 56,5…61,5 61,5…66,5	2 5 10 18 15 14 10 1 1	2,63 6,58 13,16 23,68 19,74 18,42 13,16 1,32 1,32	2,63 9,21 22,37 46,05 65,79 84,21 97,37 98,68 100,00

По данным таблицы 1.3 строят гистограммы СВ Х и СВ У. Для этого в прямоугольной системе координат по оси абсцисс откладывают границы разрядов. Затем на длине каждого разряда, как на основании, строят прямоугольник с высотой h_i или

для СВ Х и с h_j или

для СВ У.

1.4 построение диаграммы рассеивания. Составление корреляционной таблицы

Для выявления корреляционной связи между СВ Х и У используют два способа.

Первый способ заключается в построении диаграммы рассеивания (или корреляционного поля). С этой целью из таблицы 1.1 берут парные значения и на плоскость х0у наносят n точек с координатами x_i и у_i. По виду корреляционного поля можно судить о наличии и характере корреляционной связи между случайными величинами.

Так, диаграмма рассеивания, изображенная на рисунке 1.1, свидетельствует о положительной корреляции, на рисунке 1.2 - об отрицательной корреляции, на рисунке 1.3 – об отсутствии корреляционной зависимости между СВ Х и У.

Второй способ требует определения оценки коэффициента корреляции r_xy и проверки гипотезы о его нулевом значении. Для этого составляют корреляционную таблицу, приведенную ниже.

Таблица 1.4 Корреляционная таблица

СВ У	υ_j	СВ Х	h_j
436,5 458,5	458,5 480,5	480,5 502,5	502,5 524,5	524,5 546,5	546,5 568,5	568,5 590,5	590,5 612,5	612,5 634,5
u_i
447,5	469,5	491,5	513,5	535,5	557,5	579,5	601,5	623,5
61,5…66,5
56,5…61,5
51,5…56,5
46,5…51,5
41,5…46,5
36,5…41,5
31,5…36,5
26,5…31,5
21,5…26,5
h_i

В двух столбцах левой части таблицы даны границы разрядов у и средние значения разрядов υ_j. В Верхней части таблицы даны границы разрядов Х и средние значения u_i.

Из таблицы 1.1 берут пары значений x_i, у_i. Например, первая пара х = 577, у = 44. Значение 577 попадает в седьмой слева разряд Х, значение 44 – в пятый снизу разряд У, поэтому ставится штрих или точка в клетке на пресечении этих разрядов. Вторая пара х = 548, у = 39 дает штрих в клетке на пересечении шестого слева разряда Х и четвертого снизу разряда У.

Всего в таблицу заносятся n штрихов, после чего, найдя общее число штрихов в каждой клетке, получают коэффициенты h_ij и заносят их в соответствующие клетки. Сумма коэффициентов h_ij в j -й строке дает частоту h_j, эти частоты помещают в правом столбце таблицы; сумма коэффициентов h_ij в i ‑м столбце дает частоту h_i, эти частоты помещают в нижней строке таблицы.

Значения u_i, υ_j, h_i, h_j, h_ij используют для определения статистических характеристик.

При выполнении курсовой работы применяют оба способа выявления корреляционной связи между случайными величинами Х и У.

1.5 определение выборочных числовых характеристик

Для нахождения коэффициента корреляции необходимо определить следующие выборочные (статистические) числовые характеристики СВ Х и У:

выборочные средние

;

выборочные дисперсии и СКО

, ;

ковариацию или выборочный корреляционный момент

Затем находят коэффициент корреляции

пример 1.3 Используя данные таблицы 1.4, подсчитаем статистические числовые характеристики случайных величин Х и У.

m_x=531,4 =1958,1; =69,58; =4,82;

m_y=42,68;

=44,25;

=8,34;

=0,013.

Найденное значение коэффициента корреляции достаточно близко к нулю, поэтому можно предположить, что в действительности корреляционная зависимость между СВ Х и У отсутствует, а ненулевое значение

объясняется чисто случайными причинами, главным образом, малым объемом выборок.

Чтобы убедиться в правильности этого предположения, следует выполнить проверку статистической гипотезы.

1.6 проверка статистической гипотезы. нахождение регрессионной прямой

По результатам статистической обработки СВ Х, У определяют коэффициент корреляции, который должен находиться в пределах

В случае =±1 Х и У связаны линейной функциональной зависимостью, в случае =0 Х и У не коррелированны.

Чаще коэффициент корреляции принимает промежуточное значение, и тогда возникает вопрос: связаны ли Х и У корреляционной зависимостью или же событие ≠0 объясняется случайными причинами. Чтобы ответить на этот вопрос, выдвигают гипотезу Н_о: =0, для проверки которой формируют выборочную функцию

Значение сравнивают с критическим значением t_α, которые берут в таблице распределения Стьюдента [1]. Для входа в таблицу используют два параметра: число степеней свободы n-2 и уровень значимости α (0,005; 0,01; 0,02; 0,05).

Если n-2 находится между двумя табличными значениями, для нахождения размера t_α применяют линейную интерполяцию.

По результатам сравнения возможны два вывода:

1) , в этом случае считают, что гипотеза Н_о не противоречит опытным данным, т.е. Х и У не коррелированны.

2) , гипотеза Н_о отклоняется, это означает, что Х и У коррелированны, т.е. СВ У в среднем линейно зависит от СВ Х.

Эта зависимость выражается с помощью так называемой регрессионной прямой

(1.1)

коэффициенты которой определяются по правилам теории регрессии [2]

Определив коэффициенты , , строят прямую (1.1) в той же системе координат, где построена диаграмма рассеивания. Заметим, что в случае принятия гипотезы Н_о прямая (1.1) не строится.

пример 1.4 Для данных примера 1.3 выдвигаем гипотезу Н_о: r_ху=0. Зададимся уровнем значимости α=0,01 и найдем число степеней свободы 76-2=74.

Определим значение выборочной функции:

Пользуясь таблицей распределения Стьюдента, находим =2,65.

Поскольку z< , делаем вывод, что гипотеза Н_о не противоречит опытным данным, т.е. СВ Х и У не коррелированны.

пример 1.5 Статистическая обработка двух выборок с объемом п=150 дает: m_x=7,82; m_y=7,86; s_x=4,86; s_y=5,5; s_xy=14,2; r_xy=0,53. задаемся уровнем значимости α=0,02 и для числа степеней свободы 150-2=148 находим в таблице Стьюдента =2,33. Поскольку выборочная функция превосходит , гипотеза Н_о отклоняется, т.е. СВ Х и У коррелированны.

Подсчитаем коэффициенты регрессионной прямой

и запишем ее уравнение у=3,17+0,6 х.

1.7 выбор теоретического закона распределения для описания опытных данных

На практике часто ставится задача описать полученный опытным путем статистический ряд с помощью подходящего теоретического закона распределения. Обычно такой закон выбирается исходя из физической сущности исследуемого процесса или по внешнему виду эмпирического распределения, например, по виду гистограммы. Решение этой задачи рассмотрим на примере СВ У, статистические характеристики которой приведены в таблицах 1.3 и 1.4.

Так как между теоретической кривой и эмпирическим распределением неизбежны расхождения, то возникает вопрос: являются ли эти расхождения случайными вследствие ограниченного числа наблюдений или же подобранная кривая плохо описывает опытные данные. Для ответа на этот вопрос используют критерии согласия, из них наиболее распространенным является критерий Пирсона.

В соответствии с критерием Пирсона формируется мера расхождения

(1.2)

где h_j – абсолютная частота в j-м разряде;

р_j – теоретическая вероятность попадания случайной величины в j-й разряд.

Распределение зависит от числа степеней свободы

r=k-S,

где k – число разрядов;

S – число связей, наложенных на относительные частоты h_j /п.

Такими связями могут быть:

- условие равенства единице суммы относительных частот, т.е.

(1.3)

- условия равенства важнейших выборочных и теоретических числовых характеристик (моментов), например:

а) выборочное среднее должно совпадать с математическим ожиданием

m^*_y=m_y; (1.4)

б) должны совпадать выборочная и теоретическая дисперсии

S_y²=D_y=σ_y²; (1.5)

в) должны совпадать третий и четвертый центральные моменты (это условие используется значительно реже).

Далее поступают следующим образом.

1) Выдвигается гипотеза о том, что случайная величина У, представленная статистическим рядом, подчиняется некоторому теоретическому закону распределения.

2) Определяется мера расхождения по формуле (1.2).

3) Определяется число степеней свободы r=k-S.

4) По значениям r и в таблице распределения определяется вероятность того, что гипотеза Н не противоречит опытным данным (для этого должно быть р ≥ 5…10 %).

В.И. Романовский предложил очень простое правило для применения критерия Пирсона: если ввести обозначение

то при z ≥ 3 гипотеза Н отвергается, а при z <3 эта гипотеза не противоречит опытным данным.

пример 1.6 Подобрать теоретический закон распределения для упомянутой выше случайной величины У.

1) Исходя из внешнего вида гистограммы, принадлежащей СВ У, выдвигается гипотеза Н: случайная величина У подчиняется нормальному закону распределения. В качестве числовых характеристик этого закона берутся выборочные числовые характеристики, подсчитанные в п. 1.5:

m_y = m^*_y=42,68≈42,7;

D_y=S_y²=69,58; σ_y= S_y=8,34.

2) Определяется мера расхождения . С этой целью вычисляются теоретические вероятности р_j и произведения пр_j.

Для первого разряда

пр₁=76 · 0,0206=1,57.

Аналогично

пр₂=76 · 0,0636=4,83.

………………………………………………………………

пр₈=76 · 0,0503=3,82

пр₈=76 · 0,0099=0,75.

Результаты вычислений сведены в таблицу 1.5. Как видно из этой таблицы, в первый разряд попадают два значения, а в восьмой и девятый разряды – по одному значению СВ У. Автор книги [2] рекомендует объединять соседние малочисленные разряды, чтобы в каждом разряде было не менее пяти значений. В данном случае следует объединить первый и второй разряды, при этом получается h_1;2=2+5=7; np_1;2=6,4. Далее объединяем седьмой, восьмой и девятый разряды, при этом h_7;8;9=10+1+1=12; np_7;8;9=10,91.

Суммарное значение равно 0,805.

Таблица 1.5 Применение критерия Пирсона

N	Границы интервалов	h_j	р_j	р_j
1 2 3 4 5 6 7 8 9	21,5…26,5 26,5…31,5 31,5…36,5 36,5…41,5 41,5…46,5 46,5…51,5 51,5…56,5 56,5…61,5 61,5…66,5	10 18 15 14	0,0206 0,0636 0,1392 0,2140 0,2328 0,1786 0,0834 0,0503 0,0099	6,40 10,58 16,24 17,69 13,57 10,91	0,0563 0,0318 0,1853 0,4090 0,0136 0,1090
	Мера расхождения	=0,805

Определим число степеней свободы. После объединения разрядов их число сократилось до шести с учетом трех связей, описываемых формулами (1.3)-(1.5), получаем

r=6-3=3.

4)По значениям r и в таблице распределения с помощью линейной интерполяции находим, что р=0,85.

Правило Романовского дает

< 3.

Оба результата говорят о том, что гипотеза Н о нормальном распределении СВ У не противоречит опытным данным.

12 Следующая ⇒

Дата добавления: 2015-08-30; просмотров: 494. Нарушение авторских прав; Мы поможем в написании вашей работы!

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при которых тело находится под действием заданной системы сил...

Методы прогнозирования национальной экономики, их особенности, классификация В настоящее время по оценке специалистов насчитывается свыше 150 различных методов прогнозирования, но на практике, в качестве основных используется около 20 методов...

Методы анализа финансово-хозяйственной деятельности предприятия Содержанием анализа финансово-хозяйственной деятельности предприятия является глубокое и всестороннее изучение экономической информации о функционировании анализируемого субъекта хозяйствования с целью принятия оптимальных управленческих...

Образование соседних чисел Фрагмент: Программная задача: показать образование числа 4 и числа 3 друг из друга...

СИНТАКСИЧЕСКАЯ РАБОТА В СИСТЕМЕ РАЗВИТИЯ РЕЧИ УЧАЩИХСЯ В языке различаются уровни — уровень слова (лексический), уровень словосочетания и предложения (синтаксический) и уровень Словосочетание в этом смысле может рассматриваться как переходное звено от лексического уровня к синтаксическому...

Плейотропное действие генов. Примеры. Плейотропное действие генов - это зависимость нескольких признаков от одного гена, то есть множественное действие одного гена...

Методика обучения письму и письменной речи на иностранном языке в средней школе. Различают письмо и письменную речь. Письмо – объект овладения графической и орфографической системами иностранного языка для фиксации языкового и речевого материала...

Studopedia.info - Студопедия - 2014-2025 год . (0.008 сек.) русская версия | украинская версия