№
п.п.
| Уровни факторов
| Значение функции y при паралельных опытах
| Опытное среднее значение
|
x1
| x2
| y1
| y2
| y3
| yi
|
| 1,0
| 0,2
| 18,2
| 18,6
| 18,7
| 18,5
|
| 2,0
| 0,4
| 21,6
| 23,4
| 23,7
| 22,9
|
| 2,5
| 0,3
| 22,0
| 23,0
| 22,5
| 22,5
|
Число параллельных опытов, как правило, должно быть k > 3.
Проверка значимости уравнения регрессии проводится по F-крите-
рию. Для этого вычисляем остаточную дисперсию

и затем вычисляем FB — статистику

которую сравниваем с табличным значением
при уровне
значимости α и числе степеней свободы k1 = n - 1; k2 = n - k -1
(см. приложение 6, в, с). Гипотеза о значимости уравнения регрессии принимается при условии
FB≥; 
Значимость коэффициентов регрессии проверяют по t-кри-
терию. Статистику

сравнивают с
при уровне значимости α и степени свободы
k = n - k -1 (см. приложение 2).
Погрешность коэффициента регрессии определяется по фор-
муле

где
— диагональный элемент матрицы (ХTХ)-1. Доверительный интервал для коэффициентов регрессии определяем по формуле

где
— значение коэффициента регрессии в генеральной совокупности.
Пример. По результатам опытов, приведённым в табл. 7.1 получено уравнение регрессии у =14+2х1 +12х2. Проверить значимость уравнения регрессии.
Р е ш е н и е. Данные представим в виде, удобном для вычислений (табл. 7.2).
Определяем остаточную дисперсию

И дисперсию для у

Таблица 7.2
Результаты проведенных опытов
№
п.п.
| Уровни факторов
| Значение
| Опытное среднее
| Значение из уравнения регрессии
|
|
|
x1
| x2
| y1
|
|
| 1,0
| 0,2
| 18,2
18,6
18,7
| 331,40
345,96
349,69
| 18,5
| 18,4
| -0.2
0,2
0,3
| 0,04
0,04
0,09
|
| 2,0
| 0,4
| 21,6
23,4
23,7
| 466,56
547,56
561,69
| 22,9
| 22,8
| -1,2
0,6
0,9
| 1,44
0,36
0,81
|
| 2,5
| 0,3
| 22,0
23,0
22,5
| 484,00
529,00
506,25
| 22,5
| 22,6
| -0,6
0,4
-0,1
| 0,36
0,16
0,01
|
Сумма
| 191,7
| 4122,11
| -
| -
| -
| -
| -
| 3,31
|
Вычисляем F B — статистику

При уровне значимости α = 0,10 и числе степеней свободы
K1 = n - 1 = 9 - 1 = 8 и k2 = n - k - 1 = 9 - 3 - 1 =5 (см. приложение 6) находим
= 3,3393, так как F B = 7,34 ≥
= 3,3393, то гипотеза о значимости уравнения регрессии принимается.
Множественный корреляционный анализ. При множественном
корреляционном анализе можно вычислить два типа парных коэффициентов регрессии:
1)
— коэффициент, определяющий тесноту связи между функцией отклика у и одним из факторов хi;
2)
— коэффициент, показывающий на связь между двумя
факторами хi и х m(i, m = 1,k). Их величины вычисляются по формулам




где


Если ввести обозначения


то

Проверка значимости коэффициентов корреляции может производиться:
а) сравнением статистического значения
с табличным
,
значимость коэффициента корреляции устанавливается исходя из
условия

где
выбирается по таблице (см. приложение 10) при уровне значимости α и числе степеней свободы k = n - 2;
б) сравнением статистики tα с табличным значением t-кри-
терия при уровне значимости α и числе степеней свободы
k = n - 2, значимость коэффициента корреляции устанавливается
исходя из условия

где величина tв выбирается по таблице (см. приложение 2), а среднеквадратич-ное отклонение коэффициента корреляции
определяется
по формуле
.
Для парных коэффициентов корреляции может быть определен доверитель-ный интервал по формуле

где р — парный коэффициент корреляции генеральной совокупности.
Последовательно вычисляя значения всех парных коэффициентов, строим матрицу коэффициентов корреляции

С помощью матрицы R k вычисляют частные коэффициенты
корреляции, показывающие степень влияния одного из факторов х i
на функцию отклика Y при условии, что остальные факторы имеют постоянные значения.
Частные коэффициенты определяются по формуле

где Dij — определитель матрицы R k образованный вычеркиванием первой строки и j-того столбца для каждого определителя соответственно. Аналогично вычисляются и определители D11 и Djj. Значимость коэффициентов частной корреляции и доверитель-
ный интервал вычисляются так же, как и для коэффициентов пар-
ной корреляции, но число степеней свободы для критерия ta;k при-
нимается равным k = (n - 2) - р -1, где (р-1) — порядок
частного коэффициента парной корреляции.
Если необходимо изучить степень тесноты связи между функ-
цией отклика Y и несколькими факторами x1, x2,..., xр (р<k)
используют коэффициент множественной корреляции RM, который
всегда положителен и изменяется в пределах 0 < RM< 1. Чем ближе
значение RM к единице, тем лучше качество предсказания полученной моделью процесса, по наблюдениям за которым получены статистические данные. Коэффициент множественной корреляции вычисляется по формуле

или

где D — определитель корреляционной матрицы.
Если RM возвести в квадрат, то величина R2M называется множественным коэффициентом детерминации и показывает, какая часть дисперсии функции отклика объясняется вариацией линейной комбинации выбранных факторов.
При (р<k), х1, х2,...., хp значимость RM можно проверить:
а) по t-критерию

б) по F-критерию

где k1=n - р - 1 и k2 = р.
Пример. Для предыдущего примера, использовавшего данные
табл. 7.2, вычислить коэффициенты корреляции.
Р е ш е н и е. С целью облегчения вычислений результаты
работы сведем в табл. 7.3.
Таблица 7.3.
Результаты вычислений исследования
№
п.п.
| Уровни факторов
| y 1
| у 2
| x1уi
| x 2 уi
|
|
| x 1 x 2
|
x 1
| x 1
|
| 1,0
| 0,2
| 18,2
| 331,4
| 18,2
| 3,64
| 1,0
| 0,04
| 0,2
|
| 1,0
| 0,2
| 18,6
| 345,9
| 18,6
| 3,72
| 1,0
| 0,04
| 0,2
|
| 1,0
| 0,2
| 18,7
| 349,7
| 18,7,
| 3,74
| 1,0
| 0,04
| 0,2
|
| 2,0
| 0,4
| 21,6
| 466,6
| 43,2
| 8,64
| 4,0
| 0,16
| 0,8
|
| 2,0
| 0,4
| 23,4
| 547,7
| 46,8
| 9,36
| 4,0
| 0,16
| 0,8
|
| 2,0
| 0,4
| 23,7
| 561,7
| 47,4
| 9,48
| 4,0
| 0,16
| 0,8
|
| 2,5
| 0,3
| 22,0
| 484,0
| 55,0
| 6,60
| 6,25
| 0,09
| 0,75
|
| 2,5
| 0,3
| 23,0
| 529,0
| 57,5
| 6,90
| 6,25
| 0,09
| 0,75
|
| 2,5
| 0,3
| 22,5
| 506,2
| 56,2
| 6,75
| 6,25
| 0,09
| 0,75
|
Σ
| 16,5
| 2,7
| 191,7
|
| 361,6
| 58,8
| 33,75
| 0,87
| 5,25
|
Вычислим вспомогательные числа:





Вычисляем коэффициент, определяющий степень связи между
функцией Y и фактором х1

Определяем тесноту связи между факторами Y и х2

Определяем тесноту связи между факторами x1 и x2

Где

Составляем корреляционную матрицу

и определяем частные коэффициенты корреляции


где




вычисляем коэффициент множественной корреляции

где
Величина множественного коэффициента детерминации равна:
.
Отсюда можно сделать вывод, что 78,7% дисперсии функции
отклика объясняется вариацией линейной комбинации факто-
ров х1 и х2.
Множественный нелинейный регрессионный анализ. При переходе
от линейной к нелинейной модели для функции отклика Y анализ
результатов статистических наблюдений начинают с модели так называемой квадратичной формы

Данное уравнение линеаризуется заменой переменных
. По полученному уравнению регрессии представляют опытные данные и определяют коэффициенты b 0, b 1, b2, b11,....
Затем производят все вычисления аналогично сделанным для случая
линейного множественного корреляционно-регрессионного анализа. Если квадратичная форма неадекватна статистическому материалу (результатам эксперимента), то степень уравнения повышается. В практике предельным уравнением бывает кубическая форма. При переходе квысшей степени уравнение регрес-сии линеаризуется заменой переменных.
Кроме полиномиальной модели в нелинейном регрессионном
анализе используются:
а) мультипликативные модели
,
логарифмируя которые, преобразуем в линейные модели
,
с заменой переменных: у' = lny;
;
б) экспоненциальные модели
у = ехр(b0 + b 1 x 1+ b2х 2 +... + bkхk),
логарифмируя которые, получим
lnу =b0+b1х1 +b2x2+...+bkхk;
в) обратные модели
,
можно привести к виду

Для определения корреляционной связи в нелинейных моделях
используют множественное корреляционное отношение, при этом
для вычисления остаточ-ной дисперсии используется нелинейная
форма функции отклика у.
При поиске наилучшей модели функции отклика можно использовать раз-личные нелинейные функции, лучшей из них будет та, которая будет иметь наименьшую величину остаточной дисперсии
.
При построении регрессивной модели для целевой функции Y
на начальном этапе следует учитывать как можно большее число
факторов, влияющих на изменение Y. В этом случае получаются
достаточно сложные модели, особенно при использовании нелинейных форм. Часто эти модели можно значительно упростить, если в
них выявить те факторы, которые незначительно влияют на функцию отклика или один из двух, имеющих сильную корреляцию
между собой, и эти факторы не включать в уравнение регрессии.
Для анализа регрессионных моделей используется несколько
методов: метод всех регрессий; метод исключения переменных; метод
включения переменных; анализ остатков и др.
При применении метода всех регрессий функцию отклика представляют в виде комбинаций зависимостей, в которых меняют число факторов.
Так в уравнении регрессии
,
можно записать функцию отклика в различных комбинациях


и т.д.
Для каждого уравнения вычисляются коэффициенты регрессии
и определяется остаточная дисперсия
по наименьшему значению которой и выбирается лучшее уравнение. Применение этого
метода связано с трудоемкими вычислениями.
При применении метода исключения переменных уравнение
регрессии желательно представить сразу в полной квадратичной или
кубичной форме с предварительным вычислением коэффициентов
регрессии и корреляции и проверкой линейности модели по F-кри-
терию. Исключение начинают с фактора, имеющего наименьший t--
критерий. На каждом этапе после исключения каждого фактора для
нового уравнения регрессии вычисляется множественный коэффициент корреляции, остаточная дисперсия и F-критерий. Для прекращения исключения факторов следует следить за изменением остаточной дисперсии. Как только она начнет увеличиваться — исключение факторов следует прекратить. Используется также метод
контроля значений t-критерия. Для исключения следующего фактора мы сравниваем его значение (t) с t-критерием предыдущего исключенного фактора и, если они отличаются незначительно, то
фактор исключается. Если же различия t-критериев значительны,
то исключение факторов прекращают.
Метод включения переменных состоит в том, что на первом этапе выбирают фактор, у которого ryx наибольший, и строят линейное уравнение
у = f (xi).
Затем вычисляют частный коэффициент корреляции. После это-
го берут следующую величину хi+1 и находят второе уравнение
у = f (x i, x i+1)
и вычисляют частный коэффициент корреляции и т.д. Этот метод используется совместно с анализом остатков.
Метод анализа остатков состоит в том, что анализируется разница между значением функции уi и предсказываемым ее значением (уравнением регрес-сии). Определяя остатки
еi = у i -
, i=
,
мы проверяем их среднее значение, которое должно быть равно нулю, т.е.
.
Если это условие не соблюдается, то в уравнение вносят дополнительные члены или же проводятся другие преобразования исходных данных.
назад