Проверка уравнения регрессии на адекватность
По мере увеличения степени полинома будет наблюдаться все лучшее соответствие экспериментальных и расчетных данных. Очевидно, что повышать степень полинома до бесконечности не имеет смысла. Поэтому встает вопрос: а на какой степени полинома остановится? Критерием остановки расчетов является получение адекватного описания данных. Для решения этого вопроса используется следующая схема вычислений: - для каждого уравнения регрессии рассчитывается остаточная сумма квадратов. Для ее расчета используется функция Excel СУММКВРАЗН. Для вышеприведенного примера расчет остаточной суммы квадратов уравнения первой степени производится следующим образом: - курсор устанавливается в G12, вызывается функция СУММКВРАЗН и в качестве ее аргументов указываются столбцы А и G (A2:A11;G2:G11). - аналогично в строке 12 столбцов H, I, J производятся расчеты остаточных сумм для полиномов второй, третьей и четвертой степени. - в F12 отдельно рассчитывается остаточная сумма квадратов для полинома нулевой степени. Для ее расчета в указанную ячейку вводится формула =ДИСПА(A2:A11)*9 (здесь 9 это число измерений минус один); - дальнейшие расчеты показываются на следующем примере. Пусть для обработки было представлено 10 измерений – N=10. И пусть в результате расчетов остаточных сумм квадратов для уравнений разных степеней получены следующие результаты:
Как следует из таблицы, с увеличением степени полинома остаточная суммы квадратов уменьшается, т.е. степень соответствия уравнения описываемым данным увеличивается. В то же время видно, что для больших степеней уменьшение остаточной суммы практически прекращается. Поэтому необходимо объективное правило, согласно которому увеличение степени полинома можно прекратить без ущерба для точности описания данных.
Для решения этого вопроса производятся следующие вычисления. 1. Вычисляются сумы квадратов, приходящиеся на каждую компоненту уравнения. Вычисления производятся по формуле:
SSk = SSk-1 – SSk, (7.9) где SS – остаточная сумма квадратов; k – степень полинома. Для данного примера:
2. Определяются числа степеней свободы для компонент уравнения остаточной суммы квадратов. Для каждой компоненты это число равно 1, а для остаточной суммы вычисляется по формуле: f = N – k – 1, (7.10) где N – общее число измерений; k – количество коэффициентов в уравнении.
Для данного примера:
3. Определяются величины дисперсий для компоненты и ошибки текущей степени уравнения. Вычисления производятся по формуле:
s2 = SS / f. (7.11) Для данного примера:
4. Для каждой компоненты вычисляется критерий Фишера. Вычисления производятся по формуле:
F = s2k / s2e, (7.12) где s2k – дисперсия компоненты; s2e – дисперсия ошибки.
Для данного примера:
5. Для каждой компоненты определяются критические значения критерия Фишера. Эти значения вычисляются с помощью встроенной в Excel функции FРАСПОБР. Аргументами этой функции являются: а) уровень значимости. Если мы хотим сделать свои выводы с надежность 95%, то его значение должно быть равно 0,05. б) число степеней свободы для числителя. У нас при вычислении F-отношения в числителе находилась дисперсия компоненты, число степеней свободы которой всегда равно 1. в) число степеней свободы для знаменателя. Здесь указывается число степеней свободы для ошибки.
В результате всех вычислений должна получиться следующая сводная таблица.
Для решения вопроса о статистической значимости компонент уравнения производится сравнение вычисленных значений критерия Фишера с критическими. Если вычисленное значение больше критического, компонента признается статистически значимой при выбранном уровне надежности. В противном случае компонента признается статистически не значимой. В данном примере статистически существенными является компоненты первой и второй степени. Компоненты более высоких степеней не существенны. Поэтому для адекватного описания наших данных достаточно использовать уравнение второй степени следующего вида:
. (7.13)
|