Метод наименьших квадратов. Один из методов такой обработки — метод наименьших квадратов (МНК)

⇐ Предыдущая 10 11 12 13 14 15 161718 19 Следующая ⇒

Один из методов такой обработки — метод наименьших квадратов (МНК). Этот метод позволяет найти не только косвенно измеряемые параметры а_k, но и погрешности _, как если бы а_k измерялись непосредственно. Кроме того, можно строго доказать, что МНК является «лучшим» методом обработки для зависимостей вида (1). Точнее, оценка по МНК оказывается несмещенной и обладает наименьшей дисперсией в классе линейных оценок. Ограничением на применимость МНК является линейность зависимости y от неизвестных коэффициентов а_k, при атом зависимость от х может быть нелинейной. Тем не менее, даже при нелинейной зависимости y от а_k, МНК применяется. В этом случае можно попытаться найти линеаризующее преобразование. Например, зависимость y = A ехр (bx + сх²) приводится к виду (1), если вместо y рассматривать величину Y = lnу = lnA + bx + сx². Если же подходящее преобразование найти не удаётся, то задача сводится к нелинейной системе уравнений, которую в принципе можно решить. Однако существование и единственность решения не гарантированы заранее. Кроме того, теряют силу результаты линейного МНК об оценке погрешностей.

Рассмотрим сначала простой случай, когда величина у измеряется абсолютно точно, и каждое измерение дает одну точку на плоскости (x, y) принадлежащую кривой (1). Тогда достаточно проделать p измерений при различных значениях x. Подставляя результаты измерений в (1), получим систему линейных уравнений для а_k, решая которую мы определим коэффициенты а_k абсолютно точно.

Однако, в большинстве случаев измерения не точны, и точки плоскости (x, y), соответствующие отдельным измерениям, отклоняются от кривой (1) (см. рис. 8). Очевидно, что p измерений здесь будет недостаточно, поскольку через p различных точек на плоскости проходит только одна кривая вида (1), и ее коэффициенты будут отличаться от истинных. Ясно, что, увеличивая количество измерений n (n > p), мы можем получить более точные результаты.

Идея МНК принадлежит, вероятно, Гауссу и заключается в минимизации суммы квадратов отклонений экспериментальных точек от предполагаемой кривой. Пусть при n различных аргументах х₁, x₂,..., х_n измерения дали значения y₁, у₂,..., у_n соответственно.

Рассмотрим функцию

R(z_1,z₂,..., z_p)= S w_i (y_i- S z_kf_k (x_i))², (2)

где w_i > 0 — вес i- го измерения.

Веса необходимо использовать в том случае, когда заранее известно, что случайные отклонения e_i = y_i – f(x_i) в среднем различны для разных x_i. Такая ситуация возникает, когда объединяются измерения, выполненные приборами разного класса точности. Более точному измерению y, следует приписать больший вес, а именно: w_i ~ 1/e_i². Знак ~ указывает, что конкретное значение веса произвольно, существенно лишь соотношение между весами. Действительно, одновременное умножение всех весов на любое число приведет к умножению функции R на то же число, при этом положение минимума R не изменится. Поскольку отклонения e_i, неизвестны, выбор весов w_i не может зависеть от y_i и должен быть сделан на основе априорной информации 0 точности измерений. При отсутствии априорной информации полагают все w_i = 1.

Рис.8. Результат обработки экспериментальных данных методом МНК. Сплошная линия - точная зависимость f(х), крестики - экспериментальные точки, пунктирная линия — восстановленная зависимость f(х).

Положение минимума функции R определяет искомые коэффициенты зависимости (1). Обозначим через b₁, b₂,... b_р значения переменных { z_k }, при которых R минимальна.

В точке минимума выполняются условия:

¶ R/¶ z_m (b₁, b₂,..., b_P)=0,

m=1, 2,... p.

Дифференцируя (2), получаем для b_k систему линейных уравнений:

S C_mk b_k = F_m, m=1, 2,..., p (3)

где

C_m _k = S w_i f_m(x_i) f_k (x_i), F_m = S w_i f_m(x_i) y_i, m, k=1, 2,..., p (4)

Решение системы (3) всегда существует и единственно, поскольку ее детерминант отличен от нуля в силу линейной независимости f_k(x). Если измерения точны, то e_i = 0, b_k = a_k и R_min = 0. В общем случае b_k ¹ a_k и можно сказать, что оценка b_k = а_k + D_k состоит из «плавной составляющей» a_k и случайной ошибки D_k (сравните: y_i = f(x_i) + e_i). Средние величины погрешностей D_k и e_i неизвестны, но их также можно оценить через R_min - остаточную сумму квадратов. Важно понять, что речь идет не о конкретных случайных отклонениях D_k и e_i, а о средних, наиболее вероятных значениях этих ошибок (строго говоря - о дисперсиях отклонений), которые мы обозначим через П_к и e_i. Можно показать, что в пределе n> > 1

D²_k=R_min(C^-1) _kk/(n-p), k = 1, 2,..., p, (5)

e_i² =R_min/(n-p)щ_i, i = 1, 2,..., n, (6)

где (C^-1)_kk – диагональные элементы матрицы C^-1, обратной к матрице С_mk _,определенной в (4), и

R_min= R(b₁, b₂, …, b_p)= S w_i (y_i- S b_kf_k(x_i)) ².

Выражения (5-6) определяют 68% доверительные интервалы для а_k и f(x_i) соответственно. Умножением D_к и e_i на коэффициент t_a из таблицы 1.1 можно получить доверительные интервалы с вероятностью a:

Таблица 1.1.

a 0.500 0.680 0.900 0.950 0.990 0.999

t_a 0.67 1.00 1.64 1.96 2.56 3.39

a_k= b_k± t_a D_k, f(x_i) = F(x_i) ± t_a E_i, (7)

а для произвольного значения x имеем : f(x) = F(x) ± t_a E_i (x), где

F(x)= S b_k f_k(x), E_i²= R_min / (n-p) SS (C^-1)_km f_k(x) f_m(x).

Строго говоря, при малом числе измерений n надежность приведенных выше оценок уменьшается. В таких ситуациях вместо таблицы 1.1, отвечающей предельному гауссовскому распределению (n=8), следует пользоваться таблицами распределения Стьюдента, в которых коэффициенты t_a зависят также от n (точнее, от n-p) и отличаются от приведенных в табл. 1.1 в большую сторону. Это значит, что формулы (5-7) дают при малых n заниженную погрешность. Однако уже при значениях n> 20 до 30 различие становится малым, поэтому в дальнейшем будем пользоваться табл. 1.1.

Пример

В табл. 1.2 даны “измерения” y_i, полученные путем добавления к функции f(x)=2x-x² отклонений e_i, взятых из таблиц случайных чисел. При x< 1 выбраны средние отклонения e_i»0.2, при x> 1 выбраны e_i» 0.4, моделирующие измерения грубым прибором.

Таблица1.2

x_i 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

y_i 0.025 0.184 0.623 0.476 0.817 0.933 0.597 1.113 0.728 1.245

w_i

x_i 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0

y_i 0.019 1.245 0.647 1.881 0.742 0.048 0.418 0.734 -0.026 -0.312

w_i

Требуется по этим данным определить параметры зависимости: y=a₁+a₂x +a₃x². Поскольку a priori известно, что при x< 1 измерения в среднем вдвое точнее, припишем им веса w_i=4 (см. табл.1.2).

Положим f₀(x)=1, f₁(x)=x, f₂(x)=x², p=3, n=20.

Выполним необходимые вычисления, получим:

, , ,

b₁=0.069, b₂=1.991, b₃=-1.043,

D₁=0.16, D₂=0.43, D₃=0.23, R_min= 4.08,

E₁ = … = E₁₀ = 0.24, E₁₁ = … = E₂₀ = 0.48.

На рис. 8 представлены результаты. Видно, что первоначальная зависимость восстановлена практически точно, несмотря на значительные отклонения отдельных измерений и малое число экспериментальных точек. Отклонения найденных коэффициентов b_k от их точных значений оказались существенно меньше, чем вычисленные погрешности П_k. Можно утверждать, что из имеющихся экспериментальных данных нельзя получить более точные оценки для a_k, чем найденные выше методом МНК. Для уточнения коэффициентов необходимо провести более точные измерения (уменьшить e_i), или увеличить количество измерений n. Заметим, что неизвестные заранее отклонения e_i нам удалось оценить с погрешностью всего 20%.

⇐ Предыдущая 10 11 12 13 14 15 161718 19 Следующая ⇒

Дата добавления: 2014-11-10; просмотров: 861. Нарушение авторских прав; Мы поможем в написании вашей работы!

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

МЕТОДИКА ИЗУЧЕНИЯ МОРФЕМНОГО СОСТАВА СЛОВА В НАЧАЛЬНЫХ КЛАССАХ В практике речевого общения широко известен следующий факт: как взрослые...

СИНТАКСИЧЕСКАЯ РАБОТА В СИСТЕМЕ РАЗВИТИЯ РЕЧИ УЧАЩИХСЯ В языке различаются уровни — уровень слова (лексический), уровень словосочетания и предложения (синтаксический) и уровень Словосочетание в этом смысле может рассматриваться как переходное звено от лексического уровня к синтаксическому...

Плейотропное действие генов. Примеры. Плейотропное действие генов - это зависимость нескольких признаков от одного гена, то есть множественное действие одного гена...

Определение трудоемкости работ и затрат машинного времени На основании ведомости объемов работ по объекту и норм времени ГЭСН составляется ведомость подсчёта трудоёмкости, затрат машинного времени, потребности в конструкциях, изделиях и материалах (табл...

Гидравлический расчёт трубопроводов Пример 3.4. Вентиляционная труба d=0,1м (100 мм) имеет длину l=100 м. Определить давление, которое должен развивать вентилятор, если расход воздуха, подаваемый по трубе, . Давление на выходе . Местных сопротивлений по пути не имеется. Температура...

Огоньки» в основной период В основной период смены могут проводиться три вида «огоньков»: «огонек-анализ», тематический «огонек» и «конфликтный» огонек...

Studopedia.info - Студопедия - 2014-2025 год . (0.011 сек.) русская версия | украинская версия

Метод наименьших квадратов. Один из методов та­кой обработки — метод наименьших квадратов (МНК)

Метод наименьших квадратов. Один из методов такой обработки — метод наименьших квадратов (МНК)