Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Метод наименьших квадратов. Один из методов та­кой обработки — метод наименьших квадратов (МНК)





 

Один из методов та­кой обработки — метод наименьших квадратов (МНК). Этот метод позволяет найти не только косвенно измеряемые параметры аk, но и погрешно­сти , как если бы аk измерялись непосредственно. Кроме того, можно строго доказать, что МНК является «лучшим» методом обработки для зависимостей вида (1). Точнее, оценка по МНК оказывается несмещенной и обладает наименьшей дисперсией в классе линейных оценок. Ограничением на применимость МНК является линейность зависимости y от неизвестных коэффициентов аk, при атом зависимость от х может быть нелинейной. Тем не менее, даже при нелинейной зависимости y от аk, МНК применяется. В этом случае можно попытаться найти линеаризующее преобразование. Например, зависимость y = A ехр (bx + сх2) приводится к виду (1), если вместо y рассматривать величину Y = lnу = lnA + bx + сx2. Если же подходящее преобразование найти не удаётся, то задача сводится к нелинейной системе уравнений, которую в принципе можно решить. Од­нако существование и единственность решения не гарантированы заранее. Кроме того, теряют силу результаты линейного МНК об оценке погрешностей.

Рассмотрим сначала простой случай, когда величина у измеряется абсолютно точно, и каждое измерение дает одну точку на плоскости (x, y) принадлежащую кривой (1). Тогда достаточно проделать p измерений при различных значениях x. Подставляя результаты измерений в (1), получим систему линейных уравнений для аk, решая которую мы определим коэффициенты аk абсолютно точно.

Однако, в большинстве случаев измерения не точны, и точки плоскости (x, y), соответствующие отдельным измерениям, отклоняются от кривой (1) (см. рис. 8). Очевидно, что p измерений здесь будет недостаточно, поскольку через p различных точек на плоскости проходит только одна кривая вида (1), и ее коэффициенты будут отличаться от истинных. Ясно, что, увеличивая количество измерений n (n > p), мы можем получить более точные результаты.

Идея МНК принадлежит, вероятно, Гауссу и заключается в минимиза­ции суммы квадратов отклонений экспериментальных точек от предполагаемой кривой. Пусть при n различных аргументах х1, x2,..., хn измере­ния дали значения y1, у2,..., уn соответственно.

Рассмотрим функцию

  R(z1, z2,..., zp)= S wi (yi - S zk fk (xi))2, (2)

где wi > 0 — вес i- го измерения.

Веса необходимо использовать в том случае, когда заранее известно, что случайные отклонения ei = yi – f(xi) в среднем различны для разных xi. Такая ситуация возникает, когда объединяются измерения, выполненные приборами разного класса точности. Более точному измерению y, следует приписать больший вес, а именно: wi ~ 1/ei2. Знак ~ указывает, что конкретное значение веса произвольно, существенно лишь соотношение между весами. Действительно, одновре­менное умножение всех весов на любое число приведет к умножению функ­ции R на то же число, при этом положение минимума R не изменится. Поскольку отклонения ei, неизвестны, выбор весов wi не может зависеть от yi и должен быть сделан на основе априорной информации 0 точности измерений. При отсутствии априорной информации полагают все wi = 1.

Рис.8. Результат обработки экспериментальных данных ме­тодом МНК. Сплошная линия - точная зависимость f(х), кре­стики - экспериментальные точки, пунктирная линия — восстановленная зависимость f(х).

 

Положение минимума функции R определяет искомые коэффициенты зависимости (1). Обозначим через b1, b2,... bр значения переменных { zk }, при которых R минимальна.

В точке минимума выполняются условия:

¶ R/¶ zm (b1, b2,..., bP)=0,

m=1, 2,... p.

 

 

Дифференцируя (2), получаем для bk систему линейных уравнений:

  S Cmk bk = Fm, m=1, 2,..., p (3)

где

  Cm k = S wi fm(xi) fk (xi), Fm = S wi fm(xi) yi, m, k=1, 2,..., p (4)

Решение системы (3) всегда существует и единственно, поскольку ее детерминант отличен от нуля в силу линейной независимости fk(x). Если измерения точны, то ei = 0, bk = ak и Rmin = 0. В общем случае bk ¹ ak и можно сказать, что оценка bk = аk + Dk состоит из «плавной составляющей» ak и случайной ошибки Dk (сравните: yi = f(xi) + ei). Средние величины погрешностей Dk и ei неизвестны, но их также можно оценить через Rmin - остаточную сумму квадратов. Важно понять, что речь идет не о конкретных случайных отклонениях Dk и ei, а о средних, наиболее вероятных значениях этих ошибок (строго говоря - о дисперсиях отклонений), которые мы обозначим через Пк и ei. Можно показать, что в пределе n> > 1

  D2k=Rmin(C-1) kk /(n-p), k = 1, 2,..., p, (5)
  ei2 =Rmin/(n-p)щi, i = 1, 2,..., n, (6)

где (C-1)kk – диагональные элементы матрицы C-1, обратной к матрице Сmk , определенной в (4), и

  Rmin = R(b1, b2, …, bp )= S wi (yi- S bk fk(xi)) 2.  

Выражения (5-6) определяют 68% доверительные интервалы для аk и f(xi) соответственно. Умножением Dк и ei на коэффициент ta из таблицы 1.1 можно получить доверительные интервалы с вероятностью a:

 

Таблица 1.1.

a 0.500 0.680 0.900 0.950 0.990 0.999  
ta 0.67 1.00 1.64 1.96 2.56 3.39  
               
      ak= bk ± ta Dk, f(xi) = F(xi) ± ta Ei , (7)
                     

а для произвольного значения x имеем : f(x) = F(x) ± ta Ei (x), где

  F(x)= S bk fk(x), Ei2= Rmin / (n-p) SS (C-1)km fk(x) fm(x).  

Строго говоря, при малом числе измерений n надежность приведенных выше оценок уменьшается. В таких ситуациях вместо таблицы 1.1, отвечающей предельному гауссовскому распределению (n=8), следует пользоваться таблицами распределения Стьюдента, в которых коэффициенты ta зависят также от n (точнее, от n-p) и отличаются от приведенных в табл. 1.1 в большую сторону. Это значит, что формулы (5-7) дают при малых n заниженную погрешность. Однако уже при значениях n> 20 до 30 различие становится малым, поэтому в дальнейшем будем пользоваться табл. 1.1.

 

Пример

 

В табл. 1.2 даны “измерения” yi, полученные путем добавления к функции f(x)=2x-x2 отклонений ei, взятых из таблиц случайных чисел. При x< 1 выбраны средние отклонения ei»0.2, при x> 1 выбраны ei» 0.4, моделирующие измерения грубым прибором.

Таблица1.2

xi 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
yi 0.025 0.184 0.623 0.476 0.817 0.933 0.597 1.113 0.728 1.245
wi                    
xi 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
yi 0.019 1.245 0.647 1.881 0.742 0.048 0.418 0.734 -0.026 -0.312
wi                    

 

Требуется по этим данным определить параметры зависимости: y=a1 +a2x +a3x2. Поскольку a priori известно, что при x< 1 измерения в среднем вдвое точнее, припишем им веса wi=4 (см. табл.1.2).

Положим f0(x)=1, f1(x)=x, f2(x)=x2, p=3, n=20.

Выполним необходимые вычисления, получим:

, , ,

b1=0.069, b2=1.991, b3=-1.043,

D1=0.16, D2=0.43, D3=0.23, Rmin = 4.08,

E1 = … = E10 = 0.24, E11 = … = E20 = 0.48.

На рис. 8 представлены результаты. Видно, что первоначальная зависимость восстановлена практически точно, несмотря на значительные отклонения отдельных измерений и малое число экспериментальных точек. Отклонения найденных коэффициентов bk от их точных значений оказались существенно меньше, чем вычисленные погрешности Пk. Можно утверждать, что из имеющихся экспериментальных данных нельзя получить более точные оценки для ak, чем найденные выше методом МНК. Для уточнения коэффициентов необходимо провести более точные измерения (уменьшить ei), или увеличить количество измерений n. Заметим, что неизвестные заранее отклонения ei нам удалось оценить с погрешностью всего 20%.







Дата добавления: 2014-11-10; просмотров: 861. Нарушение авторских прав; Мы поможем в написании вашей работы!




Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...


Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...


Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...


Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Неисправности автосцепки, с которыми запрещается постановка вагонов в поезд. Причины саморасцепов ЗАПРЕЩАЕТСЯ: постановка в поезда и следование в них вагонов, у которых автосцепное устройство имеет хотя бы одну из следующих неисправностей: - трещину в корпусе автосцепки, излом деталей механизма...

Понятие метода в психологии. Классификация методов психологии и их характеристика Метод – это путь, способ познания, посредством которого познается предмет науки (С...

ЛЕКАРСТВЕННЫЕ ФОРМЫ ДЛЯ ИНЪЕКЦИЙ К лекарственным формам для инъекций относятся водные, спиртовые и масляные растворы, суспензии, эмульсии, ново­галеновые препараты, жидкие органопрепараты и жидкие экс­тракты, а также порошки и таблетки для имплантации...

Случайной величины Плотностью распределения вероятностей непрерывной случайной величины Х называют функцию f(x) – первую производную от функции распределения F(x): Понятие плотность распределения вероятностей случайной величины Х для дискретной величины неприменима...

Схема рефлекторной дуги условного слюноотделительного рефлекса При неоднократном сочетании действия предупреждающего сигнала и безусловного пищевого раздражителя формируются...

Уравнение волны. Уравнение плоской гармонической волны. Волновое уравнение. Уравнение сферической волны Уравнением упругой волны называют функцию , которая определяет смещение любой частицы среды с координатами относительно своего положения равновесия в произвольный момент времени t...

Studopedia.info - Студопедия - 2014-2025 год . (0.012 сек.) русская версия | украинская версия