Метод головних компонент

Цей метод призначений для оцінювання моделей великого розміру, а також для оцінки параметрів моделі, якщо до неї входять мультиколінеарні змінні.

Існують різні модифікації методу головних компонентів, які різняться між собою залежно від того, що береться за основу при визначенні ортогональних змінних — коваріаційна чи кореляційна матриця незалежних змінних.

Нехай маємо матрицю Х, яка описує незалежні змінні моделі. Оскільки спостереження, що утворюють матрицю Х, як правило, корельовані між собою, то можна поставити питання про кількість реально незалежних змінних, які входять до цієї матриці.

Точніше, ідея методу полягає в тому, щоб перетворити множину змінних Х на нову множину попарно некорельованих змінних, серед яких перша відповідає максимально можливій дисперсії, а друга — максимально можливій дисперсії в підпросторі, який є ортогональним до першого, і т.д.

Нехай нова змінна запишеться:

У матричній формі

(3.15)

де — вектор значень нової змінної; — m -вимірний власний вектор матриці .

Суму квадратів елементів вектора подамо у вигляді:

(3.16)

Звідси необхідно вибрати такий вектор , який максимізуватиме , але на вектор треба накласти обмеження, щоб він не став дуже великим. Тому ми його нормуємо, наклавши обмеження:

(3.17)

Оскільки Z ₁ = Xa ₁, то максимізація a ₁ буде максимізувати Z ₁, а Z ₁ характеризує вклад змінної Z ₁ в загальну дисперсію.

Задача тепер полягає в тому, щоб максимізувати за умов (3.18). Побудуємо функцію Лагранжа:

де — множник Лагранжа.

Узявши , дістанемо

. (3.19)

Звідси бачимо, що — власний вектор матриці , який відповідає характеристичному числу .

Підставивши значення (6.18) у (6.16), дістанемо:

(3.20)

Отже, потрібно для значення вибрати найбільший характеристичний корінь матриці . За відсутності мультиколінеарності матриця буде додатно визначеною і, відповідно, її характеристичні корені будуть додатними. Першим головним компонентом матриці X буде вектор Z ₁.

Визначимо тепер . При цьому вектор має максимізувати вираз за таких умов:

1) ;

2)

Друга умова забезпечить відсутність кореляції між і , бо коваріація між і подається у вигляді , причому вона дорівнює нулю лише тоді, коли .

Для розв’язування цієї задачі функцію Лагранжa запишемо у вигляді

де і — множники Лагранжa.

Узявши і , дістанемо де для значення треба вибрати другий за величиною характеристичний корінь матриці .

Цей процес триває доти, доки всі m характеристичних значень матриці не будуть знайдені; знайдені m власних векторів матриці об’єднаємо в ортогональну матрицю:

.

Отже, головні компoненти матриці X задаються матрицею

(3.21)

розміром n ´ m.

. (3.22)

Вираз (3.22) означає, що головні компоненти дійсно попарно некорельовані, а їх дисперсії визначаються так:

(3.23)

Співвідношення характеризують пропорційний внесок кожного з векторів у загальну варіацію змінних X, причому оскільки ці компоненти ортогональні, сума всіх внесків дорівнює одиниці.

Зауважимо, що вектори вихідних даних (матриця X) повинні мати однакові одиниці вимірювання, бо в противному разі дуже важко дати змістовне тлумачення поняттю загальної варіації змінних X і розкладанню цієї варіації на складові, виконаному відповідно до внеску кожного з векторів, якими подаються головні компоненти.

Іноді буває важко надати конкретного змісту знайденим головним компонентам. Для цього можна обчислити коефіцієнти кореляції кожного компонента з різними змінними X. Так, наприклад, візьмемо перший головний компонент Z ₁ і знайдемо коефіцієнти його кореляції її з усіма змінними X. Для цього потрібно обчислити перехресні добутки між головним компонентом Z ₁ і кожною з пояснювальних змінних X. Оскільки

маємо коефіцієнти кореляції для першого компонента:

(3.24)

У загальному випадку коефіцієнт кореляції між і

(3.25)

Частка різних головних компонентів в варіації визначається показником , а оскільки компоненти не корелюють один з одним, то сума їх часток дорівнює одиниці.

Визначивши всі головні компоненти і відкинувши ті з них, які відповідають невеликим значенням характеристичних коренів, знаходимо зв’язок залежної змінної Y з основними головними компонентами, а далі з допомогою оберненого перетворення повертаємося від параметрів моделі з головними компонентами до знаходження оцінок параметрів змінних X.

Алгoритм головних компонентів

Крок 1. Нормалізація всіх пояснювальних змінних:

Крок 2. Обчислення кореляційної матриці

Крок 3. Знаходження характеристичних чисел матриці r з рівняння

де E — одинична матриця розміром m ´ m.

Крок 4. Власні значення упорядковуються за абсолютним рівнем вкладу кожного головного компонента до загальної дисперсії.

Крок 5. Обчислення власних векторів розв’язуванням системи рівнянь

за таких умов:

Крок 6. Знаходження головних компонентів — векторів

Головні компоненти мають задовольняти умови:

;

Крок 7. Визначення параметрів моделі :

Крок 8. Знаходження параметрів моделі :

<== предыдущая лекция	\|	следующая лекция ==>
	\|	Введение. Классификация стилей с точки зрения различных подходов.

Дата добавления: 2015-08-12; просмотров: 1395. Нарушение авторских прав; Мы поможем в написании вашей работы!

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при которых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Краткая психологическая характеристика возрастных периодов.Первый критический период развития ребенка — период новорожденности Психоаналитики говорят, что это первая травма, которую переживает ребенок, и она настолько сильна, что вся последующая жизнь проходит под знаком этой травмы...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Основные разделы работы участкового врача-педиатра Ведущей фигурой в организации внебольничной помощи детям является участковый врач-педиатр детской городской поликлиники...

Ученые, внесшие большой вклад в развитие науки биологии Краткая история развития биологии. Чарльз Дарвин (1809 -1882)- основной труд « О происхождении видов путем естественного отбора или Сохранение благоприятствующих пород в борьбе за жизнь»...

Этапы трансляции и их характеристика Трансляция (от лат. translatio — перевод) — процесс синтеза белка из аминокислот на матрице информационной (матричной) РНК (иРНК...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия