Студопедия — Суть задач класифікації та понижування розмірності
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Суть задач класифікації та понижування розмірності






Необхідність аналізу і формалізації задач пов’язаних з порівнянням і класифікацією об’єктів усвідомлювали вчені минулого. Вважають, що найбільшим вкладом Аристотеля в науку була ідея класифікації, основана на подібності і відмінності.

Прикладами класифікації є ієрархічна класифікація рослин і видів Адамсона, періодична система елементів Мендєлєєва. Хоча ці автори не володіли сучасним математичним апаратом багатомірного статистичного аналізу, проте основні ідеї і методологічні принципи цього апарату явно або неявно пронизують логіку їх конструкцій.

Виділяють 4 генеральні ідеї багатомірного статистичного аналізу на яких базуються всі основні розділи і підходи математичного апарату класифікації та зменшення розмірності.

 

Ефект суттєвої багатомірності є принципом, суть якого полягає в тому, що висновки, які отримують в результаті аналізу і класифікації множини статистично досліджуваних (за низкою властивостей) об’єктів, повинні опиратися одночасно на сукупність цих взаємозв’язаних властивостей з обов’язковим врахуванням структури і характеру їх зв’язків.

Наприклад: Спроба розрізнити 2 типи споживчої поведінки сімей з допомогою критеріїв Стьюдента спочатку за 1 ознакою (питомі витрати на харчування) а потім за 2 (питомі витрати на товари і послуги) не дала результату, в той час, як багатомірний апарат цього критерію оснований на відстані Махаланобіса, який одночасно враховує значення обох згаданих ознак і характер статистичного зв’язку між ними дає правильний результат – виявляє статистично значущу відмінність між двома аналізованими сукупностями сімей.

 

Можливість лаконічно пояснити природу багатомірних структур, які аналізуються. Суть цього принципу полягає в наступному. Визначимо поняття багатомірної структури. Нехай – множина статистично досліджуваних об’єктів. Результати досліджень можуть бути представлені у двох формах. Найбільш поширеною формою є таблиці (матриці) “об’єкт – властивість”, в якій кожен об’єкт є представлений вектором значень , врахованих ознак (властивостей) , зареєстрованих при аналізі і -го об’єкта. Другою формою є матриці (таблиці) – “попарних порівнянь” наступного виду

,

де елементи - є результатом співставлення об’єктів і в сенсі деякого заданого відношення. Величина може виступати в якості міри подібності або відмінності об’єктів; міри зв’язку або взаємозв’язку між об’єктами в будь-якому процесі; геометричну відстань між двома конкретними об’єктами, відношення надання переваги, наприклад: , якщо і , якщо , тощо. Під лаконічним поясненням природи розуміють апріорне припущення того, що існує порівняно невелике число визначальних факторів, з допомогою яких можна досить точно описати, не лише спостережувані характеристики досліджуваних об’єктів (всі елементи та елементи в матрицях попарних порівнянь) і характер зв’язків між ними, але також і шукану класифікацію самих об’єктів.

 

Максимальне використання навчання при налаштовуванні математичних моделей класифікації та зменшення їх розрядності. Пояснюють цей принцип з допомогою схеми “на вході задачі – на виході задачі”

 

Об’єкт На “вході” задачі класифікації та зменшення розмірності На “виході” задачі класифікації На “виході” задачі зменшення розмірності
      або   Номер класу, до якого віднесено об’єкт , або перелік статистично представлених у формі 1 або 2 об’єктів, які входять в той самий клас, що й об’єкт Значення шуканих, визначальних (типоутворюючих) факторів, які характеризують об’єкт

 

Якщо дослідник володіє і “входами” і “виходами” задачі, то початкову інформацію називають навчальною і метою дослідження є опис процедур, з допомогою яких при поступленні лише вхідних даних стосовно нового об’єкта, його можна було б з найбільшою (в певному сенсі) точністю віднести до одного з класів (в задачі класифікації) або поділити його значеннями визначальних факторів (в задачі зменшення розмірності). До таких ситуацій відносять задачі медичної діагностики: “входи” – результати обстежень, “виходи” – діагнози.

Метою діагнозу є використання “навчання” для вибору з множини результатів невеликого числа найбільш інформативних показників і побудови на їх основі формального діагностуючого правила.

 

Оптимізаційне формулювання задач класифікації та зменшення розмірності. Суть цього принципу полягає в тому, щоб серед множини можливих методів, які реалізують поставлену мету статистичної обробки даних – розбиття сукупності статистично досліджуваних об’єктів на однорідні класи, перехід від заданого широкого набору ознак до невеликого числа визначальних факторів – вміти знайти найкращий метод з допомогою оптимізації деякого заданого критерію (функціоналу) якості методу. Вибір конкретного виду цього критерію базується або на апріорному знанні імовірнісної або геометричної природи опрацьовуваних даних, або на міркуваннях змістовного типу (медичного, технічного,...).

 







Дата добавления: 2014-11-10; просмотров: 960. Нарушение авторских прав; Мы поможем в написании вашей работы!



Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Сущность, виды и функции маркетинга персонала Перснал-маркетинг является новым понятием. В мировой практике маркетинга и управления персоналом он выделился в отдельное направление лишь в начале 90-х гг.XX века...

Разработка товарной и ценовой стратегии фирмы на российском рынке хлебопродуктов В начале 1994 г. английская фирма МОНО совместно с бельгийской ПЮРАТОС приняла решение о начале совместного проекта на российском рынке. Эти фирмы ведут деятельность в сопредельных сферах производства хлебопродуктов. МОНО – крупнейший в Великобритании...

ОПРЕДЕЛЕНИЕ ЦЕНТРА ТЯЖЕСТИ ПЛОСКОЙ ФИГУРЫ Сила, с которой тело притягивается к Земле, называется силой тяжести...

Типовые примеры и методы их решения. Пример 2.5.1. На вклад начисляются сложные проценты: а) ежегодно; б) ежеквартально; в) ежемесячно Пример 2.5.1. На вклад начисляются сложные проценты: а) ежегодно; б) ежеквартально; в) ежемесячно. Какова должна быть годовая номинальная процентная ставка...

Выработка навыка зеркального письма (динамический стереотип) Цель работы: Проследить особенности образования любого навыка (динамического стереотипа) на примере выработки навыка зеркального письма...

Словарная работа в детском саду Словарная работа в детском саду — это планомерное расширение активного словаря детей за счет незнакомых или трудных слов, которое идет одновременно с ознакомлением с окружающей действительностью, воспитанием правильного отношения к окружающему...

Studopedia.info - Студопедия - 2014-2024 год . (0.012 сек.) русская версия | украинская версия