Та понижування розмірності
Доцільність і ефективність конкретного методу класифікації та зменшення розмірності обумовлюється математичною моделлю, тобто математичною постановкою задач. Визначальним у виборі математичної постановки задачі є характер початкової інформації, що складається з двох частин: а) апріорних відомостей знань про досліджувані класи; б) вибіркової статистичної інформації навчальних вибірок. Математична модель, яка лежить в основі побудови того чи іншого методу зниження розмірності включає переважно в себе три основних компоненти: · Форму задання початкової інформації. Тут треба відповісти на питання: а) в якому виді задано основну інформацію про об’єкт; б) чи є серед початкових статистичних даних навчальна інформація, тобто які-небудь відомості про аналізовану результуючу властивість; в) якщо навчальна інформація присутня в початкових статистичних даних, то в якій саме формі вона представлена. · Тип оптимізаційного критерію інформативності шуканого набору ознак . Критерій інформативності може бути орієнтований на досягнення різних цілей. Можна виділити цілий клас критеріїв автоінформативності, оптимізація яких приводить до набору допоміжних змінних , що в свою чергу дозволяє майже точно відтворити інформацію, що міститься в описовому масиві статистичних даних. Якщо описова інформація представлена матрицею “об’єкт-властивість” то мова йде про максимально точне відтворення початкових значень змінних на основі значно меншого числа допоміжних змінних . Критерій орієнтований на пошук економних наборів допоміжних змінних , що забезпечують максимально точне відтворення інформації, що відноситься до результуючої ознаки. · Клас допустимих перетворень початкових ознак. Допоміжні ознаки при представленні початкової описової інформації матрицею “об’єкт-властивість” будується у вигляду функцій від , тобто . Для забезпечення змістовності і конструктивної реалізованості розв’язку оптимізаційної задачі необхідно визначити обмеження в класі допустимих розв’язків , в рамках якого ця оптимізаційна задача буде розв’язуватись. Від вибору суттєво залежить і отримуваний розв’язок даної оптимізаційної задачі.
ЛАБОРАТОРНА РОБОТА № 1.1.
Формування таблиць “об’єкт – властивість”
Мета роботи. Використовуючи апріорну інформацію про соціально-демографічні, соціально-економічні явища, процеси та ситуації вибрати об’єкти дослідження (не більше 20), які необхідно описати сукупністю їх характеристичних ознак, наприклад, сім’я: дохід, кількість осіб, кількість працездатних, і т.д.; академічна група: склад, успішність, зайнятість, тощо.
|