Типові задачі практики
Задача 1. Виявлення типології споживчої поведінки населення. Аналіз суті диференціальної поведінки, прогнозування структури споживання. В цьому випадку логічна схема досліджень полягає в наступному. Багатомірна статистика розглядає досліджувану сукупність багатомірних об’єктів, як сукупність точок чи векторів у просторі тих ознак, якими вони є описані. Стосовно схеми споживання такою множиною є множина сімей. Кожна сім’я з однієї сторони характеризується деяким набором ознак Весь комплекс соціально-демографічних та інших факторів, що суттєво впливають на структуру споживання називаються типоутворюючими. Вони мають визначальне значення, в той час як усі інші, дають лише випадкову варіацію поведінки споживання в межах однієї групи. До ознак поведінки
Отже в задачі маємо числові характеристики та градації типоутворюючих факторів і одночасно ознак поведінки кожної сім’ї в аналізованій сукупності. В цьому випадку логічна схема дослідження ділиться на такі етапи. Етап 1. Збір і первинна обробка вхідних даних. Об’єкти (сім’ї) виступають як точки в двох багатомірних просторах ознак: змінні Етап 2. Виявлення основних типів споживання з допомогою розбиття досліджуваної множини точок-сімей на класи в просторі поведінки Етап 3. Відбір найбільш інформативних типоутворюючих ознак і вибір метрики в просторі цих ознак. Найбільш інформативними вважаються такі фактори-детермінанти чи ті їх набори, різниця в законах розподілу яких виявляється найбільшою при переході від одного класу поведінки споживання до іншого. Далі проводять розбиття досліджуваної сукупності сімей на класи, використовуючи лише найбільш інформативні ознаки-детермінанти. При цьому результат залежатиме не лише від складу групи цих ознак, але й від способу обчислення відстані між двома точками в цьому просторі, зокрема і від того, з якими вагами враховуються при обчисленні відстані відібрані типоутворюючі ознаки. Ваги вибирають так, щоб результат розбиття сімей на класи в просторі найбільш інформативних ознак, найменше відрізнявся від розбиття тих же сімей в просторі поведінки, тобто добиваються найбільшої зв’язаності в результатах класифікації. Етап 4. Аналіз динаміки структури досліджуваної сукупності об’єктів в просторі найбільш інформативних типоутворюючих ознак. Кінцевою метою цього етапу є прогнозування поступових перетворень класифікаційної структури сукупності споживачів, які мають відбутися чи відбуваються з плином часу. Етап 5. Прогнозування структури споживання. На цьому етапі використовується результат попереднього етапу, виходячи з заданою класифікаційною структурою споживачів для того періоду часу в майбутньому, який нас цікавить.
ЗАДАЧА 2. Класифікація як необхідний попередній етап статистичної обробки багатомірних даних. Варіант а. Нехай вивчається залежність міграції населення Варіант б. Для розробки обґрунтованих нормативів для підприємств деякої галузі здійснюють їх класифікацію по
ЗАДАЧА 3. Класифікація в задачах планування вибіркових обстежень. Наприклад, треба відібрати міста, райони, школи для проведення обстежень, досліджень чи перевірок. Як правило, виходячи з кінцевих цілей класифікації розбиття багатомірних даних на одномірні групи часом дуже складно відокремити від задач зменшення розмірності досліджуваних даних. Серед основних видів виділяють такі типові задачі зменшення розмірності ознакового простору. 1. Відбір найбільш інформативних показників. Тут з початкової апріорної множини ознак 2. Стиск масивів оброблюваної та збережуваної інформації. Тут використовуються методи, які дозволяють замінити початкову систему показників 3. Візуалізація даних. Графічне та аналітичне представлення даних.
|