Задания к лабораторной работе. 1. Используя файл о кредитных историях, собранный в банке - loans.txt, построить классификатор на основе
1. Используя файл о кредитных историях, собранный в банке - loans.txt, построить классификатор на основе
а) логистической регрессии;
б) деревьев решений
в программе Deductor. Сравнить полученные модели и оценить их качество.
2. Построить модели классификации на данных, приведенных ниже в заданиях 5.1 и 5.2.
3. Сравнить результаты с классификацией на основе нейронной сети.
Задание 5.1. Главным управлением экономического развития области был проведен выборочный анализ финансового состояния хозяйствующих субъектов, в результате которого получены три группы промышленных предприятий: нормально функционирующие, нуждающиеся в финансовой поддержке и предприятия, которые находятся в состоянии банкротства. Выводы относительно конкретного предприятия делались на основе анализа коэффициента рентабельности (), коэффициента текущей ликвидности (), коэффициента обеспеченности собственными средствами () и коэффициента утраты (восстановления) платежеспособности ().
Таблица 5.4 - Результаты выборочного анализа финансового состояния хозяйствующих субъектов, действующих на територии области
Наименование предприятий
|
|
|
|
| - 1 -
| - 2 -
| - 3 -
| -4 -
| - 5 -
| Группа нормально функционирующих предприятий
| Г.П. «Медтехника»
| 8,09
| 1,30
| 0,23
| 1,13
| Завод «Гамма»
| 8,09
| 1,56
| 2,36
| 1,48
| ОАО «Искра»
| 23,17
| 17,76
| 0,85
| 17,46
| ОАО «Автозапчасти»
| 2,10
| 28,78
| 0,97
| 31,02
| ОАО «Видеофон»
| 4,48
| 1,18
| 0,15
| 1,04
| ЗАО «Гидрогаз»
| 7,32
| 1,28
| 0,23
| 1,19
| ЗАО «Агропродукт»
| 12,00
| 1,89
| 0,47
| 1,79
| ОАО «Машоборудование»
| 4,45
| 7,52
| 0,87
| 7,42
| Дорожные электромеханические мастерские
| 2,79
| 2,00
| 0,50
| 1,69
| ОАО «Преобразователь»
| 1.32
| 10,02
| 0,24
| 9,46
| Группа предприятий, нуждающихся в финансовой поддержке
| Завод «Радиоприбор»
| 0,52
| 0,95
| -0,033
| 0,97
| Производственно-коммерческая фирма «Флаттер»
| 2,84
| 0,98
| -0,02
| 0,81
| ОАО «Судоремонтный завод»
| -84,86
| 2,02
| 0,50
| 1,99
| ОАО «Автодор»
| 34,8
| 9,82
| -0,22
| 0,68
| - 1 -
| - 2 -
| - 3 -
| -4 -
| - 5 -
| ОАО «Рембыттехника»
| 8,42
| 1,09
| 0,08
| 0,96
| Группа предприятий, которые находятся в состоянии банкротства
| ОАО «Втормет»
| -2,13
| 0,73
| -0,36
| 0,59
| ОАО «Вэлт»
| -321,06
| 0,64
| -1,02
| 0,72
| ОАО «ЗПП»
| -48,53
| 0,97
| -0,03
| 0,96
| ОАО «Тяжэкс»
| -356,24
| 0,32
| -2,16
| 0,37
| ОАО «ЗСАК»
| -41,47
| 0,92
| -0,09
| 0,51
| | | | | | | Требуется, используя приведенные данные как обучающую выборку, построить модель классификации на основе одного из методов, рассмотренных выше, а затем установить принадлежность следующих предприятий к одному из трех классов, определив тем самым его финансовое состояние.
Таблица 5.5 - Показатели финансового состояния классифицируемых хозяйствующих субъектов
Наименование предприятий
|
|
|
|
| ЗАО «ЭПП-микрон»
| -5,17
| 2,97
| -0,36
| 3,15
| ОАО Молочный комбинат
| 27,8
| 19,11
| 2,6
| 16,48
| ООО Продовольственная компания
| 0,33
| 0,79
| -0,61
| 0,51
| ОАО «Фруктовые воды»
| -9,19
| -0,1
| 0,19
| 0,51
| Задание 5.2. При оценке эффективности деятельности предприятий легкой промышленности были получены два класса предприятия: с высокой и низкой производительностью труда. Кроме того, были выявлены факторы, определяющие соответствующий уровень производительности труда: 1) Доля рабочих, занятых вручную не при машинах и механизмах % (); 2) Процент текучести кадров (); 3) Коэффициент сменности по всем рабочим (); 4) Доля профильной продукции в общем объеме продукции (); 5) Электровооруженность, кВт (); В последней колонке приведено Модельное значение выработки, тыс.грн. (табл. 5.6). Опираясь на полученные результаты: 1) проанализируйте резервы роста производительности труда в группе худших предприятий; 2) проведите классификацию предприятий, представленных в табл. 5.7.
Таблица 5.6 - Классификация предприятий по уровню производительности труда
Пред-прия-тие
| Факторы
| Модельнзначение выработки, тыс.грн.
|
|
|
|
|
| Группа предприятий с высокой производительностью труда
|
| 34,1
|
| 1,47
| 93,4
| 21,3
| 69,75
|
| 33,7
|
| 1,29
| 91,7
| 32,2
| 63,89
|
| 23,6
|
| 1,17
| 95,3
| 27,8
| 60,64
|
| 29,6
|
| 1,47
| 95,3
| 22,6
| 81,62
|
| 25,3
|
| 1,44
| 96,3
| 21,9
| 81,02
|
| 17,9
|
| 1,52
| 91,1
| 27,8
| 62,53
|
| 29,3
|
| 1,62
| 94,5
| 23,5
| 83,55
| Группа предприятий с низкой производительностью труда
|
| 38,4
|
| 1,36
| 96,4
| 15,5
| 61,68
|
| 37,5
|
| 1,44
| 95,2
| 12,3
| 54,86
|
| 32,2
|
| 1,29
| 96,1
| 16,4
| 54,71
|
| 26,1
|
| 1,46
| 92,3
| 11,4
| 55,90
|
| 30,7
|
| 1,57
| 92,9
| 23,4
| 51,34
|
| 28,7
|
| 1,47
| 85,2
| 22,7
| 41,14
| Таблица 5.7 - Характеристики предприятий, подлежащих классификации
Предпри-ятие
| Факторы
|
|
|
|
|
|
| 31,5
|
| 1,76
| 92,7
| 18,4
|
| 31,2
|
| 1,37
| 94,6
| 17,9
|
| 19,7
|
| 1,52
| 96,2
| 27,1
|
| 28,7
|
| 1,56
| 92,2
| 27,8
|
Контрольные вопросы
1. Что такое задача классификации. Приведите примеры из экономики, где возникают задачи классификации.
3. Какие данные нужно иметь для построения модели классификации?
1. Как оценивают качество алгоритмов классификации?
2. В чем состоит задача кредитного скоринга?
4. Запишите математическую модель логистической регрессии. Какие задачи можно решать на основе этой модели?
5. Как кодируют категориальные переменные при решении задачи классификации?
6. Что такое дерево решений? Какие алгоритмы построения деревьев решений вы знаете?
7. На основании каких критериев выбирают переменную для ветвления при построении деревьев решений?
8. Объясните как строятся решающие правила.
9. Какие методы сокращения дерева решений и остановки построения дерева вы знаете?
10. Зачем строят дерево в интерактивном режиме?
Литература
1. Чубукова И.А. Data mining: учебное пособие – М.: Интернет-университет информационных технологий: БИНОМ: Лаборатория знаний, 2006. – 382 с. – ISBN 5-9556-0064-7.
2. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP, Data Mining. – СПб.: БХВ-Петербург, 2004. – 336с.
3. Ситник В.Ф. Інтелектуальний аналіз даних. К.: КНЕУ, 2007. –
4. А.А. Ежов, С.А. Шумский. Нейрокомпьютинг и его применения в экономике и бизнесе. –
5. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. – СПб.: БХВ-Петербург, 2007. – 384 с.
6. Паклин Н.Б., Орешков В.И. Бизнес-аналитика: от данных к знаниям: Учеб. пособие. 2-е изд., перераб. и доп. _ СПб.: Питер, 2010. – 704 с.
Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...
|
Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...
|
Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...
|
Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...
|
Краткая психологическая характеристика возрастных периодов.Первый критический период развития ребенка — период новорожденности Психоаналитики говорят, что это первая травма, которую переживает ребенок, и она настолько сильна, что вся последующая жизнь проходит под знаком этой травмы...
РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...
Решение Постоянные издержки (FC) не зависят от изменения объёма производства, существуют постоянно...
|
Функциональные обязанности медсестры отделения реанимации · Медсестра отделения реанимации обязана осуществлять лечебно-профилактический и гигиенический уход за пациентами...
Определение трудоемкости работ и затрат машинного времени На основании ведомости объемов работ по объекту и норм времени ГЭСН составляется ведомость подсчёта трудоёмкости, затрат машинного времени, потребности в конструкциях, изделиях и материалах (табл...
Гидравлический расчёт трубопроводов Пример 3.4. Вентиляционная труба d=0,1м (100 мм) имеет длину l=100 м. Определить давление, которое должен развивать вентилятор,
если расход воздуха, подаваемый по трубе, . Давление на выходе . Местных сопротивлений по пути не имеется. Температура...
|
|