Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Data Mining иText Mining





Средства интеллектуального анализа (DMg)

Предназначены для фундаментального аналитического исследования проблем в той или иной предметной области. Требования ко времени менее жесткие, чем в OLAP-средствах.

DMg наиболее сложная, интеллектуально насыщенная часть ИАС, поэтому входят в состав наиболее развитых ИАС.

Причины популярности Data Mining

Стремительное накопление данных

Всеобщая компьютеризация бизнес процессов

Рост научных данных (Tbytes/день)

Интернет и WEB

Технологический прогресс: стремительный рост производительности компьютеров, объемов накопителей, совершенствование СУБД, Хранилищ данных

Задачи:

выявление взаимозависимостей, причинноследственных связей, ассоциаций и аналогий;

определение значений факторов времени, локализация событий или явлений по месту;

классификация событий и ситуаций, определение профилей различных факторов;

прогнозирование хода процессов, событий.

При решении сложных аналитических задач используются мощные специальные программные средства, инструменты

Data Mining

Разработаны для поиска и выявления в данных скрытых связей и взаимозависимостей с целью предоставления их руководителю в процессе принятия решений

Методы:

Статистические методы корреляции

Оптимизации

Позволяющие находить зависимости и синтезировать обобщающую информацию

Возможности Data Mining

Поиск зависимых данных

Выявление устойчивых бизнес-групп

Ранжирование важности измерений при классификации объектов для проведения анализа

Прогнозирование бизнес-показателей

Оценка влияния принимаемых решений на достижение успеха предприятия

Поиск аномалий

От данных к решениям

Области применения Data Mining

Области применения Data Mining

Автономные программные системы

Специализированные системы

PolyAnalyst (российская фирма Megaputer)

SAS (фирма SAS Institute Inc., США)

Модуль Miner в составе пакета OLAP -анализа Business Objects

Система PolyAnalyst

Одна из самых мощных Data Mining систем, разработанных для Intel платформ

Сочетание высокой производительности и богатой функциональности с относительно низкой по сравнению с аналогичными системами стоимостью

PolyAnalyst

извлечение знаний в больших массивах данных;

автоматическое построение и тестирование формул, описывающих функциональные зависимости;

составление классификационных правил по заданным примерам;

формирование многомерных кластеров;

алгоритмы решений.

Удобный пользовательский интерфейс

PolyAnalyst

PolyAnalyst Lite, PolyAnalyst Power – программные модули для индивидуальных пользователей и малого бизнеса;

PolyAnalyst Professional для MS Windows NT — мощная система интеллектуального анализа для профессионалов;

PolyAnalyst Knowledge server — клиент-серверная версия предназначена для работы на высокопроизводительных платформах, обеспечивает доступ к SQL-СУБД (Оrасlе, DВ-2, Informix, MS SQL-Server и др.) и к ОLАР-системам.

Архитектура СОМ

Открытый программный интерфейс для создания собственных приложений Data Mining

Доступность из самых разных систем программирования:

Visual Basic for Applications

Visual C++

Автоматизация обработки данных

Поддержка OLE DB DM

Открытый программный интерфейс для работы с большими объемами данных

Возможность анализа больших объемов данных непосредственно на сервере базы данных

Доступ к данным

Текстовые файлы

Файлы Microsoft Excel

Объекты баз данных (таблицы, выражения SQL) через ODBC

Проекты SAS

Business View из IBM Visual Warehouse

Многомерные кубы Oracle Express

Платформы

Microsoft Windows NT/2000

Microsoft Windows 95/98

Архитектура client/server

SAS

SAS/ETS - реализует методы анализа временных рядов, экономического системного моделирования и прогнозирования, финансового анализа и формирования отчетов. Производит восстановление пропущенных значений методом интерполяции, изменение временной привязки временного ряда, выделение сезонного компонента во временны рядах, построение трендов;

SAS/STA - модуль использует статистические методы регрессионного, дисперсионного анализа, нелинейного моделирования, анализа категориальных данных, многомерного, в т. ч. факторного анализа, кластерного и непараметрического анализа;

SAS

SAS/INSIGHT - модуль представляет собой динамическое средство для исследования и анализа данных, использует методы статистического исследования одномерных и многомерных данных;

SAS/IML - модуль, реализующий поддержку интерактивного матричного языка программирования, оперирующего с матрицами данных, которые могут быть числовыми и символьными;

SAS/OR - модуль, представляющий собой инструмент моделирования анализа, решения задач исследования операций, управления проектами

Задачи Text Mining

Аннотировать документы

Осуществлять навигацию в больших базах текстов;

Осуществлять поиск информации на естественном языке

Автоматически распределять документы по заранее определенным рубрикам

Структурировать большие неструктурированные хранилища документов

Находить взаимосвязи между ключевыми понятиями текстов

Распознавать в текстах, формализовывать факты и утверждения заданного вида и заполнять ими базу знаний

Интеллектуализировать поиск в Интернет/Интранет

Продукты TextAnalyst

Локальный TextAnalyst 2.0

TextAnalyst COM – средство разработки приложений Text Mining

TextAnalyst для MS IE

Поддержка русского и английского языков







Дата добавления: 2015-03-11; просмотров: 579. Нарушение авторских прав; Мы поможем в написании вашей работы!




Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...


Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...


Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...


Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Тема 2: Анатомо-топографическое строение полостей зубов верхней и нижней челюстей. Полость зуба — это сложная система разветвлений, имеющая разнообразную конфигурацию...

Виды и жанры театрализованных представлений   Проживание бронируется и оплачивается слушателями самостоятельно...

Что происходит при встрече с близнецовым пламенем   Если встреча с родственной душой может произойти достаточно спокойно – то встреча с близнецовым пламенем всегда подобна вспышке...

Принципы резекции желудка по типу Бильрот 1, Бильрот 2; операция Гофмейстера-Финстерера. Гастрэктомия Резекция желудка – удаление части желудка: а) дистальная – удаляют 2/3 желудка б) проксимальная – удаляют 95% желудка. Показания...

Ваготомия. Дренирующие операции Ваготомия – денервация зон желудка, секретирующих соляную кислоту, путем пересечения блуждающих нервов или их ветвей...

Билиодигестивные анастомозы Показания для наложения билиодигестивных анастомозов: 1. нарушения проходимости терминального отдела холедоха при доброкачественной патологии (стенозы и стриктуры холедоха) 2. опухоли большого дуоденального сосочка...

Studopedia.info - Студопедия - 2014-2025 год . (0.013 сек.) русская версия | украинская версия