Экспертная система
Экспертная система – программное обеспечение или просто программа, способная заменить специалиста-эксперта в решении проблемной ситуации.
Как правило, экспертная система содержит:
- базу знаний, ориентированную на какую-то определенную предметную область;
- решатель, обрабатывающий (анализирующий) входящие данные;
- подсистему, выдающую результаты анализа в приемлемой для восприятия человеком форме;
- подсистему ввода (или автоматического запоминания) новых знаний;
- развитый интерфейс взаимодействия с человеком.
База знаний
База знаний, (knowledge base) - это база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний.
База знаний, как правило, включает самую релевантную и свежую информацию, имеют совершенные системы поиска информации и тщательно продуманную структуру и формат знаний.
Информационно-поисковая система
Информационно-поисковая система - система, предназначенная для поиска информации в базе данных, где база данных, как правило, является специализированным индексным деревом, позволяющим осуществлять поиск информации по ключевым словам или специальным ключам за наименьшее время.
За функциональность поисковой системы отвечает специальное программное обеспечения, которое называют поисковым движком или поисковой машиной.
Основными критериями качества работы поисковой машины являются релевантность, полнота базы, учёт морфологии языка. Индексация информации осуществляется специальными поисковыми роботами.
Популярные поисковики
Интерфейс большинства наиболее популярных поисковых систем реализован в виде веб-сайта, который предоставляет возможность поиска информации в Интернете. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах. В последнее время появился новый тип поисковых движков, основанных на технологии RSS, а также среди XML-данных разного типа.
Специализированные поисковые системы
Несмотря на то, что IT-бизнесе услуги поиска информации являются одними из самых востребованных и перспективных, несмотря на то, что уже существует большое количество мощных, развитых поисковых систем, позволяющих находить практически любую информацию в Интернете, тем не менее, спрос на специализированные поисковые системы из года в год растет. Это вызвано растущими требованиями к качеству индексируемой информации, к качеству предоставляемых результатов поиска.
Спрос на специализированные поисковые системы очень высок в крупных коммерческих структурах, где развит документооборот, где эксплуатируются базы данных и файловые серверы, где уделяется большое внимание к конфиденциальности данных, где время на поиск нужной информации является критическим показателем, влияющим на бизнес в целом.
Оптимизационные задачи
Оптимизационные задачи - это широкий спектр различных методов поиска оптимального решения (поиска одного и более экстремума).
Оптимизация (поиск оптимума) применяется практически во всех областях где в принятии решения человек участвует опосредовано либо вообще не участвует. В большинстве экспертных (интеллектуальных) систем так или иначе присутствуют методы поиска (оценки) оптимального решения.
Мониторинг
Мониторинг бизнес-процессов - систематическое регулярное сопоставление действительного положения фирмы (организации, предприятия, производственного или бизнес процесса) с желаемым.
Мониторинг по смыслу и/или назначению тесно связан с системами получения обратной связи, а так же с системами контроля качества.
Как правило мониторинг применяется как автоматизированная или полностью автоматическая организованная система анализа показателей в наиболее важных узлах технологической (производственной) цепочке процессов.
Распределенная база данных
Распределенная база данных - это система баз данных, в которой сами данные территориально или как-либо еще рассредоточены, т.е. находится в нескольких абонентских системах информационной сети.
Как правило распределенная база данных создается как интеграция (как совокупность) группы баз данных, уже функционирующих в ряде систем. Такие базы данных называют гетерогенными из-за того, что в каждой конкретной абонентской системе уникальная организация хранения данных.
Сбор, подготовка и анализ данных
Data Mining – это процесс обнаружения в "сырых" данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Data Mining является одним из шагов Knowledge Discovery in Databases.
Data Mining развивается на стыке таких дисциплин, как статистика, теория информации, машинное обучение, теория баз данных. Большинство алгоритмов и методов Data Mining были разработаны на основе различных методов из перечисленных дисциплин. Большую популярность получили следующие методы Data Mining: нейронные сети, деревья решений, алгоритмы кластеризации, в том числе и масштабируемые, алгоритмы обнаружения ассоциативных связей между событиями и т. д.
Задачи, решаемые методами Data Mining:
- Классификация – это отнесение объектов (наблюдений, событий) к одному из заранее известных классов.
- Кластеризация – это группировка объектов (наблюдений, событий) на основе данных (свойств), описывающих сущность этих объектов. Объекты внутри кластера должны быть "похожими" друг на друга и отличаться от объектов, вошедших в другие кластеры. Чем больше похожи объекты внутри кластера и чем больше отличий между кластерами, тем точнее кластеризация.
- Регрессия, в том числе задачи прогнозирования. Установление функциональной зависимости выходных данных от входных.
- Ассоциация – выявление закономерностей между связанными событиями. Примером такой закономерности служит правило, указывающее, что из события X следует событие Y. Такие правила называются ассоциативными. Впервые эта задача была предложена для нахождения типичных шаблонов покупок, совершаемых в супермаркетах, поэтому иногда ее еще называют анализом рыночной корзины (market basket analysis).
- Последовательные шаблоны – установление закономерностей между связанными во времени событиями, т.е. обнаружение зависимости, что если произойдет событие X, то спустя заданное время произойдет событие Y.
- Анализ отклонений – выявление наиболее нехарактерных шаблонов.