Аннотация:
Сопоставляются два подхода к целенаправленному извлечению нового знания из текстовых данных. Первый подход относится к предметной области лексикографии и ориентирован на извлечение новых значений слов из текстов в интересах пополнения словарных статей двуязычных словарей. Второй подход относится к медицинской науке и ориентирован на извлечение новых значений терминов в интересах актуализации терминологического портрета болезни, включающего дефиниции терминов с отражением их динамики во времени, отношения между терминами, контексты их использования и ссылки на источники контекстов. Эти подходы сравниваются по следующим позициям: проблема, для решения которой извлекается новое знание, цель его извлечения, источник концептов нового знания, эталон, сравнение с которым используется как критерий новизны, связь концепта с его источником и динамика концептов. Цель статьи состоит в описании результатов сопоставительного анализа обоих подходов. Результаты анализа предлагается позиционировать как исходные данные для создания концепции системы искусственно-естественного интеллекта (ИЕИ-системы) для целенаправленного извлечения нового знания из данных большого объема, применимой в разных предметных областях.
Ключевые слова:генерация нового знания, извлечение знания из текстов, искусственный интеллект, система искусственно-естественного интеллекта.