Аннотация:
Рассматривается проблемно-ориентированная модель извлечения языкового знания из параллельных текстов как ключевой теоретический компонент концепции лексикографической информационной системы (ЛГИС), обеспечивающей интеграцию электронных двуязычных словарей и параллельных корпусов. Предлагаемый подход к решению проблемы интеграции учитывает появление новых значений слов и устойчивых словосочетаний, которое обусловлено приобретением нового знания экспертами, фиксирующими эти значения, в результате семантического анализа регулярно пополняемых корпусных текстовых данных. Предлагаемая модель описывает взаимодействие компьютерных и экспертных процессов, в том числе поиск фрагментов параллельных текстов как потенциальных источников нового языкового знания, его извлечение экспертами из текстов и представление в ЛГИС. Основанием для построения проблемно-ориентированной модели служит спиральная модель генерации знания, которую в 1991 г. предложил Икуджиро Нонака. Цель статьи состоит в описании стадий построения модели извлечения языкового знания, используемой при проектировании ЛГИС.