Аннотация:
Рассматривается задача целенаправленного обнаружения и заполнения лакун в лингвистических типологиях, выступающих как формы представления знаний. Процесс решения этой задачи включает несколько многократно повторяемых стадий, которые в совокупности образуют одну итерацию решения задачи целенаправленного извлечения знаний из параллельных текстов для заполнения лакун. Параллельные тексты как информационный ресурс трансформируются в процессе решения этой задачи. Цель статьи состоит в описании видов информационных трансформаций параллельных текстов, используемых в начале процесса извлечения знаний и заполнения лакун в лингвистических типологиях, а именно: фрагментации текстов на объекты интерпретации и поиска тех из них, которые и являются потенциальными источниками знания для заполнения лакун. В статье процесс фрагментации позиционируется как один из видов информационных трансформаций параллельных текстов.
Ключевые слова:
обнаружение лакун, заполнение лакун, лингвистические типологии, извлечение знаний из параллельных текстов, корпусная лингвистика, объекты интерпретации.