Аннотация:
Рассматривается вопрос связанности естественно-языковых текстов по текстуальным признакам (фрагментам). Выявлены два типа связанности: явная связанность, когда тексты связаны библиографическими ссылками, и неявная связанность, когда тексты связаны между собой через общие текстовые фрагменты. Обсуждаются преимущества и области применения неявной связанности. Показано, что использование неявной связанности значительно повышает область применения основанных на связанности методов обработки текстов. Предложены меры явной и неявной связанности. Проведен эксперимент с корпусом текстов по предметной области «компьютерная графика». На основе эксперимента показано, что оба типа связанности коррелированны между собой. Найдены параметры обработки текстов, когда корреляция максимальна и достигает примерно 55%. Приводятся планы по дальнейшему развитию предложенного метода сравнения и уточнению полученных результатов.