Аннотация:
Мы представляем новую языконезависимую архитектуру робастных векторов слов (robust word vectors, RoVe). Её задача – решить проблему опечаток и орфографических ошибок, которыми изобилует практически любой порождённый пользователями контент и которые при этом осложняют автоматическую обработку текстов. Наша модель мотивирована морфологически, что позволяет ей обрабатывать ранее не виденные формы слов в морфологически богатых языках. Мы представляем результаты для нескольких задач обработки естественных языков на нескольких языках для нескольких родственных нейросетевых архитектур, показывая, что предлагаемая архитектура устойчива к опечаткам. Библ. – 38 назв.
Ключевые слова:векторы слов, распределённые представления, обработка естественных языков.