Аннотация:
Векторное представление слов используется для различных задач автоматической обработки естественного языка. Множество методов существует для векторного представления слов, включая методы нейронных сетей Word2Vec и GloVe, а также классический метод латентно-семантического анализа LSA. Данная работа посвящена исследованию эффективности использования сетевых векторных методов LSTM для неклассической классификации в соответствии с тональностью текстов на русском и английском языках. Описаны характеристики векторных методов классификации слов (LSA, Word2Vec, GloVe), описана архитектура нейросетевого классификатора слов на основе LSTM и оценены методы векторной классификации слов, представлены результаты экспериментов, вычислительных средств и их обсуждение. Лучшей моделью векторного представления слов является модель Word2Vec, учитывая скорость обучения, меньший размер корпуса слов для обучения, большую точность и скорость обучения нейросетевого классификатора.