RUS  ENG
Полная версия
ЖУРНАЛЫ // Программные системы: теория и приложения // Архив

Программные системы: теория и приложения, 2026, том 17, выпуск 1, страницы 57–84 (Mi ps496)

Искусственный интеллект и машинное обучение

Сравнительный анализ состязательных методов для нетематической классификации текстов

М. Н. Лепехинa, С. А. Шаровb

a Московский физико-технический институт, Москва, Россия
b Университет Лидса, Лидс, Великобритания

Аннотация: Нетематическая классификация текстов широко используется в современных приложениях. Одной из проблем, возникающих при решении этой задачи, является наличие смещений в распределении в тренировочных текстовых корпусах. Наиболее существенным видом смещений являются тематические смещения. Для решения этой проблемы в данной работе применяются состязательные методы - Adversarial Domain Adaptation, Energy-based ADA, BERT с контрастной функцией потерь и ADA с контрастной функцией потерь.
В работе впервые производится модификация контрастной функции потерь для снижения влияния тематических сдвигов и показывается, что использование состязательных методов повышает точность и надежность классификаторов для задачи определения пола автора текста. Также проводятся эксперименты с LLaMA-3B и показано, что большие языковые модели достигают в режиме few-shot более низкую точность чем дообученные модели с меньшим числом параметров, и требуют больше времени для предсказания.

Ключевые слова и фразы: состязательные методы, контрастная функция потерь, классификация гендера, классификация текстов, нетематическая классификация, bert, доменная адаптация.

УДК: 004.89: 004.93
ББК: 32.813.5

MSC: Primary 68T50; Secondary 68T07, 68T20

Поступила в редакцию: 11.12.2025
Подписана в печать : 12.02.2026

DOI: 10.25209/2079-3316-2026-17-1-57-84



© МИАН, 2026