Д. О. Иванов, Ю. Г. Савинов, “Дообучение нейронных сетей: методы и эксперименты”, Ученые записки УлГУ. Серия "Математика и информационные технологии", 2025, выпуск 1,страницы 31

Дообучение нейронных сетей: методы и эксперименты

Д. О. Иванов, Ю. Г. Савинов

Ульяновский государственный университет, Россия

Аннотация: В статье рассматриваются современные подходы к дообучению (transfer learning, fine-tuning) нейронных сетей для повышения качества при небольшом объёме данных. Приведены теоретические основы дообучения, в том числе методы регуляризации (dropout, L2), адаптация скорости обучения и параметрически эффективное дообучение (LoRA). Проведён эксперимент на задаче классификации тональности отзывов о ресторанах (на основе русскоязычных данных Яндекса) с использованием методов Zero-Shot, Feature Extraction, Fine- Tuning и LoRA. Представлены примеры кода и результаты (табличные и графические) сравнения точности моделей. Анализ результатов показывает, что метод LoRA обеспечивает наивысшую точность при существенно меньшей вычислительной нагрузке, в то время как Zero-Shot уступает другим методам. Приведены рекомендации по выбору методов дообучения для задач на малых данных.

Ключевые слова: дообучение нейронных сетей; transfer learning; fine-tuning; регуляризация; dropout; L2-регуляризация; адаптивная скорость обучения; LoRA; Zero-Shot; Feature Extraction

УДК: 004.032.2

Поступила в редакцию: 16.06.2025