RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2025, том 527, страницы 311–319 (Mi danma689)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Решение дифференциальных уравнений с помощью языковых моделей из коробки: потенциал небольших LLM в математике

С. Н. Кольцов, В. В. Игнатенко, А. Ю. Сурков, В. О. Захаров

Национальный исследовательский университет «Высшая школа экономики» (Санкт-Петербургский филиал), Санкт-Петербург, Россия

Аннотация: В данной работе рассматривается способность малых рассуждающих языковых моделей к построению аналитических решений дифференциальных уравнений. Компьютерные эксперименты проводятся на таких моделях, как DeepSeek-R1-Distill-Qwen-1.5B, Qwen2.5-1.5B и Open-Reasoner-Zero-1.5B. Для извлечения финального ответа из рассуждений моделей используется постобработка на основе двух языковых моделей – Qwen2.5.latest и llama3.2.latest. Затем извлеченные ответы сравниваются с эталонными решениями с помощью метрики BLEU. Наши результаты показали, что в среднем модель Open-Reasoner-Zero-1.5B демонстрирует лучшие результаты, и наивысшие значения BLEU (0.978) она достигает для однородных уравнений второго порядка.

Ключевые слова: малые языковые модели, дифференциальные уравнения, Qwen2.5-1.5b, Open-Reasoner-Zero-1.5b, DeepSeek-R1-Distill-Qwen-1.5b.

УДК: 517.54

Поступило: 20.08.2025
Принято к публикации: 29.09.2025

DOI: 10.7868/S2686954325070276



Реферативные базы данных:


© МИАН, 2025