RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2025, том 527, страницы 471–484 (Mi danma702)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Автономный ИИ-исследователь в коммерческом применении: практические задачи в области TEXT-to-SQL

В. Федоровa, Д. Лавитскаяa, Д. М. Ибрагимовb, Д. А. Сафроновc, А. Баллесc, А. Ю. Грибановаc, М. С. Радионовc

a Новосибирский государственный университет, Новосибирск, Россия
b Московский авиационный институт (национальный исследовательский университет), Москва, Россия
c ПАО Сбербанк, СберДата, Москва, Россия

Аннотация: Одной из фундаментальных проблем современного искусственного интеллекта остается автоматизация задач, требующих сложных многоэтапных рассуждений и глубокого понимания как естественного языка, так и структурированных данных. Несмотря на впечатляющие успехи больших языковых моделей в генерации кода и обработке естественного языка, их способность к автономному проведению комплексных исследований в специализированных областях по-прежнему ограничена. Это порождает ключевой вопрос: может ли искусственный интеллект надежно решать реальные бизнес-задачи? В данной работе представлена полностью автоматизированная платформа для ИИ-исследований, примененная к проблеме Text-to-SQL. Наша система позволяет передовым языковым моделям самостоятельно генерировать новые идеи, разрабатывать экспериментальные планы, реализовывать решения и документировать полученные результаты. В рамках исследования мы адаптировали The AI Scientist [1] – комплексного ИИ-агента для автономной научной деятельности – к области семантического разбора. Агент демонстрирует способность формулировать гипотезы по улучшению точности Text-to-SQL, создавать исполняемый код, проводить эксперименты на эталонных наборах данных, визуализировать динамику производительности и формировать полноценные научные статьи с обобщением результатов. Важнейшей характеристикой нашего подхода является его экономическая эффективность: полный цикл исследования стоит менее \$ 5, что создает масштабируемую основу для быстрого инновационного развития. Наша работа прокладывает путь к созданию самосовершенствующихся ИИ-систем в области обработки естественного языка, демонстрируя стабильную производительность как на проприетарных, так и на публичных бенчмарках. Предлагаемое решение представляет качественно новый уровень автоматизации, где ИИ-агенты не просто выполняют задачи, но и вносят вклад в развитие области, проводя независимые исследования. Код платформы и сгенерированные статьи доступны в открытом доступе по адресу https://gitverse.ru/tr1ggers/AIScientist-Text2SQL.git.

Ключевые слова: семантическое парсинг, большие языковые модели, автоматическое научное открытие, AI-агент, TEXT-to-SQL, NL2SQL, ответ на вопросы по базе данных, автономные исследования, автоматизация машинного обучения, генерация кода, самоулучшающийся AI, синтез программ.

УДК: 004.9

Поступило: 21.08.2025
Принято к публикации: 29.09.2025

DOI: 10.7868/S2686954325070409



Реферативные базы данных:


© МИАН, 2025