СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ
Автономный ИИ-исследователь в коммерческом применении: практические задачи в области TEXT-to-SQL
В. Федоровa,
Д. Лавитскаяa,
Д. М. Ибрагимовb,
Д. А. Сафроновc,
А. Баллесc,
А. Ю. Грибановаc,
М. С. Радионовc a Новосибирский государственный университет, Новосибирск, Россия
b Московский авиационный институт (национальный исследовательский университет), Москва, Россия
c ПАО Сбербанк, СберДата, Москва, Россия
Аннотация:
Одной из фундаментальных проблем современного искусственного интеллекта остается автоматизация задач, требующих сложных многоэтапных рассуждений и глубокого понимания как естественного языка, так и структурированных данных. Несмотря на впечатляющие успехи больших языковых моделей в генерации кода и обработке естественного языка, их способность к автономному проведению комплексных исследований в специализированных областях по-прежнему ограничена. Это порождает ключевой вопрос: может ли искусственный интеллект надежно решать реальные бизнес-задачи? В данной работе представлена полностью автоматизированная платформа для ИИ-исследований, примененная к проблеме Text-to-SQL. Наша система позволяет передовым языковым моделям самостоятельно генерировать новые идеи, разрабатывать экспериментальные планы, реализовывать решения и документировать полученные результаты. В рамках исследования мы адаптировали The AI Scientist [1] – комплексного ИИ-агента для автономной научной деятельности – к области семантического разбора. Агент демонстрирует способность формулировать гипотезы по улучшению точности Text-to-SQL, создавать исполняемый код, проводить эксперименты на эталонных наборах данных, визуализировать динамику производительности и формировать полноценные научные статьи с обобщением результатов. Важнейшей характеристикой нашего подхода является его экономическая эффективность: полный цикл исследования стоит менее \$ 5, что создает масштабируемую основу для быстрого инновационного развития. Наша работа прокладывает путь к созданию самосовершенствующихся ИИ-систем в области обработки естественного языка, демонстрируя стабильную производительность как на проприетарных, так и на публичных бенчмарках. Предлагаемое решение представляет качественно новый уровень автоматизации, где ИИ-агенты не просто выполняют задачи, но и вносят вклад в развитие области, проводя независимые исследования. Код платформы и сгенерированные статьи доступны в открытом доступе по адресу
https://gitverse.ru/tr1ggers/AIScientist-Text2SQL.git.
Ключевые слова:
семантическое парсинг, большие языковые модели, автоматическое научное открытие, AI-агент, TEXT-to-SQL, NL2SQL, ответ на вопросы по базе данных, автономные исследования, автоматизация машинного обучения, генерация кода, самоулучшающийся AI, синтез программ.
УДК:
004.9
Поступило: 21.08.2025
Принято к публикации: 29.09.2025
DOI:
10.7868/S2686954325070409