RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2024, том 520, номер 2, страницы 284–294 (Mi danma607)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

RuSciBench: открытый бенчмарк для оценки семантических векторных представлений научных текстов на русском и английском языках

А. С. Ватолинa, Н. А. Герасименкоabc, А. О. Янинаd, К. В. Воронцовadc

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
b SberAI, Москва, Россия
c Институт искусственного интеллекта Московского государственного университета им. М.В. Ломоносова, Москва, Россия
d Московский физико-технический университет, Долгопрудный, Московская область, Россия

Аннотация: Распространение открытий и знаний в научном сообществе – важная задача. Большая часть научных статей в мире написана на английском языке, что делает сложным обмен научными знаниями в странах, где большая часть населения не владеет английским языком свободно. В современном мире машинный перевод и языковые модели помогают решить эту проблему, но отсутствие или малое количество данных на выбранном языке не позволяют тренировать и валидировать модели. Чтобы решить эту проблему, мы предлагаем первый бенчмарк для оценки качества работы моделей для получения семантических векторных представлений научных статей на русском и английском языках. Он состоит из данных русской электронной библиотеки научных статей eLibrary. Мы также предлагаем набор задач, которые можно использовать для тренировки различных моделей на наших данных и приводим подробный сравнительный анализ результатов передовых моделей на нашем бенчмарке.

Ключевые слова: сбор датасетов, бенчмарк, большие языковые модели, оценка качества работы больших языковых моделей, семантические векторные представления.

УДК: 004.048

Поступило: 27.09.2024
Принято к публикации: 02.10.2024

DOI: 10.31857/S2686954324700644


 Англоязычная версия: Doklady Mathematics, 2024, 110:suppl. 1, S251–S260

Реферативные базы данных:


© МИАН, 2025