И. И. Кулагин, Р. А. Бучацкий, М. В. Пантилимонов, А. В. Вязовцев, М. М. Романов, Д. М. Мельник, “Подход к построению компиляторов нейронных сетей с использованием инфраструктуры MLIR”, Труды ИСП РАН, 2025, том 37, выпуск 1,страницы 87

Подход к построению компиляторов нейронных сетей с использованием инфраструктуры MLIR

И. И. Кулагин^ab, Р. А. Бучацкий^a, М. В. Пантилимонов^a, А. В. Вязовцев^ac, М. М. Романов^ab, Д. М. Мельник^ab

^a Институт системного программирования им. В.П. Иванникова РАН
^b Московский государственный университет имени М. В. Ломоносова
^c Московский физико-технический институт

Аннотация: Развитие матричных расширений процессорных архитектур, а также внедрение этих расширений в специализированные AI-процессоры, позволяет существенно повысить эффективность выполнения искусственных нейронных сетей. В работе выполнен обзор базовых функциональных возможностей некоторых популярных матричных расширений процессорных архитектур, в частности расширений ARM SME, RISC-V IME, RISC-V AME, а также процессорной архитектуры DaVinci. В результате проведенного анализа была предложена модель абстрактного матричного процессора, отражающая особенности современных процессорных архитектур, которые поддерживают матричное расширение. Для введенной модели матричного процессора разработано гетерогенное матричное промежуточное представление, которое может быть использовано для построения компиляторов нейронных сетей. Предложенное промежуточное представление было реализовано в инфраструктуре MLIR в виде диалекта heteroMx. В работе также описан подход к построению AI-компилятора с использованием разработанного диалекта heteroMx. Разработанное промежуточное представление может быть адаптировано или конкретизировано для других матричных процессорных архитектур.

Ключевые слова: матричное расширение, архитектуры RISC-V, расширенная архитектура матричных вычислений ARM SME, промежуточное представление, инфраструктура MLIR

DOI: 10.15514/ISPRAS-2025-37(1)-5