RUS  ENG
Полная версия
ЖУРНАЛЫ // Наносистемы: физика, химия, математика // Архив

Наносистемы: физика, химия, математика, 2022, том 13, выпуск 6, страницы 593–607 (Mi nano1142)

MATHEMATICS

Spin Boltzmann machine

[Спиновая машина Больцмана]

Igor S. Lobanov

Faculty of Physics, ITMO University, Saint Petersburg, Russia

Аннотация: Машина Больцмана (МБ) – это рекуррентная сеть, имеющая широкий спектр применений в машинном обучении (МО), включая снижение размерности исходных данных, обучение признакам и задачу классификации. Стандартная МБ описывается моделью Изинга и может быть реализована в виде устройства на основе спинового льда. Такие физические реализации быстрее и энергоэффективнее, чем моделирование на цифровых компьютерах. В настоящее время аппаратные реализации МБ делаются для единственной задачи, а их дизайн рассчитывается на цифровых компьютерах. В настоящей статье мы предлагаем обобщенную МБ, способную самостоятельно, внутри спинтронного устройства, подбирать параметры в процессе демонстрации ей обучающих примеров. Наше обобщение основано на модели Гейзенберга, которая для спинового льда более точна, чем модель Изинга. Мы показываем, что для ряда систем минимизация расстояния Кульбака–Лейблера в процессе обучения МБ эквивалентно минимизации свободной энергии по пороговым значениям нейронов, т.е. обучение этой модели МО происходит путем диссипации энергии. Мы включаем пороговые значения нейронов в степени свободы системы, полагая, что их динамика описывается тем же уравнением Ландау–Лифшица–Гильберта, которое описывает динамику остальных спинов МБ. Демонстрация примеров происходит путем фиксации входов и выходов согласно тренировочной выборке. Обучающие примеры запоминаются машиной, становясь локальными минимумами на энергетическом ландшафте, тем самым реализуется вариант долговременной потенциации. Производительность предложенной машины сравнена с искусственной нейронной сетью вида однослойного перцептрона и с ограниченной машиной Больцмана на задаче бинарной классификации.

Ключевые слова: машина Больцмана, модель Гейзенберга, диссипативное обучение, оператор Шредингера.

Поступила в редакцию: 26.10.2022
Исправленный вариант: 17.11.2022
Принята в печать: 30.11.2022

Язык публикации: английский

DOI: 10.17586/2220-8054-2022-13-6-593-607



Реферативные базы данных:


© МИАН, 2024