RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика // Архив

Вестн. Астрахан. гос. техн. ун-та. Сер. управление, вычисл. техн. информ., 2025, номер 1, страницы 17–27 (Mi vagtu830)

УПРАВЛЕНИЕ, МОДЕЛИРОВАНИЕ, АВТОМАТИЗАЦИЯ

Анализ изображений графиков зависимостей физических величин

Д. М. Коробкин, С. А. Фоменков

Волгоградский государственный технический университет, Волгоград, Россия

Аннотация: Используемые на этапе концептуального проектирования физические эффекты, описанные в «первичных» источниках информации, таких как патенты, часто содержат изображения графиков зависимостей, свя-зывающих физические величины входа и выхода. Анализ данной информации и ее использование для расширения описания физического эффекта является актуальной задачей. Описана разработка метода анализа графических изображений для классификации графиков зависимостей входных и выходных физических величин. Для этого требуется сформировать размеченный массив графиков зависимостей, а также провести вычислительные эксперименты для выявления наиболее эффективных архитектур нейросетевых моделей. Разработаны алгоритмы сегментации изображений графиков зависимостей, позволяющие избавиться от зашумляющих (для задачи классификации) частей рисунка, таких как оси координат, их обозначения, координатные сетки и т. д., на решении данной задачи проверена эффективность библиотек OpenCV и scikit-image. Сформированный размеченный массив содержит более 26 тыс. изображений графиков зависимостей. Разработан и программно реализован алгоритм классификации изображений графиков зависимостей по 9 классам (вогнутое увеличение, вогнутое уменьшение, выпуклое увеличение, выпуклое уменьшение, линейное увеличение, линейное уменьшение, постоянство, скачкообразное увеличение, скачкообразное уменьшение). По итогам работы можно сделать вывод, что все 3 метода классификации изображений (LSTM, CNN и ViT) показывают на тестовой выборке почти одинаковые результаты Accuracy, Precision, Recall, F1-Score, AUC-ROC – 98 %. При этом на произвольных изображениях из патентного массива точность анализа падает: у метода LSTM и ViT примерно на 10 %, а у CNN примерно на 2 %.

Ключевые слова: физический эффект, график зависимости, патент, сегментация изображений, классификация изображений.

УДК: 004.853

Поступила в редакцию: 12.11.2024
Принята в печать: 15.01.2025

DOI: 10.24143/2072-9502-2025-1-17-27



© МИАН, 2025