RUS  ENG
Полная версия
ЖУРНАЛЫ // Искусственный интеллект и принятие решений // Архив

Искусственный интеллект и принятие решений, 2024, выпуск 1, страницы 103–117 (Mi iipr9)

Анализ текстовой и графической информации

Сокращение пространства поиска оптимальных параметров кластеризации с использованием небольшого объема размеченных данных

В. И. Юферев, Н. А. Разин

Центральный банк Российской Федерации, Москва, Россия

Аннотация: В работе представлен метод сокращения пространства поиска параметров кластеризации. Это достигается за счет выбора наиболее подходящих способов преобразования данных и мер различия на этапе, предваряющем выполнение непосредственно кластеризации. Для сравнения выбранных способов предлагается использовать коэффициент силуэта, который рассматривает метки классов из небольшого размеченного набора данных как метки кластеров. Приведены результаты экспериментальной проверки предложенного подхода для кластеризации текстов новостей.

Ключевые слова: кластеризация, поиск параметров, сокращение пространства поиска, меры различия, машинное обучение.

DOI: 10.14357/20718594240109



© МИАН, 2024