Аннотация:
Важным этапом работы при проектировании технических систем специального назначения является подбор оборудования с учетом эксплуатационных характеристик. Необходимость категоризации технических коротких текстов, которые представляют собой краткие описания оборудования, аннотации, фрагменты баз данных, обусловлена тем, что информация об оборудовании, содержащаяся в тематических реферативных сборниках, технической и проектной документации, контекстной рекламе, зачастую не структурирована, имеется в разрозненных источниках. Дополнительной проблемой является наличие большого количества опечаток, некорректных словоупотреблений и обозначений в текстах. Приведены результаты классификации технических коротких текстов о назначении приборов с применением теории нечетких множеств и нечеткой логики. Большое внимание уделяется характеристике объектов исследования и учету их особенностей – наличию большого количества технических терминов, аббревиатур, специальных символов. Описана методика проведения классификации, обоснована целесообразность применения системы нечеткого вывода Сугено, связанная с «нечеткостью» естественно-языковой информации, простотой математических расчетов в ходе эксперимента. Модель Сугено сочетает в себе описание объектов исследования в виде лингвистических правил и функциональных зависимостей. Такой подход значительно облегчает интерпретацию результатов классификации.