RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Информатика и автоматизация, 2024, выпуск 23, том 1, страницы 39–64 (Mi trspy1280)

Искусственный интеллект, инженерия данных и знаний

Sentiment analysis framework for telugu text based on novel contrived passive aggressive with fuzzy weighting classifier (CPSC-FWC)

[Система анализа тональности текста на телугу на основе нового пассивно-агрессивного классификатора с нечетким взвешиванием]

G. Naidu, M. Seshashayee

Gandhi Institute of Technology and Management GITAM (Deemed to be University)

Аннотация: Обработка естественного языка (NLP) — это разновидность искусственного интеллекта, демонстрирующая, как алгоритмы могут взаимодействовать с людьми на их уникальных языках. Кроме того, анализ настроений в NLP лучше проводится во многих программах, включая оценку настроений на телугу. Для обнаружения текста на телугу используются несколько неконтролируемых алгоритмов машинного обучения, таких как кластеризация k-средних с поиском с кукушкой. Однако эти методы с трудом справляются с кластеризацией данных с переменными размерами и плотностью кластеров, низкой скоростью поиска и плохой точностью сходимости. В ходе этого исследования была разработана уникальная система анализа настроений на основе машинного обучения для текста на телугу, позволяющая устранить указанные недостатки. Первоначально, на этапе предварительной обработки, предлагаемый алгоритм линейного преследования (LPA) удаляет слова в пробелах, знаках препинания и остановках. Затем для маркировки POS в этом исследовании было предложено условное случайное поле с лексическим взвешиванием; После этого предлагается надуманный пассивно-агрессивный классификатор с нечетким взвешиванием (CPSC-FWC) для классификации настроений в тексте на телугу. Следовательно, предлагаемый нами метод дает эффективные результаты с точки зрения точности, воспроизводимости и показателя f1.

Ключевые слова: машинное обучение, обработка естественного языка, полярность, анализ настроений, телугу.

УДК: 004.7

Поступила в редакцию: 31.07.2023

Язык публикации: английский

DOI: 10.15622/ia.23.1.2



© МИАН, 2024