RUS  ENG
Полная версия
ЖУРНАЛЫ // Автоматика и телемеханика // Архив

Автомат. и телемех., 2013, выпуск 10, страницы 154–165 (Mi at6155)

Эта публикация цитируется в 2 статьях

Тематический выпуск

Статистический теггер для морфологической разметки русскоязычных текстов

В. В. Петроченковa, А. О. Казенниковb

a Институт проблем передачи информации им. А. А. Харкевича РАН
b Московский государственный институт радиотехники, электроники и автоматики

Аннотация: Рассматривается метод построения статистического теггера для автоматической морфологической разметки русскоязычных текстов. При такой разметке каждому слову приписывается тег, содержащий в себе информацию о части речи и полном наборе морфологических характеристик слова. Используется набор морфологических характеристик, принятый в корпусе СинТагРус, материал которого использовался для обучения теггера. В основе работы теггера лежит метод опорных векторов SVM (Support Vector Machine). Разработанный теггер показал высокую скорость и хорошее качество разметки.

Статья представлена к публикации членом редколлегии: А. В. Бернштейн

Поступила в редакцию: 11.03.2013


 Англоязычная версия: Automation and Remote Control, 2013, 74:10, 1724–1732

Реферативные базы данных:


© МИАН, 2024