Д. А. Кочаров, А. П. Меньшикова, “Применение лингвистических признаков для автоматического определения интонационно выделенных слов в русскоязычном тексте”, Тр. СПИИРАН, 2017, выпуск 55,страницы 216

Эта публикация цитируется в 1 статье

Алгоритмы и программные средства

Применение лингвистических признаков для автоматического определения интонационно выделенных слов в русскоязычном тексте

Д. А. Кочаров, А. П. Меньшикова

Санкт-Петербургский государственный университет (СПбГУ)

Аннотация: В данной статье предлагается метод автоматического предсказания интонационно выделенных слов, то есть наиболее важной информации в высказывании. Метод опирается на использование лексических, грамматических и синтаксических маркеров интонационного выделения, что делает возможным его применение в системах синтеза речи по тексту, где реализация интонационного выделения может повысить естественность звучания синтезированной речи.
В качестве методов классификации независимо друг от друга использовалось несколько различных моделей: наивная байесовская модель, модель максимальной энтропии и условные случайные поля. Сопоставление результатов, полученных в ходе нескольких экспериментов, показало, что использовавшиеся дискриминативные модели демонстрируют сбалансированные и примерно равные значения метрик качества, в то время как генеративная модель потенциально более пригодна для поиска интонационно выделенных слов в речевом сигнале.
Результаты, представленные в статье, сравнимы и в некоторых случаях превосходят аналогичные системы, разработанные для других языков.

Ключевые слова: интонационное выделение, просодия; лексический анализ; синтаксический анализ; байесовский классификатор; метод максимальной энтропии; условные случайные поля; русский язык.

УДК: 004.93'1, 004.912, 81'32

DOI: 10.15622/sp.55.9