RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2020, том 14, выпуск 4, страницы 108–116 (Mi ia704)

Эта публикация цитируется в 7 статьях

Эволюция классификаций в надкорпусных базах данных

А. А. Гончаров, И. М. Зацман, М. Г. Кружков

Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук

Аннотация: Рассматривается задача фиксации изменений, вносимых в описания значений немецких модальных глаголов в процессе аннотирования параллельных немецко-русских текстов с использованием надкорпусной базы данных (НБД). На примере этой задачи проанализирована специфика использования динамической классификационной системы (ДКС) в информационных системах. Специфика ДКС состоит в том, что смысловое содержание ее рубрик может меняться в процессе аннотирования, а это нередко влечет за собой потребность в реклассификации ранее сформированных аннотаций с измененными впоследствии рубриками. Основная цель статьи состоит в поиске ответов на два вопроса: (1) от каких факторов зависит необходимость редактирования и реклассификации аннотаций, сформированных до изменения рубрик; (2) с помощью каких операций можно вносить изменения в дефиниции рубрик ДКС. В статье определены семь типов возможных изменений дефиниций и описаны соответствующие им операции, применяемые к рубрикам ДКС в процессе аннотирования. Операции распределены на три группы в зависимости от того, требуют ли они программной или экспертной реклассификации ранее сформированных аннотаций.

Ключевые слова: динамическая классификация, фасетная классификация, реклассификация, надкорпусная база данных.

Поступила в редакцию: 05.10.2020

DOI: 10.14357/19922264200415



© МИАН, 2024