RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2018, том 30, выпуск 2, страницы 215–250 (Mi tisp316)

Эта публикация цитируется в 4 статьях

Активное обучение и краудсорсинг: обзор методов оптимизации разметки данных

Р. А. Гилязевab, Д. Ю. Турдаковcbd

a Московский физико-технический институт
b Институт системного программирования им. В.П. Иванникова РАН
c Московский государственный университет имени М. В. Ломоносова
d Национальный исследовательский университет Высшая школа экономики

Аннотация: Качественные аннотированные коллекции являются ключевым элементом при построении систем, использующих машинное обучение. В большинстве случаев создание таких коллекций предполагает привлечение к разметке данных людей, а сам процесс является дорогостоящим и утомительным для аннотаторов. Для оптимизации этого процесса был предложен ряд методов, использующих активное обучение и краудсорсинг. В статье приводится обзор существующих подходов, обсуждается их комбинированное применения, а также описываются существующие программные системы, предназначенные для упрощения процесса разметки данных.

Ключевые слова: активное обучение, краудсорсинг, аннотация корпусов, крауд-вычисления.

DOI: 10.15514/ISPRAS-2018-30(2)-11



Реферативные базы данных:


© МИАН, 2024