RUS  ENG
Полная версия
СЕМИНАРЫ

Некоторые применения математических методов в языкознании
23 октября 2025 г. 14:00, г. Москва, г. Москва, МИАН, ауд. 104


База коннекторов русского языка Рускон: проблемы и задачи представления лексикографических данных. Часть 2

Н. В. Сердобольскаяa, И. М. Кобозеваab, С. П. Тимошенкоcd

a Институт языкознания Российской академии наук
b Московский государственный университет имени М. В. Ломоносова, филологический факультет
c Институт проблем передачи информации им. А. А. Харкевича Российской академии наук, г. Москва
d Российский государственный гуманитарный университет, г. Москва

Аннотация: Тема 2-й части: «Составные коннекторы в базе Рускон: союзы, коннекторы и свободные сочетания»
Вторая часть доклада посвящена проблемам выделения класса составных коннекторов русского языка в базе Рускон. Академические словари и грамматики серьезно расходятся в мнениях по поводу трактовки конкретных сочетаний – как в плане их лексико-грамматического статуса, так и, шире, в плане включения их в базовый инвентарь. В изданиях используются термины «в значении союза», «аналог союза», «союзное соединение» и т.п. Это связано с трудностью разграничения единых союзов (потому что) и окказиональных сочетаний (а из-за этого) – условно говоря, единиц, которые содержатся в памяти как единое целое или порождаются в ходе речепроизводства. Мы рассматриваем критерии определения составных коннекторов, которые работают на различных уровнях языка – фонетические, морфологические, синтаксические и семантические критерии. В некоторых случаях эти лингвистически обоснованные критерии не дают однозначного ответа. Был проведен ряд экспериментов, в ходе которых коннекторы ранжировались с помощью различных метрик устойчивости словосочетаний. Наилучшие результаты показали метрики, производные от меры точечной взаимной информации (Pointwise Mutual Information, сокращенно PMI). Мы предлагаем использовать при решении аналогичных задач модификацию MMI (Modified Mutual Information), адаптированную для оценки словосочетаний произвольной длины.


© МИАН, 2025