RUS  ENG
Полная версия
ЖУРНАЛЫ // Ученые записки Казанского университета. Серия Физико-математические науки // Архив

Учён. зап. Казан. гос. ун-та. Сер. Физ.-матем. науки, 2009, том 151, книга 3, страницы 229–239 (Mi uzku801)

Преобразование метрик, используемых в методах кластеризации для построения филогенетических деревьев языков

В. Д. Соловьевa, Р. Ф. Фасхутдиновb

a Кафедра теоретической кибернетики Казанского государственного университета
b Институт проблем информатики АН Республики Татарстан, г. Казань

Аннотация: С появлением несколько лет назад больших типологических баз данных возникла проблема выбора математических средств извлечения из них знаний (в форме кластеризации языков). Обычно для этих целей используются филогенетические алгоритмы, основанные на метрике Хемминга. Однако в кластерном анализе было показано, что некоторые другие метрики дают лучшие результаты. В статье введены две новые метрики и на большом числе реальных лингвистических примерах продемонстрировано, что филогенетические алгоритмы, основанные на этих метриках, дают лучшие результаты.

Ключевые слова: лингвистические базы данных, метрики, филогенетические алгоритмы.

УДК: 81+004.9

Поступила в редакцию: 12.05.2009



© МИАН, 2024