RUS  ENG
Полная версия
ЖУРНАЛЫ // Программные системы: теория и приложения // Архив

Программные системы: теория и приложения, 2016, том 7, выпуск 1, страницы 201–208 (Mi ps207)

Эта публикация цитируется в 2 статьях

Математические основы программирования

A picture of common subsequence length for two random strings over an alphabet of 4 symbols

[Картина наибольшей длины общих подпоследовательностей пары случайных строк 4-буквенного алфавита]

S. V. Znamenskij

Ailamazyan Program System Institute of RAS

Аннотация: Наибольшая длина (LCS) общей подпоследовательности пары случайных конечных последовательностей из 4 букв рассмотрена как случайная функция от длин $m$ и $n$ этих двух последовательностей. Представлены таблицы точных значений вероятностей для всех пар конкретных длин в диапазоне $2<m+n<19$.
Графики зависимости математического ожидания и дисперсии показаны в линейной перспективе, позволяющей просматривать на горизонте поведение при растущих длинах. Для иллюстрации поведения при больших значениях длин на этих же графиках показаны результаты численного экcперимента для больших значений $m+n=32$, 512, 8192 и 131072. Представленный график зависимости математического ожидания от $m$ и $n$ выглядит имеющим асимптотический прямой круговой конус. Дисперсия выглядит растущей как $(n+m)^{\frac34}$.

Ключевые слова и фразы: сходство строк, выравнивание последовательностей, случайные общие подпоследовательности, LCS, метрика Левенштейна.

УДК: 004.416

Поступила в редакцию: 25.12.2015
Подписана в печать : 28.03.2016

Язык публикации: английский



© МИАН, 2024