RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2015, том 27, выпуск 3, страницы 329–342 (Mi tisp155)

Searching method of personal details on the basis of fuzzy comparison

[Метод поиска реквизитов физических лиц в базах данных на основе нечёткого сравнения]

Nataliia Limanova, Maxim Sedov

Povolzhskiy State University of Telecommunications and Informatics

Аннотация: При передаче данных от одного чреждения к другому возникает проблема персональной идентификации физических лиц, у которых частично или полностью не совпадают реквизиты. Для правильного сопоставления персональных данных в базах данных источника и приемника необходимо выполнить интеллектуальный поиск таких данных и привязку к уже имеющимся персональным идентификационным номерам. В статье предлагаются метод и алгоритм нечеткого поиска реквизитов физических лиц в базах данных. Метод основан на модифицированной метрике Левенштейна с использованием трех операций: вставки, замены и удаления символов, где все три операции имеют одинаковый вес. Представлена общая схема алгоритма поиска на основе нечеткого сравнения с подробным описанием его работы и особенностей. Разработанную процедуру идентификации можно рассматривать как часть системы поддержки принятия решений. Процедура не требует вмешательства оператора, накапливает опыт и самообучается в процессе работы, позволяя, тем самым, полностью освободить специалистов от низкопрофильной, неэффективной ручной работы напрямую с наборами реквизитов физических лиц, хранящимися в базах данных. Встроенная система приоритета реквизитов позволяет идентифицировать человека в таких случаях, как смена фамилии, имени, переезд, ошибки при ручном вводе данных, а также при частично отсутствующих реквизитах. Приведены результаты сравнения технических и экономических показателей предложенного метода с существующими. Алгоритм реализован на языке PL-SQL в СУБД Oracle 11g и используется с 2007 года в промышленной эксплуатации при автоматизированной обработке информации в нескольких муниципальных учреждениях Самарской области. В перспективе предложенный метод обладает возможностью успешного внедрения в системы глобального объединения хранилищ государственных или коммерческих организаций для ведения единой базы данных населения любой страны мира. Логическая структура разработанного алгоритма дает возможность реализовать его на любом языке программирования. Масштабируемость алгоритма позволяет применять программные процедуры на его основе, как в малых организациях, так и в крупных корпорациях, везде, где ведётся и актуализируется реестр персональных данных физических лиц.

Ключевые слова: interdepartmental exchange of information, indistinct matching, search of personal details, function of intellectual matching, personal identification number (PIN).

Язык публикации: английский



Реферативные базы данных:


© МИАН, 2024