Аннотация:
В статье представлен прототип программной платформы для извлечения связанных открытых данных (Linked Open Data) из заданной коллекции математических научных статей. Задача получения семантического представления из коллекций выбранной предметной области является актуальной, так как в настоящий момент в облаке связанных открытых данных отсутствуют новейшие данные по профессиональной математике. По нашему мнению, одной из основных причин этого является отсутствие специализированных инструментов, способных анализировать семантику, лежащую в основе статей по математике, и эффективно строить их консолидированное представление. В статье описан комплексный подход к анализу математических документов для представления содержимого статей и их метаданных в формате RDF. Рассмотрены методы и технологии извлечения семантических данных из математических статей на основе специальных онтологий, а также описаны эксперименты по интеграции построенного математического RDF-набора с существующими наборами данных в Интернете.
Ключевые слова:индексация, связанные данные, проектирование онтологий.