ИНСТРУМЕНТАРИЙ СОЗДАНИЯ ЦИФРОВЫХ АРХИВОВ ДОКУМЕНТОВ НА ОСНОВЕ СВЯЗАННЫХ ДАННЫХ

Receipt date: 
21.10.2017
Year: 
2017
Journal number: 
УДК: 
004.652.8+004.91
DOI: 

10.26731/1813-9108.2017.4(56).100-107

Article File: 
Pages: 
100
107
Abstract: 

Рассматривается задача разработки инструментальных средств реализации цифровых архивов документов. Особенностью предложенных средств является использование форматов связанных данных (семантического веба) для представления и хранения логической структуры документа и его метаинформации, системы логического вывода, встроенной в сервер, и средств создания документов из отдельных частей.

Основу формализованного описания содержимого архивов форматирует ряд стандартизованных онтологий, в том чис-ле Open Annotation, Friend-of-a-Friend, Dublin Core, Provenance, Schema.org, DBpedia, NEPOMUK и Bibliographic Ontology. Свой-ства онтологий позволили обеспечить решения различных задач, связанных с представлением и ведением документации: созда-ние документа, представление авторства, формирование описаний содержимого, представление логических связей между документами, привязку данных к конкретным объектам, а также обеспечить представление ссылок на внешние источники (списки литературы).

Представление данных в виде семантического графа и использование Prolog в качестве основного средства обеспечения доступа и обработки графов формирует среду обработки данных документа на основе декларативных спецификаций, в част-ности базы знаний. Современные средства и программные библиотеки SWI-Prolog и Python позволяют разрабатывать при-ложения анализа содержимого документов с последующим порождением новых размеченных документов.

Предложенные средства позволяют расширить функции хранения и доступа к документам функциями их интеграции с другими сайтами интернета. Рассмотрен пример приложения разработанного программного инструментария при подготовке документации о курсах, преподаваемых в университете.

Financing: 

Результаты получены при частичной поддержке Совета по грантам Президента Российской Федерации, государственной поддержке ведущих научных школ Российской Федерации (НШ-8081.2016.9).

Результаты получены при активном использовании сетевой инфраструктуры Телекоммуникационного центра коллективного пользования «Интегрированная информационно-вычислительная сеть Иркутского научно-образовательного комплекса» (ЦКП ИИВС ИРНОК) (http://net.icc.ru).

List of references: 

1.   Bizer Ch., Heath T., Berners-Lee T. Linked Data – The Story So Far // International Journal on Semantic Web and Information Systems. 2009. Vol. 5 (3). P. 1–22.

2.   Подход к управлению содержанием сайта на основе технологий RDF / Е.А. Черкашин, П.В. Белых и др. // Знания - Онтологии - Теории : материалы Всерос. конф. с междунар. участ. Т. 2. Новосибирск. 2013. С. 204–212.

3.   Lehmann J., Isele R., Jakob M., Jentzsch A., Kontokostas D., et al. DBpedia – A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia // Semantic Web Journal. 2015. Vol. 6. No. 2. P. 167–195.

4.   Krötzsch M. How to use Wikidata: Things to make and do with 40 million statements // In Keynote at the 10th Wikimania Conference. 2014.

5.   Daiber J., Jakob M., Mendes P. Improving Efficiency and Accuracy in Multilingual Entity Extraction // Proceedings of the 9th International Conference on Semantic Systems (I-Semantics), 2013.

URL: http://korrekt.org/talks/2014/wikimania-wikidata.svg (access-date: 01.07.2017).

6.   Baiju M. A. Comprehensive Guide to Zope Component Architecture. [Электронный ресурс]

URL: http://muthukadan.net/docs/zca.html (access date 01.07.2017).

7.   Langtangen H. A Primer on Scientific Program-ming with Python (Texts in Computational Sci-ence and Engineering) 3rd ed. Springer. 2012. 798 р.

8.   Wielemaker J., Beek W., Hildebrand M., Ossenbruggen J. ClioPatria: A SWI-Prolog infrastructure for the Semantic Web //  Semantic Web. 2016. Vol. 7 (5). P. 529–541.

9.   Lager T., Wielemaker J. Pengines: Web Logic Programming Made Easy // Theory and Practice of Logic Programming. 2014. Vol. 14 (4-5).

10. Wielemaker J., Schreiber G., Wielinga B. Prolog-Based Infrastructure for RDF: Scalability and Performance // In: Fensel D., Sycara K., Mylopoulos J. (eds) The Semantic Web - ISWC 2003. ISWC 2003. Lecture Notes in Computer Science. 2003. Vol.  2870. Springer, Berlin, Heidelberg.

11. Нефедова Ю.С. Архитектура гибридной рекомендательной системы GEFEST (Generation–Expansion–Filtering–Sorting–Truncation) // Системы и средства информатики. 2012. Т. 22. Вып. 2. С. 176–196.

12. Beel J., Gripp B., Langer S., Breitinger C. Research-paper recommender systems: a literature survey // International Journal on Digital Libraries. 2016. Vol. 17. Pр. 305. (access date: 12.12.2016).

13. Kuć R., Rogoziński M. Mastering Elasticsearch - Second Edition. Packt Publishing. 2015. 372 p.

14. Capadisli S., Guy A., Verborgh R., Lange C., Auer S., Berners-Lee T. Decentralised Authoring, Annotations and Notifications for a Read-Write Web with dokieli // Procs of ICWE international conference, 5-8 June, 2017, Rome, Italy. (to appear) [Electronic resource] Preprint. URL:http://csarven.ca/dokieli-rww. (access date: 12.12.2016).

15. Heino N, Tramp S, Auer S, et al. Managing Web Content using Linked Data Principles – Combining semantic structure with dynamic content syndication // Computer Software and Applications Conference (COMPSAC), IEEE 35th Annual. 2011. P. 245–250. [Electronic resource] URL:http://svn.aksw.org/papers/2011/COMPSAC_lod2.eu/public.pdf (access date: 30.05.2013).