10.26731/1813-9108.2017.4(56).100-107
Рассматривается задача разработки инструментальных средств реализации цифровых архивов документов. Особенностью предложенных средств является использование форматов связанных данных (семантического веба) для представления и хранения логической структуры документа и его метаинформации, системы логического вывода, встроенной в сервер, и средств создания документов из отдельных частей.
Основу формализованного описания содержимого архивов форматирует ряд стандартизованных онтологий, в том чис-ле Open Annotation, Friend-of-a-Friend, Dublin Core, Provenance, Schema.org, DBpedia, NEPOMUK и Bibliographic Ontology. Свой-ства онтологий позволили обеспечить решения различных задач, связанных с представлением и ведением документации: созда-ние документа, представление авторства, формирование описаний содержимого, представление логических связей между документами, привязку данных к конкретным объектам, а также обеспечить представление ссылок на внешние источники (списки литературы).
Представление данных в виде семантического графа и использование Prolog в качестве основного средства обеспечения доступа и обработки графов формирует среду обработки данных документа на основе декларативных спецификаций, в част-ности базы знаний. Современные средства и программные библиотеки SWI-Prolog и Python позволяют разрабатывать при-ложения анализа содержимого документов с последующим порождением новых размеченных документов.
Предложенные средства позволяют расширить функции хранения и доступа к документам функциями их интеграции с другими сайтами интернета. Рассмотрен пример приложения разработанного программного инструментария при подготовке документации о курсах, преподаваемых в университете.
Результаты получены при частичной поддержке Совета по грантам Президента Российской Федерации, государственной поддержке ведущих научных школ Российской Федерации (НШ-8081.2016.9).
Результаты получены при активном использовании сетевой инфраструктуры Телекоммуникационного центра коллективного пользования «Интегрированная информационно-вычислительная сеть Иркутского научно-образовательного комплекса» (ЦКП ИИВС ИРНОК) (http://net.icc.ru).
1. Bizer Ch., Heath T., Berners-Lee T. Linked Data – The Story So Far // International Journal on Semantic Web and Information Systems. 2009. Vol. 5 (3). P. 1–22.
2. Подход к управлению содержанием сайта на основе технологий RDF / Е.А. Черкашин, П.В. Белых и др. // Знания - Онтологии - Теории : материалы Всерос. конф. с междунар. участ. Т. 2. Новосибирск. 2013. С. 204–212.
3. Lehmann J., Isele R., Jakob M., Jentzsch A., Kontokostas D., et al. DBpedia – A Large-scale, Multilingual Knowledge Base Extracted from Wikipedia // Semantic Web Journal. 2015. Vol. 6. No. 2. P. 167–195.
4. Krötzsch M. How to use Wikidata: Things to make and do with 40 million statements // In Keynote at the 10th Wikimania Conference. 2014.
5. Daiber J., Jakob M., Mendes P. Improving Efficiency and Accuracy in Multilingual Entity Extraction // Proceedings of the 9th International Conference on Semantic Systems (I-Semantics), 2013.
URL: http://korrekt.org/talks/2014/wikimania-wikidata.svg (access-date: 01.07.2017).
6. Baiju M. A. Comprehensive Guide to Zope Component Architecture. [Электронный ресурс]
URL: http://muthukadan.net/docs/zca.html (access date 01.07.2017).
7. Langtangen H. A Primer on Scientific Program-ming with Python (Texts in Computational Sci-ence and Engineering) 3rd ed. Springer. 2012. 798 р.
8. Wielemaker J., Beek W., Hildebrand M., Ossenbruggen J. ClioPatria: A SWI-Prolog infrastructure for the Semantic Web // Semantic Web. 2016. Vol. 7 (5). P. 529–541.
9. Lager T., Wielemaker J. Pengines: Web Logic Programming Made Easy // Theory and Practice of Logic Programming. 2014. Vol. 14 (4-5).
10. Wielemaker J., Schreiber G., Wielinga B. Prolog-Based Infrastructure for RDF: Scalability and Performance // In: Fensel D., Sycara K., Mylopoulos J. (eds) The Semantic Web - ISWC 2003. ISWC 2003. Lecture Notes in Computer Science. 2003. Vol. 2870. Springer, Berlin, Heidelberg.
11. Нефедова Ю.С. Архитектура гибридной рекомендательной системы GEFEST (Generation–Expansion–Filtering–Sorting–Truncation) // Системы и средства информатики. 2012. Т. 22. Вып. 2. С. 176–196.
12. Beel J., Gripp B., Langer S., Breitinger C. Research-paper recommender systems: a literature survey // International Journal on Digital Libraries. 2016. Vol. 17. Pр. 305. (access date: 12.12.2016).
13. Kuć R., Rogoziński M. Mastering Elasticsearch - Second Edition. Packt Publishing. 2015. 372 p.
14. Capadisli S., Guy A., Verborgh R., Lange C., Auer S., Berners-Lee T. Decentralised Authoring, Annotations and Notifications for a Read-Write Web with dokieli // Procs of ICWE international conference, 5-8 June, 2017, Rome, Italy. (to appear) [Electronic resource] Preprint. URL:http://csarven.ca/dokieli-rww. (access date: 12.12.2016).
15. Heino N, Tramp S, Auer S, et al. Managing Web Content using Linked Data Principles – Combining semantic structure with dynamic content syndication // Computer Software and Applications Conference (COMPSAC), IEEE 35th Annual. 2011. P. 245–250. [Electronic resource] URL:http://svn.aksw.org/papers/2011/COMPSAC_lod2.eu/public.pdf (access date: 30.05.2013).