Авторитетность издания
Добавить в закладки
Следующий номер на сайте
Формирование контента единого цифрового пространства научных знаний на базе веб-ориентированного программного комплекса
Аннотация:В статье рассматриваются вопросы, связанные с исследованиями в области формирования единого цифрового пространства научных знаний (ЕЦПНЗ). Оно представляет собой общедоступную цифровую среду, объединяющую информацию о различных объектах, связанных с наукой. В качестве таких объектов может выступать цифровая копия физической сущности (текст книги, архивный документ, музейный предмет), база данных, сведения об ученом, научном мероприятии, научном факте и т.п. ЕЦПНЗ строится как система связанных данных с использованием принципов Semantic Web и онтологического подхода. Работа посвящена вопросам формирования контента под-пространств, входящих в состав ЕЦПНЗ. Приводится общая блок-схема алгоритма ввода данных в подпространство, основанного на сформированной онтологии (совокупность справочников атрибутов, связей объектов и статических словарей значений атрибутов и связей), и описывается реализующий алгоритмы диалоговый программный комплекс. Алгоритмы формирования контента тематического подпространства базируются на анализе объектов вспомогательного класса Форматы, относящегося к универсальному подпространству. Они служат основой для построения сценария диалога ввода данных и реализации автоматического формально-логического контроля вводимой информации. Разработанный программный комплекс создан с использованием технологии Microsoft ASP.NET на платформе Microsoft.NET Framework на языке C#. Он включает четыре модуля: формирование словарей объектов, формирование связей между объектами и атрибутами объектов, редактирование словарей, просмотр объектов. Для каждого модуля описан сценарий диалога, приведены примеры его реализации, иллюстрированные скриншотами.
Abstract:The paper addresses research issues related to the formation of the common digital space of scientific knowledge (CDSSK). It constitutes a publicly accessible digital environment that consolidates information about various science-related objects. Such objects may include digital copies of physical entities (book texts, archival documents, museum artifacts), databases, information about researchers, scientific events, established facts, and similar items. The CDSSK architecture implements a linked data framework based on Semantic Web standards and ontological methodologies. This work addresses content for-mation for the subspaces (SS) comprising the CDSSK. The authors present a general flowchart for the data input algorithm into the SS, based on the developed ontology – which comprises attribute directories, object relationships, and static dictionaries of attribute values and relationships – and describe a dialog-based software package that implements these algorithms. The content generation algorithms for the thematic SS utilize analysis of objects from the auxiliary class Formats, which belongs to the universal SS. They serve as the basis for constructing a data entry dialogue scenario and implementing automatic formal and logical control of the information entered. The authors created the software package using Microsoft ASP.NET technology, operating on the Microsoft.NET Framework platform and coded in C#. It comprises four modules: object dictionaries generation; relationship establishment between objects and their attributes; dictionaries editing; and object viewing. For each module, the authors described a dialog scenario and provided implementation examples illustrated with screenshots.
| Авторы: Власова С.А. (svlasova@jscc.ru) - Межведомственный суперкомпьютерный центр (МСЦ) РАН – филиал ФГУ ФНЦ Научно-исследовательский институт системных исследований (НИИСИ) РАН (ведущий научный сотрудник), Москва, Россия, кандидат технических наук, Калёнов Н.Е. (nkalenov@jscc.ru) - Межведомственный суперкомпьютерный центр (МСЦ) РАН – филиал ФГУ ФНЦ Научно-исследовательский институт системных исследований (НИИСИ) РАН (профессор, главный научный сотрудник), Москва, Россия, доктор технических наук, Сотников А.Н. (asotnikov@iscc.ru) - Федеральный исследовательский центр «Информатика и управление» РАН, ул. Вавилова, 44-2, г. Москва, 119333, Россия (главный научный сотрудник), г. Москва, Россия, доктор физико-математических наук | |
| Ключевые слова: программный комплекс, цифровое пространство научных знаний, онтология, алгоритмы формирования контента, редактирование данных, атрибуты объектов, связанные данные |
|
| Keywords: software package, digital space of scientific knowledge, ontology, content generation algorithms, data editing, object attributes, linked data |
|
| Количество просмотров: 764 |
Статья в формате PDF |
Формирование контента единого цифрового пространства научных знаний на базе веб-ориентированного программного комплекса
DOI: 10.15827/0236-235X.152.715-723
Дата подачи статьи: 20.06.2025
Дата после доработки: 14.07.2025
Дата принятия к публикации: 24.07.2025
УДК: 004.424.4
Группа специальностей ВАК: 2.3.5. Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей (технические науки, физико-математические науки)
Статья опубликована в выпуске журнала № 4 за 2025 год. [ на стр. 715-723 ]
Введение. Исследования в области создания единого цифрового пространства научных знаний (ЕЦПНЗ) ведутся с 2019 года. Постановка задачи формирования ЕЦПНЗ в информационном аспекте предложена в [1]; методологические аспекты создания ЕЦПНЗ обсуждаются в [2, 3]; принципы построения пространства сформулированы в [4]. В работе [5] предложена модель программной оболочки ЕЦПНЗ в виде семантической библиотеки. В [6, 7] авторами опубликованы исследования в области онтологии ЕЦПНЗ и предложена ее структура. В МСЦ РАН (ныне – Отделение суперкомпьютерных систем и параллельных вычислений НИЦ «Кур- чатовский институт») в течение последних лет ведется разработка унифицированных програм- мных средств, обеспечивающих наполнение ЕЦПНЗ, поиск и навигацию по его ресурсам. В 2024 году был разработан диалоговый программный комплекс для формирования онто- логии ЕЦПНЗ [8]. Он позволяет формировать систему справочников подпространств, классов, атрибутов объектов и связей различного рода, а также статических словарей значений атрибутов, являющуюся основой для наполнения ЕЦПНЗ конкретными объектами. Исследования в области развития ЕЦПНЗ как основы для информационных сервисов в последние годы активно ведутся в БЕН РАН [9], ГПНТБ СО РАН [10], ЦРБ УрО РАН [11, 12]. Кроме того, в УрО РАН обсуждаются практические шаги по наполнению ЕЦПНЗ региональной научной информацией и разработки навигатора по создаваемым ресурсам [13]. Идеи интеграции научных ресурсов в единое пространство реализуются в отдельных отраслях знаний, в частности, в геологии [14, 15]. Что касается исследований в области создания унифицированных алгоритмов формирования и обработки контента ЕЦПНЗ, то здесь развиваются подходы, основанные на теории графов. В частности, это направление отраже- но в [16] и связано с разработкой семантической библиотеки, предложенной в [5]. В доступных зарубежных источниках авторам не удалось обнаружить постановку зада- чи, аналогичной созданию унифицированной ЕЦПНЗ. Предметом данной публикации является описание результатов очередного этапа исследований в области создания ЕЦПНЗ – алгоритмов и диалоговых программных средств формирования контента пространства. Эти исследования являются особенно важными в связи с практическим задачами, связанными с ролью ЕЦПНЗ в информационно-образовательных процессах, на региональном уровне, о которых шла речь выше. Алгоритмы формирования контента ЕЦПНЗ Алгоритмы формирования контента конкретного подпространства ЕЦПНЗ базируются на сформированных с помощью программных средств, описанных в [8], онтологий данного подпространства и универсального. Основную роль при реализации алгоритмов ввода данных в ЕЦПНЗ играет вспомогательный класс Форматы, входящий в универсальное подпространство ЕЦПНЗ. Его роль – обеспечить возможность многоаспектного формально-логического контроля при формировании контента ЕЦПНЗ и облегчить навигацию по ресурсам пространства при поиске информации. Как показано в [17], в справочниках каждого атрибута и связи в обязательном порядке указывается URN одного из объектов класса Форматы, составляющие которого определяют требования к данному атрибуту или связи. Справочник класса Форматы в нотации JSON, в соответствии с обозначениями, приведенными в [17], имеет вид {“Title”: “форматы элементов”, “PrefCl”: “UNFT”, “GuideURN”: “A_UNFT”, “Ref”: “объектами класса являются наборы данных, определяющие вид атрибутов и связей объектов, типы данных их значений и прочие характеристики, отраженные в справочнике атрибутов объектов этого класса”}. Справочник атрибутов объектов класса Форматы имеет четыре составляющих (в про- цессе развития ЕЦПНЗ в него могут добавляться новые элементы): {“A_UNFT.1”: [{“Name”: “вид атрибута или связи”, “Format”: “UNFT.1” //простой текстовый обязательный уникальный атрибут первого рода, “DicURN”: “N_A_UNFT.1”: “DicType”: “S ”}]}. {“A_UNFT.2”: [{“Name”: “тип представления данных”, “Format”: “UNFT.1”, “DicURN”: “N_A_UNFT.2”: “DicType”: “S”}]}. {“A_UNFT.3”: [{“Name”: “обязательное или факультативное значение атрибута”, “Format”: “UNFT.1”, “DicURN”: “N_A_UNFT.3”: “DicType”: “S”}]}. {“A_UNFT.4”: [{“Name”: “уникальное или множественное значение атрибута”, “Format”: “UNFT.1”, “DicURN”: “N_A_UNFT.4”: “DicType”: “S”}]}. Словарь значений атрибутов первой составляющей содержит все типы объектов и связей, перечисленные в [8]. Он представляется в виде {N_A_UNFT.1: [{“N_A_UNFT.1.1”: “простой атрибут первого рода”,“N_A_UNFT.1.2”: “простой атрибут второго рода”, …“N_A_ UNFT.1.n”: “специфическая составная связь третьего рода”]}. Фрагмент словаря значений второго атрибута: {N_A_UNFT.2: [{“N_A_UNFT.2.1”: “любой текст”, “N_A_UNFT.2.2”: “целое число”, “N_A_ UNFT.2.3”: “дата в формате гггг.[[мм].дд]”, “N_A_UNFT.2.4”: “адрес электронной почты” // и т.д.}]}. Словари значений третьего и четвертого атрибутов содержат по две составляющие: {N_A_UNFT.3: [{“N_A_UNFT.3.1”: “обязательный элемент”, “N_A_UNFT.3.2”: “факультативный элемент”}]}. {N_A_UNFT.4: [{“N_A_UNFT.4.1”: “уникальное значение”, “N_A_UNFT.4.2”: “множественное значение”}]}. Собственно UNFT.n представляется в виде {“UNFT.1”: “N_A_UNFT.1.1; N_A_UNFT.2.1; N_A_UNFT.3.1; N_A_UNFT.4.1”}. Наличие в справочниках атрибутов элемента UNFT.1, указывает на то, что каждый элемент словаря объектов класса Форматы должен включать четыре составляющие, относящиеся к словарям, перечисленным выше.
Исходными данными для алгоритмов служат сформированные ранее справочники подпространств, классов и атрибутов объектов и связей, а также словарь форматов и статические словари значений атрибутов. Результатом работы алгоритмов являются словари конкретных объектов и связей между парами объектов или их атрибутов.
Структура программного комплекса В состав комплекса входят следующие модули: формирование словарей объектов, формирование связей между объектами и их атрибутами, редактирование контента, просмотр объектов.
Формирование словарей объектов На рисунке 2 представлен модельный пример списка атрибутов объектов класса Адми- нистративные единицы. Для каждого атрибута по его справочнику система определяет, является ли его значение обязательным или факультативным, уникальным или множественным. На рисунке 2 обязательные атрибуты выделены жирным шрифтом, рядом с уникальными атрибутами стоит восклицательный знак.
После ввода значения данного атрибута система определяет по его справочнику наличие атрибутов второго уровня, и в случае обнаружения переходит к вводу их значений. Следует отметить, что если у атрибута указан формат «количественная характеристика» или «временная характеристика», то сначала предлагается выбирать единицу измерения, а затем выбрать или ввести числовое значение. Если у атрибута указан формат «атрибут как связь», то предлагается выбрать объект для установления связи из списка объектов класса, указанного в справочнике данной связи. Если связь «составная первого рода», то также необходимо выбрать или ввести значение атрибута данной связи. По формату атрибута система также определяет, является он уникальным или повторяющимся, во втором случае предлагается ввести его следующее значение. После окончания ввода значений атрибута система возвращается на список названий, если в нем уже нет обязательных элементов, то система позволит закончить ввод (кнопка «Закончить ввод данных»). После ввода всех необходимых значений атрибутов будет сформирован объект, для которого можно сразу вводить связи либо перей- ти к вводу следующего объекта, а связи сформировать позднее. Формирование связей Универсальные связи между значениями атрибутов объектов. Для определения субъекта связи последовательно выбираются подпространство, класс, атрибут, затем нужный элемент из его словаря значений. На рисунке 4 показан процесс выбора значения из словаря атрибута Ф.И.О. класса Персоны универсального подпространства. Далее из списка названий имеющихся в системе универсальных связей между значениями атрибутов выбирается нужная. Выбор объекта связи также осуществляется из его словаря значений, в случае отсутствия необходимого возможно ввести его в словарь. Примером универсальной простой связи между атрибутами является связь «эквивалентно», например, между значениями «Погорелко К.П.» и «Pogorelko K.P.». В случае универсальной составной связи первого рода после выбора объекта связи из словаря значений атрибута данной связи выбирается необходимое значение. Таким примером является связь «эквивалентность (другой язык)», с помощью которой можно указать перевод значений атрибутов объектов на различные языки. Подобная связь установлена между значениями «Германия» и «Germany» с указанием значением атрибута связи «язык» «английский»,
После выбора нужной связи в соответствии с ее справочником определяется ее объект. Простая связь межу выбранными субъектом и объектом сформируется сразу. Например, в подпространстве География, в классе Административные единицы между субъектом «Архангельская область» и объектом «Северо- Западный округ» установлена универсальная связь «является частью». В случае составной связи первого рода после определения субъекта и объекта следует из словаря значений атрибута выбрать необходимое или ввести новое значение. Так, например, при формировании специфической связи первого рода, «публикации с организацией», для субъекта «Библиосфера» (класс Публикации) и объекта «Государственная публичная научно-техническая библиотека Сибирского отделения РАН» (класс Организации и их подразделения) для атрибута связи «роль организации в создании публикации» выбирается значение «издательство» (рис. 6). В составных связях второго рода (универсальные и специфические) после определения значения атрибутов связи первого уровня необходимо также выбрать или ввести значения второго уровня. Специфической связью второго рода является связь «соподчиненность организаций». Субъект и объект для ее установления выбираются из класса Организации и их подразделения. Значение атрибута связи «вид взаимоотношений организаций (подразделений)» выбирается из списка: филиал, отделение, отдел, лаборатория, прочий тип подразделения. Далее вводятся значения для атрибутов второго уровня «дата установления связи» и «дата изменения вида отношений». В отличие от связи второго рода, где значение атрибута второго уровня может относиться к любому значению первого уровня, в связи третьего рода значения атрибута второго уров- ня относятся к определенному значению первого уровня. Примером специфической связи третьего рода является «многоуровневая связь организации с персоной». В ней атрибут первого уровня «роль персоны в организации» в существующей модели может принимать значение из списка: сотрудник, руководитель, учредитель, спонсор. В случае выбора значения «сотрудник» предлагаются значения атрибута второго уровня «должность», например: главный, ведущий, старший или младший научный сотрудник. Если на первом уровне выбрать значение «руководитель», то предлагаются значения атрибута второго уровня «статус руководителя»: директор, генеральный директор, президент, председатель совета директоров, научный руководитель. Универсальная составная связь второго рода между значениями атрибутов конкретного объекта. При формировании связи выбирается подпространство, класс, затем объект. Из списка значений атрибутов выбранного объекта выбирается значение, для которого бу Редактирование контента
Модуль редактирования позволяет добавлять или удалять связи для выбранного объекта, а также полностью удалить объект при отсутствии связей. Описание объекта делится на два списка: первый – названия атрибутов и их значения (если атрибут повторяющийся, при переходе по гиперссылке будут показаны его значение или значения), второй – названия атрибутов, у которых нет значений (при переходе по гиперссылке предоставляется возможность их ввода).
Если атрибут повторяющийся, то будет доступна гиперссылка «Добавить значение», если необязательный, то рядом с каждым его значением будет находиться гиперссылка «Удалить», если и обязательный, и повторяющийся и имеет более одного значения, то рядом с каждым значением будет находиться гиперссылка «Удалить». Просмотр объектов
Так, при переходе по гиперссылке «муляж гриба «Подгруздь белый»» получим описание данного объекта, где показаны его связи с моделью гриба («связь объекта с его изображени- ем или мультимедиаресурсом»), с микологичес- кой коллекцией Государственного биологического музея («является частью»), с организацией («организация – хранитель музейного объекта») (рис. 9). Заключение Разработка алгоритмов и их реализация средствами описанного программного комплекса являются очередным этапом исследований, связанных с формированием ЕЦПНЗ. Моделирование процессов ввода объектов разного вида, описываемых атрибутами различных типов, а также связей между объектами и значениями атрибутов, показало работоспособность и эффективность разработанного решения. Развитие исследований предусматривает создание комплекса алгоритмических и программных средств интеллектуального поиска и навигации по связанным ресурсам ЕЦПНЗ, обеспечения информационного взаимодействия между ЕЦПНЗ и потребителями услуг. Список литературы
References
|
| Постоянный адрес статьи: http://www.swsys.ru/index.php?page=article&id=5216 |
Версия для печати |
| Статья опубликована в выпуске журнала № 4 за 2025 год. [ на стр. 715-723 ] |
Статья опубликована в выпуске журнала № 4 за 2025 год. [ на стр. 715-723 ]
Возможно, Вас заинтересуют следующие статьи схожих тематик:Возможно, Вас заинтересуют следующие статьи схожих тематик:
- Диалоговый программный комплекс для формирования онтологии единого цифрового пространства научных знаний
- Управление процессом моделирования движения объекта с ударами о преграду
- Моделирование трехмерных температурных полей в электронных модулях
- Основные этапы создания интеллектуальных обучающих систем
- Технология и средства автоматизации имитационного моделирования процессов управления региональной безопасностью
Назад, к списку статей


Представленные на рисунке 1 алгоритмы реализованы в виде программного комплекса. Он разработан с использованием технологии Microsoft ASP.NET [18, 19] на платформе Microsoft.NET Framework на языке C# [20, 21]. Опишем его подробнее.
Из списка подпространства, сформированного на основании справочника подпространств ЕЦПНЗ, созданного ранее с помощью програм- много комплекса [8], пользователю предлагается выбрать то, в которое будут вводиться данные. Затем на основании анализа справочника классов выбранного подпространства система предлагает определить класс формируемых объектов. На следующем шаге на экран выводится список названий атрибутов объектов выбранного класса (список формируется на основе справочника атрибутов объектов данного класса).
Рядом с каждым значением атрибута находится гиперссылка «Изменить», предоставляющая возможность его редактирования.