Санкт-Петербургский государственный университет (г. Санкт-Петербург), 19.04.2022
Дата публикации: 21.04.2023
Российский фонд фундаментальных исследований принял итоговый отчет по проекту «Формирование баз знаний на основе данных эмпирических исследований: онтологический подход (ЭМПИРИОН)» преподавателей Санкт-Петербургского университета с формулировкой «Полученные результаты соответствуют уровню мировых достижений в области онтологического инжиниринга, а по отдельным аспектам опережают».В течение трех лет преподаватели ВШМ СПбГУ Ирина Лещева, Дмитрий Кудрявцев и аспирант Алена Беглер работали над созданием уникального IT-сервиса для ученых: системы онтологий для описания данных эмпирических исследований. В начале 2020 года РФФИ поддержал данную идею. Проект осуществлялся под руководством профессора СПбГУ Татьяны Гавриловой (кафедра информационных технологий в менеджменте ВШМ СПбГУ).
«Проект относится к computer science и посвящен разработке концептуальных моделей или онтологий. Что это такое? Онтология описывает основные понятия любой проблемы или задачи и связи между ними. Для онтологий есть специальный язык программирования, поэтому они понятны всему миру и программам, — рассказала Татьяна Гаврилова. — Идея проекта родилась у Алены Беглер по итогам работы с данными научных исследований в открытых репозиториях, где сейчас находятся огромные массивы информации».
Данные – это важный источник получения знаний, при этом количество получаемых данных возрастает с каждым годом. Новая методология формирования баз знаний, основанная на системе онтологий, может сделать их обработку более эффективной и помочь ученым в работе.
Таким образом родилась идея объединить данные друг с другом, что позволило бы повторно анализировать и проверять гипотезы. Существует ряд онтологий для описания массивов, полученных в результате исследований. «Мы провели структурированный поиск таких моделей и выделили 16 подходящих онтологий, а потом обобщили эти подходы и предложили свою онтологию ЭМПИРИОН, позволяющую объединять данные схожих исследований. Полученная онтология, во-первых, заполняет дыру в существующей инфраструктуре, связывая разрозненные части в единое целое, во-вторых – предоставляет возможность полноценного описания переменных, которое может лечь в основу интеграции массивов данных», — заключила Татьяна Гаврилова.
Кроме самой онтологии исследователи ВШМ СПбГУ создали прототип на Python, который позволяет наполнять онтологию данными из любых массивов, следуя несложной процедуре. И онтология, и код выложены в открытом репозитории проекта.
Источник: СПбГУ