Гибридная документарно-фактографическая модель данных как техника реализации информационных систем культурного и учебного назначения | Казаков Виталий Геннадьевич Зам. зав. Мультимедиа центра Новосибирский государственный университет Адрес: 630090, г. Новосибирск, ул. Пирогова, 2 Тел.: (3832) 39-77-10 Факс: (3832) 39-77-80 E-mail: kazakov@phys.nsu.ru http://www.nsu.ru
|
Казаков Владислав Витальевич, Новосибирский государственный университет, тел.: (3832)39-77-10 Фет Яков Ильич, Институт вычислительной математики и математической геофизики Сибирского отделения Российской Академии Наук, тел.:(3832)34-39-94. Содержание : Введение
Современные требования к построению информационных ресурсов архивного, культурного и образовательного назначения ставят перед электронными средствами обучения задачи, требующие для их решения привлечения новейших информационных технологий и продуманной методики подготовки. Сайт из нескольких десятков HTML страниц, как правило, уже не удовлетворяет требованиям, предъявляемым к таким ресурсам, которые все более характеризуются сложной структурой данных, развитым гипертекстовым пространством, динамическим интерфейсом, использованием мультимедиа компонент и большим объемом содержащейся информации.
Построение и сопровождение подобных ресурсов без применения специализированных инструментальных средств уже не может быть эффективным. Инструментарий должен поддерживать работу по построению структуры и гипертекстового пространства, обеспечивать возможность работы с большими объемами данных, включая механизмы для их обработки, редактирования, построения сложных запросов и контроль целостности. Другой задачей инструментария является построение интерфейсов, обеспечивающих работу различных групп пользователей ресурса: конечных пользователей, авторов, дизайнеров и т.д.
Исследование способов организации подобных информационных систем и создание программного обеспечения для их построения и сопровождения является в настоящее время актуальной задачей развития культурно-образовательного информационного пространства Интернет. Одним из наиболее перспективных способов построения подобных информационных систем является использование технологий баз данных. Их применение дает мощные механизмы для решения таких вопросов как построение структуры и поддержка целостности данных, организация общих процедур для доступа к данным, включая выполнение сложных структурированных запросов и т.д.
Однако простой перенос технологий построения классических БД в область создания информационных систем культурного и образовательного характера существенно ограничивает возможности последних. Информация рассматриваемых ресурсов имеет ярко выраженную документарную составляющую и требует использование различных способов форматирования текста и размещение в нем графики, видео и другой мультимедиа информации. Базы данных, ориентированные, прежде всего, на фактографические данные, не имеют адекватных механизмов для работы с такими документами. Кроме того, в системах построенных на основе баз данных проблематично построение развитого гипертекстового пространства на основе контекстно-зависимых ассоциативных связей. Наконец, культурно-образовательные ресурсы требуют интерфейсов, как правило, значительно более сложных по сравнению с теми, которые реализуются при публикации в Web большинства фактографических баз данных.
Требования к организации данных
Перспективность создания электронных ресурсов культурно-образовательного характера в виде информационных систем, основанных на базах данных исследовалась в Мультимедиа центре НГУ в процессе разработки Интернет ресурсов для естественнонаучных и гуманитарных дисциплин. Практика построения таких систем подтвердила этот тезис, однако при этом встал вопрос о преодолении указанных выше ограничений, накладываемых традиционными технологиями баз данных.
Большинство практически используемых для построения информационных ресурсов систем достаточно четко разделяются на фактографические и документарные. В то же время, информация рассматриваемых ресурсов, отличаясь ярко выраженным документарным характером, имеет и существенную фактографическую составляющую. В этом случае возникает искушение выбора опробованной и надежной системы одного из этих типов. Однако в случае выбора чисто фактографической системы документарная составляющая информации будет страдать: ни форматированные тексты, ни другая слабоструктурированная информация, ни ассоциативные связи не могут быть включены в систему стандартными ее средствами. Выбор системы документарного характера открывает возможность широкого форматирования текстовой информации, использования ассоциативных связей, однако структура такого учебного пособия будет весьма нечеткой, а запросы, скорее всего, будут ограничены лишь контекстным поиском.
Мы можем констатировать, что в данном случае имеет место гибридный документарно-фактографический характер исходной информации, игнорирование которого при выборе модели данных негативно скажется на функциональности всего ресурса.
Нами сделана попытка, отвлекаясь от конкретных систем реализации, определить общие требования, которым должна удовлетворять модель данных для адекватной поддержки гибридной информации, кратко сформулированные ниже:
1. Модель данных должна обеспечивать средства эффективного хранения, редактирования и обработки множества единиц однотипной информации с возможностью организации отношений между типами и сложных структурированных запросов;
2. Модель данных должна обеспечивать максимальную независимость данных от контекста использования, в том числе данные должны быть полностью отделены от представления;
3. Модель данных должна обеспечивать работу с документарными данными и данными слабоструктурированного характера, например, форматированными текстами;
4. Для документарных данных модель должна обеспечивать организацию связей ассоциативного характера (гиперсвязей), например, от фрагмента текста одного элемента к другому;
5. Модель данных должна строиться с учетом требований к данному ресурсу и быть доступной для модификации в течение всего жизненного цикла ресурса;
6. Интерфейсы к ресурсу должны интегрироваться в модель данных;
7. Модель данных должна поддерживать множественные интерфейсы к системе
В настоящее время не существует программных средств для построения информационных систем, модель которых удовлетворяла бы сформулированным требованиям.
Организация данных в системе ЛЕММА
В Мультимедиа центре НГУ разрабатывается система для разработки, поддержки и публикации в Интернет информационных систем культурно-образовательного назначения ЛЕММА (Лекционная Мультимедиа Аудитория). Одной из задач, которые ставились при проектировании и реализации системы было обеспечить возможность построения ресурсов, модель данных которых в максимальной степени удовлетворяет сформулированным выше требованиям.
В качестве основы системы была выбрана реляционная платформа баз данных. Однако, построение информационных культурно-образовательного назначения непосредственно на основе реляционной СУБД, как отмечалось выше, весьма затруднительно. В метамодели фактографических баз данных отсутствует ряд понятий отражающих необходимую специфику информации: не определены понятия для проектирования интерфейсов системы, которые согласно предложенным требованиям должны быть включены в ядро данных; отсутствуют понятия для моделирования системы ассоциативных контекстно-зависимых связей; нет понятий для включения в модель средств хранения данных сложной нерегулярной структуры, например, форматированных текстов. Все это требует вести концептуальное моделирование в рамках иной системы понятий, учитывающих двойственный документарно-фактографический характер данных. Такая система понятий и правил их связывания может быть определена как гибридная метамодель, ориентированная на построение моделей данных информационных систем смешанного документарно-фактографического характера.
Однако применение новой метамодели неизбежно вызовет усложнение этапа проектирования реляционной схемы данных. Проектирование такой схемы, непросто и неоднозначно даже для концептуальной модели, построенной в родственной реляционным БД системе понятий. Сложность прямого отображение концептуальной модели, построенной в метамодели ЛЕММА на реляционную БД существенно возрастает. Отдельной проблемой в этом случае будет являться построение запросов к реляционному уровню. Все это ведет к тому, что проектирование и реализация систем в метамодели ЛЕММА, выполненная по стандартной схеме будет неоправданно сложным и доступным только высоко квалифицированным специалистам, что неприемлемо для широкого круга задач, связанного с построением учебных ресурсов.
Для решения данных вопросов нами был предложен следующий подход.
А. Разрабатывается система понятий и правил их связывания для построения концептуальной модели данных систем документарно-фактографического характера - метамодель данных.
Б. В системе строится новый логический уровень. Этот уровень должен быть максимально приближен к концептуальному, т.е. все понятия метамодели однозначно переводятся в объекты схемы логического уровня. Программное обеспечение информационной системы должно поддерживать работу по созданию модели данных в терминах логического уровня. Построение запросов к данным также должно вестись в терминах логического уровня, что существенно облегчит программирование интерфейсов к системе. Фактически концептуальный и логический уровни проектирования должны совпадать.
В. Реляционный уровень становится техническим уровнем исполнения. Логическая модель должна автоматически и однозначно переводиться программным обеспечением в реляционную схему. При этом реляционная схема будет содержать помимо таблиц хранения данных, ряд обязательных служебных таблиц, в которых прописана информация словаря данных логического уровня, а также хранится код прикладного ПО, реализующего интерфейсы к данным. В идеале уровень реляционной схемы должен быть полностью скрыт от пользователя логическим уровнем.
Г. Схема реляционного уровня отображается СУБД на физический уровень системы, на которой та функционирует.
Данный подход к построению модели данных и был реализован в системе ЛЕММА. Развита метамодель ЛЕММА для построения концептуальных моделей данных, в значительной мере удовлетворяющая сформулированным выше требованиям. Метамодель ЛЕММА можно характеризовать как гибридную модель, сочетающую в себе черты моделей реляционных, объектных и слабоструктурированных баз данных, дополненную механизмами, характерными для гипертекстовых систем.
Системой ЛЕММА поддерживается новый логический уровень моделирования данных. Данный уровень спроектирован таким образом, чтобы максимально соответствовать метамодели ЛЕММА и именуется уровнем метамодели. На уровне метамодели хранится информация о данных: типы зарегистрированных в системе данных, типы разрешенных связей между элементами различных типов данных, существующие методы представлений зарегистрированных типов данных, к какому типу данных какой элемент системы относится, какие связи существуют между элементами системы и другая информация такого рода. Все взаимодействие с данными осуществляется через уровень метамодели. На этом уровне вводятся такие объекты для доступа к данным учебного ресурса, как Классы, Элементы, Отношения, Связи, Шаблоны, Интерфейсы. На этом уровне, собственно, и строится концептуальная модель ресурса.Система ЛЕММА определяет правила трансляции с уровня метамодели в реляционные схемы. Эти правила поддерживаются программным обеспечением системы ЛЕММА. Каждая реляционная схема, полученная по концептуальной модели ЛЕММА содержит два типа таблиц. Во-первых, это предопределенное множество служебных таблиц, наличие которых обязательно. Такие таблицы содержат, например, информацию о типах данных и отношениях, введенных в концептуальной модели (словарь уровня метамодели). Во-вторых, это таблицы, появление которых зависит от конкретной концептуальной модели. В них содержатся исключительно данные ресурса. Программное обеспечение обеспечивает построение модели данных ресурса непосредственно на уровне и в терминах метамодели. Это обеспечивается библиотекой транзакций, контролирующей ядро данных системы (разумеется, через уровень реляционной СУБД). Взаимодействие с данными ресурса также строится на уровне понятий метамодели и затем переводится в SQL запросы реляционного уровня.
Опыт построения информационных ресурсов
На базе программного обеспечения ЛЕММА был построен и апробирован ряд информационных систем культурно-образовательного назначения.
Археологический Web-музей «Древнее искусство Сибири» (http://www.mmedia.nsu.ru/museum) [1]. Многофункциональный ресурс научного, учебного и культурного назначения. Номинант Всероссийского конкурса образовательных ресурсов Интернета «Образование в Рунете» 2002 г. (http://konkurs.auditirium.ru) в номинации «Интернет ресурсы по гуманитарным дисциплинам».
Мультимедиа учебник Родная история. Начальный курс. (http://www.mmedia.nsu.ru/history). Образовательный ресурс для средней школы. Статическая копия информационного ресурса была издана на CD-ROM и используется в качестве учебного пособия в ряде школ, в том числе в Православной Гимназии во имя Преподобного Сергия Радонежского (в соавторстве с коллективом которой сделан данный ресурс) и Плесковской Православной Гимназии. Номинант конкурса «Образование в Рунете» 2002 г. в номинации «Обучение и тестирование».
Атомная физика (http://www.mmedia.nsu.ru/atombook). Учебное пособие, в котором присутствует обширная математическая нотация, реализованная отображаемая в Интернет с помощью языка разметки MathML.
В настоящее время проводятся работы по созданию виртуального архива "История отечественной кибернетики и информатики" (http://www.mmedia.nsu.ru/CShistory) [2]. Задачей архива является, отражение логики и истории развития идей, школ, проектов через документы, статьи, книги, письма, биографии, дискуссии, фото-, аудио- и видео- материалы. В настоящее время наблюдается жесткий дефицит исследований в области истории отечественной информатики, а соответствующая литература отсутствует. До недавнего времени в нашей стране этим вопросам не уделялось внимания. Так в ведущем академическом журнале "Вопросы истории естествознания и техники" работы по истории информатики практически отсутствуют. Единственный в России виртуальный музей, посвященный данной тематике (http://www.computer_museum.ru) публикует только отдельные статьи-обзоры и некоторые биографические очерки. На Украине существует Музей компьютерной науки (http://www.icfcst.kiev.ua), материалы которого отражают только историю советского компьютеростроения, но не затрагивают всего многообразия развития компьютерных наук. То же самое можно сказать об изданных в Киеве книгах Б.Н. Малиновского. Данная система может восполнить существующий в данной области дефицит и стать важной составной частью Российской Сети Культурного Наследия.
Работа поддержана Российским Фондом Фундаментальных Исследований (грант 02-07-90301) и Институтом «Открытое Общество» (грант #1BE904)
1. Казаков В. Г., Хаславская Л. М., Лебедев И. А., Алексеева Т. Е., Каменский Н. В., Задорожный А. М. Археологический электронный музей "Древнее искусство Сибири". – В сб.: Информационные технологии в гуманитарных исследованиях. Новосибирск, 2000.
2. Казаков В.Г., Фет Я.И. Виртуальный архив «История отечественной кибернетики и информатики». Публикуется в данном сборнике.
|