Интернет-технологии для гуманитариев | Борисов Николай Валентинович Директор, доктор физико-математических наук Междисциплинарный центр Санкт-Петербургского государственного университета Адрес: 199178 Санкт-Петербург, 14-я линия В.О., д.29 Тел.: (812) 328-4451 Факс: (812) 323-7175 E-mail: borisov@icape.nw.ru http://www.icape.ru
|
В.А. Капустин, Филологический факультет Санкт-Петербургского государственного университета Тезисы: Интернет-технологии для гуманитариев
Н.В. Борисов[1], [2]
[1] Междисциплинарный центр Санкт-Петербургского государственного университета, Санкт-Петербург
[2] В.А. Капустин, Филологический факультет Санкт-Петербургского государственного университета, Санкт-Петербург
Работа исследователя в области гуманитарных наук – это почти всегда работа с текстом. И даже если основой исследования являются, например, изображение или звук, результатом исследования все равно становится текст. Естественный инструмент для работы с текстом – компьютер – все более активно осваивается гуманитариями. Последнее десятилетие, однако, даже текст в компьютере зачастую выступает как двоичные данные – достаточно, например, попробовать открыть документ Word в текстовом редакторе Блокнот.
С появлением Интернета ситуация стала меняться. Многообразие компьютерных платформ, подключенных к Интернету, вынудило использовать технологию, безусловно поддерживаемую всеми платформами – передачу информации в виде текстовых файлов. Однако типографские достижения таких персональных приложений, как Word и издательские системы привели к включению в передаваемые через Интернет данные не просто текста, но текста с разметкой, предназначенной для типографских и смысловых выделений в тексте. Для разметки текстов в начале 90-х годов XX века стал использоваться специальный язык – HTML [1], использующий текстовое представление разметки. К рубежу XX–XXI веков HTML стал массовым средством публикации, по крайней мере для результатов исследований. Это приводит к необходимости изучения элементов HTML и смежных технологий (прежде всего, каскадируемых таблиц стилей [2] – CSS) для подготовки качественных публикаций.
В то же время развитие Интернет-технологий привело в самом конце 90-х годов к появлению нового языка разметки, формально вообще не связанного с внешним представлением текста, но предназначенного исключительно для выделения смысловых структур в тексте – XML [3]. Возможность использования простейших текстовых редакторов для внесения разметки оказалась весьма привлекательной, и XML-технологии стали проникать в гуманитарные исследования. Оказалось, однако, что эффективное применение XML-технологий требует понимания не только небольшого базового стандарта [3], но и целого ряда смежных технологий (XLink, XPath, XSLT и пр. и/или JavaScript), необходимых для качественной визуализации документов с внесенной разметкой.
Обеспечение эффективного поиска публикаций в Интернете требует, в свою очередь, оснащения этих публикаций метаинформацией [4,5], минимальную структуру которой определяет "Инициатива Dublin Core" [4].
Развитие технологий создания интерактивных Интернет-ресурсов, поддерживающих те или иные режимы коллективной работы, приводит к необходимости все более тесных контактов исследователей-гуманитариев с разработчиками информационных систем. При этом полезным и эффективным оказывается даже просто понимание тех проблем, которые могут встать перед разработчиками подобных систем для гуманитарных исследований. Поэтому появляется актуальная задача создания учебных материалов, в которых описание интернет-технологий было бы сделано языком и в стиле, которые бы, по возможности, могли бы быть восприняты исследователями с гуманитарным, а не техническим образованием.
В рамках проекта, поддержанного Российским гуманитарным научным фондом, авторами в СПбГУ разработан ряд учебных курсов различного формата, посвященных упомянутым технологиям. Вход в эти курсы размещен на сайте www.ithum.nw.ru. Курсы спроектированы так, чтобы обеспечить возможность освоения излагаемого материала специалистам именно с гуманитарным, а не техническим образованием и стилем мышления.
Среди доступных курсов присутствуют "Основы технологий Интернета", "Поиск информации в Интернете", "HTML-разметка", "Основы веб-дизайна", "XML". Завершается разработка курсов по JavaScipt и Dublin Core.
Следует отметить отрадную тенденцию, наметившуюся в 2003 г. – начали появляться визуальные инструменты для работы с XML [6,7]. Они еще громоздки [7] и/или требуют для поддержки использования достаточно дорогих коммерческих инструментов [6], но демонстрируют тенденции в развитии технологии работы с размеченным текстом – сложности, связанные собственно с разметкой, по мере возможности скрываются от пользователя, снижая требования к его/ее техническим навыкам.
Поскольку, однако, исследователи, как правило, работают не с массовыми структурами разметки (типа описаний популярной музыки или новостей СМИ), а с уникальными видами разметки, то настройка подобных визуальных инструментов все равно потребует, по крайней мере, понимания лежащих в их основе технологий.
Работа поддержана Российским гуманитарным научным фондом, грант № 01-06-12012в
1. HTML 4.01 Specification.– http://www.w3.org/TR/html4/
2. Cascading Style Sheets, level 2 revision 1. CSS 2.1 Specification.– http://www.w3.org/TR/2002/WD-CSS21-20020802
3. Extensible Markup Language (XML) 1.0 (Second Edition).– http://www.w3.org/TR/REC-xml
4. Dublin Core Metadata Initiative.– http://dublincore.org/
5. Верняев И.И., Герасименко Е.Е., Ивановская Н.И., Панкратов В.Б., Чугунов А.В. Информационная система "Этнография народов России": проблемы метаинформации// Научный сервис в сети Интернет: Труды Всероссийской научной конференции. Новороссийск, 23-28 сентября 2002 г.– М.: Изд-во МГУ, 2002. С. 174 - 177.
6. http://www.altova.com/
7. Free XML and CSS editor.– http://www.morphon.com/index.shtml
|