Исторические информационные системы: теория и практика
Надежда Георгиевна Поврозник
Сергей Иванович Корниенко
Динара Амировна Гагарина
Исторические, или историко-ориентированные, информационные системы – значимый элемент информационной среды гуманитарных наук. Его выделение связано с развитием исторической информатики и историко-ориентированного подхода, формированием информационной среды, практикой создания исторических ресурсов.
Книга содержит результаты исследования теоретических и прикладных проблем создания и внедрения историко-ориентированных информационных систем. Это первое комплексное исследование по данной тематике. Одни проблемы в книге рассматриваются впервые, другие – хотя и находили ранее отражение в литературе, но не изучались специально.
Издание адресовано историкам, специалистам в области цифровой истории и цифровых гуманитарных наук, а также разработчикам цифровых ресурсов, содержащих исторический контент или ориентированных на использование в исторических исследованиях и образовании.
В формате PDF A4 сохранен издательский макет.
С. И. Корниенко, Д. А. Гагарина, Н. Г. Поврозник
Исторические информационные системы: теория и практика
Рецензенты:
доцент Школы исторических наук факультета гуманитарных наук Национального исследовательского университета «Высшая школа экономики», к.и.н. Д. А. Добровольский;
заведующая кафедрой документоведения, архивоведения и истории государственного управления Уральского федерального университета, д.и.н., доцент Л. Н. Мазур;
доцент кафедры исторической информатики исторического факультета Московского государственного университета им. М. В. Ломоносова, директор Института цифровых гуманитарных исследований Сибирского федерального университета, к.и.н. А. Ю. Володин
* * *
Введение
Существенную часть информационных ресурсов гуманитарных наук и образования составляет историческая информация. Со временем увеличивается ее объем, растет количество и разнообразие источников данных – исторических источников. В этих условиях важными становятся подходы к извлечению, организации, хранению и обработке исторической информации, выбору соответствующих средств и методов, а также обеспечение их научности, строгости и верифицируемости. В значительной степени указанные задачи позволяют решать исторические информационные системы, которым посвящена представляемая книга.
Информационные системы параллельно с решением вычислительных задач практически сразу становятся одним из главных направлений развития ЭВМ. Их специфика требует структурированной организации, основой чего наиболее часто являются базы данных. К концу 1980-х – началу 1990-х годов базы данных и информационные системы начинают исследоваться в аспектах исторической науки и исторической информации.
Исторические, или историко-ориентированные, информационные системы (мы будем употреблять эти понятия как синонимичные) – значимый тип исторических ресурсов и важный элемент информационной среды гуманитарных наук и образования. Выделение этого класса систем связано с несколькими тенденциями: развитием исторической информатики, цифровой истории и историко-ориентированного подхода; формированием информационной среды истории и гуманитарных наук в целом, инфраструктуры цифрового исторического и культурного наследия; практикой создания исторических электронных ресурсов, в частности баз и банков данных.
Представленное издание содержит результаты исследования методологических, теоретических и прикладных проблем создания и использования историко-ориентированных информационных систем. Монография является первым комплексным исследованием по заданной теме. Одни проблемы в книге ставятся и рассматриваются впервые, другие – хотя и находили ранее свое отражение в соответствующей литературе, не изучались специально и столь глубоко.
В главе 1 монографии рассмотрены изменения в информационной среде исторической науки, дана характеристика информационных ресурсов различного типа. На основе анализа историографии и многолетней практики авторов сформулировано и обосновано определение исторических информационных систем; разработана методика их описания, классификации и оценки; проанализированы роль и место систем различного типа. Значимой частью работы является каталог «Историко-ориентированные информационные системы», который, с одной стороны, стал организационной основой исследования, а с другой – его практическим итогом и апробационной площадкой для полученных теоретико-методических результатов. Характеристика ресурса также приведена в этой главе.
В главе 2 комплексно рассмотрены вопросы разработки исторических информационных систем; проанализированы существующие подходы, их возможности и ограничения; разработаны обобщенные модели. Наибольшее внимание уделено системам на основе реляционной модели данных и технологий разметки текста XML-TEI. С точки зрения исторической специфики в этой главе описаны две важные текущие тенденции создания цифровых (в том числе исторических) ресурсов – краудсорсинг для реализации крупномасштабных проектов и массовое развитие доступных сервисов.
Глава 3 посвящена возможностям информационных систем в работе с историко-культурным наследием; проанализированы потенциал, роль и место рассматриваемого вида ресурсов в библиотеках, архивах и музеях. Глава содержит как технологические аспекты в частности создание 3D-моделей и виртуальных экспозиций, так и инфраструктурные: взаимодействие государства, организаций хранения и исследовательских учреждений при создании информационных систем, международное сотрудничество, документирование цифрового историко-культурного наследия.
В главе 4 издания описаны уровни поддержки и методики проведения конкретно-исторических, источниковедческих и историографических исследований на основе историко-ориентированных информационных систем, а также приведены примеры таких исследований. Кроме того, в главе уделено внимание возможностям информационных систем в решении специфических задач исторической науки.
Глава 5 полностью посвящена педагогическим, методическим и дидактическим вопросам. Приведены примеры, анализ и методика применения систем, имеющих изначально образовательный характер, а также варианты адаптации системы поддержки научных исследований, каталогов исторических источников и ресурсов другого типа. Кроме того, описаны методы и форматы обучения студентов разработке информационных систем с учетом исторической специфики.
Результаты, описанные в книге, были получены в ходе реализации ряда научных проектов, работа над которыми велась с 2003 г. в Центре цифровой гуманитаристики (до 2016 г. – Лаборатория исторической и политической информатики) Пермского университета, а в настоящее время продолжается на кафедре гуманитарных дисциплин НИУ ВШЭ – Пермь. Одним из наиболее значимых в этой серии стал проект «Историко-ориентированные информационные системы: методологические, теоретические и прикладные проблемы создания и использования», поддержанный Российским фондом фундаментальных исследований и реализованный в 2013–2015 гг. (грант РФФИ № 13-06-00655). Пользуясь случаем, авторы выражают благодарность фонду за многолетнюю поддержку проектов по созданию исторических информационных систем и проведению научных исследований на их основе.
Такое широкое по отражаемой проблематике исследование стало результатом работы целого коллектива. Кроме авторов книги в нем принимали участие сотрудники Центра цифровой гуманитаристики Пермского университета и кафедры гуманитарных дисциплин НИУ ВШЭ – Пермь. Авторы выражают искреннюю благодарность за предоставление материалов для монографии и общий вклад в работу молодым ученым О. В. Власовой, Ю. В. Ященко, А. Р. Ехлаковой, И. Д. Исмакаевой.
Представленное издание не могло бы состояться без внимательного прочтения вариантов рукописи нашими коллегами. Авторы признательны за советы и замечания А. Ю. Володину (МГУ им. М. В. Ломоносова), Л. Н. Мазур (УрФУ), А. А. Мироносу (ННГУ им. Н. И. Лобачевского). Благодаря критическому отношению к рецензируемой рукописи и детальным рекомендациям Д. А. Добровольского (НИУ ВШЭ) текст приобрел большую аккуратность, были уточнены некоторые классификации и обновлены описания отдельных ресурсов.
Глава 1. Исторические информационные системы: понятие, классификация и оценка
В этой главе рассматриваются состояние и тенденции развития исторических информационных систем на уровне понятийного аппарата, содержания, используемых исторических источников и других параметров. Даются классификация и характеристика некоторых типов систем. Предложена методика оценки историко-ориентированных информационных систем.
1.1. Исторические информационные системы как информационные ресурсы
Информатизация привела к коренным изменениям в информационных среде и структуре исторической науки. Наиболее отчетливо и полно это выразилось в возникновении междисциплинарных направлений на стыке гуманитарных наук, информатики и математики – гуманитарного компьютинга (Humanities Computing), клиометрии, квантитативной истории, исторической информатики (Historical Information Science), цифровых гуманитарных наук (Digital Humanities), цифровой истории и др.
Гуманитарии используют компьютеры для решения профессиональных задач практически с начала появления ЭВМ – с 1950-х годов. Наиболее ярким примером в области компьютерной лингвистики и использования информационных технологий (ИТ) для обработки исторических текстов является проект Index Thomisticus, разработанный священником и ученым Роберто Бусой[1 - Index Thomisticus [Электронный ресурс]. URL: http://www.corpusthomisticum. org/it (дата обращения: 10.07.2020).]. В это же время появляются исторические исследования с использованием ЭВМ, в основном для автоматизации обработки статистических данных [Thomas, 2004]. Эта связь между количественными историческими исследованиями и источнико-ориентированной обработкой данных (которая впоследствии стала основой источнико-ориентированного подхода к созданию баз данных) проанализирована в статье М. Таллера [Thaller, 1995]. По мнению автора, несмотря на то, что они часто рассматриваются как противоречия, фактически исключающие друг друга, на самом деле корни источнико-ориентированного подхода лежат в традиции количественных исследований.
До 1980-х годов число гуманитарных исследований с применением компьютеров было невелико; по мнению ряда авторов, они носили случайный характер [Alkhoven, Doorn, 2007; Feeney, Ross, 1993]. С 1980-х годов, с появлением микропроцессорной техники, компьютеры проникают уже во все гуманитарные науки, количество проектов стремительно растет. Но рост и значение ИТ неравномерно распределяются среди разных направлений гуманитарных наук, в некоторых областях роль компьютеров становится более важной, чем в других [Alkhoven, Doorn, 2007]. Неравномерность наблюдается и в отношении типов изучаемых документов – текстовых, статистических, визуальных, звуковых, устных источников и материальных объектов.
Развитие исторической информатики и других направлений, в настоящее время объединенных Digital Humanities, связано не только с научными исследованиями, но и с созданием электронных ресурсов. Необходимость их разработки определяется всем процессом цифровой трансформации общества, переходом к цифровой куль туре. С ростом числа компьютеров, а затем с появлением и распространением Интернета меняются способы создания, поиска, обработки и публикации источников [Alkhoven, Doorn, 2007]; увеличиваются количество и разнообразие цифровых информационных ресурсов, их удельный вес в информационной среде общества.
Заметной частью новой инфраструктуры гуманитарных наук в целом и исторической науки в частности являются предметно-ориентированные и адаптированные к этим областям информационные ресурсы и инструментарий. Исторические информационные ресурсы разнообразны по проблематике и назначению. Они могут быть продуктом академической и публичной истории, разрабатываться профессиональными историками, историками-любителями, студентами и даже школьниками. Это как продукты для научного изучения, продукты-результаты такого изучения, так и продукты для исторического образования и просветительских целей [Корниенко, Власова, Гагарина, 2012].
Среди исторических информационных ресурсов существенное место занимают исторические (историко-ориентированные) информационные системы. Этот вид ресурсов как форма и средство сохранения, организации, обработки и визуализации исторической информации позволяет эффективно решать проблемы учета своеобразия, содержательных и формальных особенностей исторических данных, знаний и науки в целом. Будучи сегодня одним из основных компонентов информационных ресурсов исторической науки и существенной частью информационных ресурсов социально-гуманитарных наук, исторические информационные системы, а также процессы их создания и использования отражают все характерные черты их природы и применения. В этом смысле приобретает определенную важность понимание тех свойств и характерных особенностей исторических информационных систем, которые вытекают из их принадлежности к информационным ресурсам вообще и историческим ресурсам в частности. Это относится прежде всего к определению понятия «исторический информационный ресурс». Для определения, классификации и анализа указанного вида ресурсов недостаточно интуитивного понимания исторической специфики и понимания информационных ресурсов вообще [Корниенко, Власова, Гагарина, 2012]. Как и в отношении ресурсов в целом, применительно к историческим информационным системам такой уровень понимания не обеспечивает нужной четкости определения характера, содержания, установки границ и критериев для отнесения ресурсов к историческим. Более того, при определенном подходе можно расширить границы содержания рассматриваемого понятия на весь круг ресурсов вообще. Очевидно, что с течением времени любые результаты, остатки и свидетельства деятельности человека станут историческими свидетельствами, т. е. историческими источниками. Такой подход к указанному понятию правомерен, поскольку он наиболее полно раскрывает то общее, что характеризует исторические информационные ресурсы как информационные ресурсы вообще. Однако в этом одновременно состоит и недостаток данного подхода. При нем и на формальном, и на содержательном уровнях исчезает специфика исторических информационных ресурсов. Поэтому существует и более строгий подход, основанный на учете природы и предназначения таких ресурсов. В этом случае к историческим информационным ресурсам относят только те, которые созданы специалистами в области исторических исследований или обучения. В то же время такая четкость и определенность оставляют за рамками рассмотрения значимую для исторической науки и образования часть ресурсов, например цифровые музеи, коллекции, библиотеки и тематические сайты междисциплинарного характера, а также любительские ресурсы.
Преодолеть как излишне расширительное толкование, так и чрезмерную строгость в определении понятия «исторический информационный ресурс» позволяет подход, при котором основным критерием служит отношение к предметной области – истории. Иными словами, целесообразно относить к историческим те ресурсы, в которых тем или иным образом присутствует историческая тематика. Такой критерий дает возможность определения исторических информационных ресурсов, минуя имеющиеся противоречия в подходах к этому понятию в научной литературе [Антопольский, 2004, с. 37–45] и законодательстве, а также дискуссии о предмете изучения истории как науки.
Представляется, что указанный подход и вытекающее из него определение достаточно продуктивны для оценки качества, исследовательской и образовательной эффективности использования, дальнейшего развития методик и инструментов создания и применения исторических ресурсов.
Как еще в начале 2000-х годов отмечал А. Б. Антопольский, разработка стандартов описания информационных ресурсов, а следовательно, и качество их документирования во многом связаны с содержанием понятия «информационные ресурсы» и их классификация ми [Антопольский, 2004, с. 37–45]. Разработка таких классификаций и стандартов описания связана с классификацией информационных ресурсов соответственно структуре и содержанию предметной области, для которой они предназначены. В описании исторических информационных ресурсов могут использоваться: атрибуты, общие для информационных ресурсов; исторические атрибуты, в том числе применяемые для описания исторических источников и литературы; назначение ресурсов; типы данных ресурсов; тематические атрибуты [Корниенко, Власова, Гагарина, 2012].
Существенное значение с точки зрения возможностей использования ресурсов имеет классификация по типу данных, которым представлена информация, и по соответствующим информационным технологиям. В этом смысле информационные ресурсы подразделяются на текстовые, гипертекстовые, числовые, графические (в том числе 3D, 4D), аудио-, видео-, мультимедиа-, интернет-ресурсы и др. Такая классификация может использоваться, в частности, для электронных версий источников и объектов культурного наследия – в зависимости от типа источника его электронная версия может быть представлена в виде текстовой, графической (в том числе 3D-графической), аудио- или видеоинформации. Те или иные ресурсы, как правило, являются комбинацией применения различных видов технологий [Корниенко, Власова, Гагарина, 2012].
Еще один аспект анализа исторических информационных систем как информационных ресурсов связан с их значительным распространением в Интернете. Исторические информационные системы как интернет-ресурсы представлены сегодня историко-ориентированными личными и коллективными, многопрофильными и проблемно-тематическими сайтами, порталами, сервисами, форумами, хранилищами данных, веб- и цифровыми историческими архивами, поисковыми системами. Наличие исторического характера и содержания в блогах, электронной переписке, тематических группах и на страницах в социальных сетях превращает содержащие их информационные системы в уникальные современные исторические интернет-ресурсы, обогащает их многообразие и возможности, повышает значимость.
Классификация исторических интернет-ресурсов может проводиться по разным критериям: по цели, содержанию, институциональному принципу, а также по совокупности критериев. Интерес представляют такие группы исторических интернет-ресурсов, как ресурсы, созданные для организации, хранения, обработки и представления массивов исторических источников и публикаций (национальные и международные электронные архивы; электронные библиотеки, каталоги, коллекции; виртуальные музеи; электронные исторические журналы и сайты традиционных периодических изданий); проблемно-тематические исторические интернет-сайты и порталы; сайты исторических научных и образовательных учреждений, а также учреждений хранения и национальной памяти (сайты исторических и гуманитарных факультетов университетов и исследовательских учреждений; сайты музеев, архивов, библиотек) [Корниенко, Власова, Гагарина, 2012].
Изучение исторических информационных систем на теоретическом и прикладном уровнях показывает, что к настоящему времени накоплен определенный опыт их классификации и описания, однако комплексных и общепринятых в среде историков систем классификации и стандартов описания на сегодняшний день не существует. В качестве основной проблемы их создания следует назвать значительное функциональное и содержательное разнообразие, а также быстрое технологическое усложнение. Преодолеть эти препятствия в отношении исторических информационных систем можно на основе анализа основных понятий, эволюции теоретических оснований, практики создания историко-ориентированных систем, разработки критериев для их классификации, выделения основных видов, типов и характеристик. Решению этих задач в значительной степени и посвящены следующие разделы.
1.2. Исторические информационные системы: понятие и эволюция в свете развития исторической информатики
В информатике в широком смысле под информационной системой понимают программный комплекс, к функциям которого относятся обеспечение хранения информации в памяти компьютера, выполнение специфических преобразований информации и предоставление интерфейса [Кузнецов, 2005]. Понятие «информационные системы» охватывает достаточно разнообразные ресурсы.
Первые специализированные публикации по проблематике использования информационных систем в исторической науке появляются в конце 1980-х – начале 1990-х годов. Среди таковых работа И. Кропача, в которой предложено толкование термина «историческая информационная система» [Kropac, 1988]. Как было указано во введении, значительную роль в формировании рассматриваемого класса систем сыграли историческая информатика, историко-ориентированный подход, специфика информационной среды истории и гуманитарных наук в целом, а также практика создания исторических электронных ресурсов, в частности баз данных. Эти аспекты могут быть отправными точками при определении и обосновании указанного понятия, выделении его видовых признаков, разработке классификации, требований, стандартов описания и т. д.
На основе изучения литературы, анализа и обобщения опыта разработки и применения рассматриваемых систем нами было предложено следующее определение: историко-ориентированные информационные системы – это особый класс информационных систем, предназначенных для хранения, организации исторической информации, обеспечения доступа к ней и ее аналитической обработки в соответствии с потребностями исторических исследований, образования и популяризации исторических знаний[2 - Это определение было впервые нами предложено в: Кирьянов И. К., Корниенко С. И., Гагарина Д. А., Рябухин И. В. Информационный ресурс по парламентской истории России начала XX в. // Власть. 2010. № 12. С. 83–86. В текущем варианте добавлено «…и популяризации исторических знаний», чего не было в исходной редакции.]. Данное определение соответствует имеющимся в литературе общим определениям понятия «информационная система» и отражает сущность историко-ориентированного подхода. Оно позволяет при всем многообразии историко-ориентированных информационных систем выделять их в особый класс на основе достаточно четких критериев, учитывающих специфику информации, методов, технологий ее обработки и визуализации, назначения и функций, связанных с реализацией подходов и методов исторических исследований, решением научных и (или) образовательных, просветительских задач в области истории. На основе данного определения достаточно удобно выстраивается иерархия понятий, связанных с историко-ориентированными информационными системами. Оно корректно соотносится с понятиями верхнего уровня – «информационные ресурсы», «информационные системы», «базы данных», «исторические ресурсы», а также с понятиями нижнего уровня – «исторические базы данных», «просопографические информационные системы», «историко-ориентированные геоинформационные системы (ГИС)» и др. В предложенное определение вполне укладываются и различные потенциальные параметры функционального назначения систем как информационных ресурсов: научно-исследовательские, образовательные, просветительные, политические, формирование и сохранение исторической памяти и др. На исторические информационные системы важно посмотреть и с точки зрения развития исторической информатики.
Историческая информатика (Historical Information Science) – междисциплинарное направление, изучающее теоретические и прикладные вопросы использования информационных технологий в исторической науке и образовании. Это направление приобретает свои очертания в середине 1980-х годов с распространением персональных компьютеров. Л. МакКрэнк, анализируя развитие данной области в период с 1984 по 2000 г., пишет, что историческая информатика вырастает из количественных методов в истории и социальных науках [McCrank, 2002]. Сам термин приходит на смену использовавшемуся ранее понятию «история и вычисления» (History and Computing), введенному по названию одноименного журнала. В отчете «Прошлое, настоящее и будущее исторической информатики» отмечается, что смена термина была удачной, так как история и вычисления – это «неопределенно и запутанно»; при этом историческая информатика не является ни историей, ни вычислением. «Это самостоятельная наука, имеющая собственные методологические рамки», – отмечают О. Бонстра, Л. Брере, П. Доорн [Boonstra, Breure, Doorn, 2006]. Предметом исторической информатики является историческая информация, а также способы ее создания, проектирования, редактирования, анализа и представления с помощью информационных технологий [McCrank, 2002].
Российскими специалистами в области исторической информатики Л. И. Бородкиным, И. М. Гарсковой, В. Н. Владимировым и др. были поставлены существенные методологические и прикладные проблемы, связанные с критическим анализом пройденного исторической информатикой пути и определением направлений ее развития [Бородкин, 2005; Бородкин, Гарскова, 2011; Владимиров, 2006; Гарскова, 2018]; среди них также создание и использование историкоориентированных систем.
Несмотря на стремительное развитие, теоретические обоснования, очевидную практическую значимость и неоднократно описанные в научной литературе перспективы, в настоящее время термин «Historical Information Science» практически не используется в англоязычной литературе. Во многом область исследований и разработок, ранее относившихся к исторической информатике, сейчас рассматривается в русле цифровой истории (Digital History), а также цифровой гуманитаристики (Digital Humanities) как зонтичного термина (umbrella term), объединяющего использование информационных технологий во всех гуманитарных науках. В русскоязычной литературе термин «историческая информатика» используется и сейчас, что связано с активной деятельностью Ассоциации «История и компьютер» и кафедры исторической информатики МГУ им. М. В. Ломоносова. При этом международная ассоциация History & Computing прекратила работу, проведя последнюю конференцию в Амстердаме в 2005 г., а после 2010 г. перестал издаваться и журнал History and Computing. Отмеченные изменения в эволюции направления, определяемого за рубежом понятием «Historical Information Science», а в России – «историческая информатика», привели к неоднозначному пониманию в нашей стране соотношения этого и других терминов, обозначающих в настоящее время процессы информатизации в исторических науке и образовании. Так, И. М. Гарскова в указанной монографии, констатируя факт «сходства в траекториях развития “исторического компьютинга” на Западе и исторической информатики в России до “точки бифуркации” в середине 2000-х годов», говорит об «их кардинальном различии в последнее десятилетие, отмеченном трансформацией “исторического компьютинга” в “цифровую историю” после нее» [Гарскова, 2018].