Компьютерная генеалогия. Российские базы данных и программное обеспечение (ч1)

«

Источник: Информационный бюллетень «»Вестник архивиста»»,
Москва, 2001, №4-5 (64-65), с.166-193.

Статья размещена на сайте с предварительного согласия автора.




Петриченко Михаил Борисович, член ИРО и РГО




Компьютерная генеалогия. Российские базы данных и программное обеспечение

Развитие информационных технологий приводит к тому, что все более активно развивается и выделяется в самостоятельное направление так называемая «»компьютерная генеалогия»». Возможность использования Интернета, всевозможных баз данных и специализированного генеалогического программного обеспечения, во многом заменяют большинству пользователей компьютеров на Западе необходимость посещения библиотек и архивов для проведения поиска о своих предках и родственниках. На территории же бывшего Советского Союза дело обстоит иначе: развитие «»компьютерной генеалогии»» находится только на начальной стадии становления. Но при этом уже сейчас сложно в одной статье описать все аспекты этой тематики. В данной работе мы попытаемся ответить на два следующих вопроса:




  1. Какие компьютерные базы данных генеалогического профиля, существуют на данный момент в России и как они могут быть полезны российскому исследователю?
  2. Какое программное обеспечение (ПО) лучше использовать на сегодняшний день российскому пользователю для внесения уже имеющейся генеалогической информации в компьютер?


Вообще работы по автоматизации средств поиска архивной информации начались в архивных учреждениях СССР в конце 70-ых годов. Была разработана концепция, включившая в себя следующие положения: обоснованной является лишь компьютеризация поиска архивных документов, относящихся к выборочным тематическим комплексам, имеющим особо важное общественно-политическое и народнохозяйственное значение, а также документов, которые наиболее часто запрашиваются исследователями. Ввод в систему сведений обо всех архивных документах является слишком дорогим и требует больших трудовых затрат. Было принято решение о поэтапном вводе в автоматизированную систему сведений о документах, хранящихся в государственных архивах СССР, на уровне фонда.


В соответствии с этой концепцией была разработана многофункциональная Автоматизированная Информационно-Поисковая Система (АИПС) для ряда тематических комплексов архивных документов, которая предназначалась для оперативного справочно-информационного обслуживания потребителей, а также для подготовки автоматизированным способом архивных справочников. Однако появление персональных компьютеров ознаменовало подлинную революцию в использовании ЭВМ и компьютерных технологий, принципиально изменило подходы к информатизации в архивном деле. Ведение вышеуказанной АИПС позволило накопить значительные информационные массивы в электронном формате. Большая часть из которых в дальнейшем была переведена на персональные ЭВМ. Почти все архивы, располагающие компьютерами, начали создавать базы данных как тематические, обеспечивающие использование документов, так и по другим направлениям деятельности архивов. В Научно-информационном центре технической документации (НИЦТД) были разработаны некоторые АИПС, такие как: «»Документы Великого Октября»» (для ЦГАОР СССР), «»История архитектуры и градостроительства (Москва, Ленинград)»» (для ЦГИА СССР) и другие. В архиве Советской Армии (ЦГАСА) в начале 1990-ых годов разрабатывался электронный указатель на всех погибших Советских солдат во время конфликтов на озере Хасан, реке Халхин-гол и во время Советско-Финляндская войны 1939-40 годов и другие. Надо отметить, что все указанные мною выше АИПС и базы данных никогда не носили генеалогического характера. А в связи с тем, что и на сегодняшний день в государственных архивах более половины компьютерного парка относится к устаревшим моделям (Роботрон, PC XT, PC AT/286), а концепция информатизации архивных учреждений была разработана только к 1995 году, говорить о целенаправленном развитии компьютерного направления в архивном деле пока еще рано.


Хотя сказать, что в этом направлении ничего не происходит тоже нельзя. Так, например, 6-9 апреля 2000 года состоялась Всероссийская конференция «»Новые информационные ресурсы и технологии в исторических исследованиях и образовании»», организованная историческим факультетом МГУ им. М.В.Ломоносова и ассоциацией «»История и компьютер»» (АИК). Конференция проводилась по секциям: квантитативная история, методологические проблемы исторической информатики, информационные технологии в исторических исследованиях, информационные технологии в историческом образовании, электронные ресурсы и Интернет. Количество докладов и сообщений оказалось рекордным за время существования исторической информатики — более 160. А география поступивших материалов охватывала российских, белорусских, азербайджанских, украинских и казахских специалистов. Но, к сожалению, выступлений специально посвященных компьютерной генеалогии на конференции не было.


А что же происходило с АИПС и базами данных по комплексам документов генеалогического профиля. Как развивались они? По инициативе Правления Историко-Родословного Общества 30 марта 1993 года в Москве было проведено совещание-семинар по проблемам использования компьютерной техники в генеалогических исследованиях. Целью семинара было заявлено проведение взаимного обмена информацией о разрабатываемых и реализуемых проектах по компьютерной обработке данных в области генеалогии и смежных дисциплин. В результате его работы проявилась наглядная картина состояния развития информационного обеспечения в области генеалогии в странах бывшего Советского Союза.1


Еще в 1984 году была проведена одна из первых попыток создания генеалогической базы данных, которая содержала основные сведения по членам нескольких отдельных семей и позволяла проводить с данными некоторые статистические исследования. Программа была написана на языке Фортран-4 и была впервые реализована на ЭВМ БЭСМ-6, но широкого распространения не получила.2


В Республике Беларусь при Институте истории АН Беларуси создавалась база данных обо всех населенных пунктах, упоминаемых в источниках XIV-XVI веков (до Люблинской унии 1569г.). Наряду с прочей информацией в базу данных вводились данные о владельце населенного пункта, и, таким образом, данная база имеет значение не только для исторической географии, но имеет черты и генеалогической базы данных. В том же институте была также начата работа по созданию машиночитаемого указателя для книг Литовской метрики. Комитет по архивам и делопроизводству при Совете Министров Республики Беларусь в начале 1990-ых годов начал работу по компьютеризации генеалогических сведений, хранящихся в Национальном архиве республики. В частности, предусматривается составление машиночитаемого указателя дворянских фамилий, занесенных в родословные книги белорусских губерний. Но наиболее трудоемкую задачу будет представлять обработка метрических книг, ревизских сказок и других документов, позволяющих проследить генеалогию всех сословий Белоруссии XVIII-XIX вв. и выйти на европейские стандарты в хранении и обработке генеалогической информации. Программа рассчитана на длительный срок.


В Государственном Историческом Музее (ГИМ) также реализовывались проекты, предусматривающие формирование иерархического систематизированного описания собрания ГИМ и первичного учета документов, хранящихся в отделе письменных источников ГИМ. Не отставал от него и Институт истории РАН, где создавалась система учета и анализа служебной деятельности высшего (1-ый-5-ый классы) чиновничества Российской Империи. Источниками служили формулярные списки указанных лиц, хранящиеся в фондах РГИА. Но целью данной системы являлось не накопление генеалогических данных, а предоставление исходного материала для анализа тенденций в эволюции названного социального слоя, поэтому сведения накапливались дискретно, по периодам с интервалами 20-25 лет.


В рамках деятельности Международной биографической группы «»Московия»», в тесном сотрудничестве с коллегами из Гарвардского университета (США) также в начале 1990-ых годов началось создание компьютерного Биографического банка данных Российского государства XIV-XVII веков, который должен был стать наиболее полным собранием сведений о лицах разных сословий, проживавших на территории России того периода. Предполагалось использование значительного количества источников, как опубликованных, так и архивных. Велась работа по вводу данных из боярских книг и списков XVII в., и практически была завершена подготовка массива данных по составу Боярской думы XV-XVII веков.3


На Урале также в настоящее время предпринимается попытка создания компьютерной базы данных по программе «»Родовая память»». Разработана программа была А.Г.Мосиным в 1995 году. В результате ее выполнения как раз и должна появиться база данных содержащая информацию по всему населению Среднего Урала конца XVI — начала XX веков и многотомный исторический «»Словарь уральских фамилий»», первый том которого благополучно вышел в свет в 2000 году. Но данная работа требует значительного финансирования и только в 1999 году в ЦНБ УрО РАН наконец были начаты работы по формированию компьютерной базы данных. Средства на это выделил Институт «»Открытое общество»» (Фонд Сороса). Но это только на один год. В дальнейшем пополнение базы данных будет вестись ЦНБ УрО РАН на основе договоров с администрациями различных территорий Урала, учреждениями, организациями и частными лицами, заинтересованными в первоочередном введении в базу сведений о жителях той или иной территории. Первой на предложение о сотрудничестве откликнулась администрация Каменского района Свердловской области — а это означает, что именно с этой территории и начнется формирование компьютерной базы данных «»Родовая память»».4


В Государственном архиве Пермской области с 1991 года занимаются разработкой АИПС архивного профиля. За это время в практическую работу архива внедрено 12 компьютерных программ. Одна из них — Межфондовый указатель «»Метрические книги»» представляет интерес для нас. При разработке программы использована база данных (каталог единиц хранения) программного комплекса (ПК) «»Госархив»», т.е. основная часть документов (заголовков ед.хр.) автоматически берется из ПК «»Госархив»». В программе предусмотрены сортировка и поиск информации по заданным критериям. В указатель включены метрические книги церквей Пермской епархии. Работает программа в среде MS DOS в FoxPro 1.2 и предусматривает три режима работы (режим просмотра, режим редактора, режим администратора). Также можно наблюдать разрозненные попытки создания баз данных генеалогического профиля и в других российских архивах, например: в Государственном архиве Сахалинской области была создана АИПС «»Метрические книги церквей острова Сахалина»», в Тобольском филиале Государственного архива Тюменской области создана тематическая база данных «»Перепись населения»», а в Государственном архиве Архангельской области (ГААО) разработаны самостоятельные базы данных по Ревизским сказкам (1744-1857 годов), Обывательским книгам (1785-1870 годов), Первой Всеобщей переписи населения Российской империи 1897 года (административно-территориальные единицы Архангельской губернии) и Метрическим книгам, хранящимся в ГААО.


Cозданная в Алтайском государственном университете база данных купеческих семей Западной Сибири второй половины XIX-начала XX вв. (разработчики — Гончаров Ю.М. и Колдаков Д.В.), представляет собой комплексный источник для анализа демографических процессов, протекавших в купеческой семье Сибири5. Это, пример применения информационных технологий в отношении документов, содержащих сведения о семьях какой-либо конкретно-исторической общности людей. Всего в работе было использовано более 600 архивных единиц хранения и 60 опубликованных источников. При этом практически все материалы относятся к группе исторических источников, содержащих определенный набор сведений о конкретных лицах, в том числе: алфавитные списки домовладельцев, формулярные списки, ревизские сказки, дела о возведении в потомственное почетное гражданство, метрические книги, исповедные росписи и др. Главной особенностью данной базы данных как источника является ее динамический характер, поскольку она содержит данные о каждом купце и его семье в различные моменты времени, позволяющие изучать изменения, касающиеся не только отдельных персоналий, но и основных национальных, географических, возрастных иных групп в структуре личного состава купечества Томской губернии. Всего в ней содержатся сведения о более чем 1300 купеческих семьях Томской и Тобольской губерний. В качестве системы управления базой данных авторы воспользовались СУБД Paradox. Большое значение имеет также возможность применения базы данных в качестве информационно-поисковой системы. Ее организация позволяет постоянно пополнять ее новыми сведениями, расширять географически и исторически.


Следует отметить, что в Мордовии также существует опыт разработки баз данных, которые можно отнести к категории генеалогических. О программе для работы с материалами подворных описей, разработанной в Мордовском Государственном Университете, говорится в сборнике трудов I-й конференции ассоциации «»История и Компьютер»»6. Также в этом же университете была разработана программа обработки ревизских сказок — RSKAZKA. Как отмечают сами авторы программы: «»изучение ревизских сказок позволяет проследить динамику численности населения, этнические процессы в регионе, изменение структуры семьи российского крестьянства. Это три наиболее интересных для нас проблемы из огромного числа вопросов, которые позволяет раскрыть обработка ревизских сказок»»7. К сожалению, задача использования базы данных в чисто генеалогических целях авторами не преследовалась. Но при этом ценность данной разработки ни сколько не уменьшилась. Программа RSKAZKA включает в себя средства для ввода исходных данных и их первичной обработки. Однако в связи с тем, что работа по обработке данных ревизских сказок ведется коллективом не так давно, соответственно и сама программа находится в стадии постоянной доработки и усовершенствования. Авторы не исключают изменений, призванных создать программный продукт, отвечающий всем требованиям современного пользователя.


Но в основном создание баз данных и АИПС генеалогического профиля — это все-таки единичные случаи на сегодняшний день, если рассматривать ситуацию на всей территории бывшего Советского Союза. К сожалению, сами архивы пока не имеют достаточно средств и острой необходимости создавать подобные информационные системы.


Компьютерная система «»Русская генеалогия»» была разработана в 1995 году в АО «»НАФТАМ»» (главный разработчик — д.т.н., профессор Смирнов М.И.). Это действительно уникальная, действующая в настоящее время база данных, в которой содержатся сведения о сотнях тысячах наших соотечественников с X по XX вв. По данным на 1 января 2000 года в базу данных было введено более 6800 дворянских родословных. Список источников, информация которых вошла в базу данных на начало 2000 года, составлял 328. Среди них работы П.В.Долгорукова, В.В.Руммеля и В.В.Голубцова, А.Б.Лобанова-Ростовского, Г.А.Власьева, Г.А.Милорадовича, В.И.Чернопятова, И.Н.Ельчанинова, Н.Н.Кашкина, В.Л. и Б.Л.Модзалевских, Л.М.Савелова, В.С.Арсеньева, А.А.Сиверса, С.Б.Веселовского, Н.Ф.Иконникова, Д.М.Шаховского, Ж.Феррана и многих других исследователей. Информационная база постоянно пополняется: ежемесячно в систему вводятся данные о тысячах новых лиц. Начаты работы по компьютерному вводу в систему архивных материалов. В перспективе — ввод информации по купечеству, представителям других сословий. Сама система позволяет получать биографическую информацию о личностях, описывать их родословные, строить деревья предков и потомков для любой персоны, устанавливать родственные связи между представителями разных фамилий, находить по определенным признакам отдельных персонажей, получать списки лиц, удовлетворяющих различным условиям (события, титулы, награды, должности, родственные отношения, география и т.д.). Важнейшей особенностью системы является то, что все вводимые в базу данных фамильные деревья пересекаются по соответствующим женским персонажам, являющимися дочерями представителей одних и матерями представителей других фамилий. Это позволяет компьютеру в считанные секунды устанавливать родственные связи между любыми персоналиями системы, используя в том числе женские и смешанные линии. Каждая запись содержит ссылку на источник информации. Система автоматического учета приоритетов позволяет устранить противоречия в разных источниках при реализации отдельных запросов к базе данных8. Со своей стороны мне бы хотелось отметить следующее: данные, которыми наполнена система, действительно уникальны, но вот в отношении самой програмной оболочки базы данных остается очень много нерешенных вопросов. Во-первых, на мой взгляд, оболочку пока сложно назвать дружественной для пользователя. И обусловлено это в первую очередь тем, что база данных никогда с момента своего создания не планировалась для свободного распространения среди пользователей. Этот вопрос стал подниматься уже совсем недавно, поэтому разработчики обещали приложить максимум усилий для доведения оболочки до удобновоспринимаемого формата. Второй момент — система создавалась для русскоязычного пользователя, и не имеет возможности экспортировать/импортировать данные из западных генеалогических систем, т.е. не использует формат GEDCOM. Эту проблему разработчики также обещали в ближайщее время устранить. Есть и еще ряд вопросов по поводу ввода данных и их просмотра, с точки зрения пользователя. Но в целом мы действительно можем гордиться тем, что в России создана и функционирует такая прекрасная генеалогическая система. И самое главное, что это уже реально работающая и постоянно пополняющаяся АИПС. С ее помощью, например, Государственный Исторический Музей выпустил в 1995 году буклет-плакат «»Род Голенищевых-Кутузовых»», а в 1999 году буклет-плакат «»Предки А.С.Пушкина»».


Еще один действующий проект — центральный банк данных «»Книга памяти»» — это база данных обо всех воинах, партизанах, подпольщиках, погибших, пропавших без вести или умерсших от ран в лагерях или плену в годы Великой Отечественной войны, созданная на основе Книг Памяти, которые создавались по каждому региону. Инициатором и создателем проекта является фонд «»Народная память»». Демонстрационная версия системы находится в Музее Великой Отечественной войны на Поклонной Горе в Москве. Любой гражданин может бесплатно обратиться к ним, с просьбой проверить в базе данных людей, погибших во время ВОВ, и получить о них информацию. Реализована база данных на языке программирования FoxPro под DOS и на сегодняшний день в нее внесено более пятнадцати миллионов персоналий. Следует отметить, что демонстрационная версия имеет некоторые ограничения. Поиск проводится по фамилии, имени, отчеству, дате рождения и гибели. Эту же информацию Вы и сможете получить или подтвердить. Более полные данные в базе данных не содержатся. Для проведения полноценного поиска необходимо заполнить специальную анкету и отправить ее в фонд «»Народная память»», где уже работники фонда займутся бесплатным поиском данных используя всевозможные архивы. К сожалению, из-за финансовых проблем фонда, Ваша анкета может пролежать на полке не один месяц. Также нужно иметь в виду, что база данных постоянно пополняется, как только сотрудникам фонда попадают в руки новые выпуски Книг Памяти по регионам, где они еще не выходили в свет, поэтому может так получиться, что именно Ваш родственник окажется еще не внесенным в этот электронный банк данных. Но заполненная Вами анкета поможет исправить ситуацию. Однако, не смотря на все трудности банк данных «»Книга памяти»» можно не без основания отнести к одному из наиболее интересных и уже реально работающих компьютерных проектов национального масштаба, имеющего генеалогический оттенок.


В связи с тем, что компьютеризация как опубликованных, так и архивных источников, носящих генеалогический характер, в странах бывшего СССР началась только порядка 10-15 лет назад, просматривается попытка охватить весь спектр задач, которые необходимо решать с помощью создания различных Банков Данных и АИПС. А за такой короткий период это сделать просто невозможно. В России еще не сформировался рынок потребителей такого рода информации, а средства, выделяемые из бюджета на развитие Архивной системы России явно недостаточны для финансирования целевых программ такого типа. Поэтому довольно часто созданием программного обеспечения занимаются энтузиасты, а не профессионалы высокого уровня. Так, например, во многих архивах базы данных ведутся c помощью Microsoft Excel и Word.


По существу, на начальной стадии развития в нашей стране находятся задачи анализа и разработки методов проектирования ИС по архивным источникам в области генеалогии (в частности, содержащим информацию по учету населения), т.е. систем, определяющих место хранения необходимой информации, и единообразного и повсеместного ввода в ЭВМ непосредственно самих источников (писцовые книги, метрические книги, исповедные ведомости, ревизские сказки и т.д.). Их решения являются необходимым этапом для реализации последующих задач, связанных с компьютерной обработкой архивных данных.


Также нужно отметить одну существенную деталь отличающую архивы бывшего СССР от западных архивов. У них, особенно в США, давно произведена компьютеризация всей архивной системы страны, причем в 90 % случаев занесены в базы данных уже сами тексты архивных документов. Для поиска необходимого архивного генеалогического источника Вы можете затратить 10 -15 минут в независимости от того, в каком городе США он хранится. В тоже время для аналогичного поиска у нас могут понадобиться недели работы специалиста — генеалога, а не просто любителя. Поэтому в зарубежных генеалогических Базах Данных прослеживается определенная специфика. Разработчики программного обеспечения свой упор делают на создание таких систем, которые могли бы заполняться рядовыми гражданами, увлекающимися генеалогией, прямо дома, и помогали бы им вносить в базу данных информацию непосредственно о своих родственниках, строить родословные деревья, проводить статистические исследования по истории своей семьи и т.д. А как обстоят дела с такого рода программами у нас?


Вторая часть нашей работы как раз и посвящена ответу на вопрос о том, какое программное обеспечение (ПО) лучше использовать на сегодняшний день российскому пользователю для внесения уже имеющейся генеалогической информации в компьютер? Вообще попытка провести анализ ПО, которое будет наиболее удобно и полезно российскому пользователю уже делалась неоднократно. Несколько лет назад Александр Агамов на своем сайте «»Королевские дома Европы»» (http://www.geocities.com/Athens/Acropolis/7593/) в разделе «»О софте»» освещал эти вопросы. В настоящее время в различных российских генеалогических конференциях (например, таких как «»Форум (общение генеалогов)»» на сайте М.И.Крутихина «»Поиск пропавших предков»» (http://www.mtu-net.ru/rrr/Russian.htm) и др.) эта тема также широко обсуждается. И что немаловажно, российские пользователи не только обсуждают, но и сами принимают активное участие в переводе интерфейсов и доработке наиболее интересных генеалогических программ, написанных на Западе. Появились также первые самостоятельные российские разработки генеалогического ПО.


А для чего вообще нужны компьютерные генеалогические программы? Л.А.Быкова в своей книге «»Генеалогические информационные системы США. Аннотированный справочник»» так отвечает на этот вопрос: они «»позволяют исследователям записывать и прослеживать родственные связи между людьми. Имя человека и соответствующая информация могут быть введены и связаны с родителями, детьми и другими родственниками, сведения о которых уже имеются в файле. Такие программы могут систематизировать информацию в базе данных для получения различных отчетов (результатов), таких как родословные таблицы, росписи и др.9«» Действительно отличительной особенностью организации генеалогической программы является не столько принцип хранения информации, сколько возможность ее связывать и наглядно демонстрировать внесенные данные. Графическая форма фиксации родственных связей, основанная на иерархическом принципе, суть любой полноценной программы по генеалогии. Пользователь должен иметь возможность в любой момент времени увидеть фрагмент генеалогического дерева семьи, потомство, как по мужской, так и по женской линиям, линию предков и т.д. Кроме того, все эти сведения должны быть представлены в формате, позволяющем легко их распечатать или вывести в специальный файл для возможной корректировки. Графический интерфейс программы и отчеты важны не только как классический метод представления генеалогической информации, выдержавший проверку столетиями, но и как максимально удобная форма поиска информации в базе, которая может включать в себя не одну тысячу человек. Представление в текстовом формате не обеспечивает должного восприятия материала10. И что немаловажно, этими данными можно обмениваться по Интернету, сравнивать их и дополнять новой информацией, полученной от других людей или различных учреждений. Компьютерные генеалогические программы способны предупредить Вас о некорректности вводимых имен и дат, о дублировании данных одного и того же персонажа, строить сложные графики, проанализировав различные параметры жизни и смерти тысяч людей. С помощью этих программ Вы сможете найти в вашей базе данных и общего предка для двоих и более людей и их общих потомков. Вы можете проследить динамику наследственных болезней и места проживания ваших предков. Многие программы позволяют присоединять к базе графику в виде рисунков и отсканированных фотографий, звуковые файлы и видеофрагменты, превращаясь в полноценные мультимедийные программы.11

»

2 comments for “Компьютерная генеалогия. Российские базы данных и программное обеспечение (ч1)

    --->
    • интересуюсь историей моего Рода Почепцовых из Курской губерни- рассуазывала бавушка что предки были из столбовых дворян как мне точнее узнать и можно ли найти фотографии и куда можно обратиться?!Заранее благодарю С уважением Елена Сергеевна Почепцова

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *