На главную страницу
Информационные системы и банки данныхУправление и принятие решений в сложных системахПрикладные информационные технологииКомпьютер в учебном процессеСетевые технологииПленарные доклады Карта сервераПобедители семинараИнформацияОбщее впечатлениеВаши отзывы
Секция E - Список докладов

ПРИМЕНЕНИЕ ТЕХНОЛОГИИ РЕПЛИКАЦИИ ДЛЯ СОЗДАНИЯ РАСПРЕДЕЛЁННЫХ SQL БАЗ ДАННЫХ.

В.Г. Орчиков
(Московский государственный институт электроники и математики (технический университет), Россия.)

В данной работе рассматривается технология создания распределенной SQL базы данных с локальным и удаленным доступом через Internet.

Распределённая база данных - это база данных, расположенная на нескольких удаленных компьютерах, связь между которыми поддерживается соответствующими сетевыми и транспортными протоколами (например, семейством протоколов ТСРЯР). Для построения такой базы данных используется технология репликации, под которой понимается возможность копирования данных из одного источника на множество других и наоборот.

Даже при наличии удобного пользовательского интерфейса репликация требует тщательного анализа и планирования. Важно также глубоко понимать суть конкретного используемого механизма репликации для наиболее оптимального использования преимущества распределённой базы данных, а так же для своевременного предотвращения и исправления возникающих ошибок.

Примером базы данных, для которой потребовалось применить технологию репликации, служила база данных "Российские ВУЗы", которая в данный момент разрабатывается в центре информатизации министерства образования РФ "Информика"

База данных ориентирована на широкий круг пользователей и содержит необходимый минимум актуальной информации о вузах России. База данных "Российские ВУЗы" имеет один главный сервер, находящийся в Москве и нескольких региональных серверов. Московским сервером является MS SQL Server 6.5 под управлением Windows NT 4.0. Региональными серверами являются либо, так же, MS SQL Server 6.5 под управлением Windows NT 4.0, либо Oracle 7(8) под управлением Windows NT 4.0 или Linux.

К базе данных обеспечен свободный удаленный доступ через Internet. Реализована технология удаленного сопровождения.

Решение о том, что эта база данных должна быть распределённой, было принято исходя из следующих соображений, которые, в свою очередь, вытекают из общих предпосылок создания любой распределённой базы данных.

Существует так называемый принцип "20-80", по которому 20% пользоватслей необходимо 80% информации. При этом доступ к этой информации должен быть наиболее удобен и быстр. Поэтому БД должна с одной стороны находиться в непосредственной близости от источника информации, а с другой - быть приближена к конечному пользователю.

Так же механизм построения распределённой базы данных позволяет обеспечить возможность работы с ней при выходе из строя одного из сегментов сети или одного из серверов.

Существует несколько механизмов выполнения репликации, это - множественная публикация, централизованная публикация и централизованная подписка.

В данной работе применяется сценарий централизованной подписки. Администратор назначает сервер репликации и сервер подписки, определяет время, через которое будет происходить репликация и набор таблиц, участвующих в ней. Так же определяется несколько дополнительных параметров.

В нашем случае репликация происходит сразу после завершения транзакции обновления таблицы. Администратор с клиентского места вносит изменения в таблицу, используя для этого структурированный язык запросов SQL. После выполнения команды COMMIT WORK, означающей, что транзакция успешно завершена, сервер публикации/репликации устанавливает соединение с сервером подписки и проверяет данные из таблиц, участвующих в репликации, на идентичность. И в случае обнаружения новых данных сервер публикации реплицирует новые записи в соответствующие таблицы сервера подписки. В случае возникновения ошибки в процессе репликации (например, в случае разрыва сети) происходит откат выполнения репликации, и после восстановления работоспособности сети, система автоматически переходит в нормальное состояние и процесс репликации повторяется.

Так как на некоторых серверах базы данных установлен Oracle, а на главном MS SQL Server, то процесс репликации должен обеспечиваться как программным обеспечением фирмы Oracle, так и Microsoft. Продуктом, наиболее оптимально обеспечивающим связь между Oracle и MS SQL базами данных, является Oracle Transparent Gateway for MS SQL Server. Он делает структуру MS SQL базы данных прозрачной для Oracle-a и позволяет через ODBC драйвер безошибочно реплицировать данные из одной базы в другую. Так же репликацию обеспечивают Microsoft Enterprise Manager и Oracle Replication Manager, входящий в пакет продуктов Oracle Enterprise Manager.

Данная работа проводилась в центре информатизации министерства образования РФ "Информика"

RLE Banner Network