Организация информации в ГИС
Первым шагом к проекту ГИС является создание пространственной базы данных. Для переведения карты в цифровую форму необходимо организовать структуры для хранения данных и их использования. Вся мощь ГИС лежит в объединении графической и описательной информации, хранении и управлении связями между объектами.
Двумя основными типами информации для ГИС являются пространственные и атрибутивные или тематические базы данных. Пространственная информация векторных ГИС описывает расположение и очертание географических объектов. Тематическая информация содержит описание количественных и качественных характеристик объектов и связей между ними.
Понятие объекта
Данные,
встречающиеся на карте, представляют собой связанные объекты. Каждый объект
может быть описан одним или несколькими геометрическими примитивами и
атрибутами. К геометрическим примитивам относятся прежде всего точки, линии и
площади.
Атрибуты - это
прежде всего числовые или символьные характеристики, содержащиеся в базе
данных, они могут относится как к самим примитивам, так и к объектам. Данные,
хранящиеся в атрибутах этих видов, принадлежат, как правило, к целым,
вещественным и символьным типам.
Атрибутивная база данных должна удовлетворять следующим требованиям:
· поддерживать реляционную модель данных;
· осуществлять контроль вводимой информации и наличие контрольных точек для продолжения процесса загрузки базы данных без повторного ввода данных при сбоях системы;
· обеспечивать ввод, обработку и выдачу информации по установленным формам;
· иметь гибкий механизм актуализации базы данных;
· обеспечивать быструю обработку незапланированных запросов на данные;
· поддерживать стандартный язык запросов к базе данных;
· осуществлять прямой доступ к базе данных посредством описательных характеристик;
· накапливать и обрабатывать описательную информацию, связанную с географическими признаками.
По мере развития ГИС разнообразие используемых атрибутов увеличивается. Многие ГИС используют графические и аудио-атрибуты (растровые образы объектов или их аудиоописание), а также атрибуты “действия” или “поведения”, т.е. функции, которые должны быть выполнены при определенных условиях.
Совокупность примитивов и атрибутов образует простой объект. Совокупность простых объектов образует сложный или составной объект. Иерархия объектов очень удобна, т.к. позволяет избежать дублирования информации и обеспечивает наследование, т.е. изменение объекта или атрибута порождают изменения во всех объектах, частью которых он является.
Все объекты и примитивы должны иметь свой номер или идентификатор, при помощи которого можно привязать к графической информации тематическую.
Использование идентификаторов открывает широкие возможности для просмотра и анализа. Пользователь может указать на объект курсором, и система определит его идентификатор, по которому найдет относящиеся к объекту одну или несколько баз данных и, наоборот, по информации в базе можно определить графический объект.
Понятие слоя
Физически геометрические примитивы записываются как последовательность пар координат - х, у. Окружности и кривые показываются списком пар координат, площадь записывается как серия пар или серия идентификаторов ломанной, которая описывает замкнутый контур. Координаты первой и последней точки должны при этом совпадать, иначе контур не будет замкнут. Совокупность точек, линий и площадей образует цифровое представление карты.
Карта во многих системах организована как набор слоев информации. Слой составляют объекты, объединенные одной темой, например, гидрография. В традиционной картографии этому примерно соответствуют цветные слои карты. В некоторых ГИС в слое могут содержаться объекты одного типа, а не одной темы, например, слои точек. Иногда в слое могут быть объекты, разные и по типу и по теме, но чаще всего встречается все-таки логическое разбиение информации на слои. В системах, полностью ориентированных на объектную организацию информации, отсутствует ее деление на слои.
Системы координат
Все объекты земной поверхности, представляемые на карте, являются двумерными, то есть задаются координатами х, у. Картографическая информация может поступать с карт, имеющих различные системы координат. Актуальной проблемой ГИС поэтому является преобразование координат в некую единую систему для работы или в такую, которая нужна для выдачи конечного продукта.
Обычно
ГИС работают с распространенными проекциями: Меркатора, Ламберта, прямоугольной
и др. Список из 10-15 поддерживаемых проекций имеет практически каждая система,
однако, такое большое количество, как правило, не нужно для систем, работающих
с крупными масштабами, в которых используется максимум 1-2 проекции.
Одна из основных идей, воплощенная в традиционных ГИС - это сохранение связи между пространственными и атрибутивными данными, при раздельном их хранении и, частично, раздельной обработке.
Записи в таблице, хранящей характеристики объектов, имеют в своем составе поле идентификатора объекта. В свою очередь, объекты на карте тоже проидентифицированы. Таким образом, однозначная связь между пространственной сущностью объекта на карте и из информацией о нем из БД.
Комбинируя пространственные запросы на принадлежность, соседство, пересечение объектов можно удовлетворить любые информационно-поисковые нужды в любой сфере применения ГИС.
Анализ существующих подходов и систем
Вариант а) Пространственные и атрибутивные данные
целиком отделены друг от друга.
Таким образом, пользователь вынужден иметь дело с двумя системами: графической и СУБД. Как пример можно привести AutoCAD и dBASE. Такие решения внедрялись несколько лет тому назад и до сих пор используются. Очень много сил положено для состыковки двух программ и соответственно их данных.
Плюсы: Можно пользоваться крадеными продуктами, приобрести
пиратскую копию на CD
по цене 20-50 тыс. рублей. Несовершенство Российского законодательства, сложная
экономическая обстановка и государственная политика по отношению к
ГИС-технологиям это не только позволяют, но и провоцируют. Хотя, вряд ли
обоснование муниципальной ГИС или системы для иного официального заказчика
может основываться на таком “плюсе”.
Минусы: Постоянный переход из одной программы в другую вызывает определенные неудобства (хотя это замаскировано интерфейсом и не заметно для внешнего пользователя). К тому же большая часть связи между пространственным объектом и его данными происходит у пользователя в уме.
Вариант б) Пространственные и атрибутивные
данные целиком совмещены.
Такие решения часто предлагаются отечественными разработчиками (системы ориентированные на использование «стандартных» форматов SXF, F1М - например, ранние версии ГИС «Панорама»). К тому же федеральный стандарт формата данных ГИС содержит в себе всю атрибутивную информацию, включая классификатор, и не подразумевает существования других данных.
Плюсы сомнительны, разве что иногда этот вариант лучше предыдущего по возможности получения информации об указанном на карте объекте.
Минусы: Структура атрибутивных данных не реляционная; как результат – сильно затруднены или вообще невозможны запросы к атрибутивной информации.
Если у пользователя есть необходимость использования атрибутивных данных в других приложениях, необходимо конвертировать данные и хранить их дважды. Это очень трудоемко, так как отсутствует реляционная модель данных и инструментарий для конвертирования.
Вариант
б) штрих
Это
производство некоторой надстройки над традиционной системой управления
реляционными базами данных для получения графических возможностей.
Плюсы: Налицо вся мощь СУБД. Пример ORACLE , Spatial Data Extension.
Минусы: Такое решение требует серьезного участия производителя СУБД и стоит недешево, иначе система превращается в БД с элементами графики, то есть отсутствует мощность пространственного аппарата настоящей ГИС.
Вариант в) или «почти так, как должно быть»
Как правило, в состав ПО ГИС входят модули управления внутренней базой данных. Под внутренней БД понимается то, что данная ГИС умеет работать с реляционной БД без привлечения каких либо дополнительных программных средств. Это типичное решение в ГИС для персональных компьютеров. Например, PC ARC/INFO, MapInfo, MGE Intergraph и GeoGraph имеют в своем составе небольшую реляционную СУБД.
СУБД-модуль в составе ГИС обычно обладает несколько меньшими возможностями по сравнению с настоящей СУБД, но все же вполне подходит для решения многих задач, стоящих перед ГИС по отношению к базам атрибутивных данных:
Наиболее
распространенными являются следующие решения:
1.В качестве оперативного формата выбирается один из популярных форматов
данных. Таким образом, все операции проводимые ГИС с атрибутивными данными,
поддерживаются только для этого формата. Для использования данных,
представленных в других форматах, необходима их конвертация.
Этот путь прошли Arc
View, MapInfo, Intergraph, GeoGraph и другие ГИС.
Плюсы: Относительная простота использования и, как правило, более высокая скорость работы с данными.
Минусы: Если есть необходимость использования тех же атрибутивных данных, что использует ГИС в других приложениях необходимо конвертировать данные и/или хранить их дважды. Разные форматы БД поддерживают разные типы данных. Ни один из них не является совершенством, поэтому все недостатки формата БД будут ощущаться на этой ГИС.
2. Работа ведется с несколькими форматами с использованием средств IDAPI, ODBC или аналогов. Такие средства позволяют ГИС несколько абстрагироваться
от формата БД и работать с разными форматами почти одинаково хорошо. Сейчас
такими возможностями обладают Arc View, MapInfo, Intergraph
MGE.
Плюсы: Если уже есть атрибутивная информация, нет необходимости ее конвертировать. Нужно только осуществить пространственную привязку базы данных. Если понадобились дополнительные возможности по манипулированию БД, вы можете воспользоваться развитыми средствами «настоящей» РСУБД.
Минусы: Работа ведется через драйверы форматов БД, разрабатываемые производителями СУБД и сторонними фирмами. Не все из них представляют собой идеал, то есть иногда (не всегда) снижается надежность и скорость обработки атрибутивных данных. Некоторую сложность представляет настройка таких «многопрофильных» систем с помощью специальных конфигурационных утилит.
Применение архитектуры
клиент – сервер для связи с атрибутивными данными.
При реализации решения «клиент-сервер» вся обработка атрибутивных данных ведется на специально выделенном компьютере (или нескольких), называемом СУБД сервер. Компьютеры-клиенты отправляют запросы на сервер БД и потребляют их результаты. Клиенты и серверы соединены между собой каналами связи (например, они находятся в одной ЛВС).
Указанными возможностями
обладают многие современные западные ГИС - ARC/INFO, MapInfo, Intergraph, Smallworld, Gradis GIS, продукты компании Siemens Nixdorf и др. Причем некоторые из
них опираются на использование только этой возможности доступа к данным.
Необходимость такого решения
возникает, когда ГИС является частью большой информационной системы – одним из
клиентов большой базы данных, находящейся под управлением СУБД сервера.
Плюсы: Высокая степень масштабируемости и независимости от аппаратных средств. Очень высокая эффективность обработки данных, но только при правильном применении. Реальная возможность ведения распределенных БД. Пожалуй, единственный жизнеспособный вариант при использовании сверхбольших БД (миллиарды записей/объектов).
Минусы: Высокая стоимость программных и аппаратных средств. Высокая сложность поддержки и необходимость очень высококвалифицированных кадров, которые также стоят очень дорого.
Одним из самых мощных решений является осуществление доступа ко всем данным (и пространственным и атрибутивным) по схеме клиент-сервер.
Возможно два варианта решения задачи:
1. Сервер пространственных баз данных является отдельным программным продуктом. Этот вариант сложен в реализации и в мире ГИС еще не удалось его воплотить в полном объеме.
Основные сложности включают отсутствие стандартов и спецификаций на интерфейсы прикладных программ, отсутствие стандартного языка манипулирования данными и языка запросов, разнообразие моделей, типов и форматов данных, которые необходимо поддерживать и т. д.
2. Сервер пространственных баз данных является надстройкой или дополнением к существующему серверу реляционной БД. Реализация такого сервера пространственных БД опирается на использование другого программного продукта (например, ORACLE) и автоматически добавляет его стоимость и правила лицензирования к стоимости сервера пространственной БД. Кроме того, не всегда удобно использовать реляционную модель для хранения некоторых типов пространственных данных. Это касается в основном топологической модели пространственных данных.
Компании ESRI и ORACLE выпустили программный продукт этого класса. Он называется Spatial Data Extension. Планируются аналогичные расширения для других СУБД. Но в связи с открытостью системы в целом, в скором будущем и другое ПО ГИС будет работать с этим сервером пространственных данных. В конкретной реализации огорчает пока только одно - отсутствие топологической модели данных.
При построении ГИС руководствуются различными критериями: стоимость, наличие поддержки, конвертация данных и т. д. Но развитие системы в целом сильнее всего связано с моделью данных.
Литература:
1. ГИС обозрение апрель 1998 г