Ввод графической информации в ГИС

 

Растровая и векторная модели данных

В определённом смысле в основе построения ГИС лежит СУБД. Однако, вследствие того, что пространственные данные и разнообразные связи между ними плохо описываются реляционной моделью, полная модель данных в ГИС имеет сложный смешанный характер. Пространственные данные специальным образом организованы, и эта организация не базируется на реляционной концепции. Напротив, атрибутивная информация объектов (называемая ещё "семантической") вполне удачно может быть представлена реляционными таблицами и соответствующим образом обрабатываться.
Однако, поскольку в ГИС графические объекты связаны с табличными данными, то как графику, так и семантику нужно одновременно и в то же время эффективно обрабатывать, что усложняется и гигантскими объёмами информации. Становится понятным, что создание хорошей ГИС - процесс весьма непростой, требующий приложения очень больших усилий и использования новаторских решений.

Симбиоз двух моделей данных, лежащих в основе представления пространственной и семантической информации в ГИС, называется геореляционной моделью. Именно по причине сложной в целом модели данных в ГИС, а также из-за сложности процедур обработки этих данных, можно утверждать, что сегодняшний передний край в исследованиях новых подходов к проблеме построения эффективных моделей данных лежит именно в области геоинформатики.

Пространственная информация в ГИС может быть представлена в растровом и векторном видах. Растровые данные получаются в виде отдельных точек, которыми манипулируют компьютерные программы как по одной, так и группами. Растр применяется в основном там, где пользователей не интересуют отдельные пространственные объекты, а интересует точка пространства с ее характеристиками.

Векторные данные исторически используются в большинстве ГИС для представления информации, которая имеет объектную природу и нуждается в анализе и манипулировании. Они хранятся в виде точек и линий, связанных геометрически и математически. Эти связи означают, что информация может толковаться как серия индивидуальных точек, а может образовывать новые сложные структуры данных. Наличие атрибутов позволяет интерпретировать информацию. Такая информация обычно хранится в сопутствующих базах данных.

Для большинства ГИСовских программ требуется, чтобы данные были представлены в векторной модели, хотя в ряде систем допускается использование растра в качестве “подложки” или в качестве атрибута. Многие ГИС используют растровую модель для представления информации о непрерывных полях (рельефе, давлении и т.п.).

В общем случае растровые данные занимают много места, плохо сжимаются и занимают в системе памяти не меньше, чем векторные с сопутствующей информацией. Часто для сжатия растровой информации используется метод “кодирования цвета”. Поскольку при хранении последовательности пикселов одного цвета достаточно знать только его номер и количество пикселов, то таким образом можно закодировать все изображение. При больших одноцветных площадях размер файла при таком сжатии может быть уменьшен в 5 раз.

Другим методом является “сжатие по столбцам”. Выбирается базовый столбец пикселов, в соседнем столбце кодируются точки, отличающие его от базового, при значительных отличиях он принимается за новую базу и т.д. Оба этих способа хороши для черно-белых изображений, но малоэффективны для серых и цветных.

Современные профессиональные ГИС обладают исключительными средствами совместной обработки растрового и векторного изображений, что предоставляет возможность в векторной части вывести на передний план детали наибольшей важности.

 

Топологическая модель данных

 

Большое количество графических данных в ГИС со специфическими взаимными связями требует топологического описания объектов и групп объектов, которое зависит от "связанности" (простой или сложной). Оно определяет совокупность топологических моделей.

Топологические свойства фигур не изменяются при любых деформациях, производимых без разрывов или соединений. В геоинформационных системах применение термина топологический не такое строгое, как в топологии. В ГИС топологическая модель определяется наличием и хранением совокупностей взаимосвязей, таких, как соединенность дуг на пересечениях, упорядоченный набор звеньев (цепей), образующих границу каждого полигона, взаимосвязи смежности между ареалами и т.п.

В общем смысле слово топологический означает, что в модели объекта хранятся взаимосвязи, которые расширяют использование данных ГИС для различных видов пространственного анализа.

Топологическими характеристиками графические модели ГИС существенно отличаются от моделей САПР. Соответственно это различие просматривается в программно-технологическом обеспечении этих систем.

Например, вплоть до настоящего времени много разработок ГИС выполняется с использованием средств Автокада, версий от 10 до 13. Однако в нем не предусмотрены ни работа с покрытиями, ни оверлейные процедуры, ни обработка топологических данных. Принципиально такие операции в системах CAD (Computer-Aided Desing) возможны, но путем доработки программного обеспечения, что требует достаточно высокой квалификации пользователя и, естественно, ограничивает их круг.

В системах ГИС названные выше процедуры являются встроенными и делают доступным анализ картографической информации широкому кругу пользователей без всякой доработки.

Элементы топологии, входящие в описание моделей данных ГИС, в простейшем случае определяются связями между элементами основных типов координатных данных. Например, в логическую структуру ("логическая запись") описания данных могут входить указания о том, какие линии входят в район, в каких точках эти линии пересекаются.

Топологические модели позволяют представлять элементы карты и всю карту в целом в виде графов. Площади, линии и точки описываются границами и узлами (дуговая/узловая структура). Каждая граница идет от начального к конечному узлу, и известно, какие площади находятся слева и справа.

Теоретической основой моделей служат алгебраическая топология и теория графов. В соответствии с алгебраической топологией координатные типы данных: площади, линии и точки называются 2-ячейками, 1-ячейками и 0-ячейками соответственно. Карта рассматривается как ориентированный двухмерный ячеечный комплекс.

Двойственность между теорией графов и алгебраической топологией позволяет применять теоретические положения графов, а также топологический подход.

Топологическое векторное представление данных отличается от нетопологического наличием возможности получения исчерпывающего списка взаимоотношений между связанными геометрическими примитивами без изменения хранимых координат пространственных объектов.

Необходимая процедура при работе с топологической моделью -подготовка геометрических данных для построения топологии. Этот процесс не может быть полностью автоматизирован уже на данных средней сложности и реализуется только при дополнительных затратах труда (обычно значительных). Таким образом, данные, хранимые в системе, не предусматривающей поддержки топологии, не могут быть надежно преобразованы в топологические данные другой системы чисто автоматическим алгоритмом.

Топологические характеристики должны вычисляться в ходе количественных преобразований моделей объектов ГИС, а затем храниться в базе данных совместно с координатными данными.

Основные топологические характеристики моделей ГИС.

Топологические модели в ГИС задаются совокупностью следующих характеристик:

 

 

 

 

Топологические характеристики линейных объектов могут быть представлены визуально с помощью связанных графов. Граф сохраняет структуру модели со всеми узлами и пересечениями. Он напоминает карту с искаженным масштабом. Примером такого графа может служить схема метрополитена. Разница между картой метро и схемой метро показывает разницу между картой и графом.

Узлы графа, описывающего картографическую модель, соответствуют пересечениям дорог, местам смыкания дорог с мостами и т.п. Ребра такого графа описывают участки дорог и соединяющие их объекты. В отличие от классической сетевой модели в данной модели длина ребер может не нести информативной нагрузки.

Топологические характеристики ареальных объектов могут быть представлены с помощью графов покрытия и смежности. Граф покрытия топологически гомоморфен контурной карте соответствующих районов. Ребра такого графа описывают границы между районами, а его узлы (вершины) представляют точки смыкания районов. Степень вершины такого графа - это число районов, которые в ней смыкаются. Граф смежности это как бы вывернутый наизнанку граф покрытия. В нем районы отображаются узлами (вершинами), а пара смыкающихся районов - ребрами. На основе такого графа ГИС может выдать ответ на вопрос, является ли проходимой рассматриваемая территория, разделенная на проходимые или непроходимые участки.

Топологические характеристики сопровождаются позиционной и описательной информацией. Вершина графа покрытия может быть дополнена координатными точками, в которых смыкаются соответствующие районы, а ребрам приписывают левосторонние и правосторонние идентификаторы.

После введения точечных объектов при построении линейных и площадных объектов необходимо "создать" топологию. Эти процессы включают вычисление и кодирование связей между точками, линиями и ареалами.

Пересечения и связи имеют векторное представление. Топологические характеристики заносятся при кодировании данных в виде дополнительных атрибутов. Этот процесс осуществляется автоматически во многих ГИС в ходе дигитализации (картографических или фотограмметрических) данных.

Объекты связаны множеством отношений между собой. Это определяет эффективность применения реляционных моделей и баз данных, в основе которых используется понятие отношения. В свою очередь, отношения задают множества связей. Простейшие примеры таких связей : "ближайший к ...", "пересекает", "соединен с ...".

Каждому объекту можно присвоить признак, который представляет собой идентификатор ближайшего к нему объекта того же класса; таким образом кодируются связи между парами объектов.

В ГИС часто кодируются два особых типа связей: связи в сетях и связи между полигонами.

Топологически сети состоят из объектов двух типов: линий (звенья, грани, ребра, дуги) и узлов (вершины, пересечения, соединения).

Простейший способ кодирования связей между звеньями и узлами заключается в присвоении каждому звену двух дополнительных атрибутов -идентификаторов узлов на каждом конце (входной узел и выходной узел).

В этом случае при кодировании геометрических данных будут иметь место два типа записей:

1) координаты дуг: (x1,y1), (x2,y2),..., (xn,yn);

2) атрибуты дуг: входной узел, выходной узел, длина, описательные характеристики.

Такая структура позволяет, перемещаясь от звена к звену, определять те из них, у которых перекрываются номера узлов.

Более сложная, но и более совершенная структура имеет список всех звеньев для каждого узла. Это может быть выполнено добавлением к первым двум записи третьего типа;

3) узел: (х , у), смежные дуги (со знаком "+" для входного угла и со знаком "-" ~ для выходного).

Чтобы избежать неудобств, связанных с хранением неодинакового количества идентификаторов дуг, используют два отдельных файла:

1) простой упорядоченный список, в котором файл узлов сжат до ряда идентификаторов дуг;

2) таблицу, в которой для каждого узла хранится информация о положении первой дуги списка.

Используемое в настоящее время математическое обеспечение ГИС почти исключительно основано на топологических моделях, дающих хорошее формализованное представление о пространственных соотношениях между основными объектами карты. Однако, если требуется установить более сложные соотношения, например включение или порядок, нужны дополнительные средства.

 

Стандартные форматы

 

Как в группе растровых, так и в группе векторных цифровых моделей форма записи информации в файл неодинакова в различных системах. Исторически сложилось так, что фирмы, специализирующиеся в области компьютерной графики, создавали каждая свои, казавшиеся им наиболее удобными форматы графических данных. Форматом файла называется шаблон, по которому он создается. Шаблон описывает, какие именно данные и в каком порядке должны быть занесены в файл. Если ГИС “знакома” с форматом, она может прочитать данные из файла этого формата и правильно их интерпретировать, и, наоборот, записать свои данные в этом формате, что позволяет передать их в другую систему.

Следует различать внутренние форматы системы и обменные форматы, т.е. форматы, используемые для обмена информацией между различными пользователями, работающими в том числе в разных системах.

Форматов существует множество, некоторые из них настолько популярны, что стали практически стандартами, что связано с распространенностью пакетов, в которых они используются, и характеристиками самого формата, к последним можно отнести быстроту чтения/записи, величину возможного сжатия файла, полноту описания информации.

Как правило, ГИС работает в своем собственном внутреннем формате данных, наиболее удобном для конкретной системы, но поддержка импорта/экспорта возможно большего количества стандартных обменных форматов необычайно важна, поскольку объемы уже введенных графических изображений велики, и не имеет смысла вновь производить трудоемкие работы по вводу информации, гораздо проще ее купить. Можно вводить данные в своем формате и обмениваться ими, осуществляя переход в нужный формат, но формат хранения должен быть достаточно полным; ведь в отличии от координат, которые могут быть легко переведены из целых чисел в дробные, отсутствующие атрибуты и описания перевести в тот формат, где они необходимы, невозможно.

Стандартные форматы существуют как для растровой, так и для векторной форм представления информации. К растровым форматам относятся, например, PCX, TIFF, GIF, RLE, RLC. К векторным обменным форматам относятся форматы DXF, DX90, PIC, DWG, DGN, HPGL, GEN, MIF/MID и многие другие.

 

Способы ввода графической информации в ГИС

 

Существует несколько способов ввода информации в ГИС с использованием традиционных карт и планов. Это цифрование с использованием дигитайзера и цифрование растрового изображения на экране компьютера (векторизация). В настоящее время наиболее распространен второй способ, т.к. он наиболее удобен и значительно точнее первого.

Векторизация имеет три разновидности: ручная, интерактивная, автоматическая.

Этот метод требует специализированного, сложного программного обеспечения и мощной аппаратуры, т.к. требует быстродействия компьютера и значительных объемов памяти. Отсканированное изображение из файла выводится на экран монитора, и само цифрование осуществляется по этой “подложке” при помощи “мыши”. При ручной векторизации все операции выполняет сам оператор, а при интерактивной часть операций производится автоматически. При таком способе векторизации оператору достаточно задать начальную точку и направление отслеживания линии, а затем оказать программе помощь в разрешении неопределенностей. Большинство векторизаторов, работающих в интерактивном режиме, обладают возможностями настройки на преодоление некоторых неопределенных ситуаций, что позволяет векторизовать штриховые линии, бровки оврагов
и т.п. Возможности интерактивной векторизации прямо связаны с качеством исходного материала и сложностью карты.

При автоматическом цифровании карта вначале сканируется, а затем автоматически переводится в векторный формат. Этот тип ввода информации состоит из этапов предварительного редактирования, непосредственного перевода из растрового формата в векторный и окончательного редактирования. Программные продукты, реализующие этот метод, корректируют возможные помехи (пятна, грязь) с использованием специальных программ. Эти системы по заложенным в них образцам распознают символы, линии, окружности и т.п. Предварительное редактирование карт электрических сетей занимает 8-17% общего времени выполнения перевода из растрового формата в векторный в зависимости от качества исходного документа.

Окончательное редактирование обязательно проводится после перевода форматов. Оно необходимо, поскольку даже самая изощренная программа может неверно распознать объект. Время заключительного редактирования занимает 65-70% общего времени в зависимости от быстродействия используемого компьютера и качества мониторов.

Автоматический перевод из растрового формата в векторный наиболее удобен в случае, если обрабатывается большое количество однотипных простых карт.

 

Литература:

  1. Н. В. Коновалова, Е. Г. Капралов «Введение в ГИС» Москва 1997г.
  2. В. Я. Цветков «Геоинформационные системы и технологии» Москва1998г.

[ Назад ] [ Вперед ]

[ вернуться к содержанию ]