Информационная основа интегрированной

информационной системы

Любая информационная система ориентирована на работу в конкретной предметной области. При построении интегрированной информационной системы необходимо учитывать и различать следующие понятия: объект исследования, модель объекта, составная модель данных, элементарная модель данных, информационная основа.

Объектом исследования будет являться любой из объектов предметной области - все то, что может храниться в базе данных АИС.

При исследовании объектов окружающей действительности осуществляется сбор данных, часто разрозненных и неоднородных из которых необходимо формировать модели объектов.

Первичные данные - исходные данные, получаемые в ходе непосредственного сбора информации. После сбора разнообразные входные данные о объектах упрощаются, унифицируются и преобразуются в модели, хранимые базе данных.

Модели данных могут иметь сложную многоуровневую структуру. Составными моделями называют модели, имеющие сложную многоуровневую структуру, составленную из более простых моделей. Составные модели включают как элементы структуры  элементарные  модели  данных.

Элементом системы называют простейшую структурную составляющую, которая в рамках данной системы не структурируется.

Это определяет элементарную  модель  данных как структурную составляющую составной модели, которая в рамках составной модели более не структурируется.

Составная модель данных определяется как множество взаимосвязанных элементарных моделей, каждая из которых связана прямо или косвенно с другой элементарной моделью, а два любые подмножества составной модели данных  не могут быть независимыми не нарушая целостность, единство составной модели.

Конструирование или проектирование сложных моделей на основе более простых зависит от выбора структуры сложной модели, от типа связей в сложной модели и от качественных характеристик элементарных моделей.

В результате объединения и обобщения (обработки) первичных данных и первичных моделей, организации связей между ними -  образуют модели объектов как вторичные модели.

Модели объектов имеют сложную многоуровневую структуру и включают составные и   элементарные  модели  данных, а также так называемые метаданные.

Метаданные это вспомогательные данные, которые являются описанием других данных, их характеристик, связей, способов использования и т. п.

Таким образом, модель объекта можно рассматривать, как некую систему и это позволяет дать следующее определение модели объекта.

Модель объекта  - множество взаимосвязанных составных и элементарных моделей данных, метаданных, каждый элемент которого связан прямо или косвенно с другими элементом а два любые подмножества этого множества не могут быть независимыми не нарушая целостность, единство.

В процессе эксплуатации АИС пользователь работает с моделями объектов, которые сохраняет существенные свойства объектов и не содержит второстепенные.

Для нормального  функционирования  АИС все многообразие входных данных и моделей объектов преобразуется в единую  общую информационную модель, хранимую базе данных. Эта общая модель и определяют интегрированную информационную основу базы данных и определяют методы обмена данными в процессе эксплуатации АИС.

Интегрированная информационная основа АИС определяется, как совокупность определенным образом упорядоченных описаний объектов предметной области и текущих состояний их связей, которые хранятся и обрабатываются в АИС.

Интегрированная информационная основа является результатом интеграции данных, поэтому она не является простой суммой входных данных характеристик моделей объектов, применяемых в не интегрированных технологиях.  Она,  как правило,  имеет меньший требуемый объем физической памяти при сохранении информационной емкости по сравнению с ее составляющими моделями,  хотя дополняется более сложными структурными взаимосвязями и дополнительной служебной информацией.

Интеграция данных есть повышение качественного уровня взаимосвязей между разнородными данными и моделями объектов и процесс создания из разнородных информационных единиц единой системы, с целью исключения функциональной и структурной избыточности и повышения общей эффективности интегрированной системы.

Таким образом, интегрированная информационная основа является результатом интеграции данных и представляет собой некую сложную модель, имеющую структуру и составные части.

Целостность, непротиворечивость и оптимальность этой общей модели АИС  определяется качеством и обоснованностью выбора составляющих частей модели. Это определяет процесс построения  интегрированной информационной основы как организацию совокупности моделей данных и моделей объектов.

Следовательно, проблема организации интегрированной основы  в АИС сводится  к  проблеме  - организации моделей данных и объектов. Это определяет необходимость предварительного анализа  свойств  элементарных  моделей данных,  составляющих более сложные модели в БД,  и выбора базовых теоретических моделей с учетом конкретной предметной области  задач  АИС.

Такой подход позволяет оптимизировать создание информационной основы и процессы обработки данных и в БД.

 

Общие принципы  построения моделей  в интегрированных системах

Семиотический подход к организации моделей данных

 

Информационные системы  связаны с процессами обработки информации и информационного обмена.

Одним из назначений моделей данных является реализация информационного обмена. Примером стандарта информационного обмена служит естественный язык и современные языки (включая правила их употребления) сформировались как результат требований некого стандартного обмена информацией.

В технических науках примером моделей информационного обмена служат различные формализованные языки.

Таким образом, информационные средства и технологии используют де-факто стандарты, которые официально такими не называются, тем не менее, такими являются. Это говорит о важности и необходимости исследования моделей как систем информационного обмена.

Исследованием обмена информацией на основе системы знаков, образующих формальные языки, занимается семиотика.

Семиотика является теорией языковых знаков, связей их друг с другом, связей знаков с человеческим мышлением, связей с объективной реальностью и человеком.

Семиотика является общим для всех языков, независимо от их словарного состава, грамматик и способов их возникновения.

Понятием знака семиотика охватывает не только такие языки как русский, английский, немецкий и т.д., но другие образования, такие как математические символы, знаки уличного движения, условные знаки на топографических картах, знаки различия военнослужащих и т.п.

Переходя на формальное обозначение, следует выделить четыре фактора, которые должна учитывать семиотика:

Z - знак;

A - мысленные образы, отражения (модели);

O - объекты отражения;

M - людей или их мышление.

Различные взаимосвязи перечисленных факторов  определяют различные разделы семиотики.

Синтактика - раздел семиотики, который абстрагируется от всех факторов за исключением знака. Она исследует связи между знаками некоторого языка. Синтактика устанавливает правила построения составных языков.

Она создает критерии определения принадлежности совокупности знаков к определенному языку.

Семантика  (от греч. семантикос - обозначающий) - Раздел семиотики, изучающий интерпретацию знаковой системы. Он исследует отношения между знаками Z и отражениями A, связи между словами языка и соответствующими им понятиями.

Знаки Z являются формой существования мысленных образов A, последние являются значениями знаков Z. Этим семантика рассматривает отношения между знаками языка и их значениями.

Сигматика  изучает отношения между Z и О. Языковые значения Z - это имена обозначения объектов О.

Прагматика  - раздел семиотики, изучающий отношение использующего знаковую систему к самой знаковой системе.

Применительно к информатике и геоинформатике семиотический анализ информационной единицы (модели, системы, процесса, объекта, технологии) выглядит следующим образом:

Модель должна включать три составные части:

синтаксис - правила построения и критерии принадлежности к виду;

семантику - методы отображения информации объекта в информацию модели и саму эту информацию;

прагматику - полезность, методы оценки полезности модели.

Таким образом,  семиотика выделяет три основные характеристики модели как знаковой системы: синтаксис, семантика и прагматика.

Этот подход определяет содержание элементарной (атомарной) модели как   элементарной  единицы  данных,  включающей: правила построения, имя объекта, свойства объекта, значения свойств.

ВЫВОДЫ:

1. Модель данных в АИС, основанная на семиотическом подходе независимо от способов построения и видов моделей требует наличия в каждой модели (данных) информации трех ее качественных частей: синтаксической, семантической, прагматической.

2. Отсутствие какой либо из трех упомянутых частей говорит о нестандартном (неполном) построении данной информационной единицы.

 

Основные  характеристики и виды информационных моделей данных

Модель отражает наиболее общие свойства объекта или исследуемого процесса. Использование различных аспектов рассмотрения и различных критериев оценки моделей данных позволяет проводить  объективный сравнительный анализ для выбора оптимальной модели к классу решаемых проблем.

С позиций агрегации (взаимосвязи) отдельных частей модели можно говорить о структуре или структурированности модели.

Одним из основных способов структуризации данных является абстракция. Она  используется  как  для  образования категорий данных, так и для построения одних категорий на основе других.

 

Сильно и слабо типизированные модели

Одно из   противоречий  описания  моделей  заключается  в стремлении,  с одной; стороны, отразить общие свойства класса объектов,  с  другой - индивидуальные признаки более узкого подкласса и наконец индивидуальные признаки конкретного объекта.

Этот аспект  рассмотрения  приводит к разделению моделей  данных на два класса:  сильно типизированные и слабо типизированные.

Сильно типизированные - это модели,  в которых большинство данных удовлетворяют неким условиям и ограничениям и могут быть отнесены к узкому подклассу (типу).

Если исходные данные нельзя отнести к одному типу,  то их можно с помощью искусственных приемов (введением дополнительных условий или ограничений) отнести к набору  типов.

Слабо типизированные модели это модели, в которых данные разнородны по формату, структуре. Они, в общем, слабо связаны  условиями относительно  известных типов.

Примером сильно типизированных данных в  ГИС  служат координатные (метрические) данные.

Примером слабо типизированных моделей в  ГИС  могут  быть описательные характеристики (временные наборы данных).

Сильно типизированные модели эффективны при обработке однотипных потоков данных.  Слабо типизированные модели обеспечивают интеграцию категорий данных.

 

Статические и динамические модели

С позиций изменчивости можно выделить два класса моделей: статические, динамические  и квазидинамические.

К статическим относят модели инвариантные относительно времени. Они служат для описания процессов и явлений, независящих от времени.

Динамические модели не только допускают изменение параметров и структур во времени, но и служат для описания изменения процессов и моделей именно во времени. Построение динамических моделей (например для задач управления) как правило более сложно чем построение статических.

Поэтому в некоторых случаях применяют квазидинамические модели как упрощение динамических.

Квазидинамические модели - это модели, в  которых временной интервал действия модели разбивается на периоды, для каждого из которых строится статическая модель. Таким образом, квазидинамические модели можно рассматривать как совокупность меняющихся и взаимосвязанных статических моделей.

Примерами  динамических и статических  моделей  в  ГИС могут служить два вида электронных карт. Электронные карты в режиме разделения времени (электронные  атласы)  представляют  реализацию статических моделей, в то время как электронные карты в реальном  масштабе времени (навигационные системы) могут служить примером динамической модели.

Следует подчеркнуть,  что  понятие  изменчивости  моделей данных в информационных системах - относительно, так как вся информация носит временной характер и через какой-то период времени требует обновления (актуализации).

Поэтому применение  понятий  статистические и динамические модели данных требует указания периода  времени,  который используется в процессе исследований или указания альтернативной модели при сравнении с исходной.

 

Аналоговые и дискретные модели

По способу отображения объекта в модель  можно  говорить  об аналоговой и дискретной моделях.  Примерами таких моделей могут служить обычный фотоснимок и сканированное изображение снимка.

Аналоговые модели в свою очередь разбиваются на две группы: прямой и косвенной аналогии.

К первой  группе  относятся модели, создаваемые на основе физического моделирования: аналоговые карты, модели судов, самолетов, гидротехнические сооружения и т. п.

Ко второй группе (косвенной  аналогии)  относятся  модели, создаваемые на основе математического моделирования (аналитического описания),  например, цифровая модель рельефа, построенная на  основе  аналитического описания поверхности. К этой же группе относят модели,  построенные квазианалоговым способом, основанном на принципе эквивалентности.

Дискретные модели  основаны на замене непрерывных функций набором дискретных значений аргументов и функций.  Дискретность определяется шагом  квантования.  Для необходимости сохранения информативности дискретной модели по отношению к объекту шаг квантования выбирается  с  учетом  теоремы Шеннона - Котельникова.

 

Масштаб действия модели

Для моделей, описывающих пространственные объекты или явления, существует понятие масштаба действия модели. Это совершенно иное понятие по сравнению с масштабом карты. Например, модель экологического мониторинга городского района неприменима для описания экологической ситуации города или области. Модель экологической ситуации региона может иметь меньшую детализацию, чем модель города.

Масштаб действия модели определяется территориальными размерами объекта исследований и числом характеристик модели, называемым также пространством параметров.

Таким образом, модели, имеющие равное пространство параметров позволяют осуществлять информационный обмен, а модели охватывающие одинаковые территории позволяют делать обобщение на данную территорию.

 

Жизненный цикл модели

Модель как информационная продукция обладает характеристикой всех информационных продуктов - жизненным циклом. Жизненный цикл означает разные периоды разработки и применения модели. Можно выделить шесть фаз жизненного цикла информационной модели:

1.      фаза разработки концепции;

2.      фаза разработки проекта модели;

3.      фаза реализации модели;

4.      фаза эксплуатации и актуализации модели;

5.      фаза модернизации;

6.      фаза завершения эксплуатации модели.

На первой фазе создается концептуальная схема разработки и использования модели.

Концептуальная схема определяется как непротиворечивая совокупность высказываний, истинных для данной предметной области, включая возможные состояния, классификации, законы, правила.

На этапе разработки проекта осуществляется структурное проектирование, декомпозиция задач и поиск решений задач с помощью данной модели.

На фазе реализации осуществляется построение модели на основе программно-аппаратных средств.

На фазе эксплуатации осуществляют практические работы и актуализацию данных для приведения характеристик модели с соответствии с изменяющимися внешними условиями.

Модернизация модели направлена на ее совершенствование и продление периода эксплуатации.

Фаза завершения эксплуатации модели очень важна, так как помимо консервации модели, которая уже не достаточно отражает существующую реальность необходимо обеспечит преемственность в передаче данных от устаревшей модели к новой.

 

Формы представления моделей данных

Аспект  представления моделей разграничивает модели по четырем основным формам представления: аналитические, табличные, графические и графовые.

Аналитическая форма представляет модель в виде формулы, аналитического выражения, совокупности аналитических выражений (уравнений). Она применяется при известных законах поведения модели или объекта.

Графическая форма  использует отображение совокупности моделей или данных в виде кривых, графиков, диаграмм. Она наиболее часто применяется при наличии статистических данных и при известном аналитическом описании модели, т.е является формой взаимосвязанной с аналитической.

Табличная форма дает представление модели или ее характеристик в виде одной или совокупности взаимосвязанных таблиц. Она применяется при описании атрибутов и при сборе статистической информации. Следует подчеркнуть, что при этом данные в ячейках таблицы не могут заносится произвольно, они подчиняются определенным правилам, в частности, по столбцам располагают типизированные данные.

Графовая форма основана на  представление модели в виде графической схемы называемой графом. Она применяется при описании структур моделей данных, процессов обработки или управления и описании сложных систем.

Схема включает элементы графа, называемые вершинами  (узлами) и ребрами (дугами).  В отличии от произвольно нарисованной схемы графовая модель, как и табличная модель, строится по определенным правилам.

В частности, каждое ребро может быть ориентировано, если определен путь от одной вершины к другой, и не ориентировано, что соответствует возможному пути от одной вершины к другой в обеих направлениях.

Простейшим примером ориентированного графа  может служить вектор в трехмерном пространстве, а неориентированным графом схема метрополитена. Кроме вершин и ребер существуют другие элементы, значение которых не столь существенно на данном этапе рассмотрения моделей.

В целом формы представления моделей реализуются средствами компьютерной графики и деловой графики.

 

ГИС как обобщенная  интегрированная информационная  система с пространственной локализацией данных

Рассмотрев информационные системы с пространственной локализацией данных можно перейти к рассмотрению геоинформационных систем, которые появились как практическая потребность обобщения таких систем на основе интеграции.

Этот подход позволяет определить ГИС как многоаспектную автоматизированную интегрированную информационную систему с пространственной локализацией данных. ГИС  обобщающих в себе общие свойства информационных систем этого класса и является развитием таких систем.

В связи с нечеткой терминологией употребляемой рядом авторов и в первую очередь географов, следует уточнить некоторые понятия.

При изучении геоинформационных систем  не следует путать  два ряда родственных понятий. Первый ряд понятий образуют более общие термины, связанные с геоинформатикой и ГИС:

Геоинформатика, геоинформационная система, геоинформационная технология, геоинформационное моделирование, геоинформационный объект, геоинформационные данные

Второй ряд понятий образуют термины, связанные с географией:

География, географическая информационная система, географическая технология, географическое моделирование, географический объект, географические данные.

Эти два ряда понятий не эквивалентны. Замена понятий геоинформатики географическими терминами - ошибочна. В некоторых случаях эти понятия близки, но  имеют и различия. Например, геоинформационная система (ГИС) является более общим понятием по отношению к географической информационной системе (ГИС).

ГИС как географическая информационная система функционально направлена на решение задач в области географии. ГИС как геоинформационая система является обобщением автоматизированных информационных систем с пространственной локализацией данных, большинство из которых к географии отношения не имеет.

Следует различать ГИС-систему и ГИС-технологию. Сфера действия ГИС-технологий шире, чем ГИС -систем. Это обусловлено тем, что ГИС как инструментальная система работает с унифицированными данными, а ГИС -технологии включают сбор неунифицированных разнородных данных, их первичную обработку, унификацию и последующую обработку и представление с помощью ГИС-систем.

большинство технологий и методов ГИС заимствовано полностью, частично  или являются развитием уже существовавших технологий других систем с пространственной локализацией данных.

ГИС является современным обобщением автоматизированной интегрированной информационной системы с пространственной локализацией данных, в которой заимствованы методы и технологии из других ранее существовавших информационных систем.

Набольшее число важнейших технологий ГИС заимствовано из САПР. Это дает основание утверждать, что основой интеграции технологий в ГИС является технология САПР.

Основой связи между объектами ГИС является позиционирование в системе координат земной поверхности. Это дает основание говорить о том, что основой интеграции данных в ГИС являются географические координаты.

Одним из основных отличий ГИС от других АС с пространственной локализацией следует считать применение теории графов для создания топологии линейных и ареальных объектов и использование  криволинейных систем координат и картографических проекций для связи пространственных объектов с точками земной поверхности.

 

Многоаспектность ГИС

Интеграция ГИС с другими автоматизированными системами порождает многоаспектность ГИС. В ГИС  осуществляется комплексная обработка информации от сбора данных до ее хранения, обновления и представления, поэтому следует рассмотреть ГИС с различных позиций.

Одно из основных назначений ГИС - поддержка принятия решений и управление. Как системы управления ГИС -предназначены для обеспечения процесса принятия решений по оптимальному управлению землями и ресурсами,  городским хозяйством, организации транспорта   и розничной торговли, использованию океанов или других пространственных объектов.

В отличии от автоматизированных систем управления АСУ в ГИС появляется множество новых технологий пространственного анализа данных, объединенных с технологиями электронного офиса и оптимизации решений на этой основе.  В силу этого ГИС является эффективным средством преобразования и синтеза разнообразных данных для задач управления,.

Как гео системы  ГИС интегрируют технологии сбора информации таких систем как :"Географические  информационные системы" (ГИС), "Системы картографической информации" (СКИ), "Автоматизированные системы картографирования" (АСК),  “Автоматизированные фотограмметрические системы” (АФС), "Земельные информационные системы" (ЗИС), "Автоматизированные кадастровые системы" (АКС) и т.п.

Как системы, использующие базы данных, ГИС характерны широким набором данных, собираемых с помощью разных методов и технологий. При этом следует подчеркнуть, что они объединяют в себе возможности  текстовых и графических базы данных.

Как системы моделирования ГИС используют максимальное количество методов и процессов моделирования, применяемых в других автоматизированных системах и в первую очередь в САПР.

Как системы получения проектных решений ГИС во многом используют концепции и методы автоматизированного проектирования и решают ряд специальных проектных задач, которые в типовом автоматизированном проектировании не встречаются.

Как системы представления информации  ГИС являются развитием автоматизированных систем документационного обеспечения с использованием современных технологий MultiMedia. Они обладают средствами деловой графики и статистического анализа и дополнительно к этому средствами тематического картографирования. Именно эффективность последнего обеспечивает разнообразное решение задач в разных отраслях  при использовании интеграции данных на основе картографической информации.

Как прикладные системы,, ГИС не имеют себе равных по широте, т.к. применяются в транспорте, навигации, геологии, географии, военном деле, топографии, экономике, экологии и т.д.

ГИС как системы массового пользования позволяют использовать картографическую информацию на уровне деловой графики, что делает их доступными любому школьнику или бизнесмену, а не только специалисту географу. Именно поэтому принятие многих решений на основе ГИС -технологий не сводится к созданию карт, а лишь использует картографические данные.

 

Пространственная локализация данных в ГИС

ГИС как   информационные системы   с пространственной локализацией данных имеют свойства, присущие всему этому классу и индивидуальные свойства, присущие только ГИС. 

Данные  реального мира, отображаемые в информационных системах с пространственной локализацией данных,  необходимо рассматривать  с учетом трех аспектов:  пространственного, временного и тематического.

Пространственный аспект связан с определением местоположения.

Временной -    с изменениями объекта или процесса с течением времени, в частности от одного временного среза до другого. Примером временных данных служат результаты переписи населения.

 Тематический аспект обусловлен включением в информационную систему тематической информации некой предметной области.

В одних информационных системах (например, СтИС) пространственный аспект отражается с помощью системы классификаторов. В других (САПР) пространственный аспект реализуется путем координирования (позиционирования) точек объекта в Декартовой системе координат.

В ГИС используются оба подхода, т.е. используются классификаторы для пространственной информации и позиционирование, но в системе координат поверхности Земли. Последнее обстоятельство требует привлечения дополнительного математического аппарата для отображения криволинейной поверхности Земли в виде плоской модели - карты.

Существенным отличием ГИС от других информационных систем с пространственной локализацией данных является  включение в описание пространственных объектов топологических характеристик и классификация на этой основе пространственных объектов на: точечные, линейные и площадные (ареальные).

Временной аспект, как правило, включает три фактора долговременный, средне временный и оперативный. С этим аспектом связана характеристика качества информации - актуальность и процедура актуализации данных.

Актуализацией данных - называют процедуру обновления данных для приведения их в соответствие с изменениями в объективной реальности объектов исследования или среды.

По временной характеристики информация, хранимая в ГИС, обычно подразделяется на:

- долгосрочную (десятки лет хранения);

- среднесрочную (годы);

- годовую и сезонную;

- оперативную.

Однако временной аспект данных  в ГИС определяется и классом решаемых задач. Например, в большинстве ГИС оперативность определяется от одной недели до двух-трех недель. В специальных мониторинговых ГИС-системах (военная разведка, анализ чрезвычайных ситуаций) оперативность может составлять минуты.

Тематическая информация в ГИС не ограничена. Именно это создает возможность использования ГИС как универсальной информационной системы для решения разнообразных задач. Мало того, именно тематическая информация является основной, в то время как пространственная информация служит связующим звеном для объединения, сопоставления, поиска и интерпретации разнообразной тематической информации.

 

Литература:

 

1. Бугаевский Л.М., Цветков В.Я. «Геоинформационные системы» учебное  пособие Москва 1999

 

 


[ Назад ] [ Вперед ]

[ вернуться к содержанию ]