INTEROPERABILIDADE DE BASES DE DADOS ESPACIAIS HETEROGÊNEAS E DISTRIBUÍDAS

 

Julia Celia Mercedes Strauch(1,2)

e-mail: julia@cos.ufrj.br

Marta Lima de Queirós Mattoso(2)

e-mail: marta@cos.ufrj.br

Jano Moreira de Souza(2)

e-mail: jano@cos.ufrj.br

 

(1)EMBRAPA/CNPS - Rua Jardim Botânico, n° 1024, Cep 22460-000

Rio de Janeiro, RJ, Tel: (021) 274 4999, Fax: (021) 274 5291

(2)COPPE/UFRJ - Prog. de Eng. de Sist.e Computação, CP 68511, Cep 21945-970

Rio de Janeiro, RJ, Tel: (021) 590 2552, Fax: (021) 290 6626

Resumo

O alto custo da aquisição de dados para implantação de Sistemas de Informações Geográficas (SIGs) e a complexidade das análises tem demandado o acesso a dados multidisciplinares armazenados em bases de dados de SIGs localizadas em diversas instituições. No âmbito da tecnologia de Banco de Dados as propostas têm conduzido ao desenvolvimento de um ambiente denominado Multidatabase (MB), que proporciona o compartilhamento de dados entre sistemas. Este trabalho tem por objetivo caracterizar a heterogeneidade entre as bases objetos geográficos, discutir as soluções atuais para promover o compartilhamento de dados entre SIGs, conceituar interoperabilidade entre bases de dados heterogêneas e distribuídas de SIGs e apontar as principais vantagens deste conceito aplicado a SIG.

Abstract

The high cost of data acquisition to Geographic Information System (GIS) and the analysis's complexity had forced the access to the multidisciplinary data stored into GIS's databases located in any institutions. In the Database technology context the proposes have lead to the development of Multidabase (MB) environment, that provide the data sharing among systems. This paper aims to characterise the heterogeneity between geographics objects databases, to discuss the actual solutions to promote data sharing among GIS, to present the interoperability concept among heterogeneous and distributed GIS databases and to point the main advantages of these applied to GIS.

 

1. Introdução

Os Sistemas de Informações Geográficas (SIGs) surgiram da necessidade de di-versas áreas de aplicações com-binarem dados descritivos sobre a superfície terrestre com a sua representação cartográfica, a fim de realizar análises espaciais de acordo com crité-rios definidos pelos usuários. Isto gerou uma diversidade de hardwares, softwares e sistemas operacionais uti-lizados para o desenvolvimento de SIGs. Esta diversidade au-menta quando se considera que as bases de dados destes sistemas foram proje-tadas inde-pendentemente de forma diferenciada, de acordo com o domínio e finalidade da área de aplicação.

O alto custo da aquisição de dados para a implantação de um SIG e a crescente complexi-dade das análises ambientais, que a cada dia exigem novos parâmetros de diversos domínios de conhecimento não previstos nas questões manifestas e la-tentes, requerem o acesso a dados multidisciplinares arma-zenados em diversas bases de dados localizadas em diferentes instituições.

Do ponto de vista concei-tual dos dados, o compartilha-mento destes é possível, uma vez que nestas bases os objetos geográficos tem em comum o mes-mo espaço geográfico descrito. Contudo, da perspectiva de Ban-co de Dados, essas bases são heterogêneas e distribuídas. A heterogeneidade destas bases é decorrente: i) das áreas mode-larem os objetos geográficos de acordo com a semântica neces-sária a área de aplicação e a finalidade da instituição a qual pertence a informação; e ii) dos SIGs posuírem carac-terísticas decorrentes do am-biente de implementação e da adequação da modelagem dos da-dos ao software utilizado para o acesso, gerência e mani-pulação dos dados, influen-ciando no formato e estrutura de armazenamento dos dados grá-ficos e não gráficos dos obje-tos geográficos. A disribuição é decorrente dessas bases de dados estarem geograficamente localizadas em diferentes instituições [STR95].

A solução, inicialmente proposta, consiste basicamente em desenvolver aplicações espe-cíficas para converter e migrar dados de um SIG, em um deter-minado formato, para outro, em outro formato, e vice-versa, proporcionando interoperabili-dade entre pares específicos de SIG. Uma outra solução consiste em consolidar alguns formatos de dados mais utilizados como padrões para troca de dados entre SIGs. Entretanto, nos últimos anos, os recentes progressos nas tecnologias de rede, de Sistemas de Gerenci-amento de Banco de Dados Distribuídos (SGBDDs), e de co-municação, no âmbito da tecnologia de Banco de Dados, têm conduzido ao desenvol-vimento de um ambiente denomi-nado Multidatabase (MB), que proporciona o compartilhamento de dados armazenados em SGBDs pré-definidos e independentes, que gerenciam uma coleção de dados e aplicações específicas [BRI94].

Esta tecnologia estendida a SIG poderá trazer conside-ráveis benefícios no estabele-cimento de mecanismos que per-mitem a interoperabilidade en-tre bases de dados georeferen-ciadas distribuídas entre algu-mas instituições. A interopera-bilidade neste contexto tem por objetivo permitir que dois ou mais SIGs heterogêneos inte-rajam uns com os outros e troquem dados georeferenciados de forma a alcançar resultados unificados.

Assim, este trabalho tem por objetivo caracterizar a heterogeneidade entre as bases objetos geográficos, discutir as soluções atuais para promo-ver o compartilhamento de dados entre SIGs, conceituar intero-perabilidade entre bases de da-dos georeferenciadas heterogê-neas e distribuídas de SIGs e apontar as principais vanta-gens deste conceito aplicado a SIG.

2. Heterogeneidade entre bases de dados de SIG

As bases de dados de SIG contêm objetos geográficos que representam fenômenos ligados a natureza ou resultante da atuação do homem sobre o meio. A heterogeneidade entre estas bases de dados é decorrente do fato delas armazenarem dife-rentes representações lógicas e físicas das conceitualizações a respeito do mundo real. Esta heterogeneidade está presente durante toda a etapa de ciclo de vida de um SIG, a saber: na adoção do modelo conceitual para o seu desenvolvimento; na abstração da aplicação; na especificação dos metadados; no hardware utilizado; no formato dos dados; no próprio conteúdo da base e na ferramenta utilizada para o gerenciamento dos dados com suas respectivas linguagens de consulta [AGU95].

Entretanto a heteroge-neidade tem sido pesquisada no contexto das diferenças entre os esquemas das bases de dados. Estas diferenças são resultan-tes da própria tecnologia de Banco de Dados ter capacidade de armazenar uma única repre-sentação que captura como cada usuário percebe e concebe a re-alidade de modo individualizado para sua aplicação. Assim, as diversas bases de dados de SIG heterogêneos e distribuídos foram desenvolvidas indepen-dentemente para atender à necessidade de seus usuários. Estas bases não compartilham do mesmo conjunto de dados sobre a realidade que elas tratam, ou se compartilham os mesmos dados não são representados da mesma forma, tornando os seus esquemas incompatíveis (dife-rentes) ou inconsistentes (fal-ta informações).

Os objetos geográficos armazenados nas bases de dados de um SIG são descritos por um conjunto de dados gráficos e não gráficos georeferenciados em relação a um sistema de coordenadas. Deste modo, os conflitos decorrentes da hete-rogeneidade entre os esquemas das bases de dados de SIG podem ser classificados em [STR95]:

3. Soluções atuais soluções atuais para compartilhar dados entre SIGs

As soluções propostas para promover o compartilha-mento de dados entre SIG têm sido eliminar a heterogeneidade entre os diferentes formatos de arquivos proporcionados pelas diversas estrutura de dados u-tilizadas para representar os dados gráficos e não gráficos dos objetos geográficos [FRO94].

A estratégia inicial para promover o compartilhamento de dados entre SIGs consistia no desenvolvimento de aplicações orientadas a produtos, que ti-nham por finalidade transformar as estruturas de dados de um sistema para outro, através da conversão de formatos de ar-quivos de dados processados em batch. Esta estratégia no âmbito da tecnologia de Banco de Dados não é uma tarefa difícil, entretanto quando a-plicada a SIG ela se torna mais complexa, pois além da conver-são de dados não gráficos é ne-cessário considerar a conversão de dados gráficos e o rela-cionamento entre eles. Deste modo, a implementação destas a-plicações exigia o conhecimento prévio dos formatos dos ar-quivos de dados gráficos e não gráficos, levando em consi-deração as características dos softwares, das organizações dos dados, dos modelos dos dados, bem como a compreensão das ne-cessidades dos usuários, em ambos os sistemas, precisando algumas vezes realizar consi-derações bidirecionais.

 


Fig.1 - Conversão de dados

 

Esta estratégia se mostra relativamente eficiente quando se sabe onde os dados estão localizados, porém ela é pontual, proporcionando intero-perabilidade entre pares espe-cíficos de SIGs e apresenta a necessidade de conversão e mi-gração reversa de parte dos da-dos que foram atualizados em um deles, de forma a não gerar in-consistências entre os sis-temas.

De modo geral, com o amadurecimento dos softwares para SIG disponíveis no mer-cado, os processos de conversão passaram a ser incorporados aos sistemas através de aplicações que permitem importar/exportar formatos de arquivos de dados que se consolidaram no mercado como padrão, tal como formato DXF (Drawing eXchange Format) ou o formato GENERATE do ARC/Info [ARC94]. Entretanto esta solução se torna ineficiente quando há neces-sidade de trocar dados com um novo tipo de sistema não pre-visto por estas aplicações.

Deste modo, atualmente uma das soluções propostas pela comunidade usuária dos SIGs é o estabelecimento de um padrão de dados que permita transferência de dados entre os sistemas. Este padrão de dados deve oferecer simplicidade de manu-seio, neutralidade em relação aos sistemas, poder de expres-são para qualquer modelo de da-dos e capacidade de adequação aos novos conceitos da tecno-logia. Esta solução representa um denominador comum entre di-ferentes sistemas e viria re-duzir o número de aplicações de conversões de n(n-1) para 2n, onde n é o número de formatos de arquivos de dados.

 


Fig. 2 - Comparação do número de conversores com/sem padrão de dados onde onde significa duas transformações de arquivos

 

Em alguns países, órgãos com poder normativo estão pro-pondo padrões para o inter-câmbio de dados geográficos. Dentre estes destacam-se os padrões americano Spatial Data Transfer Standard (STDS) pro-posto pelo Federal Geogrhaphic Data Committee (FGDC) [RIB95] e canadense Spatial Archive Interchange Format (SAIF) pro-posto pelo Survey and Resource Mapping Branch - Ministry of Environment Lands and Parks (MELP) [SAIFa]. O SDTS é um padrão que fornece formatos para intercâmbio de dados associado a representações dos dados geográficos (vetores, grades, tabelas, etc.) que reflete o modelo conceitual do ARC/Info. O SAIF é um padrão canadense que permite definir estruturas de dados usando um modelo de dados orientado a ob-jeto que independente de soft-ware e foi projetado para mo-delar e promover a troca de dados espaço-temporais utili-zando ferramentas que estão sendo desenvolvidas, tal como Feature Manipulation Engine (FMB) [SAIFb].

O estabelecimento destes padrões requer três conside-rações. A primeira delas con-siste em estabelecer como o padrão pretende atender a tec-nologia de heterogeneidade. A segunda é relativa a neu-tralidade deste padrão que deve ser estabelecida através de um consenso entre os fabricantes e usuários. E a última consiste em estabelecer um padrão de mo-do que ele possa evoluir com a tecnologia, uma vez que a taxa de inovação da informática tor-na estes obsoletos mesmo antes de serem completamente estabe-lecidos.

Uma tendência atual para o compartilhamento de dados en-tre bases de dados de SIGs é promover a interoperabilidade estendendo as características de um ambiente MB para suportar dados gráficos e não gráficos [GAR,GOD94,LAU94].

4. Interoperabilidade

Interoperabilidade é um conceito aberto e amplo que tem sido usado em diferentes con-textos para expressar o com-partilhamento de dados em um ambiente composto de vários sistemas. Perine [Per95] define genericamente interoperabilida-de como a habilidade de dois ou mais sistemas, sejam compu-tadores, dispositivos de comu-nicações, base de dados, rede e outras tecnologias de infor-mação; interagirem um com o outro e trocar dados de acordo com um método prescrito a fim de alcançar resultados previ-síveis.

A interoperabilidade é alcançada no ambiente MB por uma arquitetura que suporta o acesso à várias bases dados, escondendo as heterogeneidades entre os sistemas, esquemas de dados ou aplicações, de forma que os sistemas se comuniquem uns com os outros, propor-cionando a troca de dados e expandindo a base de aplicações dos usuários. O objetivo destas arquiteturas é fornecer um am-biente no qual o usuário pode submeter consultas e atuali-zações acessando os dados de várias bases heterogêneas e distribuídas; denominadas de bases de dados locais; usando definição de dados e uma linguagem de manipulação comum, bem como preservando as autonomias de seus SGBDs.

No âmbito da tecnologia de Banco de Dados são encon-tradas na literatura diversas propostas de arquiteturas para este ambiente que podem ser classificadas em acoplamento forte e fraco. A primeira delas tem por objetivo desenvolver um ambiente formado por um esquema conceitual global que integra todas as bases de dados com um único método de acesso. A segunda tem por objetivo inte-grar as bases de dados uti-lizando uma interface inte-rativa com o usuário para a ne-gociação direta entre as bases de dados componentes da fede-ração ou um programa de apli-cação ou uma linguagem de consulta a múltiplas bases de dados, que auxilia a integração dos dados somente no contexto de uma sessão, sem um esquema global.

Assim a tendência em SIGs é substituir as soluções orien-tadas ao produto por arqui-teturas cliente-servidores que permitam a interoperação atra-vés da eliminação das heteroge-neidades entre as bases de dados de SIGs. Para isto é necessário compreender as dife-renças entre essas bases de dados projetadas independen-temente, capturar a semântica dos dados, os requisitos de consistência, as restrições de integridade e aplicar técnicas desenvolvidas para resolver os conflitos entre os dados grá-ficos e não gráficos dos ob-jetos geográficos armazenados pelos SIG.

Esta arquitetura deverá ser composta por uma interface que se apresenta como uma única aplicação em diversas plata-formas/sistemas e deverá con-templar ainda três requisitos básicos que tratam do gerencia-mento de rede em um ambiente MB, a saber:

Atualmente, a emergente expansão da World Wide Web (WWW) traz novas dimensões tor-nando conceito de interopera-bilidade mais amplo, uma vez que este ambiente deverá utilizar recursos da rede INTERNET permitindo o acesso a dados distribuídos em dife-rentes ambientes computacionais através da rede global de repo-sitórios de dados [GAR].

5. Vantagens de um ambiente MB aplicada a SIG

O desenvolvimento de um ambiente MB que proporciona a interoperabilidade entre bases de dados de SIGs localizadas em diferentes instituições é o grande desafio da década. Este ambiente proporcionará um com-partilhamento de dados mais produtivo, trazendo consi-deráveis benefícios a comuni-dade de usuários. Dentre os principais benefícios destacam-se:

Esta última acarretará na conseqüente redução do custo de desenvolvimento de um SIG, uma vez que o processo de aquisição de dados é a parte mais onerosa para a implantação de um pro-jeto.

6. Conclusão

A troca de dados entre bases de dados georeferenciadas é uma necessidade crescente entre as diversas instituições que trabalham com informação georeferenciada. Deste modo estender as pesquisas realizadas para o desenvol-vimento de um ambiente MB em Banco de Dados convencionais para a tecnologia de SIGs irá trazer consideráveis benefícios à comunidade de usuários de Geoprocessamento.

Este ambiente possibili-tará interoperabilidade entre bases de dados de SIG através da integração de informações multidisciplinares das diversas bases de objetos geográficos heterogêneas distribuídas. Isto deverá expandir a base de dados dos usuários de Geoproces-samento, permitindo pensarem sobre que tipos de dados eles querem compartilhar e realizar novos tipos de análises dos dados.

O Projeto HIP (Heteroge-neidade, Interoperabilidade e Paralelismo do Programa de En-genharia de Sistemas e Com-putação da COPPE/UFRJ tem como projeto de pesquisa o desen-volvimento de uma arquitetura que possibilite a interope-rabilidade entre bases de objetos geográficos hetero-gêneas e distribuídas. Esta ar-quitetura deverá proporcionar um modelo de dados que descreva os objetos geográficos utili-zando técnicas para compa-tibilizar as referências geográ-ficas, a estrutura se-mântica dos objetos geográficos heterogêneos, a qualidade dos dados e outras questões re-lativas aos metadados. Esta arquitetura deverá se bene-ficiar do paradigma orientado a objetos na adoção do modelo de dados, bem como no acesso às bases de dados georeferen-ciadas. Ela deverá ainda utili-zar algum formalismo para definir os metadados de forma a auxiliar os usuários a encon-trarem os objetos geográficos no ambiente distribuído [RIB96].

O desenvolvimento deste ambiente é um primeiro passo ao desenvolvimento da tecnologia de bibliotecas geográficas di-gitais, que nada mais são do que uma hiper base de dados geográficos descentralizada. O desenvolvimento destas biblio-tecas permitiram um eficiente acesso a mapas e imagens atra-vés do uso de sofisticados browsing, catálogo de dados e avançadas técnicas de pesquisa.

Agradecimentos: Ao CNPQ pelo su-porte a esta pesquisa.

Referências bibliográficas

[AGU95] Aguiar, C. D.; Integração de Sistemas de Banco de Dados Heterogêneos em Aplicações de Plane-jamento Urbano; Dissertação de Mestrado apresentada ao Instituto de Matemática e Ciência da Computação da UNICAMP, 1995

[ARC94] ARC/INFO: Data Mana-gement: Concepts, data mo-dels, database design and storage, v. 7.1; ESRI; 1994

[BRI94] Bright, M. W.; Hurson, A. R. & Pakzad.; A taxonomy and current issues in Multidatabase Systems; In: Multidatabase Systems: An adavanced solution for global information sharing; IEEE Computer Society Press; 1994

[FRO94] Froment, E. D.; Gis and data integration: a user's perspective; GIS'94 Sympo-sium, Vancouver, 1994, pg 157-161

[GAR95] Garcia- Molina, H. & Hsu, M.; Distributed Da-tabases; In: Modern Da-tabase Systems the object model, interoperability and beyond; Won Kim Editor; ACM Press; New York; 1995

[GAR] Gardels, K. The open gis approach to distributed geodata and geoprocessing; http://..cgia.uscb.edu/conf/SANTA_FE_CR_ROM/sf_papers/gardels_ken/ogismodl.html

[GOD94] Goodman, J. N.; Alberta land related Information System, a federated da-tabases case study, Proceedings of Annual Conference URISA, 1994

[LAU94] Laurini, R.; Sharing geographic information in distributed databases; Pro-ceedings of Annual Conference URISA, 1994

[Per95] Perine, L. A.; In Pursuit of an optimum: a conceptual model for examining public sector policy support of interope-rability; Proccedings of the Workshop on interope-rability and economics of information infrastructure, Virginia, 1995

[RIB96] Ribeiro, G.P. & Souza, J. M.; Digital Geospatial Metadata: an Brazilian Case of Federal Databases; first IEEE Metadata Conference; Maryland, USA; 1996

[SAIFa] SAIF - Profile 1: Britsh Columbia Speci-fication and Guidelines for Geomatics;http://www.env.gov.bc.ca/~srmb/stk/toc.html

[SAIFb] SAIF/FMEBC: Spatial Archieve and Interchange Format - Feature Manipu-lation Engine; http://www. env.gov.bc.ca/~srmb/fmbc/SAIF_FMEBC.html

[STR95] Strauch, J. C. M & Mattoso, M. L. Q.; Intero-perabilidade entre bases de dados heterogêneas e dis-tribuídas, Relatório Técni-co, COPPE, 1995