Presentation | Modules | Download | Manuals | Doc | Tutorial | Examples | Marc Souris | home


SavGIS Software

Savane Logo

Geographic Information System by IRD


Présentation générale
Description des principes
Description des différents modules


 

Le système d'information géographique SavGIS



SavGIS est un système d'information géographique complet, conçu pour saisir, rassembler, gérer, analyser et cartographier des données géographiques d'origine très diverses : données d'enquêtes, de cartes thématiques, topographiques, de réseaux, d'images satellitales, de photographies aériennes, de modèles numériques de terrain... Le noyau de SavGIS est un système de gestion de base de données relationnelle étendu à la localisation, autour duquel sont développées de nombreuses fonctions pour l'analyse spatiale, la cartographie, la statistique, la télédétection, l'hydrologie, etc.

Le système SavGIS est un instrument complet pour l'analyse et la recherche en géographie, la planification urbaine, l'aménagement du territoire, l'étude et la gestion de l'environnement, l'épidémiologie spatiale et la géographie de la santé...

De faible coût pour une large diffusion, c'est un système ouvert dont les sources peuvent être disponibles pour ceux qui souhaiteraient participer au développement de nouvelles méthodes ou fonctionnalités en géomatique.

Quito and Pichincha volcano


De la constitution d'une base de données géographique au produit cartographique

SavGIS est un logiciel complet qui permet de saisir des données géographiques, de constituer et de gérer des bases de données relationnelles localisées, d'analyser et de traiter l'information géographique, et enfin de cartographier et d'éditer les résultats des requêtes.

Système de gestion de bases de données relationnelles, système d'analyse et d'aide à la recherche en géographie, système de cartographie et de dessin automatique, SavGIS va de la constitution d'une base de données à l'édition cartographique : il offre la possibilité de gérer l'ensemble de la chaîne de traitement, depuis la conception de l'information jusqu'au produit cartographique final.


La gestion relationnelle et la localisation

Dans SavGIS, il n'y a pas de séparation entre la localisation et la description des objets : l'intégration complète graphique-descriptif au niveau du système de gestion permet une manipulation facile et intégrée d'objets de structures internes complexes et diverses. C'est le système de gestion de la base de données qui se charge d'administrer la complexité des structure et des relations entre le graphique et le descriptif. De même, il n'existe pas de différence externe entre raster et vecteur : la double structure interne permet de manipuler l'une comme l'autre. Certaines données sont conservées en structure vecteur (contours de zones, lignes et réseaux, points), d'autres en raster (images numériques, modèles numériques), chacune dans sa précision d'origine. Le système gère automatiquement la création d'une struture à partir d'une autre. L'ensemble de l'information est gérée par une base de données unique, assurant ainsi simplicité d'utilisation, intégration de l'imagerie, et surtout rigueur dans la gestion de la base. Ces caractéristiques font de SavGIS un système puissant mais d'utilisation facile.


Un système multi-utilisateurs

Les bases de données sont partagées entre plusieurs utilisateurs, suivant le principe du client/serveur. Seul l'administrateur du système peut modifier la base de données, mais tous les utilisateurs disposent d'un espace de travail leur permettant de mener des requêtes de stocker cartes, fichiers temporaires, masques, etc.

La requête, séquence interactive d'opérations

Toute requête est gérée par le moteur de base de données relationnel intégré au système. Pour répondre à une question avec SavGIS, il faut construire une requête, c'est-à-dire une séquence d'opérations simples, le résultat d'une opération pouvant servir d'entrée à l'opération suivante. Une fois définie, cette séquence peut être conservée sous forme de macro-commande ou être intégrée à la base de données comme méthode.
Cette succession d'opérations - le résultat de l'une servant d'entrée à la suivante - rendent quasi infinies les possibilités d'exploitation. L'interactivité graphique est permanente : à tout moment, l'utilisateur peut visualiser le résultat d'une opération avant de passer à la suivante.


L'intégration de l'imagerie numérique dans le schéma relationnel

L'image satellitale ou aérienne est une source d'information et d'actualisation primordiale. Les données de type image (comme les images satellite, les photographiées aériennes) sont intégrées dans la base de données relationnelle comme les autres types de données (zones, lignes, points, non localisées). Un module du système (Savamer) permet de géoréférencer, mosaïquer et intégrer les images dans une base de données, et des outils spécifiques de traitement d'image permettent de modifier et d'analyser les images géoréférencées au sein de SavGIS.

Un système compatible

Une base de données géographique devient rapidement l'investissement majeur d'un projet en géomatique, au-delà du logiciel informatique utilisé pour la gérer ou l'exploiter. SavGIS assure la compatibilité totale des bases de données géographiques avec les standards du marché, grâce à ses nombreuses possibilités d'exportation. L'utilisateur peut donc choisir d'utiliser d'autres systèmes et bénéficier ainsi des avantages de chaque logiciel.

Un système à vocation scientifique

Produit de la recherche scientifique, SavGIS répond aux nécessités de multiples applications tant scientifiques que pratiques. Expression de la recherche méthodologique sur les systèmes d'information géographique, il est ouvert en permanence au développement de nouvelles méthodes et fonctionnalités.

 


Un instrument de gestion, d'analyse et de représentation de l'espace géographique

Fenêtre d'étude et projections géographiques

SavGIS conserve la localisation des objets en coordonnées géographiques (longitude, latitude). Il est possible de choisir une projection (UTM, Lambert, Mercator...) pour traiter les données et représenter les résultats cartographiques. La fenêtre d'étude est l'espace sur lequel porte les requêtes, c'est le territoire sur lequel porte la séquence d'opérations. Elle peut être définie de plusieurs façons, en coordonnées, directement sur l'écran, en fonction des objets d'une collection de la base, etc.

Gestion et interrogation de données

Les données sont structurées et groupées selon le principe relationnel, en différentes tables. Le système de gestion de base de données, noyau de SavGIS, gère tous les objets et permet de les mettre en relation les uns avec les autres quelque soit leur table d'origine ou leur type d'implantation spatiale. Il contient toutes les opérations classiques des SGBD relationnels (restriction, projection, union, jointure, etc.), et les étend à la localisation (restriction geographique, union geographique, semi-jointures géographiques, etc.).
On peut également interroger directement les données sur l'écran : un clic de souris sur un objet permet d'obtenir la liste de ses valeurs descriptives.

Calculs sur les attributs descriptifs

Il est très facile de créer de nouveaux attributs par calcul à partir des attributs existants dans la base. On peut ainsi effectuer de scalcul numériques, des calculs logiques, statistiques, des agrégations, combinaisons, regroupements, des calculs de distances, de superficie, de proximité, etc.
De même, de nombreux traitements permettent de créer de nouveaux attributs par classification : par intervalle, par quantiles, par regroupement, en utilisant une distance, etc.

Cartographie automatique interactive

SavGIS offre de nombreuses possibilités pour représenter cartographiquement les éléments de la base en fonction de la valeur d'un ou plusieurs attributs : simboles, lignes, trames, couleurs. Les choix sont interactifs et le résultat est visualisé ou modifié directement sur l'écran. Il est également possible d'habiller la carte en dessinant directement sur l'écran des objets, des symboles, en écrivant du texte, etc.

Exportation et impression

SavGIS permet l'exportation des données de la base dans des formats standards. Les données graphiques comme descriptives de la base de données, vecteurs comme raster, peuvent être exportées vers d'autres SIG. La possibilité d'exporter des cartes complètes est également importante pour l'édition : importés dans les programmes de dessin spécialisés, les cartes peuvent être retouchées et préparées pour une impression directe en quadrichromie.

Statistique descriptive et géostatistique

Tous les attributs descriptifs peuvent être analysés grâce à des méthodes statistiques traditionnelles (moyenne, variance, écart-type), des moments par groupes, des histogrammes, des nuages de points, des histogrammes bi-dimentionnels, des corrélations, des régressions, etc. Il est possible de réaliser ces études statistiques sur un espace particulier défini à l'avance.
La géostatistique est également présente dans SavGIS grâce au calcul de variogrammes, aux ndices de proximité ou de regroupement, et aux procédures d'interpolation.
Pour des traitements plus complexes non disponibles dans le logiciel, SavGIS permet toujours d'exporter les données vers un logiciel statistique spécialisé et d'en importer les résultats si nécessaire.


Union et agrégation géographiques

La structure relationnel étendue à la localisation offre la possibilité de mettre en relation les objets géographiques sur leur localisation : on peut croiser, agréger des points dans des zones, sélectionner, etc. Il est ainsi possible de passer d'une division géographique à une autre, de changer d'échelle, de créer de nouveaux découpages...
SavGIS permet également de créer de nouvelles division régulières par carroyage, en mailles carrées, triangulaires, ou hexagonales. Associées aux opérations d'agrégation graphique et de classifications par proximité, le choix de la taille de la maille permet de réaliser de nombreux traitements d'union géographique.
Enfin, SavGIS dispose d'un type d'objet particulier, qui correspond à une représentation interne maillée de l'espace, à très grande définition. Tous les objets de la base de données peuvent être ramenés à ce type, qui permet donc une comparaison des valeurs d'attributs de tous les objets partageant le même point géographique de cette représentation maillée.

Masques et distances

Un masque représente un domaine de l'espace, défini à partir de certains objets de la base et d'une distance à es objets. L'espace ainsi défini peut être utilisé pour sélectionner d'autres objets dans d'autres relations, par une opération de semi-jointure géométrique. SavGIS permet de combiner différents masques et d'effectuer des opérations ensemblistes entre eux : les combinaisons possibles sont infinies et permettent de répondre à tout type de requête basée sur un critère spatial de distance. Dans la plupart des cas, les masques servent à restreindre le champ d'éxécution d'une commande à un espace particulier.
Les masques peuvent également être définis directement sur l'écran avec la souris.

Réseaux et recherche opérationnelle

Dans SavGIS, les réseaux sont considérés avec l'ensemble de leurs caractéristiques, tant descriptives que graphiques : attributs descriptifs par tronçons, noeuds, sens... Le système offre à la fois des fonctions de gestion comme de calcul spacifiques (flux, connexité, chemins le plus court et recherche opérationnelle).

Proximité et interpolation

Les fonctions d'interpolation basées sur la distance et la proximité permettent de créer des modèles numériques à partir de données de la base : une donnée connue seulement en certains points de l'espace sera interpolée et etendue à tout l'espace désiré. Les modèles numériques les plus utilisés sont élaborés à partir de données topographiques : il s'agit des modèles numériques de terrain, utilisés pour simuler le relief en chaque point à partir de courbes de niveaux et de points cotés. A partir des modèles numériques de terrain, le système permet de calculer divers attributs géomorphologiques et hydrologiques : pente, orientation, bassins versants, etc.

DEM, Slope, elevation clas - Reventador Volcano, Ecuador Volcan reventador - Ecuador

Changement de type d'objet

L'interpolation en est un exemple : le changement de type d'objet permet de passer d'une représentation géométrique à une autre, pour l'ensemble des objets d'une relation. Ainsi, le système SavGIS permet de vectoriser une image pour passer d'un mode pixel à un mode ligne ou zone ; il permet inversement de rasteriser des zones pour produire une représentation maillée ; il permet de créer des lignes à partir de points, pour traiter des couples de points ; il permet de créer des poinst à partir de lignes, pour traiter les noeuds d'un réseau, etc.

Télédétection et imagerie numérique

Une fois mise en conformité géographique selon une projection géographique, les images numériques (télédétection spatiale comme phototgraphie aérienne) son intégrées et manipulées directement avec SavGIS, qui possède un type d'implantation géographique - le pixel - spécifique à ce type d'objets géographiques. L'utilisateur peut ainsi utiliser cette information de façon simple, soit avec les commandes communes à tous les types de relation, soit avec les commandes dédiées aux relations de type pixel. Ainsi, SavGIS permet à la fois de s'initier à la télédétection (calculs d'indice, filtres, textures, classifiactions...) et de mettre en relation de façon complète les images numériques avec les objets vectoriels de la base de données (comparaisons, calculs statistiques, actualisations, etc.).

North Quito city  with Landsat TM North Quito city, Ecuador : DEM and Landsat TM

Calculs métriques interactifs

On peut effectuer directement des calculs métriques sur l'écran avec l'aide de la souris : il est possible de connaître les coordonnées exactes d'un point, de calculer la distance d'un point à un autre, de déterminer la surface d'une zone.

GPS et suivi en temps réel

Un module spécifique de suivi en temps réel permet d'intégrer en temps réel dans la base de données des positions et des données en provenance d'un GPS embarqué, et relayées par radio ou téléphonie mobile. Ces données peuvent également être analysées en temps réel : vitesse instantanée, vitesse moyenne, durée du trajet, nombre de passagers, etc.


Description des principes du système SavGIS

Cette présentation du système SavGIS a pour objectif de décrire rapidement les principes généraux de sa conception et de situer ce logiciel dans l’ensemble des systèmes d’information géographique. Il présente les concepts généraux du système et ses spécifications fonctionnelles.

Principes généraux

Le système SavGIS est d’abord un système de gestion de base de données relationnelle étendu aux données localisées, avec des fonctionnalités de type objet. Son objet est de grouper, gérer, traiter, cartographier des données géographiques de diverses origines et différents types, comme des données d'enquêtes, des cartes thématiques, des données topographiques, des réseaux, des images satellites, des photographies aériennes, des modèles numériques de terrain, etc. Le système SavGIS possède les principales fonctionnalités des SIG : multiples sont les possibilités de croisement, de mise en relation, de regroupement, d'agrégation de données géographiques d'origines diverses. Il n'y a pas dans SavGIS de séparation entre la localisation et la description, entre le dessin et l'information : chaque objet est conservé avec tous ses attributs, qu'ils soient graphiques ou descriptifs : c'est le système qui gère l'ensemble. Le système SavGIS possède son propre système de gestion de base de données, de type relationnel étendu aux données localisées dans l'espace.
À la fois système de gestion de bases de données relationnelles, système d'analyse et d'aide à la recherche en géographie, système de cartographie et de dessin automatique, SavGIS va de la constitution d'une base de données à l'édition : il offre ainsi la maîtrise de toute la chaîne cartographique de la conception de l'information au produit cartographique. Bien sûr, la constitution et l'exploitation d'une importante base de données localisées n'est pas chose simple et fait appel à de nombreux concepts, de la structuration et gestion de base de données à l'élaboration cartographique, en passant par la statistique, la géodésie, le traitement d'image.
Le système comprend cinq modules principaux (saisie graphique, géo-référencement d'images, administration des bases de données, exploitation des bases de données et cartographie, présentation d’atlas). Les bases de données géographiques sont gérées par un moteur de gestion de données bi-dimensionnel, avec indexation primaire basée sur la localisation.


Les concepts généraux de SavGIS

De nombreux choix peuvent être effectués pour construire un logiciel de type SIG, aussi bien pour l’architecture générale du système, pour les structures de données, pour les algorithmes de résolution, les méthodes d’indexation, de gestion, etc. Nous allons ici expliciter globalement ces choix.

A l’origine de la construction du SIG, il y a deux objectifs majeurs : gérer des objets géographiques, en assurant la pérennisation et le partage de l’information, et avoir la possibilité de mettre ces objets en relation les uns avec les autres en utilisant leur localisation. Mettre en relation, comme pouvait le faire simplement le géographe lorsqu’il superposait deux cartes thématiques, pour vérifier ou mettre en évidence des corrélations spatiales. L’idée initiale est donc simple : gérer des objets tels qu’ils apparaissent sur des cartes, par thèmes indépendamment les uns des autres, et utiliser cette localisation, considérée comme universelle entre tous les objets localisés, pour les relier les uns aux autres. Bien sûr, il faudra faire attention à conserver cette universalité lors de la mesure de la localisation. Pour éviter tout problème lié au référentiel, nous avons choisi dans notre système de conserver les coordonnées indépendamment de la projection cartographique, et d’imposer un même datum pour l’ensemble des objets d’une base de données. C’est la solution la plus simple au niveau du système de gestion, mais elle requiert d’avoir les capacités de transformer toute coordonnée pour la ramener dans ce référentiel : il nous faudra donc développer changements de projection et changements de datum.

Gérer des objets suivant des collections thématiques, et pouvoir les mettre en relation grâce à un attribut, tout cela rappelle la gestion relationnelle pour les bases de données classiques. Les objets y sont gérés par collections d’objets de même type, et ils sont mis en relation sur un attribut commun par une qualification de jointure sur cet attribut. Le modèle relationnel permet d’assurer au mieux cohérence et intégrité d’une base de données, en laissant à des opérations de restriction ou de jointure le soin de répondre à une requête. L’idée de base de la construction du système que nous présentons, c’est d’étendre le mode de gestion relationnel aux objets localisés, avec la possibilité d’une jointure sur l’attribut donnant la localisation des objets pour les mettre en relation, entre objets de collections différentes. Dans une première étape, il faut analyser le problème de la représentation des objets géographiques dans une base de données, dans l’optique de les gérer en collections d’éléments décrits par les mêmes attributs. Car une carte représente effectivement un ensemble d’objet, à l’inverse de la description d’un paysage ou d’un quartier, qui, en général, ne représente qu’un seul objet et n’a pas pour objectif une étude comparative avec d’autres objets du même type. L’idée de la collection est donc omniprésente dans notre approche : si l’on cherche à regrouper les objets en collections décrits par les mêmes attributs, c’est pour pouvoir bien les gérer, les comparer entre eux, les comparer aux objets d’autres collections. La localisation dans l’espace doit être un élément fondamental de cette comparaison.

Partir du modèle relationnel pour la gestion de base de données permet d’utiliser un modèle qui donne satisfaction dans la gestion d’objets décrits par des attributs simples (nominaux ou numériques de dimension 1). Mais la prise en compte de l’attribut de localisation s’avère plus complexe, car des questions inédites se posent pour des attributs de dimension supérieure à 1 : comment décrire et représenter des sous-ensembles de dimension un ou deux ? Comment conserver la structure métrique de l’espace ? Est-il possible d’utiliser les systèmes existants, ou faut-il construire un nouveau moteur de gestion de données ? Faut-il stocker des cartes, ou revenir sur la schématisation et la modélisation qui a déjà été effectuée par le géographe ou le cartographe ?

Dans la conception du système que nous proposons, le point de départ de l’information reste la carte ou la mesure directe de terrain, comme d’ailleurs dans la grande majorité des SIG. Mais la carte n’intervient que comme support d’un ensemble d’objets correspondant à une même entité du monde réel, non plus cartographique mais géographique, dépouillée de toute représentation sémiologique. La modélisation ne retient que la schématisation géométrique utilisée pour rendre compte des phénomènes dans l’espace, avec, pour forte contrainte, l’unicité d’un phénomène dans l’espace et le temps : dans une collection, on ne peut avoir deux objets au même endroit et au même moment (si l’on prend en compte le temps). Le respect de cette contrainte est fondamental pour assurer la validité conceptuelle de la modélisation de la réalité. A partir de ce choix (une représentation géométrique des objets basée sur une description cartographique), plusieurs possibilités existent pour conserver la description de cette représentation géométrique dans un système informatique. Il est nécessaire de définir des types différents suivant le type de localisation, ponctuelle ou ensembliste, de dimension 1 ou de dimension 2. Déjà, on pressent qu’un système de gestion de base de données classique ne peut convenir pour stocker efficacement cette description, pour peu que l’on veuille l’utiliser dans sa structure d’espace métrique. Rien n’empêche d’utiliser des tables classiques pour stocker des points (x,y), mais un système classique sera incapable de reconstituer un contour, d’effectuer des tests d’appartenance, ou une interrogation sur la distance entre les objets : l’incapacité des SGBD classiques à gérer l’attribut de localisation dans sa structure est évidente. On peut alors séparer graphique et descriptif, utilisant un système particulier pour gérer l’attribut de localisation, et un système classique pour gérer l’ensemble des attributs descriptifs, en établissant un lien entre les deux systèmes par une clé de jointure pour reconstituer les objets. Cette solution ne nous satisfait pas, pour deux raisons essentielles : il est alors impossible d’indexer les objets sur leur localisation, alors que ce critère est de loin le plus discriminant, et la gestion séparée de deux ensembles d’attributs, correspondant à un même objet, est source d’incohérence dans les bases de données et de perte de performance dès que le nombre d’objet devient grand. Lorsque les objets sont localisés, l’attribut de localisation devient en effet le plus efficace en terme d’indexation : nous souhaitons mettre en œuvre une indexation de type séquentiel indexé basée sur la localisation, ce qui impose aux valeurs descriptives d’être stockées dans l’ordre des objets si l’on veut bénéficier des performances de l’indexation sans avoir à maintenir des index denses. Ceci ne peut se faire que dans un système gérant à la fois le descriptif et le graphique.

L’autre objectif principal du système SavGIS, c’est de pérenniser l’information, de façon centralisée, et d’en permettre la consultation et l’exploitation décentralisée, avec une démarche exploratoire. En effet, si l’interrogation d’un SGBD classique utilise habituellement un langage de requête permettant d’exprimer en une « phrase » la demande faite à la base de données, le processus d’interrogation de données géographiques et la démarche du géographe relève bien souvent d’une approche exploratoire, sans la définition formelle du cheminement des opérations permettant de répondre à une question qui peut elle-même varier en fonction du cheminement. Il est essentiel de conserver cet aspect interactif dans le processus de requête, ce qui implique concrètement la création temporaire lors de l’interrogation de nouveaux attributs ou relations. Le système doit donc maintenir des états temporaires, par utilisateur : il ne pouvait être question de permettre la modification de la base de données par un utilisateur sous peine de remettre en question l’objectif fondamental de pérennisation et de centralisation de l’information.

Pour toutes ces raisons, nous avons choisi de construire un système possédant son propre moteur BD, permettant l’indexation primaire sur la localisation, permettant le stockage et la gestion de la géométrie représentant la localisation des objets, regroupés en relations, en fonction d’une modélisation de l’espace respectant le principe d’unicité de clé pour la localisation. Cette modélisation doit prendre en compte les différents types d’implantation spatiale : zone, ligne, points, pixels. Nous avons également choisi de séparer l’administration de l’exploitation : le module d’interrogation doit permettre l’approche exploratoire et la gestion d’états temporaires lors d’une requête, mais il ne peut pas modifier la base de données, droit réservé au module d’administration. Nous avons également choisi de séparer l’exploitation de la saisie graphique et de la vérification des contraintes d’intégrité. Pour le choix des structures internes de représentation de la localisation, nous privilégions systématiquement la simplicité des structures sur la simplicité des algorithmes de traitement : ainsi, nous choisirons de conserver des arcs frontières, quitte à avoir à reconstituer le contour des zones, plutôt que de conserver un contour fermé imposant un sens dans le stockage des arcs. Des structures plus simples pour la représentation de la localisation permettent de réduire les contraintes d’intégrité sur cet attribut.

A partir de la modélisation en collections thématiques, l’extension du modèle relationnel aux données localisées devient naturelle. Les opérations de l’algèbre relationnelle (restriction, projection, jointure) sont étendues à la localisation en utilisant des critères de distance ou d’appartenance, à la place d’une relation d’ordre ou d’égalité. Malheureusement, on s’aperçoit rapidement que cet attribut de localisation, que nous avions qualifié d’universel, ne l’est pas vraiment. Il varie considérablement, aussi bien dans sa conception, dans la manière de le représenter, que dans la précision de sa mesure. La jointure spatiale, extension de la jointure classique et opération formelle correspondant à la mise en relation par superposition, ne tient pas compte de la validité ou de l’échelle de description. Dans de nombreux cas, elle s’avère donc inutilisable en l’état : il va falloir gérer des transferts d’échelle pour mettre effectivement en relation des objets de validité ou d’implantation spatiale différente. La conception de notre système est-elle encore valide, si son principal objectif, à savoir mettre les objets localisés en relation grâce à leur localisation, ne peut être atteint efficacement ? Gérer ensemble des collections d’objets en conservant l’ambiguïté sur la validité de l’attribut de localisation est-il possible ? Pour répondre positivement à cette question, il est nécessaire d’introduire de nouvelles méthodes de gestion et d’exploitation, au-delà d’une jointure dont l’objectif initial –retrouver les valeurs d’un point de l’espace à partir de collections distinctes– doit être analysé en fonction de la modélisation du monde réel. La première réponse, c’est l’introduction de procédures permettant de gérer les transferts d’échelle, à la fois par des procédures d’agrégation, par des procédures de changement de type d’implantation spatiale, par des procédures d’interpolation, par des procédures d’extrapolation. L’autre réponse, complémentaire, consiste à documenter les bases de données par l’introduction systématique de méta-données permettant à l’utilisateur de revenir à la genèse de l’information et d’éviter les écueils d’une utilisation erronée. Elle consiste également à introduire dans le schéma de la base de données des méthodes d’utilisation de ces données, de manière à proposer à l’utilisateur un ensemble de méthodes d’exploitation qui dépendent non seulement du type des objets, mais également de leur contenu sémantique et de leur précision géographique.

Enfin, l’ergonomie du logiciel est importante : elle doit permettre à la fois l’approche exploratoire et la représentation cartographique des résultats, à chaque étape de la requête. Ces deux objectifs sous-tendent la conception de l’ergonomie du module d’exploitation.

Architecture générale de SavGIS

Le système SavGIS se caractérise donc par une stricte application de la logique et des concepts des base de données, notamment relationnelles et objets, aux objets géographiques localisés. Il y a d'abord le concept d'objet, qui est l'entité de base gérée par le système : une zone dans une carte, un individu dans un recensement, un tronçon de réseau, etc. Chaque objet est décrit par un certain nombre d'attributs, comme un nom, des coordonnées, des valeurs numériques. Le système gère des objets et les valeurs des attributs qui les décrivent. On regroupe les objets qui sont décrits par les mêmes attributs dans des collections, que l'on appelle relations ou tables : le schéma d'une relation, c'est l'ensemble des attributs servant à décrire les objets de la relation, ainsi qu’un ensemble de méthodes pouvant être appliquées à ces objets. L'ensemble des schémas des relations donne le schéma de la base de données, qui est constituée quant à elle des objets de toutes les relations. Le système stocke et gère les objets en s'appuyant sur cette structure de relation - collections d'objets du même type - et traite les objets grâce à leur description par attributs - variables dont les valeurs décrivent l'objet : le système SavGIS est construit sur le principe des systèmes de gestion de données relationnels.

Lorsqu'un objet est géographique, il est souvent localisé, c'est-à-dire que l'on tient compte de sa position dans l'espace en deux ou trois dimensions, et cette position sert aussi à décrire l'objet. On parlera d'attribut de localisation comme on a parlé d'attribut de description. Le schéma d'une relation dont les objets sont localisés - on dira une relation localisée - comporte donc toujours un attribut de localisation : c'est la gestion de cet attribut qui fait la différence entre un SIG (système d'information géographique) et un simple SGBD (système de gestion de base de données). Le système SavGIS étend la gestion relationnelle à l’attribut de localisation : il utilise la localisation pour mettre les objets d’une collection en relation avec les objets d’une autre collection.

La localisation d'objets géographiques peut être zonale (l'objet est une zone; une collection de zones donne une relation zonale, ou de type zone), linéaire (l'objet est une portion de ligne, et la relation correspondante est dite linéaire), ponctuelle (la localisation est donnée par un point, la relation est dite ponctuelle), ou encore donnée sous forme d'image numérique géo-référencée (les objets sont alors les pixels qui forment l'image). La localisation peut être donnée sous forme vectorielle (des contours, des arcs) ou sous forme matricielle (des pixels) : de toutes les façons, le système SavGIS crée à partir des vecteurs une représentation matricielle lorsqu'il en a besoin, lors de l'exploitation des données. Il peut également créer des vecteurs à partir de pixels d’une image. Ces différents types de localisation correspondent à des types de base pour les objets : zone, ligne, point, pixel. A chaque type correspondent des méthodes particulières (par exemple, la surface pour les zones), méthodes accessibles directement dans les menus de SavGIS. Ce modèle de données reprend donc la schématisation cartographique de la réalité géographique.

La saisie et le stockage de la localisation des objets géographiques impliquent des procédures tout à fait spécifiques à ces objets, et l'administration d'une base de données géographiques nécessite aussi quelques connaissances en cartographie (les projections, le redressement, les échelles, la précision géographique, la généralisation, etc.).

La structuration des données dans SavGIS correspond au modèle relationnel des systèmes de gestion de base de données étendu aux données géographiques localisées. Il s'oriente également vers le modèle objet par l'introduction de classes d'objets et de méthodes sur ces classes. L'architecture générale est celle d'un calculateur base de données simplifié : il possède un dictionnaire des données, indiquant les relations, attributs, méthodes, ainsi que leurs caractéristiques (types, définition du schéma interne associé), un dictionnaire des accès permettant de gérer les niveaux externes (par l'allocation de droits et la définition de l'accès aux données), un langage de commande permettant d'interroger et de manipuler les données suivant une structure client/serveur. Chaque opération utilise ces trois structures pour accéder au niveau interne et au système de gestion de fichier.

Le système SavGIS crée et administre ses propres bases de données, intégrant dans un même ensemble l'information descriptive et l'information de localisation, contrairement à la plupart des SIG qui utilisent un SGBD classique pour les données descriptives et créent le lien entre descriptif et graphique au moment de l'exploitation des données. L'information de localisation est conservée dans sa forme originale, vectorielle ou pixel selon la modélisation d'origine. Le système se charge de l'ensemble des opérations de changement de type (vecteur-raster ou raster-vecteur notamment) en fonction des besoins de l'utilisateur : il privilégie toujours l'aspect fonctionnel à l'aspect technique. Tous les points sont décrits par leurs coordonnées géographiques dans un datum unique. La projection géographique de restitution peut être choisie par l'utilisateur lors de l'interrogation des données.

Les relations localisées sont indexées sur la localisation par la notion naturelle de feuille, chaque feuille correspondant à une coupure de carte. Toute recherche dans une relation localisée passe par la recherche des feuilles concernées par le territoire d'étude. Chaque relation localisée possède son propre ensemble de feuilles, puisque cette indexation dépend essentiellement de la densité des objets propre à une relation donnée. Cette indexation s’apparente donc à un découpage en grille adaptative.

L’exploitation des bases de données est multi-utilisateur. L’interrogation se fait sous forme de requêtes, dans une démarche exploratoire. Le système gère les requêtes de chaque utilisateur en créant des états temporaires, propres à l’utilisateur, sans modifier la base de données.
L’extension du modèle relationnel sur la localisation permet de joindre les objets de la base sur la localisation, lors d’une requête, à partir d’une gestion en relation. Mais la gestion seule est insuffisante pour répondre aux besoins d’analyse qui sont omniprésents lors de l’exploitation de données géographiques. Le système comprend donc de nombreuses fonctionnalités d’analyse. De plus, les différences de précision dans la localisation, dues aux différences d’échelle de description des objets, réduisent le caractère universel de la localisation en tant qu’attribut de jointure. Nous avons donc développé dans le système SavGIS de nombreuses procédures pour répondre aux besoins de jointures spatiales lorsque la simple mise en relation sur la localisation ne peut être utilisée. L’extension du modèle relationnel se fait donc à plusieurs niveaux : d’une part par l’extension des opérations classiques de l’algèbre relationnelle à l’attribut de localisation, et d’autre part par l’introduction de fonctionnalités permettant de résoudre les problèmes de transfert d’échelle.


Administrer une base SavGIS

Le schéma d'une base comprend la définition des relations, des attributs, et des méthodes. Contrairement aux SGBD classiques, chaque relation a ici un type, qui définit le type des objets contenus dans la relation, et permet d’associer des méthodes de base uniquement liées au type d’implantation géographique (comme le périmètre ou la surface pour les zones, ou la longueur pour les lignes, etc.). La structuration et la gestion interne sont également propres à chaque type d’objet. Les types supportés par SavGIS correspondent aux objets habituellement rencontrés en géographie : zone, ligne, point, pixel, non localisé. Tous les objets d'une même relation sont donc du même type. La localisation des objets géographiques est conservée dans le repère d'un datum commun, en coordonnées sphériques et hauteur au-dessus du géoïde. Le schéma d'une base est conservé dans un dictionnaire de données ; tous les modules du système accèdent à ce dictionnaire pour lire le schéma et utiliser une base de données. Les bases de données sont créées et administrées par le module d’administration, qui est séparé des modules d’exploitation. Ce module gère également les vues externes, qui permettent aux modules d'exploitation d'avoir une vision différente de la base, par le choix ou le regroupement logique de relations, d'attributs et de méthodes. Il gère également les méta-données, pour les relations, attributs et méthodes.

L'administration d'une base de données est un travail en soi dès que la base atteint des dimensions importantes. Pour gérer une base de données géographiques avec le système SavGIS, et comme pour toute base de données, il faut réfléchir à la structuration des données, à leur organisation, à leur gestion, à la manipulation des données, ainsi qu'à la formation des utilisateurs : c'est l'administrateur de la base de données qui en aura la charge, poste fondamental pour le bon fonctionnement du système. En revanche, un utilisateur du système d'information n'a pas à se préoccuper de l'administration de la base de données, ni de celle de la machine sur laquelle il travaille. Il se consacrera uniquement à l'exploitation des données, en supposant la base fiable, mise à jour, prête à l'emploi.


D'une manière générale, l'administration d'une base SavGIS, de sa création à son exploitation, peut se résumer en plusieurs grandes étapes : décrire, saisir, intégrer, modifier :

Décrire ...

Pour créer une base de données il faut, avant tout, décrire cette base, décrire les données, indiquer comment se regroupent les objets, quels sont les attributs, leurs types, etc. C'est la première étape, celle de la réflexion, de la structuration, de la schématisation, de la description, pour créer ce que l'on appelle le schéma de la base de données.
Une fois créé le schéma de la base, l'administrateur pourra définir des utilisateurs et leur allouera des droits d'utilisation.

Saisir ...

Une fois défini le schéma d'une collection d'objet, nous savons quels sont les attributs qui décrivent chaque objet. Il faut donc saisir, pour chaque objet, la valeur de ces attributs. Si les objets sont localisés, et que l'on a décidé dans le schéma de prendre en compte cette localisation, il faut également saisir la partie graphique des objets, en fonction du type de la relation.
Cette étape, dans le cas de grandes bases de données, est contraignante, longue et lourde, et il convient de la gérer avec le plus grand soin car elle est bien sur très importante.

Intégrer ...

La saisie des données se fait, disons, par morceaux. Les données peuvent être hétérogènes : différences de formats, de codages... S'il s'agit de géographie et de localisation, les problèmes sont plus nombreux. Entre la saisie et la base de données, il y a donc une phase d'intégration des morceaux dans l'ensemble homogène que constitue une base de données SavGIS. Intégrer, c'est donc lire des données (graphiques ou descriptives) dans des fichiers pour les réécrire dans un ensemble - la base de données proprement dite - qui se constitue peu à peu. Il est important de noter que cette phase d'intégration lit des données pour créer ou modifier une base de données qui sera indépendante de ces fichiers (qui ne serviront plus dans SavGIS après l'intégration). Les fichiers contiennent soit des données descriptives (des valeurs qualitatives, des valeurs quantitatives, des dates, etc.), soit des données graphiques provenant de la saisie graphique ou d'images.

Modifier...

Une fois la base constituée, il faut pouvoir la modifier pour corriger d'éventuelles erreurs ou intégrer les évolutions et modifications dans l’information. Ces modifications se font grâce à des éditeurs propres à SavGIS, pour la partie graphique comme pour les données descriptives. Ces différentes opérations ne s'effectuent pas une fois pour toute. Il est courant de créer une base petit à petit, de modifier le schéma pour rajouter des relations, des attributs, etc. Il est important, pour l'administrateur de la base, de bien connaître toutes les phases indiquées plus haut, dans l'ordre comme chaque opération séparée.


Presentation | Modules | Download | Manuals | Doc | Tutorial | Examples | Marc Souris | home