Presentation | Modules | Download | Manuals | Doc | Tutorial | Examples | Marc Souris | home
SavGIS Software
Geographic Information System by IRD
Présentation générale
Description
des principes
Description
des différents modules
Le système d'information géographique SavGIS
SavGIS est un système d'information géographique complet, conçu
pour saisir, rassembler, gérer, analyser et cartographier des données
géographiques d'origine très diverses : données d'enquêtes,
de cartes thématiques, topographiques, de réseaux, d'images
satellitales, de photographies aériennes, de modèles numériques
de terrain... Le noyau de SavGIS est un système de gestion de base
de données relationnelle étendu à la localisation, autour
duquel sont développées de nombreuses fonctions pour l'analyse
spatiale, la cartographie, la statistique, la télédétection,
l'hydrologie, etc.
Le système SavGIS est un instrument complet pour l'analyse et la recherche
en géographie, la planification urbaine, l'aménagement du territoire,
l'étude et la gestion de l'environnement, l'épidémiologie
spatiale et la géographie de la santé...
De faible coût pour une large diffusion, c'est un système ouvert
dont les sources peuvent être disponibles pour ceux qui souhaiteraient
participer au développement de nouvelles méthodes ou fonctionnalités
en géomatique.

De la constitution d'une
base de données géographique au produit cartographique
SavGIS est un logiciel complet qui permet de saisir des données géographiques,
de constituer et de gérer des bases de données relationnelles
localisées, d'analyser et de traiter l'information géographique,
et enfin de cartographier et d'éditer les résultats des requêtes.
Système de gestion de bases de données relationnelles, système
d'analyse et d'aide à la recherche en géographie, système
de cartographie et de dessin automatique, SavGIS va de la constitution d'une
base de données à l'édition cartographique : il offre
la possibilité de gérer l'ensemble de la chaîne de traitement,
depuis la conception de l'information jusqu'au produit cartographique final.
La gestion relationnelle
et la localisation
Dans SavGIS, il n'y a pas de séparation entre la localisation et la
description des objets : l'intégration complète graphique-descriptif
au niveau du système de gestion permet une manipulation facile et intégrée
d'objets de structures internes complexes et diverses. C'est le système
de gestion de la base de données qui se charge d'administrer la complexité
des structure et des relations entre le graphique et le descriptif. De même,
il n'existe pas de différence externe entre raster et vecteur : la
double structure interne permet de manipuler l'une comme l'autre. Certaines
données sont conservées en structure vecteur (contours de zones,
lignes et réseaux, points), d'autres en raster (images numériques,
modèles numériques), chacune dans sa précision d'origine.
Le système gère automatiquement la création d'une struture
à partir d'une autre. L'ensemble de l'information est gérée
par une base de données unique, assurant ainsi simplicité d'utilisation,
intégration de l'imagerie, et surtout rigueur dans la gestion de la
base. Ces caractéristiques font de SavGIS un système puissant
mais d'utilisation facile.
Un système multi-utilisateurs
Les bases de données sont partagées entre plusieurs utilisateurs,
suivant le principe du client/serveur. Seul l'administrateur du système
peut modifier la base de données, mais tous les utilisateurs disposent
d'un espace de travail leur permettant de mener des requêtes de stocker
cartes, fichiers temporaires, masques, etc.
La
requête, séquence interactive d'opérations
Toute requête est gérée par le moteur de base de données
relationnel intégré au système. Pour répondre
à une question avec SavGIS, il faut construire une requête, c'est-à-dire
une séquence d'opérations simples, le résultat d'une
opération pouvant servir d'entrée à l'opération
suivante. Une fois définie, cette séquence peut être conservée
sous forme de macro-commande ou être intégrée à
la base de données comme méthode.
Cette succession d'opérations - le résultat de l'une servant
d'entrée à la suivante - rendent quasi infinies les possibilités
d'exploitation. L'interactivité graphique est permanente : à
tout moment, l'utilisateur peut visualiser le résultat d'une opération
avant de passer à la suivante.

L'intégration
de l'imagerie numérique dans le schéma relationnel
L'image satellitale ou aérienne est une source d'information et d'actualisation
primordiale. Les données de type image (comme les images satellite,
les photographiées aériennes) sont intégrées dans
la base de données relationnelle comme les autres types de données
(zones, lignes, points, non localisées). Un module du système
(Savamer) permet de géoréférencer, mosaïquer et
intégrer les images dans une base de données, et des outils
spécifiques de traitement d'image permettent de modifier et d'analyser
les images géoréférencées au sein de SavGIS.
Un
système compatible
Une base de données géographique devient
rapidement l'investissement majeur d'un projet en géomatique, au-delà
du logiciel informatique utilisé pour la gérer ou l'exploiter.
SavGIS assure la compatibilité totale des bases de données géographiques
avec les standards du marché, grâce à ses nombreuses possibilités
d'exportation. L'utilisateur peut donc choisir d'utiliser d'autres systèmes
et bénéficier ainsi des avantages de chaque logiciel.
Un
système à vocation scientifique
Produit de la recherche scientifique, SavGIS répond aux nécessités
de multiples applications tant scientifiques que pratiques. Expression de
la recherche méthodologique sur les systèmes d'information géographique,
il est ouvert en permanence au développement de nouvelles méthodes
et fonctionnalités.
Un
instrument de gestion, d'analyse et de représentation de l'espace géographique
Fenêtre
d'étude et projections géographiques
SavGIS conserve la localisation des objets en coordonnées géographiques
(longitude, latitude). Il est possible de choisir une projection (UTM, Lambert,
Mercator...) pour traiter les données et représenter les résultats
cartographiques. La fenêtre d'étude est l'espace sur lequel porte
les requêtes, c'est le territoire sur lequel porte la séquence
d'opérations. Elle peut être définie de plusieurs façons,
en coordonnées, directement sur l'écran, en fonction des objets
d'une collection de la base, etc.
Gestion
et interrogation de données
Les données sont structurées et groupées selon le principe
relationnel, en différentes tables. Le système de gestion de
base de données, noyau de SavGIS, gère tous les objets et permet
de les mettre en relation les uns avec les autres quelque soit leur table
d'origine ou leur type d'implantation spatiale. Il contient toutes les opérations
classiques des SGBD relationnels (restriction, projection, union, jointure,
etc.), et les étend à la localisation (restriction geographique,
union geographique, semi-jointures géographiques, etc.).
On peut également interroger directement les données sur l'écran
: un clic de souris sur un objet permet d'obtenir la liste de ses valeurs
descriptives.
Calculs
sur les attributs descriptifs
Il est très facile de créer de nouveaux attributs par calcul
à partir des attributs existants dans la base. On peut ainsi effectuer
de scalcul numériques, des calculs logiques, statistiques, des agrégations,
combinaisons, regroupements, des calculs de distances, de superficie, de proximité,
etc.
De même, de nombreux traitements permettent de créer de nouveaux
attributs par classification : par intervalle, par quantiles, par regroupement,
en utilisant une distance, etc.
Cartographie
automatique interactive
SavGIS offre de nombreuses possibilités pour représenter cartographiquement
les éléments de la base en fonction de la valeur d'un ou plusieurs
attributs : simboles, lignes, trames, couleurs. Les choix sont interactifs
et le résultat est visualisé ou modifié directement sur
l'écran. Il est également possible d'habiller la carte en dessinant
directement sur l'écran des objets, des symboles, en écrivant
du texte, etc.
Exportation
et impression
SavGIS permet l'exportation des données de la
base dans des formats standards. Les données graphiques comme descriptives
de la base de données, vecteurs comme raster, peuvent être exportées
vers d'autres SIG. La possibilité d'exporter des cartes complètes
est également importante pour l'édition : importés dans
les programmes de dessin spécialisés, les cartes peuvent être
retouchées et préparées pour une impression directe en
quadrichromie.
Statistique
descriptive et géostatistique
Tous les attributs descriptifs peuvent être analysés
grâce à des méthodes statistiques traditionnelles (moyenne,
variance, écart-type), des moments par groupes, des histogrammes, des
nuages de points, des histogrammes bi-dimentionnels, des corrélations,
des régressions, etc. Il est possible de réaliser ces études
statistiques sur un espace particulier défini à l'avance.
La géostatistique est également présente dans SavGIS
grâce au calcul de variogrammes, aux ndices de proximité ou de regroupement, et aux procédures d'interpolation.
Pour des traitements plus complexes non disponibles dans le logiciel, SavGIS
permet toujours d'exporter les données vers un logiciel statistique
spécialisé et d'en importer les résultats si nécessaire.

Union
et agrégation géographiques
La structure relationnel étendue à la localisation
offre la possibilité de mettre en relation les objets géographiques
sur leur localisation : on peut croiser, agréger des points dans des
zones, sélectionner, etc. Il est ainsi possible de passer d'une division
géographique à une autre, de changer d'échelle, de créer
de nouveaux découpages...
SavGIS permet également de créer de nouvelles division régulières
par carroyage, en mailles carrées, triangulaires, ou hexagonales. Associées
aux opérations d'agrégation graphique et de classifications
par proximité, le choix de la taille de la maille permet de réaliser
de nombreux traitements d'union géographique.
Enfin, SavGIS dispose d'un type d'objet particulier, qui correspond à
une représentation interne maillée de l'espace, à très
grande définition. Tous les objets de la base de données peuvent
être ramenés à ce type, qui permet donc une comparaison
des valeurs d'attributs de tous les objets partageant le même point
géographique de cette représentation maillée.
Masques
et distances
Un masque représente un domaine de l'espace, défini à
partir de certains objets de la base et d'une distance à es objets.
L'espace ainsi défini peut être utilisé pour sélectionner
d'autres objets dans d'autres relations, par une opération de semi-jointure
géométrique. SavGIS permet de combiner différents masques
et d'effectuer des opérations ensemblistes entre eux : les combinaisons
possibles sont infinies et permettent de répondre à tout type
de requête basée sur un critère spatial de distance. Dans
la plupart des cas, les masques servent à restreindre le champ d'éxécution
d'une commande à un espace particulier.
Les masques peuvent également être définis directement
sur l'écran avec la souris.
Réseaux
et recherche opérationnelle
Dans SavGIS, les réseaux sont considérés avec l'ensemble
de leurs caractéristiques, tant descriptives que graphiques : attributs
descriptifs par tronçons, noeuds, sens... Le système offre à
la fois des fonctions de gestion comme de calcul spacifiques (flux, connexité,
chemins le plus court et recherche opérationnelle).
Proximité
et interpolation
Les fonctions d'interpolation basées sur la distance et la proximité
permettent de créer des modèles numériques à partir
de données de la base : une donnée connue seulement en certains
points de l'espace sera interpolée et etendue à tout l'espace
désiré. Les modèles numériques les plus utilisés
sont élaborés à partir de données topographiques
: il s'agit des modèles numériques de terrain, utilisés
pour simuler le relief en chaque point à partir de courbes de niveaux
et de points cotés. A partir des modèles numériques de
terrain, le système permet de calculer divers attributs géomorphologiques
et hydrologiques : pente, orientation, bassins versants, etc.
Changement
de type d'objet
L'interpolation en est un exemple : le changement de type d'objet permet de
passer d'une représentation géométrique à une
autre, pour l'ensemble des objets d'une relation. Ainsi, le système
SavGIS permet de vectoriser une image pour passer d'un mode pixel à
un mode ligne ou zone ; il permet inversement de rasteriser des zones pour
produire une représentation maillée ; il permet de créer
des lignes à partir de points, pour traiter des couples de points ;
il permet de créer des poinst à partir de lignes, pour traiter
les noeuds d'un réseau, etc.
Télédétection
et imagerie numérique
Une fois mise en conformité géographique selon une projection
géographique, les images numériques (télédétection
spatiale comme phototgraphie aérienne) son intégrées
et manipulées directement avec SavGIS, qui possède un type d'implantation
géographique - le pixel - spécifique à ce type d'objets
géographiques. L'utilisateur peut ainsi utiliser cette information
de façon simple, soit avec les commandes communes à tous les
types de relation, soit avec les commandes dédiées aux relations
de type pixel. Ainsi, SavGIS permet à la fois de s'initier à
la télédétection (calculs d'indice, filtres, textures,
classifiactions...) et de mettre en relation de façon complète
les images numériques avec les objets vectoriels de la base de données
(comparaisons, calculs statistiques, actualisations, etc.).

Calculs
métriques interactifs
On peut effectuer directement des calculs métriques sur l'écran
avec l'aide de la souris : il est possible de connaître les coordonnées
exactes d'un point, de calculer la distance d'un point à un autre,
de déterminer la surface d'une zone.
GPS et
suivi en temps réel
Un module spécifique de suivi en temps réel permet d'intégrer
en temps réel dans la base de données des positions et des données
en provenance d'un GPS embarqué, et relayées par radio ou téléphonie
mobile. Ces données peuvent également être analysées
en temps réel : vitesse instantanée, vitesse moyenne, durée
du trajet, nombre de passagers, etc.
Description
des principes du système SavGIS
Cette présentation du système SavGIS a pour
objectif de décrire rapidement les principes généraux
de sa conception et de situer ce logiciel dans l’ensemble des systèmes
d’information géographique. Il présente les concepts généraux
du système et ses spécifications fonctionnelles.
Principes
généraux
Le système SavGIS est d’abord un système de gestion de
base de données relationnelle étendu aux données localisées,
avec des fonctionnalités de type objet. Son objet est de grouper, gérer,
traiter, cartographier des données géographiques de diverses
origines et différents types, comme des données d'enquêtes,
des cartes thématiques, des données topographiques, des réseaux,
des images satellites, des photographies aériennes, des modèles
numériques de terrain, etc. Le système SavGIS possède
les principales fonctionnalités des SIG : multiples sont les possibilités
de croisement, de mise en relation, de regroupement, d'agrégation de
données géographiques d'origines diverses. Il n'y a pas dans
SavGIS de séparation entre la localisation et la description, entre
le dessin et l'information : chaque objet est conservé avec tous ses
attributs, qu'ils soient graphiques ou descriptifs : c'est le système
qui gère l'ensemble. Le système SavGIS possède son propre
système de gestion de base de données, de type relationnel étendu
aux données localisées dans l'espace.
À la fois système de gestion de bases de données relationnelles,
système d'analyse et d'aide à la recherche en géographie,
système de cartographie et de dessin automatique, SavGIS va de la constitution
d'une base de données à l'édition : il offre ainsi la
maîtrise de toute la chaîne cartographique de la conception de
l'information au produit cartographique. Bien sûr, la constitution et
l'exploitation d'une importante base de données localisées n'est
pas chose simple et fait appel à de nombreux concepts, de la structuration
et gestion de base de données à l'élaboration cartographique,
en passant par la statistique, la géodésie, le traitement d'image.
Le système comprend cinq modules principaux (saisie graphique, géo-référencement
d'images, administration des bases de données, exploitation des bases
de données et cartographie, présentation d’atlas). Les
bases de données géographiques sont gérées par
un moteur de gestion de données bi-dimensionnel, avec indexation primaire
basée sur la localisation.
Les concepts généraux
de SavGIS
De nombreux choix peuvent être effectués pour construire un logiciel
de type SIG, aussi bien pour l’architecture générale du
système, pour les structures de données, pour les algorithmes
de résolution, les méthodes d’indexation, de gestion,
etc. Nous allons ici expliciter globalement ces choix.
A l’origine de la construction du SIG, il y a deux objectifs majeurs
: gérer des objets géographiques, en assurant la pérennisation
et le partage de l’information, et avoir la possibilité de mettre
ces objets en relation les uns avec les autres en utilisant leur localisation.
Mettre en relation, comme pouvait le faire simplement le géographe
lorsqu’il superposait deux cartes thématiques, pour vérifier
ou mettre en évidence des corrélations spatiales. L’idée
initiale est donc simple : gérer des objets tels qu’ils apparaissent
sur des cartes, par thèmes indépendamment les uns des autres,
et utiliser cette localisation, considérée comme universelle
entre tous les objets localisés, pour les relier les uns aux autres.
Bien sûr, il faudra faire attention à conserver cette universalité
lors de la mesure de la localisation. Pour éviter tout problème
lié au référentiel, nous avons choisi dans notre système
de conserver les coordonnées indépendamment de la projection
cartographique, et d’imposer un même datum pour l’ensemble
des objets d’une base de données. C’est la solution la
plus simple au niveau du système de gestion, mais elle requiert d’avoir
les capacités de transformer toute coordonnée pour la ramener
dans ce référentiel : il nous faudra donc développer
changements de projection et changements de datum.
Gérer des objets suivant des collections thématiques, et pouvoir
les mettre en relation grâce à un attribut, tout cela rappelle
la gestion relationnelle pour les bases de données classiques. Les
objets y sont gérés par collections d’objets de même
type, et ils sont mis en relation sur un attribut commun par une qualification
de jointure sur cet attribut. Le modèle relationnel permet d’assurer
au mieux cohérence et intégrité d’une base de données,
en laissant à des opérations de restriction ou de jointure le
soin de répondre à une requête. L’idée de
base de la construction du système que nous présentons, c’est
d’étendre le mode de gestion relationnel aux objets localisés,
avec la possibilité d’une jointure sur l’attribut donnant
la localisation des objets pour les mettre en relation, entre objets de collections
différentes. Dans une première étape, il faut analyser
le problème de la représentation des objets géographiques
dans une base de données, dans l’optique de les gérer
en collections d’éléments décrits par les mêmes
attributs. Car une carte représente effectivement un ensemble d’objet,
à l’inverse de la description d’un paysage ou d’un
quartier, qui, en général, ne représente qu’un
seul objet et n’a pas pour objectif une étude comparative avec
d’autres objets du même type. L’idée de la collection
est donc omniprésente dans notre approche : si l’on cherche à
regrouper les objets en collections décrits par les mêmes attributs,
c’est pour pouvoir bien les gérer, les comparer entre eux, les
comparer aux objets d’autres collections. La localisation dans l’espace
doit être un élément fondamental de cette comparaison.
Partir du modèle relationnel pour la gestion de base de données
permet d’utiliser un modèle qui donne satisfaction dans la gestion
d’objets décrits par des attributs simples (nominaux ou numériques
de dimension 1). Mais la prise en compte de l’attribut de localisation
s’avère plus complexe, car des questions inédites se posent
pour des attributs de dimension supérieure à 1 : comment décrire
et représenter des sous-ensembles de dimension un ou deux ? Comment
conserver la structure métrique de l’espace ? Est-il possible
d’utiliser les systèmes existants, ou faut-il construire un nouveau
moteur de gestion de données ? Faut-il stocker des cartes, ou revenir
sur la schématisation et la modélisation qui a déjà
été effectuée par le géographe ou le cartographe
?
Dans la conception du système que nous proposons, le point de départ
de l’information reste la carte ou la mesure directe de terrain, comme
d’ailleurs dans la grande majorité des SIG. Mais la carte n’intervient
que comme support d’un ensemble d’objets correspondant à
une même entité du monde réel, non plus cartographique
mais géographique, dépouillée de toute représentation
sémiologique. La modélisation ne retient que la schématisation
géométrique utilisée pour rendre compte des phénomènes
dans l’espace, avec, pour forte contrainte, l’unicité d’un
phénomène dans l’espace et le temps : dans une collection,
on ne peut avoir deux objets au même endroit et au même moment
(si l’on prend en compte le temps). Le respect de cette contrainte est
fondamental pour assurer la validité conceptuelle de la modélisation
de la réalité. A partir de ce choix (une représentation
géométrique des objets basée sur une description cartographique),
plusieurs possibilités existent pour conserver la description de cette
représentation géométrique dans un système informatique.
Il est nécessaire de définir des types différents suivant
le type de localisation, ponctuelle ou ensembliste, de dimension 1 ou de dimension
2. Déjà, on pressent qu’un système de gestion de
base de données classique ne peut convenir pour stocker efficacement
cette description, pour peu que l’on veuille l’utiliser dans sa
structure d’espace métrique. Rien n’empêche d’utiliser
des tables classiques pour stocker des points (x,y), mais un système
classique sera incapable de reconstituer un contour, d’effectuer des
tests d’appartenance, ou une interrogation sur la distance entre les
objets : l’incapacité des SGBD classiques à gérer
l’attribut de localisation dans sa structure est évidente. On
peut alors séparer graphique et descriptif, utilisant un système
particulier pour gérer l’attribut de localisation, et un système
classique pour gérer l’ensemble des attributs descriptifs, en
établissant un lien entre les deux systèmes par une clé
de jointure pour reconstituer les objets. Cette solution ne nous satisfait
pas, pour deux raisons essentielles : il est alors impossible d’indexer
les objets sur leur localisation, alors que ce critère est de loin
le plus discriminant, et la gestion séparée de deux ensembles
d’attributs, correspondant à un même objet, est source
d’incohérence dans les bases de données et de perte de
performance dès que le nombre d’objet devient grand. Lorsque
les objets sont localisés, l’attribut de localisation devient
en effet le plus efficace en terme d’indexation : nous souhaitons mettre
en œuvre une indexation de type séquentiel indexé basée
sur la localisation, ce qui impose aux valeurs descriptives d’être
stockées dans l’ordre des objets si l’on veut bénéficier
des performances de l’indexation sans avoir à maintenir des index
denses. Ceci ne peut se faire que dans un système gérant à
la fois le descriptif et le graphique.
L’autre objectif principal du système SavGIS, c’est de
pérenniser l’information, de façon centralisée,
et d’en permettre la consultation et l’exploitation décentralisée,
avec une démarche exploratoire. En effet, si l’interrogation
d’un SGBD classique utilise habituellement un langage de requête
permettant d’exprimer en une « phrase » la demande faite
à la base de données, le processus d’interrogation de
données géographiques et la démarche du géographe
relève bien souvent d’une approche exploratoire, sans la définition
formelle du cheminement des opérations permettant de répondre
à une question qui peut elle-même varier en fonction du cheminement.
Il est essentiel de conserver cet aspect interactif dans le processus de requête,
ce qui implique concrètement la création temporaire lors de
l’interrogation de nouveaux attributs ou relations. Le système
doit donc maintenir des états temporaires, par utilisateur : il ne
pouvait être question de permettre la modification de la base de données
par un utilisateur sous peine de remettre en question l’objectif fondamental
de pérennisation et de centralisation de l’information.
Pour toutes ces raisons, nous avons choisi de construire un système
possédant son propre moteur BD, permettant l’indexation primaire
sur la localisation, permettant le stockage et la gestion de la géométrie
représentant la localisation des objets, regroupés en relations,
en fonction d’une modélisation de l’espace respectant le
principe d’unicité de clé pour la localisation. Cette
modélisation doit prendre en compte les différents types d’implantation
spatiale : zone, ligne, points, pixels. Nous avons également choisi
de séparer l’administration de l’exploitation : le module
d’interrogation doit permettre l’approche exploratoire et la gestion
d’états temporaires lors d’une requête, mais il ne
peut pas modifier la base de données, droit réservé au
module d’administration. Nous avons également choisi de séparer
l’exploitation de la saisie graphique et de la vérification des
contraintes d’intégrité. Pour le choix des structures
internes de représentation de la localisation, nous privilégions
systématiquement la simplicité des structures sur la simplicité
des algorithmes de traitement : ainsi, nous choisirons de conserver des arcs
frontières, quitte à avoir à reconstituer le contour
des zones, plutôt que de conserver un contour fermé imposant
un sens dans le stockage des arcs. Des structures plus simples pour la représentation
de la localisation permettent de réduire les contraintes d’intégrité
sur cet attribut.
A partir de la modélisation en collections thématiques, l’extension
du modèle relationnel aux données localisées devient
naturelle. Les opérations de l’algèbre relationnelle (restriction,
projection, jointure) sont étendues à la localisation en utilisant
des critères de distance ou d’appartenance, à la place
d’une relation d’ordre ou d’égalité. Malheureusement,
on s’aperçoit rapidement que cet attribut de localisation, que
nous avions qualifié d’universel, ne l’est pas vraiment.
Il varie considérablement, aussi bien dans sa conception, dans la manière
de le représenter, que dans la précision de sa mesure. La jointure
spatiale, extension de la jointure classique et opération formelle
correspondant à la mise en relation par superposition, ne tient pas
compte de la validité ou de l’échelle de description.
Dans de nombreux cas, elle s’avère donc inutilisable en l’état
: il va falloir gérer des transferts d’échelle pour mettre
effectivement en relation des objets de validité ou d’implantation
spatiale différente. La conception de notre système est-elle
encore valide, si son principal objectif, à savoir mettre les objets
localisés en relation grâce à leur localisation, ne peut
être atteint efficacement ? Gérer ensemble des collections d’objets
en conservant l’ambiguïté sur la validité de l’attribut
de localisation est-il possible ? Pour répondre positivement à
cette question, il est nécessaire d’introduire de nouvelles méthodes
de gestion et d’exploitation, au-delà d’une jointure dont
l’objectif initial –retrouver les valeurs d’un point de
l’espace à partir de collections distinctes– doit être
analysé en fonction de la modélisation du monde réel.
La première réponse, c’est l’introduction de procédures
permettant de gérer les transferts d’échelle, à
la fois par des procédures d’agrégation, par des procédures
de changement de type d’implantation spatiale, par des procédures
d’interpolation, par des procédures d’extrapolation. L’autre
réponse, complémentaire, consiste à documenter les bases
de données par l’introduction systématique de méta-données
permettant à l’utilisateur de revenir à la genèse
de l’information et d’éviter les écueils d’une
utilisation erronée. Elle consiste également à introduire
dans le schéma de la base de données des méthodes d’utilisation
de ces données, de manière à proposer à l’utilisateur
un ensemble de méthodes d’exploitation qui dépendent non
seulement du type des objets, mais également de leur contenu sémantique
et de leur précision géographique.
Enfin, l’ergonomie du logiciel est importante : elle doit permettre
à la fois l’approche exploratoire et la représentation
cartographique des résultats, à chaque étape de la requête.
Ces deux objectifs sous-tendent la conception de l’ergonomie du module
d’exploitation.
Architecture
générale de SavGIS
Le système SavGIS se caractérise donc par une stricte application
de la logique et des concepts des base de données, notamment relationnelles
et objets, aux objets géographiques localisés. Il y a d'abord
le concept d'objet, qui est l'entité de base gérée par
le système : une zone dans une carte, un individu dans un recensement,
un tronçon de réseau, etc. Chaque objet est décrit par
un certain nombre d'attributs, comme un nom, des coordonnées, des valeurs
numériques. Le système gère des objets et les valeurs
des attributs qui les décrivent. On regroupe les objets qui sont décrits
par les mêmes attributs dans des collections, que l'on appelle relations
ou tables : le schéma d'une relation, c'est l'ensemble des attributs
servant à décrire les objets de la relation, ainsi qu’un
ensemble de méthodes pouvant être appliquées à
ces objets. L'ensemble des schémas des relations donne le schéma
de la base de données, qui est constituée quant à elle
des objets de toutes les relations. Le système stocke et gère
les objets en s'appuyant sur cette structure de relation - collections d'objets
du même type - et traite les objets grâce à leur description
par attributs - variables dont les valeurs décrivent l'objet : le système
SavGIS est construit sur le principe des systèmes de gestion de données
relationnels.
Lorsqu'un objet est géographique, il est souvent localisé, c'est-à-dire
que l'on tient compte de sa position dans l'espace en deux ou trois dimensions,
et cette position sert aussi à décrire l'objet. On parlera d'attribut
de localisation comme on a parlé d'attribut de description. Le schéma
d'une relation dont les objets sont localisés - on dira une relation
localisée - comporte donc toujours un attribut de localisation : c'est
la gestion de cet attribut qui fait la différence entre un SIG (système
d'information géographique) et un simple SGBD (système de gestion
de base de données). Le système SavGIS étend la gestion
relationnelle à l’attribut de localisation : il utilise la localisation
pour mettre les objets d’une collection en relation avec les objets
d’une autre collection.
La localisation d'objets géographiques peut être zonale (l'objet
est une zone; une collection de zones donne une relation zonale, ou de type
zone), linéaire (l'objet est une portion de ligne, et la relation correspondante
est dite linéaire), ponctuelle (la localisation est donnée par
un point, la relation est dite ponctuelle), ou encore donnée sous forme
d'image numérique géo-référencée (les objets
sont alors les pixels qui forment l'image). La localisation peut être
donnée sous forme vectorielle (des contours, des arcs) ou sous forme
matricielle (des pixels) : de toutes les façons, le système
SavGIS crée à partir des vecteurs une représentation
matricielle lorsqu'il en a besoin, lors de l'exploitation des données.
Il peut également créer des vecteurs à partir de pixels
d’une image. Ces différents types de localisation correspondent
à des types de base pour les objets : zone, ligne, point, pixel. A
chaque type correspondent des méthodes particulières (par exemple,
la surface pour les zones), méthodes accessibles directement dans les
menus de SavGIS. Ce modèle de données reprend donc la schématisation
cartographique de la réalité géographique.
La saisie et le stockage de la localisation des objets géographiques
impliquent des procédures tout à fait spécifiques à
ces objets, et l'administration d'une base de données géographiques
nécessite aussi quelques connaissances en cartographie (les projections,
le redressement, les échelles, la précision géographique,
la généralisation, etc.).
La structuration des données dans SavGIS correspond au modèle
relationnel des systèmes de gestion de base de données étendu
aux données géographiques localisées. Il s'oriente également
vers le modèle objet par l'introduction de classes d'objets et de méthodes
sur ces classes. L'architecture générale est celle d'un calculateur
base de données simplifié : il possède un dictionnaire
des données, indiquant les relations, attributs, méthodes, ainsi
que leurs caractéristiques (types, définition du schéma
interne associé), un dictionnaire des accès permettant de gérer
les niveaux externes (par l'allocation de droits et la définition de
l'accès aux données), un langage de commande permettant d'interroger
et de manipuler les données suivant une structure client/serveur. Chaque
opération utilise ces trois structures pour accéder au niveau
interne et au système de gestion de fichier.
Le système SavGIS crée et administre ses propres bases de données,
intégrant dans un même ensemble l'information descriptive et
l'information de localisation, contrairement à la plupart des SIG qui
utilisent un SGBD classique pour les données descriptives et créent
le lien entre descriptif et graphique au moment de l'exploitation des données.
L'information de localisation est conservée dans sa forme originale,
vectorielle ou pixel selon la modélisation d'origine. Le système
se charge de l'ensemble des opérations de changement de type (vecteur-raster
ou raster-vecteur notamment) en fonction des besoins de l'utilisateur : il
privilégie toujours l'aspect fonctionnel à l'aspect technique.
Tous les points sont décrits par leurs coordonnées géographiques
dans un datum unique. La projection géographique de restitution peut
être choisie par l'utilisateur lors de l'interrogation des données.
Les relations localisées sont indexées sur la localisation par
la notion naturelle de feuille, chaque feuille correspondant à une
coupure de carte. Toute recherche dans une relation localisée passe
par la recherche des feuilles concernées par le territoire d'étude.
Chaque relation localisée possède son propre ensemble de feuilles,
puisque cette indexation dépend essentiellement de la densité
des objets propre à une relation donnée. Cette indexation s’apparente
donc à un découpage en grille adaptative.
L’exploitation des bases de données est multi-utilisateur. L’interrogation
se fait sous forme de requêtes, dans une démarche exploratoire.
Le système gère les requêtes de chaque utilisateur en
créant des états temporaires, propres à l’utilisateur,
sans modifier la base de données.
L’extension du modèle relationnel sur la localisation permet
de joindre les objets de la base sur la localisation, lors d’une requête,
à partir d’une gestion en relation. Mais la gestion seule est
insuffisante pour répondre aux besoins d’analyse qui sont omniprésents
lors de l’exploitation de données géographiques. Le système
comprend donc de nombreuses fonctionnalités d’analyse. De plus,
les différences de précision dans la localisation, dues aux
différences d’échelle de description des objets, réduisent
le caractère universel de la localisation en tant qu’attribut
de jointure. Nous avons donc développé dans le système
SavGIS de nombreuses procédures pour répondre aux besoins de
jointures spatiales lorsque la simple mise en relation sur la localisation
ne peut être utilisée. L’extension du modèle relationnel
se fait donc à plusieurs niveaux : d’une part par l’extension
des opérations classiques de l’algèbre relationnelle à
l’attribut de localisation, et d’autre part par l’introduction
de fonctionnalités permettant de résoudre les problèmes
de transfert d’échelle.
Administrer une base
SavGIS
Le schéma d'une base comprend la définition des relations, des
attributs, et des méthodes. Contrairement aux SGBD classiques, chaque
relation a ici un type, qui définit le type des objets contenus dans
la relation, et permet d’associer des méthodes de base uniquement
liées au type d’implantation géographique (comme le périmètre
ou la surface pour les zones, ou la longueur pour les lignes, etc.). La structuration
et la gestion interne sont également propres à chaque type d’objet.
Les types supportés par SavGIS correspondent aux objets habituellement
rencontrés en géographie : zone, ligne, point, pixel, non localisé.
Tous les objets d'une même relation sont donc du même type. La
localisation des objets géographiques est conservée dans le
repère d'un datum commun, en coordonnées sphériques et
hauteur au-dessus du géoïde. Le schéma d'une base est conservé
dans un dictionnaire de données ; tous les modules du système
accèdent à ce dictionnaire pour lire le schéma et utiliser
une base de données. Les bases de données sont créées
et administrées par le module d’administration, qui est séparé
des modules d’exploitation. Ce module gère également les
vues externes, qui permettent aux modules d'exploitation d'avoir une vision
différente de la base, par le choix ou le regroupement logique de relations,
d'attributs et de méthodes. Il gère également les méta-données,
pour les relations, attributs et méthodes.
L'administration d'une base de données est un travail en soi dès
que la base atteint des dimensions importantes. Pour gérer une base
de données géographiques avec le système SavGIS, et comme
pour toute base de données, il faut réfléchir à
la structuration des données, à leur organisation, à
leur gestion, à la manipulation des données, ainsi qu'à
la formation des utilisateurs : c'est l'administrateur de la base de données
qui en aura la charge, poste fondamental pour le bon fonctionnement du système.
En revanche, un utilisateur du système d'information n'a pas à
se préoccuper de l'administration de la base de données, ni
de celle de la machine sur laquelle il travaille. Il se consacrera uniquement
à l'exploitation des données, en supposant la base fiable, mise
à jour, prête à l'emploi.
D'une manière générale, l'administration d'une base SavGIS,
de sa création à son exploitation, peut se résumer en
plusieurs grandes étapes : décrire, saisir, intégrer,
modifier :
Décrire ...
Pour créer une base de données il faut, avant tout, décrire
cette base, décrire les données, indiquer comment se regroupent
les objets, quels sont les attributs, leurs types, etc. C'est la première
étape, celle de la réflexion, de la structuration, de la schématisation,
de la description, pour créer ce que l'on appelle le schéma
de la base de données.
Une fois créé le schéma de la base, l'administrateur
pourra définir des utilisateurs et leur allouera des droits d'utilisation.
Saisir ...
Une fois défini le schéma d'une collection d'objet, nous savons
quels sont les attributs qui décrivent chaque objet. Il faut donc saisir,
pour chaque objet, la valeur de ces attributs. Si les objets sont localisés,
et que l'on a décidé dans le schéma de prendre en compte
cette localisation, il faut également saisir la partie graphique des
objets, en fonction du type de la relation.
Cette étape, dans le cas de grandes bases de données, est contraignante,
longue et lourde, et il convient de la gérer avec le plus grand soin
car elle est bien sur très importante.
Intégrer ...
La saisie des données se fait, disons, par morceaux. Les données
peuvent être hétérogènes : différences de
formats, de codages... S'il s'agit de géographie et de localisation,
les problèmes sont plus nombreux. Entre la saisie et la base de données,
il y a donc une phase d'intégration des morceaux dans l'ensemble homogène
que constitue une base de données SavGIS. Intégrer, c'est donc
lire des données (graphiques ou descriptives) dans des fichiers pour
les réécrire dans un ensemble - la base de données proprement
dite - qui se constitue peu à peu. Il est important de noter que cette
phase d'intégration lit des données pour créer ou modifier
une base de données qui sera indépendante de ces fichiers (qui
ne serviront plus dans SavGIS après l'intégration). Les fichiers
contiennent soit des données descriptives (des valeurs qualitatives,
des valeurs quantitatives, des dates, etc.), soit des données graphiques
provenant de la saisie graphique ou d'images.
Modifier...
Une fois la base constituée, il faut pouvoir la modifier pour corriger
d'éventuelles erreurs ou intégrer les évolutions et modifications
dans l’information. Ces modifications se font grâce à des
éditeurs propres à SavGIS, pour la partie graphique comme pour
les données descriptives. Ces différentes opérations
ne s'effectuent pas une fois pour toute. Il est courant de créer une
base petit à petit, de modifier le schéma pour rajouter des
relations, des attributs, etc. Il est important, pour l'administrateur de
la base, de bien connaître toutes les phases indiquées plus haut,
dans l'ordre comme chaque opération séparée.
Presentation | Modules | Download | Manuals | Doc | Tutorial | Examples | Marc Souris | home