Le serveur éducatif de l'IGN et de l'Education Nationale sur l'information géographique
documentation spécialisée définitions des mots techniques consulter le sommaire... page d'accueil exposés sur questions techniques voir exemples, télécharger ... rechercher un mot ...

 

2
Les différents types d'information géographique

Les cartes: présentation et classification
Photographie aérienne et photocarte : présentation, description
Image satellitale et spatiocarte : présentation, description (en chantier)
Présentation des bases de données
Les informations géographiques alphanumériques
Les sources d'information géographique
Les métadonnées

 

 
Fiche précédente Fiche suivante

par
Jean
Denègre

Ecole Nationale des Sciences Géographiques
Ecrire

 

Présentation des bases de données
 

Le sytème de gestion de base de données ou SGBD assure l'interface (accès, mise à jour, conservation) entre les données et les applications externes qui en sont faites
 

Les bases de données géographiques sont les outils opérationnels qui permettent d'organiser et de gérer l'information géographique sous forme numérique.
Ce sont des ensembles structurés de fichiers décrivant les objets ou phénomènes localisés sur la Terre (avec leurs attributs et leurs relations nécessaires à la modélisation de l'espace géographique).
Ces ensembles sont munis d'un système de gestion permettant de les tenir à jour, de les archiver et de les diffuser.

Les bases de données constituent le socle sur lequel s'appuient les systèmes d'information géographique, qui analysent et exploitent les données pour en tirer des informations utiles à la décision.

 

Plan de fiche

Définition
Modélisation
Requêtes
Gestion
Echange de données

 

 

Définition

Qu'est-ce qu'une base de données?

 

Une base de données (en anglais database) est une "structure de données permettant de recevoir, de stocker et de fournir à la demande des données à de multiples utilisateurs indépendants" (définition AFNOR-ISO, dictionnaire de l'informatique, 1989).

 

 

Modélisation

Qu'est-ce que le modèle d'une base de données géographiques?

 

La réalité d'un territoire peut être représentée (on dit aussi "modélisée") par une base de données géographiques décrivant tous les objets ou phénomènes présents sur ce territoire, ainsi que les relations entre ces objets. Ce modèle de la réalité est en fait une schématisation du monde réel, dont la complexité est trop grande pour être tout entière représentée par une ou même plusieurs bases de données géographiques. De plus, comme pour les cartes, la description des objets dans les bases de données est étroitement liée à l'échelle de représentation à laquelle on travaille.

 

Exemple : la forêt de Fontainebleau, représentée sur un globe terrestre (échelle : 1:40 000 000), sera figurée par un simple point. Sur une carte à petite échelle, par ex; une carte routière au 1:250 000, elle sera représentée par un ensemble de polygones de forme complexe, avec des enclaves (les clairières, les villages, ...) et des noms correspondant aux différents massifs forestiers. A des échelles beaucoup plus grandes (carte forestière par ex.), on peut aller jusqu'à identifier chaque arbre, avec son essence, son âge, sa hauteur, son volume, et ainsi de suite.

 

 

Toute base de données représente une modélisation particulière de la réalité, et donc une généralisation plus ou moins poussée de celle-ci. Comment décrire les objets localisés sous forme numérique ? De même que sur une carte, interviennent trois catégories de descripteurs : la nature et les attributs de l'objet, la localisation et la forme de l'objet et les relations de construction

 

- la nature et les attributs de l'objet (la sémantique), comme ceux qui sont définis dans la légende et les écritures de la carte, mais qui peuvent être beaucoup plus complets et précis,

 

- la localisation et la forme de l'objet (la géométrie), pour laquelle on définit trois formes principales de représentation : point, ligne et surface, un objet pouvant d'ailleurs être représenté par plusieurs de ces formes (ex. une route avec ses deux bords, et formée de tronçons successifs).

 

 

 

 

Il faut donc assurer la correspondance entre l'objet sémantique et sa traduction géométrique, par ce qu'on appelle les "relations de construction". A cela s'ajoutent d'autres types de relations, qui peuvent être évidentes ou implicites sur une carte, mais qu'il faut modéliser explicitement dans une base de données : par ex. les relations de voisinage ou d'appartenance.

 

 

Pour être plus précis, on distingue trois types de relations entre objets :

 

Les relations spatiales

 

 

 

Les plus évidentes sur une carte, comme deux bâtiments voisins (adjacence), ou deux routes qui s'intersectent (connectivité), ou une clairière incluse dans une forêt (inclusion) (voir figure 2) ; on les appelle aussi relations topologiques (logique de l'espace), les termes utilisés pour les formes graphiques élémentaires dans la théorie des graphes étant : polygones (ou faces, pour les surfaces), arcs (limites des polygones) et nœuds (extrémités des arcs).

 

Les relations de composition

 

 

La plupart des objets, relativement complexes, sont en fait constitués d'objets plus simples, comme on le voit souvent sur une carte. Par exemple, un aéroport est composé de pistes, de bâtiments, d'espaces en herbe, etc. (voir figure 3). Ces relations de composition décrivent l'appartenance d'un objet à un autre objet. Les objets dits "élémentaires" sont ceux qui se construisent directement avec leurs formes géométriques (relations de construction) ; cette notion dépend de l'échelle à laquelle on travaille : dans l'exemple précédent, la forêt de Fontainebleau est un objet élémentaire au 1:40 000 000 mais devient un objet complexe aux échelles plus grandes.

 

Les relations sémantiques

 

 

Les relations sémantiques décrivent toutes les autres sortes possibles de relations logiques entre objets (voir figure 3) :0 elles portent généralement sur la fonction ou les attributs des objets. Exemples : tel cours d'eau est affluent de tel autre, tel bâtiment appartient à tel propriétaire, telle route franchit telle voie ferrée, etc.. Ces relations peuvent être aussi nombreuses et détaillées que le permet l'informatique, ce qui n'est pas le cas pour la carte-papier.

L'ensemble de ces quatre types de relations (de construction, spatiales, de composition, sémantiques) permet de modéliser complètement, selon la schématisation retenue, en termes de thèmes et d'échelle, l'espace géographique concerné. On appelle "modèle conceptuel de données" le diagramme représentant, avec différents symboles, l'ensemble des objets, leurs attributs et leurs 4 types de relations.

 

 

Requêtes

Comment interroge-t-on une base de données géographiques?

 

Toutes les questions que l'on peut poser à une carte doivent pouvoir être traitées de même à l'aide d'une base de données géographiques. De plus, celle-ci peut répondre à des questions beaucoup plus complexes, grâce à la richesse des attributs et à la souplesse des relations entre objets, notamment sémantiques et topologiques. Exemples, en allant du plus simple au plus compliqué :

- Où se trouve la commune de Mauperthuis ?
- Où se trouvent tous les bâtiments de la commune de Mauperthuis ?
- Quels sont les bâtiments situés à moins d'1 km de l'église de Mauperthuis ?
- Quels sont les bâtiments de plus de 2 étages et situés à moins d'1 km de l'église ?
- Quels sont les bâtiments de plus de 2 étages, situés à moins d'1 km de l'église, construits depuis plus de 10 ans et comprenant une cour intérieure ?

 

   

La réponse passe par un calcul d'intersection de polygones puis par une méthode d'interpolation (par exemple en supposant une densité uniforme de la population dans chaque commune)
   

 

Toutes ces questions (qu'on appelle des requêtes) peuvent être traitées en se basant sur les attributs des objets, sur leurs relations sémantiques, spatiales ou de composition, etc. Des langages de requête spécialisés, tels que SQL (Structured Query Language) permettent aux utilisateurs d'obtenir automatiquement les réponses attendues. On distingue les requêtes attributaires (qui portent sur les attributs des objets) et les requêtes spatiales (qui portent sur les relations de construction ou topologiques), ces dernières étant propres à l'information géographique et exigeant des développements spécifiques.

   

 

 

Gestion

Comment gère-t-on une base de données?

 

Une base de données doit pouvoir être gérée automatiquement, c'est-à-dire modifiée en fonction des mises à jour successives des données, résultant des changements incessants qui interviennent dans la vie courante : aménagement, construction, urbanisation, exode rural, déprise agricole, déforestation, sècheresse, etc. Il faut, non seulement, modifier,ajouter ou supprimer des objets, mais mettre à jour toutes leurs relations mutuelles.

Les systèmes de gestion de bases de données (SGBD) doivent assurer les fonctions suivantes :

- manipulation des données : recherche, modification, insertion ou suppression de données. La sélection des données doit pouvoir se faire soit selon un critère géographique (la zone d'intérêt), soit selon un critère thématique (les thèmes choisis),

- maintien de l'intégrité des données,

- respect de la confidentialité des données : suivant les cas, les données appartiennent à des utilisateurs différents, qui n'ont pas tous les mêmes droits d'accès,

- simultanéité d'accès : plusieurs utilisateurs doivent pouvoir accéder aux données en même temps. Les mises à jour sont sériées de façon à assurer en permanence la cohérence de la base,

- sécurité de fonctionnement : le SGBD doit assurer la sauvegarde des données en cas de panne (matériel ou logiciel).

Les logiciels de SGBD ont été bâtis sur des modèles logiques tels que les modèles en réseaux et, plus récemment, les modèles relationnels. Ceux-ci représentent les relations entre objets par des tables ainsi construites :

- les 2 premières colonnes sont les classes d'objets en relation,
- les colonnes suivantes sont les attributs de la relation.

 

   

Exemple: relation "tel Etat possède telle population":

Etat

Population*

Croissance pop.

Surface Km2

Capitale

Bulgarie

9

0%

111 000

Sofia

Hongrie

10

-0,3%

93 000

Budapest

Moldavie

4

0,3%

34 000

Kichinev

Pologne

39

0,4%

313 000

Varsovie

Roumanie

23

-0,2%

237 000

Bucarest

Slovaquie

5

0,5%

49 000

Bratislava

Tchèque (Rép.)

10

0,1%

79 000

Prague

Ukraine

52

0,3%

604 000

Kiev

*Population en millions d'habitants

 

La base de données relationnelle est construite de façon que pour chaque relation, les objets et leurs attributs soient reliés dans une même table. Si l'on dispose de plusieurs relations, on peut former de nouvelles tables en "fusionnant" deux relations : par ex. la relation "tel Etat a telle production agricole" peut être fusionnée avec la relation "tel Etat a telle population" en formant une seule table (cela s'appelle une jointure).

 

   

Il est ainsi possible de questionner la base sur n'importe quelle combinaison de critères :
(Exemple d'après la table ci-dessus) : quels sont les pays qui ont une population supérieure à18 millions, une croissance supérieure à 0,2 % et une surface inférieure à 500 000 km2 ? En suivant la colonne 2 on identifie 3 pays, puis en suivant la colonne 3, on élimine l'un d'entre eux, et la colonne 4 nous donne la réponse (la Pologne).

 

   

L'inconvénient des bases de données relationnelles est d'éparpiller les relations entre objets en un grand nombre de tables relationnelles, d'où la difficulté de retrouver toutes les informations relatives à un objet donné. C'est pourquoi la tendance est à l'utilisation de base de données orientées-objets, c'est-à-dire regroupant toutes les informations (attributs et relations) relatives à un objet donné dans un ensemble unique (processus d'encapsulation).

   

 

 

Echange de données

Comment échange-t-on des données entre producteurs et utilisateurs?

 

L'échange de données est un aspect fondamental de l'information géographique numérique. La faisabilité de l'échange est conditionnée par la normalisation de l'information, qui est un objectif de l'ensemble de la communauté géographique, tant nationale qu'internationale. La normalisation porte notamment sur le format des données, ce qui permet d'éviter les conversions de format quand on passe d'un système à l'autre, ce qui est souvent très lourd à réaliser. Le fait de disposer d'une norme permet de limiter le nombre de conversions. La normalisation à l'échelon national (AFNOR, avec la norme EDIGEO) puis européen (Comité Européen de Normalisation), a été amorcée au début des années 90 puis étendue à l'International Standard Organisation (ISO), dans l'optique de favoriser l'inter-opérabilité des systèmes.

   

 




Introduction : Systèmes d'information géographique et bases de données
Présentation de logiciels SIG
Intégrer des données dans un SIG (acquisition et saisie)
Interroger le SIG (analyse)

 

 


Haut de page
 
Accueil Recherche Exemples Dossiers Sommaire Lexique Documentation Aide A propos...