indexing.rst @ 33

Revision 33, 10.0 KB checked in by djay, 14 years ago (diff)
Traduction partie 14

Partie 14 : les indexes spatiauux

Rapellez-vous que les indexes spatiaux est l'une des trois fonctionnalitÃ©s clÃ©es d'une base de donnÃ©es spatiales. Les indexes sont ce qui rend possible l'utilisation de grandes quantitÃ©s de donnÃ©es dans une base. Sans indexation, chaque recherche d'une entitÃ© nÃ©cessitera d'accÃ©der sÃ©quentiellement Ã tout les enregistrement de la base de donnÃ©es. L'indexation rend plus rapide les recherche en organisant les donnÃ©es dans des arbre de recherches qui peuvent Ãªtre parcouru efficacement pour retrouver une entitÃ© particuliÃšre.

Les indexes spatiauxs ont l'un des plus grands atouts de PostGIS. Dans les exemples prÃ©cÃ©dents, nous construissions nos jointures spatiales en comparant la totalitÃ© des tables. Ceci peut s'averrer trÃšs coÃ»teux : rÃ©aliser la jointure de deux tables de 10000 enrigstrements sans index nÃ©cessitera de comparer 100000000 valeurs, avec les indexes le comparaisons requises seront 20000.

Lorsque nous avons chargÃ© la table nyc_census_blocks, l'outils pgShapeLoader crÃ©e automatiquement un indexe spatial appelÃ© nyc_census_blocks_the_geom_gist.

Pour dÃ©montrer combien il est important d'indexer ses donnÃ©es pour la performance des requÃªtes, essayons de requÃªter notre table nyc_census_blocks sans utiliser notre indexe.

La premiÃšre Ã©tapt consiste a supprimer l'index.

DROP INDEX nyc_census_blocks_the_geom_gist;

Note

La commande DROP INDEX supprime un index existant de la base de donnÃ©es. Pour de plus amples informations Ã ce sujet, consultez la documentation officielle de PostgreSQL.

Maintenant, regardons le temps d'exÃ©cution dans le coin en bas Ã droite de l'interface de requÃªtage de pgAdmin et lanÃ§ons la commande suivante. Notre requÃªte recherche les bloques de la rue Broad.

SELECT blocks.blkid
FROM nyc_census_blocks blocks
JOIN nyc_subway_stations subways
ON ST_Contains(blocks.the_geom, subways.the_geom)
WHERE subways.name = 'Broad St';

      blkid
-----------------
 360610007003006

La table nyc_census_blocks est trÃšs petite (seulement quelque millier d'enregistrements) donc mÃªme sans l'index, la requÃªte prends 55 ms sur mon ordinateur de test.

Maintenant remettons en place l'indexe et lanÃ§ons de nouveau la requÃªte.

CREATE INDEX nyc_census_blocks_the_geom_gist ON nyc_census_blocks USING GIST (the_geom);

Note

l'utilisation de la clause USING GIST spÃ©cifie Ã PostgreSQL de crÃ©er une structure (GIST) pour cet indexe. Si vous recevez un mesage d'erreur ressemblant Ã ERROR: index row requires 11340 bytes, maximum size is 8191 lors de la crÃ©ation, cela signifie sans doute que vous avez omis la clause USING GIST.

Sur mon ordinateur de test le temps d'exÃ©cution se rÃ©duit Ã 9 ms. Plus votre table est grande, plus la diffÃ©rence de temps d'exÃ©cution pour une requÃªte utilisant les indexes sera augmentÃ©.

Comment les indexes spatiaux fonctionnent

Les indexes des base de donnÃ©es standards crÃ©e un arbre hierarchique basÃ© sur les valeurs de la colonne Ã indexer. Les indexes spatiaux sont un peu diffÃ©rents - ils ne sont pas capable d'indexer des entitÃ© gÃ©mÃ©triques elles-mÃªme mais indexe leur Ã©tendues.

Dans la figure ci-dessus, le nombre de lignes qui intersectent l'Ã©toile jaune est unique, la ligne rouge. Mais l'Ã©tendue des entitÃ©s qui intersectent la boÃ®te jaune sont deux, la boÃ®te rouge et la bleu.

La maniÃšre dont les bases de donnÃ©es rÃ©pondent de maniÃšre efficaces Ã la questions "quelle ligne intersectent l'Ã©toile jaune ?" correspond Ã d'abort rÃ©pondre Ã question ; "quelle Ã©tendue intersecte l'Ã©tendue jaune" en utilisant les indexes (ce qui est trÃšs rapide) puis rÃ©alise le calcul exacte de "quelles lignes intersectent l'Ã©toile jaune" seulement en utilisant les entitÃ©s retournÃ© par le premier test.

Pour de grandes tables, il y a un systÃšme en "deux Ã©tape" d'Ã©valuation en utilisant dans un premier temps l'approximation Ã l'aide d'indexes, puis en rÃ©alisant le test exact sur un quantitÃ© bien moins importantes de donnÃ©es ce qui rÃ©duit drastiquement le temps de calcul nÃ©cessaire Ã cette deuxiÃšme Ã©tape.

Ã la fois PotGIS et Oracle Spatial partage la mÃªme notion d'index structurÃ© sous la forme "d'arbres R" [1]. Les arbres R classent les donnÃ©es sous forme de rectangles, de sous-rectangles etc. Cette structure d'index gÃšre automatiquement la densitÃ© et la taille des objets.

RequÃªte avec seulement des index

System Message: WARNING/2 (<string>, line 70)

Title underline too short.

RequÃªte avec seulement des index
--------------------------------

La plupart des fonctions utilisÃ©es par PostGIS (:command:`ST_Contains`, :command:`ST_Intersects`, :command:`ST_DWithin`, etc) prennent en compte les index automatiquement. Mais certaines fonctions (comme par exemple : :command:`ST_Relate`) ne les utilisent pas.

System Message: ERROR/3 (<string>, line 72); backlink