Scripts permettant de préparer les données cadastrales diffusées par Etalab.
-
Node.js 16
-
Pour France entière : un CPU avec au moins 16 coeurs, ou beaucoup de patience
-
Pour France entière : au moins 190 Go d'espace disponible (50 pour les fichiers sources, 50 pour l'espace de travail, 30 pour les fichiers départementaux, 30 pour les fichiers communaux, 30 pour les Shapefile départementaux)
# You may need to use npm_config_build_from_source=true if you have issues about ABI
yarn global add @etalab/cadastre
Pour produire la totalité des fichiers, il est nécessaire de se procurer :
- Les archives départementales brutes PCI/EDIGÉO, PCI/TIFF et PCI/DXF mises à disposition par la DGFiP (par convention)
- Le Référentiel Topographique Simplifié et les données cadastrales mis à disposition par l'Eurométropole de Strasbourg
Pour ne générer que les données GeoJSON et Shapefile, les données PCI/EDIGÉO par feuille telles que diffusées par Etalab remplacent les archives brutes ne pouvant être obtenues que par convention.
Actuellement la production des fichiers se déroule en 5 étapes, via 5 commandes.
Tout d'abord la commande import-pci
explore le dossier contenant les archives départementales PCI, les décompresse et organise leur contenu pour la diffusion. Cette commande supporte à la fois les données PCI Vecteur et PCI Image.
L'import du PCI Vecteur au format DXF doit être fait séparément (facultatif mais nécessaire à la diffusion officielle).
Pour France entière l'opération ne prend que quelques minutes sur une machine moyenne.
# EDIGÉO
cadastre-builder import-pci --bundle edigeo sources-edigeo/ dist/
# DXF-CC
cadastre-builder import-pci --bundle dxf-cc sources-dxf-cc/ dist/
sources-edigeo/
: dossier contenant les archives sources sous la forme******depXX.zip
sources-dxf/
: dossier contenant les archives sources DXF sous la forme******depXX.zip
dist/
: dossier de travail qui contiendra les données de sortie
Les types de bundle supportés sont : edigeo
, edigeo-cc
, dxf
et dxf-cc
.
La commande extract-pci
déclenche l'analyse et l'extraction de tous les départements et toutes les communes présentes dans le dossier de travail.
Les archives correspondant aux feuilles cadastrales, sous la forme XXXX-XXX-XX-XX.tar.bz2
, sont successivement extraites dans le répertoire temporaire de votre système puis analysées par le parser développé par Etalab.
Un fichier GeoJSON est produit pour chaque couche et pour chaque commune.
Pour France entière, l'opération prend environ 240 heures par coeur de CPU moderne disponible. Néanmoins le script gère efficacement la présence de multiples coeurs. Sur une machine dédiée avec 48 coeurs le traitement prend environ 5 heures et 30 minutes.
cadastre-builder extract-pci dist/
NB : Les objets bruts sont systématiquement produits et placés dans un dossier raw
.
La commande extract-ems
déclenche l'analyse et l'extraction des données cadastrales mises à disposition par l'Eurométropole de Strasbourg..
Un fichier GeoJSON est produit pour chaque couche résultante et pour chaque commune.
L'opération dure moins de 5 minutes.
# Attention, le dossier de sortie doit être le même que celui de sortie de l'export PCI
cadastre-builder extract-ems --rts chemin/vers/referentiel_topo_simplifie.zip --parcellaire chemin/vers/referentiel_parcellaire.zip dist/
À date, les liens de téléchargement sont les suivants :
La commande merge
permet d'obtenir des fichiers GeoJSON départementaux à partir des fichiers communaux, et les fichiers nationaux.
L'opération France entière dure environ 30 minutes.
cadastre-builder merge dist/
La commande generate-shp
permet d'obtenir des fichiers Shapefile départementaux et nationaux à partir des fichiers GeoJSON.
L'opération France entière dure environ 30 minutes.
cadastre-builder generate-shp dist/
MIT