Decoupage des communes d’Ile de France pour PowerBI (TopoJSON)

Loin d’être l’outil le plus complet pour visualiser des données, en particulier géographique, PowerBI developpe une visualisation “Carte de forme” permettant d’associer des données à un découpage. (très) Peu développée, elle offre cependant quelques fonctionnalités de base qui me seront suffisante pour mes analyses futures.

PowerBI n’admet qu’un format de fichier de formes : TopoJSON.
Performant pour ce type de traitement, il est (malheuresement) encore assez peu répandu.

Visualisation du nombre d’administration présente dans l’annuaire de l’administration, par commune

La quête du cadastre électoral

Six ans après l’entrée en vigueur de la loi Lemaire pour une République numérique et du prometteur DataCamp #CadElec de la préfecture du Val de Marne, aucun cadastre électoral à l’échelle nationale ne semble avoir vu le jour. Les outils de gestion ou de pilotage de campagne électorale se sont pourtant multipliés. Dans cet article je tenterai d’expliquer les enjeux liés à ce sujet ainsi qu’une

L’article s’illustrera autour du département de la Haute-Garonne et plus particulièrement la ville de Blagnac. C’est une ville moyenne, d’une vingtaine de bureaux de vote et dont le découpage a été réalisé par la mairie. Cela nous servira de référentiel de comparaison.

De quoi parle-t-on

Avant toute chose, qu’est-ce qu’un bureau de vote et quelles données gravitent autour ?
Afin de permettre l’organisation des élections, l’Institut national de la statistique et des études économiques (INSEE) gère une liste de citoyens s’y étant inscrits : la liste électorale. La segmentation des bureaux de vote répond en réalité à une contrainte simple : le temps passé par électeur dans le bureau, le jour du scrutin.

Cette procédure est longue et nécessite la mobilisation de plusieurs autres électeurs pour la tenue du bureau. Ce nombre par bureau doit donc être limité afin de permettre le bon déroulement du scrutin. Ainsi, un zonage est effectué afin de répartir de manière équitable la population sur plusieurs bureaux, n’excédant généralement pas plus d’un millier d’électeurs. Il est fixé par arrêté, assignant des rues à des bureaux.

De par leur nombre d’habitants, la plupart des villages n’ont qu’un seul bureau de vote, couvrant l’ensemble du territoire de la commune et associé à l’ensemble de ses électeurs. Dans les villes plus grandes, il est fréquent de voir plusieurs bureaux de vote rassemblés au sein d’un même bâtiment, il s’agit du lieu de vote.

Un bureau de vote, c’est donc, en fonction du paradigme :

  • un ensemble d’électeurs, environ un millier, vivant tous sur
  • une zone prédéfinie par la mairie, correspondant au découpage géographique du bureau
  • le jour du scrutin, une urne, le bureau (physique) et l’équipe responsable de la tenue de celui-ci.

Le bureau devient l’objet d’étude le plus précis pour étudier les résultats à une élection.

Pourquoi un cadastre ?

Mais alors pourquoi un cadastre électoral ? Les préfectures et les mairies s’en sortent pourtant bien malgré l’absence de cette cartographie. Il est d’abord important de répondre à cette question car le résultat attendu ne sera pas le même en fonction de ce que l’on cherche à faire. Une administration publique cherchera probablement plus à obtenir un cadastre fidèle au zonage permettant de déterminer, pour une adresse à laquelle ne se situe pas d’électeur, à quel bureau celle-ci serait rattachée et inversement pour un découpage, toutes les adresses se trouvant à l’intérieur de celui-ci. Dans mon cas, le cadastre serait utilisé dans le cadre de campagnes électorales, cette précision ne m’intéresse pas nécessairement, ainsi le but de ce cadastre serait :

  • Pour l’analyse : disposer de contours plus ou moins précis permettant de distinguer les bureaux de vote entre eux;
  • Pour le ciblage : la visualisation sous forme de carte ne serait alors pas la plus pertinente et un cadastre précis n’aurait rien à apporter aux techniques de propagande ciblée.
  • Pour le pilotage : il servirait aux responsables d’une campagne de coordonner les militants sur des actions de terrain avec une délimitation précise.

Pourquoi un cadastre ?

Mais alors pourquoi un cadastre électoral ? Les préfectures et les mairies s’en sortent pourtant bien malgré l’absence de cette cartographie. Il est d’abord important de répondre à cette question car le résultat attendu ne sera pas le même en fonction de ce que l’on cherche à faire. Une administration publique cherchera probablement plus à obtenir un cadastre fidèle au zonage permettant de déterminer, pour une adresse à laquelle ne se situe pas d’électeur, à quel bureau celle-ci serait rattachée et inversement pour un découpage, toutes les adresses se trouvant à l’intérieur de celui-ci. Dans mon cas, le cadastre serait utilisé dans le cadre de campagnes électorales, cette précision ne m’intéresse pas nécessairement, ainsi le but de ce cadastre serait :

  • Pour l’analyse : disposer de contours plus ou moins précis permettant de distinguer les bureaux de vote entre eux;
  • Pour le ciblage : la visualisation sous forme de carte ne serait alors pas la plus pertinente et un cadastre précis n’aurait rien à apporter aux techniques de propagande ciblée.
  • Pour le pilotage : il servirait aux responsables d’une campagne de coordonner les militants sur des actions de terrain avec une délimitation précise.
Pourquoi un cadastre ?
Mais alors pourquoi un cadastre électoral ? Les préfectures et les mairies s’en sortent pourtant bien malgré l’absence de cette cartographie. Il est d’abord important de répondre à cette question car le résultat attendu ne sera pas le même en fonction de ce que l’on cherche à faire. Une administration publique cherchera probablement plus à obtenir un cadastre fidèle au zonage permettant de déterminer, pour une adresse à laquelle ne se situe pas d’électeur, à quel bureau celle-ci serait rattachée et inversement pour un découpage, toutes les adresses se trouvant à l’intérieur de celui-ci. Dans mon cas, le cadastre serait utilisé dans le cadre de campagnes électorales, cette précision ne m’intéresse pas nécessairement, ainsi le but de ce cadastre serait :

Pour l’analyse : disposer de contours plus ou moins précis permettant de distinguer les bureaux de vote entre eux;
Pour le ciblage : la visualisation sous forme de carte ne serait alors pas la plus pertinente et un cadastre précis n’aurait rien à apporter aux techniques de propagande ciblée.
Pour le pilotage : il servirait aux responsables d’une campagne de coordonner les militants sur des actions de terrain avec une délimitation précise.

Le découpage de la commune de Blagnac et les communes limitrophes
Couleurs d’illustration

Le découpage des bureaux de vote de la commune de Blagnac réalisé à partir de la liste électorale et d’une décomposition de Voronoï
Couleurs d’illustration

Il devient alors possible, sur une population de plusieurs dizaines de milliers de votants de visualiser une nuance de l’électorat à un niveau infra-communal.

Pour un département comme la Haute-Garonne, c’est tout simplement 134 communes sur les 586 qui disposent de plus d’un bureau, soit près de 23% de communes pour lesquelles nous ne sommes pas capable d’avoir une visualisation précise.

Le dilemme

Il n’y pas de bon ou de mauvais découpage dans notre cas, il n’y a que des découpages qui correspondent à des contraintes propres à chaque finalité. Si en tant que commune je souhaite me concentrer sur mon territoire pour à posteriori pouvoir répondre à des besoins précis, il semble plus probable que je m’oriente vers un découpage rigoureux de celui-ci. Celui-ci sera peut-être un peu plus couteux en temps mais il sera plus pertinent compte-tenu de la finalité poursuivie par l’administration.
En revanche, un groupe politique qui doit fournir une visualisation à un candidat afin qu’il puisse analyser des résultats sur sa circonscription, n’aura pas forcément d’intérêt à avoir un découpage très précis, le simple fait de savoir que celui-ci est ou n’est pas homogène sur une commune et comment est-ce que celui-ci est réparti lui permettra déjà un gain important en précision.

Quelles techniques ?

On peut classer ces méthodes en deux grandes familles :

Une première, la plus formelle, ayant pour source les arrêtés municipaux définissant les bureaux de vote. Elle offre l’avantage de pouvoir déterminer de manière exhaustive les adresses assignées à un bureau par la mairie, qu’il y ait ou pas un électeur à cette adresse. Cette approche par la théorie permet une fois le cadastre dessiné, de réaliser l’opération inverse : trouver pour une adresse à laquelle il n’y pas d’électeur, le bureau de vote auquel un électeur y habitant y serait rattaché.

La seconde, part des données de la liste électorale, associant pour un électeur et son adresse, le bureau de vote auquel il est rattaché. Toute la difficulté ici se trouve dans le fait que les adresses sont saisies par les électeurs eux-mêmes, dans un format qui n’est pas standard et que celles-ci comportent de nombreuses erreurs.

A l’arrivée, nous obtenons un ensemble de points représentant des adresses auxquelles se trouvent ou pourraient se trouver des électeurs. Il est important de rappeler les informations qui se trouvent derrière chacun de ces points.

Étant issus de la base électorale, les points dans notre second cas seront capables par la suite de nous apporter plus d’informations sur les électeurs.

C’est à partir de ces ensembles de points que nous allons pouvoir maintenant réaliser notre découpage. Beaucoup ont été explorés lors du DataCamp “#CadElec” de la préfecture du Val-de-Marne.

#CadElec, le DataCamp de la préfecture du Val de Marne

En 2016, la préfecture du Val de Marne a pourtant tenté de trouver une solution pérenne à ce problème, accueillant une trentaine de participants aux profils variés afin de travailler sur cette question. En sont ressorties de nombreuses solutions et pour chacune, des avantages, des contraintes et des limites à leur mise en œuvre. Je ne chercherai pas à les exposer dans cet article.

Coloration des points par bureau

Pour visualiser des adresses, la solution la plus pertinente et précise reste encore de visualiser des points représentant chacune d’entre elles.

Cette solution offre l’avantage d’être précise et fidèle aux données que l’on cherche à visualiser. Dans le cas de données issues de la liste électorale, on pourrait pondérer la taille de chacun de ces points par le nombre d’électeurs se trouvant à cette adresse, mettant en évidence les grands ensembles d’immeubles ou les pavillons résidentiels. Si sur cette illustration les bureaux sont facilement distinguables grâce au choix de la palette, cette approche rend très difficile la comparaison de nuances de couleurs lorsque l’on cherche à analyser des résultats à une élection par exemple.
De plus, le calcul du rendu des points lorsque l’on travaille sur une grande ville ou un département et assez difficile par l’ordinateur et rend la navigation peu fluide.

La décomposition de Voronoï

Si la visualisation des adresses permet d’identifier précisément les adresses d’un bureau, elle semble cependant peu adaptée pour une visualisation globale du bureau.

En rouge, la commune de Blagnac et Toulouse en bleu
Les points représentent les adresses, colorées en fonction de leur bureau de vote.

On préféra ainsi tenter de représenter le bureau non plus par les adresses qui le composent mais par la zone qu’il représente sur la commune. On prendra soin de faire correspondre ce découpage à celui de la commune afin d’obtenir un résultat sans trou.

En rouge, la commune de Blagnac et Toulouse en bleu
Le découpage issu de la décomposition de Voronoï

Cette approche nous offre d’abord plusieurs avantages :
Elle est simple à mettre en place et ne nécessite pas de réinterroger d’autres découpages. L’intervention humaine derrière ce découpage est très faible et en permet une automatisation facile, ce qui va être un facteur déterminant lorsque l’on cherche à obtenir le découpage de plusieurs dizaines/centaines de communes.
Par définition, ce découpage ne laisse pas de place à des trous et permet d’obtenir un résultat qui occupe toute la surface de la commune, utile pour comparer les bureaux entre eux, mais également l’intégrer au découpage des autres communes.

Fonctionnement

Le principe va être de calculer pour chacun des points une “zone d’influence” en fonction des points qui lui sont proches. Chacun détermine ses limites en cherchant à occuper le plus d’espace, tout en restant en concurrence les points à proximité.
La première étape va consister à isoler les points pour une commune, pour Blagnac voici le résultat.

Découpage de la commune de Blagnac ainsi que des points représentant les adresses présentes sur la liste électorale

On peut ensuite lancer le calcul du diagramme sur notre ensemble de points et en fonction du découpage de la commune.

Diagramme de Voronoï

Chaque point à ainsi déterminé sa zone d’influence, retournant un ensemble de cellules.

Il est ainsi possible de colorer ces cellules en fonction du bureau de vote attribué au point qu’elles contiennent. Un découpage du bureau de vote apparait.

Il suffit alors de simplement corriger les quelques cellules égarées dans le mauvais bureau, à cause d’une erreur lors du géocodage (un point géographique donné à la mauvaise adresse).

Le découpage des bureaux de vote de la commune de Blagnac réalisé à partir de la liste électorale et d’une décomposition de Voronoï
Couleurs d’illustration

Avantage et limite de la décomposition de Voronoï

Prenons maintenant quelques minutes pour analyser un peu le résultat. En rouge est tracé sur la carte, le découpage officiel de la mairie de Blagnac. Les points représentent les adresses présentes sur la liste électorale. En fond, une vue satellite de la commune.
On constate d’abord que le découpage des cellules a tendance à dépasser le tracé dessiné par la ville. Dans le cas ci-dessus, cela est plus pertinent, le tracé, qui suit la route inclus les habitations au nord de celle-ci. Les cellules englobent alors non seulement le point mais également une partie de la parcelle correspondant à ces habitations. Le découpage par la décomposition de Voronoï est alors plus fidèle.

Sur la droite on peut observer quelques points se situant en dehors des limites du découpage de la mairie. Ce genre de cas peut être expliqué par des dates de publication et d’actualisation différentes entre le découpage de la mairie et celui utilisé pour assigner les électeurs de la liste électorale.

Le cas de Blagnac est intéressant car une partie de la commune est couverte par un immense aérodrome.

En rouge, le découpage officiel publié par la mairie de Blagnac

L’absence de points autour de la zone aéroportuaire amène la zone d’influence des points limitrophes à s’étendre au-delà de toute limite logique, faute de concurrence.

Conclusion

A défaut de pouvoir obtenir un cadastre précis des bureaux de vote, la multitude de solutions trouvées pour y pallier viennent toute avec leur lot d’avantages et d’inconvénients. La décomposition de Voronoï apporte une solution efficace pour la visualisation des bureaux de vote dans un contexte d’analyse des résultats électoraux. Elle est également facilement automatisable et demande une intervention humaine faible. Il conviendra cependant, mais comme pour toute visualisation, de former les utilisateurs à cette technique de découpage afin qu’ils en comprennent pleinement les limites et que par exemple, le sur-étalement des cellules en milieu à faible densité d’habitation ne créé par de biais d’interprétations.

Conclusion

A défaut de pouvoir obtenir un cadastre précis des bureaux de vote, la multitude de solutions trouvées pour y pallier viennent toute avec leur lot d’avantages et d’inconvénients. La décomposition de Voronoï apporte une solution efficace pour la visualisation des bureaux de vote dans un contexte d’analyse des résultats électoraux. Elle est également facilement automatisable et demande une intervention humaine faible. Il conviendra cependant, mais comme pour toute visualisation, de former les utilisateurs à cette technique de découpage afin qu’ils en comprennent pleinement les limites et que par exemple, le sur-étalement des cellules en milieu à faible densité d’habitation ne créé par de biais d’interprétations.