L’apport de l’OpenData aux données métiers

open-data-SIG

« Les données sont une matière première vitale de l’économie de l’information, comme le charbon ou le minerai de fer l’étaient pendant la révolution industrielle. »

Steve Lohr, journaliste au New York Times

 

Oui l’OpenData est devenu incontournable, on en parle beaucoup et souvent, à se demander comment nous faisions pour vivre sans avant, n’est-ce pas. Pourtant, alors même que son nom sous-entend une parfaite libre utilisation, le plus souvent ces données dépendent de conditions d’utilisations et licences contraignantes pour les réutilisations. Tout n’est donc pas si rose dans le monde de l’OpenData.

Néanmoins, il faut bien lui accorder certains atouts, comme celui de créer de l’information, notamment en croisant ses données avec des données métiers. C’est là que prend tout son sens l’utilisation d’un outil de visualisation de données (dataviz) comme Dashboard : ajouter de la valeur aux données, c’est bien, les visualiser sur une carte interagissant avec des graphiques, c’est optimal pour en saisir la valeur.

Aujourd’hui, nous allons vous révéler toute la valeur ajoutée qu’il est possible de tirer du croisement de données avec de l’OpenData via trois cas d’usages : la prévision de fréquentation d’un musée, l’estimation du risque de catastrophes portant sur des structures touristiques et pour finir la détermination de cibles de prospect.

 

Commençons par un type de jeu de données assez courant sur les plateformes OpenData : les séries temporelles. Pour les non-statisticiens il s’agit tout simplement de fichiers dont l’information est rattaché à une notion de temps, comme des historiques de ventes ou de fréquentation. Ainsi à partir de données comme celles-ci, nous sommes en mesure de mettre en place un modèle de prédiction.
Cette information peut ensuite servir dans l’établissement d’un planning d’actions commerciales ou marketing par exemple.

À partir d’un jeu de données de la plateforme OpenData de la communauté d’agglomération du Grand Poitiers, portant sur la fréquentation des musées, nous avons  mis en place un modèle de Holt-Winters de façon à obtenir des prévisions par triple lissage exponentiel.

 

 

 

Grâce à ces prédictions directement exploitables dans Dashboard, la municipalité va pouvoir mettre en place des actions de promotions de ses musées lors des périodes creuses et ainsi dynamiser la fréquentation.

Le type de fichiers probablement le plus fréquent dans l’OpenData est celui de localisation. A partir de ce type de jeu de données, on peut calculer un tas d’indicateurs dépendants entre autres de la distance entre plusieurs éléments.

Ici, nous prenons l’exemple de la ville de St-Malo qui  souhaite évaluer le niveau de risque qui porte sur chacun des campings de la ville.
Pour ce faire nous utilisons plusieurs fichiers du site OpenData de l’agglomération de St-Malo, pour récupérer la localisation de deux types de structures dangereuses identifiées par la ville : les stations-services et les conteneurs de piles et batteries usagées.

Ensuite il reste à calculer la distance euclidienne, c’est-à-dire la distance « à vol d’oiseau », entre  un camping et chaque structure à risque, puis d’affecter une valeur proportionnelle à la distance. Le nombre de places du camping a également été pris en compte, puisque plus il y a de monde à évacuer et protéger, plus le danger augmente.

La municipalité va pouvoir adapter les mesures de sécurité et de protection, ainsi que les moyens de secours à l’aide de cette information. Elle pourra également autoriser ou interdire la construction de nouvelles structures dangereuses si le niveau de risque d’un camping dépasse alors un certain seuil. Dashboard devient alors un véritable outil de gestion opérationnelle pour aider à la prise de décision grâce à une visualisation géocentrique des données calculées.

 

La dernière possibilité de création d’information à partir de l’OpenData que nous vous proposons aujourd’hui est celle du calcul de densité proportionnelle d’un équipement par rapport à la population, en se servant d’un jeu de données de recensement de population et un autre de dénombrement d’équipements.

Prenons l’exemple d’une entreprise de BTP basée en Isère qui souhaite augmenter ses chantiers de piscines publiques. Avec les fichiers de l’INSEE, un de recensement de la population et un de dénombrement de structures sportives, nous pouvons lui fournir pour chaque commune de son département, le nombre de piscines pour 10 000 habitants.

Ici l’intérêt de Dashboard est de pouvoir comparer rapidement et visuellement des villes de tailles différentes. En effet comparer des effectifs bruts est trompeur. On le voit très bien dans le premier cas, Grenoble ressort très nettement sur la carte, alors que dans le second elle est très pale.

Avec cette information placée sur une carte (comme la seconde ici), la société va pouvoir cibler les communes à démarcher pour les pousser à faire des appels d’offres.

 

 

Brutes, les données « OpenData » sont quasi inutilisables, car bien souvent trop déconnectées d’un contexte d’utilisation. Tout l’intérêt de traiter celles-ci et de les croiser avec d’autres est justement d’obtenir de l’information, qui plus est, une information qui n’existe nulle part ailleurs.

 

Pour pouvoir visualiser vos données enrichies grâce à l’OpenData de manière géolocalisée, les consulter de façon dynamique et interactive avec un outil carto-centré, notre outil Dashboard se présente comme une solution incontournable. Vous pourrez choisir vos analyses, vos modules et obtenir un tableau de bord de suivi de vos données personnalisé, unique et surtout adapté à vos besoins.