L’Open Data est un levier particulièrement intéressant pour enrichir ses données. Les données libres donnent accès à des informations inédites, souvent d’intérêt général qui méritent d’être partagées. En complétant vos bases de données avec de l’Open Data, vous améliorerez votre degré d’information et pourrez affiner vos analyses de données. Créatrice de nombreuses opportunités, leur valeur atteindrait même 1,75 trillion de dollars.
Pourtant, il peut être complexe d’intégrer durablement l’Open Data dans sa stratégie. Pour vous aider, Edouard Nahama, Data Analyst chez Invenis, partage avec vous ses conseils pour traiter correctement les données en Open Data.
Invenis – L’intégration et le traitement des données Open Data à sa base de données sont cruciaux pour l’efficience des analyses de données. En tant que Data Analyst, quels sont pour vous les pré-requis pour l’exploiter ?
Edouard Nahama – Comme pour toutes analyses de données, il est crucial d’identifier le besoin des équipes métiers. En amont des traitements et en collaboration avec les équipes métiers, il faut d’abord définir le cas d’usage qu’on souhaite réaliser. Une fois que cela est fait, on pourra alors identifier les bonnes sources de données et parmi elles, sélectionner les données qui répondront à notre besoin.
Une fois que vous avez vos données en Open Data, obtenues soit par une API soit en téléchargeant des fichiers, il faudra les importer dans votre base. A chaque analyse de données, il est indispensable de passer par la préparation des données. Il faudra donc procéder à des travaux de nettoyage, d’harmonisation des données. L’objectif est de faire parler entre elles des données qui à la base étaient silotées pour en tirer de la valeur pour le métier.
Globalement, avant de se lancer dans l’intégration de données en Open Data, il faut garder à l’esprit que cela nécessite une charge de travail supplémentaire qui ne doit pas être prise à la légère.
Invenis – Quels sont les coûts à prévoir en amont de l’intégration de données Open Data ?
EN – Il faut savoir qu’il existe des données gratuites et payantes selon la source mais aussi selon la fréquence d’utilisation. Si vous avez besoin de données plus précises, elles pourront devenir payantes.
Comme je l’expliquais avant, l’exploitation de l’Open Data demande un travail supplémentaire, il faut alors prendre en compte la dimension des ressources humaines. Pour que des jeux de données soient intégrés à votre base de données, des Data Analysts devront suivre les mises à jour des données, réaliser une veille pour disposer des meilleures sources, vérifier qu’il n’y a pas de rupture et identifier les sources qui n’existent plus. Tout cela représente du temps humain supplémentaire qui implique un coût.
Aussi, il faut anticiper la dimension technique avec la question des infrastructures et du stockage si votre data est hébergée ailleurs que dans vos bases de données. Le coût dépendra de la volumétrie des données, même s’il s’agit davantage d’une question d’organisation que de coût car celui-ci reste peu élevé. Le problème pourra se poser si le volume est très important et l’information doit être propagée via des outils de dashboarding.
Invenis – Pourquoi en tant que Data Analyst pensez-vous que l’Open Data soit une source de données intéressante ?
En tant que DSI, il est intéressant de mettre à disposition des données enrichies en Open Data pour répondre aux problématiques des équipes métiers.
Prenons quelques exemples :
L’Open Data permettra aux équipes marketing d’améliorer leur connaissance client par zone géographique avec des données sur les revenus moyens par région, département, ville ou même quartier. Les données météo pourront aider des commerçants à adapter leurs produits saisonniers ou comprendre le comportement de leurs clients en fonction de la météo.
L’Open Data permet de connaître le potentiel d’un marché :
Par exemple dans le secteur bancaire, les données Open Data d’origine sociodémographique pourraient permettre d’identifier les parts de marché d’une banque dans les communes dans lesquelles ses clients sont présents.
L’Open Data est utile pour les équipes logistiques. Elle donne accès, par exemple, aux données de circulation sur un territoire défini. Ainsi, on pourra améliorer l’organisation des itinéraires et des chauffeurs. Avec comme objectif, un gain de temps et une réduction des coûts.
L’Open Data est aussi utile pour les acteurs publics. Les collectivités peuvent, par exemple, utiliser des données pour réaliser de la prédiction sur les places de parking disponibles. Cela dans un souci de faciliter la vie des citoyens.
Invenis – Selon vous quels sont les pièges à éviter pour bien exploiter l’Open Data ?
EN – Pour que les données ouvertes vous offrent de nouvelles opportunités, il y a quelques éléments à avoir en tête :
Certaines données Open Data sont issues d’une seule source. Cela pourrait être un problème si celle-ci n’était plus mise à jour. De même, il est difficile de vérifier la qualité des données.
Toutefois, cela est à relativiser car la majorité des bases Open Data sont fiables, bénéficient d’un long historique et sont issues du Gouvernement. Ce dernier, d’ailleurs, œuvre en faveur de l’ouverture des données. Ce qui minimise le risque qu’une source disparaisse ou ne soit plus à jour.
Par ailleurs, on pourrait craindre qu’un format de données en Open Data puisse changer, entraînant la faillite d’un modèle d’analyse. Il est tout à fait possible qu’un format de données soit modifié. Auquel cas il faudra savoir s’adapter au changement mais il ne sera pas nécessaire de repartir de zéro.
Un autre point à avoir en tête en Open Data est la notion des droits d’exploitation. On ne fait pas forcément ce que l’on veut avec l’Open Data. Par exemple, si vous souhaitez revendre des données, il faudra apporter une vraie plus-value.
Enfin, le dernier écueil à éviter sera de vouloir exploiter de l’Open Data à tout prix. Ne partez pas des données disponibles pour réaliser un cas d’usage. Il faut toujours utiliser des données pour répondre à un besoin déjà identifié.
Découvrez notre guide spécial Open Data avec les conseils de nos experts et des cas d’usage concrets.