Open Data, une solution pour le Big Data !

L’Open Data est certes une belle initiative mais que faire pour que son usage soit profitable à tous ? Comment l’Open data permettra une meilleure exploitation du Big Data ? Nous allons tenter d’y répondre en nous appuyant sur deux interventions de la conférence GS1 France. La première de Simon Chignard, auteur de l’ouvrage L’Open Data : comprendre l’ouverture des données publiques. La suivante de Martin Duval, président de Bluenove. (société de conseils consacrée à « Open Innovation »).

 Quels usages de ces données ? Avec qui les partager ?

Tout le monde peut produire de la donnée ! Face à l’Open Data une évolution des mentalités apparait. En effet, les particuliers sont aussi dans la partie pour une approche plus collaborative. Les citoyens viennent nourrir des sites par des données afin « de construire des contenus et services partagés dans le pur esprit des wiki ».  OpenStreetMap est un projet collaboratif qui consiste à réaliser une carte du monde gratuite. Un internaute peut apporter des modifications, télécharger les données et les utiliser dans les termes d’une licence ouverte. Cette application est parfois même plus riche en données que Google MapsLa preuve en est que Apple et Google se sont appuyés sur OpenStreetMap pour certaines applications. On constate donc une évolution de production, de diffusion et de partage de la donnée.

Cependant, quelles sont les motivations pour les entreprises de rendre leurs données ouvertes ? Il faut distinguer droit d’accés et données ouvertes. On nomme maladroitement le fait de « publier des données pour dire aux autres ce que je fais » : la transparence, alors qu’une réelle transparence serait de combiner publication et réutilisation des données. Le souci est donc que dans certains cas la donnée n’est pas particulièrement libre, la Vrai définition de l’open data selon Simon Chignard est : « tout avec tout le monde sans a priori ».

Comment l’Open Data permettra une meilleure exploitation du Big Data ?

Dans un premier point, une donnée contrôlée et mise à jour permet une meilleure fiabilitée. Dans un deuxième point selon Martin Duval « ouvrir ses données à des tiers est peut-être une des meilleures des façons de les valoriser ». Si une entreprise n’arrive plus à gérer sa masse de données, ce serait pour elle la possibilité d’obtenir de l’aide extérieure. Le projet SNCF a utilisé ce concept en ouvrant ses premiers jeux de données sur  test.data-sncf.com où chaque individu peut partager et échanger des idées et des avis :  » nous avancerons, ensemble dans le bon sens » (citation SNCF).

Le bénéfice d’ouverture des données est un sujet nouveau pour les entreprises. Cela contribuerait à la satisfaction client, l’ accélération du développement des produits, la réalisation de nouveaux produits et de services innovants. Plusieurs types de modèles d’ouverture existent :
Modèle semi-ouvert : Des partenaires sélectionnés ont l’accès aux données avec un lien contractuel.
Modèle demi ouvert : des interfaces de programmation proposent un accès partiel aux données. Ce modèle Permet une diffusion plus importante de données auprès de partenaires pouvant les réutiliser. Mais toutes les données ne sont pas ouvertes.
Modèle ouvert : « L’ouverture est alors à la fois technique (la fourniture de données brutes dans un format ouvert et facilitant la réutilisation), juridique (l’utilisation de la licence ouverte proposée par Etalab, la licence ODbL) et économique (peu ou pas de redevances sur la réutilisation des données) »
Ainsi le fait d’ouvrir les données à ses partenaires pourrait leur permettre de les étudier, de faire des requêtes sur ces données, de se demander ce qu’il pourrait améliorer, voire de développer des applications par la suite mises en vente sur le marché comme a pu le faire Apple avec App Store, une plateforme qui pemet de télécharger des applications.

Pour que le big data puisse arriver à ses objectifs de prédiction, celui ci est dépendant de l’open d­­­ata. En effet l’open data implique une qualité de la donnée par l’ouverture et le contrôle de celle-ci. La condition sera alors une ouverture à tous les niveaux, la collecte, les algorithmes de prédiction et la conduite de l’action. Il reste à innover !

Pour en savoir plus, quelques sources :