Open Data : La Conférence

Hier jeudi 27 septembre avait lieu la première édition d’ « Open Data : La Conférence ». Des intervenants de qualité, un lieu emblématique (le Ministère de l’Economie et des Finances à Bercy), un sujet qui bien entendu nous intéresse ; on a aimé des réflexions fines, des opportunités bien vues, un constat nécessaire de manque de maturité -commerciale- de la data en France par exemple, on a moins aimé des raccourcis et rapprochements souvent trop faciles entre différents pays et la France, quelques lieux communs et passages longuets sur des opportunités long terme, qu’il est néanmoins nécessaire d’avoir quand on est un grand groupe, notamment chez Orange ou à la SNCF.

Il y a déjà eu beaucoup (trop) de tweets (voir sur #odlc et @opendatalaconf) lors de la journée, et le contenu d’un certain nombre de slides (souvent appelés « transparents » lors de la conférence, ça fait vintage) sera disponible sur le site de la conférence, donc nous n’allons pas vous faire un rapport complet de la chose, mais un simple survol des points qui nous semblent importants, et n’allons donc pas aborder toutes les interventions ; le site de l’évènement est d’ailleurs assez fourni sur le sujet et présente bien les intervenants.

Gilles Babinet

Le marché de l’Open Data (ici, la réutilisation des informations publiques) en Europe représenterait 32 milliards d’euros (NDLR :  Le rapport MEPSIR de 2006, financé par la commission européenne, avait estimé ce marché à 27 milliards d’euros).

Les Français conservent une grande défiance vis-à-vis de leurs institutions, et la petite trentaine d’initiatives publiques dans l’Open Data en France peine à faire démarrer le mouvement Open Data dans notre pays, notamment à cause de nombreux freins administratifs ou réglementaires : la CNAM qui empêche la transparence des frais de santé, Pôle Emploi l’accès à ses bases de données, la RATP la publication des horaires des métros en temps réel, l’INPI la gratuité de sa base, etc. On ne peut toujours pas aujourd’hui en France noter les professeurs (interdit par la loi) ou mesurer l’efficacité de nos écoles primaires.

Jeanne Holm & Jeff Kaplan

Il y aurait aujourd’hui dans le monde 1 million de jeux de données (datasets) libérés dans le monde. C’est peu et demande encore beaucoup d’efforts, mais se pose aussi le double problème des formats standards des données et des modèles de plateformes proposant ces données pour les libérateurs de données, qui restent encore à définir.

Philippe Reynaud

On ne connaît pas encore dans le monde la ruée sur l’Open Data tant attendue (NDLR : constat apparemment basé sur les chiffres d’une étude britannique d’avril 2012, que nous n’avons pu retrouver). On constate un push des jeux de données par l’offre, mais qui souvent échouent à rencontrer l’enthousiasme du public ou la pertinence que ce dernier réclame. La logique de l’Open Data doit se (re)centrer sur la demande et non plus sur l’offre.

On peut pointer par ailleurs un vrai manque de fiabilité des données libérées, souvent lié à leur fixité (elles sont intégrées une fois pour toute dans une application, et ne sont pas ou peu mises à jour).

Nigel Shadbolt

There is no point in publishing data if it is easy

En effet, une grande part de l’utilité de l’ouverture des données  repose sur le fait qu’elle reflète une vraie décision politique, une fermeté nécessaire car contrevenant aux intérêts d’acteurs, privés ou publics, qui ne veulent pas cette transparence car ils ont peur de perdre une donnée sensible ou qu’ils pensent pouvoir vendre. Très souvent aussi, quand ces données reflètent la performance de certains acteurs, donc une comparaison, la transparence entraîne une certaine pression, qui peut être considérée comme une bonne motivation d’amélioration. L’exemple de la réduction du nombre de cas de maladie nosocomiales en Grande-Bretagne est flagrant, si l’on suppose qu’elle est effectivement corrélée avec la sortie (peu avant) d’une plateforme web recensant les cas de ce genre de maladies dans les hôpitaux britanniques.

Agnès Verdier-Molinie

Pour chaque euro d’argent public dépensé, on a des comptes à rendre

« On » ici, c’est l’iFRAP, et plus généralement les acteurs des politiques publiques.

Georges Nahon

En 10 ans, le ticket d’entrée (capital à investir) pour une startup basée sur la data serait passé de 5 millions à 5 000 dollars ; les startups qui réussissent dans ce domaine sont par ailleurs plus souvent tournées vers le service B2B, plus demandeur et plus juteux en ce moment. Et il convient une fois encore d’appeler à l’amélioration de la qualité des données libérées, traitées, réutilisées, plus qu’à l’augmentation de leur nombre.

Bernard Benhamou, Daniel Dardailler et Jean-Marc Lazard

Les secteurs les plus porteurs pour la création d’applications ou services dans l'(open) data sont la m-santé (santé sur mobile) et les applications de maîtrise d’énergie, notamment par les object connectés (dont les capteurs).

La Maison Blanche commence par exemple à mettre à disposition des individus certaines de leurs informations personnelles (smart disclosure) concernant leur dossier médical (blue button) ou de consommation d’énergie (green button) : ces informations pourraient notamment être la base d’applications utiles à chacun.

Mais pour que cette libération de données s’accompagne d’applications efficaces, le problème du Big Data doit être résolu : comment recueillir et analyser autant de données de manière pertinente et rapide ? On connaît un échec aujourd’hui lors du passage à l’échelle des applications, à cause de la multiplication des capteurs et des utilisateurs créant toujours plus de données, et des données aux formats toujours plus divers.

Un autre problème subsiste : la mise en oeuvre du « droit au silence des puces » comme on l’appelle parfois, qui devrait selon M. Dardailler (directeur associé Europe W3C) prendre la forme d’un opt-in ; des puces inactives ou silencieuses par défaut, que l’utilisateur final pourrait ou non décider d’activer (le principe de précaution « à la Française »). Il manque selon lui une couche de « trust » dans les données libérées, d’un système de validation des données permettant un vrai développement de l’Open Data en France.

Quelques sites abordés durant la conférence / pour aller plus loin