Data, Data Viz, Open Data et Big Data, faisons le point !

Jeux de données

Journalistes, bloggeurs, politiciens, professionnels, sociologues…Ils en parlent un peu plus chaque jour.
Le phénomène Data perce en France depuis quelques années, mais reste un mystère pour beaucoup de nos concitoyens, quelques éclaircissements ne sont donc pas de trop.

D’abord, qu’est-ce que « la Data » à proprement parler ?

Les « datas », ou « données », sont disséminées dans nos systèmes, notamment sur le web, sans structure, sous des formes variées. Aujourd’hui, la capacité de comprendre ces données et d’en tirer une information utile est de plus en plus valorisée (notamment économiquement) et surtout rendu possible par la puissance de nos outils informatiques.

Par exemple, la collecte de données est la fonction même du code à barres. Le code à barre, ou « code-barre » est apparu en 1971, lorsque les fournisseurs et distributeurs, dont l’objectif était d’accélérer et d’améliorer le passage aux caisses ainsi que de collecter les données de vente afin de favoriser la disponibilité des produits et l’efficacité de promotions.

Les problèmes de la Data : le Big Data

Le développement des échanges électroniques, des cartes de fidélité, de la traçabilité et du couponing a contribué à l’augmentation des données, et, a donc permis d’accroitre des informations sur la vie des produits et le comportement des consommateurs. Potentiellement tout le monde peut créer des données ; entreprises, particuliers, administrations, par exemple par le partage de photos ou vidéos, les réseaux sociaux, les achats en ligne… Tous ces acteurs créent donc de plus en plus, et de plus en plus vite, des données qu’on peut avoir du mal à traiter ; on entend souvent, par exemple, que l’humanité génère actuellement en deux jours un volume de données équivalent à celui du total des données générées par l’humanité jusqu’en 2003.

En plus du volume des données, un problème de formats apparaît souvent : ces deux problèmes des données constituent ce qu’on appelle communément le Big Data. Le phénomène Big data est considéré comme l’un des grands défis informatiques de la décennie 2010-2020 : le stockage, le partage, l’analyse et la visualisation d’une grande quantité et diversité de données devront être réétudiés dans nos systèmes !

Les perspectives du traitement des Big Data sont énormes, notamment pour l’analyse d’opinions ou de tendances industrielles, ou bien la lutte contre la criminalité. Tim O’Reilly, auteur et fondateur – PDG de la célèbre maison d’édition O’Reilly, et, John Battelle, analyste et bloggeur, ont adroitement expliqué; « Les entreprises doivent apprendre à exploiter des données temps réel comme des signaux essentiels qui alimentent une boucle de rétroaction (retour du consommateur, NDLR) beaucoup plus efficace pour le développement de produits, le service à la clientèle, et l’allocation des ressources ».
Une vraie opportunité business pour les entreprises donc.

Les données illustrées : la Data Viz

Les données que l’on possède peuvent être extraites de diagrammes, graphiques ou cartographies, pour ensuite être converties, testées, nettoyées, complétées et, enfin, croisées pour être représentées par les Data Vizualisations, aussi appelées Data Viz.
Les Data Viz peuvent être rassemblées sous la forme de vidéos, de photos ou en infographies : consultez par exemple notre infographie sur Paris.

Il s’agit donc d’un outil de présentation, utilisé dans le but de convaincre, persuader et présenter des informations dune nouvelle manière.

L’Open Data :

L’Open Data c’est la libération des données publiques brutes au plus grand nombre. Aujourd’hui, il est possible de connaître la hauteur des trottoirs d’une ville, ou de trouver les tarifs des médecins à proximité de son domicile, leurs qualifications (tel est le but de l’application web Fourmi Santé).

On trouve d’autres utilisations à l’Open Data, telles que ;
la consultation des données, c’est à dire que, l’internaute accède directement à une donnée en ligne pour collecter une information dite « brute ».
l’application, lorsqu’un développeur va utiliser les données ouvertes pour construire et proposer un service, ou une application, afin d’améliorer notre quotidien (Par exemple l’application RATP qui traîte des positions géographiques des stations du réseau ferré).
la réutilisation spécialisée, prenons le cas d’une entreprise qui souhaite réévaluer son fichier clients en fonction de critères géographiques, son objectif est de mettre en relation les adresses postales de clients, ou prospects, à des coordonnées géographiques. Ainsi, elle atteindra la population souhaitée.

En bref, l’Open Data ne concerne que les données ouvertes, librement accessibles, contrôlées et réutilisables. Cela représente une source de réduction des coûts ainsi qu’un potentiel d’innovation encore inexploité.

En espérant que cet article ait éclairci les quelques points d’ombre persistants !
Pour plus d’infos, voici quelques sources :

Partagez cet article :

A propos de l'auteur

Sur le même sujet