Vous êtes intéressé(e) par le domaine des données personnelles, de l'Open Data, du Big Data ou des Data Viz ? Devenez contributeur de notre blog !

Le Lexique

Retrouvez ici tous les termes techniques de l’Open Data et des data en général… et devenez savants !

 

Apache Hadoop

C’est une bibliothèque de logiciels libres utilisant un modèle de programmation simple qui permet le traitement d’un grand nombre de données (Big Data)

 

API

Interface de programmation permettant l’interaction de chaque programme les uns avec les autres, donnant alors la possibilité d’échanger des données. Ces API peuvent avoir différentes fonctions (ex : de connexions pour les bases de données ou annuaires, de gestion, d’analyse…)

 

La licence CC0 (Creative Commons Zéro)

Licence libre créée par l’organisation Creative Commons qui permet à celui détenant les droits d’auteur à renoncer à ceux-là dans la limite des lois applicables pour placer son œuvre au plus près du domaine public. Celle-ci concerne donc plus particulièrement ceux mettant à disposition du contenu. Elle autorise alors chacun à réutiliser librement ses travaux, et même à les modifier sans aucune restriction de droit, sauf celles imposées par la loi.

 

CKAN (Comprehensive Knowledge Archive Network)

Logiciel open source pour portail Open Data incluant une base de données qui offre la possibilité de mettre à disposition des données mais aussi de les stocker, les cataloguer, de les trouver et de les partager.

 

Cloud Computing

Accès à la demande et en libre-service à des ressources informatiques virtualisées et mutualisées. L’emplacement des données dans le nuage n’est pas porté à la connaissance des clients et les utilisateurs ou entreprises n’ont plus à gérer leurs serveurs informatiques mais peuvent toujours accéder à de nombreux services sans avoir à gérer l’infrastructure sous-jacente, souvent complexe, les applications et les données ne se trouvant plus sur l’ordinateur local, dans un « nuage » composé d’un certain nombre de serveurs distants interconnectés.

 

Crowdsourcing

Externalisation de masse : Données recueillies par tous sur la base du volontariat. Ex :openstreetmap
Data Visualisations

Ce ne sont pas des données mais des graphiques permettant de les interpréter. Elles sont souvent conçues à partir de données libérées soumises à une licence d’utilisation.

 

DSPL (DataSet Publishing Language)

Langage défini par Google de description de jeux de données qui structure ces jeux de données et permet de les visualiser grâce à Google Public Data Explorer.

 

Linked Data

En français web des données: publication de données structurées sur le web, reliant les silos de données entre eux permettant ainsi de constituer un réseau global d’informations. Cela permet aussi d’interroger automatiquement les données où qu’elles soient stockées.

 

Licence ouverte/open licence Etalab

Licence issue de la mission intergouvernementale française Etalab, elle vise à faciliter et à encourager la réutilisation et l’exploitation des données publiques mises à la disposition des citoyens gratuitement. Elle apporte ainsi la sécurité juridique nécessaire aux producteurs et réutilisateurs de ces données.

 

Licence Information Publique (IP)

Cette licence certifie la qualification juridique d’information publique au sens du droit français et permet de simplifier les conditions de réutilisation.

 

Licence APIE

Licence élaborée par l’Agence du patrimoine immatériel de l’État sous forme de conditions générales qui prône la réutilisation gratuite des informations publiques sans condition particulière, offrant ainsi plus de sécurité juridique aux réutilisateurs.

 

NoSQL

Désigne une catégorie de systèmes de gestion de bases de données (SGBD) destinés à manipuler des bases de données immenses provenant de sites internet très importants (Facebook, google, amazon…). Ces systèmes de gestion ont choisi d’abandonner certaines fonctionnalités classiques. Le terme NoSQL (Not Only SQL) a été utilisé pour la première fois en 1998, il est la combinaison de non et de SQL, ce qui laisserait penser que cette technologie s’oppose à SQL. En vérité, les fondateurs de ce langage ont probablement voulu dire « non-relationnel », mais ont choisi « non-sql » car il sonnerait mieux. Le mot est aujourd’hui utilisé comme terme générique pour tous les systèmes de gestion de bases de données et les logiciels de stockage de données qui ne suivent pas les principes classiques des SGBD relationnels.

 

La PDDL (Public Domain Dedication and Licence)

Licence de type domaine public permettant aux données d’être exploitées et reutilisées de façon libre.

 

Open Data App Framework (ODAP)

Le Cadre d’Application Open Data permet de créer des repères sur des cartes interactives grâce à la publication de jeux de données mis sous forme de data visualisations. Elle permet aussi à n’importe quel utilisateur de créer de nouveaux repères, de les noter et les commenter.

 

L’Open Database License (ODbL)

Issue de l’Open Knowledge Foundation, c’est une licence de base de données qui vise à favoriser la libre-circulation des données sur le web et qui permet à tous de pouvoir exploiter, modifier ou réutiliser publiquement ces bases de données.

 

ODC (Open Data Commons)

Trio de licences spécifiques aux bases de données. Il contient :

 

La ODC-BY (attribution licence for data/databases)

Cette licence autorise le partage de ces données, leur réutilisation et adaptation.

 

La ODC-ODbL (Open Database Licence Attribution Share-Alike for data/databases)

Licence autorisant aussi le partage, la création et la modification de ses bases de données. Il faut toujours indiquer les origines des bases de données: nom du producteur, lien vers le site source, date de la dernière mise à jour.

 

OGDI (Open Government Data Initiative)

Logiciel open source développé et distribué par Microsoft qui offre à un organisme public la possibilité de mettre en place un portail de mise à disposition de données ouvertes.

 

Open Data Protocol

Appelé aussi OData, c’est un protocole qui facilite la mise à disposition, le partage, la création et la consommation des données par le biais des réseaux d’entreprises et du web. Ses spécificités sont publiées sous licence OSP (Mirosoft Open Specification Promise) qui permet à de tierces parties (dont des projets Open Source) la possibilité de développer des services pour n’importe quelle plateforme.

 

Open Data Sets

Terme anglais faisant référence aux jeux de données rendus publiques par les administrations ou entreprises.

 

Open Source

Elle définit les conditions nécessaires pour qu’une licence soit considérée « libre » par l’Open Source Initiative, organisation dévouée à la promotion des logiciels Open Source. Toutes les conditions préalables ainsi que les licences approuvées sont disponibles sur le site de l’OSI.

 

SDMX

Abréviation de Statistical Data and Metadata eXchange, est une initiative technique visant à promouvoir les échanges de données et metadonnées statistiques.  SDMX a été reconnu comme norme ISO avec le statut de spécification technique (ISO/TS 17369. Depuis l’initialisation de cette spécification, de nombreux outils, applications ou logiciels de gestion ont vu le jour. Par exemple, les outils en sources libres développés par EUROSTAT et l’Union Européenne. Le site officiel du SDMX se trouve ici.

 

Silos de Données

Données relatives aux clients qui sont obtenues sur différents canaux non unifiés. Elles nuisent généralement à la qualité de la relation client et à l’efficacité des campagnes marketing. Par exemple, au niveau d’un point de vente physique, il n’est souvent pas possible d’avoir accès aux achats réalisés sur Internet par un client.

Partagez cet article :

Laissez un commentaire !