L’ABC du Big Data

Le Big Data, c’est récolter, partager et analyser à grande échelle un trésor d’informations quotidiennes, à la fois précieuses et incroyablement volumineuses. Quelques concepts de base.

AIDC

AIDC est l’abréviation d’Automatic Identification and Data Capture, soit « identification automatique et capture de données ». C’est le terme général désignant toutes les technologies permettant de reconnaître automatiquement des personnes, des animaux et des produits sans intervention humaine, et de mettre ces informations à disposition dans des systèmes de gestion de données. Au lieu d’enregistrer manuellement les ventes par un clavier, il est par exemple possible de lire automatiquement les produits par des codes-barres, bandes magnétiques ou caméras.

Algorithme

Les algorithmes sont utilisés pour rechercher des informations dans des données brutes (voir aussi Datamining). Ce sont des séries d’instructions données dans un programme informatique, comme des indications sous la forme de questions (heuristique). Les algorithmes apportent de la structure dans les données : ils les classent et constituent des modèles et des patrons.

Cookie

Visiter un site web revient à demander à un navigateur (comme Firefox) de rechercher certaines informations sur un serveur. Un cookie est un morceau d’information conservé par le navigateur. Lors de la visite suivante sur le même site, ces informations seront également envoyées sur le serveur, qui pourra ainsi « se souvenir » de l’utilisateur. Les cookies sont notamment utilisés pour retenir les noms d’utilisateurs.

Datamining

Chaque minute, 1,7 milliard d’octets sont créés dans le monde numérique. Et cette quantité croît de jour en jour. Toutes ces données ne sont pas utiles. Le Datamining est le terme général désignant toutes les technologies qui recherchent des liens entre ces grandes quantités de données. Le filtrage de messages en fonction de certaines combinaisons de mots en fait notamment partie. Ces liens peuvent contribuer à la création de profils ou de modèles.

Embedded system

Un « système intégré » est un appareil dans lequel est intégré un logiciel, ce qui en fait un appareil « intelligent ». Le système se compose généralement d’un capteur capable de mesurer certains indicateurs et d’un élément à même de traiter l’information, comme une puce. Ses applications sont de plus en plus larges : pensez à la téléphonie mobile, aux pacemakers, aux distributeurs automatiques de billets, aux appareils de cuisine.

Trace

Cela fait longtemps que nous laissons des données derrière nous : lorsque nous effectuons un achat, lorsque nous souscrivons un emprunt, lorsque nous empruntons un livre. Depuis la révolution numérique, la quantité de données a explosé. Tout ce qui se fait sur internet laisse une trace : une adresse internet, l’appareil utilisé, le système d’exploitation, le site vers lequel vous surfez et le site duquel vous venez…

Internet des objets

Outre les ordinateurs manipulés par des êtres humains, un nombre croissant d’objets de la vie quotidienne et de machines sont connectés à internet. Ces appareils « intelligents » (voir Embedded systems) pourront échanger des données et prendre des décisions. Ainsi votre radioréveil connecté à votre système de navigation et à votre agenda numérique vous réveillera-t-il automatiquement plus tôt en cas d’embouteillage, afin que vous ne manquiez pas votre rendezvous.

Smart data

Les données ne sont utiles que si elles sont exploitées de manière intelligente. Collecter les données sur le comportement de personnes n’a de sens que si elles sont ensuite comparées à des données commerciales ou sociologiques. Les données « intelligentes » sont les informations utiles qui subsistent après le traitement et l’analyse de données brutes. Les données pertinentes, en d’autres termes. Comme l’identification des 10% de clients qui prennent à leur compte 80% du chiffre d’affaires d’une entreprise.

Analyse comportementale

Les données relatives au comportement des consommateurs fournissent des informations utiles aux entreprises. Les informations sur les habitudes et les préférences des clients permettent un marketing plus ciblé et adapté. Et ce marketing ciblé, adapté, accroît la rentabilité. Ainsi les supermarchés analysent-ils les produits qui sont souvent vendus ensemble et adaptent leurs promotions ou l’aménagement de leurs rayons.

20/12/2014