Big Data – Grosses données

Extrait de la définition
le Big Data regroupe des données présentant une grande variété, arrivant en volumes croissants, à grande vitesse. C’est ce que l’on appelle les trois « V ».
Définition complète

Big Data - Grosses données
Afin de bien comprendre ce qu’est le Big Data, il est utile d’en connaître le contexte historique. En voici la définition de Gartner, qui date de 2001 (mais qui reste la définition de référence) : le Big Data regroupe des données présentant une grande variété, arrivant en volumes croissants, à grande vitesse. C’est ce que l’on appelle les trois « V ».

En d’autres termes, le Big Data est composé de jeux de données complexes, provenant essentiellement de nouvelles sources. Ces jeux de données sont si volumineux que les logiciels de traitement des données classiques sont incapables de les traiter. Ces volumes massifs de données permettent néanmoins de résoudre des problèmes commerciaux qui auraient été impossibles à aborder auparavant.
Les trois « V » du Big Data

Volume
La quantité de données a son importance. Le Big Data vous oblige à traiter d’énormes volumes de données non structurées de faible densité. Il peut s’agir de données de valeur inconnue, comme des flux de données Twitter, des flux de clics sur une page Internet ou une application mobile ou d’un appareil équipé d’un capteur. Pour certaines organisations, cela peut correspondre à des dizaines de téraoctets de données. Pour d’autres, il peut s’agir de centaines de pétaoctets.

Vitesse
La vitesse à laquelle les données sont reçues et éventuellement traitées. Normalement, les données haute vitesse sont transmises directement à la mémoire, plutôt que d’être écrites sur le disque. Certains produits intelligents accessibles via Internet opèrent en temps réel ou quasi réel et nécessitent une évaluation et une action en temps réel.

Variété
La variété fait allusion aux nombreux types de données disponibles. Les types de données traditionnels ont été structurés et trouvent naturellement leur place dans une base de données relationnelle. Avec l’augmentation du Big Data, les données ne sont pas nécessairement structurées. Les types de données non structurées et semi-structurées, telles que les données texte, audio et vidéo requièrent un prétraitement supplémentaire pour dégager du sens et prendre en charge les métadonnées.