Commençons déjà par sa traduction : en français, ça donne « données volumineuses ». Bon. Passons ensuite à sa définition. Selon le Larousse, le Big Data est un « domaine technologique dédié à l’analyse de très grands volumes de données informatiques (petaoctets), issus d'une grande variété de sources, tels que les moteurs de recherche et les réseaux sociaux ».
Vous vous dites sûrement : je connaissais les octets, les mégaoctets, et même les giga-octets, mais les pétaoctets !? Un pétaoctet (Po) représente modestement 1 million de milliards d’octets ! Pour vous faire une idée, 2 Po équivalent aux fonds de toutes les bibliothèques universitaires des États-Unis, et 8 Po, à l’ensemble des données disponibles sur le Web.
Autrement dit, le Big Data correspond à l’explosion des données numériques ! Nous sommes près de 8 milliards sur terre*, alors imaginez le volume de données que nous produisons chaque jour ! Photos, vidéos, likes sur les réseaux, horaires d’avions, géolocalisation… il en existe des trillions !
Mais le Big Data ne se limite pas qu’à la création et la diffusion de ces données…
Il désigne aussi le développement de technologies capables de les traiter afin d’en extraire des corrélations ou du sens. Un défi technologique de taille : celui de capturer, stocker, partager, analyser ou encore protéger toutes ces données. Et vous imaginez bien qu’avec cette quantité, il faut bien plus d’un disque dur et d’un chercheur pour le relever !
* Pssst ! Si vous voulez le compte exact, vous pouvez passer un peu de temps ici : https://www.worldometers.info/fr/