Big data ou le sens de la vie

Dans le roman de science-fiction « The Hitchhiker’s Guide to the Galaxy », l’histoire des origines du monde est racontée ainsi : il était une fois une race hyper-intelligente qui construisit un ordinateur chargé de calculer la réponse à la question ultime de la vie, de l’univers et de tout le reste (Life, the Universe and Everything).

L’ordinateur mit sept millions et demi d’années à trouver une réponse qui laissa les chercheurs perplexes :

-«C’est tout ce que t’as à nous montrer au bout de sept millions et demi d’années de boulot ?

- J’ai vérifié très soigneusement, répondit l’ordinateur, et c’est incontestablement la réponse exacte. Je crois que le problème, pour être tout à fait franc avec vous, est que vous n’avez jamais vraiment su quelle était la question. »[1]

(On construisit alors un deuxième ordinateur plus puissant pour trouver la question. Cet ordinateur s’appelait la Terre, et, en raison de sa taille et des composantes biologiques qui le constituaient, il était souvent confondu avec une planète. Il mit dix millions d’années pour calculer la question. L’histoire se termine mal pour l’ordinateur et pour ses composantes biologiques, mais il faut lire la trilogie en cinq volumes pour en connaître tous les détails.)

Données volumineuses au menu : indigestion en vue ?

Douglas Adams, l’auteur du Hitchhiker’s Guide to the Galaxy a écrit son livre en 1979.  À l’époque, il n’aurait sans doute jamais pu imaginer sur quelles avenues la recherche des questions fondamentales allait mener l’humanité.

(La réponse à la mystérieuse question ? Tapez « the answer to life, the universe and everything” dans Google pour la découvrir. Et vous n’attendrez pas sept millions et demi d’années, mais 0,28 secondes. On n’arrête pas le progrès.)

L’une de ces avenues, le buzz word de 2012, c’est le Big Data, (ou Big Data, comme l’appellent nos amis les Français.)

L’édition 2012 de La Boule de cristal étant inscrite sous la thématique « Quand tout devient données ! », vous vous doutez bien que diverses conférences aborderont la question sous l’angle du Big Data.

Mais qu’est-ce que le Big Data ? Et y a-t-il une traduction française dans la salle ? L’Office québécois de la langue française propose « données volumineuses », mais ça ne reflète vraiment pas bien, à mon sens, la phénoménalisation de ce concept. Big Data, ce sera, pour les besoins de ce billet.

La définition généralement reconnue est assez simple. Celle-ci, donnée par Edd Dumbill sur O’Reilly Radar en ouverture d’un dossier très complet sur la question, est claire :

Big data is data that exceeds the processing capacity of conventional database systems. The data is too big, moves too fast, or doesn’t fit the strictures of your database architectures. To gain value from this data, you must choose an alternative way to process it.

Big Data est BIG, big comme dans yotta

La  clé, dans cette définition, c’est tout ce qui est contenu dans la dernière phrase : « To gain value from this data… ». Pour extraire de la valeur du Big Data, il faut trouver la bonne avenue.

L’important, ce n’est pas la réponse, mais le chemin qui y mène.

Pour peu qu’on se fie à la littérature récente sur le sujet, Big Data est en passe de devenir un phénomène porteur de promesses immenses, instrument d’une révolution en devenir, porte d’entrée de notre société dans une nouvelle ère.

Tel que vu par des médias aussi divers que le McKinsey Quarterly et les revues Scientific American et Forbes, le phénomène est matière à de volumineux dossiers spéciaux.

 

Sources :

The Age of Big Data, The New York Times

Are You Ready for the Age of Big Data, McKinsey Quarterly

The Big Data Boom is the Innovation Story of our Time, The Atlantic

Big Data, Big Impact: New Possibilities for International Development, The World Economic Forum

Big Data: The Only Business Model that Tech has Left, Forbes

En introduction de chacun de ces articles, on utilise ces chiffres aux préfixes composés de noms anciens (giga, téra, péta, exa, zetta, yotta) et d’images fortes (où la Bibliothèque du Congrès américaine, est abondamment utilisée comme unité de mesure) pour rendre compte de l’incommensurable immensité du Big Data et de ses potentialités.

Quelques-uns de ces chiffres et images :

  • Au sein de 15 des 17 secteurs de l’économie américaine, les compagnies avec plus de 1000 employés emmagasinent en moyenne plus de 235 téraoctets de données, davantage que dans la Bibliothèque du Congrès des États-Unis (qui contiendrait, mais ce n’est pas confirmé par les responsables, 10 téraoctets de données textuelles non compressées). McKinsey Quarterly
  • En 2012, le volume de données produites devrait atteindre un niveau vertigineux de l’ordre de 2,7 zettaoctets (2,7 x 1021). Forbes
  • Selon la compagnie IDC (The Premier Global Market Intelligence Firm, citée dans plusieurs des articles mentionnés plus haut), d’ici à 2015, le monde aura généré et entreposé 8 000 exaoctets d’information numérique et d’ici la fin de la décennie, ce volume devrait avoir atteint 80 000 exaoctets.
  • Toujours selon IDC, le marché du Big Data devrait atteindre 16,9 milliards de $ d’ici à 2015.

Qui produit les données volumineuses? En grande majorité, elles seraient le fait, à 75%  selon IDC, de nous, les connectés, qui les lançons dans l’espace numérique via les médias sociaux, nos transmissions de vidéo et de photos en ligne, les signaux GPS de nos téléphones cellulaires, nos achats en ligne, etc. 80% de ces données transiteraient, à un moment ou un autre de leur existence, par les entreprises qui captent des billions d’informations provenant de leurs clients, de leurs fournisseurs et de leurs opérations. Des millions de capteurs sans fil, installés dans les objets du quotidien, créent et émettent d’autres données. Finalement, Big Data est une bête qui se nourrit de ses propres déjections : « The wealth of new data, in turn accelerates advances in computing – a virtuous circle of Big Data. » (The Age of Big Data, The New York Times)

Big Data : Eldorado ou Océania (la patrie de Big Brother)?

Rick Smolan, un photographe américain producteur de projets collectifs (America at Home, 24h in Cyberspace) qui marient la technologie, la photographie et l’internet pour produire des instantanés de la vie privée et intime de l’Amérique, a lancé fin 2011 le projet « The Human Face of Big Data ».  L’objectif est d’imaginer et de lancer des projets qui tireraient profit du potentiel du Big Data pour transformer le monde. Sa vision de ce potentiel est très optimiste :

Big Data has the potential to cure disease, provide a healthier life for our children, enable us to spend less time in traffic, alert us to tiny changes in our health weeks or years before we develop a life-threatening illness, give our seniors more independence while keeping them safe, and help us make better use of precious resources like water.

The premise of our new project is that Big Data is quickly evolving into one of humanity’s most powerful tools in addressing some of the biggest challenges facing the planet.

Pour le chercheur en sciences sociales Gary King, directeur de l’Institute for Quantitative Social Science de l’Université Harvard, cité dans le New York Times, c’est une révolution : « … the march of quantification, made possible by enormous new sources of data, will sweep through academia, business and government. »

Dirk Helbing, un physicien détenteur de la Sociology Chair, in Particular of Modeling and Simulation de l’École polytechnique fédérale de Zurich, croit pour sa part que Big Data pourrait devenir la boule de cristal du monde et il a déposé un projet d’un milliards d’euro à la Commission européenne pour la construire. Le projet s’appelle FuturICT Knowledge Accelerator and Crisis Relief System. Le cœur de ce système est le Living Earth Simulator, un simulateur qui ne construirait pas le modèle d’un seul secteur de notre monde – le monde financier ou l’environnement par exemple, mais les intégreraient tous simultanément dans un système à l’échelle mondiale en utilisant les flots de données du Big Data, des algorithmes sophistiqués et toute la quincaillerie possible. Ce système est un exemple parmi plusieurs des ambitieuses applications en développement autour du Big Data.

Pour des scientifiques cités dans l’article du Scientific American qui raconte le projet du professeur Helbing, le  Big Data c’est une avancée technologique aussi importante que l’invention du microscope et du télescope, une fenêtre ouverte sur une autre façon de voir le monde.

Du point de vue  de l’entreprise, exprimé dans le McKinsey Quarterly par exemple, Big Data deviendra, à terme, un puissant actif garant de la compétitivité des compagnies qui sauront tirer leur épingle du jeu et exploiter cet or virtuel. Alistair Croll  parle d’une Feedback Economy Big Data, qui, conjuguée à un processus d’optimisation continue et à la conversion de tout en données, pave la voie à quelque chose de plus grand et de beaucoup plus important que la simple efficacité organisationnelle.  Alistair donnera à La Boule de cristal une keynote intitulée « Big Data, towards the quantified society » dans laquelle il se propose de répondre à ces questions : Can we optimize the way we live, learn, work, and play through data? Is tomorrow a happy utopia where everyone achieves their potential—or is Big Data really Big Brother, making us slaves to feedback?

Questions très pertinentes. Le phénomène Big Data fait certes miroiter des lendemains qui chantent, mais des lendemains où plane l’ombre d’un Big Brother qui se serait adjoint les services d’apprentis sorciers.

Pour tout savoir sur le Big Data, suivez l’itinéraire Big Data de la Boule de cristal :

On commence par la salle 3 à 8h30 : La révolution des données sociales avec Claude G. Théorêt

On se précipite à la salle 2 à 9h20,  pour écouter Christine Connors : Getting started with Unstructured Data

Après une pause méritée, direction salle 1 à 10h30:Défi Big Data : Au-delà de gérer un large volume de données avec Philippe Nieuwbourg

On ne bouge pas de la salle 1 et Thierry Hubert vient, à 11h30, parler de consommation :  Consuming Big Data in the Age of Information Overload 

Et en après-midi on écoute, avant la keynote d’Alistair Croll à 16h30, celle de Gordon Bell à 13h30:
Big Data: Lifelogging, The Fourth Paradigm of Science, and Sensor-Effectors for the Control of Everything

Dans un prochain billet j’aborderai les limites et les risques du Big Data, le danger à accepter tous les postulats et parti-pris au pied de la lettre, les limites causées par les réglementations différentes selon les États, les impacts d’une walmartisation éventuelle des données sur la fracture numérique entre individus, universités et entreprises.

 

 



[1] The Hitchhikers Guide to the Galaxy (Le Guide du voyageur galactique, page 233)

Publié dans : Big Data, Web

Un commentaire

  1. Liliane Tremblay dit:

    Excellent article et j’aime beaucoup les propositions d’ateliers!!

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>