Le pouvoir du mental

D’ici à 2017, la lecture des pensées ne sera plus une fantaisie. C’est ce que prédit IBM dans sa liste « Five in Five »  présentant les cinq innovations majeures qui devraient se produire dans les cinq prochaines années.

En fait, cette accroche est un peu trompeuse. Pour IBM, il n’est pas vraiment question de lire les pensées, mais plutôt de contrôler des appareils par la pensée, de ne plus utiliser nos doigts pour des actions simples comme appeler au téléphone, déplacer un curseur sur l’écran, ou taper un texte. Et, éventuellement, grâce à un jeu complexe de décodage des expressions faciales, des niveaux de stress, d’excitation ou de concentration, de comprendre les pensées des autres, à défaut de les lire.

L’humain et la technologie : un mariage naturel?

Douglas Coupland, cet écrivain canadien passionné par la rencontre de la culture et de la technologie et à qui l’on doit l’expression Génération X, dit de la technologie qu’elle ne nous a pas été transmise par des extraterrestres, que nous l’avons inventée nous-mêmes. En conséquence, la technologie ne peut pas être aliénante, elle ne peut être que l’expression de notre humanité. (“Aliens didn’t come down to Earth and give us technology,” (…). “We invented it ourselves. Therefore it can never be alienating; it can only be an expression of our humanity.” The New York Times Sunday Book Review, 9 mars 2012)

Voilà tout à la fois une brillante façon d’illustrer notre relation à la technologie –  celle-ci n’est pas extrinsèque à notre humanité, mais produit de celle-ci, et un avertissement quant à ses limites, notre humanité étant capable du pire, comme du meilleur.

Pour peu qu’on s’intéresse aux recherches et prédictions en ce sens, les possibilités de la fusion humain/machine semblent infinies. Il y a d’ailleurs, sous forme de prototypes dans la plupart des cas, une variété intéressante d’expériences en cours.

Celle-ci, conduite par une équipe de neuroscientifiques de l’Université de Berkeley en Californie produit des résultats assez spectaculaires. En utilisant l’imagerie par résonance magnétique fonctionnelle et des modèles informatiques, l’équipe a réussi à décoder et à reconstituer les expériences visuelles d’individus – le visionnement de bandes-annonces de films hollywoodiens dans ce cas.

Image de prévisualisation YouTube

Bon, si on se donne la peine de lire la méthodologie de la recherche, on comprend que ce résultat n’a pas été obtenu en connectant simplement un cerveau à un bidule qui en reproduirait ensuite l’imagerie.  Il a fallu passablement de programmation, de recherche et de codage pour en arriver là (entre autres, la constitution d’un catalogue de 5 000 heures de vidéo prises au hasard sur YouTube). Le mental est fort, mais il a quand même besoin de toute l’aide que la technologie peut lui fournir.

Les objectifs poursuivis par le professeur Jack Gallant et son équipe : reconstituer une image mentale interne, ouvrir une fenêtre sur le cinéma dans notre tête, filmer nos rêves, pourquoi pas. Plus prosaïquement, la technologie pourrait permettre de mieux comprendre ce qui se passe dans le cerveau des personnes qui ont perdu la faculté de communiquer, comme les victimes d’attaques cérébrales ou les personnes dans le coma. Ultimement, ces recherches pourraient jeter les bases de véritables interfaces cerveau-machine qui permettraient à des grands paralysés d’opérer des ordinateurs avec leur cerveau.

Un vélo contrôlé par le cerveau

Dans un autre registre, Toyota Prius et Parlee Cycles, un fabricant de vélos de course, ont fait équipe pour la construction d’un vélo qui change de vitesse sous l’impulsion du cerveau du cycliste.

Image de prévisualisation YouTube

Un élément intéressant de cette expérience : rien n’a été créé spécialement pour ce vélo, toute la technologie utilisée existait déjà. Ce qui est nouveau, c’est la façon dont diverses nouvelles technologies ont été amalgamées  pour produire un résultat inédit.

Comment résister à un chat  (même s’il ne s’agit que de ses oreilles) ?

Image de prévisualisation YouTube

Vous avez peut-être déjà entendu parler de ces oreilles de chat qui bougent au rythme de nos émotions. Necomimi (oreilles de chat en japonais), de la compagnie japonaise Neurowear, est produit par une compagnie japonaise qui se targue de faire ainsi du « corps augmenté », un appareil capable de prolonger notre cerveau et de présenter nos émotions. En fait, les émotions que ces oreilles traduisent sont plutôt basiques : elles se dressent quand on est concentrés et s’inclinent quand on relaxe. On annonce leur mise en marché pour le printemps 2012.

Des machines qui veulent notre bien

Plus près de nous, à Toronto, la compagnie InterAxon s’affaire à développer des applications et technologies informatiques centrées sur les  interfaces cerveau-machine.

Ariel Garten, la présidente d’InterAxion, sera à la 9ième édition de la Boule de cristal pour expliquer comment les technologies contrôlées par le cerveau représentent la prochaine étape logique de notre interaction avec le contenu numérique. Selon elle, on peut, par exemple, imaginer un avenir proche où les machines seraient en mesure de décoder nos émotions et de nous proposer des contenus qui y répondent, une manière de smart TV  avant la lettre.

C’est certainement une proposition intrigante. Je me demande bien dans quel état d’esprit je devrais être, par exemple, pour que mon téléviseur me propose The Walking Dead, une série de télévision terrifiante, dont je suis fan, dans laquelle un petit groupe de personnes tente de survivre dans un monde apocalyptique envahi par les zombis.

Publié dans : Uncategorized

Lifelogging : supplément numérique pour la mémoire

L’un des nombreux avantages de CONNECT 2012, c’est de donner l’occasion de découvrir des conférenciers de calibre international sous plusieurs facettes. Par exemple, Gordon Bell, chercheur principal chez Microsoft, qui donnera deux conférences keynotes, l’une à webcom et l’autre à La Boule de cristal

Gordon Bell, un pionnier de l’industrie des nouvelles technologies, travaille chez Microsoft  où il explore l’infonuagique et le lifelogging dans le cadre du programme de recherche MyLifeBits mené avec son collègue Jim Gemmell. Le lifelogging, c’est l’art de saisir les données de la vie quotidienne – les images, les sons, les activités, les documents, les conversations, les pensées même, et de les entreposer numériquement.

Le lifelogging : une e-mémoire à disposition en permanence

L’objectif principal de MyLifeBits, écrit Gordon Bell dans Total Recall, un compte rendu de leur expérience (traduit en français chez Flammarion), c’est d’accomplir les ambitions du Memex de Vannevar Bush, l’auteur de As we may think (« Tel que nous pourrions penser »), considéré par plusieurs comme le texte fondateur du cyberespace et une ébauche des fondements théoriques de l’hypertexte.

Dans ce texte écrit en 1945, Vannevar Bush, alors conseiller scientifique de Roosevelt et directeur du Bureau fédéral de la recherche et du développement scientifique, imaginait ainsi le Memex : « un appareil de l’avenir à usage individuel, une sorte de classeur et de bibliothèque personnels et mécaniques (…) un appareil dans lequel une personne stocke tous ses livres, ses archives et sa correspondance, et qui est mécanisé de façon à permettre la consultation à une vitesse énorme et avec une grande souplesse. Il s’agit d’un supplément agrandi et intime de sa mémoire. »

« Imaginons », ajoute Vannevar Bush, « un scientifique dans son laboratoire. Ses mains sont libres et il n’est rattaché à rien. Imaginons que tout en se déplaçant et en observant, il photographie et commente. Que s’il se déplace sur le terrain, il reste connecté par radio à son appareil enregistreur. Que quand il révise ses notes dans la soirée, il ajoute des commentaires dans le dossier et tout ce qu’il a produit – ses notes, ses commentaires, ses photographies sont miniaturisés afin qu’il puisse les projeter pour les examiner. »

Cette vision, très en avance sur son temps (rappelez-vous, ENIAC, le premier ordinateur entièrement électronique, a été créé en 1946) c’est un peu ce que le doctorant Pranav Mistry du MIT Media Lab a réussi à concrétiser avec le projet SixthSense.  L’objectif de SixthSense c’est d’aider l’humain à développer un sixième sens qui lui donnerait un accès continu et facile à toute l’information pertinente sur les objets et les personnes rencontrées, à la Minority Report.

« SixthSense », écrit Gordon Bell dans Total Recall,  « illustre à merveille le climat technologique dans lequel Total Recall nous fera baigner : l’enregistrement en continu grâce un appareil photo portable et votre e-mémoire à disposition en permanence et sur n’importe quelle surface ».

On peut construire son propre dispositif SixthSense : c’est un projet open source, monté avec des gadgets électroniques disponibles pour environ 350$ dans un magasin près de chez vous.

(Cliquer ici pour voir une présentation que Pranav Mistry a faite de son invention à TED.)

Le lifeblogging ou comment déjouer Big Brother à son propre jeu

Hasan Elahi, lui, pratique le lifeblogging. Hasan, un artiste qui explore les frontières de la surveillance et de la sousveillance (l’enregistrement d’une activité du point de vue d’une personne qui y est impliquée), s’est retrouvé par erreur sur la liste américaine des terroristes à surveiller. Après quelques détentions préventives et plusieurs tests de détecteurs de mensonges, le FBI finit par reconnaître son erreur. L’agence locale lui conseilla de les aviser chaque fois qu’il se déplaçait – ce qu’il fait fréquemment pour participer à des expositions de ses œuvres et participer à des conférences – afin d’éviter qu’il ne tombe sur une agence locale qui n’aurait pas reçu la note de service au sujet de son retrait de la liste.

Ce qu’il fit, d’abord au téléphone, puis par courriel, puis en se mettant à enregistrer pratiquement tout ce qui lui arrive sous forme de photographies avec indications d’heures et de lieu. Son site de suivi donne une image de l’endroit précis où Hasan se trouve à chaque instant.

Dans une entrevue qu’il accordait au magazine Wired, Hasan Elahi explique que puisque tout révéler sur ses déplacements lui permettait d’éviter d’être faussement soupçonné, une idée s’imposa à lui : s’ouvrir totalement pourrait devenir la meilleure façon de protéger sa vie privée, dans la mesure où c’est lui qui contrôle ce qui est en ligne.  « C’est une question économique, dit-il, j’inonde le marché ». Son objectif : qu’un jour il y ait tellement de personnes qui pellètent  leurs données personnelles en ligne que Big Brother devra fermer boutique.

(Hasan a présenté son lifeblogging à TED.)

L’enfer c’est les données ouvertes

Pour sa part, Gordon Bell ne veut pas voir le lifelogging se transformer en lifeblogging : «Si cela ne tenait qu’à moi, écrit-il dans son livre, Total Recall ne quitterait pas la sphère privée. Le cryptage serait une pratique privée, les e-souvenirs seraient entreposés dans des « banques suisses » de données et leur partage se ferait au compte-gouttes (…) opter pour la divulgation intégrale de toutes nos données, crier sur tous les toits nos faits et gestes les plus secrets, ce serait l’enfer. »

La nuance est importante, le lifelogging, c’est avoir toute sa vie accessible en un clic – comme le dit le slogan en couverture de la version française du livre de Gordon Bell, mais ce n’est pas la dévoiler à tout venant.

Si cette question de la protection de la vie privée à l’ère du Big Data vous préoccupe, vous ne voudrez pas manquer la conférence que Charles Nouyrit, fondateur et CEO de MyID.is Certified, donnera à la Boule de cristal à 16 h 00 : Protection de la vie privée et Big Data, compatibilité ou non ?

Mise-à-jour: Nadia Seraiocco, qui sera l’une des blogueuses officielles de Connect 2012, a eu une conversation très intéressante avec Gordon Bell au sujet de MyLifeBits et elle en rend compte sur Triplex, le blogue techno de Radio-Canada.

Publié dans : Conférenciers

La beauté des données

Le Big Data, cette nouvelle vedette du monde technologique dont je vous ai entretenu dans les billets précédents, a un petit cousin qui le rejoint en popularité : la visualisation des données.

Si les données sont le nouveau pétrole – une ressource naturelle qui peut être transformée en marchandise, vendue pour un profit et utilisée pour faire avancer la société – la visualisation est sa raffinerie et sa station d’essence tout à la fois, nous dit Julie Steele de O’Reilly Media pour présenter la conférence qu’elle va donner à ce sujet à La Boule de cristal.

Ou, pour utiliser une image plus « environnementalement » correcte, la visualisation des données, c’est l’art de faire fleurir les données invisibles, comme autant de bourgeons cachés  qui éclatent à la suite d’un changement dans leur environnement.

David McCandless, le designer et auteur anglais qui tient le blogue Information is beautiful, le dit dans cette conférence TED, la visualisation peut contribuer à guérir du mal du siècle, l’overdose d’information. La visualisation d’information, c’est une autre manière de faire de la curation d’information, de la mettre en contexte, d’en faire émerger sens et patterns et de la mettre en forme pour faire ressortir ce qui est important ou encore raconter une histoire. Et si ces objectifs ne sont pas atteints, on aura au moins produit quelque chose de beau, ajoute-t-il !

La matière organique qui permet de composer les visualisations, ce sont les Big Data, ces données volumineuses produites par téra volume chaque jour par les interactions, sur le web et les médias sociaux, entre les humains entre eux, les humains avec les machines, les machines avec les machines. Plusieurs de ces données sont enfermées dans les coffres-forts des entreprises qui les récoltent, mais un bon nombre sont accessibles gratuitement. Dirk Helbing, le professeur de l’École polytechnique fédérale de Zurich, qui construit le Living Earth Simulator dont j’ai parlé dans le premier billet sur le Big Data, a publié une liste de 70 bases de données et applications reproduite ici par le magazine Technology Review du MIT. On y retrouve des sites d’archivage de l’internet comme la Wayback machine, des sites d’extraction de données comme Google Trends, des sites de partage de données sociales (Linked Data, par exemple), etc.

La plus ludique d’entre toutes à mon sens : l’application We feel fine, une base de données qui permet de visualiser les sentiments exprimés à chaque seconde partout dans le monde sur les médias sociaux. Les créateurs ont des prétentions mondiales – an exploration of human emotion on a global scale, disent-ils –  mais comme les sentiments exprimés ne sont qu’en anglais, c’est un peu de surenchère. Cela dit, cette visualisation en mouvement, en temps réel et interactive demeure fascinante.

La visualisation des données : des formes, mais également des fonctions

Les applications visuelles des Big Data peuvent revêtir plusieurs formes. Elles peuvent également remplir certaines fonctions.

Deux fonctions particulièrement intéressantes :

  • Le journalisme de données (data journalism) qui s’appuie sur la visualisation des données pour présenter le résultat de ses enquêtes basée en grande partie sur l’analyse de grands volumes de données. Le pionnier de la présence en ligne parmi les médias traditionnels, le journal londonien The Guardian, y consacre une section complète de son site, le Datastore.
  • L’utilisation de la visualisation pourrait révolutionner les interfaces utilisateurs dans le monde des tablettes électroniques.  L’application pour iPad Planetary, en apparence une autre app frivole pour la musique, recèlerait ce potentiel. Cette application, qui permet de visualiser une librairie musicale comme si elle était le système solaire (les artistes sont des étoiles, leurs albums des planètes dont les satellites sont les pistes musicales) n’est pas contrôlée par les traditionnelles interfaces graphiques que sont les boutons et les barres de défilement par exemple, mais par la visualisation même.  Planetary transforme des ensembles de données en objets tactiles et dynamiques. (C’est l’explication que Ben Ceverny, le créateur de l’application, donne pour le nom de sa compagnie, Bloom, qui m’a inspiré la métaphore horticole du début : we’ll make the invisible data visible. We’ll make it bloom.)

Planetary a soulevé un fort mouvement d’enthousiasme sur les blogues spécialisés au moment de son lancement, en mai 2011. Elle est disponible sur le App Store. Aux dernières nouvelles, on attend toujours de voir des signes de son potentiel transformatif.

Les formes que peuvent prendre les visualisations, quant à elles, couvrent un très large spectre, qui va du plus sérieux au plus frivole. Quelques exemples :

  • Wind Map, une carte dynamique et en temps réel des vents qui balaient les États-Unis créée par les leaders du projet “Big Picture” de Google, un groupe de recherche en visualisation, qui combinent sur leur site personnel, Hint, des visions artistiques et technologiques de la visualisation des données.

  • Color Forecast, une application développée pour la marque de prêt-à-porter française Pimkie montre en temps réel les couleurs les plus portées par les gens de la rue à Paris, Milan et Antwerp.

 

Information inutile, mais jolie : les couleurs populaires dans les rues de Milan au cours de la semaine 22 avril 2012.

Malgré cette apparente frivolité, la visualisation d’ensemble de données – bien exécutée – est une autre avancée technologique importante, sinon pour l’avenir de l’humanité, du moins pour celui de l’acquisition de savoirs et de connaissance. C’est ce que Julie Steele viendra expliquer et démontrer le 15 mai prochain, dans le cadre de la Boule de Cristal, Julie Steele.  

Mise à jour de l’itinéraire Big Data.

Deux nouvelles conférences :

 Et les autres conférences Big Data 

Salle 3 à 8h30 : La révolution des données sociales avec Claude G. Théorêt.

Salle 2 à 9h20,  avec Christine Connors : Getting started with Unstructured Data, puis

Salle 1 à 10h30 avec Philippe Nieuwbourg Défi Big Data : Au-delà de gérer un large volume de données

Salle 1 à 11h30 avec  Thierry Hubert:  Consuming Big Data in the Age of Information Overload

Publié dans : Big Data

Big Data 2 : risques et limites

Le Big Data pourrait devenir la boule de cristal de l’humanité, mais Big Brother et ses apprentis sorciers rôdent dans les coulisses. Le phénomène Big Data comporte sa part de limites, de problèmes d’éthique et de risques qui ne peuvent pas être ignorés.

danah boyd chercheure principale chez Microsoft, assistante-professeure à la New York University et chercheure au Berkman Center for Internet and Society d’Harvard,  spécialiste reconnue de la recherche en médias sociaux, et sa collègue Kate Crawford de l’Université de New South Wales ont présenté récemment, dans un article très fouillé (traduit en français par le site français InternActu.net) les écueils sur lesquels les promesses du Big Data risquent de s’échouer. Comme elles le précisent en introduction : « La manière dont nous nous engageons dans l’ère des Big Data est cruciale : alors qu’elle s’installe dans un environnement d’incertitudes et de changements rapides, les décisions prises aujourd’hui auront un impact considérable dans le futur. »

La montée du Big Data amène aussi de grandes responsabilités

Et, disent-elles, il est temps de se pencher sur celles-ci. Ce questionnement les amène à lancer six « provocations », six défis au Big Data :

1. Il ne faut pas laisser les chiffres s’exprimer seuls

En 2008,  Chris Anderson, le rédacteur en chef de Wired, déclarait que si l’on a assez de données, les chiffres parlent d’eux-mêmes.

Non, répondent-elles, on ne peut pas laisser les chiffres s’exprimer seuls. Il faut tenir compte du fait que les outils spécialisés du Big Data contiennent, pour la plupart, leurs propres limites et restrictions, ce qui a une incidence sur le sens qu’on peut en extraire. Ainsi, une grande partie des Big Data est issue de sources qui ont des fonctions de recherche et d’archivage rudimentaires, comme Facebook et Twitter, ce qui les coupe de tout contexte historique.

2. L’objectivité et la précision sont un mythe

Un mythe, parce que, expliquent-elles, « un modèle peut avoir l’air mathématiquement solide, une expérience peut sembler valide, mais dès lors que le chercheur tente d’en saisir le sens, le processus d’interprétation a commencé. Les décisions de conception, qui déterminent ce qui sera mesuré, découlent elles aussi d’un processus interprétatif. »

Il faut ajouter à cela  le problème des erreurs dans les données elles-mêmes, souvent peu fiables, à la merci des pannes ou des pertes, et qui se retrouvent décuplées quand on croise de multiples jeux de données.

 3. Plus gros ne veut pas nécessairement dire meilleur

Twitter en est la meilleure illustration. En dépit des raccourcis qu’on voit souvent dans les médias, « abonné Twitter » n’est pas synonyme de « tout le monde », pas davantage que la population qui utilise Twitter n’est représentative de la population en général. Le nombre de comptes sur Twitter n’est pas non plus équivalent au nombre d’humains qui l’utilisent puisque certains ont ouvert plusieurs comptes, d’autres en partagent un et même les chats et les chiens sont des utilisateurs.

4. Toutes les données ne pas égales

Les données, extraites de leur contexte, perdent leur sens et leur valeur. Il ne faut jamais perdre de vue l’importance du contexte :

 « De fascinantes analyses de réseaux peuvent être réalisées à partir de ces réseaux articulés et comportementaux. Mais il existe un risque, à l’ère des Big Data, de traiter chaque connexion comme équivalente à toutes les autres, de confondre la fréquence des contacts avec la force des relations, et de croire qu’une absence de connexion indique qu’une relation devrait être établie. Les données ne sont pas génériques. Il y a certes un intérêt à analyser des données abstraites, mais le contexte demeure crucial. »

5. Ce n’est pas parce qu’elles sont accessibles qu’il est nécessairement éthique de les utiliser

Cette histoire, publiée dans le New York Times du 12 février dernier a fait frémir les défenseurs de la protection de la vie privée.

Bien que l’article porte davantage sur les sciences de l’étude du comportement humain et la formation des habitudes, le Big Data, on s’en doute, y joue un rôle important. Le détaillant Target a développé un programme qui analyse des masses de données sur le comportement de ses clients, ce qui lui a permis d’identifier les produits les plus susceptibles d’être achetés par une femme enceinte. L’analyse de Target est tellement sophistiquée que l’entreprise est même en mesure de deviner, avec une très petite marge d’erreur, la date de l’accouchement. Ce qui a donné lieu à la situation embarrassante souvent citée en lien avec cet article : le père d’une adolescente, se plaignant à Target que le commerçant semblait vouloir inciter sa fille à tomber enceinte en l’inondant de coupons de produits pour bébés, appris, mais un peu tard, que sa fille était bel et bien enceinte.

Les utilisateurs des médias sociaux sèment des données personnelles à tout vent, mais cela ne veut pas dire qu’ils sont d’accord pour qu’elles soient utilisées. On ne peut pas présumer que le fait de mettre un contenu en ligne signifie qu’on autorise son exploitation dans n’importe quel contexte

6. L’accès limité aux Big Data crée de nouvelles fractures numériques

Historiquement, la collecte de données a effectivement toujours été difficile, chronophage et coûteuse. L’essentiel de l’enthousiasme autour des Big Data provient de l’impression qu’elles offrent au contraire un accès facile à un grand nombre de données. Mais, comme le souligne les auteures,  la difficulté et le coût de l’accès aux données des Big Data aboutissent à une culture étriquée des résultats de recherche. Les grandes entreprises de données n’ont aucune obligation de rendre leurs données disponibles, et ont un contrôle total sur le choix de ceux qui y accèdent. Les chercheurs du champ des Big Data qui ont accès à ces jeux de données propriétaires sont moins susceptibles de choisir des questions qui pourraient être litigieuses pour une société de médias sociaux, par exemple, s’ils pensent que cela peut aboutir à l’interruption de leur droit d’accès.

Big Data et le bien commun de l’humanité

Les Big Data détiennent le potentiel de devenir la boule de cristal de l’humanité. Le Secrétaire-général de l’ONU y croit, lui qui, en 2009,  a mis sur pied l’initiative Global Pulse. Global Pulse, c’est une petite équipe basée à New York et composée de scientifiques de données, d’open-source hackers et d’experts en développement international qui s’affairent à faire le tri dans une masse d’informations énorme pour exploiter les données en temps réel, afin d’acquérir une compréhension en temps réel de l’état du monde. Leur mission : prévenir les prochains chocs alimentaire, pétrolier et financiers qui ont secoué la planète ces dernières années.

Le Big Data, qui avait déjà six défis importants à relever selon danah boyd et Kate Crawford, devra, pour devenir la boule de cristal de l’humanité, s’atteler à des difficultés d’envergure mondiale. Cette carte de l’état du monde à l’échelle et en temps réel ne pourra être tracée sans que les gouvernements acceptent de donner accès à leurs données. Il faudra en outre que les compagnies minières de Big Data, qui sont nombreuses à se positionner pour en tirer profit, ne les enferment pas dans des coffres-forts dont elles seraient les seules à détenir la clé.

Et je n’ai pas encore parlé de la pénurie de personnel compétent : dans le dossier du McKinsey Quarterly dont je parlais dans le billet précédent, on évalue que la demande pour des personnes possédant les compétences nécessaires pourrait excéder l’offre de 50 à 60%.

Dans l’itinéraire Big Data que j’ai tracé dans le billet précédent, la keynote de Gordon Bell,
Big Data: Lifelogging, The Fourth Paradigm of Science,
and Sensor-Effectors for the Control of Everything, est particulièrement intrigante.   Il promet en tout cas de nous faire voyager dans un univers assez singulier.

Gordon Bell est un collègue de danah boyd chez Microsoft et comme elle (il faut lire ce portrait qu’on a fait d’elle dans le New York Times), il semble être un personnage plus grand que nature, dont il sera intéressant de tracer le portrait dans un prochain billet.

 

Publié dans : Big Data, Conférenciers, Twitter

Big data ou le sens de la vie

Dans le roman de science-fiction « The Hitchhiker’s Guide to the Galaxy », l’histoire des origines du monde est racontée ainsi : il était une fois une race hyper-intelligente qui construisit un ordinateur chargé de calculer la réponse à la question ultime de la vie, de l’univers et de tout le reste (Life, the Universe and Everything).

L’ordinateur mit sept millions et demi d’années à trouver une réponse qui laissa les chercheurs perplexes :

-«C’est tout ce que t’as à nous montrer au bout de sept millions et demi d’années de boulot ?

- J’ai vérifié très soigneusement, répondit l’ordinateur, et c’est incontestablement la réponse exacte. Je crois que le problème, pour être tout à fait franc avec vous, est que vous n’avez jamais vraiment su quelle était la question. »[1]

(On construisit alors un deuxième ordinateur plus puissant pour trouver la question. Cet ordinateur s’appelait la Terre, et, en raison de sa taille et des composantes biologiques qui le constituaient, il était souvent confondu avec une planète. Il mit dix millions d’années pour calculer la question. L’histoire se termine mal pour l’ordinateur et pour ses composantes biologiques, mais il faut lire la trilogie en cinq volumes pour en connaître tous les détails.)

Données volumineuses au menu : indigestion en vue ?

Douglas Adams, l’auteur du Hitchhiker’s Guide to the Galaxy a écrit son livre en 1979.  À l’époque, il n’aurait sans doute jamais pu imaginer sur quelles avenues la recherche des questions fondamentales allait mener l’humanité.

(La réponse à la mystérieuse question ? Tapez « the answer to life, the universe and everything” dans Google pour la découvrir. Et vous n’attendrez pas sept millions et demi d’années, mais 0,28 secondes. On n’arrête pas le progrès.)

L’une de ces avenues, le buzz word de 2012, c’est le Big Data, (ou Big Data, comme l’appellent nos amis les Français.)

L’édition 2012 de La Boule de cristal étant inscrite sous la thématique « Quand tout devient données ! », vous vous doutez bien que diverses conférences aborderont la question sous l’angle du Big Data.

Mais qu’est-ce que le Big Data ? Et y a-t-il une traduction française dans la salle ? L’Office québécois de la langue française propose « données volumineuses », mais ça ne reflète vraiment pas bien, à mon sens, la phénoménalisation de ce concept. Big Data, ce sera, pour les besoins de ce billet.

La définition généralement reconnue est assez simple. Celle-ci, donnée par Edd Dumbill sur O’Reilly Radar en ouverture d’un dossier très complet sur la question, est claire :

Big data is data that exceeds the processing capacity of conventional database systems. The data is too big, moves too fast, or doesn’t fit the strictures of your database architectures. To gain value from this data, you must choose an alternative way to process it.

Big Data est BIG, big comme dans yotta

La  clé, dans cette définition, c’est tout ce qui est contenu dans la dernière phrase : « To gain value from this data… ». Pour extraire de la valeur du Big Data, il faut trouver la bonne avenue.

L’important, ce n’est pas la réponse, mais le chemin qui y mène.

Pour peu qu’on se fie à la littérature récente sur le sujet, Big Data est en passe de devenir un phénomène porteur de promesses immenses, instrument d’une révolution en devenir, porte d’entrée de notre société dans une nouvelle ère.

Tel que vu par des médias aussi divers que le McKinsey Quarterly et les revues Scientific American et Forbes, le phénomène est matière à de volumineux dossiers spéciaux.

 

Sources :

The Age of Big Data, The New York Times

Are You Ready for the Age of Big Data, McKinsey Quarterly

The Big Data Boom is the Innovation Story of our Time, The Atlantic

Big Data, Big Impact: New Possibilities for International Development, The World Economic Forum

Big Data: The Only Business Model that Tech has Left, Forbes

En introduction de chacun de ces articles, on utilise ces chiffres aux préfixes composés de noms anciens (giga, téra, péta, exa, zetta, yotta) et d’images fortes (où la Bibliothèque du Congrès américaine, est abondamment utilisée comme unité de mesure) pour rendre compte de l’incommensurable immensité du Big Data et de ses potentialités.

Quelques-uns de ces chiffres et images :

  • Au sein de 15 des 17 secteurs de l’économie américaine, les compagnies avec plus de 1000 employés emmagasinent en moyenne plus de 235 téraoctets de données, davantage que dans la Bibliothèque du Congrès des États-Unis (qui contiendrait, mais ce n’est pas confirmé par les responsables, 10 téraoctets de données textuelles non compressées). McKinsey Quarterly
  • En 2012, le volume de données produites devrait atteindre un niveau vertigineux de l’ordre de 2,7 zettaoctets (2,7 x 1021). Forbes
  • Selon la compagnie IDC (The Premier Global Market Intelligence Firm, citée dans plusieurs des articles mentionnés plus haut), d’ici à 2015, le monde aura généré et entreposé 8 000 exaoctets d’information numérique et d’ici la fin de la décennie, ce volume devrait avoir atteint 80 000 exaoctets.
  • Toujours selon IDC, le marché du Big Data devrait atteindre 16,9 milliards de $ d’ici à 2015.

Qui produit les données volumineuses? En grande majorité, elles seraient le fait, à 75%  selon IDC, de nous, les connectés, qui les lançons dans l’espace numérique via les médias sociaux, nos transmissions de vidéo et de photos en ligne, les signaux GPS de nos téléphones cellulaires, nos achats en ligne, etc. 80% de ces données transiteraient, à un moment ou un autre de leur existence, par les entreprises qui captent des billions d’informations provenant de leurs clients, de leurs fournisseurs et de leurs opérations. Des millions de capteurs sans fil, installés dans les objets du quotidien, créent et émettent d’autres données. Finalement, Big Data est une bête qui se nourrit de ses propres déjections : « The wealth of new data, in turn accelerates advances in computing – a virtuous circle of Big Data. » (The Age of Big Data, The New York Times)

Big Data : Eldorado ou Océania (la patrie de Big Brother)?

Rick Smolan, un photographe américain producteur de projets collectifs (America at Home, 24h in Cyberspace) qui marient la technologie, la photographie et l’internet pour produire des instantanés de la vie privée et intime de l’Amérique, a lancé fin 2011 le projet « The Human Face of Big Data ».  L’objectif est d’imaginer et de lancer des projets qui tireraient profit du potentiel du Big Data pour transformer le monde. Sa vision de ce potentiel est très optimiste :

Big Data has the potential to cure disease, provide a healthier life for our children, enable us to spend less time in traffic, alert us to tiny changes in our health weeks or years before we develop a life-threatening illness, give our seniors more independence while keeping them safe, and help us make better use of precious resources like water.

The premise of our new project is that Big Data is quickly evolving into one of humanity’s most powerful tools in addressing some of the biggest challenges facing the planet.

Pour le chercheur en sciences sociales Gary King, directeur de l’Institute for Quantitative Social Science de l’Université Harvard, cité dans le New York Times, c’est une révolution : « … the march of quantification, made possible by enormous new sources of data, will sweep through academia, business and government. »

Dirk Helbing, un physicien détenteur de la Sociology Chair, in Particular of Modeling and Simulation de l’École polytechnique fédérale de Zurich, croit pour sa part que Big Data pourrait devenir la boule de cristal du monde et il a déposé un projet d’un milliards d’euro à la Commission européenne pour la construire. Le projet s’appelle FuturICT Knowledge Accelerator and Crisis Relief System. Le cœur de ce système est le Living Earth Simulator, un simulateur qui ne construirait pas le modèle d’un seul secteur de notre monde – le monde financier ou l’environnement par exemple, mais les intégreraient tous simultanément dans un système à l’échelle mondiale en utilisant les flots de données du Big Data, des algorithmes sophistiqués et toute la quincaillerie possible. Ce système est un exemple parmi plusieurs des ambitieuses applications en développement autour du Big Data.

Pour des scientifiques cités dans l’article du Scientific American qui raconte le projet du professeur Helbing, le  Big Data c’est une avancée technologique aussi importante que l’invention du microscope et du télescope, une fenêtre ouverte sur une autre façon de voir le monde.

Du point de vue  de l’entreprise, exprimé dans le McKinsey Quarterly par exemple, Big Data deviendra, à terme, un puissant actif garant de la compétitivité des compagnies qui sauront tirer leur épingle du jeu et exploiter cet or virtuel. Alistair Croll  parle d’une Feedback Economy Big Data, qui, conjuguée à un processus d’optimisation continue et à la conversion de tout en données, pave la voie à quelque chose de plus grand et de beaucoup plus important que la simple efficacité organisationnelle.  Alistair donnera à La Boule de cristal une keynote intitulée « Big Data, towards the quantified society » dans laquelle il se propose de répondre à ces questions : Can we optimize the way we live, learn, work, and play through data? Is tomorrow a happy utopia where everyone achieves their potential—or is Big Data really Big Brother, making us slaves to feedback?

Questions très pertinentes. Le phénomène Big Data fait certes miroiter des lendemains qui chantent, mais des lendemains où plane l’ombre d’un Big Brother qui se serait adjoint les services d’apprentis sorciers.

Pour tout savoir sur le Big Data, suivez l’itinéraire Big Data de la Boule de cristal :

On commence par la salle 3 à 8h30 : La révolution des données sociales avec Claude G. Théorêt

On se précipite à la salle 2 à 9h20,  pour écouter Christine Connors : Getting started with Unstructured Data

Après une pause méritée, direction salle 1 à 10h30:Défi Big Data : Au-delà de gérer un large volume de données avec Philippe Nieuwbourg

On ne bouge pas de la salle 1 et Thierry Hubert vient, à 11h30, parler de consommation :  Consuming Big Data in the Age of Information Overload 

Et en après-midi on écoute, avant la keynote d’Alistair Croll à 16h30, celle de Gordon Bell à 13h30:
Big Data: Lifelogging, The Fourth Paradigm of Science, and Sensor-Effectors for the Control of Everything

Dans un prochain billet j’aborderai les limites et les risques du Big Data, le danger à accepter tous les postulats et parti-pris au pied de la lettre, les limites causées par les réglementations différentes selon les États, les impacts d’une walmartisation éventuelle des données sur la fracture numérique entre individus, universités et entreprises.

 

 



[1] The Hitchhikers Guide to the Galaxy (Le Guide du voyageur galactique, page 233)

Publié dans : Big Data, Web