[Social Media] Pinterest, Google Hangout, du SM en événementiel et un very zombie bonus

Petit tour d’horizon des stratégies social media en retail (Anthropologie, Lush, Marlette…), un petit cours de Pinterest, illustration d’une utilisation de Google+ Hangout avec le New York Times, naissance de l’agence Ondine de couverture social media d’événements, et un bonus vidéo.

Continuer la lecture de [Social Media] Pinterest, Google Hangout, du SM en événementiel et un very zombie bonus

[Article Long] Big data: l’exploration de données, la trace est l’avenir de l’homme?

Loin d’être révolutionnaire, le concept d’exploration de données à des fins informatives ou décisionnelles, est devenue une expertise d’affinage d’une matière première numérique brute de plus en plus recherchée, la donnée. La donnée, cette unité minuscule, numérisée, extraite de la vie quotidienne des individus, peut être aussi bien un « like » sur Facebook pour un produit, un service ou même un commentaire, qu’un relevé de compte personnel. Or, ce n’est qu’en agrégeant un grand nombre de ces données avec une question en tête (détecter les fraudes de manière automatisée pour les banques, créer un meilleur système d’information, une politique CRM, de recommandation de produits réactive et affinée…), que les data miners – ces ingénieurs /statisticiens –  réussissent à faire émerger des modèles de comportements, voire à les anticiper. The Atlantic, dans un article sur la pratique du data mining (exploration ou fouille de données), souligne:

« Sans le data mining, quand vous laissez quelqu’un accéder à des informations sur vous, tout ce qu’ils savent c’est ce que vous leur avez dit. Avec le data mining, ils peuvent deviner encore plus que ce que vous leur avez dit. Dit autrement, le data mining permet aux entreprises et aux gouvernements d’utiliser l’information que vous avez fourni pour révéler plus que ce que vous pensez. »

Au cœur de ces  modélisations et de rationalisation de la complexité, se trouve un idéal d’anticipation afin de réduire les marges de risques, d’optimiser un système automatisée de façon à avoir de moins en moins besoin d’intervention humaine et de toujours avoir une longueur d’avance sur la population étudiée (garder un client et anticiper ses besoins par exemple). L’objectif du data mining étant de trouver des connexions utiles et utilisables à partir de ces amas de données passés à la moulinette. De nouvelles connaissances, de nouveaux services, ont pu voir le jour grâce à cette pratique: l’exploration et la cartographie du génome humain par exemple, les systèmes de recommandation dans le e-commerce ou dans la découverte de biens culturels, ou même dans la compréhension des attentes humaines par la machine.

Cela dit, l’exploration de données n’a pas toujours bonne réputation: d’une part, avec son utilisation massive et rapide dans le milieu de finance, la modélisation de systèmes complexes à tendance « divinatoire » a permis l’avènement de la spéculation comme fondement de l’économie et de la finance contemporaine. Si la maîtrise des big data a renforcé les systèmes informatiques anti-fraudes pour les banques, elle a aussi abouti à la production des produits dérivés financiers, ces contrats financiers largement basés sur de la pure spéculation et qui ont contribué à la crise du système

Avec l’évolution de l’informatique et du numérique, la pratique a gagné en complexité et en maîtrise: le cloud computing (informatique en nuage) a permis non seulement de multiplier les données de tous types (notamment multimédia) du côté utilisateurs, et permis de manipuler de plus en plus en de données du côté des data miners. De même, l’explosion de l’industrie mobile et la démocratisation des smartphones ont permis de construire des systèmes de « filet à données » pervasifs, si bien que les utilisateurs sont toujours « connectés » et que le feedback est quasi-ininterrompu voire de plus en plus intime (localisation, échanges interpersonnels, etc). De plus en plus d’entreprises basent d’ailleurs leur business model sur la fouille de données, en particulier les pure players, ces sociétés implantées dans le secteur numérique et naturellement à l’aise avec ce milieu (on peut citer les sites de e-commerce, de service en ligne, plateformes de contenus, réseaux sociaux…), y compris quand il est question de manipuler les traces digitales des utilisateurs. Ces traces peuvent être circonscrites sur un site ou un appareil mobile, mais comme expliqué plus haut avec l’image des rets mobiles connectés à Internet, ce n’est plus le cas. Les plus grosses sociétés numériques, véritables gatekeepers qui conditionnent l’accès et façonnent la navigation sur Internet (comme Google en situation de quasi-monopole), ont de moins en moins de juridiction circonscrite et, par le biais de partenariats ou d’outils comme Facebook Connect ou l’identifiant unique, vont piocher hors de leur site des informations sur l’utilisateur qui reste « tagué » (à son insu ou non, telle est la question…). Le réseau social Facebook a beaucoup été cité (notamment lors de son intronisation sur les marchés à une valorisation qui en a laissé perplexe plus d’un, et qui s’est révélé être un véritable pétard mouillé) comme champion de l’exploitation des données de ses utilisateurs, notamment pour optimiser son propre système de publicité en ligne. En réalité, c’est Amazon qui est le champion toutes catégories en matière de data mining. En effet, l’efficacité de son système de vente repose depuis toujours sur son système de recommandation, lui-même basé sur un logiciel apprenant des comportements des utilisateurs sur le site. La société propose aujourd’hui son expertise en matière de fouille de données à des entreprises tierces.

En dehors de ce panorama, plusieurs questions en creux sont à soulever. J’en choisirai deux: une  sur la méthode elle-même qui prétend avoir accès à la vérité des individus par le biais de schémas émergents, de signaux imperceptibles, mais légitimés par la quantité et la « scientificité » de l’analyse statistique prenant pour objet des traces numériques -ou numérisées (depuis l’espace physique). L’autre remarque concerne la literacy numérique et les droits des individus concernant l’utilisation de ces données dites « personnelles« .

– Le data mining est une méthode quantitative.

Il est totalement illusoire de croire que les comportements humains deviennent transparents grâce à des méthodes d’échantillonnage, aussi grand ou massif soit cet échantillon. De même, les logiciels sont eux-mêmes écrits par des humains, qui ne sont ni exempts de jugements, de biais ou de préjugés sur ce ce qu’ils cherchent à prouver. En aval, les données sont de toute manière toujours interprétées. Comme le mentionne (timidement) un article du Nouvel Economiste sur le nouveau rôle du marketing dans l’entreprise à l’heure du digital, les filtres informatiques devront être multipliées… tout autant que les analystes qualitatifs:

“Les directions marketing doivent s’ouvrir à d’autres disciplines. Il faut savoir parler avec la R&D, l’IT… mais aussi avec d’autres spécialités intellectuelles : des anthropologues, des philosophes…”.

Des profils issus des sciences humaines et sociales s’intéressant aux questions des comportements numériques (anthropologie digitale) et utilisant des méthodologies numériques (ethnographie digitale), arrivent en complémentarité et certainement en affinage des résultats automatisés générés par le data mining: on peut voir Laurence Allard ou Tricia Wang chercheuses, parfois consultantes comme la seconde, spécialisées dans l’observation de l’utilisation des technologies mobiles, notamment dans les pays en voie de développement.

– La question sociale et politique: exploitation des données opaque, la mise en visibilité de ces données, et la sécurisation de l’accès à ces données (piratage).

La première remarque concerne la vie privée, car ces données proviennent aussi bien d’actions dont nous avons conscience que de faits plus ponctuels et parfois plus intimes. The Economist reprenait l’exemple d’une jeune fille qui venait d’apprendre qu’elle était enceinte, ne l’avait pas dit à son entourage, et s’était pourtant retrouvée inondée d’offres de produits liés aux bébés. Cet exemple, loin d’être catastrophique, prête certes plutôt à sourire, mais il faut rappeler que la pratique du data mining est basé sur la surveillance, expertise vendue à des fins commerciales et industrielles, mais aussi sociales: des pays en font usage pour suivre à la trace et disons-le, espionner leurs citoyens (qui passent par des communications privées), avec des résultats parfois moins drôles comme l’emprisonnement de dissidents dans des pays totalitaires, ou l’utilisation de données parfois isolées pour juger des individus en tant que « suspects » (par exemple aux Etats-Unis). Au-delà de ce déséquilibre observé, on assiste néanmoins à une amélioration de la literacy numérique des individus, qui passe par la prise de conscience et la meilleure circulation de l’information concernant les tenants et les aboutissants des licences d’utilisation sur Internet par exemple. Elle est aussi le fait d’une certaine fatigue des utilisateurs / utilisés dont la bienveillance a des limites comme avec n’importe quel type de service, notamment quand ils sont confrontés trop souvent à la réalité de ces réseaux loin d’être gratuits ou à visée purement « sociale »: Facebook en l’occurrence (mais il y en a bien d’autres) étant le meilleur exemple avec ses actions hebdomadaires modifiant sur le papier ou dans les faits les conditions d’utilisation de la plateforme. La dernière action la plus marquante concerne le remplacement immédiat sur les profils, de toutes les adresses email des utilisateurs par l’adresse email facebook. De plus en plus d’utilisateurs choisissent alors de se déconnecter, mais, et c’est certainement le plus inquiétant, il est extrêmement difficile de supprimer ses propres données ou de clôturer définitivement un profil personnel, comme le montre un internaute qui explique que le processus est une véritable affaire de fourmi qui peut prendre jusqu’à plusieurs jours:

« La suppression de mon compte Facebook m’a pris quatre jours. Autant de temps pour m’extraire du service et pour faire savoir aux autres comment me contacter après ma déconnexion. Cette « extraction » impliquait la suppression de mes photos, « unliker » tout ce que j’avais pu « liker » et déconnecter tous les services tiers utilisant Facebook Connect pour me loguer. Vous avez sûrement vu ces services qui proposent l’option « se connecter en utilisant votre compte Facebook ». Le problème est, à ma connaissance, qu’il n’y a aucun moyen d’obtenir une liste de tous les sites que vous avez accédé de cette manière. La raison pour laquelle ces services doivent être désactivés de façon à pouvoir supprimer votre compte, est qu’il faut avoir été déconnecté de Facebook pendant 14 jours pour que la suppression ait lieu. Si vous vous loguez de quelque façon que ce soit (notamment via Facebook Connect) pendant ce temps, vous devrez recommencer tout le processus depuis le début et attendre encore 14 jours… »

La législation elle-même, en tout cas en Europe, continue à prôner le droit à la vie privée et à calmer les ardeurs des sociétés digitales, qui repoussent toujours plus leur territoire d’intervention et d’intrusion dans les données personnelles. La CNIL en France (Commission Nationale de l’Informatique et des Libertés), enregistre pour 2011 une hausse de 42% des plaintes liées au droit à l’oubli sur Internet.

<<<

Pour conclure, il est important de rappeler que le data mining permet le progrès des méthodes de recherche, en dehors du champs industriel: pour la science (la recherche spatiale par exemple) mais aussi dans les sciences sociales comme outil d’enquête. Tim Berners-Lee, qu’on crédite de la création du World Wide Web, appelle notamment les citoyens à réclamer leurs données aux entreprises telles que Google ou Facebook. En effet, dans une interview parue dans le Guardian, la data curation et le data mining personnels, permettraient de créer des services à des fins de développement social et humain. L’accès et la réclamation de ses données propres permettrait en outre d’améliorer l’éducation, la reconnaissance et la maîtrise propre de sa vie numérique. Il est à souhaiter, dans le contexte économique, qu’au-delà des politiques de personnalisation de la publicité (qui peut être clairement appréciable), que la pratique d’une part ne créé pas les comportements qu’elle est censée observer pour anticiper et innover, et d’autre part qu’elle homogénéisera pas l’offre là où elle devait l’ouvrir. Enfin, inutile d’insister sur ce miroir aux alouettes que pourrait constituer le data mining, notamment comme ça a été le cas, avec les conséquences qu’on lui connaît, avec la finance et son attrait pour les produits probabilistes et spéculatifs… Issues de l’entrée Wikipedia sur la fouille de données, deux citations d’un statisticien pour illustrer ces questions: « Tous les modèles sont faux, mais certains sont utiles » et « Les statisticiens sont comme les artistes, ils tombent amoureux de leurs modèles ». Espérons qu’entre la prophétie auto-réalisatrice et la virtualisation (au sens de l’abstraction mathématique totale), il y ait un boulevard respectant les droits des individus et permettant l’innovation, notamment aux plus petites structures.