Christian Rudder a un CV qui ressemble au profil romancé d’un des usagers d’OkCupid, le site de rencontres très populaire qu’il a cofondé. Non content d’avoir lancé une entreprise Internet en plein essor (vendue 50 millions de dollars à Match.com en 2011), il est guitariste du groupe d’indie pop Bishop Allen, acteur de cinéma (dans Funny Ha Ha (1)) et titulaire d’un diplôme de mathématiques de Harvard. Si l’on précise qu’il aime faire de longues promenades et cuisiner la paella, voilà qui ressemble à l’homme le plus désirable d’Amérique. D’autant qu’il peut désormais ajouter « auteur » à son profil. Son livre, « Dataclysme », est né du blog OkTrends, que Rudder tenait sur OkCupid pour aborder des questions d’une importance historique mondiale, comme : « Comment vous prendre en photo afin de susciter le maximum d’intérêt pour votre profil ? » (Pas de flash, faible profondeur de champ) ou « En quoi les fervents adeptes de Twitter diffèrent-ils des autres membres d’OkCupid ? » (Ils se masturbent plus souvent).
Dans « Dataclysme », Rudder poursuit des objectifs plus ambitieux. Les internautes ne cessent de lâcher (souvent de manière délibérée) des bribes de renseignements sur eux-mêmes. Selon Rudder, le nuage de poussière d’information qui en résulte autorise une toute nouvelle forme de sociologie et permet de déterminer « qui nous sommes », comme le dit son sous-titre. Non, les ordinateurs ne comprennent pas très bien les humains, mais ils ont leurs atouts. Ils peuvent voir dans leur globalité des réalités que l’œil humain n’appréhende qu’en partie. « Suivre les traces, c’est leur seule tâche, explique Rudder. Ils ne perdent pas l’album souvenir, ne voyagent pas, ne s’enivrent pas, ne sont pas guettés par la sénilité, ne ferment jamais les yeux même l’espace d’une seconde. Ils sont là, voilà tout, et ils mémorisent. »
C’est formidable si vous êtes un scientifique ou si la traçabilité des données est votre fonds de commerce [lire notre entretien avec Viktor Mayer-Schönberger et Kenneth Cukier, Books, n° 52, mars 2014]. Mais les humains ainsi étudiés frémiraient peut-être d’apprendre, par exemple, qu’OkCupid garde une trace non seulement des messages que vous envoyez à vos flirts potentiels, mais aussi des caractères que vous tapez et effacez en composant vos petites fables pour mieux séduire. Un superbe diagramme de dispersion (le livre grouille littéralement de superbes diagrammes de dispersion) cartographie le paysage des messages. D’un côté, vous trouvez les relecteurs attentifs, qui rédigent un premier jet puis effacent, rédigent à nouveau puis effacent à nouveau, et tapent donc bien plus de caractères qu’ils ne finissent par en envoyer. De l’autre, vous trouvez ceux qui tapent moins de caractères qu’ils n’en envoient. Comment est-ce possible ? Ce sont des adeptes du copier-coller, des stakhanovistes de la rencontre, pour qui la démarche romantique est une occasion d’utiliser l’efficacité de l’ère numérique. Ils envoient le même baratin de prise de contact à des dizaines de partenaires potentiels. Voilà comment on se fait la cour à l’époque de la reproduction mécanique.
Rudder est très transparent sur les expériences auxquelles OkCupid se livre sur ses clients, au grand dam de certains d’entre eux (un jour, le site s’est mis à proposer des unions que l’algorithme estimait en réalité catastrophiques, simplement pour voir ce qui allait se passer). De telles pratiques relèvent intrinsèquement de la tromperie ; de l’avis de Rudder, elles en valent la peine, car elles permettent d’étudier le comportement humain à l’état sauvage. Il revient à plusieurs reprises sur l’idée que ces données – qui suivent ce que nous faisons, et non ce que nous prétendons faire – constituent des guides plus fiables pour connaître notre paysage intérieur que les questionnaires et les sondages. Par exemple, il arrive que les gens déclarent n’avoir aucune préférence raciale en matière de flirt, alors que les données recueillies indiquent nettement qu’ils ont tendance à contacter des personnes de leur propre groupe. Elles laissent aussi penser que la véritable fracture raciale, en matière de rencontres Internet, ne passe pas entre les Blancs et les non-Blancs, mais entre les Noirs et les non-Noirs. « Les données révèlent ce que nous ressentons véritablement », affirme Rudder, sans les masques que nous portons en public. Cela me paraît excessif : la plupart d’entre nous continuons à jouer un rôle, même en étant persuadés que personne ne regarde. Nous n’ôtons jamais le masque. Mais il est indéniable que Rudder et ses collègues détenteurs de données peuvent voir et analyser des comportements jusque-là invisibles au regard de la science.
Les pages consacrées aux questions raciales – peut-être parce qu’il est difficile d’en parler en public – comptent parmi les plus fortes du livre. Rudder fournit la liste des expressions particulièrement plébiscitées (ou rejetées) par les Blancs, les Noirs, les Latinos et les Asiatiques dans leur profil OkCupid. Et l’on y trouve une multitude de détails curieux. L’internaute d’origine asiatique a fortement tendance à indiquer qu’il est « grand pour un Asiatique », conformément au stéréotype selon lequel la petite taille d’un homme est un handicap. Mais les femmes asiatiques utilisent aussi volontiers la formule « grande pour une Asiatique » – pourquoi ? Mystère.
Rudder soutient que les célibataires posent les mauvaises questions à leurs contacts, en se focalisant sur des sujets nobles, comme la politique et la religion, alors que des thèmes plus subtils ont davantage de valeur prédictive. Ainsi, dans les trois quarts des cas où la rencontre sur OkCupid a débouché sur une union durable, les deux partenaires ont donné la même réponse à la question « Aimez-vous les films d’horreur ? » Voilà qui paraît impressionnant ! Mais sans plus d’informations, il est difficile de savoir quoi faire de ça. Les films d’horreur sont plutôt populaires. Si, disons, 70 % des gens les apprécient, on pourrait s’attendre à ce que, dans 49 % des cas (70 % de 70 %), les deux partenaires d’un couple répondent « oui » par pur hasard, et « non » dans 9 % des cas (30 % de 30 %), moyennant quoi nous aurions 58 % de couples d’accord sur le sujet, même si le goût de l’hémoglobine n’avait aucun rapport avec la possibilité de tomber amoureux.
J’ai eu à la lecture quelques autres objections comme celle-ci. Mais cela prouve que le livre de Rudder offre vraiment matière à discussion. La plupart des ouvrages sur l’exploitation des données brassent de l’air en assénant des slogans. Celui-ci propose du solide, de vraies informations et une vraie analyse. Voilà qui mérite de longs et sonores applaudissements. Le style de Rudder est également digne d’éloges, constamment savoureux et heureusement débarrassé de tout jargon façon Silicon Valley.
L’auteur compare son projet au livre de Howard Zinn, Une histoire populaire des États-Unis (2). Cette référence m’a étonné, mais elle a du sens. Comme Zinn, Rudder cherche une sociologie qui mette l’accent sur les agrégats plutôt que sur les individus, et soit à l’écoute d’évolutions sociales subtiles peut-être invisibles à l’échelle de l’individu. Mais l’expression « histoire populaire » revêt deux significations. C’est l’histoire du peuple, mais aussi l’histoire par le peuple, une exploration qui n’est pas l’apanage des universitaires et des spécialistes. Telle est la grande question qui se pose à la nouvelle sociologie des ensembles de données. Il est clair que nous sommes tous des objets de cette étude. Mais pouvons-nous concevoir une science populaire des données qui nous permette à tous d’en être aussi les savants ?
Cet article est paru dans le Washington Post le 11 septembre 2014. Il a été traduit par Laurent Bury.