Facebook, la vie téléchargée

Le 18 novembre 2010 Olivier Ertzscheid

Saisissant l'opportunité offerte par Facebook, Olivier Erztscheid a téléchargé l'ensemble de ses données personnelles. Il y voit l'émergence d'un nouveau langage documentaire.

Ca y est c’est fait. Sur mon compte Facebook, dans l’onglet “Account” > “Account settings”, j’ai vu apparaître le petit lien magique que j’attendais tant : “Download your information”

J’allais enfin pouvoir télécharger toutes mes données personnelles. Après avoir indiqué que “oui, oui, je suis sûr de bien vouloir les télécharger“, et une heure plus tard, j’ai reçu dans ma boîte mail un message de Facebook avec un lien d’activation pour accéder au précieux fichier.

Mais il m’a d’abord fallu doublement montrer patte blanche : une première fois en redonnant mon mot de passe (ok, précaution élémentaire), et une deuxième fois en jouant au jeu des photos de mes amis.

Je traduis :

Pour vérifier que vous êtes bien le propriétaire de ce compte, merci de reconnaître les personnes tagguées sur ces photos suivantes.

Il faut reconnaître 5 amis et on l’on n’a droit qu’à 3 erreurs (“I’m not sure“), soit 8 questions en tout. Le problème c’est que les photos affichées ne sont pas des portraits de vos amis, mais des photos prises au hasard dans le photostream de tous vos contacts Facebook, c’est à dire toutes les photos déposées par tous vos amis.

Et là première angoisse : je suis ami avec plein de gens, mais surtout j’ai plein “d’amis d’amis” et encore davantage “d’amis étudiant(e)s”. Et autant vous dire que je ne passe pas mon temps à regarder toutes les photos postées sur Facebook par tous mes “amis”. Et donc ça ne loupe pas, on me demande de reconnaître quel est l’ami qui se cache derrière ces photos :

Voilà voilà voilà … Donc ben du coup je n’ai plus droit qu’à 2 erreurs en espérant que les autres photos seront plus … explicites. Quelques reconnaissances plus tard, c’est gagné :

Une fois le téléchargement effectué, je me retrouve avec çà :

Le dossier avec :

mes photos de profil (album-Profile Pictures.html)
la liste alphabétique de tous mes amis (friends.html)
les événements auxquels j’ai été convié (events.html)
mes courriers reçus sur facebook (messages.html)
tout ce que j’ai posté sur mon “mur” (profile.html), soit – en ce qui me concerne – l’équivalent de 150 pages Word, et ce qui m’a permis de retrouver la date précise de mon arrivée sur Facebook: c’était le 11 Juillet 2007 à 13h40 et mon premier statut disait: “At home”. Largement de quoi imprimer un aussi épais que futile “egobook”.

Le dossier avec :

toutes mes photos (c’est à dire en ce qui me concerne, uniquement 2 pauvres photos de profil)

Soit un dossier complet d’1,3 Méga-octets.

Remarque : ce dossier et les fichiers qu’il contient est un “à plat”. Ainsi, dans le fichier “profile.html” on retrouve bien – et on peut activer – les liens hypertextes postés sur mon mur ou dans mes “statuts”, mais on ne retrouve naturellement pas le graphe relationnel/navigationnel qui constitue le vrai trésor de guerre de Facebook, notamment – depuis l’activation de la fonctionnalité – les personnes qui ont “aimé” (= le fameux bouton “like”) tel ou tel statut.

Et maintenant un peu de maths

Sachant qu’un individu (moi en l’occurrence) peut être considéré comme un utilisateur type du réseau social Facebook, et sachant qu’il y a au moins 500 millions d’utilisateurs sur Facebook, quel est le poids des données personnelles détenues par Facebook ?

Solution : 500 millions multiplié par 1,3 méga-octets = 650 millions de mégaoctets.

Ce qui nous donne : 650 Téra-octets de données personnelles disponibles sur Facebook [EDIT: selon le commentaire d'un employé de Facebook posté sur le blog d'Olivier Ertzscheid, ce chiffre serait encore plus élevé, notamment parce que l'entreprise de Mark Zuckerberg a collecté plus de 160 téraoctets de photos sur la seule année 2007. Par ailleurs, Twitter stockerait pas moins de 4 pétaoctets (4.096 téraoctets) par an.]

65 fois la bibliothèque du Congrès

Sachant que “10 téraoctets pourraient contenir toute la collection des ouvrages imprimés de la bibliothèque du Congrès” (source), on peut donc supposer que Facebook détient au moins l’équivalent de 65 bibliothèques du Congrès uniquement composées de données personnelles. Celle-ci comptant plus de 33 millions d’ouvrages, cela fait donc l’équivalent de (33 x 65) : 2.145 millions de livres de données profilaires.

Et encore, je dis bien “au moins” car dans les profils Facebook ce sont les photos qui prennent le plus de place, que je n’en ai que deux (photos) dans le mien et qu’en moyenne mes amis sont plus proches d’une bonne cinquantaine (de photos toujours), et je ne vous parle même pas de mes “amis-étudiants” (il n’est pas rare de voir plus de 300 photos dans certains profils). Mais bon on va pas chipoter, l’ordre de grandeur me semble déjà suffisamment parlant …

Mon mur, ma bataille

L’équivalent de 150 pages Word pour moi en 3 ans, et pour 499.999.999 autres, 2.145 millions de livres de données profilaires dont probablement plusieurs centaines de millions également et uniquement remplis de ces traces profilaires, conversationnelles, le reste étant occupé par la documentation iconographique rétrospective des 500 millions d’habitants de cette communauté. Vertigineux.

Facebook en grand ordonnateur du nouvel ordre documentaire mondial?

Facebook est, par le nombre, la première communauté humaine de la planète numérique. Si l’homme est un document comme les autres, et si l’ordre documentaire du 21ème siècle sera celui d’un pan-catalogue des individualités humaines, Facebook est en bonne place pour remporter la mise ou pour en devenir à tout le moins le grand ordonnateur, le grand sachem de ce qui est “su”.

De la thésaurisation des profils au trésor de guerre

Au-delà des chiffres et des questions de “vie privée”, il faut relire ce billet de Tim Berners Lee, une nouvelle fois visionnaire, dans lequel il évoque le Giant Global Graph.

Le net est un graphe d’ordinateurs connectés.
Le web est un graphe de contenus connectés, dont Google est, pour l’instant, l’outil qui permet le mieux d’en sonder les profondeurs, d’en donner l’image la plus “complète” possible.
Les réseaux sociaux sont un graphe d’individus connectés, dont Facebook est, pour l’instant, l’outil qui permet le mieux d’en sonder les profondeurs, d’en donner l’image la plus “complète possible”.

L’enjeu est désormais de savoir qui sera le premier à pouvoir réunir la puissance des 2 graphes. La guerre des graphes a désormais officiellement commencée. Et comme toutes les guerres, elle fut d’abord larvée, chacun essayant de circonscrire au mieux ses frontières naturelles (les contenus pour Google, les profils pour Facebook).

Elle fut ensuite une série de petites offensives permettant de jauger les forces et faiblesses de l’adversaire en envoyant une petite armée le combattre sur son terrain : ce que tenta de faire Google en lançant “son” réseau social (Orkut), ce que tenta de faire Facebook en nouant alliance avec Microsoft pour s’installer – mais en restant dans ses frontières – sur le marché du “search”.

“Projet Titan”

Et puis un jour, à l’occasion d’une escarmouche, on sort l’artillerie lourde et on engage “officiellement” le début des hostilités. C’est désormais chose faite entre Google et Facebook.

L’escarmouche ce fut ce “cheval de troie” qui permettait à un nouvel arrivant sur Facebook d’importer rapidement l’ensemble de ses contacts Gmail pour densifier rapidement son réseau d’amis. Jusqu’à ce que Google exige une contrepartie, c’est à dire que les utilisateurs de Gmail puissent récupérer et importer – par exemple – leurs contacts Facebook. Un blocage par ailleurs rapidement contourné par Facebook.

Et l’on apprend (sur Techcrunch) que Facebook lancerait (demain lundi ?) son webmail, nom de code “projet Titan” (sic) :

Le réseau social proposerait ainsi à ses utilisateurs, qui sont plus de 500 millions dans le monde, une adresse email personnelle @facebook.com, permettant d’envoyer des mails à tous les internautes, qu’ils aient une messagerie Hotmail, Yahoo ou Gmail. Aujourd’hui, les membres de Facebook ne peuvent envoyer de messages qu’aux autres membres du site.
–
(Source)

Le courriel et les webmails sont, pour ces deux acteurs, un cheval de Troie idéal et hautement stratégique permettant d’assiéger la place-forte de nos pratiques connectées :

D’abord parce que les mails rassemblent, parce qu’ils “synthétisent” notre réseau relationnel (nos “contacts”),
Ensuite parce qu’ils sont le point d’entrée le plus aisé vers le cloud computing, le stockage “dans les nuages” ou plus exactement sur les serveurs de ces grandes compagnies de pans entiers de nos vies sociales (pièces jointes, documents de travail, photos, etc …)
Parce qu’ils contiennent également ce que nous avons à raconter de plus “intime”, de plus “personnel” et qu’ils permettent donc d’affiner encore l’affichage de publicités “contextuelles” en scannant le contenu desdits mails,
Enfin parce que les webmails peuvent, au sein d’un écosystème semi-fermé (comme Facebook) ou semi-ouvert (comme Google et sa galaxie de services), constituer un point pivot autour duquel hiérarchiser l’ensemble des autres données affiliées à notre profil, à notre “empreinte numérique”.

Techcrunch souligne ainsi que “Facebook aurait les moyens à la fois de hiérarchiser les courriels et de les intégrer à ses autres fonctions (partage de photos, calendrier etc.) d’une façon très convaincante.” (source)

Thesaurus : From society of query to society of contact

Google est depuis longtemps emblématique de ce que Geert Lovink appelle une “Société de la requête”. Facebook représente lui, les promesses d’une société des contacts étendus, ou distendus. Or requêtes comme contacts représentent la conquête et l’apprentissage d’un langage commun à l’humanité tout entière ; plus précisément un thésaurus, c’est à dire :

Un type de langage documentaire qui consiste en une liste de termes sur un domaine de connaissances, reliés entre eux par des relations synonymiques, hiérarchiques et associatives.

En l’occurrence, de l’approche commune de Google et Facebook on pourrait dire qu’elle vise à faire émerger et à circonscrire un type de langage documentaire qui consiste, en une liste de requêtes (déposées sur le moteur ou sur chacun de nos “murs”), portant sur l’ensemble des domaines de connaissance existants (des plus fondamentaux aux plus futiles).

Ces requêtes sont reliées entre elles par des relations lexicales (ingénierie linguistique) et associatives “amicales” ou “contactuelles” (ingénierie de la recommandation reposant sur des graphes relationnels) permettant de hiérarchiser l’ensemble des requêtes et des profils en fonction du contexte de la requête et/ou du profil du requêtant.

Moralité. L’étymologie du mot thésaurus désigne, en latin, le “trésor”. De ce trésor là nous n’avons pas encore fini de mesurer la valeur. De ce trésor là nous connaissons déjà ceux qui veulent en être les grands avaleurs.

Cet article a initialement été publié sur Affordance

Crédits photo: Flickr CC dbking, Eneas, Mosman Library, malias

Supprimer l’ISF pour récompenser la paresse

HADOPI déjà six pieds sous terre ?

Facebook♥ Twitter♥ ♥ RSS

15
commentaires Fermer

Laisser un commentaire

Derniers articles publiés

Une Vive Internet! Inédit • 14 décembre 2012

[Infographie] 10 ans de Creative Commons

par Sabine Blanc

Cette semaine, Creative Commons fête ses dix ans dans le monde entier. Une décennie d'alternative à une vision maximaliste de la propriété intellectuelle qui a su conquérir le grand public. Owni, un des rares médias en CC en France, vous retrace cette histoire en une infographie interactive.

Twitter Facebook 188

creative commons, droit d'auteur, Lawrence Lessig

Graphisme Chronique • 14 décembre 2012

Charte de confidentialité : des icônes pour informer

par Geoffrey Dorne

Personne - ou presque - ne lit les politiques de confidentialité. Pour simplifier les choses et rendre compréhensible ce que fait chaque site avec vos données, designers, citoyens et experts soutenus par la fondation Mozilla ont mis en place une liste d'icônes. Tour d'horizon de l'initiative.

Twitter Facebook 223

Art, CGU, création, design, graphisme, icone, icônes, picto, pictogramme, vendredi-graphism, vie privée

droit Chronique • 14 décembre 2012

Les Creative Commons hackent le droit d’auteur !

par Lionel Maurel (Calimaq)

Toute la semaine, ce sont les dix ans des Creatives Commons. L'occasion pour notre chroniqueur Calimaq de revenir sur le projet : réussites, limites et défis à relever.

Twitter Facebook 344

#cc10, creative commons, droit d'auteur, licences libres

Une Vive Internet! Édito • 13 décembre 2012

Offrez-vous un Owni

par Media Hacker

Des milliers de témoignages de réconfort et de soutien, et beaucoup évoquant le souhait de participer financièrement. Il nous reste à déterminer si cette somme de bonnes intentions peut effectivement transformer notre modèle économique et faire vivre le média.

Twitter Facebook 602

42, financement, Internet, médias, owni

Presse Enquête • 13 décembre 2012

Google : chêne ou roseau?

par Andréa Fradin

Google et les éditeurs de presse belges ont enfin trouvé un accord. Pour Le Monde, cela veut dire que "la presse peut faire plier Google" et que les titres français peuvent espérer profiter d'un effet "boule de neige". En fait, c'est un poil plus compliqué. Explications.

Twitter Facebook 78

belgique, Copie presse, éditeurs de presse, Google, IPG, Laurent Joffrin, lex google, médiation

L'auteur

Olivier Ertzscheid

Suivre sur Twitter

En savoir +

Tags pour cet article:

données personnelles, Facebook, numérisation, thésaurisation, vie privée

Du même auteur:

Facebook étend la statusphère

Désormais, vous pouvez étaler votre prose en long et en large sur votre mur. Pour Olivier Ertzscheid, Facebook veut "territorialiser à l’extrême – et à son seul profit – les expressions documentaires". Avec des visées commerciales, bien sûr.

144

Penser le futur du web

Réseaux sociaux et moteurs de recherche se confrontent à des silos de données toujours plus titanesques. Vie professionnelle, privée, intime : comment le web, et ces acteurs, vont-ils distribuer et exploiter ces informations dans l'avenir ?

284

L’article du futur sera une API

Pour trouver l'article du futur, les annonces sont presque plus nombreuses que les tentatives. Mais la piste la plus intéressante reste l'API, y compris pour les publications scientifiques.

Nos mémoires ne valent pas un cloud

L'externalisation de nos mémoires va-t-elle tuer le web? Pour Olivier Ertzscheid, il faut veiller à la survie de la sacro-sainte URL et ne pas placer tous nos espoirs dans le cloud computing massif.

192

Ordi en cours: soyons pragmatiques, n’ayons l’air de rien

Face au nombre croissant de ses étudiants utilisant un portable, Olivier Ertzscheid, enseignant en IUT, a décidé d'encadrer cette pratique. Prise de note attentive recommandée.

190

Voir tous les articles