Je lisais rĂ©cemment un article qui expliquait comment, sur la base d'informations trĂšs sommaires, des internautes utilisateurs "anonymes" des moteurs de recherche, avaient Ă©tĂ© retrouvĂ©s. Reprenons les faits : l'Ă©tĂ© dernier, AOL a mis en ligne de façon "accidentelle" un fichier de requĂȘtes effectuĂ©es sur son moteur de recherche aux Etats-Unis. Ce fichier contenait deux choses : les requĂȘtes saisies sur le moteur et, pour chacune d'entre elle, un numĂ©ro d'internaute. On savait ainsi que, par exemple, l'utilisateur 123456, avait saisi tel et tel mot clĂ©. Bien entendu, aucun utilisateur n'Ă©tait dĂ©crit sous une autre forme que ce "matricule"... Mais on avait Ă disposition l'ensemble des requĂȘtes effectuĂ©es par une seule et mĂȘme personne. Et bien, cela a suffi pour que quelques observateurs fassent des recherches et arrivent Ă identifier certaines personnes, retrouvant leur nom, leur adresse, leur numĂ©ro de tĂ©lĂ©phone rien qu'en analysant les recherches qu'elles avaient faites sur le moteur.
A la rĂ©flexion, on se dit que, effectivement, nos mots clĂ©s peuvent nous "trahir" et rĂ©vĂ©ler bien des choses sur nous... Pensez-y lorsque vous taperez vos prochaines requĂȘtes et vous verrez... En allant plus loin, je me dis mĂȘme que les moteurs de recherche nous connaissent vraiment trĂšs bien... Trop bien ? Possible... En effet :
- Ils connaissent nos goûts et nos attentes au travers des mots clés que nous tapons dans leurs formulaires de recherche. De plus, ils savent quand nous les saisissons et ont donc quelques informations sur les moments pendant lesquels nous sommes devant notre écran...
- Ces centres d'intĂ©rĂȘts, ils les connaissent non seulement au travers du moteur "Web" classique, mais aussi au travers de nos investigations sur les moteurs d'actualitĂ©s (et leur systĂšme d'alertes par mail, redoutables rĂ©vĂ©lateurs de nos thĂšmes de veille), sur les livres, les catalogues, le cinĂ©ma, les blogs, les images, les vidĂ©os, et j'en passe bien d'autres...
- Ils savent aussi ce que l'on achÚte en ligne au travers des comparateurs de prix ou tout simplement des moteurs web que nous utilisons pour trouver des informations sur des produits particuliers... Des outils comme les solutions de paiement Paypal ou Google Checkout peuvent aussi donner des informations intéressantes...
- Les moteurs savent bien sûr tout de notre équipement informatique : PC/Mac, systÚme d'exploitation utilisé, taille de l'écran, navigateur, etc. puisque ces informations sont fournies par le protocole Web. Autant de données commercialement intéressantes...
- Les barres d'outils et les clics que nous faisons dans les pages de résultats dévoilent les sites que nous allons visiter. Y pensons-nous toujours lorsque nous décidons de nous "divertir" en ligne ? ;-))
- La gĂ©olocalisation qui, au vu des enjeux publicitaires Ă©normes qu'elle gĂ©nĂ©re, fait de plus en plus de progrĂšs, indique, parfois Ă quelques kilomĂštres prĂšs, oĂč nous nous situons gĂ©ographiquement parlant...
- Avec les systĂšmes de "comptes utilisateurs" que proposent tous les grands moteurs / portails actuels, ce sont bon nombre de donnĂ©es personnelles que nous indiquons : adresse postale, numĂ©ro de tĂ©lĂ©phone, parfois, sexe, date de naissance, etc. Voire nos coordonnĂ©es bancaires si l'on veut ĂȘtre payĂ© par virement lorsqu'on affiche des liens contextuels sur nos sites...
- Les webmails, outils de partage d'informations et messageries instantanées dévoilent nos connaissances et nos relations, personelles et professionnelles... Et que dire des outils communautaires et de "réseaux sociaux" ?
- Quant à notre agenda, des outils comme Google Calendar s'en chargent trÚs bien... hébergés sur les serveurs du moteur et pas sur nos machines...
- Bien entendu, les fichiers de nos ordinateurs sont lus par les outils de "Desktop Search" disponibles, et nos fichiers Word et Excel vont de plus en plus ĂȘtre disponibles en ligne, partageables par plusieurs utilisateurs et... hĂ©bergĂ©s Ă distance sur les serveurs des moteurs. Donc potentiellement lisibles Ă tout moment par un tiers...
- Et si l'on parlait de nos déplacements personnels ou professionnels ? Ne pensez-vous pas que des outils comme Google Maps, Virtual Earth ou Yahoo! Local fournissent de trÚs nombreuses informations aux outils de recherche ?
- Et les moteurs verticaux, spĂ©cifiques Ă une thĂ©matique donnĂ©e, comme ceux que proposent certains outils spĂ©cialisĂ©s pour les enfants ou les Ă©tudiants ? Et oui, nos chĂšres petites tĂȘtes blondes n'y Ă©chappent pas....
- Et encore, je passerai sous silence nos "dĂ©viances" analysables pourtant sur des moteurs de recherche d'images et de vidĂ©os car chacun sait bien que cela ne nous rĂ©garde pas... đ
Bref, à la réflexion, il est étonnant de voir à quel point les moteurs de recherche actuels peuvent, potentiellement, obtenir des informations d'ordre privé sur nous. Bien sûr, cela ne signifie pas qu'il le font, qu'ils recoupent toutes ces données, et il n'est nullement l'objet de ce post de dire que les moteurs sont des "Big Brother" à la solde des gouvernements et qui savent tout de nous à la minute prÚs.
Le but, ici, est plutĂŽt de relever l'incroyable potentiel que dĂ©tiennent ces outils en matiĂšre de pĂ©nĂ©tration de nos vies privĂ©es et les Ă©ventuelles dĂ©rives que cela peut gĂ©nĂ©rer. Il ne faut pas l'oublier... Et cela ne concerne pas que Google, qui est assez rĂ©guliĂšrement attquĂ© sur ce sujet. La problĂ©matique est identique pour TOUS les moteurs. Peut-ĂȘtre faudra-t-il que des groupes de travail soient créés, si ce n'est dĂ©jĂ fait, pour apprĂ©hender ce phĂ©nomĂšne qui peut bien nous dĂ©passer rapidement et proposer quelques gardes-fous salutaires...
Bien entendu, le but de ce post n'est pas nonplus d'instaurer une panique dans la tĂȘte des utilisateurs. Je reste moi-mĂȘme un inconditionnel des moteurs de recherche que j'utilise Ă longueur de journĂ©e. Mais je me dis que je devrais peut-ĂȘtre parfois faire attention Ă la façon dont je m'en sers car parfois, j'ai l'impression qu'ils me connaissent mieux que je ne me connais moi-mĂȘme...
Je suis nĂ©ophyte dans le domaine mais je commence quand mĂȘme Ă m’y retrouver. Pendant des annĂ©es, j’ai Ă©tĂ© trĂšs prudente concernant mes traces sur le net mais depuis quelques mois, je l’utilise beaucoup plus souvent. J’ai eu la bĂȘtise d’installer google desktop pendant quelques temps. Et le pire, c’est que quand j’ai voulu effacer le logiciel de mon HD, ça n’a pas Ă©tĂ© facile! En lisant cet article (un peu tard certes), j’ai ressenti de nouveau l’affreuse sensation d’ĂȘtre espionnĂ©e…
Google Inc a suivi trois axes de dĂ©veloppement : dĂ©multiplication spĂ©cialisĂ©e du moteur de recherche, nouveaux logiciels et services et nouvelle technologie publicitaire. Ces trois axes ne sont pas conçus pour ĂȘtre indĂ©pendants : lâobjectif de l’entreprise, câest dâoptimiser leur interactivitĂ© et leur « interinformativitĂ© ». Les fonctions sont interdĂ©pendantes, et les informations livrĂ©es circulent entre les diffĂ©rents outils : ce rĂ©seau logiciel est parcouru par la sĂšve bio-data-graphique du client.
Je propose, toujours sur Agit-Log, une sĂ©rie de rĂ©flexions sur la question de la surveillance gĂ©nĂ©ralisĂ©e sur internet – en revenant notamment sur l’Ă©pisode AOL et ce qu’il peut nous dire du pouvoir de google.
Bien Ă vous,
Agit-Log
http://agitlog.zeblog.com/149191-iv-ubu-iquite-du-cyber-biopouvoir-geek-l-39-empire-google/
Fraggle a dit :
Comme disait quelqu’un que je connais bien, lorsqu’on surfe on est comme des jeunes mariĂ©s: on laisse plein de casseroles ! et dĂ©poser un CV (par ex dĂ©but 2007) on pourrait le retrouver 3 ans + tard avec des rĂ©fĂ©rences personnelles… Danger
===
Je retrouve des rĂ©ponses que j’ai donnĂ© dans des forums voici prĂšs de 5 ans !!! Ma femme Ă croisĂ© un article qu’elle a rĂ©digĂ© dĂ©but 2000 , et qui , depuis, ne reflĂšte plus les donnĂ©es actuelles.
Des avis de recherches d’enfants disparus, et rentrĂ©s Ă bon port depuis des annĂ©es, sont encore Ă trainer et nous interpeler.
Bienvenue dans le Deep Web !
Un groupe de travail serait en effet trĂšs intĂ©ressant voir salutaire, la question se pose d’oĂč se situe la frontiĂšre de la rĂ©colte d’Ă©lĂ©ments nominatifs et non nominatifs.
En effet on pense qu’en donnant simplement un numĂ©ro Ă l’internaute et en y associant ni adresse mail ni nom prĂ©nom ni adresse mais seulement un historique de surf cela garantie la confidentialitĂ©, or cet article semble montrer le contraire.
Comme disait quelqu’un que je connais bien, lorsqu’on surfe on est comme des jeunes mariĂ©s: on laisse plein de casseroles ! et dĂ©poser un CV (par ex dĂ©but 2007) on pourrait le retrouver 3 ans + tard avec des rĂ©fĂ©rences personnelles… Danger
« Et bien, cela a suffi pour que quelques observateurs fassent des recherches et arrivent Ă identifier certaines personnes, retrouvant leur nom, leur adresse, leur numĂ©ro de tĂ©lĂ©phone rien qu’en analysant les recherches qu’elles avaient faites sur le moteur. »
La question, c’est comment ?
Le drame, c’est que trĂšs peu d’internautes sont conscients des traces qu’ils sĂšment en surfant sur le net.
Sans pour autant cĂ©der Ă la panique, la maitrise de l’identitĂ© numĂ©rique sera sans doute un des enjeux essentiels des annĂ©es Ă venir. Internet Ă©tait jusqu’alors un espace d’expression et de libertĂ© plus ou moins absolue. Avec la puissance des outils de recherches, il devient maintenant essentiel de maĂźtriser son image en ligne…
Le but, ici, est plutĂŽt de relever l’incroyable potentiel que dĂ©tiennent ces outils en matiĂšre de pĂ©nĂ©tration de nos vies privĂ©es et les Ă©ventuelles dĂ©rives que cela peut gĂ©nĂ©rer. Il ne faut pas l’oublier…
C’est certain… Heureusement que tout le monde n’est pas capable d’analyser toutes ces donnĂ©es đ
Bonjour,
Effectivement, en dehors de la considĂ©ration de la relative « traçabilité » (car mĂȘme si cela n’est pas adoptĂ© forcĂ©ment par le grand public, il est possible de passer par des proxys, d’utiliser et de configurer ses logiciels -navigateurs : cookies , user agent et javascript, pare-feu, antispyware etc – pour ne pas donner ces informations), cela soulĂšve aussi la question de l’identitĂ© numĂ©rique (quelle est l’image que je donne sur internet, au travers des rĂ©sultats de recherches que l’on peut effectuer sur mon nom, mon pseudo, le nom de ma sociĂ©tĂ©…), qui va Ă mon avis gĂ©nĂ©rer de nombreux emplois dans les annĂ©es Ă venir…