On se demande parfois comment les moteurs de recherche font pour indexer autant de pages Web, même les plus obscures. Intuitivement, on se dit que, même s'il y a beaucoup de pages avec beaucoup de liens dans chaque page, il doit y avoir des pans entier du Web qui ne sont pas connectés entre eux. Par exemple, la page A a des liens vers B et C, B a un lien vers C, C a un lien vers A, D a un liens vers E et E a un lien vers D. On voit que les groupes de pages ABC et DE sont indépendants. Si le moteur de recherche sait que la page A existe, il indexera B et C mais n'aura jamais connaissance de D et E. C'est pourquoi, aux débuts des moteurs de recherche, un lien "Ajouter un site" était présent en évidence sur la page de recherche. Il permettait d'avertir le moteur qu'un site existait, et ainsi le faire prendre en compte dans les recherches. Il a depuis disparu, la base de données étant maintenant assez vaste pour ne plus oublier grand-chose. Mais comment font les moteurs de recherche pour avoir connaissance de pages peu ou pas liées, et ainsi fournir des résultats de recherche plus complets que leurs concurrents ? Pour Bing (Microsoft), c'est simple. Il semblerait qu'il ignore délibérément les directives des webmasters demandant aux moteurs de ne pas indexer certaines parties de leur site (robots.txt). Cela permet à Bing d'avoir connaissance de pages que Google, qui respecte ces directives, ne connaîtra pas. Quelle est la contre-offensive de Google ? Leurs algorithmes sont assez opaques, mais une petite aventure qui nous est arrivée aujourd'hui peut donner quelques pistes. Nous possédions une page secrète sur notre site. Cette page n'est liée par aucune autre page. Nous connaissons simplement son nom (qui est introuvable par essai et erreur), ce nom n'étant stocké que dans les onglets de nos navigateurs personnels. Or cette page vient de se retrouver listée dans les résultats de recherches Google. Comment Google a-t-il connu ce nom de page secret ? Nous avons vérifié, aucun hacker n'a posté ce nom dans une autre page Web connue de Google. Nous-même, nous ne l'avons pas envoyé sur notre compte gmail et ne l'avons à notre connaissance pas copié/collé dans la barre de recherche Google. Seules solutions possibles, d'après nous : 1- Nous avons accédé à cette page en entrant son adresse dans la barre d'adresse de Safari, Firefox et Chrome. L'un de ces produits peut-il envoyer l'adresse de la requète à Google pour compléter sa base de données ? ou 2- Lors de l'installation des navigateurs, nous avons transféré nos onglets de l'un à l'autre. Les onglets sont-ils envoyés à un moment ou à un autre à Google pour analyse? Dans les deux cas, il nous semble qu'il y a violation manifeste de la sphère privée. Pour s'en assurer, il faudrait mettre en place un "pot à miel" : créer un ensemble de pages au nom compliqué, non liées de l'extérieur. - Entrer l'URL de la première dans la barre de recherche Google - Mettre la seconde dans les onglets de Chrome, Firefox & Safari - Taper l'URL de la 3e dans la barre d'adresse des 3 navigateurs - Renouveler l'opération régulièrement, jusqu'à ce que l'une des trois se retrouve référencée sur Google... |
|
|
by Olivier Guillion | | | |
|
Comments
Souriez... Vous êtes suivis ! Bientôt quand j'aurai paumé mon code de carte bancaire, y aura qu'à questionner Google pour récupérer l'info... C'est sympa : quand je serai devenu gaga, je demanderai que Google soit mon tuteur : normal, il sera le seul à tout se rappeler de moi depuis le berceau ! |
|
| 
Pour les favoris, au moins pour Chrome, il y a un "service" qui les stocke dans le nuage google (si on a un compte google), ainsi on retrouve les favoris sur un téléphone/une tablette Android. Sur ma tablette j'ai ainsi récupéré les favoris du boulot, pas ceux de la maison Même aventure, avec une page "secrète" le temps de la construction, sur un site tout neuf... rapidement tout référencé, mais utilisant une messagerie Gmail ainsi que certains de mes correspondants avec qui j'ai échangé le lien, je me suis dit qu'il l'avait chopé par là. |
|
| 
Bonjour, Avec les applis optionnelles de la barre d'outils Google, incluse d'office dans Google Chrome, si je peux pas y accéder anonymement, je passe mon chemin : c'est évidemment le cas pour G-Mail : y ouvrir un compte, c'est mettre un doigt dans une moulinette implacable Normal que ce truc cherche sans cesse à profiler le pékin : c'est son casse-croùte de le livrer comme otage à la Pub déchaînée... Cela n'empêche pas d'autres poisons de s'instiller dans une bécane selon la même méthode : j'ai retrouvé un contact de messagerie privée sur Face de bouc, comme proposition de nouvel "Ami" ! Réaction du vieux réfractaire que je suis : j'ai bouclé aussi sec et sans regret mon compte F-B, mais ont-ils gommé ce qu'ils savaient de moi ? J'ai les plus grands doutes à ce sujet, et je ne suis pas seul à penser comme ça... Un jour ou l'autre, ce genre de pratique souterraine gougeulnafière va donner lieu à des procédures judiciaires du plus bel intérêt, parce qu'il faut bien un jour que ce bazar subisse le contre-coup de ses atteintes récurrentes aux libertés individuelles fondamentales, dont la confidentialité des données est la seule garantie objective reconnue par le Droit Amitiés |
|
| 
Bonsoir Si Google a écrit Chrome, ce n'est pas pour embêter Microsoft, ni pour nos beaux yeux. Idem pour les barres de recherche, ce sont autant d'espion installés par nous-mêmes sur nos machines. Et Apple qui veut que tout ce que vous mettez sur votre téléphone passe par chez lui, tout comme les logiciels que vous installez ... Et Microsoft qui fait pareil dans l'indifférence générale... Le pouvoir politique se désintéresse de tout ça, quel que soit le pays. Des procès pour quoi faire ? Autant donner des millions de dollars aux pauvres plutôt qu'à des avocats. |
|
|
|
|
|