Myriad Blog 1.3.0 Thursday, Apr 24th, 2014 at 05:17pm 

Thursday, Oct 14th, 2010 at 05:13pm
Kooplet, étape 63 et autre

 
Nous avançons toujours sur le système de balayage des sites. Nous nous sommes heurtés à un problème assez compliqué qui n'avait jamais été résolu convenablement dans la version précédente du "crawler" : certains sites, pour être parcourus correctement, nécessitent un enregistrement de l'utilisateur.
C'est le cas notamment de CPDL.
 
Afin d'économiser la bande passante, les visiteurs se voient redirigés aléatoirement vers des sites miroir, ce qui perturbait notre robot. Heureusement, le webmaster de CPDL est également utilisateur de nos produits, il nous a donc aimablement ouvert un compte privilégié afin que nous puissions indexer tous les fichiers à notre guise.
 
Mais la phase de "login" nous a posé quelques problèmes. Le site est un wiki, donc pour éviter que des robots puissent s'enregistrer tout seuls et s'amuser sur les pages, des protections anti-robot ont été mises en place. L'analyse nous a montré qu'elles étaient similaires au système anti-spam de notre blog. Nous avons donc du gérer la prise en compte de cookies multiples, et récupérer des données générées dynamiquement sur les pages de log-in afin que notre robot puisse s'identifier correctement. Cela fonctionne maintenant.
 
 
Dans un tout autre domaine, nous avons reçu ce matin un e-mail qui nous a fait beaucoup rire.
Un utilisateur très soucieux de la confidentialité des échanges sur Internet s'est inscrit à notre liste de diffusion de la lettre d'information.
 
Dans l'e-mail de confirmation de l'inscription, nous terminons par le petit paragraphe suivant :
Quote:
Note : Afin d'éviter les abus, l'adresse IP de la personne ayant demandé ce message vous est communiquée ici.
Il s'agit de : xxx.xxx.xxx.xxx

Ceci permet d'éviter qu'un robot automatique, le voisin à qui vous avez rayé la voiture, ou un collègue de bureau un peu farceur n'inscrive votre adresse e-mail à votre insu juste pour rigoler. Avec l'adresse IP, vous pouvez vérifier que l'inscription provient bien de chez vous.
 
Voici donc le mail que nous avons reçu en retour. Je me suis permis d'en modifier légèrement la syntaxe afin que son auteur ne considère pas que nous dévoilons en public des éléments de correspondance privée .
Quote:
A ma demande d'information concernant vos produits, vous me menacez en me précisant que vous avez mon adresse IP. Je me suis inscrit sans mauvaise intention et en retour, je suis agressé par vous. Pour quelle raison ? Clarifiez votre démarche, vous améliorerez ainsi votre image auprès de vos clients de bonne foi.

Si ce monsieur savait qu'à chaque consultation d'une page sur un site, le serveur voyait son adresse IP en clair, je crains qu'il n'en perde d'un coup le sommeil et l'appétit. Les campagnes médiatiques paranogènes sur les dangers d'Internet ont, il semble, fait croire à certains que l'adresse IP était une information secrête, au même titre que le code de carte bleue ou la combinaison de son coffre-fort...
by Olivier Guillion
Comments

Comment from François Desjardins Thursday, Oct 14th, 2010 at 05:27pm
Lettres d'information.
Bonjour,
Je suis inscrit depuis belle lurette à cette rubrique, mais il me semble ne pas recevoir de message.


Most recent first
Oldest first

Top of page
Last update:  (c) Myriad 2013