Myriad Blog 1.3.0 Friday, Sep 19th, 2014 at 09:54am 

Tuesday, Apr 25th, 2006 at 10:35am
Spam-terrorisme
Le spam est un véritable fléau moderne, et apporte la preuve de l'incommensurable étendue de la bêtise humaine et de la propension d'une poignée d'abrutis à détourner les meilleurs concepts.
Si vous avez eu le malheur de publier votre adresse électronique en clair sur Internet, vous avez probablement reçu ces messages (souvent en anglais) vantant les mérites d'une pilule bleue pas chère à base d'herbe, d'une formation rapide et illustrée à quelque spécialité médicale, ou d'un nouveau moyen de se faire de l'argent vite et sans effort.
 
Quand ce n'est pas une proposition pour acquérir une liste de 1 million d'adresses e-mail auxquelles vous pourrez vous-même envoyer du spam. Ca fait frémir, sachant que votre propre adresse est dans la liste puisque vous avez reçu ce message !
 
Donc, si vous avez décidé de céder au terrorisme, vous avez supprimé votre adresse e-mail de votre site personnel, et ponctué celle-ci de "pleasenospam" ou "enlevezceci" lorsque vous postez sur les newsgroups afin de la rendre difficilement récupérable.
A ce sujet, la surcharge d'adresse la plus inventive que j'ai vue était du type :
jean@dupontle_temoin_genant.net
avec la mention : pour m'écrire, supprimez le_temoin_genant.
 
Dans le cas contraire, ou si votre vigilance a été mise en défaut ne serait-ce qu'une fois, vous recevez probablement un minimum de 80% de spam. Si ce chiffre ne vous dit rien, considérez que nos boîtes aux lettres sont assaillies quotidiennement par un bon millier de messages de ce type.
Cela rend quasiment impossible de faire le tri manuellement, et le risque d'éliminer par erreur un message valide devient important.
 
Il y a maintenant quelques années, j'ai découvert l'excellent Popfile, de John Graham-Cumming, un freeware écrit en Perl (donc normalement, pouvant potentiellement fonctionner sur n'importe quel système) qui permet de classer les messages en fonction de leur contenu.
Il s'agit d'un filtre "Bayesien", principe maintenant devenu à la mode, mais qui vient, rappelons-le, du théorème du révérend presbytérien Thomas Bayes, publié au 18e siècle.
 
En pratique, un tel filtre est un "proxy", qui s'intercale entre votre boîte aux lettres externe et votre lecteur de courrier. Il analyse tous les mots contenus dans chaque e-mail, et classe le message dans une des catégories que vous avez définie, en fonction des "scores" obtenus. Le sujet du message peut alors modifié pour refléter le résultat de ce classement. Charge à votre lecteur de mail de ranger ensuite les e-mails reçus en fonction de cette modification (par exemple, la présence du mot [spam] les envoie directement à la poubelle).
 
Si le mail est mal classé (un frontal Web local permet de gérer ceci), il faut que l'utilisateur indique la bonne catégorie, apprenant ainsi au système à mieux classer ce genre de messages la prochaine fois.
 
La vitesse d'apprentissage est surprenante. Après seulement une dizaine de mails reçus et correctement classés par l'utilisateur, Popfile reconnaît tout seul des types de spam qu'il n'avait pas encore rencontrés, et le pourcentage de fiabilité monte très rapidement à plus de 99%, voire 99,9% !
 
Mais, même arrivé à ce taux, cela ne dispense pas l'utilisateur de vérifier périodiquement si certains mails ont été mal classés, afin de parfaire l'apprentissage du filtre et d'éviter de rater certains "bons" mails.
 
Un avantage non négligeable est que chaque utilisateur possède sa propre "base de données" de mots, en fonction de ses centres d'intérêt (le mot "viagra" peut être considéré comme un bon indicateur de spam par la plupart d'entre nous, mais pas pour un pharmacien), réduisant ainsi les possibilités de contournement du système.
 
Donc, quand vous nous écrivez, un sujet clair permet de vous assurer que votre courrier nous parvient. Si vous utilisez par exemple le sujet "Import MIDI dans Harmony Assistant" plutôt que "Ca marche pas" ou "J'ai besoin de viagra", vous minimisez les risques que votre courrier se voit éliminé sans même être lu...
by Olivier Guillion


Most recent first
Oldest first

Top of page
Last update:  (c) Myriad 2013