Mail encoder
Par batmat le samedi 13 mai 2006, 16:10 - Technique - Lien permanent
J'ai écrit une page qui vous permet d'encoder vos adresses email. Je l'ai fait parce que celle qui était auparavant disponible chez Olivier semble ne plus l'être.
Cette technique permet de réduire le nombre de spams reçus. Toutefois, bien évidemment, il ne s'agit en aucun cas d'une technique infaillible. Je parle bien d'encodage et non de cryptage. Un robot un peu élaboré n'aura donc pas plus de mal à récupérer pouet@free.fr que %70%6f%66%40%66%72%65%65%2e%66%72.
Il s'agit en l'occurrence simplement d'une sorte de petite bidouille qui met seulement hors-jeu les robots collecteurs les moins élaborés. Et l'expérience semble montrer que la plupart des robots ne s'embêtent pas à tenter de récupérer les adresses encodées, il doit y en avoir déjà largement suffisamment qui ne le sont pas... Il existe un nombre important de façon de rendre plus difficile aux robots la récupération des adresses email. La technique en question d'encodage présente surtout l'intérêt d'être directement utilisable dans un lien mailto.
Ça me fait penser à autre chose : personnellement, lorsque j'écris une adresse au format texte, du style moi chez free point fr, je le fais en essayant d'utilisant des modèles pas trop standards, mélangeant les langues, at avec point, chez et dot, écrivant POWAIN au lieu de POINT lorsque le sérieux de l'endroit me le permet (e.g. pas sur un CV). Je vous conseille de faire de même si vous êtes paranoïaques. En effet, il semble envisageable d'écrire un programme qui récupère simplement tout ce qui ressemble à l'expression suivante : "(.*POINT)+CHEZ(.*POINT).*" ou quelque chose de ce genre afin de récupérer sur la toile un grand nombre d'adresses écrites dans ce format à la mode... Il serait peut-être intéressant d'écrire un pareil robot pour voir la faisabilité de la chose, mais ça me semble hautement faisable [1]...
Notes
[1] Notez que je parle ici uniquement de prouesse technique, et en aucun cas je ne pense à cela dans le but de devenir un spammer professionnel. Je vous encourage grandement à ne pas le faire non plus dans ce but si vous ne souhaitez pas recevoir ma plus grande inimitié et celle de la plupart des internautes de la planète (cf. mon rêve de désouder un spammer)
Commentaires
Je te reconnais bien là Bamt toujours prêt à désouder un spammer
Je te vois bien en chasseur de primes antispam...bonne nhuitre !
Ben si on peut rendre service ;-).
Juste là comme ça une question : si n'importe quel navigateur comprend l'encodage, pourquoi le robot ne comprendrait pas ???
il suffit de prendre ce qui suit le mailto et désencoder, c'est plus simple que d'aller fouiller une adresse comme : abonné point delonguedate chez la voisine de free point effeère.
Moi y'en a pas comprendre l'intérêt du tout, mais si on me prouve que ça a un réel intérêt alors là je prend tout de suite.
Au fait apparement y'a comme un bug dans les commentaire par ici.
Si je clique sur sauvegarder sans me relire (mauvaise habitude, je sais), Spamplemousse m'envoie un doux message d'erreur...
Ce n'est pas normal que ça pose problème.
J'ai testé plusieurs fois avec le contenu de ton commentaire : la première fois, j'ai eu ton erreur. J'ai juste ajouté un saut de ligne à la ligne 102 et je n'ai plus le problème maintenant :-/.
Je pense toutefois que ça n'a pas réglé le pb. Si tu arrives à redéclencher l'erreur, (re)fais moi signe.
Merci
Il est clair que cette technique n'est pas infaillible. Je l'ai d'ailleurs dit plusieurs fois : ce système ne va dérouter que les robots qui ne parsent que le text brut/ascii de base.
En l'occurrence, par exemple, un robot de base n'ira pas forcément naturellement convertir "%20" en " ". Si le navigateur le fait si bien, c'est que par contre, pour lui, C'EST naturel : cet encodage est standard pour les URL. Le robot va lui parser % comme un %, 2 comme un 2 et 0 comme un 0 (je parle toujours d'un robot basique, bien sûr) et ne verra donc pas l'email encodé et passera son chemin.
Donc, oui : n'importe quel robot intelligent pourra désencoder ce type d'adresse. Mais l'expérience semble montrer que peu doivent le faire : les adresses encodées comme ça sont généralement assez peu spammées (au jugé du volume, personnellement, ça se vérifie).
Quel intérêt ou avantage ? Simple : si tu écris un site où tu références des adresses pour des gens pas ou peu au fait des problèmes liés aux emails sur Internet. Tu vas réduire simplement le nombre de spams reçus par cette adresse tout en permettant aux utilisateurs de l'utiliser naturellement au clic sur le lien "mailto:". Si tes utilisateurs n'ont strictement aucune idée de comment remplacer "abonné point delonguedate chez la voisine de free point effeère" par la vraie adresse équivalente, et que tu ne peux pas te passer des novices comme clientèle, alors un bon intermédiaire est certainement de générer le mail encodé "%61%62%6f%6e%6e%65%2e%64%65%6c%6f%6e%67%75%65%64%61%74%65%40%76%6f%69%73%69%6e%65%2e%66%72%65%65%2e%66%72" :-).