Le blog de florimond

Spam de blog

Posted on: 4 juillet 2006

On trouve à boire et à manger dans ces pages.

Il n’aurait pas fallu très longtemps au premier spammeur pour s’attaquer aux commentaires de ce blog. La première pollution a été déposée ce matin même à 10h56, soit moins de trois semaines après l’ouverture du dotclear « de production ». Alors oui, le sujet « single woman » est susceptible de m’intéresser, mais non, je crois que je vais me passer de ce genre de, hum, « service », et en particulier non merci pour la publicité via mon blog.

Attendez vous bientôt à l’installation de quelques plugin du genre Spamplemousse sur ce blog.

Edition du 20 juillet : en pratique, Spamplemousse est efficace mais m’a rapidement montré ses limites. J’ai donc adopté un captcha enfin d’empêcher les robots de remplir des pages et des pages de logs Spamplemousse qui deviennent inexploitables pour repêcher un commentaire légitime dans une file d’attente de mille messages postés en une nuit. Comme je suis sensibilisé aux thèmes d’accessibilité, j’ai opté pour une solution qui permettait de poser des questions aux lecteurs, ce qui ne défait pas les mécanismes d’aides classiques des personnes handicapées – en désactivant les options concernant les images déformées, qui me font la plupart du temps échouer moi-même. Plus d’informations dans les commentaires ci-dessous.

21 Réponses to "Spam de blog"

Sur Overblog, me semble qu’ils ont mis en place un système de cryptogrames visuels à entrer pour valider un commentaire… Je sais pas ce que dotclear propose, mais profites-en…

Les cryptogrammes visuels, ça suxe (et les aveugles alors ? Ils font comment ?). Rien ne vaut un spam-filter bayésien style celui qu’a kim sur son blog.

SPAM!!! SPAM!!! SPAM!!! SPAM!!! SPAM!!! SPAM!!! SPAM!!! SPAM!!!

Je sens une espèce de coalition de « M. » contre moi. Pour répondre au premier, dotclear ne propose rien, basiquement. Il y a deux liens vers des plugins depuis le site ; en ce qui me concerne je pensais plutôt utiliser un champ caché pour détecter les robots qui remplissent porcinement – méthode décrite par ploum. Pour répondre au second, je dirai « bien essayé, mais non ! » 🙂 Et effectivement, les captcha c’est le mal.

./1 : les crypto visuels, ca suxe clairement.

Personnellement, je tourne sur :
* spamplemousse en premier lieu, qui fonctionne sur une blacklist de mots, ca filtre deja pres de 50% des spams
* derriere, spam clear, bayesien, qui commence a etre un peu efficace, il filtre 48% des spams.

Restent 2%, qui me font ch***. Et les 98% autres qu’il faut nettoyer, ca me lourde de le faire. Je compte donc ajouter une ptite option prise egalement sur les idees de ploum. On verra notamment un debut de ca sur mon blog, j’ai ajoute la checkbox. Curieusement il poste quand meme le commentaire alors que j’ai mis un test sur ce machin, il faut que j’en vois la raison. Cette checkbox devrait limiter un pti peu la quantite de spam, mais pas la qualite 🙂

C’est pas ultime apparemment (lire linuxfr.org/~ploum/22011…. qui est un bon condense de choses utiles) mais c’est deja ca.

Pourquoi pas 2 checkboxes? Une qu’il faudrait cocher et l’autre qu’il faudrait décocher. Avec changement aléatoire. Ca pourrait être pas mal…

pour info, juste avec la première astuce de ploum, je m’en sors à 4 spams par jour qui ne passent pas plus loin que spamplemousse (donc pas spamclear), ce qui est une diminution par 7/8 des taux actuels !

Une semaine apres, retour a la normale, autant de spam qu’avant. ploum a donc bien raison, cette solution "ne suffit pas"

Et donc ce matin au réveil, une jolie salve de 80 vomissures avait été commise sur ce blog. J’ai tenté les modifications proposées par ploum, qui n’ont pas l’air trop efficace ; maitenant il est possible que je me sois planté quelque part – toujours est-il que j’ai en repris 6 juste derrière.

S’ensuivit donc l’installation de Spamplemousse 1.2.5, avec résultats immédiats puisqu’une minute plus tard une pub’ pour du poker en ligne finissait dans la file de modération.

Suite au week-end, nous avons donc atteint un rythme de croisière de 2 spams par minute environ – plus de 900 entre minuit et demi et huit heures trente ce matin. À cette fréquence, il est évident qu’un tri manuel de ce qui est intercepté par Spamplemousse pour détecter les commentaires légitimes n’est plus envisageable. Il va donc me falloir avoir recours à une solution plus radicale, solution restant à définir pour le moment.

Malgré la souillure que je ressens, j’essaie de garder espoir et je ne ferme donc pas tous les commentaires – toute la pourriture étant pour le moment bloqué par Spamplemousse. En revanche, si vous recevez un message indiquant que votre message attend modération, il est très probable qu’il passe à la trappe au prochain flush de la file ; envoyez moi donc un mail avec l’heure à laquelle vous avez posté si vous voulez que je tente de le récupérer.

Bien, donc, une nouvelle approche avec le plug-in captcha accessible de l’atelier php.

Désolé, il va falloir bosser un peu pour pouvoir poster des commentaires. Dites moi si vous trouvez ça rédhibitoire.

C’est vaguement incompatible avec Spamplemousse, dans le sens où celui-ci intercepte les commentaires *avant* que ceux-ci ne soient validés par l’attrape-chat, donc je le désactive en serrant les fesses à titre probatoire pour ce soir.

Ah ! Bonjour à tous _o/

Je vois que ça bouge ici ! Je risque de repasser pour plus de verbosité…

On a parlé de moi ou j’ai rêvé ?

A+ Kim

Ahoï, Celui Par Qui Le Scandale Est Arrivé !

Car en cherchant un captcha accessible, on tombe essentiellement sur deux plug-ins pour dotclear : l’un de dash, et l’autre d’Olivier. Et c’est kimael qui m’a convaincu du bien fondé du premier. Si vous voulez utiliser le même, alors voir à l’adresse suivante : http://www.atelierphp5.com/un-captcha-accessible.html

Cependant, il semblerait qu’il faudrait que je revoie certaines questions … 🙂

Le captcha buggue quand il demande des résultats de multiplication dont un terme est zéro : quand tu réponds "0" il dit que c’est mal.

Bon, il semblerait que le captcha est bien pour les commentaires. Il reste à trouver une solution pour les trackbacks, suite au début d’attaque de cet après-midi.

_ezaK, j’ai désactivé les questions de multiplication, ça avait l’air trop difficile pour vous tous. 🙂

J’ai beaucoup de mal avec le prénom de Robert Zelazny. Je l’ai relativement fréquemment, celle-là…

./16 > pfff, Faudrait des vrais questions (donner un point d’inflexion de la fonction f(x) = (blablabla))
./17 > attend, je lui prepare un systeme de whitelist au poil (avec du spamplemousse et tout) 🙂

./15 > Je vais poster un billet chez moi, ca commence a faire long le texte 😀

Moi je vote pour la question : "Quel est l’âge du capitaine ? (chiffres)"
et là, plus de spam possible. Et plus de commentaire, non plus.

Ou alors, pour poster ton commentaire, si tu trouves pas la réponse, tu as le droit au 50/50, au coup de fil à un ami, ou au switch.

Ou alors, pour poster un commentaire, t’as un javascript qui te fait résoudre un nonogramme, et…

C’est quoi un trackback au fait ?

En gros, tu signales à un site qui a écrit quelque chose, que tu as réagi, ou relayé l’information. Tu pinges le site de départ enlui donnant l’info de ton site, ton billet, et quelques lignes. Le site de départ va afficher tout ça, comme ça, un lecteur peut suivre, avoir un avis qui diverge (et diverge, c’est énorme pour un seul homme) ou pas. Tres pratique 🙂

Répondre à fiftywan Annuler la réponse.

juillet 2006
L M M J V S D
 12
3456789
10111213141516
17181920212223
24252627282930
31