Captcha e rimedi ai commenti SPAM

Tre settimane senza curare il benessere del blog e mi ritrovo con 370 commenti di spam da pulire ad uno ad uno poiché… la speranza di un buon commento è l’ultima a morire.
Cosa fare dunque per fermare lo SPAM?

  1. richiedere la registrazione al blog;
  2. richiedere la validazione dell’indirizzo e-mail;
  3. utilizzare un captcha

1) Richiedere la registrazione al blog

Avanti, siamo realisti! Sono pochi i blog non professionali che valgano una registrazione e – aimè – non sono tanto superba da ascrivere il mio a una così ristretta cerchia. La volontà di commento è un sentimento tanto estemporaneo da suggerire di …non far passare la voglia richiedendo una registrazione.
Oltretutto, l’archiviazione di dati sensibili (l’indirizzo e-mail è considerato tale dal garante della privacy: ordinanza 18 settembre 2008) richiede l’assunzione di impegni legali che i blog non professionali difficilmente hanno interesse a sostenere.

2) Richiedere la validazione dell’indirizzo e-mail

Tra le opzioni della moderazione di WordPress c’è la possibilità di filtrare i commenti richiedendo che l’indirizzo e-mail fornito dall’autore venga “autorizzato” ossia esista un precedente commento approvato pervenuto dal medesimo indirizzo. Oltre ad incorrere nel problema dell’archiviazione di indirizzi e-mail, come nel caso precedente, qui si incorre nel dilemma della moderazione: conviene subordinare la visibilità immediata di un commento alla sua approvazione?
Se esistesse una redazione con personale impiegato alla moderazione a tempo 0 dei commenti, direi che ne varrebbe la pena. In questo caso ci sono solo io e i miei tempi limitati quindi preferisco optare per la moderazione a posteriori con alcune precauzioni:

  1. Configurazione delle impostazioni anti spam incluse nell’installazione default di WordPress, come illustrato nel Codex: limite massimo di link inclusi nei commenti, elenco di “parole proibite” etc. ;
  2. utilizzo del filtro fornito dal plug-in Akismet o simili per bloccare il grosso dei commenti lesivi

Per il resto conto sulla buona educazione dei miei lettori.

3) Utilizzare un captcha

Con le precauzione adottate riesco ad evitare di pubblicare commenti inadeguati, tuttavia mi resta da fare un gran lavoro manuale di pulizia dello spam.
Un sistema per bloccare sul nascere i commenti di spam prodotti da agenti automatici (spambot) è l’utilizzo dei captcha. Questa soluzione, peraltro divenuta un pattern web classificato, consiste in un test di riconoscimento visivo finalizzato a determinare se l’utente è un umano o una macchina e, di conseguenza, ad abilitare o bloccare l’invio del messaggio.
I captcha classici presentano un’immagine contenente numeri o lettere storpiate perfettamente riconoscibili per un umano, meno per una macchina. Esistono anche versioni uditive dei captcha e altri basati sul riconoscimento di volti o su test logici. Google ha da poco reso pubblica una nuova metodologia basata sulla rotazione di immagini che sembra essere altrettanto efficace e più “divertente” della versione tradizionale.
In ogni caso i captcha presentano dei limiti:

di accessibilità:
poiché sono immagini sono inaccessibili a utenti con disabilità visive e poichè sono test ideati per aggirare le macchine diventano incomprensibili per molte tecnologie assistive;
di efficacia:
molti spambot si sono evoluti in modo da superare il test, tramite tecniche di OCR o addirittura registrando le risposte degli utenti e riutilizzandole. Si è arrivati al punto che alcuni algoritmi captcha, per prevenire l’evenienza degli spambot evoluti, hanno sviluppato dei test di difficile risoluzione persino per i veri utenti…
di efficienza:
qualcuno potrebbe obiettare che l’uso di captcha rallenta l’inserimento del messaggio e potrebbe far perdere la famosa “volontà di commento” all’utente. Onestamente, l’impegno ed il tempo richiesto dai più semplici captcha è veramente poco, tanto che converrebbe porsi la domanda inversa ossia se vale la pena postare un commento se per scriverlo si è speso meno tempo di quello richiesto dalla compilazione del captcha….

Dovrebbe risultare chiara a questo punto la mia preferenza e la necessità (370 commenti di spam in 3 settimane, distribuiti sui soli 4 post della home page…) di ricorrere ad un plug-in per i captcha. WordPress ne offre diversi: dai tradizionali basati su numeri e lettere ad altri basati sul riconoscimento di immagini. Tra i tanti mi ha colpito in modo favorevole Ajax Fancy Captcha poiché – oltre ad essere esteticamente gradevole – è basato su una soluzione drag&drop che non avevo mai visto prima.
Quindi, cedendo alla vanità estetica, provo questo plugin per un po’ e vedo se mi aiuta a ridurre il lavoro manuale di pulizia dello spam. Provatelo, ditemi cosa ne pensate. Io vi farò sapere se è di aiuto o meno.

Ajax Fancy Captcha

Installazione piuttosto problematica per questo plugin.
Innanzitutto la cartella contenuta nello zip ha un nome diverso da quello impostato all’interno dei file: se volete che funzioni correttamente cambiate il nome da “ajax-fancy-captcha” a “AjaxFancyCaptcha” e ricordatevi di mettere la cartellina sotto il folder “wp-content/plugin”.
Il box è in lingua inglese, per convertirlo in italiano bisogna lavorare sui seguenti file:

  • nel folder “AjaxFancyCaptcha/imgs/” rinominare i file immagine da “item-pencil.png” a “item-matita.png”;
  • nel file “AjaxFancyCaptcha/jquery.captcha.js” modificare il testo del box con le istruzioni, ricordandosi che gli apostrofi devono essere preceduti da un backslash (\);
  • nel file “AjaxFancyCaptcha/afc.php” modificare i nomi degli elementi dell’array;
  • nel file “AjaxFancyCaptcha/captcha.css” aggiustare i css per adattarli alla maggiore lunghezza dei testi in italiano.

Ho creato uno zip con i miei adattamenti e segnalato agli autori del plugin la mia disponibilità a fornire la traduzione in italiano.

Aggiornamento

Ho rimosso il plugin poiché sono stati più i problemi dei vantaggi nel suo utilizzo:

  1. problemi di lingua: era solo in inglese;
  2. problemi di accessibilità: se js è disabilitato non funziona;
  3. problemi di funzionamento: ogni tanto in modo misterioso il drag&drop smetteva di funzionare, uno dei js inclusi andava in errore ed interferiva con il plugin lightbox

Ho rimosso il pacchetto zip con la traduzione poiché temo di aver “rotto” qualcosa. Anche il pacchetto in inglese dava problemi ma dopo la traduzione è andata solo peggio.

reCAPTCHA

Esiste un sistema per sfruttare positivamente la “seccatura” della compilazione di un captcha. Il metodo reCaptcha elaborato dalla Carnegie Mellon University sfrutta la collaborazione degli utenti per disambiguare immagini frutto della conversione OCR di manoscritti storici. Quando si riscontra una sostanziale convergenza nelle “traduzioni” fornite dagli utenti, l’interpretazione viene assegnata alla parola. In questo modo si contribuisce al progetto di digitalizzazione di libri.
Il plugin per WordPress è semplice da installare e viene fornito con quattro differenti grafiche ed il supporto alla versione audio. Funziona anche in caso di js disabilitato, permette di escludere la protezione captcha per gli utenti registrati ed ulteriormente offre un supporto per la protezione degli indirizzi e-mail presenti sul blog, nei post, nei commenti e persino negli RSS.
Per utilizzare questo plugin è necessario procurarsi gratuitamente una chiave sul sito ufficiale reCAPTCHA.

Aggiornamento

In due settimane 363 commenti di spam. Il captcha non ha funzionato per niente.

Secondo aggiornamento

Ho avuto forse troppa fretta nel valutare la capacità di reCaptcha d tenere a bada i commenti di spam. Nel lungo periodo i risultati si sono visti significativamente: adesso la media dei commenti di spam è di 10/15 al mese. Tra l’altro, prevalentemente sui post che per primi erano stati attaccati massivamente dagli spambot.
Sono decisamente soddisfatta di questo plugin, ha ricondotto il fenomeno nei limiti del gestibile.

5 commenti su “Captcha e rimedi ai commenti SPAM”

  1. Dom93 ha detto:

    un rimedio è utilizzare le email temporanee nelle registrazioni, come detto anche qui: http://in2mag.com/index.php/2009/05/lantidoto-contro-lo-spam/

  2. timendum ha detto:

    A me il campo non risulta svuotato quando faccio “indietro”…

  3. Ziqu ha detto:

    ulteriori problemi:
    1) ogni tanto va in “tilt” e non consente il drag&drop degli oggetti ;
    2) ogni tanto, pur trascinando l’oggetto giusto, restituisce un errore;
    3) in caso di errore il campo messaggio viene svuotato: il testo è comunque in memoria ma non è reso evidente all’utente.

  4. Ziqu ha detto:

    Grazie per il test.
    Anche io ho notato il “problema” di accessibilità di questo plugin e stavo vagliando altre soluzioni. Per altro, noto dalla pagina degli autori che il difetto è noto ma non è mai stato fixato.
    Oltre a questo ci sono almeno altri 3 problemi:
    1) anche gli utenti registrati sono obbligati a compilarsi il captcha;
    2) uno degli script va in errore;
    3) si crea un’interferenza con plugin Lightbox.

    Direi che stando così le cose, AFC verrà scartato nonostante tutte le tribolazioni per farlo funzionare.

    reCaptcha è una soluzione che mi interessa, infatti sto “studiandomi” il plugin come seconda scelta.

    Quanto ai famosi 370 commenti erano in effetti tutta spam ma io ci spero sempre in un qualche lettore nuovo….

  5. timendum ha detto:

    Prova di commento, senza il Javascript, i controlli non appaiono ma il commento originale non è stato approvato, quindi direi che come accessibilità è così così…

    Tra i CAPTCHA segnalo anche il famoso reCAPTCHA, che oltre alla soluzione di lettura (e audio) contribuisce alla digitalizzazione di alcuni libri, l’utente viene infatti sfruttato come OCR umano.

    Alternative invece sono sistemi di commenti esterni (come DISQUS o Intense Debate), che dovrebbero centralizzare l’individuazione di spam.

    PS ma su tutti quei commenti quanti non erano spam? forse il gioco non vale la candela…

Commenti chiusi