¿Existe algún buen software para identificar usuarios de spam en un sitio con contenido generado por el usuario?

Gracias por el A2A.

No tenemos ningún software de reconocimiento de patrones ni nada de eso, pero hay algunas cosas que puede hacer para identificar a los spammers y deshacerse de su basura.

1. Mire las direcciones IP de los spammers. En nuestro caso, generalmente somos golpeados por un par de compañías cuyas personas de marketing piensan que la mejor manera de obtener los nombres de sus productos es publicar, y siempre provienen de la misma dirección IP. Todavía no hemos pedido a nuestros administradores de sistemas que bloqueen la dirección IP, pero pudimos.

2. Nuestro sitio tiene un sistema de “búsqueda guardada”, por lo que podemos configurar una alerta que busque palabras clave, especialmente el nombre de dominio, de las publicaciones de los spammers. En general, es bastante efectivo porque analiza lo que realmente se publica en el área de texto, por lo que no se puede ocultar un enlace detrás de la frase que aparece en la pantalla.

3. Utilizo una búsqueda similar para ver las preguntas y los artículos sobre el tema de correo no deseado más frecuente (para nosotros, tiene que ver con la migración de servidores de Exchange). Es un poco más de trabajo, pero se ha vuelto más efectivo durante el último año más o menos.

El mayor problema es el inevitable falso positivo. El abuso más común que encontramos es la gente que anuncia un producto, por lo que si alguien pregunta sobre un reemplazo o una alternativa para ese producto, aparecerá. Del mismo modo, alguien que dice “sí, usé ese software basura una vez y tuve que reconstruir mi servidor”, consideramos esa información valiosa, por lo que no queremos eliminarla.

Y eso plantea el peligro de demasiada automatización, o depender de uno o dos conjuntos de criterios como absolutos. El hecho de que alguien publique desde una IP particular no hace que su publicación sea spam; el hecho de que alguien mencione una de esas palabras clave (o incluso el nombre de dominio de nuestro peor spammer) tampoco lo convierte en spam.

Es muy útil tener un montón de globos oculares que consideran que les interesa mantener a los spammers fuera del sitio. Las personas son nuestro mejor sistema de alerta temprana.

Como ya respondieron otros, no hay software que pueda detectar publicaciones de spam porque siempre existe el riesgo de falsos positivos. Sin embargo, hay una combinación de tecnologías y métodos que se pueden aplicar para reducir las publicaciones de spam en dichos sitios web, pero no eliminarlo totalmente sin el riesgo de falsos positivos.

La detección de spam es generalmente una tarea de clasificación de texto. A menudo encontrará que un usuario publicará contenido válido entre el correo no deseado, y solo desea deshacerse del correo no deseado.