No todo visitante es una persona

Una parte considerable del tráfico en internet proviene de programas automáticos — bots. Algunos son útiles, como los rastreadores de los motores de búsqueda. Otros exploran páginas en busca de vulnerabilidades, raspean contenidos o generan tanta carga que los visitantes reales se ven frenados.

Cómo identificar bots dañinos

Una única solicitud revela poco. El patrón lo revela todo:

  • Cientos o miles de solicitudes en muy poco tiempo desde la misma fuente
  • Peticiones que simulan un navegador, pero no se comportan como tal
  • Acceso a rutas que un visitante normal nunca visitaría
  • Sesiones que se crean a cada segundo y nunca vuelven
En un caso, bots distribuidos generaron millones de sesiones vacías en poco tiempo e inundaron el almacenamiento de sesiones con gigabytes de basura — hasta que la página experimentó un colapso notable. Esto solo fue visible cuando se analizó la carga por patrones en lugar de por solicitudes individuales.

Por qué los bloqueos simples no son suficientes

Bloquear una única dirección sirve de poco si el siguiente bot proviene de otra red. La protección efectiva funciona con patrones y umbrales: quien se comporta de forma sospechosa es frenado o bloqueado — automáticamente y con criterio, para que los visitantes reales y los rastreadores de los motores de búsqueda circulen sin obstáculos.

Lo que implementamos en la práctica

  • Evaluar el tráfico por comportamiento en lugar de por dirección individual
  • Bloquear automáticamente y de forma temporal las fuentes sospechosas, con una lista de bloqueo centralizada
  • Permitir explícitamente que los rastreadores reales pasen, para que la visibilidad no se vea afectada
  • Hacer visible la carga y los bloqueos, en lugar de bloquear a ciegas

La protección contra bots no es un muro único, sino un proceso continuo de sincronización. Bien hecho, solo lo notan quienes debe expulsar.