Mostrando entradas con la etiqueta Web. Mostrar todas las entradas
Mostrando entradas con la etiqueta Web. Mostrar todas las entradas

Qué hacer ante un robot agresivo

RobotHace unos días vimos que la carga del servidor de Nireblog subía espectacularmente en un horario en el que no suele tener mucha. Tras comprobar que había más de 700 tareas entre apache y mysql, hice un netstat y constaté que la mayoría de las conexiones venían de una sola dirección ip. Se trataba de un bot agresivo de Attributor que estaba haciendo peticiones a diestro y siniestro (del orden de unas 10 por segundo). Tras denegar la ip mediante iptables, recuperamos la carga. Pero eso sólo fue una solución temporal, dado que usan más direcciones y ayer nos volvió a tocar con otra diferente. Así que os voy a contar una serie de soluciones que podemos aplicar ante estos robots chupa-conexiones.

  • Fichero robots.txt: cuando un robot visita una página, lo primero que solicita es http://www.lapagina.com/robots.txt. En ese documento se le indica si tiene permitido el acceso o no. Esto, claro está, si es un bot bien programado o con buenas intenciones (por ejemplo, las arañas que se usan para extraer direcciones de correo a las que enviar spam no siguen el protocolo ;-)). Por tanto, esta solución puede que no nos valga de mucho. Para decirle que no pase, pondríamos lo siguiente:

    User-agent: attributor.com
    Disallow: /

    Para más información sobre el funcionamiento de este fichero, pasaros por robotstxt.org. Además también tenéis un completo listado de User Agents con las ip's que suelen usar.

  • Fichero .htaccess: si el bot deja su nombre en el campo user-agent, podremos denegar su acceso en este fichero de la siguiente forma:

    RewriteCond %{HTTP_USER_AGENT} ^.*attributor.*$
    RewriteRule ^.* - [F,L]

    Con esto le estamos diciendo a nuestro apache que, a todas las peticiones que le lleguen en las que el campo User Agent tenga la palabra attributor, les devuelva el código 403 : Forbidden.
    Expliquemos más a fondo la expresión regular que se usa:

    • ^ indica que es el comenzamiento de la URL
    • .* cualquier cadena alfanumérica
    • $ indica que es el final de la URL

    Como vemos, esto nos librará de conexiones a base de datos, porque no se sirve nada, pero no de las conexiones a nuestro servidor web. Aunque si queremos pagar al bot con su misma moneda, podemos modificar la acción de la regla y en vez de hacer que se deniegue el acceso, se puede redirigir a la página del bot en cuestión (en nuestro caso a www.attributor.com).
    Recordad que para usar .htaccess tenemos que tener habilitado el modulo mod_rewrite de apache.

    Para comprobar si nos está funcionando correctamente este método, podemos hacer una petición simulada desde aquí, donde podemos introducir el User Agent a mano y hacer una petición a nuestra web.

  • Iptables: si ni siquiera queremos que trabaje nuestro servidor web, podemos rechazar las peticiones con nuestro firewall. Aunque para eso deberemos conocer las direcciones ip que usa el bot. Si las sabemos, podemos agregar la siguiente regla:

    iptables -A INPUT -s 64.41.145.240 -j LOG --log-prefix "[BLOQ]=>"
    iptables -A INPUT -s 64.41.145.240 -j DROP

    La primera línea hace que se registre el bloqueo en el log de iptables (en el caso de debian es /var/log/syslog ) y la segunda hace que todos los paquetes que lleguen de esa dirección sean descartados. Si no sabemos todas las direcciones que usan los bots, también podemos aplicar la siguiente solución que nos presentó Ricardo Galli: usar el módulo recent de iptables para que descarte las conexiones si un cliente ha intentado hacer más de 30 en 10 segundos

Technorati tags: , , , , ,

Lavado de cara

Estamos a puntito de cambiar de año y este blog se renueva (aunque sólo estéticamente), estrenando su versión 2.0 (y esto no va por la dichosa palabra de marras). Tenía programado un lavado de cara para celebrar mi blogueaños (a finales de octubre), pero como casi cualquier proyecto informático, se ha retrasado dos meses. Así que llega tarde, pero llega.

Con esto culmino mi migración total al nuevo sistema de Blogger. El diseño de la plantilla es obra de Design Disease y ha sido adaptada a blogger por Blog and Web.

Quedo a la espera de vuestras impresiones (por favor, sed críticos y que no os dé miedo decir lo que no os guste). Y como buena beta (palabra que tiene que salir en estos casos), puede tener fallos. Si encontráis alguno, dejad aquí vuestra impronta.

Recordad que desde vuestros lectores de rss no podréis comprobar el cambio ;-)

Technorati tags: , , ,

Un empujoncito a la Wikipedia en euskera: Zientzia Astea 2007

Zientzia Astea
Como ya muchos Aprendices han anunciado, del 5 al 10 de noviembre se va a celebrar la Zientzia Astea 2007 (también conocida como la Semana de la Ciencia y la Tecnología). Y estamos intentando dinamizar un poco el evento a través de un blog y un wiki (toda ayuda para dar a conocer la iniciativa será bienvenido ;-)).

Esos días se celebrarán múltiples actos para acercar la Ciencia a todos los públicos (no hay más que ver el vídeo de la edición anterior). Pero uno de los eventos que más me gusta es, sin duda alguna, el concurso que quiere premiar las mejores contribuciones de contenido científico y tecnológico en la Wikipedia en Euskara. Y más tras las últimas noticias que nos llegan de la bajada de el número de artículos editados así como del número de colaboradores. No debemos olvidar que la Wikipedia se sustenta por su calidad y no por su cantidad, pero si todos nos relajamos y dejamos de aportar, perderemos una de las herramientas colaborativas más exitosas de todos los tiempos (en la opinión de la que escribe).

¿Quién puede participar?

  1. Alumnado de E.S.O.
  2. Alumnado de bachillerato
  3. Profesorado de E.S.O.
  4. Profesorado de bachillerato
  5. Alumnado universitario
  6. Público en general


Los premios son muy golosos:

10 ordenadores portátiles personales:
  • 2 para alumnado E.S.O.
  • 2 para alumnado bachillerato
  • 2 para profesorado E.S.O.
  • 2 para profesorado bachillerato
  • 1 para alumnado universitario
  • 1 para público en general
8 cañones digitales para los centros (sólo para las 4 primeras categorías):
  • 2 para alumnado E.S.O.
  • 2 para alumnado bachillerato
  • 2 para profesorado E.S.O.
  • 2 para profesorado bachillerato

Las bases del concurso tanto en castellano como en euskera.

Animaros a participar y sobre todo, que esto sólo sea una forma de "engancharse" a la edición en la Wikipedia y que luego perdure en el tiempo. Porque para una herramienta que podemos hacer entre todos...

technorati Technorati tags: , ,

¿Cuánto tarda en cargar mi blog?

Vivimos en la sociedad de las prisas. Todo tiene que ser rápido y ya (en los trabajos, incluso "para ayer"). Y los blogs no iban a ser una excepción. Por eso me parece muy interesante conocer lo que tarda en cargar una página (para no matar de aburrimiento a nuestros lectores). Gracias a la herramienta The Full Page Test, de Pingdom Tools, podremos saberlo y además, tendremos un interesante análisis de qué elemento es el que nos está ralentizando.

Cómo funciona:
The Full Page Test simula la carga completa de nuestra web (CSS's, javascripts, RSS, Flash, imágenes, etc.) como si de un navegador convencional se tratara y muestra mediante barras de tiempo lo que le cuesta a cada elemento. Podremos ordenar esas barras por orden de carga o por jerarquía.

Tiempo de carga del blog
Disclaimer: este post va dedicado a nuestro artesano Julen ;-)

technorati Technorati tags: , ,

Estudiar Braille en Internet

Braille

Foto: jasonpearce

A través de esta entrada en Bloc de blocs descubro una página muy interesante desde la que se puede aprender el sistema Braille de lectura y escritura táctil utilizado por personas con discapacidades visuales.

Se puede acceder aquí al curso online o bien descargarse el programa tanto para windows como para linux.

Sin duda alguna, un diez para la Universidad de São Paulo, responsable de este curso.

Si los ciegos leen con los dedos... tú puedes leer el Braille con los ojos

technorati Technorati tags: ,

NireBlog, mi nuevo bebé

Nireblog.com/es

Desde que conocí la palabra procrastinación, me he decidido a llevarla a límites insospechados (espero que no me pase aquello de que quien mucho abarca, poco aprieta...).

La cuestión es que he fichado por el equipo de NireBlog (con Ketari a la cabeza) para participar en el proyecto del que ya había hablado antes.

Cuando me propusieron formar parte de este grupo, no lo dudé ni un minuto puesto se trata de algo hecho con muchas ganas y del que voy a aprender mucho y variado (gestión de servidores, php, html, css, etc...). Además intentaremos poner en claro y documentar el código para liberarlo.

Quizá este sea el empujón final para migrar mi blog de aquí y poder tener el control total sobre mis datos. Ya os iré avanzando más primicias primiciosas ;-).

Tenéis aquí una mejor explicación de todo lo aquí expuesto.

technorati Technorati tags: ,

Aprendiendo CSS

Un día me levanté pensando: ¿en cuánto estará el record de número de blogs por persona? Y es que esto cada vez se parece más al mundo de los móviles (mínimo dos por cabeza).

Todo este rollo porque estreno blog (a añadir al que estáis leyendo ahora, a BOFH y a Industria y Servicios).

Se trata de Aprendiendo CSS. Aquí el feed: RSS

¿Y por qué otro blog más en el mundo? (os preguntaréis... y aunque no lo hagáis, os lo voy a responder).

La idea de crear este blog nació tras celebrar la segunda edición de Aprendices: HTML para bloggers.

Como nunca he tenido la suerte de recibir un curso de CSS he decidido darlo yo. De esta forma, me sentiré obligada a conseguir el material y leer manuales y libros. Yo misma sería la profesora y la estudiante; la generadora de contenidos y la consumidora.

Y qué mejor soporte que un blog donde el conocimiento sea colectivo y se vea complementado con vuestros comentarios. Porque no pretendo con él ser la única que enseñe. También quiero que vosotros me enseñéis.

Os animo a que os pongáis en contacto conmigo y me mandéis cosas que os interesarían aprender de css, o que ya conocéis y queréis compartir con los demás.

Por cierto, habemus dominio :)

technorati Technorati tags: ,

Banner personalizado con FeedBurner

Vía el blog de FeedBurner descubro que ya se pueden personalizar los banners en los que se muestran nuestros últimos posts. Ahora podemos poner un fondo personalizado como éste:

El Blog de Loretahur


Para ello, haremos lo siguiente:
  1. Entramos en nuestra cuenta de FeedBurner.
  2. Nos vamos a la pestaña Publicize.
  3. Seleccionamos la opción Headline Animator.
  4. Debemos diseñar un fondo con las dimensiones que queramos (con Gimp, Photoshop, etc.) pero con el único requisito de que lo guardemos como gif.
  5. Subimos el fondo al hosting que queramos (yo recomiendo ImageShack).
  6. Copiamos el link permanente de la imagen y lo pegamos en el campo Image URL.
  7. El resto de campos los podremos personalizar a nuestro gusto (colores, posición dentro del banner, formato de las fechas, etc.),
  8. Pulsamos el botón Save y ya podemos copiar el código HTML que se genera en nuestro blog, en nuestro email o donde más rabia nos dé.

technorati Technorati tags: ,

Ajax, accesibilidad cero

ajaxUna de esas palabras que se han puesto de moda con todo el tinglado de la web 2.0 es ajax. La primera vez que la escuchamos, a todos nos viene a la cabeza ese famoso limpiahogar. Pero debemos aclarar que se trata de una nueva tecnología web.

Tiraremos de Wikipedia para tener una definición más tecnológicamente correcta:

AJAX, acrónimo de Asynchronous JavaScript And XML (JavaScript y XML asíncronos), es una técnica de desarrollo web para crear aplicaciones interactivas. Éstas se ejecutan en el cliente, es decir, en el navegador del usuario, y mantiene comunicación asíncrona con el servidor en segundo plano. De esta forma es posible realizar cambios sobre la misma página sin necesidad de recargarla.
En palabras llanas, ajax nos permite recargar una parte específica de una página sin tener que hacerlo de la página completa. Servicios como gmail, writely, digg, yahoo, ... hacen uso de esto. Para mí, el ejemplo más claro es gmail, donde cuando nos llega un mensaje nuevo, aparece misteriosamente en nuestra bandeja sin que la página se haya recargado (y sin necesidad de ese botoncito de "Revisar Correo").

Para lograr todo esto hacen uso de JavaScript. Primer problema: si el usuario no tiene habilitado JavaSript en su navegador, Ajax no funcionará. Esto rompe con uno de los criterios de accesibilidad web que establece que las páginas deben seguir siendo usables cuando los lenguajes de scripting están desactivados o no están soportados.

Todas las grandes compañías (Google, Microsoft, ...) se están lanzando de lleno a incorporar esta tecnología en todos sus nuevos productos. Sin embargo, no se dan cuenta o se olvidan de nuevo de las minorías. Todas aquellas personas con deficiencias visuales que utilizan programas para "leer" las páginas web como pueda ser JAWS, se encuentran con que ajax no cumple con la accesibilidad. El problema es que estos programas por voz recorren la página en secuencia y no serán capaces de informar sobre los cambios que se produzcan en la página ya que ésta no se refresca.

No deberíamos hacer de Internet una segunda calle con obstáculos para personas con discapacidades. Bastantes bordillos, escalones, obras, tienen que sortear ya.

technorati Technorati tags: ,