Rss Feed
Tweeter button
Facebook button

6 claves para solucionar los errores de rastreo y enlaces rotos

Fecha : 15-06-2011 | Autor : Silvia Martínez | En : Destacado

6 pasos clave para solventar tus enlaces rotosUna de las opciones más eficaces para poder comprobar si nuestra web dispone de enlaces rotos o diversos problemas de rastreo es el Panel de Herramientas para Webmasters de Google; los especialistas en adecuación a buscadores de Qweb.es os desvelamos sus principales misterios.

 

Se trata de una herramienta gratuita que ofrece la ayuda necesaria para que nuestra web se adapte a los requisitos de Google, como por ejemplo ver cuáles y cuántas páginas de nuestro sitio se incluyen en el índice de este buscador, consultar los errores que se encuentran al rastrear nuestra web, averiguar qué sitios enlazan con el nuestro, etc.

 

Profundicemos en la detección y solución de los diferentes tipos de errores de rastreo que un sitio web puede presentar:

 

1) La página solicitada no se encuentra debido a errores de código de estado HTTP:

“El servidor a menudo muestra este código cuando, por ejemplo, se realiza una solicitud de una página que no existe en el servidor.”

Existen muchos tipos de errores por códigos de estado HTTP. Algunos de los códigos más frecuentes son:

- 200: El servidor muestra la página correctamente - 404: La página solicitada no existe - 503: Cuando el servidor está temporalmente fuera de servicio

Para ampliar más información sobre este punto, puedes dirigirte al Centro para Webmasters de Google.

 

2) La url no se ha seguido

- Error de redireccionamiento: Cuando Google no puede seguir los redireccionamientos, sus directrices sugieren que permitas el acceso a todas las páginas del sitio desde al menos un enlace de texto estático.

- Error de bucle de redireccionamiento: Cuando Google accede al redireccionamiento pero tras varios intentos da error, quedándose en la misma página. En estos casos, debemos comprobar que nuestros redireccionamientos no dirijan a sí mismos.

- URL de redireccionamiento demasiado larga: Google recomienda no añadir información automáticamente a las URL de nuestro sitio web (como un ID de sesión) al realizar una redirección. Para no incurrir en este tipo de errores, Google recomienda que nuestro sitio web permita que los robots de búsqueda lo puedan rastrear sin ID de sesión ni argumentos que efectúen un seguimiento de la ruta por el sitio.

- Redireccionamiento no válido: Es cuando Google sigue un redireccionamiento desde una página, pero no consigue acceder a la página de destino. Es muy recomendable asegurarnos de que los redireccionamientos de nuestra web dirijan a páginas válidas.

- Redireccionamiento vacío: Cuando Google detecta un redireccionamiento en nuestra web, pero éste no redirige a ningún sitio.

- Error de cookies: Es posible que los motores de búsqueda tengan dificultades para rastrear sitios que utilizan cookies para la navegación.

 

3) URLs restringidas por el archivo robots.txt

En ocasiones Google no puede rastrear las URL a consecuencia de restricciones por parte de nuestros propios archivos robots.txt. Normalmente esta acción no suele ser un error, sino que nosotros mismos así lo hemos configurado por algún motivo, como por ejemplo cuando impedimos a Googlebot a través de nuestro archivo robots.txt acceder a nuestra página de pruebas.

 

4) URLs caducadas

Los motores de búsqueda tratan de acceder a alguna de nuestras páginas y, tras un tiempo de espera, no puede acceder a la misma debido a alguna de estas razones:

- El tiempo de espera de la búsqueda DNS ha caducado - El tiempo de espera de la URL ha caducado - El tiempo de espera de robots.txt ha caducado

 

5) URLs inaccesibles:

Es el tipo de error que se da cuando Google visita nuestra web y recibe un mensaje de error al intentar visitar una URL. Es muy posible que se trate de un error momentáneo de DNS o de tiempo de espera, debido a que nuestro servidor se hallara inactivo u ocupado cuando Google intentó acceder a la página.

Existen varios tipos de error que se muestran en estos casos, algunos de ellos son:

- Error 5xx - Problema de DNS - No se puede acceder al archivo robots.txt - No se puede acceder a la red - Se ha producido un error al establecer conexión o el servidor ha rechazado la conexión - No se ha obtenido respuesta o se ha recibido una respuesta incompleta

 

6) Errores 404 leves

Surgen cuando un usuario solicita una página que no existe. El servidor devuelve entonces un código de error 404 (Página no encontrada). Este código de respuesta HTTP indica a los navegadores y a los motores de búsqueda que la página no existe, por lo que los motores de búsqueda no rastrean ni indexan el contenido de la página (en el caso de que lo hubiera).

Pero cuidado, es posible que el servidor aparte de devolver un código 404 en respuesta a una solicitud de una página inexistente, muestre una página 404 personalizada por el propietario de la web para proporcionar información adicional al usuario. Por ejemplo, puedes crear una página que contenga una lista de las páginas más populares del sitio web, o bien que disponga de un enlace a la página principal o un apartado interactivo para que los propios usuarios puedan enviar comentarios.

 

Como siempre, desde Qweb os animamos a seguir este tipo de consejos para mejorar la calidad de vuestra web y cumplir las Directrices de Adecuación a Buscadores.

 

Comentarios (7)

Muy buenos consejos, gracias por compartirlos.

Muy buenos tips, gracias voy a revisar mi web según estos consejos.

¿Y cuando el buscador indexa erroneamente las páginas? ¿que hacemos?

En mis webs tengo instalado un módulo que, además de mostrar una página personalizada de error, me envía un email con dicho error, así de paso puedo saber que tretas están intentado usar los hacker para acceder a las webs y hacer de las suyas.

Yo estoy hasta las narices de enviar emails al webmaster de un comparador de precios (no digo el nombre por no hacerle publicidad gratuita) que tiene como 60 páginas mias mal indexadas y por un oido le entra y por el otro le sale, no corrigen el error ni hacen nada por solucionarlo.

Llevo mas de 3 meses recibiendo unos 60 emails de error suyo con urls tipo (convierto lo esensial de la url a xxx para evitar lo mismo de antes, publicidad gratuita a pesar de que me interese)

http://www.xxx.xxx/%5C'http:/www.xxx.xxx/xxx-p-1056.html%5C

A través del archivo robots.txt puedo bloquear el acceso a este comparador pero entonces el resultado es peor porque recibo mas de 750 emails diarios con el error acceso prohibido.

¿Que hacer en estos casos? ¿ajo y agua, a jo***se y aguantarse? pues yo ya estoy cansado

Un saludo desde Málaga.

Esto menos que soluciones a los errores de rastreo, son explicaciones de cada error de rastreo, yo no veo que diga que medidas tomar para cada tipo de error de rastreo, pero de todos modos es un buen aporte esto de explicar el motivo de los errores correspondientes.

Conocer los motivos de cada error de rastreo, es el paso previo a aplicar las medidas para solucionarlo.

¿como podemos quitar las que aparecen con error 404?

gracias

Holas a todos conocen por casualidad algun tutorial de como interpretar dichos errores con la herramienta
http://validator.w3.org/checklink y mas aun como corregirlos ??, `

tambien conocen de algun tuto para corrergir y validar errores de tipo W3C ??, gracias de antemano

Escribe un comentario