Estado de la Indexación en GooglePor fin, muchas de las plegarias de los SEOs han sido escuchadas por Google y ya tenemos un forma más exacta de medir la indexación para un sitio Web. El milagro se llama “Estado de la Indexación” y es un reporte nuevo que se ha añadido en el Google Webmaster Tool.

Antiguamente para medir el número de páginas indexadas en Google, se tomaba los datos del comando site:www.misitioweb.com, cuyos resultados eran un dolor de cabeza (sobretodo en sites grandes) ya que fluctuaban de forma un poco ilógica. Era posible que hoy obtuvieran un número de páginas indexadas de 40.000 y en 2 días el comando site:, te decía que para el mismo sitio web tenías unas 35.000 páginas indexadas. ¡Vaya locura!

El juguete nuevo para los SEO denominado “Estado de la Indexación”, consiste en una gráfica histórica que muestra la evolución de las páginas indexadas, desde que se dió de alta la web en el Google Webmaster Tool. En este caso si tenemos una curva lógica que siempre debería ir en sentido ascendente.

La gráfica muestra 4 ratios que son:

Total de páginas indexadas: El número total de URL que se encuentran actualmente en el índice de Google. Estas direcciones URL están disponibles para aparecer en los resultados de la búsqueda, junto con otras URL que Google puede descubrir por otros medios. Este número cambiará con el tiempo, a medida que se añadan nuevas páginas y se indexen, y se eliminen las páginas antiguas. El número de URL indexadas casi siempre es significativamente más pequeño que el número de URL rastreadas, porque no incluye URL que se han identificado como duplicadasno canónicas o menos útiles, o que contienen una metaetiqueta “noindex”.

Rastreadas alguna vez: El total de direcciones URL de tu sitio que Google ha rastreado en algún momento. No todas las direcciones URL rastreadas se indexan, y es posible que Google detecte algunas URL por otros medios, como, por ejemplo, los enlaces de entrada de otros sitios. Este número debería aumentar con el tiempo a medida que se añadan nuevas páginas a tu sitio.

No seleccionadas: Páginas que no están indexadas porque son muy similares a otras páginas, o que se han redireccionado a otra dirección URL.

Bloqueadas por Robots: El número total de direcciones URL que Google no puede rastrear porque no se permiten en tu archivo robots.txt.

Gracias a esta nueva gráfica podemos detectar algún bajón importante en el número de páginas indexadas, lo que nos hace presumir una posible penalización, un problema en el servidor o una errónea maniobra en la programación. También nos ayuda a estimar una posible detección de contendo duplicado por parte de Google, ya que si aumenta la curva de “URLs no seleccionadas” o su valor es alto en comparación con el total de URLs indexadas, podemos estar ante este problema de contenido similar.

Cómo crítica a esta nueva herramienta de medición, está el hecho de que no te dice el nombre de las urls que esta indexando y no se puede hacer un análisis por directorios o subcarpetas del site. Con esta mejoraría el análisis de indexación. Por ahora, tenemos una nueva herramienta de medición de las páginas indexadas que se ajusta más a la realidad. Pues nada, hay que aprovecharla.

Más información sobre la herramienta Estado de la Indexación