INDEXABILIDAD ¿QUÉ ES?

 

 

  • ✅ La indexación se refiere a la acción del robot (es decir, un programa) de un motor de búsqueda que pasa por encima de un sitio, lo rastrea (una fase llamada «crawl» ) e indexa su contenido. Cuando decimos que el robot (la araña) indexa un sitio, significa que visita el sitio, copia su contenido y lo almacena en los servidores del motor de búsqueda.

 

  • ✅ Usaremos aquí el término «indexación» en el sentido de indexación de Google. No nos ocuparemos de Yahoo y Bing (los otros dos principales motores de búsqueda); sólo recordar que los sistemas de indexación son bastante similares en su funcionamiento

 

 

 

  • ✅ La primera fase es una fase de exploración de la web: el rastreador (o robot de indexación) de Google, llamado Googlebot, explorará las páginas de la web y seguirá los enlaces presentes en estas páginas para descubrir nuevas páginas y nuevo contenido a medida que avance. Visita las páginas y las indexa en la base de datos (es decir, copia y guarda las páginas en los servidores ubicados en el centro de datos de Google).

 

  • El índice corresponde a la base de datos de Google. Hoy en día, el tamaño del índice se estima en más de 130.000 billones de URLs. Nota: El índice de Google no representa a toda la web. La web en su conjunto es mucho más grande ya que Google sólo indexa páginas «indexables», es decir, páginas a las que su robot puede acceder. Veremos más adelante que hay métodos para bloquear la indexación de ciertas páginas. ( No Index )

 

  • ✅ Desde 2003, Google trabaja con 2 índices. Así que no hay un índice de Google, sino muchos índices de Google.

 

 

 

  • ✅ El índice principal: que corresponde a las páginas designadas por Google como las más interesantes entre todas las indexadas.

 

  • ✅ El índice secundario: está compuesto por páginas de «segunda elección», es decir, las de menor calidad. Esto es particularmente el caso de las páginas duplicadas (problema de contenido duplicado) o las páginas juzgadas por Google como de «mala calidad». Estas páginas con contenido similar serán ignoradas por Google y sólo aparecerán en las SERPS (páginas de resultados) si el usuario lo solicita expresamente haciendo clic en el mensaje «Reiniciar la búsqueda incluyendo páginas ignoradas» que aparece en la parte inferior de la página de resultados.

 

  • Es posible pedir a Google que indexe un sitio. Para ello puedes utilizar el formulario de envío a través de Search Console  o pedir a un sitio externo que se enlace con el tuyo. Cuando el robot de Google regrese a este sitio externo, encontrará el enlace a tu sitio, lo seguirá y luego indexará todas las páginas accesibles de su sitio.

 

  • ✅ Esta segunda solución (colocar un backlink) es muy conveniente y rápida; el tiempo de indexación será tanto más corto cuanto más a menudo se actualice el sitio que hace este enlace contigo

 

  • Borrar un sitio del índice de Google es como borrar el sitio de la base de datos. Es posible eliminar páginas del índice: así, ya no serán tenidas en cuenta por el robot durante la próxima exploración de la web.

 

  • ✅ La versión en caché de una página corresponde a la versión de la página tal como estaba cuando el robot de indexación pasó por última vez. Esta información está disponible: sólo hay que utilizar el comando «cache»  y luego mencionar la dirección del sitio. De esta manera, sabes en qué día y a qué hora precisa pasó el Googlebot (el robot de Google) por última vez.

 

 

 

  • La caché permite a los robots de indexación saber si la página ha cambiado (añadiendo contenido, imagen, modificación de enlaces, …) desde su última visita. Compara la versión «en caché» de la página con la que «ve» en este momento e indexa la página de nuevo si nota algún cambio. El objetivo de Google es tener en su índice las páginas más «frescas» posibles.

 

  • ✅ Si observas que algunas de tus páginas no son exploradas por Google, es decir, poco revisadas por el Googlebot deberías alertarle de la calidad de estas páginas. De hecho, si la araña (el robot) pasa cada vez menos en algunas páginas esto no es un signo positivo.

 

  • ✅ Google es un motor que a veces se describe, como ejemplo ilustrativo, como «obsesionado con el texto», lo que significa que se alimenta de texto y datos. Cuanto más texto le des con actualizaciones frecuentes de tu sitio, más vendrá a visitarlo. Un sitio activo será visitado e indexado con mayor regularidad por los robots que un sitio antiguo sin contenido nuevo.

 

  • ✅ Para comprobar si tus páginas están presentes en el índice, haz la siguiente consulta: site:www.mi sitioweb.com. Indicará el número de resultados obtenidos por Google en esta consulta. Este número corresponde a la lista de páginas o urls de tu sitio indexadas (en general).