Un mapa de sitio XML es un archivo que proporciona una lista de URL para los motores de búsqueda, como Google, Bing y Yahoo, las rastreen. Los mapas de sitio XML pueden contener atributos que brinden información adicional sobre cada URL para los rastreadores.
Hay muchas razones por las que los mapas de sitio XML son importantes para el SEO, pero lo fundamental es que los mapas de sitio XML ayudan a los motores de búsqueda a descubrir tus páginas. Proporcionar un mapa del sitio XML asegurará que las páginas importantes de tu sitio web sean rastreadas de forma eficiente.
De hecho, Gary Illyes, analista de tendencias para webmasters de Google, dijo en la Conferencia de Marketing de Búsqueda de Sidney, que Googlebot utiliza los mapas de sitio para descubrir el contenido. El 80% del descubrimiento consiste en seguir los enlaces, y cerca del 20% en seguir los mapas de sitio.
Recuerda que un mapa de sitio está en una lista de URL para los motores de búsqueda de las rastreen. Por lo tanto, es fundamental que hablemos de lo que es un crawl budget y de cómo afecta a los sitemaps XML.
Así es como Google define el crawl budget:
Tomando la tasa de rastreo y la demanda de rastreo , define el crawl budget como el número de URL que Googlebot puede y quiere rastrear. Lo importante que hay que entender en el contexto de los mapas de sitio XML es que Googlebot sólo rastreará un determinado número de URLs, y puede que esto no cubra todas tus URLs.
Proporcionar mapas de sitio XML puede utilizar tu presupuesto de rastreo de forma más eficiente, ya que Googlebot sabrá que debe rastrear más las URL importantes que le proporciones en el mapa de sitio en lugar de las de poco valor. Los mapas de sitio XML no evitarán que Google rastree todas las URL de bajo valor, pero proporcionen una indicación de las URL en las que Googlebot debe centrarse.
La mejor práctica es enviar tus mapas de sitio XML a los motores de búsqueda a través de sus consolas de herramientas para webmasters. Al hacer esto, obtienes acceso a datos útiles, como los errores, la fecha del último rastreo y el número de URLs descubiertas.
Para el contenido web (por ejemplo, imágenes y vídeos) hay dos tipos de mapas de sitio XML: un índice de mapa de sitio y un archivo de mapa de sitio. Los trataré brevemente a continuación, pero asegúrate de consultar la documentación de los principales motores de búsqueda:
Archivo de índice del mapa del sitio
Un archivo de índice de mapa del sitio es simplemente un mapa del sitio para tus mapas del sitio. Proporciona la ubicación de un archivo de mapa del sitio y también cuándo se modificó por última vez.
http://www.example.com/sitemap1.xml.gz
2004-10-01T18: 23: 17 + 00: 00
http://www.example.com/sitemap2.xml.gz
2005-01-01
Archivo de mapa del sitio
Un archivo del mapa del sitio es una lista de URL que desea que Googlebot rastree. El archivo del mapa del sitio contiene información adicional , como la fecha de la última modificación, la frecuencia con la que cambia el contenido y la prioridad en una escala de 0,0 a 1,0.
http://www.example.com/
2005-01-01
mensual </ fecha de cambio>
0,8
Más allá de tener un mapa del sitio XML, hay varias cosas que puedes hacer para optimizarlo y mejorar su rendimiento SEO.
Antes de ver cualquier consejo de optimización, es vital que tus mapas del sitio sigan el protocolo de sitemps.org para que los motores de búsqueda los entiendan.
Para que tu mapa de sitio XML sea admitido por los principales motores de búsqueda debe:
• Comenzar con una etiqueta de apertura y terminar con una etiqueta de cierre.
• Especificar el espacio de nombres (protocolo estándar) dentro de la etiqueta.
• Incluir una entrada para cada URL , como etiqueta XML padre.
• Incluye una entrada hija para cada etiqueta padre.
Uno de mis casos de uso favoritos para los mapas de sitio XML es controlar las URL válidas y excluidas por sección del sitio en Google Search Console. Para ello, debes crear archivos de índice de mapas de sitio para cada sección de tu sitio web.
Aquí tienes un ejemplo de cómo puede ser:
• Index.xml
• productos-index.xml
• producto.xml
• producto1.xml
• blog-index.xml
• blog.xml
• blog-1.xml
• directorio-index.xml
• directorio.xml
• directorio-1.xml
Sólo debes incluir en tus archivos XML del mapa del sitio la URL que quieras que Googlebot rastree, indexe y clasifique. Estas páginas suelen denominarse “páginas valiosas” porque son las que aportan beneficios. No hay razón para incluir en tu mapa del sitio URLs que no aporten ningún beneficio SEO a tu sitio web.
Evita incluir URLs que devuelvan un código de respuesta HTTP no-200 en tu mapa del sitio XML. Incluir respuestas no-200 es malo para tu SEO porque le estás diciendo a Googlebot que quieres que rastree estas URLs aunque estén desperdiciando tu presupuesto de rastreo.
Las URL marcadas como noindex no tienen cabida en tus mapas de sitio XML (salvo en casos de uso específico). Las URLs noindex no te aportarán tráfico desde los motores de búsqueda, por lo que no hay razón para que Googlebot las rastree una vez que hayan sido eliminadas del indexado.
Nota: puedes utilizar un mapa del sitio XML temporal si quieres que Google vea una etiqueta sin índice en un gran número de URLs rápidamente.
Las URL que se canonizan a otra URL tampoco tienen cabida en el mapa del sitio XML. Al igual que la etiqueta noindex, no quieres que estas URLs se clasifiquen en Google, así que no hay ninguna razón para decirle a Googlebot que las rastree.
Enlaces de Referencia:
Guía para principiantes sobre optimización para motores de búsqueda de Google en PDF
Guía de Google para optimización de sitios web para dispositivos móviles
Directrices para webmasters de Google
Directrices para webmasters de Bing (en inglés)
Yahoo! Directrices de contenido de calidad de Yahoo! (en inglés)
Sitios de calidad baja según Yandex (en inglés)
Blog Central de Google para Webmasters (en Inglés)
Blog para Webmasters (en Español)