sitemap robots.txt

Multiple Sitemap: entradas en robots.txt?



(3)

He estado buscando por Google pero no puedo encontrar una respuesta a esta pregunta.

Un archivo robots.txt puede contener la siguiente línea:

Sitemap: http://www.mysite.com/sitemapindex.xml

pero ¿es posible especificar múltiples archivos de índice de sitemaps en el archivo robots.txt y los motores de búsqueda deben reconocerlo y rastrear TODOS los mapas de sitio a los que se hace referencia en cada archivo de índice de sitemaps? Por ejemplo, esto funcionará:

Sitemap: http://www.mysite.com/sitemapindex1.xml Sitemap: http://www.mysite.com/sitemapindex2.xml Sitemap: http://www.mysite.com/sitemapindex3.xml


Es posible escribirlos, pero depende del motor de búsqueda saber qué hacer con él. Sospecho que muchos motores de búsqueda "seguirán digiriendo" cada vez más tokens o, alternativamente, tomarán el último mapa del sitio que encuentren como verdadero.

Propongo que la pregunta sea "si quiero que el motor de búsqueda ____ indexe mi sitio, ¿podría definir múltiples sitemaps?"


Sí, es posible tener más de un sitemap-index-file :

Puede tener más de un archivo de índice de Sitemap.

Resalta por mí.

Sí, es posible listar múltiples archivos de mapa de sitio dentro de robots.txt , ver también en el sitio de sitemap.org :

Puede especificar más de un archivo de Sitemap por archivo robots.txt.

Sitemap: http://www.example.com/sitemap-host1.xml Sitemap: http://www.example.com/sitemap-host2.xml

Resalte por mí, esto no se puede malinterpretar, diría, tan simplemente dicho, esto se puede hacer.

Esto también es necesario para envíos cruzados, por lo cual, por cierto. el robots.txt ha sido elegido.

Por cierto, Google , Yahoo y Bing , todos son miembros de sitemaps.org :

El sitemap 0.90 se ofrece bajo los términos de la licencia Creative Commons Reconocimiento-CompartirIgual y tiene amplia adopción, incluido el soporte de Google, Yahoo !, y Microsoft.

Así que puede estar seguro de que los bots del motor de búsqueda leerán correctamente las entradas de su mapa del sitio.

Enviarlos a través de herramientas de webmaster tampoco puede hacer daño, como commented John Mueller .


Si su mapa del sitio tiene más de 10 MB (sin comprimir) o tiene más de 50 000 entradas, Google requiere que utilice múltiples mapas de sitios incluidos en un archivo de índice de sitemaps.

En su archivo robots.txt apunte a un índice del mapa del sitio que debería verse así:

<?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.example.com/sitemap1.xml.gz</loc> <lastmod>2012-10-01T18:23:17+00:00</lastmod> </sitemap> <sitemap> <loc>http://www.example.com/sitemap2.xml.gz</loc> <lastmod>2012-01-01</lastmod> </sitemap> </sitemapindex>