Muchas veces los buscadores tienen dificultades para encontrar las páginas de tu sitio.
Es lo que pasa cuando:
- Tienes enlaces en JavaScript, Java o Flash
- Tu sitio es nuevo y no has enlazado lo suficiente a páginas internas
- Tienes muchas páginas y éstas no están bien enlazadas
En estos casos, un Sitemap es un recurso valioso para mejorar la indexación.
Contenidos:
Qué es un Sitemap XML
Probablemente ya conozcas los mapas del sitio en HTML; esas páginas estáticas a las que accedes con un enlace al pié y que te dan una visión general del sitio, ¿te suenan? Pues bien, un Sitemap XML es lo mismo, pero en un formato que entienden los buscadores.
En 2005, Google se había dado cuenta de que los mapas del sitio tradicionales servían de ayuda para localizar las páginas de un sitio disponibles para la indexación. Lo que ocurría es que éstos eran mejorables desde el punto de vista del buscador, así que decidió lanzar el protocolo Google Sitemap. Un año más tarde, MSN (Bing) y Yahoo! se unieron a la iniciativa y dejó de ser exclusivo de Google.
En su forma más básica, un Sitemap es un archivo escrito en el lenguaje de marcas extensible (eXtensible Markup Language o XML) que proporciona una lista de las páginas del sitio junto con otros datos. Esta información ayuda a los buscadores a identificar las páginas que pueden rastrear y los caminos que conducen a ellas.
Por ello, cuando tienes problemas para indexar ciertas páginas, un Sitemap hace más probable que el buscador las encuentre y pase a visitarlas, aunque no lo garantiza.
Matt Cutts, jefe del departamento de web spam de Google, lo explica así:
Imagina que tienes en tu sitio las páginas A, B, y C. Nosotros encontramos las páginas A y B mediante el seguimiento natural de tus enlaces. Entonces creas un mapa del sitio con las páginas B y C. Ahora hay una posibilidad (pero no una promesa) de que exploremos la página C. No eliminaremos la página A sólo porque no esté listada en tu Sitemap. Y sólo porque incluiste una página que no conocíamos tampoco garantiza que la vayamos a rastrear.
Otros tipos de Sitemap
Los mapas del sitio no sólo ayudan a los buscadores a encontrar simples páginas, sino también videos, imágenes, noticias y contenidos para móviles.
La extensión del protocolo de Sitemaps admite:
- Sitemaps de vídeo – Puedes aumentar las posibilidades de que tus videos sean descubiertos por los buscadores si los incluyes en un mapa del sitio. Los Sitemaps de vídeo te permiten incluir la URL donde se encuentra el video, pero también el título, la descripción la localización del thumbnail.
- Sitemaps de imágenes – Al igual que ocurre con los Sitemaps de vídeo, también puedes mejorar la indexación de tus imágenes si las añades a un Sitemap.
- Sitemaps de noticias – Permiten controlar el contenido que envías a Google Noticias.
- Sitemaps de móviles – Indica la ruta donde se encuentran los contenidos para móviles de tu sitio.
Cómo crear un Sitemap XML
El mapa del sitio más sencillo que puedes crear es un archivo de texto con una URL por renglón. El problema de este formato es que no puedes incluir información adicional como la fecha de última modificación, la frecuencia de cambios y la prioridad.
Con un Sitemap en formato XML sí es posible.
Este es su aspecto:
<urlset xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance” xsi:schemaLocation=”http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd” xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>http://deteresa.com/</loc>
<lastmod>2013-03-21T15:45:21+00:00</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
</urlset>
A primera vista parece complicado, pero quédate tranquilo porque no necesitas escribir todo esto a mano; hay un puñado de herramientas que pueden a hacerlo por ti.
Vamos a ver los generadores de Sitemap más comunes y fáciles de usar:
- XML-Sitemaps – Una sencilla herramienta online. Introduces tu dominio y automáticamente rastrea todas las páginas, creando Sitemaps de hasta 500 páginas. Si tus sitio es grande puedes acceder a una versión de pago que se instala en el servidor y funciona con PHP. Ésta no tiene límites, además permite generar Sitemaps de video, de imágenes, de noticias y de móviles.
- Google XML Sitemaps – Un plugin imprescindible para WordPress. Actualiza el mapa del sitio automáticamente cada vez que publicas un nuevo post o página, y es altamente configurable.
Si estas herramientas no son suficiente para cubrir tus necesidades, en esta página tienes todos los recursos disponibles para crear mapas de tu web. Algunos de ellos son programas que puedes ejecutar en tu ordenador, otros requieren la instalación en tu servidor y otros funcionan desde una página web. Hay para todos los gustos.
Cómo enviar tu Sitemap al buscador
Tras crear el archivo del Sitemap, el siguiente paso consiste en subirlo al directorio raíz de tu sitio (www.example.com/mimapadelsitio.xml). Fíjate que no es obligatorio llamarlo “sitemap”, sino que puedes ponerle el nombre que quieras. Cuando tengas el archivo preparado, súbelo al servidor mediante un cliente FTP como Filezilla o Cyberduck.
Una vez tengas el mapa al servidor, dáselo a conocer a los buscadores para que pasen a examinarlo. Hay 3 formas de hacerlo:
Método 1: Webmaster Tools
Puedes enviar el mapa a través de las herramientas para webmasters del buscador.
Estos son los pasos que debes seguir:
- Crea una cuenta en las herramientas de Google y/o Bing
- Añade la URL de tu sitio web
- Verifica el sitio
- Sube tu Sitemap:
- En Google – Rastreo > Sitemaps
- En Bing – Configurar mi sitio > Mapas del sitio
Método 2: Robots.txt
Puedes incluir una línea al final del archivo robots.txt de tu sitio:
Sitemap: http://www.example.com/sitemap.xml
Método 3: Ping
Hacer ping es como decirle al buscador “mi mapa del sitio está aquí”, y es tan sencillo como cargar una dirección en el navegador. Es el método menos seguro de los tres, pero hasta ahora viene funcionando.
Dicho esto, aquí tienes las direcciones que deberás cargar, donde URL_SITEMAP es la URL del mapa:
- En Google – http://www.google.com/webmasters/tools/ping?sitemap=URL_SITEMAP
- En Bing – http://www.bing.com/webmaster/ping.aspx?sitemap=URL_SITEMAP
¿Has conseguido generar tu Sitemap y enviarlo al buscador?
Imagen Flickr Creative Commons vía Norman B. Leventhal Map Center at the BPL
Marc dice
Gracias por la información.
¿Qué pasa con el Sitemap cuando lo subimos y en el Search Console nos da errores?
El problema que me da es:
“Detalles del error: 0 errores y 7212 advertencias”
Y luego le digo a mostrar advertencias y me dice que tengo 7212 adevertencias, pero luego solo me muestra 1.
Y es la siguiente: “El sitemap incluye URL que el archivo robots.txt ha bloqueado”.
Eso no es ningún error, ya que son URL’s que bloquee expresamente.
Tomás de Teresa dice
El Sitemap sólo debería contener las URL que quieres tener indexadas. Si hay páginas bloqueadas, el buscador no podrá acceder a ellas ni incluirlas en su índice, de ahí la advertencia. Para no ver el aviso tienes que eliminar del Sitemap las URL bloqueadas.
Saludos
Javier dice
Muy bueno la verdad es que nadaba perdido y no sabía que hacer con eso pero esto lo soluciono en cuestión de minutos, muchas gracias.
Tomás de Teresa dice
Me alegro mucho Javier :-)
Alex dice
Gracias, no sabía lo del ping. En el enlace de mi nombre hay un artículo de como general sitemaps automáticamente con PHP y MySQL. Combinado con el truco del ping (usando cronjobs) ya no tienes que preocuparte por enviarlo por FTP o en la consola de Google (u otro buscador). El proprio sitio web se encarga de todo
Tomás de Teresa dice
Gracias Alex, buena aportación. Sólo ten en cuenta que el método ping tiene más posibilidades de ser ignorado por el buscador.
Saludos
Miguel dice
Buenas Tomás. Estoy teniendo un problema al enviar el sitemap de una de mis webs. Al enviarlo Google me dice que no reconoce el “formato del archivo” y no entiendo porque ya que he probado con el plugin by Yoast y Google xml sitemap que generan archivos .xml que deberían ser compatibles. También acabo de probar con la herramienta que comentas de XML-Sitemaps y nada, dice lo mismo. ¿sabrías a que se puede deber?
Hemos sido infectados por un malware recientemente y no sé si tendrá algo que ver.. Muchas gracias de antemano ;)
Tomás de Teresa dice
Hola Miguel
Antes de nada asegúrate de limpiar el sitio de malware al 100%. Luego comprueba que el archivo XML del sitemap está en su sitio y libre de errores. Puedes usar una herramienta como http://sitemapinspector.com/.
Suerte
Sergio dice
Estupendo tu artículo. Gracias.
Un saludo,
Leandro dice
Excelente información. He podido realizar todo al pie de la letra. Gracias.
Tomás de Teresa dice
Me alegro Leandro ;-)
Laura dice
Antes de nada, enhorabuena por este post, realmente útil.
Te quería hacer una pregunta que quizás sea algo ‘tonta’, pero temo meter la pata y, antes de eso, prefiero preguntar. Una vez creado el sitemap y subirlo a Google Webmaster Tools, ¿puedo eliminar el plugin Google XML Sitemaps de mi WordPress?
Muchas gracias de antemano!
Tomás de Teresa dice
Hola Laura
Debes mantener el plugin activo para conservar el sitemap ya que se genera dinamicamente. Además lo necesitas para que añada las nuevas publicaciones al mapa.
Saludos
Pablo Abreu dice
Buenas noches:
Tengo creado el sitemap y no se como subirlo a mi web. La tengo alojada en weebly. Me podrías echar una mano para activar el sitemap?
Un saludo y gracias.
Tomás de Teresa dice
Hola Pablo
Todos los sitios creados con Weebly generan un sitemap automáticamente. Puedes encontrar el tuyo añadiendo a la dirección web “/sitemap.xml” (sin comillas).
Saludos
Claudia dice
Gracias, gracias, gracias. Tenía un buen rato quebrandome la cabeza sin saber dónde poner el sitemap en mi sitio de weebly, ¡me salvaste! Es difícil llevar una página web sabiendo apenas lo mínimo, aunque en mi caso la curiosidad resulta buena aliada. Gracias otra vez.
Tomás de Teresa dice
Me alegro Claudia :-)
Jose dice
Hola Tomás,
leyendo esto me surge la siguiente duda, una vez creado el sitemap en xml-sitemaps , ¿Cómo puedo subirlo si utilizo la plataforma blogger?
Gracias,
Tomás de Teresa dice
Hola Jose
Para eso necesitas tener acceso por FTP y creo que con Blogger no es posible. De todas formas, puedes usar el feed como mapa del sitio. Lo único que tienes que hacer es asegurarte de que se muestran todas las entradas, aunque eso ya no se cómo hacerlo exactamente.
Suerte y acuérdate de ponerme al día ;-)
Jorge Alcaraz dice
Muy buena y completa la explicación, de suma utilidad…
Tomás de Teresa dice
Gracias Jorge
Alejandro dice
Hola gracias por el articulo, yo creé una pagina con jimdo y agregue su sitemap a google hace como 6 meses pero ahora le he agregado una pagina y le he hecho algunos cambios y por consiguiene el sitemap a cambiado, mi pregunta es: debo eliminar el sitemap viejo de la pagina de google(herramientas para webmasters) y subir el nuevo? o google actualiza el sitemap automaticamente?. Muchas gracias.
Tomás de Teresa dice
Google revisa el archivo frecuentemente, aunque si ha cambiado el nombre tendrías que subirlo en WMT.
César dice
Gracias por tus artículos, son muy claros y breves.
Hace unas semanas termine mi primer proyecto con Magento para mi tienda de impresiones, antes solo tenia el dominio con un texto breve inclusive tengo la configuracion en google maps, lo cierto es que antes de subir los archivos magento al buscar tangoprint o tango print salia en la primera y segunda posicion, con el mapa incluido, luego de subir los archivos Magento pase a la tercera pagina y hasta la quinta, inverti muchas horas investigando y parte del problema es segun entiendo el contenido repetido en mis paginas, pero eso es algo que no puedo modificar pues en muchos casos es el mismo producto solo con diferentes tamanos, el punto es que con ayuda de webmaster tools borre todos los productos pues no tiene sentido tenerlos indexados, asi como FAQ, etc (logrando recuperar algunas posiciones hasta aparecer en la pagina 2).
El sitemap generado por magento incluye todas las paginas; entonces mi pregunta es: Si yo ya borre algunas paginas del google index, ademas agregue el metatag noindex,nofollow a dichas paginas, en el sitemap generado. debo borrar las paginas que no quiero se indexen? o las debo dejar en el archivo xml?
igual debo crear un archivo robots.txt para evitar se indexen las versiones de idiomas, sesion, etc. Que mas debo tener en cuenta para recuperar la posicion de mi web?
Muchas gracias de antemano por la atencion prestada
Saludos
Tomás de Teresa dice
La verdad es que no tengo experiencia con Magento, pero para tratar contenido duplicado en el sitio te recomiendo el elemento de enlace Rel Canonical. Aquí tienes un artículo sobre el tema: http://deteresa.com/rel-canonical/
En cuanto al sitemap, no necesitas incluir las páginas bloqueadas a la indexación.
Saludos
Luka dice
Vaya, me sirvió de mucho; pero tengo una pequeña duda, a ver si me puedes dar una mano. Mi sitio lo manejabamos dos personas, lamentablemente él dicidió dejar el proyecto y se llevó todas las notas que aportó; ahora bien, en Google webmasters, me aparece que tengo más de mil errores de página no encontrada (404). “Las notas ya no van a regresar…” Así que, como podría arreglarlo para que desaparezcan de google. Gracias de antemano.
Tomás de Teresa dice
Puedes dejar los códigos de error y esperar a que Google elimine las páginas progresivamente, aunque en tu caso redireccionaría con 301 cada página hacia un destino apropiado dentro del sitio. Esta solución es buena para el usuario, ya que no se encuentra con una página de error, y es buena para el sitio, ya que se conservan los enlaces externos que se hayan podido acumular.
Andrés dice
El plugin de wordpress que recomiendas tiene varias opiniones negativas durante este año. Algunas hablan de inclusión de SPAM en el sitemap y de códigos maliciosos.
Tomás de Teresa dice
En los años que llevo usando Google XML Sitemaps no me he encontrado con nada de eso, aunque imagino que siempre habrá alguien al que no le guste. Busca, compara, y si encuentras algo mejor, coméntalo por aquí ;-)
Joaquim dice
Mira que he dado vueltas buscando información clara, límpia y sencilla y nunca habia encontrado una web tan perfecta como esta. Felicidades!
Tomás de Teresa dice
¡Muchas gracias Joaquim! :-)
Rosario Saiz dice
Era el paso que me faltaba para terminar de indexar la web, ¡mil gracias!
Tomás de Teresa dice
Estupendo Rosario :-)
Natalia dice
Gracias por la claridad. Hablas en tu artículo de indexación para videos e imágenes. Conoces alguna herramienta automática? Teniendo en cuenta la cantidad de fotos que se ponen en una página web hacerlo manual….
Gracias!
Tomás de Teresa dice
Si usas WordPress lo tienes fácil, sólo tienes que buscar “image sitemap” y “video sitemap” en la sección de plugins. En otro caso lo único que te puedo recomendar es la herramienta XML-Sitemaps que comento en el post.
Saludos
Javier dice
Hola, tu explicación me ha sido de mucha ayuda, gracias, muy claro y fácil de seguir.
Pero me queda una duda, explicas como indexar tu sitio en Google y Bing, pero de Yahoo no dices nada, como se haría en este último.
Saludos.
Tomás de Teresa dice
Yahoo bebe de los resultados de Bing, lo que significa que si estás en Bing estás en Yahoo.
julio dice
gracias por el tutorial ya que no tenia una idea clara sobre mapa del sitio
Begoña dice
Mil gracias por la exposición clara y sencilla que has dado del tema. Sobre este tema no resulta fácil de encontrar ;)