Le sitemap est un élément important dans le processus d'indexation d'un site/blog. Il permet d'indiquer aux moteurs de recherche quel est grossièrement la structure de votre site et à quel rythme il serait préférable que le contenu soit indexé.
Sans ce sitemap, les moteurs indexent votre site/blog en suivant les différents liens de votre site. De ce fait certaines pages ne sont tout simplement pas indéxées (ou mal positionnées) car le nombre de liens menants à cette page est trop faible. En quelque sorte il force l'indexation de pages orphelines.
Un membre de SEOMoz a effectué des tests pour vérifier si l'utilisation d’un Sitemap avait un impact sur la rapidité d'indexation dans les moteurs de recherche Google et Yahoo.
Le temps d'indéxation est considérablement réduit si votre site comporte un sitemap : 10 fois plus rapide chez Yahoo et 100 fois plus rapide chez Google !
Sans sitemap :
Avec sitemap :
Personnellement j'utilise un maximum les sitemaps pour deux raisons : je n'ai constaté aucun impact négatif et c'est entièrement gratuit. A titre d'exemple, le sitemap de Blogmotion est ici.
Si vous utilisez WordPress je vous conseille fortement d'utiliser le plugin Google XML Sitemaps qui permet d'informer les moteurs Google, Ask, Live et Yahoo de vos posts.
Pour informer Google de l'emplacement de votre sitemap ça se passe via les "Outils Google pour les webmasters", un compte Google (gratuit) est requis.
Pour soumettre votre blog dans le moteur de recherche de blogs Google ça se passe cet outil en ligne.
Conclusion
Vous pouvez abuser des sitemap sans modération, veillez tout de même à ce que le contenu soit cohérant.
En complément, je vous conseille d'optimiser le fichier robots.txt dans lequel vous pouvez préciser les parties ou pages de votre site que vous ne souhaitez pas voir ressortir dans les moteurs de recherche grâce au mot clé "Disallow". Gardez tout de même à l'esprit que ce fichier reste accessible à tout le monde et que de préciser des adresses de pages relativement sensibles (administration) est inutile si aucun lien ne pointe vers celles-ci (elle ne seront jamais indexées par les moteurs).
Pour générer votre sitemap il existe une multitude de site et logiciels sur le web 😉
Auteur : Mr Xhark
Fondateur du blog et passionné par les nouvelles techno, suivez-moi sur twitter
5 commentaires
Autres infos :
- la limite du nombre d'url dans un sitemap est de 50 000 (y'a de quoi faire).
- poids limite de la sitemap 10 Mo
- la limite du nombre de sitemap est de 1000 (je vous conseille néanmoins un site map par thématique si vous comptez exploser les 50 000 ou les 10Mo)
- google n'aime pas les doublons avec/sans www (en gros c'est l'un ou l'autre)
- évitez l'ASCII étendu, (en gros les petits coeurs encodé dans l'url)
- évitez les liens vers des fichiers (images, pdf, etc..) google les ignores de toutes manières
- évitez d'abuser du "changefreq hourly"
(enfaite surtout sur de vielles pages qui n'en n'ont pas besoin, gardez le par contre sur un article récent pour l'indexation des commentaires)
@Michael : merci pour les précisions
Au niveau de la taille il suffit de regarder le sitemap de Google pour faire planter son navigateur tellement y'a de choses 🙂
un peu long a charger car environ 4Mo.. mais sinon ça s'affiche parfaitement 🙂
Oui d'ailleurs j'avais réussi à faire planter Google Chrome et la sandbox n'avait pas fonctionner 🙂
Un vieux post mais tombé dessus en premier ... avec "influence sitemap" (comme ca, c'est dit 🙂
Idem, plantage de safari en essyant de charger le sitemap de google ... enfin, au bout de 2 mnt, j'ai forcé la fermeture.
Sur ce sujet, avec un annuaire de millions de pages, je n'ai pas (encore) généré de sitemap.
Je vais le faire, mais je cherche des infos sur le classement des pages, voire essayer d'influencer (si possible) l'indexation des meilleures pages... ???
Mais comme il est dit dans cet article, c'est gratuit et plus rapide, donc, autant en profiter!