Qu’est-ce qu’un sitemap ?

Un sitemap (ou plan de site en français) est un fichier, le plus souvent au format XML (eXtensible Markup Language) qui répertorie de manière structurée l’ensemble des URLs canoniques d’un site web que vous souhaitez voir explorées et indexées.

Ce fichier agit comme une feuille de route pour les robots des moteurs de recherche (Googlebot, Bingbot, etc.). Il leur fournit une liste exhaustive et organisée du contenu, améliorant le processus d’Exploration (Crawl) et d’Indexation.

S’il est correctement structuré, le sitemap est un pilier technique pour améliorer la visibilité d’un site dans les résultats de recherche et, par conséquent, maximiser le trafic organique.

Pourquoi faire un plan de site?

L’utilité d’un sitemap dépasse la simple liste d’URLs. C’est un outil stratégique pour optimiser l’efficacité de l’exploration par Google, notamment pour la gestion du Budget de Crawl.

  • Amélioration de l’Indexation et Découverte de Pages : Le sitemap permet aux moteurs de recherche de découvrir l’ensemble des pages d’un site web, y compris celles qui pourraient être enfouies ou difficiles d’accès via le maillage interne (faible profondeur de clic).

    Exemple Technique (E-commerce) : Un site e-commerce de taille moyenne (> 10 000 produits) utilise souvent des filtres ou des pages de produits qui ne sont pas liées directement depuis le menu principal. L’inclusion de ces URLs dans le sitemap garantit qu’elles sont trouvées, même si le robot n’a pas suivi un lien interne.

  • Optimisation du Budget de Crawl : Le budget de crawl est le nombre de pages qu’un robot est prêt à explorer sur votre site dans un temps donné. Pour les très grands sites (> 100 000 URLs), un sitemap bien tenu permet à Googlebot de dépenser son budget de manière plus intelligente, en se concentrant sur les pages prioritaires ou récemment mises à jour.

  • Suivi des Erreurs et Diagnostics : Les outils pour webmasters, principalement la Google Search Console (GSC), utilisent le sitemap pour alerter des erreurs (erreurs HTTP 404, redirections, URLs bloquées par robots.txt).

    Exemple d’Erreur : Si votre sitemap contient une URL qui retourne une erreur HTTP 404 (page non trouvée), la GSC l’identifiera et vous permettra de la corriger rapidement en la retirant du sitemap.

  • Facilitation de la Navigation (Sitemap HTML) : Bien que l’objectif premier soit technique (Sitemap XML), un Sitemap HTML peut également servir de plan de navigation pour les visiteurs, en indiquant la structure du site. C’est un complément pour l’UX, mais c’est le Sitemap XML qui est essentiel pour le SEO.

Comment créer et soumettre un plan de site

1. Création d’un Sitemap XML

Plusieurs méthodes existent pour générer un sitemap. Le choix dépend de votre plateforme (CMS) et de la taille du site :

  • Plugins CMS : Pour les sites sous WordPress, des extensions comme Yoast SEO ou Rank Math génèrent automatiquement le sitemap et le mettent à jour à chaque nouvelle publication.

  • Outils Tiers : Des logiciels d’audit SEO comme Screaming Frog SEO Spider (souvent utilisé en Europe pour les audits) permettent de crawler le site et d’exporter un sitemap statique.

  • Développement Custom : Pour les applications web complexes ou les grands sites, la génération dynamique via le serveur est souvent nécessaire.

2. Soumission du plan de site

Une fois créé et accessible via une URL (ex: https://votresite.com/sitemap.xml), il doit être déclaré aux moteurs de recherche :

Via Google Search Console (GSC) ► La méthode principale et la plus recommandée. Dans l’onglet Indexation puis Sitemaps, vous soumettez l’URL du fichier.

Via le fichier robots.txt ► Une bonne pratique consiste à ajouter la ligne Sitemap: https://developers.google.com/search/docs/crawling-indexing/sitemaps/overview?hl=fr à la fin de votre fichier robots.txt. Cela permet aux robots de le découvrir immédiatement sans passer par la GSC.

Bing Webmaster Tools ► Soumission similaire à la GSC pour optimiser l’indexation sur Bing.

3. Balises techniques optionnelles

Le format XML Sitemaps inclut des balises optionnelles qui fournissent des informations supplémentaires à Googlebot. Bien que Google indique souvent qu’il les utilise peu, elles peuvent être utiles :

<lastmod> : Indique la date de dernière modification de l’URL. Essentiel pour signaler les mises à jour et inciter Googlebot à la re-crawler.

<changefreq> : Indique la fréquence de mise à jour suggérée (ex: daily pour un site d’actualités).

<priority> : Indique la priorité relative de cette URL sur le site (échelle de 0.0 à 1.0).

Outils pour webmasters de Google :
Lien vers la console Google

Bing Webmaster Tools :
Lien vers les outils Bing

Exemple : dans les outils pour webmasters de Google, il est possible de soumettre un sitemap en allant dans l’onglet « Index » puis en cliquant sur « Soumettre un sitemap ».

Les bonnes pratiques d’un sitemap efficace

Pour maximiser l’efficacité SEO d’un sitemap plusieurs règles techniques doivent être respectées :

Limites de taille et structure :

Un sitemap ne doit pas contenir plus de 50 000 URLs.

Sa taille ne doit pas excéder 50 Mo (idéalement compressé en Gzip).

Si le site dépasse ces limites, vous devez utiliser un Index de Sitemaps (un fichier XML qui liste vos différents fichiers sitemaps).

Le sitemap doit uniquement contenir des URLs canoniques (qui retournent un code HTTP 200) et qui ne sont pas bloquées par le fichier robots.txt.

Le sitemap doit être mis à jour dès qu’une nouvelle page est publiée ou une page existante est modifiée.

Exemple : un site d’actualités ou de presse en ligne doit mettre à jour son sitemap quotidiennement, voire en temps réel, pour que les nouveaux articles soient indexés le plus rapidement possible (vitesse d’indexation).

Il est recommandé d’utiliser des sitemaps dédiés pour les contenus spécifiques :

  • Pour aider Google à découvrir et indexer vos images.
  • Crucial pour le contenu vidéo.
  • Obligatoire pour être éligible à Google Actualités.

Hreflang Sitemaps ► Pour les sites multilingues, c’est souvent la méthode la plus propre pour déclarer les balises hreflang et cibler la bonne audience européenne.

Le sitemap est un outil technique essentiel pour tout audit SEO et pour garantir la bonne santé de l’indexation d’un site web. Il participe directement à une meilleure gestion du crawl et à une augmentation de la visibilité dans les SERP.

Liens utiles :

La doc Google :
N’hésitez pas à lire la documentation Google sur le sujet.

Je vous dis tout sur le sitemap

On booste votre visibilité ?

Je vous aide à attirer plus de trafic qualifié vers votre site web grâce à des techniques de référencement naturel et payant optimisées.

Je suis disponible pour tout projet SEO / SEA  sur les Hauts-de-France (Béthune, Lille, Arras=.

Envie d’en savoir plus ? Contactez-moi via LinkedIn ou le bouton ci-dessous.

Matthieu Brunel

Matthieu Brunel

Consultant SEO, SEA, UX, CRO & acquisition de trafic

Passionné par le digital et spécialisé en référencement, j’ai développé une solide expertise dans l’analyse et l’optimisation du parcours client. Mon expérience s’étend de la consultance en référencement à la gestion de trafic, en passant par la création et l’optimisation de sites e-commerce.