Pourquoi une page web n'est pas indexée par Google ?

Publié le 13/07/2024 par Candice

pourquoi-page-web-pas-indexee-par-google

Avant d'indexer une page web, Google traite et analyse son contenu. Ensuite, si le contenu répond aux requêtes des internautes, elle peut être mise en avant dans les résultats de recherche. Or, il existe de nombreuses raisons pour lesquelles une page peut ne pas être indexée et donc ne pas être visible sur Google. On vous explique.

La page n'est pas adaptée aux mobiles

S'il n'est pas obligatoire d'avoir une version mobile de vos pages pour qu'elles remontent dans les résultats de recherche, sachez que c'est tout de même fortement recommandé.

D'ailleurs, Google utilise principalement la version mobile d'une page web pour l'explorer, l'indexer et la classer dans les résultats de recherche. C'est ce qu'on appelle « l'indexation orientée mobile ».

Pour que vos pages soient indexées par Google, vous devez alors vous assurer de plusieurs éléments :

Google peut-il accéder et afficher votre contenu quel que soit l'appareil utilisé ? Pour cela, utilisez les mêmes balises « meta » robots pour la version mobile ou ordinateur.
Le contenu à chargement différé sur vos pages est-il également accessible ? Par exemple, sachez que Google ne charge pas le contenu qui nécessite une interaction de l'internaute (clic ou balayage de l'écran).
Le contenu de votre site est-il identique en version mobile et en version ordinateur ?
Avez-vous spécifié les mêmes métadonnées sur la version mobile que sur la version ordinateur ?
Vos contenus visuels respectent-ils bien les bonnes pratiques relatives à l'affichage sur mobile ?

Pour en savoir plus, rendez-vous sur la page dédiée à l'indexation orientée mobile sur Google Search Central.

L'indexation de la page est bloquée

Plusieurs mécanismes peuvent bloquer l'indexation d'une page web. C'est le cas notamment selon la configuration de votre fichier robots.txt ou si vous avez mis en place une directive « noindex », ou encore une règle « disallow » par exemple.

Un fichier robots.txt a pour rôle d'indiquer aux robots d'exploration de Google les URL accessibles sur votre site (pour leur exploration). Il sert principalement à gérer le trafic des robots d'exploration sur votre site.

Or, il peut arriver que vous ayez besoin de limiter le trafic d'exploration de votre site, notamment si vous avez peur que votre serveur soit dépassé par les requêtes de Googlebot. Dans ce cas, l'indexation de certaines pages peut être bloquée.

Vous avez aussi la possibilité de bloquer l'indexation d'une page de votre site en utilisant la directive « noindex ». Concrètement, en ajoutant une balise « meta » ou un en-tête de réponse HTTP, Google le détectera à la prochaine exploration et exclura la page concernée des résultats de recherche.

Enfin, la règle « disallow » a pour objectif de spécifier les chemins auxquels les robots d'exploration n'ont pas accès. Sachez que Google ne peut pas indexer le contenu d'une page dont l'exploration n'est pas autorisée. En revanche, l'URL peut tout de même être indexée et affichée dans les résultats de recherche, mais sans extrait.

Les contenus de la page sont de faible qualité

Pour qu'une page web soit indexée (et remonte dans la page de résultats de Google, qu'on appelle « la SERP »), son contenu doit être jugé utile et intéressant par le moteur de recherche.

Pour cela, le contenu doit répondre à un certain nombre de critères et notamment :

Être fiable et « people-first » : avant de le publier, interrogez-vous sur votre contenu. Apporte-t-il des réponses concrètes aux internautes qui vont le lire ? Est-il rédigé de façon appropriée ? Présente-t-il des fautes d'orthographe et de syntaxe ? Les informations fournies dans le contenu peuvent-elles être jugées dignes de confiance ?
Être unique : même si vous pouvez vous appuyer sur d'autres articles pour rédiger un contenu, ne recopiez pas tout ou partie d'un autre contenu et citez vos sources ! Il existe de nombreux outils gratuits disponibles en ligne pour tester le taux de plagiat de vos articles (Duplichecker ou encore plagiarismdetector) et vous assurer que vous publiez du contenu réellement original. De même, ne dupliquez pas votre propre contenu sur plusieurs pages de votre site, au risque que vos contenus (et votre site tout entier) soient pénalisés par Google.
Répondre aux exigences techniques pour être indexé par le moteur de recherche : Google n'indexe par exemple que les pages servies avec un code d'état HTTP 200 (success) ainsi que le contenu qui n'enfreint pas les règles concernant le spam.
Être à jour : il est essentiel que les contenus publiés sur votre site soient d'actualité pour être indexés. Relisez et mettez à jour régulièrement vos contenus pour vous en assurer.

La conception du site rend l'indexation difficile

Cette partie est un peu technique mais si on le vulgarise, le concept est le suivant : si vous utilisez un modèle d'architecture de type « Client Side Rendering » basé sur Javascript pour votre site Internet, et notamment si vous avez besoin d'afficher un contenu très dynamique sur votre site. C'est le cas par exemple, pour une plateforme de location de vacances en ligne et sur laquelle les visiteurs modifient les critères au fur et à mesure de leur recherche (date de séjour, localisation, type de location...).

Dans ce cas, le contenu des pages n'est affiché que partiellement lors du chargement initial de chaque page. L'exploration des contenus est donc bien plus complexe pour Google car il doit attendre que les traitements Javascript soient terminés pour afficher le reste du contenu. Cela a généralement un impact important sur l'indexation des pages par le moteur de recherche, et donc, in fine, sur la stratégie de référencement SEO.

Votre page est nouvelle

Avant de pouvoir être indexée par Google, une page doit au préalable être explorée par les robots du moteur de recherche. Or, si vous venez de publier une page sur votre site, il se peut que celle-ci n'ait pas encore été explorée, et donc pas encore indexée.

Comptez généralement entre quelques jours, voire quelques semaines, pour l'indexation d'une nouvelle page par Google.

Le saviez-vous ?

Vous avez la possibilité de demander l'indexation d'une page manuellement à Google. Pour cela, il vous suffit de vous rendre sur Google Search Console, de renseigner l'URL de la page que vous souhaitez voir indexer dans le champ « Inspecter n'importe quelle URL de votre site » et de cliquer sur « Demander une indexation ».

Vous avez migré votre site vers un autre domaine

Vous avez changé de nom de marque et donc de nom de domaine pour votre site ? Même si vos pages étaient bien classées avant la migration, ce n'est plus forcément le cas après.

Dans ce cas, mettez en place des redirections 301 pour rediriger les internautes, mais aussi Googlebot.

Vous avez un problème de sécurité sur votre site

Si Google identifie des problèmes de sécurité sur votre page, il est fréquent qu'elle soit moins bien classée dans les résultats de recherche, voire pas du tout indexée.

Les problèmes de sécurité identifiés sont multiples et variés : le contenu de votre page a été piraté (un contenu publié sur votre site sans votre autorisation) ; le contenu de la page incite les visiteurs à effectuer une action dangereuse (révéler des données confidentielles), etc.

Il existe bien d'autres cas pouvant expliquer qu'une page web ne soit pas indexée par Google : page orpheline, liens internes brisés, etc. Généralement, les éléments renseignés dans Google Search Console vous permettent d'en savoir plus et de corriger les problèmes d'indexation. Sinon, n'hésitez pas à faire appel à un prestataire spécialisé pour vous aider.

Bon à savoir

Chez Agapornis, nous intégrons les exigences des moteurs de recherche dès la création de votre site Internet afin d'assurer l'indexation de toutes vos pages.

Les questions fréquentes sur le sujet

En quoi consiste l'indexation d'une page web ?

Pour qu'une page de votre site Internet remonte dans les résultats de recherche Google, celle-ci doit au préalable avoir été ajoutée à l'index de Google. Concrètement, le moteur de recherche commence par explorer le contenu de vos pages, si vos pages répondent aux critères d'indexation, elles sont indexées par Google. Et, selon la pertinence des contenus, vos pages remontent (ou non) dans les résultats de recherche Google lorsqu'un internaute effectue une requête.

Qu'est-ce qu'un robot d'indexation ?

Un robot d'indexation, aussi appelé « web crawler » ou « bot » est en réalité un robot d'exploration.

L'objectif d'un moteur de recherche est de pouvoir apporter une réponse aux requêtes des internautes. Pour y parvenir, les moteurs de recherche scannent l'ensemble des contenus disponibles sur Internet et créent ce qu'on appelle un index. Après avoir exploré une page et vérifié que son contenu était pertinent, le moteur de recherche procède à l'indexation de la page (et l'ajoute donc à son index).

Comment indexer une page web ?

Généralement, vous n'avez aucune action à mettre en œuvre pour indexer une page web. Google réalise l'exploration et l'indexation de vos contenus automatiquement.

Toutefois, si vous constatez qu'une page de votre site n'est pas indexée, c'est qu'il y a peut-être un problème d'indexation. Il faudra investiguer pour détecter la source du problème et le corriger pour que votre page puisse être indexée par Google.

Crédit photo pour l'illustration de l'article : photo-mix-company

Candice Vernadat-Moitrelle

Cofondatrice Agapornis

Passionnée par les mots et par leur capacité à transmettre des messages et des émotions, Candice s’est spécialisée dans la rédaction de contenus SEO lorsqu’elle s’est lancée en tant qu’autoentrepreneur en 2019.

En 2024, elle a cofondé Agapornis, une société de création, d’hébergement et de maintenance de sites web, aux côtés de son associé Thibault Vernadat-Moitrelle. Sa plume est toujours au service de ses clients et elle continue d’exprimer sa passion pour les mots en rédigeant des articles sur le blog d’Agapornis.

Lire aussi...