S'il n'est pas obligatoire d'avoir une version mobile de vos pages pour qu'elles remontent dans les résultats de recherche, sachez que c'est tout de même fortement recommandé.
D'ailleurs, Google utilise principalement la version mobile d'une page web pour l'explorer, l'indexer et la classer dans les résultats de recherche. C'est ce qu'on appelle « l'indexation orientée mobile ».
Pour que vos pages soient indexées par Google, vous devez alors vous assurer de plusieurs éléments :
Pour en savoir plus, rendez-vous sur la page dédiée à l'indexation orientée mobile sur Google Search Central.
Plusieurs mécanismes peuvent bloquer l'indexation d'une page web. C'est le cas notamment selon la configuration de votre fichier robots.txt ou si vous avez mis en place une directive « noindex », ou encore une règle « disallow » par exemple.
Un fichier robots.txt a pour rôle d'indiquer aux robots d'exploration de Google les URL accessibles sur votre site (pour leur exploration). Il sert principalement à gérer le trafic des robots d'exploration sur votre site.
Or, il peut arriver que vous ayez besoin de limiter le trafic d'exploration de votre site, notamment si vous avez peur que votre serveur soit dépassé par les requêtes de Googlebot. Dans ce cas, l'indexation de certaines pages peut être bloquée.
Vous avez aussi la possibilité de bloquer l'indexation d'une page de votre site en utilisant la directive « noindex ». Concrètement, en ajoutant une balise « meta » ou un en-tête de réponse HTTP, Google le détectera à la prochaine exploration et exclura la page concernée des résultats de recherche.
Enfin, la règle « disallow » a pour objectif de spécifier les chemins auxquels les robots d'exploration n'ont pas accès. Sachez que Google ne peut pas indexer le contenu d'une page dont l'exploration n'est pas autorisée. En revanche, l'URL peut tout de même être indexée et affichée dans les résultats de recherche, mais sans extrait.
Pour qu'une page web soit indexée (et remonte dans la page de résultats de Google, qu'on appelle « la SERP »), son contenu doit être jugé utile et intéressant par le moteur de recherche.
Pour cela, le contenu doit répondre à un certain nombre de critères et notamment :
Cette partie est un peu technique mais si on le vulgarise, le concept est le suivant : si vous utilisez un modèle d'architecture de type « Client Side Rendering » basé sur Javascript pour votre site Internet, et notamment si vous avez besoin d'afficher un contenu très dynamique sur votre site. C'est le cas par exemple, pour une plateforme de location de vacances en ligne et sur laquelle les visiteurs modifient les critères au fur et à mesure de leur recherche (date de séjour, localisation, type de location...).
Dans ce cas, le contenu des pages n'est affiché que partiellement lors du chargement initial de chaque page. L'exploration des contenus est donc bien plus complexe pour Google car il doit attendre que les traitements Javascript soient terminés pour afficher le reste du contenu. Cela a généralement un impact important sur l'indexation des pages par le moteur de recherche, et donc, in fine, sur la stratégie de référencement SEO.
Avant de pouvoir être indexée par Google, une page doit au préalable être explorée par les robots du moteur de recherche. Or, si vous venez de publier une page sur votre site, il se peut que celle-ci n'ait pas encore été explorée, et donc pas encore indexée.
Comptez généralement entre quelques jours, voire quelques semaines, pour l'indexation d'une nouvelle page par Google.
Vous avez changé de nom de marque et donc de nom de domaine pour votre site ? Même si vos pages étaient bien classées avant la migration, ce n'est plus forcément le cas après.
Dans ce cas, mettez en place des redirections 301 pour rediriger les internautes, mais aussi Googlebot.
Si Google identifie des problèmes de sécurité sur votre page, il est fréquent qu'elle soit moins bien classée dans les résultats de recherche, voire pas du tout indexée.
Les problèmes de sécurité identifiés sont multiples et variés : le contenu de votre page a été piraté (un contenu publié sur votre site sans votre autorisation) ; le contenu de la page incite les visiteurs à effectuer une action dangereuse (révéler des données confidentielles), etc.
Il existe bien d'autres cas pouvant expliquer qu'une page web ne soit pas indexée par Google : page orpheline, liens internes brisés, etc. Généralement, les éléments renseignés dans Google Search Console vous permettent d'en savoir plus et de corriger les problèmes d'indexation. Sinon, n'hésitez pas à faire appel à un prestataire spécialisé pour vous aider.
Pour qu'une page de votre site Internet remonte dans les résultats de recherche Google, celle-ci doit au préalable avoir été ajoutée à l'index de Google. Concrètement, le moteur de recherche commence par explorer le contenu de vos pages, si vos pages répondent aux critères d'indexation, elles sont indexées par Google. Et, selon la pertinence des contenus, vos pages remontent (ou non) dans les résultats de recherche Google lorsqu'un internaute effectue une requête.
Un robot d'indexation, aussi appelé « web crawler » ou « bot » est en réalité un robot d'exploration.
L'objectif d'un moteur de recherche est de pouvoir apporter une réponse aux requêtes des internautes. Pour y parvenir, les moteurs de recherche scannent l'ensemble des contenus disponibles sur Internet et créent ce qu'on appelle un index. Après avoir exploré une page et vérifié que son contenu était pertinent, le moteur de recherche procède à l'indexation de la page (et l'ajoute donc à son index).
Généralement, vous n'avez aucune action à mettre en œuvre pour indexer une page web. Google réalise l'exploration et l'indexation de vos contenus automatiquement.
Toutefois, si vous constatez qu'une page de votre site n'est pas indexée, c'est qu'il y a peut-être un problème d'indexation. Il faudra investiguer pour détecter la source du problème et le corriger pour que votre page puisse être indexée par Google.