Blog

Actualités, Astuces, Questions fréquentes

J’ai trop de pages indexées ?!

Voici un cas intéressant. Régulièrement lorsque nous prenons la gestion d’un site, nous faisons le tour du propriétaire. Parmi les éléments que nous vérifions figure le nombre de pages que le site possède dans l’index de Google. Ceci permet de ce faire une idée du volume de pages présentes sur le site et dans une certaine mesure “appréciées” par le moteur de recherche. C’est une démarche tout à fait habituel pour une agence de référencement. Cela permet d’éliminer facilement un nombre important d’entrées dupliquées dans la base de donnée du moteur de recherche (ce qui n’est jamais vraiment souhaitable!).

Le cas pratique décrit dans ce billet va vous expliquer :

  • comment déterminer le nombre de pages indexées de votre site.
  • comment identifier le problème si le score obtenu est trop différent de la réalité.
  • comment corriger simplement la situation avec les outils proposés par Google.

Comment déterminer le nombre de pages indexées ?

La commande est très connu et très simple à exploiter. Elle consiste à interroger Google sur l’url en question en plaçant le paramètre “site:” devant la requête, et cela se présente ainsi :

usage de la commande site

Notre article est relativement jeune par rapport au site, et le résulta retourné n’est pas très élevé. Ce qui compte ici c’est que ce score correspondent parfaitement avec notre nombre de page réellement en ligne. Supposons pour l’exemple que le score obtenu pour notre site était de 545 pages indexées, soit environ 10 fois plus que la réalité.

Dans ce cas, la méthode est simple, elle va consister à obliger Google à nous montrer la liste des URL qu’il a indexé, ainsi nous serons obligé de voir et nous pourrons donc comprendre ce qui se passe. Dans ce cas, refaite la même commande “site:” et ajoutez après l’url un morceau de phrase ne figurant sur la page d’accueil.

Google va vous retourner probablement qu’un seul résultat, dans ce cas prenez le soin de détecter le message du bas de page :

Pour limiter les résultats aux pages les plus pertinentes (total : 1), Google a ignoré certaines pages à contenu similaire. Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées.

Cliquez sur la mention “relancer la recherche en incluant les pages ignorées”. Vous avez maintenant toutes les urls relatives à votre page d’accueil avec les variantes qui génèrent le sur-nombre de résultat. Si votre cas de figure est le cas le plus classique, vous allez découvrir des urls qui sont complétées avec des paramètres d’url, cela se matérialise sous cette forme :

http://www.votre-domaine.fr/index.php?id_product=405&page=12345&order=asc
http://www.votre-domaine.fr/index.php?id_lang=802&page=123&order=desc
http://www.votre-domaine.fr/index.php?id_cms=456&page=124&order=desc
etc…

 

Ces paramètres appellent des variantes qui peuvent :

  • soit influer sur le contenu de la page (dans ce cas c’est un paramètre dynamique)
  • soit ne pas avoir d’influence sur le contenu de la page (dans cette situation, le plus souvent il s’agira de paramètre permettant des suivis statistiques (parfois utiles, parfois inutiles)).

 

Pour les sortir de l’index de Google et ainsi vous débarrasser de toutes ces entrées dupliquées, il existe un moyen simple dans un outil que vous connaissez tous très bien, votre Google Webmaster Tools ! à la rubrique / configuration / Paramètres d’url.

modification des paramètres d'url

modifier les paramtrees d’url

 

cas pratique pour la modification

exemple

 

ou alors si le paramètres d’url affecte le contenu de la page de nouvelles options apparaissent :

modification parametre url

Il ne vous reste plus qu’à attendre le prochain passage du moteur de recherche et réaliser à nouveau la même opération de comptage pour vous assurer que les urls indésirables ont bien disparues. Nous vous invitons à identifier clairement, et facilement UN paramètre, et à travailler autour de ce dernier en évitant de vouloir TOUT faire en une seule fois.

 

 

Texte sur le netlinking et les bonnes pratiques pour le référencement naturel sur le site 123boost.

Balise description trop courte

Voici un court article pour montrer le comportement du moteur de recherche lorsque la balise description est trop courte. Le moteur de recherche se sent alors obligé de prendre le contenu de la page pour l’afficher dans la page de ses résultats comme si nous...

Infographie orange montrant un développeur en hoodie travaillant sur un ordinateur, représentant les 12 facteurs d’un site Web personnalisé et réactif par 123boost

12 facteurs à prendre en considération lors de la création d’un site Web personnalisé et réactif

À mesure qu’une entreprise se développe, il est important de disposer d’un site Web capable de s’adapter à l’évolution des besoins. Dans le monde numérique d’aujourd’hui, les sites web ne sont pas seulement un endroit où les...

Portrait d'un homme souriant, portant une chemise et des lunettes, avec un fond flou.

La balise rel=”author”

Comment signer vos contenus La balise rel=”author” … cette balise permet de mettre en avant l’identité de l’auteur directement dans les résultats de Google. Il vous faudra réunir quelques éléments pour y parvenir : Il faut placer la...

Texte explicatif sur les accents et le référencement en français, avec des exemples.

Mots clés avec ou sans accent, avec ou sans article ?

Cas particulier pour certaines expressions clés Certaines expressions sont avec des accents et/ou sont composées de deux mots, ou encore nous les rencontrons dans le language courant avec ou sans préposition… Au moment de définir votre meilleur stratégie de mots...

Texte sur un fond rose indiquant 'Les mots clés et référencement payant (Adwords)'.

Les mots cléss et référencement payant (Ads)

Quelle est la différence entre le référencement naturel (également appelé référencement gratuit ou encore référencement organique) et le référencement payant?. Le référencement naturel laisse l’algorithme des moteurs de recherche décider de la pertinences de...

Gemini migration OVH vers Google Workspace et Gmail avec Split Delivery, démontrant le routage des emails entrants entre Google Workspace et le serveur OVH.

Migrer de OVH vers Google Workspace sans coupure : le Split Delivery expliqué

Changer de plateforme mail, c’est rarement anodin. Quand une entreprise décide de quitter OVH pour Google Workspace, elle s’expose à un moment critique : celui où les enregistrements MX basculent, et où le moindre mauvais paramétrage peut faire disparaître...

Infographie Gemini orange illustrant le guide Google Ads et le Quality Score, avec diagrammes et icônes liées à l’optimisation des performances et au CPC

Niveau de qualité de vos mots clés

Un score “silencieux” mais omniprésent Il est important de noter qu’en 2026, le Score de Qualité ne doit plus être vu comme une simple note statique affichée dans un tableau. S’il existe toujours un indicateur de 1 à 10 dans vos rapports pour...

Texte blanc sur un fond rouge indiquant 'Offrir de la visibilité à votre site Internet'.

Offrir de la visibilité à votre site Internet en occupant la première page de Google

En étant positionné sur la première page de Google, vous allez obtenir un nombre de clics beaucoup plus important sur votre site Internet. Ainsi, cela va vous permettre de trouver de nouveaux clients, d’augmenter votre visibilité sur le net et donc de développer...

Infographie orange montrant les performances web et l'optimisation du temps de chargement, avec Google et OVH et une référence à Matt Cutts.

Le chargement des pages (page speed) et votre positionnement dans Google

Le temps de chargement d’une page web est-il un critère déterminant pour le positionnement de votre site dans les moteurs de recherche ? La réponse est officiellement oui.

Texte sur un fond rouge indiquant 'Choisir son Agence SEO : 12 points clés, plein de bon sens'.

Choisir son Agence SEO : 12 points clés, plein de bon sens

Choisir son référenceur parmi toutes les agences qui fleurissent sur le web est une tâche délicate.  Compréhension, force de proposition, adaptation, honnêteté,  disponibilité, transparence, assiduité, traçabilité des actions, professionnalisme et personnalisation des...