Blog

Actualités, Astuces, Questions fréquentes

J’ai trop de pages indexées ?!

Voici un cas intéressant. Régulièrement lorsque nous prenons la gestion d’un site, nous faisons le tour du propriétaire. Parmi les éléments que nous vérifions figure le nombre de pages que le site possède dans l’index de Google. Ceci permet de ce faire une idée du volume de pages présentes sur le site et dans une certaine mesure “appréciées” par le moteur de recherche. C’est une démarche tout à fait habituel pour une agence de référencement. Cela permet d’éliminer facilement un nombre important d’entrées dupliquées dans la base de donnée du moteur de recherche (ce qui n’est jamais vraiment souhaitable!).

Le cas pratique décrit dans ce billet va vous expliquer :

  • comment déterminer le nombre de pages indexées de votre site.
  • comment identifier le problème si le score obtenu est trop différent de la réalité.
  • comment corriger simplement la situation avec les outils proposés par Google.

Comment déterminer le nombre de pages indexées ?

La commande est très connu et très simple à exploiter. Elle consiste à interroger Google sur l’url en question en plaçant le paramètre “site:” devant la requête, et cela se présente ainsi :

usage de la commande site

Notre article est relativement jeune par rapport au site, et le résulta retourné n’est pas très élevé. Ce qui compte ici c’est que ce score correspondent parfaitement avec notre nombre de page réellement en ligne. Supposons pour l’exemple que le score obtenu pour notre site était de 545 pages indexées, soit environ 10 fois plus que la réalité.

Dans ce cas, la méthode est simple, elle va consister à obliger Google à nous montrer la liste des URL qu’il a indexé, ainsi nous serons obligé de voir et nous pourrons donc comprendre ce qui se passe. Dans ce cas, refaite la même commande “site:” et ajoutez après l’url un morceau de phrase ne figurant sur la page d’accueil.

Google va vous retourner probablement qu’un seul résultat, dans ce cas prenez le soin de détecter le message du bas de page :

Pour limiter les résultats aux pages les plus pertinentes (total : 1), Google a ignoré certaines pages à contenu similaire. Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées.

Cliquez sur la mention “relancer la recherche en incluant les pages ignorées”. Vous avez maintenant toutes les urls relatives à votre page d’accueil avec les variantes qui génèrent le sur-nombre de résultat. Si votre cas de figure est le cas le plus classique, vous allez découvrir des urls qui sont complétées avec des paramètres d’url, cela se matérialise sous cette forme :

http://www.votre-domaine.fr/index.php?id_product=405&page=12345&order=asc
http://www.votre-domaine.fr/index.php?id_lang=802&page=123&order=desc
http://www.votre-domaine.fr/index.php?id_cms=456&page=124&order=desc
etc…

 

Ces paramètres appellent des variantes qui peuvent :

  • soit influer sur le contenu de la page (dans ce cas c’est un paramètre dynamique)
  • soit ne pas avoir d’influence sur le contenu de la page (dans cette situation, le plus souvent il s’agira de paramètre permettant des suivis statistiques (parfois utiles, parfois inutiles)).

 

Pour les sortir de l’index de Google et ainsi vous débarrasser de toutes ces entrées dupliquées, il existe un moyen simple dans un outil que vous connaissez tous très bien, votre Google Webmaster Tools ! à la rubrique / configuration / Paramètres d’url.

modification des paramètres d'url

modifier les paramtrees d’url

 

cas pratique pour la modification

exemple

 

ou alors si le paramètres d’url affecte le contenu de la page de nouvelles options apparaissent :

modification parametre url

Il ne vous reste plus qu’à attendre le prochain passage du moteur de recherche et réaliser à nouveau la même opération de comptage pour vous assurer que les urls indésirables ont bien disparues. Nous vous invitons à identifier clairement, et facilement UN paramètre, et à travailler autour de ce dernier en évitant de vouloir TOUT faire en une seule fois.

 

 

Infographie Gemini orange illustrant le guide Google Ads et le Quality Score, avec diagrammes et icônes liées à l’optimisation des performances et au CPC

Niveau de qualité de vos mots clés

Un score “silencieux” mais omniprésent Il est important de noter qu’en 2026, le Score de Qualité ne doit plus être vu comme une simple note statique affichée dans un tableau. S’il existe toujours un indicateur de 1 à 10 dans vos rapports pour...

Texte sur fond rouge indiquant 'Un audit pour votre référencement naturel'.

Un audit pour votre référencement naturel

Qu’est ce qu’un Audit de référencement ? C’est une étude détaillée qui est menée sur l’ensemble d’un site et de ses sites concurrents sur une thématique précises. Son objectif principal est de permettre de mieux comprendre et mieux situer votre positionnement web et...

Texte en blanc sur un fond rose, encourageant à opter pour des articles originaux selon Google.

Opter pour des articles originaux, Google vous y encourage

L’originalité : récompensée à tout les coups ! Qu’en est-il de la publication du plagiat de textes en provenance d’autres sites ? C’est une pratique qui est vide de sens, et que nous observons 9 fois sur 10 chez les webmasters douteux, qui...

Graphique représentant l'audit de la répartition du trafic web avec des sections colorées.

Audit : la répartition du trafic web

Votre référencement c’est votre visibilité, c’est ce qui va déterminer vos scores d’audience. Avoir un score exceptionnel de visite n’est pas forcement un atout si les termes les plus rémunérateurs en trafic ne vous permettent pas de faire de bons scores sur vos...

Texte blanc sur un fond rouge indiquant 'Offrir de la visibilité à votre site Internet'.

Offrir de la visibilité à votre site Internet en occupant la première page de Google

En étant positionné sur la première page de Google, vous allez obtenir un nombre de clics beaucoup plus important sur votre site Internet. Ainsi, cela va vous permettre de trouver de nouveaux clients, d’augmenter votre visibilité sur le net et donc de développer...

Illustration montrant les opérateurs de recherche Google tels que 'in', 'ou', et 'allin'.

Bien s’adresser à votre moteur de recherche préféré

Nous interrogeons Google de la manière la plus bête qui soit ! Surement parce que nous sommes impatients lorsque nous cherchons une page. Il est possible de l’interroger de manière beaucoup plus pointue  avec des commandes dédiées qui vont permettre...

Texte sur un fond coloré avec des conseils pour bien choisir votre agence de référencement.

Quelques conseils pour bien choisir votre agence de référencement

Comment doit-on choisir son agence de référencement ? Pour celui qui a besoin de ces services et qui n’a pas les connaissances générales sur le sujet, c’est un véritable casse tête. Vous êtes livrée à vous même, allez démarcher quelques agences, chercher à...

Texte sur fond rouge indiquant 'Le Référencement Gratuit ou à la Performance'.

Le Référencement Gratuit ou à la Performance

Pour commencer le sujet, insistons sur le fait qu’internet c’est l’occasion de tout avoir gratuitement … alors pourquoi se priver de proposer des services pour le référencement qui ne soient pas aussi gratuits !!! Le référencement gratuit,...

Texte sur fond rouge indiquant 'Comprendre le fichier Robots.txt'.

Comprendre le fichier Robots.txt

Le saviez-vous , le fichier robot.txt est un élément de base du référencement, le fichier indique aux moteurs de recherche les pages qui  peuvent ou qui ne peuvent pas être crawlées et indexées. Le plus souvent il est utilisé pour limiter les espaces que vous...

Capture d'écran montrant des résultats de recherche pour le site 123boost.com sur Google.

J’ai trop de pages indexées ?!

Voici un cas intéressant. Régulièrement lorsque nous prenons la gestion d’un site, nous faisons le tour du propriétaire. Parmi les éléments que nous vérifions figure le nombre de pages que le site possède dans l’index de Google. Ceci permet de ce faire une...