Blog

Actualités, Astuces, Questions fréquentes

J’ai trop de pages indexées ?!

Voici un cas intéressant. Régulièrement lorsque nous prenons la gestion d’un site, nous faisons le tour du propriétaire. Parmi les éléments que nous vérifions figure le nombre de pages que le site possède dans l’index de Google. Ceci permet de ce faire une idée du volume de pages présentes sur le site et dans une certaine mesure “appréciées” par le moteur de recherche. C’est une démarche tout à fait habituel pour une agence de référencement. Cela permet d’éliminer facilement un nombre important d’entrées dupliquées dans la base de donnée du moteur de recherche (ce qui n’est jamais vraiment souhaitable!).

Le cas pratique décrit dans ce billet va vous expliquer :

  • comment déterminer le nombre de pages indexées de votre site.
  • comment identifier le problème si le score obtenu est trop différent de la réalité.
  • comment corriger simplement la situation avec les outils proposés par Google.

Comment déterminer le nombre de pages indexées ?

La commande est très connu et très simple à exploiter. Elle consiste à interroger Google sur l’url en question en plaçant le paramètre “site:” devant la requête, et cela se présente ainsi :

usage de la commande site

Notre article est relativement jeune par rapport au site, et le résulta retourné n’est pas très élevé. Ce qui compte ici c’est que ce score correspondent parfaitement avec notre nombre de page réellement en ligne. Supposons pour l’exemple que le score obtenu pour notre site était de 545 pages indexées, soit environ 10 fois plus que la réalité.

Dans ce cas, la méthode est simple, elle va consister à obliger Google à nous montrer la liste des URL qu’il a indexé, ainsi nous serons obligé de voir et nous pourrons donc comprendre ce qui se passe. Dans ce cas, refaite la même commande “site:” et ajoutez après l’url un morceau de phrase ne figurant sur la page d’accueil.

Google va vous retourner probablement qu’un seul résultat, dans ce cas prenez le soin de détecter le message du bas de page :

Pour limiter les résultats aux pages les plus pertinentes (total : 1), Google a ignoré certaines pages à contenu similaire. Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées.

Cliquez sur la mention “relancer la recherche en incluant les pages ignorées”. Vous avez maintenant toutes les urls relatives à votre page d’accueil avec les variantes qui génèrent le sur-nombre de résultat. Si votre cas de figure est le cas le plus classique, vous allez découvrir des urls qui sont complétées avec des paramètres d’url, cela se matérialise sous cette forme :

http://www.votre-domaine.fr/index.php?id_product=405&page=12345&order=asc
http://www.votre-domaine.fr/index.php?id_lang=802&page=123&order=desc
http://www.votre-domaine.fr/index.php?id_cms=456&page=124&order=desc
etc…

 

Ces paramètres appellent des variantes qui peuvent :

  • soit influer sur le contenu de la page (dans ce cas c’est un paramètre dynamique)
  • soit ne pas avoir d’influence sur le contenu de la page (dans cette situation, le plus souvent il s’agira de paramètre permettant des suivis statistiques (parfois utiles, parfois inutiles)).

 

Pour les sortir de l’index de Google et ainsi vous débarrasser de toutes ces entrées dupliquées, il existe un moyen simple dans un outil que vous connaissez tous très bien, votre Google Webmaster Tools ! à la rubrique / configuration / Paramètres d’url.

modification des paramètres d'url

modifier les paramtrees d’url

 

cas pratique pour la modification

exemple

 

ou alors si le paramètres d’url affecte le contenu de la page de nouvelles options apparaissent :

modification parametre url

Il ne vous reste plus qu’à attendre le prochain passage du moteur de recherche et réaliser à nouveau la même opération de comptage pour vous assurer que les urls indésirables ont bien disparues. Nous vous invitons à identifier clairement, et facilement UN paramètre, et à travailler autour de ce dernier en évitant de vouloir TOUT faire en une seule fois.

 

 

Texte sur un fond rose indiquant 'Les mots clés et référencement payant (Adwords)'.

Les mots cléss et référencement payant (Ads)

Quelle est la différence entre le référencement naturel (également appelé référencement gratuit ou encore référencement organique) et le référencement payant?. Le référencement naturel laisse l’algorithme des moteurs de recherche décider de la pertinences de...

Un jeune hacker concentré tapant sur un clavier avec des graphiques numériques flottants autour de lui.

12 facteurs à prendre en considération lors de la création d’un site Web personnalisé et réactif

À mesure qu’une entreprise se développe, il est important de disposer d’un site Web capable de s’adapter à l’évolution des besoins. Dans le monde numérique d’aujourd’hui, les sites web ne sont pas seulement un endroit où les...

Texte sur fond rouge indiquant 'Le référencement par le netlinking'.

Le référencement par le netlinking

Pour plaire aux moteurs de recherche, un site internet doit être bien conçu et proposer régulièrement du contenu unique et optimisé. Ce n’est pas tout : il doit également justifier d’un bon indice de popularité auprès des moteurs de recherche. Pour y parvenir, nous...

Infographie beige et orange détaillant les 7 erreurs à éviter pour le référencement d'un site, référence à Google et à l'agence 123boost

7 erreurs à éviter pour le référencement de votre site

Il y a beaucoup d’éléments à vérifier pour le référencement de votre site, le centre d’aide de Google pour les webmasters est une très bonne source d’informations pour savoir par où commencer. Le SEO (search engine optimization) d’un site demande du temps, des...

Texte sur fond rose indiquant 'Comprendre et auditer ses concurrents, c'est important'.

Comprendre et auditer ses concurrents, c’est important !

Votre activité s’essouffle, vous avez du mal à développer de nouvelles orientations, vous ne voulez pas vous faire dépasser par des sites concurrents plus novateurs et audacieux? L’audit référencement peut vous aider à vous aiguiller vers des idées qui plairont...

Panneaux rouges et jaunes avec les mots 'Web Marketing' entourés de dés colorés sur un fond bleu.

Le Web Marketing ou le pouvoir de conversion

L’objectif de chaque site Il va sans dire que l’objectif de chaque site est de permettre de promouvoir services et produits en vue de les commercialiser et d’en tirer le maximum de bénéfice en augmentant votre chiffre d’affaires. Certains...

Texte sur fond rouge indiquant 'Un audit pour votre référencement naturel'.

Un audit pour votre référencement naturel

Qu’est ce qu’un Audit de référencement ? C’est une étude détaillée qui est menée sur l’ensemble d’un site et de ses sites concurrents sur une thématique précises. Son objectif principal est de permettre de mieux comprendre et mieux situer votre positionnement web et...

Texte sur un fond rose indiquant 'Liens internes et ancres similaires'.

Liens internes et ancres similaires

Donner un sens pratique à vos liens interne Nous avons vu l’importance du netlinking, et avons déjà abordé les règles de bon usage. Voyons maintenant ce qu’il en est pour les liens internes. Votre site, q’uil s’agit de page html réalisées par...

Texte sur le netlinking et les bonnes pratiques pour le référencement naturel sur le site 123boost.

Balise description trop courte

Voici un court article pour montrer le comportement du moteur de recherche lorsque la balise description est trop courte. Le moteur de recherche se sent alors obligé de prendre le contenu de la page pour l’afficher dans la page de ses résultats comme si nous...

Texte sur un fond coloré avec des conseils pour bien choisir votre agence de référencement.

Quelques conseils pour bien choisir votre agence de référencement

Comment doit-on choisir son agence de référencement ? Pour celui qui a besoin de ces services et qui n’a pas les connaissances générales sur le sujet, c’est un véritable casse tête. Vous êtes livrée à vous même, allez démarcher quelques agences, chercher à...