Les robots d’exploration de Google recherchent en permanence sur Internet des pages Web nouvelles et mises à jour.
Lorsque ces robots indexent le contenu d’un site, ils ne se contentent pas d’utiliser ces informations pour fournir des résultats de recherche. Ils font une sauvegarde des pages et les ajoutent à une base de données unifiée appelée Google Cache.
Vous avez peut-être déjà utilisé Google Cache pour afficher d’anciennes versions de sites Web qui ne fonctionnent pas ou ne se chargent pas correctement. Mais saviez-vous que vous pouvez également l’utiliser pour résoudre des problèmes sur votre site Web ? Il peut même vous aider dans vos efforts de référencement.
Cet article présente Google Cache et explique comment le vérifier. Nous verrons également en quoi Google Cache est utile, et quand il ne faut pas trop s’y fier.
Comment afficher le cache de Google
La manière d’accéder à une page Google en cache à partir des résultats du moteur de recherche Google dépend du type d’appareil que vous utilisez. À partir d’un navigateur Web de bureau, vous avez deux possibilités :
-
- Vous pouvez suivre un lien vers la version en cache d’une page, en cliquant sur la petite flèche (pointant vers le bas) juste en face de l’URL d’un site, à partir des résultats de recherche Google.
- Vous pouvez accéder directement à la page. Pour cette méthode, vous devez connaître l’URL de la page que vous voulez voir. Il suffit d’entrer sur votre navigateur cache:website.xyz dans la barre de recherche. Par exemple, cache:adgency360.com vous amènera directement à notre page d’accueil en cache.
Le cache de Google – Définition
Une page mise en cache par Google est une sauvegarde HTML brute du contenu d’une page prise au cours de l’un des crawls de Google. Le cache Google dans son ensemble comprend ces pages sauvegardées.
Si vous regardez la version en cache de votre site Web, elle ressemblera probablement beaucoup à ce qu’elle était au moment de l’exploration par les robots d’exploration. Mais il y a quelques raisons pour lesquelles la version en cache peut apparaître parfois différente comparé à la version Live.
Les deux principales raisons sont les suivantes :
- La page Web est rendue par votre navigateur, et non par Google. Cela peut entraîner des divergences avec la version actuelle du site.
- Le JavaScript se trouvant sur la page, n’est pas enregistré dans la mémoire cache, ce qui peut entraîner l’absence de certains éléments de votre page/site Web.
En haut d’une page mise en cache, vous verrez une bannière vous indiquant trois choses :
- L’URL de la page mise en cache : Il s’agit généralement de l’URL que vous vouliez visiter. Dans certains cas, comme une URL redirigée, elle sera différente.
- La date à laquelle cette version de la page a été mise en cache : Vous pouvez voir si la page en cache que vous consultez a été créée hier ou la semaine dernière. Il ne s’agit pas nécessairement de la dernière fois que votre page Web a été explorée ; nous y reviendrons plus tard.
- Versions : Vous pouvez choisir d’afficher la version complète, la version texte seulement ou le code source de votre page. La version complète vous montre la page telle qu’elle est rendue par votre navigateur. Dans la version texte seul, les feuilles de style CSS sont désactivées et aucune image n’est affichée, mais les liens hypertextes sont toujours visibles. Si vous cliquez sur Afficher la source, le code source de la page s’affiche. Voici à titre d’exemple, la version en cache de notre page d’accueil.
Pourquoi l’analyse du Cache de Google est-elle importante ?
L’intérêt principal de Google Cache est de voir les pages Web qui ne sont pas disponibles ou qui ont des problèmes de chargement.
Il existe d’autres raisons pour lesquelles Google Cache est crucial. Vous espérez que votre site ne sera jamais indisponible ou ne connaîtra pas de problèmes, mais cela arrive. Le fait de disposer d’une version en cache met votre contenu à la disposition des utilisateurs, même si quelque chose ne fonctionne pas correctement.
Vous pouvez également utiliser la version en cache de votre site pour savoir comment votre site est indexé et diagnostiquer les problèmes.
Outils d’affichage du cache de Google
Avec ces outils, vous n’avez pas besoin d’outils spéciaux pour afficher les pages mises en cache ; Google le fait de manière native et extrêmement facile. Mais il existe quelques outils dont les fonctionnalités pourraient vous intéresser.
- L’extension « Web Cache Viewer » pour Chrome vous permet de cliquer avec le bouton droit de la souris sur n’importe quel lien pour afficher à la fois la version de la page mise en cache par Google et la version de l’archive Web Wayback Machine.
- L’outil « Google Cache Checker » qui vous permet d’afficher les URL et les dates de mise en cache d’un maximum de cinq pages à la fois :
Affichage des anciennes versions d’une page sans Google Cache
Votre page indique qu’elle a été mise en cache hier, mais vous voulez voir la version de la semaine dernière. Est-ce possible avec Google Cache ? Malheureusement, non.
Google ne peut vous montrer qu’une seule version d’une page mise en cache. Pour voir les versions précédentes d’un site Web, vous pouvez utiliser un outil comme la Wayback Machine, une archive des versions antérieures des pages Web.
Les raisons d’utiliser Google Cache en tant que propriétaire de site Web
Il existe une pléthore d’outils pour accomplir tout ce qui est décrit ci-dessous – dans de nombreux cas, des outils plus sophistiqués.
Mais il faut reconnaitre que le Google Cache est difficile à battre car il est rapide et facile à vérifier. Cela en fait un moyen précieux de contrôler certains aspects de vos pages Web.
Voici cinq façons de tirer profit du Google Cache :
1. Comprendre que Google a identifié du contenu dupliqué
Il arrive que vous cliquiez sur un lien en cache et que vous atterrissiez sur une page différente de celle à laquelle vous vous attendiez.
L’une des raisons pour lesquelles cela peut se produire est le contenu dupliqué. Lorsque Google voit deux pages très similaires, il peut décider de ne pas les conserver séparément dans l’index. Il n’en conserve alors qu’une seule dans le cache.
Le fait que Google mette en cache plusieurs pages sous le même lien peut vous alerter sur la présence de contenu dupliqué sur votre site. Le contenu dupliqué ne crée pas seulement une situation confuse dans le cache – il est mauvais pour le référencement.
2. Vérifier que Google respecte vos balises canoniques
Le contenu dupliqué de votre site Web est peut-être intentionnel, mais si vous avez ajouté des balises rel=canonical pour indiquer à Google la version à explorer, vous respectez parfaitement les meilleurs pratiques SEO.
3. Vérifier que vos actions d’optimisation ont été prises en compte par Google
Vous avez mené des actions d’optimisation, ou rajouter un contenu sur une page et vous voulez vous assurer que Google a pris en compte les changements ?
Un coup d’œil à la version en cache d’une page peut vous indiquer qu’elle a été explorée.
Notez que si vos modifications ne sont pas apparues sur la page en cache, elles ont peut-être été indexées. Si vous êtes inquiet, vous pouvez vous rendre dans l’inspecteur d’URL de la Search Console pour confirmer. Mais si vous voyez vos mises à jour dans le cache, vous savez qu’elles ont été indexées et qu’elles devraient commencer à avoir un impact sur votre classement dans les résultats de recherche.
4. Surveillez les modifications apportées aux sites concurrents
Vous remarquez que sur un mot-clé important, un concurrent vous prend soudainement votre place.
Qu’a-t-il fait pour y arriver ? Vous pouvez utiliser Google Cache pour le découvrir. Il vous suffit de comparer leurs pages en cache aux versions actuelles – vous pourrez voir quelles modifications récentes le concurrent a apportées.
5. Récupérez une version récente de votre site
Vous devriez toujours avoir une sauvegarde de votre site Web au cas où quelque chose lui arriverait. Cela dit, le pire peut parfois arriver, même pour la personne la mieux préparée.
Bien que la version de Google Cache de votre site ne remplace pas une sauvegarde complète, elle vous permet parfois de voir à quoi ressemblaient vos pages avant le désastre. Vous pouvez l’utiliser pour récupérer l’ancien contenu ou le code qui a été perdu.
Les limites du cache de Google
Le cache de Google peut fournir des informations utiles, et il peut être intéressant de l’examiner si quelque chose semble étrange. Mais Google Cache présente certaines limites connues.
1. Google Cache ne vous indique pas quand votre page a été explorée pour la dernière fois.
Commençons par l’une des plus grandes idées fausses : certains pensent souvent que le cache est mis à jour chaque fois que Googlebot explore une page. De nombreux autres articles sur ce sujet vous diront d’utiliser le cache pour savoir à quelle fréquence votre page est explorée.
Ce n’est pas vrai. John Mueller, de Google, l’a confirmé :
“In general, we do not always update the cached page every time that we crawl a page. Especially when the page does not significantly change, we may opt to just keeping [sic] the old date on it.”
En français :
« En général, nous ne mettons pas toujours à jour la page en cache à chaque fois que nous crawlons une page. En particulier, lorsque la page ne change pas de manière significative, nous pouvons choisir de simplement garder [sic] l’ancienne date sur celle-ci. »
Un conseil : si vous cherchez des informations sur la fréquence de visite des robots qui parcourent votre site Web, oubliez le cache. Ces données se trouvent dans Google Search Console. Vous trouverez le rapport d’exploration sous l’option « Paramètres » dans la barre latérale sur votre gauche.
Toutefois, vous ne pouvez voir ces informations qu’au niveau du domaine. Search Console ne vous dira pas à quelle fréquence chaque page est explorée.
2. La page peut ne pas être rendue (en cache) correctement
Heureusement, des progrès ont été réalisés. Le service de rendu Web de Google, qui assure le rendu des pages en direct sur le web, reposait auparavant sur une version obsolète de Chrome. Par conséquent, les navigateurs rendaient parfois une page en cache différemment du rendu de la page actuelle par Google.
Depuis 2019, le service de rendu Web de Google utilise la dernière version de Chrome. Toutefois, si votre version de Chrome est ancienne, ou si vous utilisez un autre navigateur, la page mise en cache peut être rendue de manière incorrecte.
Un autre problème de rendu est lié à l’absence de ressources. Le code sauvegardé par Google peut faire référence à une ressource telle que CSS ou JavaScript. Si ces ressources n’existent plus ou ont été modifiées, la page ne s’affichera pas correctement.
1. La mauvaise page s’affiche
Nous avons déjà vu comment le contenu dupliqué ou les balises canoniques incorrectes peuvent conduire Google Cache à afficher la mauvaise page. Comme vous pouvez l’imaginer, cela limite l’utilité de consulter le cache pour des pages Web spécifiques. Certaines pages ne sont pas mises en cache, cela peut surprendre, mais il s’avère que de nombreuses pages ne sont pas du tout mises en cache.
Une idée fausse très répandue est qu’un site Web non mis en cache signifie que Google ne l’a pas jugé essentiel, mais ce n’est pas nécessairement vrai.
Nous allons examiner les raisons pour lesquelles une page peut ne pas être mise en cache.
Pourquoi ne puis-je pas trouver ma page Web en cache ?
Toutes les pages qui sont explorées ne sont pas mises en cache. Si votre page n’a pas de version en cache, ne paniquez pas ! Cela ne signifie pas que votre page n’a pas été indexée.
Si vous craignez qu’elle n’ait vraiment pas été indexée, vous pouvez utiliser l’inspecteur d’URL de la Google Search Console pour vérifier. La preuve que les pages indexées ne sont pas toujours mises en cache nous ramène à John Mueller, de Google.
Sur Twitter, il a répondu à un utilisateur qui s’interrogeait sur une page non mise en cache :
“We don’t cache all pages that we index, so that can happen. Sometimes it takes a while, sometimes we just don’t cache it at all even if indexed.”
En français :
« Nous ne mettons pas en cache toutes les pages que nous indexons, donc cela peut arriver. Parfois, cela prend un certain temps, parfois nous ne mettons pas du tout en cache une page bien qu’indexée (dans le passé) »
En d’autres termes, les pages en cache ne sont pas un facteur de classement. Vous pouvez arriver en tête des résultats de recherche même si vos pages Web n’ont pas de version en cache.
Mais une page non mise en cache peut tout de même valoir la peine d’être examinée. Il existe plusieurs possibilités que vous pouvez explorer :
- Votre page est basée sur du JavaScript : Google a plus de facilité à indexer certaines pages JavaScript que d’autres. Mais de nombreuses pages JavaScript ne sont pas mises en cache, voire ne sont pas indexées. En effet, la majeure partie du code HTML n’est chargée qu’après l’exécution de JavaScript. S’il n’y a rien à indexer, Google ne créera pas de page en cache.
- La mise en cache est empêchée par une balise Meta. Une balise méta noindex dans le code HTML de votre page signifie que la page ne peut pas être indexée par Google, tandis que noarchive l’empêche d’être mise en cache. Dans les deux cas, la page ne sera pas mise en cache. C’est peut-être précisément ce que vous voulez. Mais si vous n’avez pas réalisé que vous aviez une balise noindex ou noarchive sur la page, sa suppression peut résoudre votre problème de cache manquant.
- La page est un doublon (ou Google le pense), si Google a décidé que deux de vos pages sont des doublons, trouvez des moyens de les rendre uniques en travaillant leur sémantique.
Comment résoudre les problèmes de mise en cache des pages de votre site Web ?
Votre page n’est toujours pas mise en cache, vous voulez encourager google à la revisiter, il y a certaines choses que vous pouvez faire.
1.Forcer le cache d’une page en soumettant votre page à Google
Si vous craignez que Google n’ait pas indexé votre page, vous pouvez accéder à votre Search Console pour le vérifier.
Saisissez l’URL de la page dans la barre de recherche d’inspection des URL située en haut de Search Console. Si vous obtenez le résultat « L’URL est sur Google », la page a été indexée. Si la page a été modifiée récemment et que vous pensez que Google n’a pas indexé la nouvelle version, vous pouvez cliquer sur « Demander l’indexation » pour demander à Google de la réindexer :
Vous pouvez également obtenir le résultat « La page n’est pas sur Google ». Dans ce cas, faites défiler la page vers le bas et vous pourrez voir certains détails concernant la page. Par exemple, vous pouvez vérifier si le crawling est autorisé sur cette page et si le canonical choisi par l’utilisateur correspond au canonical choisi par Google. Pour demander l’indexation, cliquez sur Demander l’indexation :
2. Vérifiez les problèmes de votre site
Nous avons déjà abordé plusieurs raisons pour lesquelles vos pages pourraient ne pas être mises en cache, comme l’utilisation intensive de JavaScript et le contenu dupliqué.
Au-delà de cela, la meilleure chose que vous puissiez faire pour favoriser une indexation fréquente est de créer un site de qualité. Assurez-vous que vous avez optimisé votre site pour les mobiles et que la vitesse de votre site est élevée.
Si le temps de chargement de votre page est trop lent, il peut même ralentir les robots de Google, ce qui entraîne un retard dans l’indexation.
Comment supprimer des pages du cache de Google
Nous pensons que Google Cache est très utile, mais il se peut que vous ne souhaitiez pas qu’une ancienne version de votre page Web soit stockée sur les serveurs de Google pour diverses raisons. Par exemple, vous ne souhaitez peut-être pas que les pages relatives à des produits abandonnés soient disponibles.
Une façon d’empêcher la mise en cache de vos pages est d’utiliser les balises noindex et noarchive mentionnées ci-dessus. Ces balises constituent la solution permanente idéale si vous souhaitez conserver les pages, mais ne voulez jamais qu’elles soient mises en cache.
Vous pouvez également demander directement à Google de supprimer des URL de Google Cache. Pour ce faire, rendez-vous dans la Google Search Console et cliquez sur Suppression dans la barre latérale. Cliquez ensuite sur Nouvelle demande. À ce stade, vous disposez de deux options :
– Supprimer temporairement l’URL
– Effacer l’URL mise en cache.
La suppression temporaire signifie que l’URL n’apparaîtra pas dans les résultats de recherche de Google pendant environ six mois. Le cache disparaîtra également. La page sera réindexée et remise en cache lorsqu’elle sera à nouveau disponible (si vous ne voulez pas que cela se produise, vous devrez ajouter une balise méta).
L’effacement de l’URL en cache elle, permettra au cache d’être supprimé, mais la page sera à nouveau mise en cache lorsque le site sera exploré.
Si vous souhaitez que l’ancienne version d’une page mise à jour disparaisse, c’est un excellent moyen d’y parvenir. Vous pouvez également inciter Google à mettre à jour le cache de votre page en soumettant la page à l’indexation après l’avoir modifiée.
En résumé sur le cache de Google
L’accès au Google Cache reste une action utile pour tout référenceur. Vous ne pouvez pas l’utiliser pour vérifier quand votre site a été exploré pour la dernière fois et parfois, la version stockée de votre site pourrait apparaître comme incomplète ou tout simplement fausse.
Mais Google Cache a son utilité : c’est un moyen rapide de vérifier comment votre site a été indexé, et il peut vous aider à détecter et à diagnostiquer les problèmes.
0 commentaires