Comment détecter et réparer les erreurs 404 de mon site internet ?

Mathilde
Rédigé par Geoffroy Barre
Rédacteur web
Mathilde
Revu par Mathilde Grattepanche
Responsable éditoriale chez Abondance
Le 16 avril 2024
Icône erreurs 404
Une erreur 404 est un code erreur HTTP renvoyé par un serveur lorsqu’une ressource est indisponible ou introuvable. En petit nombre, elles sont souvent logiques. Elles peuvent s’expliquer en cas de changement dans l’arborescence ou selon le CMS utilisé. En masse, elles deviennent problématiques. Google ne pénalise pas directement la présence de pages qui renvoient une erreur 404. Mais les liens pointant vers ces pages inaccessibles sont, logiquement, non comptabilisés pour le référencement, et cela nuit à l’expérience utilisateur. Détecter et réparer des erreurs 404, cela ne va pas doper votre SEO, mais cela peut jouer optimiser le crawl réalisé par les robots Google, car votre contenu sera jugé plus pertinent. Ces pages d'erreur 404 revues et gérées peuvent améliorer le ressenti des visiteurs sur votre site, et limiter la perte de trafic pourtant qualifié. Voici un ensemble de bonnes pratiques avec notre guide dédié. 

Identifier et détecter les erreurs 404

Les fameuses « page not found », « Oops ! Cette page est introuvable » et autres messages affichés sur votre site si une ressource demandée n’est pas accessible, ce n’est jamais très agréable. 

Ces messages nuisent à l'expérience utilisateur et peuvent impacter négativement votre référencement naturel, les liens externes pointant vers ces 404 n’étant pas pris en compte par Google. 

Heureusement, plusieurs méthodes permettent de repérer facilement ces URL cassées.

Erreur 404 Google

Le crawl et le suivi passif des erreurs 404

Tout d'abord, un audit complet peut être réalisé. Avec des outils d'analyse SEO comme Screaming Frog, SEOLyzer, Oncrawl ou le Site Audit de Ahrefs, vous pouvez obtenir un rapport détaillé de tous les codes de statut http de vos URL, y compris les 404. 

En parallèle de cette méthode « one shot », qui consiste à lancer une analyse régulière ou à planifier des rapports, vous pouvez aussi avoir un suivi récurrent et passif de vos erreurs 404. Avec une analyse des logs, ou en combinant Google Analytics (GA) et Google Tag Manager (GTM). Intéressons-nous à cette seconde méthode. 

Il faut implémenter un bout de code qui enverra un événement "page introuvable" vers la couche de données (Data Layer) à chaque fois qu'un internaute tombe sur une page 404. Google Tag Manager peut récupérer cet événement créé involontairement par le visiteur et l'envoyer vers GA. Pour cela, un déclencheur d'événement personnalisé doit être créé dans GTM, en précisant de transmettre ledit événement uniquement lorsqu'il détecte "page introuvable" dans la Data Layer.

Lorsque tout est paramétré, il est possible de consulter un rapport dédié dans GA. Celui-ci fera apparaître les différentes URL renvoyant des 404, avec leur URL et titre de la page. Un tableau bien pratique pour connaître les pages problématiques. 

« L'analyse de ces données issues de Analytics et Tag Manager permet d'identifier les pages supprimées ou déplacées par erreur, mais aussi les pages modifiées ou les structures qui ont évolué du fait d’un changement d’arborescence par exemple, explique Ronan Hello, développeur web indépendant et formateur. Personnellement, je déclenche un rapport qui me donne la liste des erreurs 404 dès qu’une page renvoie ce code deux fois par jour. Cela permet d’éviter les 404 générées humainement, en se trompant par exemple dans la barre d’URL. Si une page renvoie plusieurs fois une erreur, alors il y a un problème ».

Gérer les erreurs 404 avec Google Tag Manager - Image Ronan-hello.fr

Les rapports de la Google Search Console

Avec la Google Search Console (GSC) vous pouvez accéder à une liste des pages introuvables  qui renvoient une erreur 404. Accédez à la section 'Indexation' et 'Pages' pour voir l'état d'indexation de vos pages.

Vous pouvez aller plus loin, et accéder à la liste de toutes les pages qui renvoient une erreur 404 suite à l’exploration des robots Google. Pour cela, rendez-vous dans ‘Anciens outils et rapports' et 'Paramètres'. Choisissez ensuite ‘Statistiques sur l’exploration’ puis accédez à la zone ‘Par réponse’ pour voir les pages qui renvoient une 404. 

Vous pourrez connaître le pourcentage de vos pages en erreur (sur le total des pages de votre site), mais aussi accéder à une liste avec les 404 explorées, jour par jour, avec l’horaire précis de visite du robot Google. Vous pouvez très bien exporter cette liste pour traiter les URL.

Après avoir effectué des changements sur votre site web, comme la création de redirections ou la mise à jour de pages, il est essentiel d'en informer Google. Vous pouvez soumettre les nouvelles URL à la GSC, directement.

Ensuite, pour les pages existantes dont le contenu a été actualisé, vous pouvez demander à Google de les revisiter. Enfin, dans le rapport d'erreurs d'exploration de la GSC, n'oubliez pas de marquer comme résolues les URL pour lesquelles vous avez apporté des corrections.

Rapport sur les erreurs 404 dans la Google Search Console

Corriger efficacement les erreurs 404

Les 404 ne doivent pas rester sans réponse. Il ne faut pas les ignorer, même si elles sont marginales. Il faut traiter ces erreurs. Deux actions sont à entreprendre : corriger la source de l'erreur pour éviter qu'elle ne revienne (si c’est un lien interne qui déclenche une 404) et/ou rediriger le visiteur si la 404 est issue d’un backlink.

Gérer les 404 avec les redirections

Il existe plusieurs méthodes pour corriger les erreurs 404. La façon « en masse », l’approche plus feutrée avec un message personnalisé, et enfin les techniques plus fines. 

La première solution consiste à appliquer une seule méthode : rediriger les pages qui sont en erreur vers l’accueil. Simple, basique. « Il s’agit de l’une des pires manières, explique Ronan Hello. Tant du point de vue du référencement si l’erreur est causée par un lien externe, que sur le plan de l’expérience utilisateur, cela n’a pas de sens ». On ne tient pas compte du chemin d’accès du visiteur, c'est-à-dire de la pertinence éventuelle du backlink, ou du contexte du lien interne qui est cliqué. Mais au moins, le problème est réglé. 

Deuxième grande solution, intermédiaire, créer une page 404 personnalisée. Elle peut indiquer aux visiteurs que la page qu’ils demandent n’existe pas, et proposer une solution. C’est là d’ailleurs que vous pouvez ajouter un formulaire de signalement et proposer une navigation au travers des différentes catégories de votre site. Pour le visiteur, on évite l’effet surprise d’être redirigé vers l’accueil alors qu’il s’attendait à une page précise.

Troisième possibilité, la redirection vers une page proche ou vers la page recherchée si son URL a été modifiée. On utilise ici une redirection 301 (rediriger de façon permanente la page web qui renvoie une 404 vers une nouvelle URL). « Pour moi, lorsqu’une page est en erreur 404 à cause d’un lien externe, c’est la méthode à appliquer. La redirection 301 devrait être la norme » confie Ronan Hello. À moins de prendre le temps de contacter le gérant du site qui effectue le backlink pour lui demander de modifier l’URL de destination. Fastidieux. 

Ultime possibilité, à privilégier pour les erreurs 404 issues d’un lien interne, le renvoi vers un cran supérieur. Une solution à plébisciter notamment pour un site e-commerce. Dans ce cas précis, on indique que le produit ou l’article recherché n’est plus disponible, mais on renvoie vers sa catégorie/branche, ce qui permet de proposer une alternative. Mieux, avec un peu de développement et selon le CMS utilisé, il est possible de personnaliser la page 404 par catégorie. Pratique par exemple pour mettre en avant le produit le plus vendu, les nouveautés, proposer une navigation par marque ou encore donner une alternative à un produit qui n’existe plus ou qui n’est plus en stock.

Gestion de la redirection dans WordPress avec le plugin SEO Key

Mettre en place des URL propres pour réduire les 404

Pour réduire le risque d’avoir des erreurs 404, et notamment pour limiter la génération de pages en erreur avec votre maillage interne, il existe une bonne pratique à généraliser. Pointer vers une référence de page, pas vers une URL.

Dans votre CMS, vos contenus publiés ont une adresse URL, mais ils sont aussi connus dans la base de données et dans le back-office avec des identifiants (ID). Ainsi, si vous décidez de modifier le permalien d’une page une fois qu’elle est publiée, vous allez modifier son chemin d’accès… mais pas son ID. Vous suivez ? Par conséquent, lorsque vous effectuez des liens internes, appeler une page avec son ID plutôt que son URL vous permet de réduire le risque d’erreur 404.

Cela se prête parfaitement à tous les liens présents dans les menus, en sidebar ou dans le footer. Dans le contenu d’un article ? Cette technique est plus complexe à mettre en place, mais elle peut tout de même être déployée avec un peu de développement.

Connaître son CMS et ses caprices

Selon le CMS que vous utilisez, certaines erreurs 404 peuvent être déjà connues, identifiées et il est possible de trouver des solutions pour les réparer. WordPress est l’exemple le plus criant.

Avec sa structure particulière, WordPress génère facilement des 404. Par exemple, si vous utilisez des types de publications personnalisés (Custom Post Types), et que certaines pages ont des noms identiques. Assurez-vous que vos publications personnalisées ne sont pas désignées avec le même nom que vos pages ou posts. Car si cela est le cas, vous allez avoir des 404 en pagaille. 

La solution miracle ? Si vous avez des erreurs 404 que vous ne parvenez pas à traiter dans WordPress, réinitialisez les permaliens. Allez dans Paramètres > Permaliens. Choisissez une structure de permaliens différente puis enregistrez les modifications. Modifiez à nouveau pour revenir à la structure précédente que vous voulez pour votre site et enregistrez. L’erreur disparaît très souvent.

Tous les CMS ont leurs trucs, leurs erreurs connues, et des solutions. Arpentez les forums dédiés à Joomla!, Drupal, Magento ou encore Shopify ou Wix selon votre besoin. 

Possibilités de réglage des permaliens dans WordPress

Contrôler régulièrement pour prévenir les 404

Nous avons évoqué les principales solutions pour identifier les erreurs 404 ainsi que des pistes pour les réparer. Afin d’être complet sur le sujet, il nous faut maintenant évoquer le monitoring. 

Car si vous êtes vous-même éditeur de sites ou si vous gérez les projets de clients, c’est un contrôle régulier que vous avez besoin de mettre en place.

En complément des événements que vous pouvez intégrer via GTM et GA4 (lire ci-dessus), d’autres méthodes existent pour avoir une liste des erreurs 404. Elles doivent être utilisées selon les moments clés.

  • Après des modifications lourdes du site ou des mises à jour, effectuez un crawl. Une nouvelle version de votre CMS, installée automatiquement, peut réinitialiser des paramètres ou faire sauter des réglages. 
  • En cas de changement d’hébergeur, avec une copie de base de données qui peut ne pas être à jour, il est important là aussi d’effectuer un crawl. Des modifications ne sont peut-être pas là, ou des erreurs ont pu apparaître.
  • Connectez-vous à la (GSC une fois par mois pour voir les erreurs qui remontent. Vous aurez peut-être accès à des 404 qui ont échappé à votre crawler, générées par exemple par les utilisateurs si de nombreux paramètres s’ajoutent à une URL au point de la surcharger.

Un contrôle régulier est la clé pour éviter l’apparition en masse d’erreurs 404. Ne soyez pas pour autant un(e) monomaniaque de la 404 ! La GSC a pour habitude d’en renvoyer énormément, qui ne sont pas toujours explicables.

Prémunir, détecter, corriger : voilà l’approche que vous devez avoir avec les erreurs 404. Bien les gérer et éviter leur multiplication est le gage d’une meilleure expérience utilisateur pour vos visiteurs, mais aussi une manière d’améliorer votre référencement.