Le site Search Engine Journal a mis en place un test pour savoir si, comme cela avait été a priori dit par Matt Cutts cet été, Google prenait bien l'underscore ("_") comme séparateur de mots dans les urls, au même titre que le tiret ("-").
Depuis que Google existe, un débat existe en effet sur les urls des sites qui contiennent des underscores ou tirets bas pour séparer les mots. Longtemps, Google n'a pas considéré ce caractère comme séparateur de mots. En clair, lorsque le moteur de recherche lisait "achat_telephone_portable", il comprenait en fait "achattelephoneportable". En revanche, "achat-telephone-portable" était, lui, interprété comme "achat telephone portable"...
En juillet 2007, Matt Cutts, porte-parole "référencement" de Google aux Etats-Unis, avait indiqué lors d'un forum dédié aux utilisateurs du logiciel WordPress, que l'underscore était aujourd'hui considéré comme un séparateur de mots. Soupir de soulagement de nombreux webmasters que la situation génait au plus au point avant cette annonce.
Cependant, selon Search Engine Journal, la situation n'est pas aussi rose et les tests effectués montrent que l'underscore pose encore souci, si on regarde par exemple les résultats renvoyés par Google sur les 3 requêtes ci-dessous :
* Results 1 - 10 of about 502,000 for "search engine journal".
* Results 1 - 10 of about 502,000 for "search-engine-journal".
* Results 1 - 5 of 5 for "search_engine_journal".
Si les résultats sont bien identiques pour les orthographes "search engine journal" et "search-engine-journal", il n'en est pas de même lorsque l'underscore est considéré comme séparateur, avec très peu de résultats renvoyés...
D'ailleurs, selon Dave Rigotti auteur du billet sur le site Search Engine Journal, Google, via Matt Cutts, n'a pas été si catégorique que cela sur la prise en compte des underscores par les algorithmes du moteur de recherche... Il semblerait que le "bug" (car il me semble que cça en est clairement un) soit en passe d'être résolu, mais rien ne semble encore établi.
Bref, si vous avez le choix, il faudra encore utiliser des tirets dans vos adresses à la place des underscores pour être bien "compris" par les robots du moteur... En attendant mieux...
Source de l'image : http://www.mattcutts.com/blog/
Effectivement, je suis étonné qu’on continue à écrire sur le sujet. Google référence très bien les pages dont l’url comporte des « underscore ». Et ce n’est pas (principalement) l’url de la page qui détermine le positionnement ; on en est loin…
Je ne suis pas tout à fait d’accord avec le test réalisé dans cet article car selon moi faire une requêtes avec des tirets ou underscore ne démontre pas du tout l’efficacité de son nommage de page avec des tirets ou des underscores : Tester des requêtes dans Google (mots clés) en utilisant des tirets, des espaces ou des underscores va nous donner des résultats différents, et ceci me semble normal car je pense qu’il est rare que les internautes utilisent des tirets ou underscores dans leurs requêtes. Alors que d’utiliser soit des tirets ou soit des underscores dans le nom de ces pages amène les robots des outils de recherche à indexer les mots clés composant le nom de la page différemment.
J’ai toujours entendu des débats sur l’efficacité des underscores ou des tirets, mais pour moi il n’y a pas de différence et Google est capable de détacher les mots composant le nom de la page.
Si vous faites des exemples de requêtes dans Google et en observant dans les résultats, la partie de votre requête qui sera en gras dans les urls, vous pourrez alors tirer des conclusions : Exemple avec ‘sejour maroc’ on retrouve en première page tout d’abord Last Minute, qui utilise des underscore dans son nommage et mes deux mots ‘sejour’ et ‘maroc’ séparés par un underscore sont en gras, pour les sites puis Fram ou Pole-maroc qui utilisent un tirets, les deux mots sont également en gras… donc ceci peut vous aider à comprendre que soit le tiret ou soit l’underscore permettent d’espacer mes mots composant mon mots clés.
Pour terminer, je voudrais préciser qu’en ayant travailler sur une centaine de sites à référencer, je n’ai jamais eu de problème de réactivité de certaines pages qui utilisaient des underscores.