Référencement de sites multilingues et risque de duplicate content - (Questions/réponses avec Google #16)

   
(English version - machine translation)

Nous continuons notre série de questions/réponses avec Google en abordant un point dont il est souvent question sur le web et les forums spécialisés, et un question qui nous est souvent posée dans les formations et conférences que nous animons : le référencement de sites multilingues.

En effet, il arrive très souvent qu'un site web mette en ligne des contenus identiques ou similaires, mais dédiés à des pays différents bien que parlant la même langue : France, Belgique, Suisse, Canada (Québec), Afrique, etc. Un contenu mis en ligne sur un site pour les internautes français ne risque-t-il pas, dans ce cas, de créer un conflit de duplicate content avec une autre page, proposant le même contenu éditorial, mais sur le site destiné aux belges francophones, par exemple ? Même chose avec les américains, les anglais et les australiens, etc. Comment faire pour signaler ces informations à Google ?

Nous avons donc posé la question au service "Search Quality" de Google : comment signaler au moteur de recherche certains contenus dédiés à des pays spécifiques tout en évitant le duplicate content ?...

Question Abondance : Je dispose d'un site avec un contenu pour les américains et, sur une autre page, le même contenu pour les australiens et enfin sur une troisième page, un contenu pour les anglais (Grande-Bretagne). Ces contenus sont identiques et, bien sûr, tous dans la même langue. Comment indiquer à Google la cible géographique de ces contenus ? Prenez-vous en compte les balises de géolocalisation (geo.position ou autre) ? Et comment éviter tout problème de duplicate content dans ce cas ?
 

La réponse de Google : Google prend en compte un certain nombre de signaux afin d'identifier l'origine géographique d'un site, comme l'extension (.fr vs .be), ou le lieu d'hébergement du site.
Ces informations peuvent être incomplètes ou non pertinentes, c'est pourquoi il est possible de définir des zones géographiques ciblées dans nos Outils pour les Webmasters.

Prenons un exemple concret :
Une association canadienne propose ses services au Canada, mais également en France et en Belgique. Le site, www.association.org, est hébergé au Canada et dispose donc d'un TLD (.org) générique.
Etant donné que l'extension (en anglais TLD -
top level domain) est générique et que le site n'est pas hébergé dans le territoire cible pour la France et la Belgique, il est recommandé d'avertir Google de l'emplacement géographique des utilisateurs que l'on cible, en suivant les étapes suivantes :
- Définir des sections ou sous-domaines spécifiques pour chacun des territoires ciblés (sous-domaines : ca.association.org, be.association.org et fr.association.org, ou répertoires : association.org/ca, association.org/be et association.org/fr).
- Ajouter ces entités dans le compte Outils pour les webmasters.
- Définir la zone géographique ciblée correspondant à chacune de ces entités dans le compte des Outils pour Webmasters (section "Paramètres", puis "Zone géographique ciblée").

Ces informations permettront d'améliorer les résultats des requêtes géographiques sur Google, et complèteront celles que Google aura déjà en sa possession.

Remarques :
- Les sites possédant des extensions nationales (site.fr ou site.be) sont déjà associés à une zone géographique qu'il n'est pas possible de modifier via les Webmaster Tools.
- Il n'est pas conseillé de définir une zone géographique ciblée pour les sites dont l'audience est liée au langage et non au territoire. Il existe des francophones dans de nombreux pays et définir une zone géographique ciblée pourrait restreindre l'audience.
- Si un site est ajouté et vérifié dans les Outils pour les webmasters, ses sections le seront également, tandis que chacun des sous domaines devra être vérifié séparément. Pour reprendre l'exemple, be.association.org devra être vérifié, mais pas association.org/be qui est vérifié par défaut.
- Nous n'utilisons pas les meta tags de localisation (comme "geo.position" ou "distribution") ou des attributs HTML pour géociblage. Alors que ceux-ci peuvent être utiles à d'autres égards, nous avons constaté qu'ils ne sont généralement pas suffisamment fiables à utiliser pour géolocalisation.

Pour ce qui est des problèmes de "duplicate content", les sites multilingues destinés à différentes zones géographiques proposent parfois un contenu identique ou similaire via des URL différentes, et cela ne pose généralement pas de problème lorsque le contenu est destiné à des visiteurs situés dans des pays différents.

Toutefois, nous recommandons vivement de proposer du contenu unique à chaque groupe de visiteurs (par exemple en customisant l'offre du site à l'audience cible, ou en utilisant un vocabulaire adéquat -ex: le Français parle de 'portable', le Belge de 'GSM', et le Suisse de 'natel').

Plus de ressources:
https://sites.google.com/site/webmasterhelpforum/fr/aide-au-referencement/travailler-avec-des-sites-multilingues
https://sites.google.com/site/webmasterhelpforum/fr/aide-au-referencement/sites-web-ciblant-plusieurs-zones-geographiques

Notre commentaire : pour bien référencer un site s'adressant à des internautes habitant dans plusieurs pays, la meilleure solution est certainement d'acheter des TLD spécifiques et alloués à chaque pays. Exemple : le .com pour les Etats-Unis, le .fr pour la France, le .be pour la Belgique, etc. Ensuite, si c'est possible, suffisamment différencier les contenus pour qu'ils ne rentrent pas dans une problématique de duplicate content. Si ce n'est pas possible (et même si ce travail est effectué, d'ailleurs), indiquer dans les Google Webmaster Tools le pays-cible de chaque site.
Si l'achat de plusieurs TLD pose problèmes (de disponibilité par exemple, dans certains pays), vous pouvez opter pour des sous-domaines et effectuer le mêmes manoeuvres que décrites précédemment.
Bon référencement !

Rappel des précédentes Questions à Google :
1. Les underscores dans les URL
2. Web 2.0, Contenu caché et pénalités Google
3. La pondération des liens entrants - ou backlinks
4. Les redirections multiples en cascade
5. Modification de la vitesse de crawl des spiders
6. Référencement et hébergement mutualisé
7. Sitemaps et nombre d'URL indexées
8. Référencement et redirections 301
9. Google prend-il en compte l'attribut Longdesc ?
10. Le nombre de pages d'un site web indexées par Google
11. Mots clés et Google Webmaster Tools
12. Les 3 chiffres dans les URL sont-ils obligatoires pour être indexé dans Google Actualités ?
13. Google et le Content Spinning
14. Duplicate Content Dust et balise canonical
15. Validation HTML/W3C et positionnement Google

Commentaires : 15
  1. Anonymous 31 octobre 2011 at 13 h 26 min Reply

    Merci pour cet article très intéressant ! On voit bien que Google prend en compte un faisceaux d'indices pour déterminer la zone géographique : la langue, l'extension, l'hébergement... mais on aurait pu citer aussi la monnaie si je suis un site ecommerce, l'adresse postale pour me contacter...

    J'ai une question connexe. Mettons que je m'adresse aux entreprises ayant des problématiques à l'international, je vais donc créer un site en anglais avec une extension en .com
    Comment Google va déterminer la zone géographique du site puisque mon site s'adresse à tous les pays ?
    Merci

  2. Abondance 31 octobre 2011 at 13 h 30 min Reply

    Bonjour
    J'aurais tendance à dire que si le site s'adresse à tous les pays, il ne s'adresse à aucun en particulier. Il ne sera donc pas mis en valeur dans les résultats du moteur pour un pays particulier. Sauf si le champ adéquat dans les webmaster tools est rempli..
    Cdt

  3. Fredodo13 5 novembre 2011 at 10 h 21 min Reply

    Bonjour,
    Merci pour cet article.
    J'aurai une question cependant, j'ai un site bonjour.fr entièrement en français et donc ciblé d'office par google vers la France. Le site bénéficié d'un très bon référencement.

    Afin d'améliorer le site et le compléter j'aimerai lancer des versions dans d'autres langues.

    Quelle serai la meilleure solution ?
    faire une adresse avec bonjour.fr/en ou faire une adresse hello.com qui redirigerai en faites vers la partie de mon site bonjour.fr/en ?
    Est ce que la deuxième solution dérangerai google ?

    Votre avis ? j’espère que mon explication est clair :s

    Merci et bonne journée, bon WE

  4. Abondance 5 novembre 2011 at 13 h 03 min Reply

    @ Fredodo13 : le mieux est de créer un site web hello.com qui ne redirige sur rien, qui est un vrai site à part entière avec un contenu en anglais (la redirection de toutes façons, sera inopérante en termes de SEO).
    Ca devrait tres bien se passer :)))
    Bien cordialement

  5. Fredodo13 6 novembre 2011 at 18 h 27 min Reply

    lol !
    j'aurai du me douter de cette réponse! c'est vrai que s'est la meilleure des solutions le problème c'est qu'il faut référencer dans une langue autre que le FR et donc beaucoup de travail et pas toujours un travail adapter.

  6. Willgoto 11 novembre 2011 at 1 h 34 min Reply

    1. Il y a apparemment quelque chose que le staff de google ne comprend pas:
    Lorsqu'il s'agit d'un site "dont l'audience est liée à la langue et non à un territoire (pays)", google recommande de ne pas définir une zone géographique.
    Ce serait parfait ... SAUF que un site est toujours associé, par défaut, à un pays soit par son TLD soit par son lieu d'hébergement. Donc, l'option n'est pas de ne pas définir une zone géographique, mais de garder ou changer le choix de zone par défaut.

    2. Pour les sites s'adressant dans une même langue à plusieurs pays avec un même texte, la réponse de google pour éviter problème de duplicate content est de travailler avec des TLD de chaque pays (ou bien avec des sous-domaines ou répertoires géolocalisés).

    Je doute que cette solution fonctionne correctement. Et ce cas est précisément visé dans un article tout récent traitant des cas de cross-domain duplicate content où google pourrait ne pas retenir la version voulue:

    "Duplicate content, including multi-regional websites: We regularly see webmasters use substantially the same content in the same language on multiple domains, sometimes inadvertently and sometimes to geotarget the content.....".
    http://googlewebmastercentral.blogspot.com/2011/10/raising-awareness-of-cross-domain-url.html

    Cela ne me donne pas raison, mais montre quand même que la solution envisagée ne fonctonne pas sans possible hiatus.

  7. Anonymous 18 novembre 2011 at 10 h 08 min Reply

    Bonjour,

    j'ai un .com hébergé en Angleterre, j'ai fait une version francaise, disons plutot francophone. Dans Google Webmaster, j'ai déclaré France, que faire pour cibler les belges !

    un doublon du site que je déclare dans Google Webmaster, ca me semble totalement ahurissant de devoir faire deux versions !

    Merci

  8. Loiseau2nuit 9 février 2012 at 13 h 44 min Reply

    Hello Olivier et merci pour cette ressource.

    En revanche, je me pose des questions. Selon toi la réponse de Google ne rentre t'elle pas en contradiction avec une annonce, parue sensiblement au même moment que ton billet (peut être même avant) parlant de la déclassification des sous-domaines ?

    En d'autres termes, est-il encore possible aujourd'hui de leur faire gober que http://fr.site.tld/ est bien un site à part entière, comparé à en.site.tld/ ?

    Parce qu'en l'état leur réponse me semble un peu laconique...

  9. Abondance 9 février 2012 at 14 h 34 min Reply

    @Loiseau2nuit : je ne me souvient pas d'une annonce officielle de Google indiquant que les sous-domaines seraient déclassifiés (il y a eu une communication sur la prise en compte des sous-domaines dans les webmaster tools, mais c'est un peu différent).
    Ceci dit, selon moi, les sous-domaines sont effectivement de moins en moins pris en compte comme des sites à part entière par Google, en effet. Mais rien d'officiel :)
    Ceci dit, il est clair pour moi qu'une adresse de type fr.monsite.com donne une indication logistique au moteur, ce qui est une approche diffrente de actu.monsite.com ou blog.monsite.com :)
    Cordialement

  10. Bijoux chics 27 juin 2012 at 13 h 59 min Reply

    Super intéressant ! J'aurais également souhaité savoir comment au delà du texte présent sur un site, google gérait le contenu dupliqué de 2 sites ayant tout en commun sauf le texte qui est traduit dans une autre langue.

  11. Référencement google 1 novembre 2012 at 17 h 12 min Reply

    Merci pour cet article très intéressant et instructif !J'aurais tendance à dire que si le site s'adresse à tous les pays, il ne s'adresse à aucun en particulier. Il ne sera donc pas mis en valeur dans les résultats du moteur pour un pays particulier. Sauf si le champ adéquat dans les webmaster tools est rempli..Google, qui comme d'habitude ne dit ni oui ni non quand on lui pose une question, vient de nous gratifier des meilleurs pratiques lorsqu'on réalise un site qui cible plusieurs audiences géographiques dans la même langue ,,,,

  12. annonces maroc 17 décembre 2012 at 14 h 32 min Reply

    Bonjour,
    j'ai une question qui me préoccupe avec le ciblage des zone géographiques. je sais bien que c'est mieux d'attribuer des sous domaines et de bien les cibler sur des zones définies, mais y a t il un moyen de rendre un répertoire ou une section d'un site ciblée pour une zones différentes ?

    Merci

  13. Julie DERVILY 22 janvier 2013 at 19 h 00 min Reply

    Bonjour,

    Merci pour cet article très intéressant et vraiment instructif. J'avais une question à laquelle je ne trouve pas de réponse, si vous pouviez m'apporter votre aide, elle me serait très utile. Voici mon exemple : référencement.fr et fr.référencement.com ont exactement le même contenu. Le .fr s'adresse aux internautes vivant en France, l'autre est destinée aux Français vivant à l'étranger. Malgré la mise en place de canonicals ( fr.référencement.com vers référencement.fr) les deux sites apparaissent dans les pages de résultats de google.fr sur certaines requêtes. Je pourrais même dire que parfois le .fr n'apparait pas pour laisser place au .fr.com . Que faire dans cette situation à votre avis ?

  14. Romain 16 avril 2013 at 9 h 09 min Reply

    Bonjour,

    Déjà merci pour cet article ;)

    J'ai une petite question, concrètement, quand on veut lancer un site à l'international, il vaut mieux avoir => domaine.fr domaine.es domaine.it etc ou bien domaine.com/fr domaine.com/es domaine.com/it etc.. ? (dans le cas ou on n'a aucun problème d'achat de domaine)

    Et j'en ai une petite deuxième ;) si on a un site domaine.fr et qu'on veuille le lancer en Espagne, il vaut mieux faire un sous domaine, un répertoire ou un avoir le domaine.es ? Enfin, j'ai bien compris qu'il est mieux d'avoir un le tld dans la langue du pays mais niveau seo, si on part sur cette solution, ne va-t-on pas perdre le jus qu'on aurait pu avoir avoir un répertoire par exemple du 1er domaine ? (un peu plus tordus celle là)

    En vous remerciant d'avance pour votre réponse !

  15. lorent 20 juin 2013 at 16 h 23 min Reply

    Bonjour,

    je vois fréquemment des sites qui sont référencés en Anglais en position 1 et en position 2 en français. Est-ce du duplicate content ? Qu'en pensez vous ?

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *


*

Un site du Réseau Abondance  : Information : Abondance - Forums Abondance - Boutique Abondance - Livre Référencement - Formation DVD Référencement | Outils : Outiref - Visiref - Spider SimulatorDivers / Jeux : Googlefight - Googland |  Moteurs de recherche : Mozbot.fr - Mozbot.com - Grifil.net - SearchWings