Nous continuons notre série de questions/réponses avec Google en abordant une question qui pose souvent quelques problèmes aux webmasters : comment intégrer son site web dans Google Actualités si ses articles ne possèdent pas 3 chiffres dans ses URL ?

Rappelons en effet que Google demande certaines contraintes sur les URL pour accepter un site dans son outil Google actualités :
- Le contenu proposé doit être unique. Une URL doit pointer vers un article et un seul. En clair, une suite de brèves, affichées dans une même page, ne sera pas recevable.
- L'URL doit être exclusive à un article. Si, sous une même URL, un article différent est publié chaque jour, ce contenu ne sera pas non plus indexé. Exemple : www.votresite.com/la-news-du-jour.html.
- Comme le dit l'aide en ligne de Google, l'URL associée à chaque article doit comporter un numéro unique composé d'au moins trois chiffres. Par exemple, nous ne pouvons pas explorer un article dont l'URL est la suivante : http://www.google.com/actualites/article23.html. Nous pouvons en revanche explorer un article dont l'URL est la suivante : http://www.google.com/actualites/article234.html. Sachez que si le seul nombre contenu dans l'URL est composé d'une série de quatre chiffres semblant correspondre à une année, comme http://www.google.com/actualites/article2006.html, nous ne serons pas en mesure de l'explorer.
La règle est donc la suivante : pour être indexé dans Google News, un site web doit proposer, pour les URL de ses articles, une suite d'au moins 3 chiffres consécutifs dont le format ne ressemble pas à celui d'une date (la plupart du temps, on intègre un numéro de référence ou similaire).

Oui, mais comment faire si les URL de votre site ne répondent pas à cette contrainte, pour quelque raison que ce soit ? Nous avons donc posé la question au service "Search Quality" de Google...

Question Abondance : L'indexation d'un site dans Google Actualités demande à ce que les URL contiennent une suite de 3 chiffres. Cela signifie-t-il qu'un site ne répondant pas à cette contrainte n'a aucune possibilité d'être indexé sur votre outil ?
 

La réponse de Google : Non, si un site web n'a pas la possibilité d'intégrer cette suite de chiffres dans les URL de ses pages, il aura toujours la possibilité de créer un Sitemap pour Google Actualités. Dans ce cas, la contrainte de la suite numérique dans les URL n'est plus valable et un site web n'ayant pas ces chiffres dans ses URL pourra quand même être potentiellement indexé (s'il répond aux autres critères de recevabilité).

Notre commentaire : bonne nouvelle, la contrainte des 3 chiffres minimum dans les URL n'est donc pas incontournable, puisqu'un Sitemap spécifique pour Google Actualités peut pallier le problème. Attention cependant :
- Les Sitemaps Google Actualités génèrent, eux aussi, quelques contraintes qu'il vous faudra prendre en compte (ils doivent contenir uniquemement les articles des deux jours précédents, ne doivent pas contenir plus de 1 000 URL, etc., plus d'infos ici)
- Le fait d'avoir un tel Sitemap (ou la suite de chiffres dans l'URL) ne veut pas dire que le site sera obligatoirement indexé, mais qu'il sera "recevable" par Google Actualités. Le site peut ensuite être accepté ou rejeté en fonction d'autres critères.

Rappel des précédentes Questions à Google :
1. Les underscores dans les URL
2. Web 2.0, Contenu caché et pénalités Google
3. La pondération des liens entrants - ou backlinks
4. Les redirections multiples en cascade
5. Modification de la vitesse de crawl des spiders
6. Référencement et hébergement mutualisé
7. Sitemaps et nombre d'URL indexées
8. Référencement et redirections 301
9. Google prend-il en compte l'attribut Longdesc ?
10. Le nombre de pages d'un site web indexées par Google
11. Mots clés et Google Webmaster Tools