Les algorithmes des moteurs de recherche évoluent chaque jour un peu plus et font parfois l'objet de communication de la part des équipes qui les mettent en place. Ça a été le cas il y a quelques jours avec l'update BERT, une mise à jour intégrée par Google pour améliorer sa compréhension des requêtes longues et/ou complexes. Mais quels sont les algorithmes derrière BERT en général et quelles sont les implications SEO en particulier de cet update ? Explications par Sylvain Peyronnet, notre spécialiste reconnu de tous sur l'algorithmie des moteurs de recherche...

Récemment (voir l’annonce [1]), Google a annoncé par la voix de son vice-président Search Pandu Nayak qu’une nouvelle routine de compréhension de la requête tapée par un utilisateur était en cours de mise en place, basée sur l’algorithme de machine learning BERT.

Qu’est-ce que BERT l’update, mais surtout qu’est-ce que BERT l’algorithme, et que permet-il de faire réellement ?

La requête, point bloquant pour un moteur de recherche qui veut améliorer la qualité de ses résultats

Un moteur doit réaliser de nombreuses tâches, plus ou moins coûteuses et plus ou moins importantes (voir la figure 1, qui présente le schéma général d’un moteur de recherche). Mais depuis plusieurs années, l’effort qui permet au moteur d’améliorer la qualité de ses résultats, et d’avancer vers la notion de moteur de réponse, se concentre principalement sur la compréhension de l’utilisateur.

L’utilisateur intervient à deux moments cruciaux dans la vie du moteur : tout d’abord lorsqu’il rentre sa requête pour exprimer son besoin informationnel, et ensuite lorsque la SERP lui est proposé et qu’il va implicitement en noter la qualité par le comportement qu’il adoptera (ce qu’il clique, mais surtout ce qu’il ne clique pas). L’update BERT que propose Google en ce moment intervient sur le premier moment : comprendre le besoin informationnel de l’utilisateur.

La notion de besoin informationnel est clé pour le moteur, mais les différents algorithmes qui étaient utilisés jusqu’ici n’étaient pas nécessairement toujours au top. Pourquoi ? Car il y a de nombreuses ambiguïtés dans la langue, complexes même pour les êtres humains. En Français on se plait à utiliser le mot "Paris" comme par exemple dans cette phrase : J’ai vu Paris à Paris, elle travaille sur la vie de Pâris. (par ordre d'apparition : le prénom, la ville, le prince troyen).

En anglais, avec la sortie de BERT c’est le mot "bank" qui revient en force pour faire un bel exemple : The Bank is close to the river bank (la banque est proche de la rive du fleuve). L’objectif de la fameuse update BERT est de mieux comprendre les ambiguïtés dans les mots d’une requête, de mieux comprendre le sens d’une requête, et tout simplement de mieux comprendre les contenus (par exemple de comprendre que le mot Paris n’est finalement pas le même objet selon le contexte qui l’entoure).

[Cet article est disponible sous sa forme complète pour les abonnés du site Réacteur. Pour en savoir plus : https://www.reacteur.com/2019/11/bert-quelles-sont-les-technologies-derriere-lupdate-et-lalgorithme.html]

BERT : Quelles sont les technologies derrière l'update et l'algorithme ?

Un article écrit par Sylvain Peyronnet, fondateur de la régie publicitaire sans tracking The Machine In The Middle (http://themachineinthemiddle.fr/).