Et si les fonctionnalités People Also Search For et People Also Ask de Google étaient générées par I’IA depuis plusieurs années, et non pas uniquement par les recherches des utilisateurs ? C’est l’hypothèse de Glenn Gabe, qui s’appuie sur un brevet déposé en 2018 par la firme de Mountain View !

Un brevet plein de surprises !

En consultant les brevets déposés par Google, Glenn Gabe a découvert un brevet délivré et publié le 30 mai 2023. Intitulé « Generating Query Variants Using A Trained Generative Model » (Générer des variantes de requête à l’aide d’un modèle génératif entraîné), ce brevet déposé initialement en avril 2018 n’a pas manqué de piquer sa curiosité puisqu’il concerne un sujet qui l’intéresse tout particulièrement : les fonctionnalités People Also Search For (PASF) et People Also Ask (PAA).

Si la fonctionnalité People Also Ask n’est pas explicitement mentionnée dans le brevet en question, contrairement à la fonctionnalité People Also Search For, l’auteur de l’article pense toutefois qu’il y a de fortes probabilités qu’elle ait également bénéficié du système décrit dans le brevet.

Pour synthétiser, le brevet explique comment Google est en mesure de générer des variantes de requêtes, même pour les toutes nouvelles requêtes et les requêtes de longue traîne pour lesquelles il n’existe pas encore beaucoup de données disponibles. Sachant que 15 % des requêtes n’ont jamais été vues par Google avant, Glenn Gabe pense qu’il serait logique qu'une génération de variantes de requêtes soit utilisée.

Diagramme du modèle de génération de variantes de requêtes - Source : Google

Le modèle génératif de variantes de requêtes en détail

Dans son article, Glenn Gabe revient sur plusieurs points importants mentionnés dans le brevet.

  1. Les variantes de requêtes peuvent être générées en utilisant un modèle génératif entraîné basé sur les jetons des requêtes initiales et les fonctionnalités d’entrées additionnelles.
  2. Par ailleurs, le système est en mesure de générer des variantes, même lorsque le modèle n’a pas été entraîné sur les requêtes concernées. Par conséquent, il peut générer des variantes pour des nouvelles requêtes ou pour des requêtes pour lesquelles les données sont encore rares. En somme, le modèle génératif peut prédire les variantes de requêtes à générer, en utilisant un réseau neuronal.
  3. Le modèle génératif peut être entraîné en se basant sur les précédentes requêtes formulées par les utilisateurs, mais ce n’est pas tout. En effet, le brevet précise que les données d’apprentissage des variantes de requêtes peuvent aussi se baser sur des paires de requêtes pour lesquelles des clics ont été effectués sur des documents similaires.
  4. En outre, le modèle peut être entraîné comme modèle multitâche pour permettre la génération de plusieurs types de variantes de requêtes : requêtes de suivi, requêtes de généralisation, requêtes canoniques, requêtes de traduction linguistique, requêtes d’implication, etc.
  5. Une fois générées, les variantes sont évaluées par le système qui donne un score à chaque réponse et peut classer les variantes en vérifiant les réponses associées à chacune d’entre elles. De cette façon, le système peut détecter les variantes de requêtes « potentiellement fausses ».
  6. Le brevet indique également que le système peut renvoyer des réponses en complément des variantes de requêtes. Ainsi, il peut retourner un résultat de recherche, ce qui rappelle à Glenn Gabe la fonctionnalité People Also Ask, mais pas seulement. Il peut s’agir aussi d’une entité du graphe de connaissance, une réponse nulle ou même une demande d’éclaircissement. Pour l’auteur, cela pourrait notamment prendre la forme des demandes de désambiguïsation envoyées par Google aux internautes pour mieux comprendre leurs requêtes.
  7. Le modèle développé par Google peut non seulement prendre en compte la requête, mais aussi des « caractéristiques d’entrée additionnelles ». Ces caractéristiques peuvent inclure de nombreux éléments différents comme la localisation de l’internaute, la tâche qui l'intéresse ou qu’il est en train d’effectuer, les conditions météorologiques, les entrées du calendrier, les requêtes antérieures, les messages de chat, etc.
  8. Par ailleurs, le brevet précise que le modèle est également en mesure de gérer des publicités et d’autres contenus potentiellement visibles dans les SERP de Google.
  9. Enfin, le brevet déposé par Google explique qu’il peut exister des modèles génératifs destinés à des tâches spécifiques, comme faire des achats, se rendre à un endroit, etc.

Glenn Gabe conclut son article en faisant remarquer que les systèmes développés par Google sont bien plus sophistiqués que ce que les gens peuvent penser. La preuve avec ce modèle génératif de variantes de requêtes qui permet de proposer aux internautes des requêtes personnalisées et parfois spécifiques à certaines tâches, notamment via les fonctionnalités People Also Ask et People Also Search For.