> > Définition : RankBrain, c'est quoi ?

Définition : RankBrain, c'est quoi ?



 
Définition : RankBrain, c'est quoi ?
5 (100%) 7 votes

Définition : RankBrain, c'est quoi ?

RankBrain est une composante de l'algorithme de pertinence de Google, basée sur l'intelligence artificielle et les réseaux de neurones, et permettant de mieux comprendre l'intention de recherche de l'internaute posant une question au moteur. Il sert notamment à identifier les requêtes jamais demandées auparavant et contribue à préparer l'avenir. Explications...

Qu'est-ce que RankBrain ? Voici notre définition :

RankBrain est un algorithme, basé sur les réseaux de neurones, l'apprentissage automatique et l'intelligence artificielle, utilisé par Google pour mieux comprendre l'intention de recherche de l'internaute qui utilise son moteur. Il prépare également l'outil à l'avènement prochain de la recherche vocale et conversationnelle.

Les différents algorithmes utilisés par les moteurs de recherche ont connu plusieurs époques, devenant au fil des ans plus spécifiques et efficaces. Basés au départ sur des "sacs de mots" (bag of words) dans les années 50, où le contexte des différentes entités des phrases n'était pas analysé, le TF*IDF a, 20 ans plus tard, amélioré la connaissance des contenus en pondérant ces mots par rapport à une importance relative dans un ensemble de documents. Le modèle vectoriel de Gérard Salton (et son célèbre cosinus) constituera ensuite une nouvelle avancée en représentant les documents sous forme de vecteurs mathématiques.

De nombreux concepts et théories ont, depuis, vu le jour au fur et à mesure que l'Internet prenait de l'importance et que le besoin de trier et noter les contenus disponibles en ligne, mais également de comprendre le sens de la demande de l'internaute, devenait indispensable. L'intelligence artificielle, les réseaux de neurones et l'apprentissage automatique (machine learning, deep learning) ont trouvé là des "terrains de jeux" parfaits pour se répandre et améliorer les connaissances et les analyses, notamment dans le domaine du "word embedding" qui serait à la base de RankBrain, incorporé en 2015 dans le coeur de Google (qui utilise également ces concepts dans des algorithmes comme Word2vec).

Fortement lié à Hummingbird (2013), Rankbrain serait une composante de l'algorithme permettant de mieux comprendre, notamment grâce à des réseaux de neurones et des systèmes d'apprentissage automatique (deep learning), l'intention de recherche de l'internaute, par exemple lorsque celle-ci est exprimée en langage naturel. RankBrain serait donc également une composante du moteur préparant ce dernier à l'arrivée prochaine de la recherche vocale et conversationnelle. Selon la firme de Mountain View, RankBrain serait déjà particulièrement efficace actuellement pour les 15% de requêtes qu'il doit traiter quotidiennement et qui n'ont jamais été tapées auparavant sur le moteur.

C'est donc un non-sens que d'expliquer qu'il faut "optimiser un site pour RankBrain", puisque cette technologie ne s'applique pas à l'analyse des pages web, mais avant tout à établir une meilleure compréhension de ce que désire l'internaute, à extraire le concept demandé de la demande émise par l'utilisateur. Et à lui fournir par la suite la réponse la plus pertinente possible...

google-brain
RankBrain, au coeur du cerveau de Google... Source de l'image : Search Engine Land

Commentaires : 4
  1. Christian MÉLINE 17 mai 2017 at 10 h 19 min

    Word2Vec appartient à l'ancien monde, celui des sacs de mots…

    Aujourd'hui, on est davantage sur des vecteurs de contexte.

    • Olivier 18 mai 2017 at 10 h 08 min

      Christian,
      Les metamots, de ce que j'en ai compris, me semblent une approche pertinente. Néanmoins, tu émets plein d'affirmations sans citer de sources pour étayer tes propos. De même, sur ton site, on trouve des graphes présentant l'efficacité de ta méthode mais sans les échelles (cf http://www.referencement-naturel-white-hat.fr/images/progression-reelle.png).
      Pour une approche qui se veut très pragmatique, je trouve que cela manque de rigueur !

    • Vivien 21 mai 2017 at 8 h 41 min

      Les vecteurs de contexte sont indissociables des sacs de mots puisque l'alignement tient compte de l'espace des mots-sources et de l'espace des mots-cibles.

      Sinon, c'est toujours un peu la même chose: à lire les articles consacrés au SEO, on dirait que Google est un peu une oeuvre philanthropique, le principal moteur du progrès humain vers des lendemains qui chantent...

      Google me fait de plus en plus penser à "La Machine" dans le Monde des non-A: un mystérieux "algorithme" réglerait la machine pour qu'elle soit impartiale et utile au bien de l'humanité... et puis Gosseyn passe de l'autre côté du miroir et s'aperçoit que tous les résultats sont manipulés en interne par des bonshommes qui ne considèrent que leur intérêt au détriment des autres.

      C'était ma réflexion philosophique du matin en ce dimanche 21 mai. 😉

  2. Christian MÉLINE 23 mai 2017 at 9 h 59 min

    Olivier,

    Mes sources sont mes propres expérimentations depuis des années. Expérimentations à assez grande échelle. Mon blog reporte ces travaux depuis des années aussi.

    Tu as malgré tout un brevet récent de Google qui va aussi dans le sens des metamots :
    https://patentscope.wipo.int/search/en/detail.jsf?docId=US177618724tion=Pub+Date+Desc&maxRec=3
    Dans ce brevet on parle aussi d’« attirance » qui est un des concepts de base des metamots… j’utilise aussi le mot « attirance » car c’est celui qui définit le mieux ce qui se passe.

    L’image que tu cites est une image de l’interface, elle aurait été dans un billet, tu aurais eu les valeurs (mais pas le ndd, faut pas rêver non-pus).
    Sinon, bien que cela date un peu :
    https://twitter.com/ChristianMeline/status/785460173536169984

Un site du Réseau Abondance | Olivier Andrieu | Contact | Publicité sur le site