Il y a quelques semaines de cela, Microsoft a proposé en Open Source un algorithme nommé "Space Partition Tree And Graph (SPTAG)" faisant partie notamment de son moteur de recherche Bing. Une pratique appréciable de mise à disposition de logiciels qui devient courante chez les moteurs, car Google en fait souvent de même...

Une information qui n'est pas toute nouvelle mais dont nous n'avions pas parlé à l'époque : Microsot a mis au mois de mai dernier son algorithme baptisé "Space Partition Tree And Graph (SPTAG)", utilisé notamment par le moteur de recherche Bing, en Open Source comme projet Github.

Microsoft explique sur son blog que cet algorithme permet de tirer parti de l'intelligence des modèles de "deep learning" pour rechercher des milliards d'informations, appelées vecteurs, en quelques millisecondes, permettant de fournir des résultats plus pertinents plus rapidement.

Ce type de recherche, dite vectorielle, facilite la recherche par concept plutôt que par mot-clé. Par exemple, si un utilisateur tape "Quelle est la hauteur de la tour située à Paris ?", Bing peut retourner un résultat en langage naturel indiquant à l'utilisateur la hauteur de la Tour Eiffel, même si le mot "Eiffel" n'est jamais apparu dans la requête de recherche et le mot "grand" n'apparaît jamais dans le résultat.

Requête [Quelle est la hauteur de la tour à Paris ?] sur Bing. Source : Abondance

Ce type de technologie est utilisée dans le moteur de recherche Bing pour mieux comprendre l'intention de recherche de l'utilisateur.

Certes, avec cet algorithme, vous ne pourrez pas créer un moteur de toutes pièces, puisque ce n'est qu'une (petite) partie du système, mais il faut saluer Microsoft qui permet à d'autres développeurs de travailler sur ces logiciels pour d'autres fonctionnalités. Notons que Google propose également en Open Source bon nombre de ses algorithmes, notamment dans le domaine de l'intelligence artificielle et du machine learning.

La recherche vectorielle expliquée par Microsoft. Source : Youtube