La recherche d'images peut revêtir plusieurs formes : texte (requête) vers image, image vers image (similarité) ou image vers page web. Dans tous ces cas, des technologies existent aujourd'hui et sont appliquées, souvent avec un bonheur certain, par de nombreux moteurs de recherche. Sylvain Peyronnet, qui a créé le moteur de recherche d'images de Qwant, nous explique dans cette série d'articles ce qui se passe "sous la carrosserie du moteur" et les différents algorithmes utilisés, avec des explications les plus... imagées possible.

Ce mois-ci et le mois prochain, je vais aborder un point qui n'est pas couramment évoqué lorsque l'on parle du fonctionnement des moteurs de recherche, il s'agit de la verticale "images". Vous remarquerez que je prends une précaution littéraire en parlant de "verticale images" et non pas de moteur de recherche image, car le sens que l'on peut donner à cette dernière expression est multiple.

En effet, on peut s'intéresser à :

  1. Un moteur de recherche qui prend en entrée un texte comme requête, et renvoie en sortie des images ;
  2. Un moteur de recherche qui prend en entrée une image, et renvoie en sortie des images.
  3. Un moteur de recherche qui prend en entrée une image, et renvoie en sortie des pages web (qui contiennent l'image, ou plus impressionnant qui parlent de ce qui est représenté dans l'image).

Aujourd'hui, la technologie est assez mature pour assurer ces trois missions, et c'est pour cela que le terme "moteur de recherche images" est et reste assez flou.

Comme souvent, les anglo-saxons sont un peu plus précis : ils font la distinction entre plusieurs objets, et utilisent les termes de image retrieval system pour désigner un moteur qui renvoie des images en sortie, de image meta search pour dire que le moteur se base sur une information hors de l'image, et de content-based image retrieval pour signifier que c'est le contenu réel de l'image qui est utilisé.

Dans cette série d'articles, nous allons évoquer tout cela.

Première question : un moteur "images", pour qui ? pour quoi faire ?

Comme souvent, la définition technique d'un produit va découler de ses cas d'usage. La première question que l'on va donc se poser est celle de l'utilisateur du produit de recherche d'images, et de son intention.

[Cet article est disponible sous sa forme complète pour les abonnés du site Réacteur. Pour en savoir plus : https://www.reacteur.com/2020/03/les-technologies-utilisees-dans-la-recherche-dimages-1ere-partie.html]

Les technologies utilisées dans la recherche d'images (1ère partie)

Un article écrit par Sylvain Peyronnet, oncepteur de l'outil d'analyse de backlinks Babbar. (https://freres.peyronnet.eu/babbar-on-vous-explique-tout-partie-1/).