> > Définition : Un Index Inversé, c'est quoi ?

Définition : Un Index Inversé, c'est quoi ?



 
Définition : Un Index Inversé, c'est quoi ?
5 (100%) 2 votes

Définition : Un Index Inversé, c'est quoi ?

Un index inversé est un système utilisé par tous les moteurs de recherche et qui leur permet de calculer plus rapidement quels mots se trouvent dans quelles pages web. Une bonne façon d'analyser de façon plus fine la pertinence des documents traités. Explications...

Qu'est-ce qu'un index inversé ? Voici notre définition :

Un index inversé permet à un moteur de recherche de répertorier les mots ou expressions de l'index et de savoir dans quelles pages web ils se trouvent. Le contraire donc d'un index "classique" qui, lui, stocke et traite avant tout des documents (pages web).

Prenons l'exemple de deux pages web se trouvant dans l'index "classique" :
- Le document A contient le texte : "le soleil brille en Alsace".
- Le document B contient le texte : "en Alsace, on mange de la choucroute".
L'index inversé, de son côté, va comptabiliser les mots qui se trouvent dans ces pages ainsi que leurs occurrences (le nombre de fois où ils apparaissent) :
- "soleil" apparaît 1 fois dans A.
- "mange" apparaît 1 fois dans A.
- "choucroute" apparaît 1 fois dans B.
- "alsace" apparaît 2 fois, 1 fois dans A et 1 fois dans B.
En fonction des requêtes tapées par l'internaute, le moteur pourra alors rapidement identifier les URL des pages pertinentes pour la question demandée et donner une note de pertinence à chaque document ainsi répertorié. Ce travail sera effectué pour tous les termes contenus dans les pages web de l'index classique.

classement-information-index
Classement et analyse de l'information... Source de l'image : iPhone Fan

Commentaires : 2
  1. Denis 25 mai 2017 at 19 h 16 min

    Il y a aussi les index de type FULL-TEXT SEARCH qui se chargent de cette "besogne".

  2. Anonyme 31 mai 2017 at 12 h 15 min

    Sur le moteur en developpement Premsgo, nous travaillons depuis 2 ans sur un nouveau type d'index, qui modélise dans un espace 3D numérique des formes de "pyramide" dont chaque tete représente un "sujet" racine. Les documents sont ainsi lié a une table symétrique qui comporte des champs avec les valeurs numériques des "pyramides" auxquels ils appartiennent.

    Cette innovation de Premsgo devrait conduire a une pertinence bien au delà de celle de Google qui, au delà de la deuxième page et parfois même après les 10 premier résultats, devient purement catastrophique, et qui, dans les résultats suivants, reprend d'autres pages des même sites.

    A ce sujet, la pertinence extreme de Google mais extrement limité est étonnante pour une firme dont la technologie est si évoluée et puissante, au point que l'on pense que c'est un fait exprès probablement, peut-être afin de solliciter des clics sur les publicité de bas de page .... (Tant mieux pour nous si Premsgo devient plus pertinent que Google sur les 100 premiers résultats 🙂 ).

    Cette recherche et développement est toujours en l'étude, et demande énormément de ressources machine (ce que nous avons peu), mais nous sommes convaincu que c'est la bonne méthode sémantique. Pour le moment, seul les titres et les balises H1 sont prises en compte. Ksenia, notre chercheuse fraichement embauchée travaille sur le sujet a se brûler les neurones , mais nous espérons d'ici quelques mois arriver a un résultat satisfaisant pour le mettre en application.

    NOTA : aucun développement évolué concernant le moteur Premsgo n'a été appliqué depuis septembre 2015 (lancement de Premsgo), afin de "trancher" sérieusement lorsque l'ensemble du projet sera opérationnel. Aucune campagne de pub non plus, restons modeste avant d'être au minimum au point. Septembre 2017 devrait être la bonne date, nous ne sommes pas préssé non plus.

Un site du Réseau Abondance | Olivier Andrieu | Contact | Publicité sur le site