Bing découvre chaque jour des douzaines de milliards de liens inédits

Olivier Andrieu

Article rédigé par Olivier Andrieu

Fondateur Abondance

Publié le 23/08/2022 07h43 | Mis à jour le 21/08/2023 11h56

Temps de lecture : 2 minutes

Nous suivre sur Google

Résumer cet article avec :

Résumer l'article sur ChatGPT

Résumer l'article sur Mistral

Résumer l'article sur Claude

Résumer l'article sur Perplexity

Résumer l'article sur Grok

Grok

Partagez l'article

Bing découvre chaque jour des douzaines de milliards de liens inédits

Bing a récemment indiqué que Bingbot, son robot, découvrait chaque jour des douzaines de milliards d'URL qu'il n'avait jamais vues auparavant. Un chiffre à mettre en parallèle avec un autre, fourni il y a un an et demi de cela. Mais cela ne signifie pas que tous ces contenus sont indexés, loin de là...

En février 2020, Bing nous confiait que ses robots découvraient de 70 à 100 milliards de nouvelles URL chaque jour, des adresses de pages que Bingbot n'avait jamais détectés auparavant.

Dans un tweet récent (voir ci-dessous), Fabrice Canel, responsable du crawl et de l'indexation chez Bing, donnait un chiffre un peu différent : « Nous découvrons chez Bing quotidiennement des douzaines de milliards d'URL normalisées jamais vues auparavant ».

La différence avec le chiffre de 2020 vient certainement du terme « normalisées » alors que les 70 à 1000 milliards étaient certainement un nombre brut.

À lire aussi

Nom de domaine : .com, .fr, .bzh… comment choisir la bonne extension pour votre site ?

Mais Fabrice continue en disant que dans ces contenus, atteints en cliquant sur ces liens inédits, on ne trouve pas grand chose de « comestible » pour un moteur de recherche : « Des contenus pour la plupart inutiles (duplicate / contenu copié-collé / généré automatiquement / spam, junk, etc) y compris les "choses à éviter"… »

Ainsi va donc la vie des moteurs de recherche : crawler un magma de contenus inutiles pour en extraire les quelques pépites qui seront indexées. Trier le bon grain de l'ivraie, un sacerdoce pas toujours facile à mettre en place, surtout quand certains s'échinent à pourrir chaque un peu plus le magma en question…

Site of the internet = ♾. We discover at #bing daily 12s of billions of normalized URLs never seen before. Mostly useless content (duplicate/scraped/automatically generated content, spam, junk, etc.). See our guidelines https://t.co/IKdDkLNs6W including the “Things to avoid”
— Fabrice Canel (@facan) August 17, 2022

Le Tweet de Fabrice Canel sur la découverte d'URL par Bing. Source : Bing

Pour poursuivre la lecture

Google met fin au cache AMP dans les résultats de recherche

Olivier Andrieu

Article rédigé par Olivier Andrieu

Fondateur Abondance

ActuMoteurs, la newsletter hebdo d'Abondance

Rejoignez nos 20 000 abonnés et recevez, chaque semaine, tous nos articles dans votre boite mail !

Les données transmises par le biais de ce formulaire sont uniquement destinées à Abondance. Elles ne seront en aucun cas cédées à des tiers. Vous pouvez vous désabonner à tout moment en cliquant sur les liens de désinscriptions présents dans chacun de nos emails. Pour plus d’informations, vous pouvez consulter l’intégralité de notre politique de traitement de vos données personnelles.

Une sélection d’outils pour vous aider

Abondance > Actualités > Bing découvre chaque jour des douzaines de milliards de liens inédits