Google a annoncé hier mettre à la disposition des chercheurs un dataset d'informations concernant les tendances de recherche sur son moteur ayant trait à la Covid 19, afin d'élaborer des modèles scientifiques et d'aider à lutter contre la maladie...

Google a annoncé hier qu'il mettait à la disposition des chercheurs et des scientifiques un ensemble de données sur les tendances de recherche des internautes sur son moteur afin qu'ils puissent étudier le lien entre les recherches liées aux symptômes de la maladie et la propagation de la Covid-19, afin de mieux comprendre l'impact de la pandémie, notamment aux Etats-Unis.

Voici un exemple de graphique qui peut être généré sur la base de ce dataset, à partir duquel les chercheurs peuvent élaborer des modèles et créer des visualisations en fonction de la popularité des recherches liées aux symptômes :

Exemple de graphique basé sur le dataset fourni par Google. Source : Google

L'ensemble de données sur le Covid-19 comprend des tendances de recherche agrégées et anonymisées pour plus de 400 symptômes, signes et états de santé, tels que la toux, la fièvre et les difficultés respiratoires. L'ensemble de données comprend les tendances des trois dernières années au niveau des états américains afin de permettre aux chercheurs de tenir compte des changements dans les recherches sur le moteur en raison de la saisonnalité.

Cet ensemble de données est disponible dans le programme COVID-19 de Google Cloud et peut être téléchargé au format CSV à partir de Google Research dans le dépôt de données COVID-19 GitHub.

Cette publication est actuellement limitée aux États-Unis et couvre les recherches effectuées en anglais et en espagnol, mais Google prévoit d'y inclure au fur et à mesure d'autres pays et régions du Globe.

Comme pour Google Trends, les données sont normalisées en fonction de la popularité relative d'un symptôme, ce qui permet aux chercheurs d'étudier les pics d'intérêt des recherches sur différentes périodes, sans exposer une requête individuelle ni même le nombre de requêtes dans une zone donnée, pour des raisons de protection des informations personnelles.