Google lance un nouveau moteur de recherche !
5 (100%) 1 vote

Google lance un nouveau moteur de recherche pour aider les scientifiques à trouver les ensembles de données dont ils ont besoin

L’objectif de Google a toujours été d’organiser l’information mondiale, et sa première cible était le web commercial. Maintenant, il veut faire de même pour la communauté scientifique avec un nouveau moteur de recherche qui centralise des millions de bases de données scientifiques.

Le service, appelé Dataset Search, a été lancé début septembre 2018 et est en quelque sorte le compagnon de Google Scholar, le moteur de recherche populaire de l’entreprise pour les études et rapports universitaires. Les institutions qui publient leurs données en ligne, comme les universités et les gouvernements, devront inclure des balises de métadonnées dans leurs pages Web qui décrivent leurs données, notamment qui les a créées, quand ont-elles été publiées, comment ont-elles été recueillies, etc. Ces informations seront ensuite indexées par Dataset Search et combinées avec les données du Knowledge Graph de Google.

Natasha Noy, une chercheuse scientifique de Google AI qui a contribué à la création de Dataset Search, affirme que l’objectif est d’unifier les dizaines de milliers de référentiels différents. ”

Actuellement, la publication des ensembles de données est extrêmement fragmentée. Différents domaines scientifiques ont leurs propres dépôts de données préférés, de même que différents gouvernements et autorités locales.

La première version de Dataset Search couvrira les sciences environnementales et sociales, les données gouvernementales et les ensembles de données d’organismes de presse. Cependant, si le service devient populaire, la quantité de données qu’il indexe devrait rapidement faire augmenter.

Google a expliqué que le nouvel outil référencera les bases de données gouvernementales, les sources publiques, les bibliothèques numériques et les sites Web personnels pour trouver les ensembles de données que vous recherchez. S’ils sont structurés à l’aide du balisage de schema.org ou d’équivalents similaires décrits par le W3C, Google peut les trouver. Il prend déjà en charge plusieurs langues et en ajoutera bientôt d’autres.

Cette année, Google s’est concentré sur un grand nombre d’initiatives destinées aux journalistes. En juillet, elle a amélioré la représentation des données tabulaires dans les résultats de recherche. En Inde, elle a lancé un programme de formation des journalistes à l’identification de la désinformation. Et lors de sa conférence des développeurs au début de l’année, il a déployé une nouvelle version de Google News avec des fonctionnalités de personnalisation.

Vous pouvez essayer la nouvelle recherche de données en cliquant sur ce lien : Dataset Search