• Contenu du site mis à jour le 23 mai 2024

Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Une actualité des moteurs très chargée

Carole Tisserand-Barthole
Bases no
362
publié en
2018.09
288
Réduire Augmenter Taille de la police
Une actualité des moteurs très chargée Image 1
Une actualité des moteurs très chargée Image 1

Pas toujours facile de suivre toutes les évolutions de Google quand on sait par exemple qu’il modifie son algorithme plus de 1 600 fois par an. Heureusement, toutes ces modifications ne revêtent pas la même importance et toutes n’ont pas d’impact sur la recherche d’information professionnelle.

Toujours est-il qu’en ce mois de septembre, les nouveautés sont nombreuses et méritent d’être signalées.

On commencera donc par le lancement d’un nouveau moteur dédié aux données publiques appelé « Google Dataset Search » accessible à l’adresse suivante : https://toolbox.google.com/datasetsearch.

On rappellera qu’un dataset ou jeu de données en français est « un ensemble de données où chaque valeur est associée à une variable et un commentaire. Ces données sont stockées dans des tables qui contiennent des colonnes et des lignes comme dans un tableau Excel. Ainsi, une base de données, ou database, est constituée de plusieurs jeux de données, structurés afin d’être exploitables par un programme informatique. » (source : www.matlo.com ).

Depuis le développement de l’Open Data, de nombreux organismes publics mettent à disposition des jeux de données librement accessibles tels que les horaires ou la ponctualité des trains, l’emplacement des lampadaires dans une ville, le Cadastre, la liste des organismes de formation, etc. Et du côté de l’information scientifique et technique, on voit également se développer la mise à disposition des données de la recherche par les chercheurs sous la forme de jeux de données accessibles sur le Web.


Premiers retours

Les premiers retours d’experts et blogueurs sur le produit sont plutôt mitigés et pointent la faiblesse et l’absence de fonctionnalités de recherche dignes de ce nom mais également le fait que le moteur est très loin de donner accès à l’ensemble des jeux de données éparpillés sur le Web.


Voir aussi notre dossier spécialDatasets : un nouvel enjeu pour la recherche d’information et la veille ?


 Quant aux produits existants, Google, qui vient de fêter ses 20 ans, a décidé d’annoncer un certain nombre de nouveautés pour son moteur Web et d’images.

Concernant le moteur Web, on a ainsi pu apprendre que :

  • Google utilise depuis quelques mois maintenant une nouvelle technique liée à l’intelligence artificielle appelée « correspondance neurale » pour mieux comprendre les synonymes et classer le contenu. 30 % des requêtes seraient déjà impactées par cette nouvelle technique et cela devrait continuer à s’étendre.
  • Google va prochainement lancer des Activity cards dans les résultats de recherche. Une activity card se définit comme un cadre qui apparaîtra au-dessus des résultats de recherche et visible uniquement pour un utilisateur donné. Il contiendra des pages liées à la requête qu’il a visitées par le passé et qui sont donc basées sur son historique de recherche. Il visualisera également les requêtes qui avaient alors fait apparaître ces résultats. Ces Activity cards ne s’afficheront que lorsque le moteur juge qu’elles sont utiles pour l’internaute. Elles seront bien présentes sur mobile mais on ne sait pas encore si cela sera le cas pour l’interface desktop.
  • Google flux qui était disponible uniquement sur l’application mobile de Google change de nom et devient Discover. Cette fonctionnalité sera désormais présente sur mobile puis sur la page d’accueil Google desktop. Rappelons que l’idée est de proposer à l’utilisateur un flux d’informations en lien avec ses goûts et centres d’intérêt sans qu’il ait même besoin de faire des recherches. Une sorte de page d’accueil personnalisée un peu à l’image de ce qu’on peut trouver sur les réseaux sociaux comme Twitter, LinkedIn ou encore Facebook.
  • Google va également lancer des Collections qui vont permettre à l’internaute de sauvegarder des contenus, pages Web ou images. Ces contenus pourront être ajoutés au flux d’information Discover présenté ci-dessus. Ce service est un peu à l’image de ce que l’on peut faire sur Pinterest ou sur Scoop.it et Google s’apparente ainsi de plus en plus à un outil de curation. A partir de ces contenus sauvegardés, Google pourra également proposer des recommandations de contenus similaires.

Google a également décidé de revoir l’interface et les fonctionnalités de Google Images en proposant :

  • plus de contexte autour des images avec la légende, le titre de la page Web où apparaît cette image et l’url de l’image ;
  • des filtres/mots-clés au-dessus des images pour aider l’internaute à mieux cibler et raffiner sa requête. Ces filtres étaient déjà présents depuis quelques mois mais pas encore appliqués à toutes les interfaces ;
  • des métadonnées dans les photos qu’il affiche (créateur, crédit et copyright) ;
  • Google a également indiqué avoir modifié son algorithme pour mieux mettre en valeur les « contenus pertinents ». Concrètement, l’autorité de la page sur laquelle est publiée l’image aura plus d’importance ainsi que la position de l’image sur la page ;
  • Google Lens va être intégré à Google Images. Rappelons que Google Lens est une application qui permet de prendre des photos avec son téléphone et qui recherche sur Google Images des produits et images similaires à ce que l’on vient de prendre en photo. En l’incluant directement à Google Images, cela permettra aux internautes de mieux rechercher au sein des images en zoomant par exemple sur un élément de l’image et en relançant la recherche sur cet élément précis. Rappelons que Bing propose cette fonctionnalité depuis déjà quelque temps.
De son côté, Microsoft a également fait quelques annonces importantes :

Comme Google, il a annoncé des améliorations à son moteur d’images Bing Visual Search :

  • lancement de Math Solver qui permet de prendre en photo une équation et le moteur se charge ensuite de la résoudre ;
  • Text transcription qui permet de prendre un photo un morceau de texte (article, ouvrage, etc.) et transforme cette image en contenu textuel ;
  • La recherche d’images inversée, où le moteur se charge de retrouver des images similaires à une image donnée, a également été améliorée. On peut désormais utiliser un simple glisser/déposer d’une image ce qui rend le processus plus simple et plus rapide.

Seul problème, on ne sait pas encore si cela sera accessible à tout le monde où bien uniquement aux internautes américains.

Enfin, Microsoft a annoncé vouloir unifier ses outils de recherche sur ses différents produits et services.

Microsoft Search deviendra l’outil de recherche principal pour Windows, Office et Bing. Les utilisateurs pourront donc obtenir des résultats Web (venant de Bing) mais également des résultats internes et locaux liés aux applications et services de Microsoft auxquels ils ont accès. Et comme on sait que la veille et la recherche d’information nécessitent bien souvent de combiner de l’information externe et interne, on suivra donc ces évolutions avec intérêt même si elle ne sont limitées qu’aux produits Microsoft...

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...