L’expertise humaine qui donne du sens à l'IA

S'abonner ou acheter un numéro

Connexion

Actualités serveurs, moteurs, Web social, veille et Open Data

Carole Tisserand-Barthole

Bases no

343

publié en

2016.12

2524

Acheter ce no

Actualité des serveurs, éditeurs et outils scientifiques

Clarivate Analytics lance une nouvelle version de son outil de gestion bibliographique EndNote. EndNote X8 offre désormais la possibilité de partager une bibliothèque de références, des références, des PDFs et des annotations avec 100 personnes maximum, la possibilité de travailler simultanément sur une bibliothèque partagée en temps réel, du stockage illimité sans coût additionnel et l’ajout d’un flux d’activité pour voir les nouveaux membres ou les changements apportés aux bibliothèques partagées.

Autres serveurs bases de données

L’organisation des Nations-Unies pour l’Alimentation et l’Agriculture (FAO) vient de lancer une nouvelle version de sa base de données statistique FAOSTAT. Au programme des nouveautés, une interface plus moderne et adaptée à la lecture sur supports mobiles, de nouvelles fonctionnalités de recherche et de filtrage et la possibilité de télécharger des ensembles de données personnalisées, des cartes et graphiques. Le nouveau site propose également une nouvelle fonction avec un ensemble d’indicateurs-clés prêts à l’emploi.

L’heure est à la refonte et à l’amélioration puisqu’on apprend également que le site Legifrance sera refondu en 2017. L’Etat a en effet prévu d’allouer deux millions d’euros à ce nouveau site. Parmi les améliorations prévues : l’ergonomie, l’amélioration des fonctions existantes de recherche comme la recherche multi-bases, le filtrage des résultats, les liens entre les textes et enfin la création de nouveaux services comme la possibilité de mieux gérer ses alertes ou la création de flux thématiques.

L’actualité des moteurs

On ne saurait parler de l’actualité des moteurs sans parler de Google. Il y a bien longtemps que Google ne communiquait plus sur la taille de son index. Google a récemment changé son fusil d’épaule et annoncé que son moteur indexait désormais 130 trillions de pages (rappelons qu’un trillion représente 1 milliard de milliard). En comparaison, en 2013, le géant américain parlait de 30 trillions de pages. Pas sûr que communiquer sur des chiffres d’un telle ampleur ait encore un sens...

Nous avions déjà eu l’occasion de mentionner que Google allait prochainement scinder son index en deux : un pour les mobiles et un pour les ordinateurs. On en sait désormais un peu plus sur ce nouvel index mobile. On apprend ainsi que ce nouvel index analysera en priorité les versions mobiles des pages. Pour certaines pages et sites, il existe en effet des versions mobiles et desktop qui peuvent être différentes et ne pas proposer un contenu strictement identique. D’autre part, cet index est toujours en test et ne devrait pas être implémenté avant quatre mois. Pour les professionnels de l’information, il faudra alors s’interroger sur l’intérêt éventuel de combiner des recherches sur les index mobiles et desktop car les résultats pourraient différer. Nous testerons dans quelques mois.

Au cours de l’été, Google a également déposé un brevet sur le classement des événements. L’idée est de classer les événements (qui ont une réalité physique comme un concert, une conférence, une exposition, etc.) par popularité sans se baser sur le nombre de liens qui pointent vers le site de l’événement en question.

Autre nouveauté : l’amélioration des traductions dans Google Translate. Depuis le mois de Septembre, Google a annoncé l’intégration d’un nouveau système de traduction neuronal. L’idée est de répliquer le cerveau humain en ne considérant plus les phrases mot à mot mais dans leur intégralité afin d’obtenir une qualité de traduction proche de la traduction humaine. Chez Google cette innovation est pour le moment appliquée à 8 langues : l’anglais et le français, l’allemand, l’espagnol, le portugais, le chinois, le japonais, le coréen, et le turc.

La traduction neuronale est en pleine expansion et on apprend également que Systran est le premier éditeur à lancer un moteur de traduction de ce type sur plus de 30 langues. L’outil est pour l’instant en version beta et accessible à un nombre restreint de beta-testeurs et il existe également une plateforme de démonstration à l’adresse https://demo-pnmt.systran.net/production#/translation permettant d’entrer jusqu’à 2000 caractères. Nous avons fait quelques tests sur l’allemand et les résultats sont déjà très concluants. Néanmoins, il ne semble pas que cet outil soit destiné à être en libre accès.

Mi-Novembre, Bing a annoncé la mise en ligne d’une nouvelle fonctionnalité permettant de sauvegarder certains résultats de recherche pour les visualiser et les retrouver plus tard. Pour le moment, cela ne s’applique qu’aux images, vidéos et articles de shopping. Google propose un système similaire mais qui ne fonctionne que sur les mobiles et pour les images uniquement.

On apprend également que Ahrefs va prochainement lancer un outil de recherche de mots-clés appelé Keyword Explorer. Même s’il agit plutôt d’un outil de référencement/SEO, on pourra néanmoins y trouver un intérêt pour les veilles et recherches d’informations afin d’enrichir le vocabulaire de ces requêtes. Reste à voir s’il disposera d’une version gratuite ou abordable.

Twitter a récemment introduit une nouvelle fonctionnalité permettant d’exclure certains mots-clés, hashtags, phrases, utilisateurs et emojis de ses notifications. Ils ne disparaîtront pas pour autant de la timeline mais uniquement des notifications.

Facebook, quant à lui, continue à s’aventurer dans des secteurs a priori éloignés de son cœur de métier traditionnel avec cette fois-ci les offres d’emploi. Cette nouvelle fonctionnalité toujours en test permettra aux entreprises de diffuser des offres d’emplois ciblées et aux candidats de postuler directement.

Du côté des réseaux sociaux professionnels, l’actualité est plutôt morose. Viadeo a été placé en redressement judiciaire le 29 novembre dernier par le Tribunal de commerce de Paris et vient d’annoncer son retrait du Maroc. Leboncoin et le département des petites annonces du Figaro avaient déposé des offres pour la reprise du réseau social et c’est finalement Figaro Classifieds, la filiale de petites annonces du groupe média qui a été retenue.

LinkedIn de son côté est accusé de violer les lois sur le stockage des données personnelles en Russie et le tribunal municipal de Moscou a ordonné le 10 Novembre son blocage dans tout le pays.

Il semblerait également que les possibilités de recherche booléenne disparaissent progressivement de LinkedIn (source : Boolean Strings) et qu’il réserve de plus en plus ses fonctionnalités de recherche avancées pour les abonnements les plus chers. Pour le moment, certains professionnels ont pu constater ces changements alors qu’ils ne semblent pas s’appliquer pour d’autres. Affaire à suivre !

L’actualité des outils de veille et de curation

Du côté des outils de veille, Meltwater rend désormais accessibles à ses clients toutes les publications de l’Union européenne. Des procès-verbaux de réunions aux discours en passant par les rapports d’activité et déclarations publiques, toutes les informations publiées par les 56 départements de l’UE, institutions, agences, services sont maintenant recueillies et analysées par Meltwater.

Talkwalker, connu pour ses solutions de veille sur les médias sociaux a récemment lancé Talkwalker Now, une plateforme pour détecter et analyser les tendances. L’outil permet également de détecter des influenceurs et des sources d’information. Il s’adresse aussi bien aux éditeurs, aux équipes marketing qu’aux veilleurs. Son coût est de 12 000 € /an pour 5 utilisateurs.

Inoreader, l’un des lecteurs de flux RSS les plus puissants du marché et déjà utilisé par de nombreux professionnels de l’information vient d’annoncer que l’intégration d’IFTTT (un service très puissant qui permet d’automatiser un grand nombre de tâche sur le Web comme par exemple publier automatiquement sur Facebook tout message posté sur Twitter ou sauvegarder sur Evernote tout billet publié sur son blog, etc.) allait être réservé aux utilisateurs ayant souscrit l’abonnement Pro.

Revenons maintenant à l’outil IFTTT qui permet d’automatiser des tâches sur les outils de Web. Jusqu’à présent un déclencheur ne pouvait lancer qu’une seule action. Désormais il peut lancer plusieurs actions en même temps.

D’autre part, Microsoft a annoncé le lancement de Flow, un concurrent direct d’IFTTT (https://flow.microsoft.com).

Elcurator, un outil de curation professionnel dont nous avions déjà eu l’occasion de parler dans Netsources (Netsources n°123 - juillet/août 2016) et dans le numéro spécial de Bases sur les livrables de veille (Bases n°338 - juin 2016) est désormais connecté à Zapier, un service proche de ce que peut proposer IFTTT présenté plus haut. Cela permettra notamment de lier elCurator à Facebook, Twitter, Feedly, Slack, Wordpress ou encore Buffer et de créer des procédures automatisées qui seront déclenchées périodiquement.

L’excellent outil de bookmarking Diigo, qui avait beaucoup perdu de sa valeur au cours des dernières années en raison du peu d’améliorations et d’innovations apportés à l’outil a été complètement revu. Parmi les nouveautés : une interface plus ergonomique, une application mobile enfin fonctionnelle, la possibilité d’éditer un grand nombre de bookmarks en même temps, etc.

L’actualité de l’Open Data

En matière d’Open Data, nous apprenons ce mois-ci que la Métropole Européenne de Lille ouvre ses données à l’adresse https://opendata.lillemetropole.fr/. 57 jeux de données sont pour le moment disponibles. Plus de la moitié concernent les transports et déplacements.

La Banque de France commence elle-aussi à ouvrir ses données mais pas à tous les publics... Depuis 2011, elle partage déjà quelques données sur le site http://webstat.banque-france.fr/fr/home.do mais désormais certaines personnes pourront accéder à des données beaucoup plus complètes. 400 millions d’éléments seront mis gratuitement à la disposition des chercheurs uniquement. Ceux-ci devront en faire la demande écrite, demande qui sera ensuite examinée par un comité dédié.

Enfin le site data.gouv.fr publie une liste des collectivités territoriales ayant ouvert leurs données (plus de cinq jeux de données pertinentes) à l’adresse http://bit.ly/2h9kLtW.

Précédent 497 / 628 Suivant

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...

JComments