Tout le monde ou presque utilise Google pour rechercher de l’information. S’y limiter présente néanmoins quelques risques : l’un des plus importants étant de passer à côté de contenus pertinents non accessibles sur le Web ouvert ou mal référencés.
Pour mener une recherche efficace sur Google, on peut bien évidemment tirer parti des différentes fonctionnalités proposées par le moteur (recherche sur un site ou une extension précise, recherche sur certains types de fichiers, recherche sur les titres de pages, etc).
Les fonctionnalités sont toujours nombreuses mais certaines ont disparu ces dernières années et d'autres n’ont tout simplement jamais fonctionné correctement (comme l’opérateur de proximité AROUND par exemple).
Mais saviez-vous que certains concurrents de Google comme Bing, DuckDuckGo ou encore Yandex proposent quelques fonctionnalités originales ou innovantes que l’on ne retrouve pas chez le géant américain ?
La phase de sourcing, c’est-à-dire l’identification des sources d’informations pertinentes est un élément essentiel de tout processus de veille. On peut bien évidemment créer des alertes sur des moteurs, réseaux sociaux, agrégateurs de presse tous azimuts ce qui peut générer un bruit considérable mais on a aussi et surtout intérêt à identifier et mettre sous surveillance des sources précises en lien avec son sujet.
Différentes méthodes sont possibles pour y parvenir : interroger des moteurs de recherche, des médias sociaux en testant plusieurs stratégies de recherche plus ou moins ciblées, explorer des sites de référence à la recherche d’une rubrique « liens » qui redirigerait vers d’autres sites pertinents, etc.
Nous apprenions il y a quelques jours dans un communiqué de presse de l’Union Européenne de Radio-Télévision (UER) que les adresses internet avec une extension
.radio
allaient être mises sur le marché en 2017.
Cela va se faire selon plusieurs vagues successives.
Le but : fédérer la communauté des 65 000 radios hertziennes et des 60.000 webradios dans le monde. A noter qu'une radio devra débourser 200 euros pour acquérir cette extension.
En février et mars 2017, l’UER va sélectionner 80 radios dans le monde parmi celles ayant fait une demande et leur attribuer une extension .radio
. Ce n’est qu’en mai et juin que les autres radios pourront à leur tour postuler.
Le mouvement de l’Open Data (ouverture et mise à disposition des données) concerne principalement les données dites « publiques », c’est à dire produites par des organismes publics ou affiliés (ministères, collectivités locales, état, organismes publics comme l’assurance maladie, Pôle Emploi, l’INSEE, entreprises publiques etc.) mais l’Open Data dans le secteur privé commence également à se développer.
L’ouverture des données en France mais également dans le reste du monde représente donc une véritable opportunité pour les personnes confrontées à des problématiques de veille et de recherches d’information.
Les plateformes/portails Open Data permettent en effet d’accéder gratuitement à une multitude de données brutes, certes, mais vérifiées, relatives à des secteurs comme le transport, l’urbanisme, l’économie, la culture, la santé, etc.
Avant le mouvement de l’Open Data, apparu il y a quelques années maintenant, on rappellera que ces données étaient souvent difficilement accessibles même pour des professionnels experts de la recherche.
Pour interroger la presse que ce soit pour la France ou à l’étranger, on pense généralement aux solutions suivantes :
Mais ces différentes solutions ne permettent malheureusement pas d’accéder à une très grande antériorité notamment au delà des années 90. Alors, comment faire ?
LinkedIn est principalement connu pour être le réseau social professionnel leader du marché
Pour la recherche d’informations et la veille, on se tourne en priorité vers lui pour rechercher des profils pour un poste, ou pour obtenir des informations sur une personne.
On peut s’abonner à des groupes thématiques pour suivre les discussions sur différents sujets et bénéficier des articles/ressources partagés par les membres. Depuis quelques années néanmoins, on constate que les groupes se transforment de plus en plus en espaces publicitaires où les membres et entreprises communiquent sur leur propre actualité, ce qui a moins de valeur ajoutée a priori.
Les salons professionnels représentent souvent une source d’information intéressante pour la veille et la recherche d’information.
Cela permettra par exemple :
d’identifier des salons en lien avec son activité pour y devenir exposant ou simple visiteur
de traquer la présence de concurrents sur les salons dans le cadre d’une veille concurrentielle
de repérer des fournisseurs et partenaires éventuels
d’identifier des médias spécialisés sur une thématique précise dans le cadre d’un sourcing
de repérer de nouveaux acteurs, start-ups et produits et services innovants dans un secteur bien précis pour une veille innovation, etc…
Rappelons que Factiva est un des principaux acteurs sur le marché des agrégateurs de presse. Il permet d'interroger plusieurs dizaines de milliers de titres de presse en France et à l'international ainsi que des sources Web (sites d'actualités, blogs, etc.) et est utilisé par un grand nombre de professionnels de l'information et de la veille dans le monde.
Lorsque l'on cherche dans Factiva les articles écrits par une personne donnée, il est extrêmement tentant de chercher le nom de cet auteur dans le filtre auteurs.
Et c'est là que se situe justement le piège! En effet, pour qu'une personne figure dans le filtre auteurs, il faut qu'elle ait écrit au moins quatre articles dans la même publication pendant une période de trente jours.
Cela limite donc de fait la liste à des journalistes professionnels ou à des chroniqueurs très réguliers.
On peut néanmoins rechercher tous les articles écrits par une personne donnée moins prolifique, il suffit pour cela d'écrire by=Prenom Nom.
Toujours bon à savoir pour éviter des désillusions inutiles.
Auteur : François Libmann, Directeur de Publication
Dans un récent ouvrage paru aux éditions de l’INA, intitulé « L’ information à tout prix », les auteurs ont mis en évidence, grâce à un algorithme de détection de plagiat, un fait édifiant, quoique peu surprenant...
Dans les cas des actualités « chaudes », 64% de l’information publiée en ligne correspond à du copié-collé pur et simple
Et pour les professionnels de l’information, cette profusion de contenus dupliqués a un impact réel et dommageable sur l’exercice de leur métier au quotidien quand il s’agit de réaliser des recherches documentaires ou des veilles, qu’elles soient documentaires, concurrentielles ou stratégiques.
Ainsi, pour toute recherche ou veille sur les news, le professionnel est de plus en plus souvent noyé sous l’information alors que seule une infime partie de ce contenu est susceptible d’apporter des informations originales et réellement utiles.
On peut réaliser une veille ou une recherche bibliographique via des bases de données bibliographiques spécialisées présentes sur les serveurs et agrégateurs, via les sites des éditeurs scientifiques ou encore tout simplement sur le Web ouvert et gratuit (via Google Scholar par exemple). On identifie alors une liste de notices bibliographiques comprenant généralement le titre de l’article, le nom des auteurs ainsi que le résumé et parfois quelques termes d’indexation.
Derrière un nom énigmatique se cache en réalité un nouveau format pour la syndication de contenu : les flux au format JSON Feed jouent donc dans la même cour que les flux RSS et atom. Attention cependant à ne pas confondre avec les flux d'information codés en JSON qui sont plus communs et utilisés depuis plusieurs années.
Rappelons que le RSS est un format de données utilisé pour la syndication de contenus Web. Les flux RSS sont des fichiers XML qui sont souvent utilisés par les sites d'actualité et les blogs pour présenter les titres des dernières informations consultables. (source : Wikipédia).
Que ce soit pour une recherche d’informations ou dans le cadre d’une veille, il existe une multitude d’astuces et méthodes pour optimiser sa recherche et identifier des résultats pertinents.
Lorsque l’on a identifié une page ou un site web pertinent par exemple, il peut être intéressant de l’utiliser comme point de départ d’une nouvelle recherche, dans l’optique d’identifier des sources et contenus similaires.
Lire aussi :
Identifier des sources grâce aux backlinks
Sourcing pour la veille : pensez à utiliser les images !
Dans notre précédent billet « Google Actualités évolue à son tour : bonne ou mauvaise nouvelle pour la veille ? », nous avions analysé la nouvelle interface de Google Actualités (plus communément appelé Google News) afin de voir ce que cela changeait pour la veille et la recherche d’informations.
Et le constat final n’était malheureusement pas très encourageant...
Nous allons donc aujourd’hui tester l’aspect méthodologie de recherche. Existe t-il une façon réellement efficace de l’interroger ?
Pour rappel, Google Actualités est un moteur, lancé en 2002 mais en 2009 seulement pour la France, qui n’indexe que des contenus provenant de sites de presse, site d’actualités et quelques blogs de référence.
Les concepts d’études de marché et de gratuité semblent à première vue antinomiques. Les études de marché ont la réputation d’être chères, très chères même...
Alors que se cache t-il derrière ces sites et organismes qui proposent des études de marché gratuites ou très bon marché ? Quel intérêt ces documents peuvent-ils avoir pour la veille et la recherche d’information ?
Derrière le terme « étude de marché » se cachent en réalité de multiples définitions.
Certains lui appliquent une définition très stricte : celle d’une étude longue combinant de manière équilibrée données sectorielles et vision stratégique et prospective d’un marché.
D’autres, au contraire, englobent toute forme de rapports ou d’études courtes ou longues incluant des données de marché.
Et les documents que l’on trouve gratuitement sur le Web relèvent principalement de cette seconde définition.
Depuis plus de 10 ans maintenant, Google a recours à ce qu’il appelle la « recherche personnalisée ».
Concrètement, cela signifie que Google personnalise la liste des résultats naturels de ses utilisateurs en fonction de différents critères : localisation, historique de recherche, historique de navigation ou encore présence et contacts sur les médias sociaux, etc.
Deux personnes effectuant une même requête au même moment n’ont donc pas nécessairement les mêmes résultats.
Et quand on sait que Google n’affiche en réalité pas plus de 200/300 résultats au maximum par requête, même s’il indique à première vue des milliers voire des millions de réponses, on risque vite de passer à côté d’informations et de sources pertinentes...
Lire aussi :
Google évolue, les documentalistes plus utiles que jamais ?
1. Lutter contre l’infobésité en privilégiant une sélectivité des sources;
2. Trouver des solutions pour intégrer les contenus multimédias à sa veille au même titre que les contenus textuels;
3. Tirer parti des évolutions de la traduction automatique pour renforcer sa veille sur des langues autres que l’anglais;
4. Accorder plus d’importance à la fiabilité des sources et informations et être vigilant sur la porosité de la frontière information/publicité;
5. Adapter ses livrables aux attentes et pratiques de son public et non l’inverse;
Twitter est une source d’information incontournable pour la veille et la recherche d’information, notamment pour réaliser sa veille métier.
En effet, on a beau surveiller de multiples sources d’informations, blogs, sites Web, sites de presse, etc., rien ne remplace cette curation humaine souvent réalisée par des experts et des passionnés. C'est une des meilleures méthodes pour découvrir des outils, sources et méthodes passés inaperçus ou non relayés par ses sources d’information traditionnelles.
Le volume d’informations pour réaliser une « veille sur la veille » la plus exhaustive possible est aujourd’hui tel qu’il est plus que jamais nécessaire de tirer parti de l’intelligence collective.
Pour rester un expert et conserver sa valeur ajoutée au sein de l’organisation, on ne peut que conseiller à un professionnels de l’info, si ce n’est pas déjà fait, de suivre au minimum une sélection de comptes Twitter qualifiés.
Ce n’est pas parce que Google a un index gigantesque qu’il donne accès à tous les contenus qui pourraient être utiles à l’internaute. Au contraire, plus les années passent, moins il y a de résultats pour une question ou une requête donnée.
Google est devenu un assistant de recherche qui fournit sur un plateau une sélection de résultats qu’il juge lui-même pertinents. Et il a une assez haute idée de ses capacités et compétences en la matière. Pour faire simple, il sait tout mieux que vous.
Utiliser Google pour des questions simples, factuelles ou pour retrouver un document précis ne présente généralement pas de difficulté majeure. Mais cela se complexifie quand il s’agit d’utiliser Google pour répondre à des questions complexes.
En effet, malgré sa volonté de réussir à répondre à des questions complexes, Google admet qu’il a encore du mal.
Lire aussi :
Google n’est plus un moteur de recherche ni de réponses, mais un assistant virtuel
Le professionnel de l’info face à un Google en perpétuel mouvement
Comment retrouver une ancienne étude interne citée dans la littérature académique ?
Conseil veille du 13 juillet pour des recherches par document dans Google Image
Faut-il préférer l’opérateur site: de Google ou la création d’un moteur CSE ?
Identifier des projets et opportunités commerciales représente un véritable défi. C’est réussir à détecter des projets clairement identifiés et énoncés en tant que tel par l’entreprise commanditaire, mais c’est aussi réussir à capter des signaux beaucoup plus discrets en amont d’un potentiel projet.
Il y a donc la partie émergée de cette démarche qui consiste à détecter des opportunités d’affaires via la surveillance classique des appels d’offres (voir notre article dans ce même numéro « La veille sur les appels d’offres de A à Z »). Et il y a toute la partie immergée et peu visible de projets et opportunités qui ne déboucheront jamais sur un appel d’offres publics (en raison de la nature de l’émetteur, du montant du contrat, etc.) et qu’il faut pourtant réussir à identifier.
Quelle démarche adopter pour identifier ces projets et opportunités d’affaires sur le web ? Quelles sources faut-il connaître et interroger ?
C’est ce que nous aborderons dans cet article.
Et pour illustrer cette démarche, nous prendrons l‘exemple d’une entreprise spécialisée dans la location de bureaux qui souhaite identifier des entreprises souhaitant déménager ou changer de locaux pour leur proposer ses services.
Lire aussi :
Comment surveiller Google Actualités ?
Si la recherche sur les entreprises est souvent associée à l’information financière et légale, on pense moins à aller explorer la question des statistiques douanières, c’est-à-dire les mouvements d’importations et exportations entre pays pour un produit donné.
Et pourtant, on peut en apprendre beaucoup sur ses concurrents, ses fournisseurs ou sur son marché en allant explorer ces données.
Mais ce n’est pas avec Google, pas plus qu’avec des outils de recherche et de veille classiques, que l’on va réussir à obtenir l’information souhaitée.
Dans cet article, nous avons voulu faire le point sur ce type de recherche d’information et de veille très particulières en nous intéressant :
L’opérateur
site:
sur Google est bien connu des professionnels de l’information et permet de rechercher uniquement sur un ou plusieurs sites web bien précis, ce qui en fait une fonctionnalité très précieuse.
La requête veille site:https://www.bases-netsources.com/
par exemple recherchera le terme veille sur les pages du site bases-netsources.com indexées par Google.
Google permet également la création de moteurs personnalisés appelés « Google CSE », pour Custom Search Engine (https://cse.google.com). L’utilisateur peut créer un moteur en entrant les sources qu’il souhaite interroger et peut ensuite créer des requêtes comme sur le moteur classique de Google.
Dans les deux cas, l’internaute recherche donc sur une sélection de sources et non sur l’intégralité du web.
Que l’on utilise l’opérateur site:
ou un moteur CSE avec les mêmes sources, les résultats devraient donc être sensiblement les mêmes. Sauf qu’il n’en est rien…
La recherche et la veille sur les articles de presse est ce qu’il y a de plus classique et de mieux connu. Pourtant, si l’article de presse en tant que tel évolue peu, bien qu’il puisse être enrichi avec des contenus graphiques et multimédia, les outils de recherche, eux, évoluent et se renouvellent régulièrement. Et c’est à eux qui nous allons ici nous intéresser.
Quelles sont les outils et méthodes aujourd’hui disponibles pour rechercher et faire de la veille sur la presse ?
Lire la suite :
Comment surveiller Google Actualités ?
Les newsletters, podcasts, vidéos et streaming télé sont autant de nouveaux formats que les médias traditionnels et les nouveaux médias explorent toujours plus.
Et comme nous l’avons vu dans l’article « La veille «médias»: un champ diversifié et complexe », ces nouveaux formats ne sont pas un simple moyen de multiplier sa diffusion à travers différents canaux répliquant le même contenu. Il s’agit au contraire, de plus en plus, de contenus exclusifs ou complémentaires qui méritent donc d’être intégrés dans un processus de veille et de recherche.
Lire aussi :
Le format RSS est toujours - et plus que jamais - d’une grande utilité pour la veille mais il vous arrive peut-être de ne plus parvenir à détecter facilement la présence des flux sur une page, sur les sites web des sociétés et même sur les sites web de presse. Ils sont en effet devenus beaucoup moins visibles et moins promus - ce qui ne veut pas dire pour autant inexistants - que par le passé. A cela s’ajoute le fait que les outils de détection souffrent d’une certaine instabilité.
Cette méthodologie présente les bonnes pratiques à essayer systématiquement, ainsi qu’une sélection des meilleurs outils de détection en 2021. Elle détaille en outre les points d’attention à vérifier pour garantir l’efficacité de la démarche, et suggère quelques pistes pour identifier de nouveaux outils de détection RSS.
Lire aussi : Quel lecteur de flux RSS choisir en 2020
Il y a quelques semaines, EDF annonçait le lancement de sa plateforme open data (opendata.edf.fr), une bonne nouvelle pour les professionnels de l’information susceptibles de rechercher des informations dans le secteur de l’énergie.
Mais au-delà de l’annonce d’EDF en tant que telle, ce qui est intéressant, c’est que cette nouvelle plateforme est initiée par une entreprise alors qu’on est plus habitué à entendre parler d’open data dans le secteur public. On l’oublierait presque mais les entreprises, elles aussi, peuvent lancer leurs plateformes d’open data et mettre en ligne certains jeux de données, même si on est très loin d’une ouverture des données à très grande échelle.
Rechercher l’information scientifique et technique (qui inclut aussi bien les sciences dites « dures » que les sciences humaines et sociales ») ressemble peu à la recherche dans les domaines business, actualités ou encore juridique.
Le processus de publication scientifique a ses propres codes et spécificités. Et contrairement à d’autres domaines où les moteurs web généralistes comme Google sont souvent d’une aide précieuse pour la recherche, ils sont ici peu efficaces pour arriver au résultat escompté.
La recherche d’information scientifique et technique nécessite de savoir utiliser une combinaison de sources, d’outils spécifiques et des méthodes adaptées.
Lire aussi :
Les nouveaux outils de recommandation pour l’IST
Tour du monde des sites de thèses en accès libre - Dossier spécial
La veille au défi de l’information scientifique et technique
Les brevets et les marques, des outils d'information particuliers et puissants au service de la démarche de recherche et de veille
De la référence bibliographique au texte intégral des articles scientifiques, il n’y a pas toujours qu’un pas
Les résumés automatiques nouvelle génération au service de la veille
Il arrive fréquemment que l’on ne puisse pas se rendre à un événement professionnel aussi intéressant soit-il. Même sans s’y rendre, il est pourtant possible de récupérer une multitude d’informations, ce qui peut s’avérer très riche dans le cadre d’une veille stratégique, concurrentielle, innovation ou encore métier.
La principale difficulté lorsque l’on souhaite récupérer des informations sur une conférence sans s’y rendre, c’est que ces informations autour de l’événement sont éparpillées aux quatre coins du web.
Nous avons exploré dans cet article comment identifier les contenus associés à une conférence et les sources les plus à même de proposer ces contenus.
Lire aussi :
La digitalisation express des événements professionnels booste la veille stratégique, innovation et métier
Comment valoriser les contenus multimédias dans un livrable de veille ?
Comment repérer et identifier des formations et événements professionnels ?
Les outils et moteurs spécialisés sur les conférences, salons, congrès
Les sources et outils de recherche dédiés aux formations
Tirer parti des évènements, salons et congrès pour son sourcing
Le sourcing, c’est à dire l’identification des sources pertinentes est une étape cruciale de la veille et requiert une méthodologie structurée.
Si on intègre généralement les moteurs de recherche et médias sociaux à sa démarche, on ne pense pas nécessairement à utiliser les événements professionnels pour venir enrichir son sourcing. Et c’est bien dommage car les conférences, congrès, salons permettent d’identifier une multitude de sources qualifiées centralisées en un seul et même endroit sans même avoir besoin de s’y rendre physiquement.
Lire aussi :
La digitalisation express des événements professionnels booste la veille stratégique, innovation et métier
Comment valoriser les contenus multimédias dans un livrable de veille ?
Comment repérer et identifier des formations et événements professionnels ?
Les outils et moteurs spécialisés sur les conférences, salons, congrès
Les sources et outils de recherche dédiés aux formations
Voir aussi > Dossier spécial de NETSOURCES n°146 consacré au Sourcing
Les événements professionnels ont un intérêt certain pour la veille stratégique, concurrentielle, scientifique, technique ou innovation mais également pour la veille métier et la mise à jour de ses connaissances.
Pour autant, identifier les événements pertinents pour son activité n’est pas aussi simple car malgré les apparences, il n’existe pas de véritables ressources fédératrices au niveau mondial ou national, pas plus que de d’outil exhaustif sur un secteur d’activité.
Lire aussi :
La digitalisation express des événements professionnels booste la veille stratégique, innovation et métier
Les outils et moteurs spécialisés sur les conférences, salons, congrès
Les sources et outils de recherche dédiés aux formations
Comment suivre et tirer parti d’une conférence sans s’y rendre physiquement ?
Tirer parti des évènements, salons et congrès pour son sourcing
Lancée en 2013, la recherche sur les valeurs numériques est une des valeurs ajoutées, originale, de l’offre du serveur STN qui propose, rappelons-le, un ensemble de banques de données dans le domaine de la littérature scientifique (références bibliographiques) et des brevets (références bibliographiques ou fulltext).
Le nombre de propriétés recherchables jusqu’à présent était de 55 telle que la charge électrique (en Coulomb), la force (en Newton), la fréquence (en Hertz), la masse moléculaire (en g/mol), la pression (en Pascal), etc.
On en trouve la liste en cherchant HELP NPS si l’on est connecté à STNext et plus précisément à une des bases offrant cette possibilité.
Sinon, on trouvera la liste à l’adresse http://www.stn-international.de/en/productsservices/products-services.