20 juin 2024 - Résumé généré par IA à partir de l'article original de Korben (Auto-News – L’agrégateur de news qui vous permet d’éviter le « bruit »)
Perplexity est le seul outil IA positionné comme un moteur de recherche. Il fonctionne avec GPT et son modèle propriétaire (Pplx). Il vient de s’améliorer en permettant de sélectionner son corpus. Cette fonctionnalité, discrète, se cache derrière le bouton « Focus ».
Il propose de filtrer ses recherches par corpus : Academic (en provenance de Semantic Scholar), Wolfram/Alpha (pour l’informatique), YouTube et Reddit, mais aussi par format (image ou vidéo).
C’est un bon moyen pour réduire la marge d’erreur (et donc le niveau d’hallucination) de l’outil et d’améliorer la précision des résultats. Last but not least, cela permet aussi de savoir d’où viennent les sources.
Par exemple, si l’on cherche Hemingway
, puis que l’on choisit « Youtube », six vidéos sont proposées, suivies par une courte biographie (générée) et de trois questions suggérées. À droite, trois autres vidéos sont proposées, ainsi qu’une « Recherche Image » et une « Génération d’image » (accès payant). Pour une recherche filtrée avec des résultats en provenance du forum « Reddit », il nous est aussi proposé une « recherche video ».
Google Podcasts va prochainement disparaître pour être intégré dans YouTube Music. Aussi, sur le moteur Web de Google, l'apparition du filtre "podcast" est complètement aléatoire, ce qui complique la recherche méthodique et rigoureuse de ce précieux support d'informations.
Nous vous conseillons donc de parcourir Kagi Search, qui a consacré un onglet spécial pour les podcasts ! Le crawler va rechercher le mot-clé dans le titre du Podcast, le titre d’un épisode et dans le descriptif de ces derniers.
Pour cela, il suffit de taper son mot-clé dans la barre de recherche, puis de cliquer sur l’onglet « Podcast
» sous la barre de recherche. Les résultats s’affichent tout d’abord sous forme d’une galerie avec visuels des Podcasts, puis une série de podcasts sur le sujet donné.
Résultat : cette recherche permet de belles découvertes, y compris d’épisodes récents (moins de 48 heures), mais elle n’est pas exempte de bugs : des résultats de la galerie renvoient vers des erreurs 404, d’autres manquent de pertinence et peuvent même constituer une perte de temps : une recherche « Macron » renvoie sur quelques chroniques politiques, mais alors que le résultat fait apparaître le titre d’un épisode, le lien nous envoie sur une longue liste d’épisodes… dans laquelle ne figure même pas le titre de l’épisode sur lequel on a cliqué.
Conclusion : une initiative qui vaut le détour, mais qui demande à être encore améliorée. Et pour aller plus loin ne ratez pas notre article complémentaire : Identifier des podcasts pour sa veille
Dans la famille des file-types indexés par Google, il y avait un grand absent qui pouvait être regretté par les professionnels du Search et de l’analyse des données : le format de tableau de données .CSV
Depuis quelques semaines, les fichiers et tableurs Excel (Microsoft), Numbers (Apple) ou les autres logiciels qui produisent du .CSV peuvent donc être retrouvés (sans avoir à faire d’export, par exemple). Ils rejoignent les fichiers texte, image ou vidéo, mais aussi les fichiers de code en python, Java, C++, etc. qui sont déjà indexés par Google.
Avec une commande [filetype:csv]
, vous accédez ainsi aux résultats de recherche au format csv.
Par exemple, dans le cadre d’une recherche sur les matières premières, avec un mot-clé sur le café, la commande « café filetype:csv » donne accès à des exports de données en .CSV, majoritairement issues de l’OpenData.
Source : Barry Schwartz
Pour comparer des indicateurs économiques nationaux de façon simple et rapide, on est de plus en plus tenté de passer par une IA générative de contenu. Problème : le résultat n’est pas fiable et le temps de vérification peut-être très long... On recommandera plutôt le comparateur GlobalEDGE.
Créé par l'International Business Center et l'Eli Broad College of Business de la Michigan State University, GlobalEDGE est un portail Web de connaissances à l’attention des acteurs académiques et économiques et financiers permettant d’accéder au profil économique et sociétal d’un pays mais aussi de comparer les données de plusieurs pays entre elles.
En se basant sur divers indicateurs économiques, commerciaux, d'investissement, énergétiques et démographiques, il est possible de consulter et de comparer les données de 20 pays. Les données, soigneusement sourcées et vérifiées, offrent une clarté face à la complexité des informations disponibles. Par exemple, pour comparer les dépenses éducatives entre la France et l'Espagne, il suffit de choisir une année, un domaine de données, 1 à 5 indicateurs et plusieurs pays dans des menus déroulants, puis de cliquer sur Comparer pour obtenir instantanément un tableau avec les données et les sources correspondantes.
Seuls problèmes : Il lui manque une fonction d’export et également, lorsque l’on sélectionne la date, mieux vaut choisir une date précise que l’option Last available data. En effet, cette dernière n’est pas précisée et il faut donc la revérifier dans la source, ce qui peut vite devenir chronophage !
Avec la fermeture de l’éditeur de newsletter Revue, nombre de professionnels habitués à délivrer une newsletter par un simple export de flux RSS se sont retrouvés démunis. Une solution – ancienne, mais discrète - s’offre à eux : Goodbits.
Pour les prochaines newsletters, le flux RSS s’actualise automatiquement, nul besoin de le réimporter, il suffira de le rafraîchir (Sources > lien du RSS > bouton pour rafraîchir)
Gratuit pour 1 newsletter, envoyée à moins de 100 personnes, puis min. 24 $/mois
Le professionnel de la veille doit bien souvent recourir au système D pour réaliser un sourcing performant des médias européens. Le process souvent fastidieux consiste à consulter des annuaires de presse, Google Actualités, et à interroger à de multiples reprises les moteurs de recherche... Toutefois, il reste un angle mort : les médias indépendants.
L’annuaire fait partie d’un programme international plus vaste, Project Oasis, mené conjointement par l’UNC, une école américaine de journalisme, Google News Initiative, LION Publishers et l’auteur Douglas K. Smith.
Pour aller plus loin : commandez nos Fiches pratiques qui proposent un sourcing médias et presse vérifié sur l'Allemagne, l'Algérie ainsi que sur l'Arabie-Saoudite. Et n'hésitez pas à nous contacter si vous souhaitez un sourcing sur un pays ou sur un thème ciblé.
Sur LinkedIn, une nouvelle fonctionnalité permet désormais de réaliser une veille sur les entreprises sans filtrage algorithmique. Cette fonctionnalité permet ainsi de visionner et suivre l’ensemble des publications des entreprises suivies – et qui plus est de façon anonyme !
Seule contrainte, elle nécessite d’avoir une page Entreprise et/ou d’être détenteur d’un compte Administrateur.
Pour y accéder, aller sur le menu « Outils d’administration », puis sélectionner « Gérer les suivis ». LinkedIn vous demande ensuite d’ajouter des pages à suivre. Après cette sélection, les flux s’affichent au centre de votre page d’accueil, dans l’ordre antéchronologique dans l’onglet « Suivi ».
Source : Bryan Coder
LinkedIn est LE média social incontournable des relations B2B, très prisé pour sa veille prospective. Mais saviez-vous que même sans l’abonnement Sales Navigator, il est possible d’identifier des entreprises et profils déjà sensibilisés à votre offre et se rapprochant de l’acte d’achat grâce aux filtres de LinkedIn?
1- La première étape est donc de trouver le client idéal en lançant une recherche par poste (ex. Responsable veille), puis en filtrant par « Personnes ».
2- La deuxième étape est de cliquer sur « Tous les filtres* » qui ouvre une seconde fenêtre avec des options supplémentaires pour sa recherche qui permet d’identifier les relations du prospect.
3- Enfin, dans ces options avancées, on recommandera notamment de préciser le champ "Abonnés de" en renseignant le nom d'un créateur de contenu / KOL / influenceur connu de son domaine.
Également, le champ « Sujets de prédilection » permet quant à lui spécifier et sélectionner un hashtag. Cela permet dans les deux cas de trouver des prospects qui s’informent sur un sujet proche de son produit/service… … et qui sont donc, à ce titre, déjà « éduqués » à son offre.
* « Tous les filtres » est une option qui diffère à chaque sélection de filtre.
Source : Adeline Lory
Contrairement à la recherche classique, Google ne propose pas de filtre de date personnalisé pour ses recherches sur Google Images. Nous pouvons entrer l’intervalle de dates de son choix en sélectionnant des « périodes », comme « depuis 24 heures » ou « depuis une semaine », mais impossible de personnaliser (pas même dans l’option « recherche avancée »).
Pour contourner cette restriction par défaut et parvenir à nos fins, nous vous conseillons d’utiliser les opérateurs before:AAAA-MM-DD
et after:AAAA-MM-DD
, à la suite de son mot-clé dans la barre de recherche.
Par exemple en entrant : Netsources after:2022-07-31
dans Google Image, on obtiendra tous les visuels correspondant aux publications de Netsources depuis le 31 juillet 2022.
NB : Merci à @henkvaness pour son partage ! Nous avons simplifié ses opérateurs en supprimant les parenthèses et crochets et cela fonctionne tout aussi bien !
Depuis l’avènement de Chat GPT, quelques outils gratuits permettent désormais de détecter si un contenu a été écrit avec la fameuse IA. Un contre pouvoir bienvenu qui permet d’encadrer les pratiques.
Le détecteur le plus performant à ce jour est ChatGPT Detector, créé par une entreprise franco-canadienne, Draft & Goal. Il est (de loin !) le plus fiable pour du contenu en français et en anglais. L’entreprise annonce un taux de réussite de 93 % sur plus de 2000 tests effectués et notre expérience le confirme (à titre de comparaison, l’outil de détection d’OpenAI, AI Text Classifier, n’est fiable, de leur propre aveu, qu’à 26 %).
Le fonctionnement de ChatGPT Detector est extrêmement simple : on accède à cet outil sans inscription, puis on y copie-colle le texte que l’on souhaite analyser. L’outil livre son résultat sous forme de pourcentage de 0 à 100 % de probabilité que le document ait été produit via une intelligence artificielle.
En outre, chaque itération permet d’améliorer l’intelligence de l’outil face à un document.
La recherche sur Telegram est éminemment complexe et il est nécessaire de passer par des outils et index externes pour trouver des informations ou des serveurs / groupes de discussion thématiques.
Nous vous recommandons Telegago, un moteur de recherche CSE, powered par Google, qui propose une sélection de canaux de discussion Telegram pertinents en fonction de votre recherche par mot-clé. Il est conseillé de traduire au préalable ses mots-clés et de réitérer son interrogation au besoin car, bien qu’il soit proposé par Google, il ne cherchera pas votre terme dans une autre langue que celle renseignée.
Telegago, a le mérite de compiler les résultats de plusieurs sites-catalogues et autres Telegram search engine, ce qui lui permet d’être l’un des plus complet du web. Il interroge notamment Tgstat, Telegramindex ou encore le catalogue de Telemetr.
Les résultats sont classés par catégories : Web (avec 8 sous-catégories, dont Telegraph (la plateforme de blogs anonymes), Contacts (recherche dans les descriptifs des profils), Public (comptes officiels, médias…), Bots et Chats vocaux.
Astuce bonus : Pour effectuer une recherche uniquement pour les chats, ajoutez inurl:chat
à la requête de recherche. Vous pouvez l’utiliser sur votre ordinateur, mais aussi dans l’appli mobile Telegram.
Exporter ses résultats de recherche peut être utile pour identifier ou analyser un corpus. Le MediaLab de Sciences Po a conçu 2 « Google Bookmarklets » pour exporter ses résultats en fichier .csv.
1. Rendez-vous à cette adresse https://medialab.github.io/google-bookmarklets/
2. Glissez les deux icônes dans la barre de favoris du navigateur pour installer les deux boutons. Rappel : pour afficher votre barre de favoris : Ctrl+Maj+B
ou dans les options de vos favoris.
3. Effectuez votre recherche sur Google.
4. La première icône « Switch to Classic Google » permet de définir les modalités d’extraction : nombres de résultats et langage. Cliquez sur le bouton ‘Redirect Me’ pour valider votre configuration.
5. La seconde icône « Extract Google Results Page » qui, comme son nom l’indique, exportera les résultats dans le fichier csv correspondant. Si vous souhaitez décharger plusieurs pages de résultats, il faudra alors cliquer sur le bouton « Keep Existing Results & continue to the next page ». Cette option agrègera au fur et à mesure les résultats. Quand vous avez suffisamment de données, cliquez sur le bouton « Download Complete csv».
Une fois téléchargé, le fichier csv peut nécessiter quelques manipulations complémentaires pour réattribuer les cellules à des champs. Une ultime étape un peu fastidieuse mais un moindre mal compte tenu de l’opportunité que cela représente !
PubMed, moteur académique spécialisé dans le biomédical, vient d’ajouter une nouvelle fonctionnalité à son moteur de recherche qui permet aux utilisateurs de déterminer le nombre de mots maximum entre deux termes. Dans un contexte où les fonctionnalités de recherche sophistiquées tendent à disparaître, il est très appréciable de voir un moteur qui en réintroduit pour nous permettre de mieux cibler nos recherches sans être trop restrictif !
Exemple : pour rechercher le terme hip à deux mots maximum du terme pain, on écrira la requête suivante : "hip pain"[Title/Abstract:~2]
Les termes à rechercher à proximité sont à mettre entre guillemets, les champs où les mots clés doivent apparaître entre crochets comme par exemple [Title/Abstract]
et le tilde suivi d’un chiffre ~N
correspond au nombre maximum de mots entre les termes de recherche.
Dans notre exemple, cela permet de retrouver des documents citant « Hip related pain » ou « pain in right hip ».
Pour importer vos contacts Twitter sur un serveur Mastodon, nous recommandons d’utiliser Debirdify. Cet outil ira chercher vos contacts Twitter qui auront préalablement spécifié une adresse dans le Fediverse dans leur profil.
Tout d’abord lui autoriser l’accès à votre compte Twitter, puis cliquer sur l’option désirée : « personnes qui vous suivent », « personnes que vous suivez », ou même dans vos « listes ». Et de relancer une recherche à chaque option. Chaque liste, assortie de statistiques, est fournie sous forme d’un fichier .csv à importer dans Mastodon.
Debirdify détecte même les liens raccourcis dans les profils !
Nous avons également testé Twitodon mais il propose moins d’options et est moins efficace. Nous ne le recommandons pas.
Pour importer vos contacts Twitter sur un serveur Mastodon, nous recommandons d’utiliser Debirdify. Cet outil ira chercher vos contacts Twitter qui auront préalablement spécifié une adresse dans le Fediverse dans leur profil.
Tout d’abord lui autoriser l’accès à votre compte Twitter, puis cliquer sur l’option désirée : « personnes qui vous suivent », « personnes que vous suivez », ou même dans vos « listes ». Et de relancer une recherche à chaque option.
Chaque liste, assortie de statistiques, est fournie sous forme d’un fichier .csv
à importer dans Mastodon.
Debirdify détecte même les liens raccourcis dans les profils !
Nous avons également testé Twitodon mais il propose moins d’options et est moins efficace. Nous ne le recommandons pas.
En opposant Mastodon et Twitter, l’actualité a mis en avant un univers parallèle à celui des réseaux sociaux, et décentralisé sur plusieurs serveurs et open source : le Fediverse.
Ici, chaque « galaxie », dont Mastodon, correspond à un réseau social (Twitter, Instagram…). Et chacune d'entre elles est donc composée d’étoiles : les « serveurs » (quelque 7700 pour Mastodon).
Choisir un serveur est déterminant dans son expérience future du réseau. Outre la langue et le thème de discussion utilisés, il est important de vérifier si son serveur communique avec d’autres.
Pour cela, nous vous recommandons d’utiliser Fediverse.space, outil de visualisation en ligne des serveurs, bien plus efficace que la liste proposée par Mastodon, dont le moteur de recherche n’est pas efficace.
Créez d'abord votre propre requête à partir du modèle suivant : https://legifrss.org/latest? en spécifiant le type de décision (arrêté, décret,... attention l'opérateur loi ne fonctionne pas ! ) souhaitée avec l'opérateur nature=
, l'autorité de contrôle (ministère, commission,...) ciblée, et le fameux q=
pour indiquer le mot clé surveillé, en les croisant entre eux bien sûr avec l'opérateur &
. La requête permet ensuite de créer son propre fil RSS à visualiser via son lecture de flux. Retrouvez l'ensemble des opérateurs disponibles via ce lien.
Exemples :
Source : @precisement / CC @L_DiCarlo
Découvrez Bookmarkify, une extension gratuite qui permet de surligner les passages clés d’une page web et ainsi créer des signets à l’intérieur de cette même page. Les signets enregistrés ne disparaitront pas et vous pourrez retrouver les éléments en un clic même après que la page ait été fermée.
Pour aller plus loin, cette extension est à compléter avec d’autres outils gratuits qui permettent notamment l’insertion de notes et commentaires sur ces pages. On citera Liner, Outline, Beanote, Weava ou encore Hypothesis qui vous aideront à transformer une page web en environnement de travail structuré, optimisé et annoté.
Source : Outilstice
Votre sujet génère beaucoup de bruit ? Transformez Twitter en mini moteur Google Actualités pour y voir plus clair.
Dans l'espace de recherche avancé de Twitter, l'opérateur filter:news
, associé à vos mots-clés, vous permet d'atteindre directement des sites reconnus : grands médias, comptes influents, etc.
Exemple : filter:news "baby formula"
Une bonne façon de lutter contre l'infobésité !
Source : @OsintJobs
Les sites web évoluent ou disparaissent, impactant directement les liens ulrs associés (1 an après leur création, 20% des liens web se cassent ou deviennent inaccessibles) et fatalement, cela se répercute dans vos livrables de veille...
WebtoPDF est un outil en ligne gratuit qui permet de convertir des pages web en fichiers PDF.
Il se débarrasse également des contenus inutiles comme les pubs pour obtenir un rendu propre.
Vous souhaitez suivre le lancement d'une marque dans un pays précis, retrouver un objet ou une espèce endémique ou encore confirmer qu'une photo d'usine a bien été faite dans tel pays ? Complétez votre stratégie de recherche inversée avec le petit opérateur site:
suivi du code iso du pays cible. Cela permettra de délimiter votre périmètre de recherche.
Mode d'emploi : Importez votre image ou renseignez lien url puis lancez la recherche. Une fois les résultats de recherche obtenus, affinez votre recherche avec l'opérateur site: code ISO
et relancez à nouveau votre stratégie.
La Bibliothèque de Science Po a ouvert 130 listes thématiques Twitter au public. Une vraie aubaine pour les veilleurs qui pourront saisir cette opportunité pour étoffer leur sourcing . Parmi les sujets traités dans ces listes, on citera : Economie Numérique, Histoire de l'art, Energie, Ukraine, Infos-Afrique, Ressources Naturelles, Think Tank etc...
On pensera à aller explorer les sources web correspondantes pour les intégrer à son dispositif de veille quel qu'il soit.
Pour consulter la liste de listes : https://twitter.com/ScPoBibli/lists
Courant 2020, Twitter abandonnait la fonctionnalité de recherche sur les Listes thématiques....Dommage.
Ces listes Twitter restent d’excellents viviers informationnels, alors comment les atteindre dorénavant ?
Serge Courrier et Vera Lucia nous partagent leurs astuces pour trouver ces listes thématiques.
En passant par Google Chrome, entrez simplement les requêtes suivantes en modifiant le mot-clé avec vos sujets d'intérêt (ici par ex : climat et smart city, respectivement dans le titre ou l'url)
site:https://twitter.com/*/lists/* intitle:climate
site:twitter.com inurl:lists «smart city»
Discord est une plateforme de discussion gratuite. Elle permet de créer des serveurs privés mais aussi de rejoindre des serveurs publics thématiques sur des sujets de veille (finance, NFT...) ou encore sur l'OSINT. Cependant, il est difficile de trouver LE serveur rassemblant LA communauté de vos pairs ou traitant de vos sujets d'intérêt.
La solution pour découvrir : Disboard, l'outil gratuit qui répertorie les serveurs accessibles publiquement. Grâce à son interface de recherche, renseignez votre sujet et découvrez les serveurs les plus pertinents. Ainsi en recherchant "OSINT
", Disboard nous donne 6 serveurs avec une petite description pour tous, proposant des challenges de hacking gratuits pour identifier des experts, des astuces et conseils ainsi qu'un espace d'échange en direct.
La solution pour être exhaustif : Serverse qui va interroger les plus grands moteurs de recherche sur Discord. En recherchant OSINT
on atteint plus d'une vingtaine de serveurs. Encore faut-il évaluer leur pertinence manuellement.
Source : Pour Serverse via Serge Courrier
Certes, TikTok est encore stigmatisé par sa réputation de plateforme de divertissement... Néanmoins son contenu est en train de changer et d'intéresser les entreprises ! Vous y trouverez de plus en plus de contenus informatifs parfois exclusif, sur sur les sociétés : innovation, vidéos d'ateliers, présentation d'équipes etc...
Nous vous conseillons de tester l'outil gratuit Tikrank, qui permet de télécharger simplement du contenu TikTok, comparer plusieurs comptes entre eux selon divers critères : le nombre d'abonnés, la croissance de leur base de followers, les vidéos les plus regardées ou encore, il propose directement des classement des Top influenceurs par pays (US, Cambodge, Inde, Pakistan, Thailande...). Idéal pour enrichir vos livrables de veille et introduire cette plateforme dans votre dispositif de surveillance réseaux sociaux.
Voir aussi l'article : Réseaux Sociaux atypiques : nouvelle opportunité pour le veilleur
Benjamin Azoulay et Benoît de Courson lancent un nouvel outil de lexicométrie nommé Gallicagram.
Sensiblement similaire à Google Ngram Viewer, le Gallicagram offre un moyen de quantifier la présence/ le nombre d'occurrences d'un ou plusieurs termes en tirant profit de la base de données d'archives de presse française de Gallica. Ce logiciel permet de générer des graphiques interactifs à partir d'une simple barre de recherche tout en maîtrisant le corpus de d'étude, la période et surtout, l'outil permet d'accéder aux documents qui remontent via votre recherche, contrairement à Google Ngram.
Via @Mart1oeil | Sources : https://osf.io/preprints/socarxiv/84bf3/
L’extension, G Map Extractor vous permettra d’extraire les données de vos recherches sur Google Maps sans encombre.
Pour compléter un annuaire de contacts ou construire un listing d’adresses postales, cet outil de scraping est capable, à partir des résultats de recherche sur Google Maps, de générer un fichier CSV téléchargeable comprenant le nom d'un établissement ou d'une société cible, son adresse, le code postal, le téléphone, le site web ainsi que les coordonnées GPS.
Source : Korben.info
Après avoir visionné un webinar d’1h30 sur YouTube, vous souhaitez transmettre un passage clé à vos collaborateurs ? Lors d’une conférence d’expert vous désirer intégrer le bon extrait vidéo dans votre livrable ? Il vous faudra créer un lien personnalisé.
Sur YouTube, en plaçant votre curseur au bon moment de la "timeline" de votre vidéo puis de cliquer sur le bouton Partager. Une petite boite de dialogue s'ouvrira, dans laquelle vous cochez l’option « Démarrer à » afin que YouTube génère un lien personnalisé prêt à être copié. Astuce déjà connue par certains mais un rappel nécessaire selon nous !
Tout le monde ne souhaite pas nécessairement créer un compte sur tous les réseaux sociaux pour pouvoir faire sa veille.
Le site Maketecheasier vient de publier un article récapitulatif (By Alexandra Arici) vous donnant les outils et astuces pour naviguer à travers le contenu de Twitter, Instagram (dont le format story !), Facebook, Tiktok et Reddit et cela, sans vous inscrire. Un véritable recueil d’outils et extensions à garder comme mémo pour faciliter l’interrogation de ces réseaux sociaux tout en restant anonyme.
Via Serge Courrier