Annoncé l’été dernier par OpenAI sous forme de prototype, le moteur de recherche SearchGPT a été lancé en novembre pour les utilisateurs de la version premium et est depuis le 17 décembre accessible gratuitement à tous.
Au-delà d’un moteur de recherche classique, SearchGPT allie les capacités de génération de texte et de recherche contextuelle du modèle de langage d’OpenAI pour offrir une nouvelle expérience de la recherche d’informations.
OpenAI renforce ainsi sa concurrence directe non seulement avec des services de recherche basés sur l’IA comme Perplexity ou You.com, mais aussi avec les géants du Search en ligne que sont les moteurs Google ou Microsoft Bing Copilot. Doit-on en attendre une transformation radicale du paysage des outils de recherche ? Ou bien s’agit-il d’une tentative de la part d’OpenAI destinée à capter une part du marché lucratif de la recherche web, en « disruptant » le modèle économique ?
SearchGPT est une extension de l’intelligence artificielle conversationnelle GPT, spécifiquement optimisée pour la recherche d’informations. Contrairement à un moteur de recherche classique qui restitue des résultats sous forme de liste de liens vers des pages web, SearchGPT combine les capacités d’analyse contextuelle, de synthèse et d’interaction conversationnelle du modèle de langage GPT, en les adaptant à la recherche web.
Concrètement, le moteur est basé sur la technologie de génération augmentée de récupération (Retrieval Augmented Generation, ou RAG). Cette technologie RAG se retrouve dans de nombreux moteurs de recherche basés sur l’IA, comme Perplexity par exemple, de façon à obtenir des réponses précises et contextualisées à partir d’un corpus défini, en réduisant ainsi les risques d’erreur ou d’hallucinations.
Cette approche combine les capacités des modèles de langage génératifs avec l’accès à des données web en temps réel, permettant à SearchGPT de fournir des réponses en s’appuyant sur une sélection de sources web. OpenAI n’est guère transparent sur les modalités d’accès au web de son crawler, et plusieurs informations contradictoires circulent. On peut estimer qu’une partie des données provient de l’index du moteur Bing, grâce au partenariat historique entre OpenAI et Microsoft. Mais SearchGPT exploite également son propre robot d’exploration, l’« OAI-SearchBot », développé par OpenAI pour parcourir et indexer des pages web. Le moteur passerait de plus par des API spécialisées vers des sources spécifiques (par exemple, des bases de données ouvertes).
L’usage de SearchGPT est désormais, depuis le 17 décembre, accessible à tout utilisateur de la version gratuite de ChatGPT.
L’accès à la recherche web se matérialise sous la forme d’une icône en forme de mappemonde dans l’interface du robot conversationnel :
La recherche s’effectue en langage naturel, sous forme de prompt. Grâce au modèle de langage GPT, le moteur convertit le prompt en vecteurs numériques, de façon à activer ses mécanismes d’attention et à « comprendre » le contexte et la sémantique des mots présents dans le prompt, ainsi que l’intention de l’utilisateur. Le moteur interroge ensuite son index (composé comme mentionné plus haut des index de plusieurs crawlers web, et d’accès directs à des sources d’informations) pour identifier des contenus pertinents répondant à la requête.
C’est dans la génération de la réponse que SearchGPT se démarque le plus des moteurs web classiques : la réponse consiste en effet en une synthèse de plusieurs résultats trouvés par le moteur, et générée par le modèle de langage GPT.
Déjà abonné ? Connectez-vous...