Depuis son lancement officiel fin 2023, Mistral AI s’est imposé comme l’un des acteurs incontournables de l’intelligence artificielle générative en Europe. Fondée par trois anciens chercheurs de Meta et de Google DeepMind, cette startup française a rapidement levé plus de 600 millions d’euros, atteignant une valorisation de 6 milliards d’euros en moins d’un an d’existence.
Si Mistral AI est souvent présentée comme le champion français de l’IA, sa stratégie et ses ambitions dépassent largement les frontières hexagonales. Dans cet article, nous examinerons le positionnement de Mistral face aux géants américains, nous analyserons les fonctionnalités phares de son application Le Chat, et nous tenterons de comprendre l’attrait de ses modèles au-delà des utilisateurs francophones.
Une réponse européenne aux géants américains ?
« En IA, nous pouvons rivaliser avec Google ou OpenAI », affirmait Arthur Mensch, CEO de Mistral AI, dans une interview avec Le Monde. Cette déclaration résume l’ambition affichée par la startup face aux géants américains qui dominent actuellement le marché de l’IA générative, à savoir OpenAI (ChatGPT), Anthropic (Claude) ou encore les solutions de Google (Gemini), Meta (Llama) et xAI (Grok).
Face à cette hégémonie, Mistral AI propose une alternative européenne avec une offre différenciée, notamment par son approche « open-weight ». Cette approche « open-weight » s’inscrit dans le mouvement de l’open source, mais se limite à rendre publics les paramètres des modèles d’IA (plutôt que le code source complet). Cela permet l’utilisation de ces modèles et leur modification par la communauté des développeurs sans nécessairement révéler tous les détails de l’entraînement. Cette approche est devenue l’une des marques de fabrique de l’entreprise. Dans une interview avec Xavier Niel sur France Inter, Arthur Mensch comparait d’ailleurs Mistral au « Deepseek français », faisant écho à cette entreprise chinoise également reconnue pour sa publication de modèles IA performants en accès libre.
L’un des atouts principaux de Mistral est l’efficacité de ses modèles d’IA. Contrairement à la tendance qui consiste à créer des modèles toujours plus grands, Mistral privilégie des modèles plus compacts et optimisés. Cette approche permet non seulement d’accélérer la génération des réponses, mais aussi de réduire les besoins en puissance de calcul des modèles et, ainsi, de réduire leur empreinte écologique.
Une stratégie de modèles IA multilingues
Alors que la plupart des modèles d’IA générative sont principalement conçus pour fournir des performances élevées en anglais, Mistral a fait du multilinguisme l’un de ses avantages compétitifs. L’évaluation des modèles Mixtral 8x7B et Mistral 7B le confirme : selon une étude publiée sur arXiv, ces modèles affichent l’un des meilleurs scores de fidélité linguistique parmi les modèles open source (benchmark MultiQ). De plus, les plus petits modèles de la startup, surnommés « Les Ministraux », surpassent ceux de Meta et Google en français, allemand et espagnol, à taille équivalente.
Avec l’annonce de Mixtral (décembre 2023), l’entreprise améliore les performances dans plusieurs langues européennes, notamment le français, l’espagnol, l’italien et l’allemand. Cette stratégie multilingue semble au cœur de la stratégie de Mistral.
Une illustration récente de cette stratégie est le lancement de « Saba », un modèle IA spécifiquement conçu pour améliorer les performances en langues du Moyen-Orient et d’Asie du Sud. Entraîné sur des ensembles de données méticuleusement sélectionnés, Saba fournit des réponses plus précises et pertinentes en arabe et en langues d’origine indienne que des modèles cinq fois plus grands, tout en étant significativement plus rapide et moins coûteux.
Au-delà de l’entraînement de modèles sur des corpus non anglophones et de la création de modèles spécialisés « régionaux », Mistral adopte une nouvelle approche : l’intégration de sources d’information externes, illustrée par son partenariat avec l’Agence France-Presse. Les modèles Mistral peuvent désormais citer directement les dépêches AFP comme sources vérifiées dans ses réponses. En allant au-delà de la simple génération de texte, Mistral fait un premier pas vers une stratégie d’agrégation de contenus externes, ouvrant peut-être la voie à un modèle plus respectueux de la propriété intellectuelle.