Les professionnels de l’information ont largement dépassé le stade des benchmarks. Ils évaluent aujourd’hui les LLMs de manière plus intuitive : cohérence sur la durée, sensation de neutralité, fiabilité perçue, absence de bizarreries récurrentes. Pourtant, trois phénomènes structurels influencent fortement la qualité réelle des réponses, sans être visibles à l’œil nu.
Ces angles morts prolongent la réflexion engagée dans notre précédent article sur l’alignement éthique : aux règles explicites imposées aux modèles s’ajoutent des forces plus profondes, économiques, internes et héritées.
Lire aussi : LLM : l’alignement éthique, le critère qu’on oublie d’évaluer – BASES nᵒ 444 (en accès libre)
OpenAI a lancé sa régie publicitaire en février 2026, d’abord aux États-Unis, et a rapidement généré plus de 100 millions de dollars de revenus annualisés, avec des projections de plusieurs milliards par an, malgré des pertes attendues de 14 milliards cette année.
Impact concret : dans une réponse conversationnelle, il n’existe aucune séparation claire entre contenu neutre et contenu influencé : la recommandation publicitaire est fondue dans le texte, sans label détachable.
Le précédent Google Search est parlant : perçu à l’origine comme un outil de classement neutre, il a progressivement intégré la publicité jusqu’à rendre difficile la distinction entre résultats sponsorisés et organiques. Avec les LLMs, le risque est identique, mais plus insidieux.
À l’opposé, Anthropic a affirmé publiquement que Claude resterait sans publicité, en en faisant le thème de sa première campagne Super Bowl. Perplexity confirme la viabilité économique de ce choix : 500 millions de dollars d’ARR (chiffre d’affaires annuel récurrent) avec un abonnement professionnel à 200 $/mois, sans publicité. Il semblerait qu'il n'y ait pas non plus de publicité dans l'abonnement Pro à 20 $/mois.
En avril 2026, l’équipe d’interprétabilité d’Anthropic a identifié 171 vecteurs émotionnels internes dans Claude Sonnet 4.5.
Un vecteur émotionnel est un schéma d’activation mesurable dans les couches du réseau de neurones, associé à un concept précis : «calme», «désespoir», «défiance». Ces vecteurs sont mesurables par les équipes de recherche via l’analyse interne des activations du modèle, mais pas par l’utilisateur ordinaire. En revanche, c’est bien le contexte de la conversation qui les active : chaque mot, chaque ton du prompt guide involontairement le modèle vers un état interne particulier, comme l’humeur d’une personne influencée par l’ambiance.
Déjà abonné ? Connectez-vous...
