Critique de Microsoft : GPT et Claude collaborent pour réviser les réponses de l'IA

Microsoft présente Critique, une fonctionnalité pour son outil Copilot Researcher. Son mécanisme repose sur la collaboration entre deux modèles d'IA : GPT d'OpenAI génère une réponse initiale et Claude d'Anthropic agit comme réviseur critique. Ce processus de double vérification interne vise à élever la précision du résultat final, obtenant une amélioration de 13,8 % dans les tâches de recherche approfondie.

Deux assistants IA, l'un générant du contenu et l'autre le révisant de manière critique, sur un document avec des graphiques d'amélioration de la précision.

L'architecture d'orchestration de modèles multiples 🤖

La fonctionnalité s'inscrit dans une stratégie technique d'orchestration, où différents modèles d'IA spécialisés travaillent en séquence ou en parallèle. Critique utilise un flux en série : un modèle produit et un autre évalue. À ses côtés, Council permet de comparer les sorties de plusieurs modèles à la fois. Cette approche réduit la dépendance à un fournisseur unique et atténue les erreurs systématiques, visant une plus grande fiabilité dans les tâches complexes.

L'IA se met en réunion d'équipe pour ne pas se tromper 😅

On dirait que les IA ont adopté la culture d'entreprise des révisions interminables. Désormais, GPT ne peut pas envoyer un rapport sans que Claude ne lui renvoie le document couvert de commentaires en rouge. C'est le classique laisse-moi le voir avant que ça parte. Au final, l'utilisateur reçoit un travail plus soigné, mais on se demande si la prochaine étape sera que les modèles se mettent à débattre dans un canal Slack sur la meilleure façon de citer une source.