Découvrez Sakana Fugu, son orchestration multi-agents, ses versions Fugu et Fugu Ultra, ses performances, son API et ses différences avec Claude, GPT et Gemini.
Sakana Fugu est un système d’intelligence artificielle multi-agents développé par le laboratoire japonais Sakana AI. Plutôt que de s’appuyer sur un seul grand modèle de langage, il sélectionne et coordonne plusieurs modèles spécialisés pour résoudre une tâche derrière une interface unique.
Présenté publiquement le 22 juin 2026, Fugu vise notamment la programmation, le raisonnement complexe, la recherche scientifique et les questions exigeant plusieurs étapes de vérification. Il se distingue de Claude, GPT ou Gemini par sa fonction principale : il ne constitue pas seulement un modèle supplémentaire, mais une couche d’orchestration capable d’utiliser différents agents.¹

Sakana Fugu est une famille de modèles orchestrateurs proposée par Sakana AI, un laboratoire de recherche en intelligence artificielle installé à Tokyo.
Le mot fugu désigne également le célèbre poisson-globe japonais. Dans le contexte de cet article, il ne s’agit toutefois pas du poisson, mais d’un multi-agent AI system commercialisé sous forme d’API.
Fugu reçoit une requête comme un modèle classique. En arrière-plan, il peut cependant :
Pour l’utilisateur, cette orchestration reste largement invisible. Il envoie une seule requête et reçoit une réponse finale, sans avoir à gérer lui-même plusieurs fournisseurs, clés API ou chaînes d’agents.
ÉlémentFonction dans Sakana Fugu🧠 Modèle orchestrateurAnalyse la demande et choisit une stratégie🧩 Agents spécialisésRésolvent différentes parties du problème🔀 Routage dynamiqueSélectionne les modèles selon la tâche💬 Communication inter-agentsOrganise le partage d’informations✅ VérificationContrôle ou critique les solutions intermédiaires📝 Synthèse finaleProduit une réponse unique pour l’utilisateur
Cette approche est parfois présentée comme un mixture-of-agents framework, par analogie avec les architectures dites mixture of experts. La différence est que Fugu coordonne des modèles complets accessibles comme agents, au lieu de seulement activer des sous-réseaux internes à un modèle unique.

Fugu est lui-même un modèle de langage entraîné pour comprendre une demande et construire une organisation d’agents adaptée à cette demande.
Il ne repose donc pas uniquement sur une liste de règles écrites manuellement. Le système apprend à décider quel modèle solliciter, dans quel ordre et avec quelles instructions.
Dans une utilisation simplifiée, le fonctionnement peut être résumé en cinq étapes :
Pour une question simple, cette organisation peut rester légère. Pour un problème complexe, Fugu Ultra peut coordonner jusqu’à trois agents et produire un processus plus long.
Cette adaptive task delegation évite d’utiliser systématiquement le dispositif le plus coûteux. Le nombre d’agents et le niveau de raisonnement peuvent varier selon la difficulté détectée.
Sakana Fugu s’appuie sur deux travaux de recherche présentés à l’ICLR 2026 : TRINITY et Conductor. Le produit commercial va plus loin que ces prototypes, mais ils permettent d’en comprendre les principes fondamentaux.²
TRINITY utilise un petit modèle coordinateur associé à une tête de sélection très légère.
À chaque étape, le coordinateur choisit un modèle et lui attribue l’un des trois rôles suivants :
RôleMission💭 ThinkerDécomposer le problème et proposer une stratégie🛠️ WorkerExécuter concrètement une partie du travail🔍 VerifierContrôler l’exactitude et la complétude du résultat
Le processus peut s’étendre sur plusieurs tours. Un premier agent élabore un plan, un deuxième réalise les calculs ou écrit le code, puis un troisième vérifie la solution.
Le coordinateur de TRINITY a notamment été optimisé avec une stratégie évolutionnaire appelée sep-CMA-ES. Cette méthode teste différentes politiques de coordination, évalue leurs résultats, puis conserve et combine les stratégies les plus efficaces.
Il s’agit donc d’une forme d’evolutionary optimization appliquée non pas directement au contenu des réponses, mais à la manière d’organiser les modèles.
Conductor adopte une approche plus ouverte.
Au lieu de sélectionner uniquement un modèle et un rôle à chaque tour, il génère un véritable workflow multi-agents en langage naturel. Il peut définir :
Conductor est entraîné par apprentissage par renforcement afin de découvrir des stratégies de collaboration performantes.
Cette architecture constitue une partie importante de Fugu Ultra, qui doit pouvoir traiter des workflows plus longs, utiliser des outils et maintenir une mémoire partagée entre plusieurs agents.
Au moment de son lancement public, Sakana AI propose deux modèles : Fugu et Fugu Ultra.
Pendant la phase bêta, la première version était appelée Fugu Mini. Elle a été renommée simplement Fugu lors de la commercialisation.
Critère🐟 Fugu🐡 Fugu UltraObjectifÉquilibre entre qualité et rapiditéQualité maximaleNombre d’agentsRoutage adaptatif, souvent plus légerUn à trois agents selon le problèmeLatencePlus faiblePotentiellement élevéeCoûtVariable selon le pool de modèlesTarification fixe par jetonsCas d’usageProgrammation quotidienne, chatbot, analyseRecherche, cybersécurité, problèmes complexesPool personnalisableOui, certains fournisseurs peuvent être exclusNon, pool complet imposéEffort de raisonnementhigh ou xhighhigh ou xhighModèle recommandé par défautOuiSeulement lorsque la profondeur est prioritaire
Fugu est conçu comme le modèle par défaut pour les usages interactifs.
Il est adapté à la programmation, à la revue de code, aux assistants conversationnels et aux analyses pour lesquelles le délai de réponse reste important.
Fugu Ultra privilégie la profondeur et la qualité, au prix d’une latence et d’un coût potentiellement supérieurs.
Sakana AI cite notamment :
Fugu Ultra n’est donc pas nécessaire pour chaque requête. Son intérêt apparaît surtout lorsque le coût d’une réponse médiocre dépasse celui d’un raisonnement plus long.
Fugu peut être interrogé comme un modèle classique, mais sa nature est différente.
Claude, les modèles GPT et Gemini sont principalement des modèles de fondation développés par un fournisseur. Fugu agit comme un modèle orchestrateur au-dessus d’un ensemble de modèles et d’agents.
CritèreSakana FuguClaude, GPT ou Gemini utilisés seuls🏗️ ArchitectureOrchestrateur multi-agentsModèle de fondation principal🔀 Sélection dynamiqueOuiNon, le modèle est choisi avant l’appel🤝 CollaborationPlusieurs agents possiblesUn seul modèle par appel standard📝 RésultatSynthèse des agentsRéponse directe du modèle🔑 IntégrationAPI compatible OpenAIAPI propre au fournisseur👁️ Transparence du routageLimitéeLe modèle appelé est connu⏱️ LatenceVariable et parfois importanteGénéralement plus prévisible💰 CoûtDépend de l’orchestrationDépend directement du modèle choisi
Fugu ne remplace donc pas nécessairement Claude, GPT ou Gemini. Il peut les utiliser comme composants de son propre système.
La comparaison la plus juste n’est pas « Fugu contre Claude », mais plutôt :
Faut-il sélectionner soi-même un modèle ou confier cette sélection et cette coordination à Fugu ?
Un routeur classique analyse une requête, sélectionne un modèle, puis lui transmet la tâche.
Fugu cherche à aller plus loin. Il peut organiser plusieurs interventions, attribuer différents rôles et adapter le workflow en fonction des réponses intermédiaires.
ApprocheFonctionnement➡️ Routeur simpleChoisit un modèle pour toute la requête🗳️ Vote majoritaireEnvoie la question à plusieurs modèles et retient la majorité🧪 Mixture of Agents classiqueGénère plusieurs réponses puis les agrège🐡 Sakana FuguConstruit dynamiquement un processus de collaboration
Dans certaines situations, le système peut solliciter un agent pour élaborer une stratégie, un autre pour la mettre en œuvre et un dernier pour rechercher les erreurs.
Ce multi-step reasoning synthesis représente le principal facteur différenciant de Fugu.
Fugu est principalement destiné aux problèmes pour lesquels les modèles présentent des forces complémentaires.
Fugu peut être intégré à Codex ou à un autre environnement compatible avec les API OpenAI.
Ses usages comprennent :
Le système a été entraîné sur des trajectoires issues d’environnements comme Claude Code, Codex et OpenCode. Ces trajectoires incluent l’utilisation d’outils, les retours d’exécution et les modifications successives de fichiers.
Fugu peut mobiliser différents modèles selon que le problème nécessite des connaissances scientifiques, des calculs, une compréhension graphique ou une vérification logique.
Cette spécialisation dynamique est particulièrement intéressante pour les questions multidisciplinaires qu’un modèle unique pourrait traiter de manière inégale.
Fugu Ultra est destiné aux travaux comportant plusieurs phases :
L’API Responses permet également d’activer un outil de recherche Web intégré.
Sakana AI présente plusieurs expériences dans lesquelles Fugu Ultra pilote des processus d’optimisation sur une longue durée.
Le modèle peut proposer une modification, lancer une expérience, analyser son résultat et décider de conserver ou d’abandonner la piste.
Le rapport technique évalue également Fugu sur des problèmes de génération de modèles CAO, de programmation compétitive, d’interprétation de documents anciens et de raisonnement sur de longs contextes.
Ces exemples montrent surtout sa capacité à adapter la composition de ses agents à des domaines très différents.
Sakana AI rapporte des résultats élevés sur plusieurs benchmarks de programmation, de science et de raisonnement.
Benchmark🐟 Fugu🐡 Fugu UltraMeilleur résultat FuguSWE-Bench Pro59,073,7Fugu UltraTerminal-Bench 2.180,282,1Fugu UltraLiveCodeBench Pro87,890,8Fugu UltraHumanity’s Last Exam47,250,0Fugu UltraGPQA Diamond95,595,5ÉgalitéSciCode60,158,7FuguLong Context Reasoning74,773,3Fugu
Ces résultats indiquent que Fugu Ultra n’est pas systématiquement supérieur. Fugu obtient, par exemple, de meilleurs scores sur certains tests scientifiques ou de contexte long.
Ils montrent également que l’orchestration la plus lourde n’est pas toujours la solution optimale.
Non. Plusieurs précautions sont nécessaires :
Fugu ayant été lancé très récemment, les évaluations indépendantes et les retours de production restent encore limités.
Un test sur des tâches représentatives de son propre environnement est donc plus pertinent qu’une décision fondée uniquement sur un classement.
Fugu masque une grande partie de la complexité liée à la gestion de plusieurs fournisseurs.
Le développeur n’a pas besoin de construire lui-même un routeur, un système de communication entre agents ou une couche de synthèse.
La force d’un modèle peut varier d’une question à une autre, y compris à l’intérieur d’un même domaine.
Le task-specific model routing de Fugu cherche à sélectionner le meilleur agent pour chaque étape plutôt que d’appliquer une règle générale comme « utiliser tel modèle pour tout le code ».
Fugu permet de combiner plusieurs fournisseurs et de faire évoluer son pool lorsque de nouveaux modèles apparaissent.
Cette approche améliore la résilience de l’infrastructure IA et limite la dépendance technique envers un seul éditeur.
Elle ne crée cependant pas une souveraineté complète : les données peuvent toujours être transmises à des modèles externes exploités par OpenAI, Anthropic, Google ou d’autres fournisseurs.
Plusieurs agents peuvent proposer, critiquer et vérifier une solution.
Cette organisation peut réduire certains angles morts d’un modèle isolé, notamment lorsqu’un agent spécialisé intervient sur une partie précise du problème.
Elle ne garantit toutefois ni l’exactitude ni l’absence de biais. Plusieurs modèles peuvent partager les mêmes erreurs ou accepter collectivement une hypothèse incorrecte.
Fugu ne s’appuie pas uniquement sur des workflows figés.
Son entraînement combine ajustement supervisé, stratégies évolutionnaires et apprentissage par renforcement afin d’améliorer les décisions de routage et les structures de collaboration.
✅ Points forts⚠️ LimitesAccès à plusieurs modèles via une APIRoutage précis non communiquéCoordination dynamique des agentsLatence moins prévisibleBons résultats sur de nombreux benchmarksÉvaluations principalement publiées par Sakana AIAPI compatible OpenAICompatibilité partielle avec certains paramètresPossibilité d’exclure des fournisseurs avec FuguPool de Fugu Ultra non personnalisableRéduction de la dépendance à un modèleDépendance persistante aux fournisseurs externesAdaptation du workflow à la tâcheDisponibilité géographique limitée
Sakana AI ne révèle pas quel modèle a été sélectionné pour chaque requête ni le détail du workflow généré.
Cette opacité protège sa technologie d’orchestration, mais elle peut poser problème aux organisations qui doivent expliquer précisément le traitement de leurs données ou auditer chaque décision.
Une requête peut déclencher plusieurs appels successifs ou parallèles.
Fugu Ultra peut donc nécessiter des délais d’expiration nettement plus longs qu’un appel à un modèle unique. La documentation recommande d’augmenter le délai côté client pour les problèmes complexes.
L’orchestration consomme ses propres jetons en plus de la requête et de la réponse visibles.
Le développeur doit surveiller les champs détaillant les jetons d’orchestration pour comprendre le coût réel de chaque traitement.
Au 26 juin 2026, le service n’est pas proposé aux utilisateurs situés dans :
Un utilisateur situé en France ne peut donc pas encore créer et utiliser normalement le service selon ses conditions officielles.
Dans les régions prises en charge, l’utilisateur doit :
La clé API n’est affichée qu’une seule fois lors de sa création.
Sakana AI propose actuellement les identifiants de modèles suivants :
IdentifiantUtilisationfuguVersion équilibrée pour les usages quotidiensfugu-ultraVersion orientée qualité maximalefugu-ultra-20260615Version datée et figée de Fugu Ultra
L’identifiant daté est utile lorsqu’une application doit conserver un comportement plus stable malgré les futures mises à jour du service.
L’API de Sakana Fugu est compatible avec le SDK OpenAI.
Elle prend en charge :
Sakana AI recommande l’API Responses pour les nouvelles intégrations.
import os
from openai import OpenAI
api_key = os.environ.get("SAKANA_API_KEY")
if not api_key:
raise RuntimeError(
"La variable d’environnement SAKANA_API_KEY est absente."
)
client = OpenAI(
base_url="https://api.sakana.ai/v1",
api_key=api_key,
)
response = client.responses.create(
model="fugu",
input=(
"Analyse cette fonction Python, identifie les risques "
"et propose une version corrigée."
),
reasoning={"effort": "high"},
timeout=120.0,
)
print(response.output_text)
Passer de Fugu à Fugu Ultra ne nécessite que de modifier l’identifiant :
model="fugu-ultra"
Pour un traitement complexe, le délai peut devoir être augmenté au-delà de 120 secondes.
La compatibilité ne signifie pas que chaque paramètre OpenAI produit exactement le même effet.
Certains paramètres, comme temperature, top_p, seed ou les pénalités de fréquence, peuvent être acceptés mais ignorés.
Les applications doivent donc vérifier la liste des champs réellement pris en charge avant une migration.
Sakana AI fournit une configuration permettant de définir Fugu comme fournisseur de modèles dans Codex CLI.
Cette intégration permet d’utiliser l’interface et les outils de Codex tout en faisant traiter les demandes par Fugu ou Fugu Ultra.
Sur macOS et Ubuntu, un programme d’installation automatisé est proposé. Une configuration manuelle reste nécessaire dans certains environnements, notamment sous Windows.
Dans cette architecture :
Il ne faut donc pas confondre l’agent de programmation avec le modèle qui alimente son raisonnement.
Avec la version standard de Fugu, l’utilisateur peut exclure certains fournisseurs lors de la création ou de la modification de sa clé API.
Cette option répond aux contraintes liées :
La liste exacte des modèles sélectionnés pour une requête n’est toutefois pas communiquée.
Fugu Ultra utilise obligatoirement le pool complet prévu par Sakana AI. Sa composition ne peut pas être personnalisée, car ses performances reposent sur cet ensemble d’agents.
Sakana Fugu présente une approche particulièrement intéressante de l’orchestration multi-agents.
Au lieu de demander aux développeurs de sélectionner manuellement Claude, GPT ou Gemini, puis de construire leurs propres workflows, Fugu encapsule cette complexité derrière une API familière.
Sa combinaison du routage dynamique, de l’apprentissage par renforcement et de l’optimisation évolutionnaire constitue son principal avantage. Ses résultats publiés sur le code, le raisonnement scientifique et les tâches agentiques indiquent que la coordination peut parfois dépasser les performances de chaque modèle utilisé séparément.
Plusieurs limites empêchent néanmoins de conclure trop rapidement à une révolution.
Le routage reste propriétaire, les coûts et la latence sont moins prévisibles, les évaluations indépendantes sont encore rares et le service n’est pas disponible dans l’Union européenne au moment de son lancement.
Fugu paraît donc surtout pertinent pour les équipes qui utilisent déjà plusieurs modèles et veulent externaliser leur sélection et leur coordination. Une organisation ayant besoin d’une traçabilité complète ou d’un contrôle strict de chaque fournisseur pourrait préférer conserver sa propre couche d’orchestration.
Sakana Fugu illustre malgré tout une évolution importante : l’amélioration des performances de l’IA ne dépend plus uniquement de modèles toujours plus grands. Elle peut également provenir d’une meilleure organisation des intelligences existantes.
Au 26 juin 2026, Sakana AI propose des abonnements et une facturation à l’usage.
FormulePrix affichéUsage indicatif🟢 Standard20 $/moisEssais et utilisation légère🔵 Pro100 $/moisSessions régulières de code et d’analyse🟣 Max200 $/moisTâches longues et utilisation intensive⚙️ Paiement à l’usageVariableProduction et besoins évolutifs
Pour Fugu, la facturation à l’usage dépend du modèle le plus coûteux présent dans le pool actif. Les tarifs des différents agents ne sont pas additionnés.
Pour fugu-ultra-20260615, les prix affichés par million de jetons sont :
Type de jetonsContexte standardContexte supérieur à 272 000 jetons📥 Entrée5 $10 $📤 Sortie30 $45 $♻️ Entrée en cache0,50 $1 $
Les jetons consommés par l’orchestration sont facturés, même lorsqu’ils ne sont pas directement visibles dans la réponse finale.
Ces prix sont susceptibles d’évoluer rapidement après le lancement.
Sakana AI présente Fugu comme une manière de limiter le risque lié à la dépendance envers un fournisseur unique.
Cette approche possède une valeur réelle pour la résilience :
Il serait néanmoins excessif de qualifier Fugu d’AI sovereignty infrastructure totalement souveraine.
Le service repose encore sur des modèles externes, des API propriétaires et une orchestration dont le fonctionnement détaillé n’est pas public. Une véritable stratégie de souveraineté doit également examiner l’hébergement, les juridictions, les flux de données, les contrats et la possibilité de fonctionner sans fournisseurs étrangers.
Fugu constitue donc surtout une infrastructure multi-fournisseurs et résiliente, plutôt qu’une solution de souveraineté complète.
Fugu Ultra est conçu pour les problèmes complexes sur lesquels la qualité de réponse est prioritaire.
Cela ne signifie pas qu’il peut prendre seul des décisions médicales, juridiques, financières, industrielles ou de sécurité.
Pour les usages à fort enjeu, une organisation doit prévoir :
L’agrégation de plusieurs modèles peut améliorer le résultat moyen, mais elle ne transforme pas une réponse probabiliste en preuve certaine.

