BLOG

Sakana Fugu : fonctionnement, API, performances et avis sur l’orchestrateur multi-agents

Découvrez Sakana Fugu, son orchestration multi-agents, ses versions Fugu et Fugu Ultra, ses performances, son API et ses différences avec Claude, GPT et Gemini.

hero image blog

📆 Last update:

06/2026

Key Takeaways

Sakana Fugu est un système d’intelligence artificielle multi-agents développé par le laboratoire japonais Sakana AI. Plutôt que de s’appuyer sur un seul grand modèle de langage, il sélectionne et coordonne plusieurs modèles spécialisés pour résoudre une tâche derrière une interface unique.

Présenté publiquement le 22 juin 2026, Fugu vise notamment la programmation, le raisonnement complexe, la recherche scientifique et les questions exigeant plusieurs étapes de vérification. Il se distingue de Claude, GPT ou Gemini par sa fonction principale : il ne constitue pas seulement un modèle supplémentaire, mais une couche d’orchestration capable d’utiliser différents agents.¹

Qu’est-ce que Sakana Fugu ?

Sakana Fugu est une famille de modèles orchestrateurs proposée par Sakana AI, un laboratoire de recherche en intelligence artificielle installé à Tokyo.

Le mot fugu désigne également le célèbre poisson-globe japonais. Dans le contexte de cet article, il ne s’agit toutefois pas du poisson, mais d’un multi-agent AI system commercialisé sous forme d’API.

Fugu reçoit une requête comme un modèle classique. En arrière-plan, il peut cependant :

  • analyser le type de problème posé ;
  • sélectionner un ou plusieurs modèles adaptés ;
  • leur attribuer des rôles ou sous-tâches ;
  • organiser leurs échanges ;
  • vérifier et synthétiser les résultats.

Pour l’utilisateur, cette orchestration reste largement invisible. Il envoie une seule requête et reçoit une réponse finale, sans avoir à gérer lui-même plusieurs fournisseurs, clés API ou chaînes d’agents.

ÉlémentFonction dans Sakana Fugu🧠 Modèle orchestrateurAnalyse la demande et choisit une stratégie🧩 Agents spécialisésRésolvent différentes parties du problème🔀 Routage dynamiqueSélectionne les modèles selon la tâche💬 Communication inter-agentsOrganise le partage d’informations✅ VérificationContrôle ou critique les solutions intermédiaires📝 Synthèse finaleProduit une réponse unique pour l’utilisateur

Cette approche est parfois présentée comme un mixture-of-agents framework, par analogie avec les architectures dites mixture of experts. La différence est que Fugu coordonne des modèles complets accessibles comme agents, au lieu de seulement activer des sous-réseaux internes à un modèle unique.

Comment fonctionne Sakana Fugu ?

Fugu est lui-même un modèle de langage entraîné pour comprendre une demande et construire une organisation d’agents adaptée à cette demande.

Il ne repose donc pas uniquement sur une liste de règles écrites manuellement. Le système apprend à décider quel modèle solliciter, dans quel ordre et avec quelles instructions.

Un processus d’orchestration adaptatif

Dans une utilisation simplifiée, le fonctionnement peut être résumé en cinq étapes :

  1. Fugu interprète la demande et son niveau de difficulté.
  2. Il choisit les agents susceptibles d’être les plus compétents.
  3. Il construit un processus de collaboration adapté.
  4. Les agents exécutent, critiquent ou complètent le travail.
  5. Fugu agrège les contributions dans une réponse finale.

Pour une question simple, cette organisation peut rester légère. Pour un problème complexe, Fugu Ultra peut coordonner jusqu’à trois agents et produire un processus plus long.

Cette adaptive task delegation évite d’utiliser systématiquement le dispositif le plus coûteux. Le nombre d’agents et le niveau de raisonnement peuvent varier selon la difficulté détectée.

Trinity et Conductor : les technologies derrière Fugu

Sakana Fugu s’appuie sur deux travaux de recherche présentés à l’ICLR 2026 : TRINITY et Conductor. Le produit commercial va plus loin que ces prototypes, mais ils permettent d’en comprendre les principes fondamentaux.²

TRINITY : choisir un modèle et lui attribuer un rôle

TRINITY utilise un petit modèle coordinateur associé à une tête de sélection très légère.

À chaque étape, le coordinateur choisit un modèle et lui attribue l’un des trois rôles suivants :

RôleMission💭 ThinkerDécomposer le problème et proposer une stratégie🛠️ WorkerExécuter concrètement une partie du travail🔍 VerifierContrôler l’exactitude et la complétude du résultat

Le processus peut s’étendre sur plusieurs tours. Un premier agent élabore un plan, un deuxième réalise les calculs ou écrit le code, puis un troisième vérifie la solution.

Le coordinateur de TRINITY a notamment été optimisé avec une stratégie évolutionnaire appelée sep-CMA-ES. Cette méthode teste différentes politiques de coordination, évalue leurs résultats, puis conserve et combine les stratégies les plus efficaces.

Il s’agit donc d’une forme d’evolutionary optimization appliquée non pas directement au contenu des réponses, mais à la manière d’organiser les modèles.

Conductor : construire un workflow en langage naturel

Conductor adopte une approche plus ouverte.

Au lieu de sélectionner uniquement un modèle et un rôle à chaque tour, il génère un véritable workflow multi-agents en langage naturel. Il peut définir :

  • les sous-tâches à réaliser ;
  • les agents responsables ;
  • les instructions transmises à chacun ;
  • la structure de leurs échanges ;
  • la méthode de synthèse des résultats.

Conductor est entraîné par apprentissage par renforcement afin de découvrir des stratégies de collaboration performantes.

Cette architecture constitue une partie importante de Fugu Ultra, qui doit pouvoir traiter des workflows plus longs, utiliser des outils et maintenir une mémoire partagée entre plusieurs agents.

Fugu et Fugu Ultra : quelles différences ?

Au moment de son lancement public, Sakana AI propose deux modèles : Fugu et Fugu Ultra.

Pendant la phase bêta, la première version était appelée Fugu Mini. Elle a été renommée simplement Fugu lors de la commercialisation.

Critère🐟 Fugu🐡 Fugu UltraObjectifÉquilibre entre qualité et rapiditéQualité maximaleNombre d’agentsRoutage adaptatif, souvent plus légerUn à trois agents selon le problèmeLatencePlus faiblePotentiellement élevéeCoûtVariable selon le pool de modèlesTarification fixe par jetonsCas d’usageProgrammation quotidienne, chatbot, analyseRecherche, cybersécurité, problèmes complexesPool personnalisableOui, certains fournisseurs peuvent être exclusNon, pool complet imposéEffort de raisonnementhigh ou xhighhigh ou xhighModèle recommandé par défautOuiSeulement lorsque la profondeur est prioritaire

Quand choisir Fugu ?

Fugu est conçu comme le modèle par défaut pour les usages interactifs.

Il est adapté à la programmation, à la revue de code, aux assistants conversationnels et aux analyses pour lesquelles le délai de réponse reste important.

Quand choisir Fugu Ultra ?

Fugu Ultra privilégie la profondeur et la qualité, au prix d’une latence et d’un coût potentiellement supérieurs.

Sakana AI cite notamment :

  • la reproduction d’articles scientifiques ;
  • les compétitions de science des données ;
  • les analyses de cybersécurité ;
  • les recherches documentaires ou brevetaires ;
  • les problèmes complexes comportant plusieurs étapes.

Fugu Ultra n’est donc pas nécessaire pour chaque requête. Son intérêt apparaît surtout lorsque le coût d’une réponse médiocre dépasse celui d’un raisonnement plus long.

Sakana Fugu est-il un modèle comme Claude, GPT ou Gemini ?

Fugu peut être interrogé comme un modèle classique, mais sa nature est différente.

Claude, les modèles GPT et Gemini sont principalement des modèles de fondation développés par un fournisseur. Fugu agit comme un modèle orchestrateur au-dessus d’un ensemble de modèles et d’agents.

CritèreSakana FuguClaude, GPT ou Gemini utilisés seuls🏗️ ArchitectureOrchestrateur multi-agentsModèle de fondation principal🔀 Sélection dynamiqueOuiNon, le modèle est choisi avant l’appel🤝 CollaborationPlusieurs agents possiblesUn seul modèle par appel standard📝 RésultatSynthèse des agentsRéponse directe du modèle🔑 IntégrationAPI compatible OpenAIAPI propre au fournisseur👁️ Transparence du routageLimitéeLe modèle appelé est connu⏱️ LatenceVariable et parfois importanteGénéralement plus prévisible💰 CoûtDépend de l’orchestrationDépend directement du modèle choisi

Fugu ne remplace donc pas nécessairement Claude, GPT ou Gemini. Il peut les utiliser comme composants de son propre système.

La comparaison la plus juste n’est pas « Fugu contre Claude », mais plutôt :

Faut-il sélectionner soi-même un modèle ou confier cette sélection et cette coordination à Fugu ?

Sakana Fugu est-il seulement un routeur de modèles ?

Un routeur classique analyse une requête, sélectionne un modèle, puis lui transmet la tâche.

Fugu cherche à aller plus loin. Il peut organiser plusieurs interventions, attribuer différents rôles et adapter le workflow en fonction des réponses intermédiaires.

ApprocheFonctionnement➡️ Routeur simpleChoisit un modèle pour toute la requête🗳️ Vote majoritaireEnvoie la question à plusieurs modèles et retient la majorité🧪 Mixture of Agents classiqueGénère plusieurs réponses puis les agrège🐡 Sakana FuguConstruit dynamiquement un processus de collaboration

Dans certaines situations, le système peut solliciter un agent pour élaborer une stratégie, un autre pour la mettre en œuvre et un dernier pour rechercher les erreurs.

Ce multi-step reasoning synthesis représente le principal facteur différenciant de Fugu.

Quels sont les principaux usages de Sakana Fugu ?

Fugu est principalement destiné aux problèmes pour lesquels les modèles présentent des forces complémentaires.

Programmation et génie logiciel

Fugu peut être intégré à Codex ou à un autre environnement compatible avec les API OpenAI.

Ses usages comprennent :

  • la génération et la correction de code ;
  • l’analyse d’un dépôt logiciel ;
  • la résolution de bugs ;
  • la revue de modifications ;
  • l’exécution de tâches dans un terminal.

Le système a été entraîné sur des trajectoires issues d’environnements comme Claude Code, Codex et OpenCode. Ces trajectoires incluent l’utilisation d’outils, les retours d’exécution et les modifications successives de fichiers.

Raisonnement scientifique

Fugu peut mobiliser différents modèles selon que le problème nécessite des connaissances scientifiques, des calculs, une compréhension graphique ou une vérification logique.

Cette spécialisation dynamique est particulièrement intéressante pour les questions multidisciplinaires qu’un modèle unique pourrait traiter de manière inégale.

Recherche et analyse documentaire

Fugu Ultra est destiné aux travaux comportant plusieurs phases :

  1. définir un plan de recherche ;
  2. collecter des informations ;
  3. comparer les sources ;
  4. vérifier les contradictions ;
  5. produire une synthèse.

L’API Responses permet également d’activer un outil de recherche Web intégré.

Science des données et recherche automatisée

Sakana AI présente plusieurs expériences dans lesquelles Fugu Ultra pilote des processus d’optimisation sur une longue durée.

Le modèle peut proposer une modification, lancer une expérience, analyser son résultat et décider de conserver ou d’abandonner la piste.

Tâches spécialisées

Le rapport technique évalue également Fugu sur des problèmes de génération de modèles CAO, de programmation compétitive, d’interprétation de documents anciens et de raisonnement sur de longs contextes.

Ces exemples montrent surtout sa capacité à adapter la composition de ses agents à des domaines très différents.

Quelles sont les performances de Sakana Fugu ?

Sakana AI rapporte des résultats élevés sur plusieurs benchmarks de programmation, de science et de raisonnement.

Benchmark🐟 Fugu🐡 Fugu UltraMeilleur résultat FuguSWE-Bench Pro59,073,7Fugu UltraTerminal-Bench 2.180,282,1Fugu UltraLiveCodeBench Pro87,890,8Fugu UltraHumanity’s Last Exam47,250,0Fugu UltraGPQA Diamond95,595,5ÉgalitéSciCode60,158,7FuguLong Context Reasoning74,773,3Fugu

Ces résultats indiquent que Fugu Ultra n’est pas systématiquement supérieur. Fugu obtient, par exemple, de meilleurs scores sur certains tests scientifiques ou de contexte long.

Ils montrent également que l’orchestration la plus lourde n’est pas toujours la solution optimale.

Les benchmarks doivent-ils être pris au pied de la lettre ?

Non. Plusieurs précautions sont nécessaires :

  • les résultats de Fugu sont publiés par Sakana AI ;
  • certains scores concurrents proviennent des fournisseurs eux-mêmes ;
  • les configurations peuvent différer entre les benchmarks ;
  • les résultats réels dépendent du prompt, des outils et du contexte ;
  • un bon score moyen ne garantit pas une bonne réponse individuelle.

Fugu ayant été lancé très récemment, les évaluations indépendantes et les retours de production restent encore limités.

Un test sur des tâches représentatives de son propre environnement est donc plus pertinent qu’une décision fondée uniquement sur un classement.

Quels sont les avantages de Sakana Fugu ?

Une API unique pour plusieurs modèles

Fugu masque une grande partie de la complexité liée à la gestion de plusieurs fournisseurs.

Le développeur n’a pas besoin de construire lui-même un routeur, un système de communication entre agents ou une couche de synthèse.

Une sélection adaptée à chaque problème

La force d’un modèle peut varier d’une question à une autre, y compris à l’intérieur d’un même domaine.

Le task-specific model routing de Fugu cherche à sélectionner le meilleur agent pour chaque étape plutôt que d’appliquer une règle générale comme « utiliser tel modèle pour tout le code ».

Une réduction de la dépendance à un fournisseur

Fugu permet de combiner plusieurs fournisseurs et de faire évoluer son pool lorsque de nouveaux modèles apparaissent.

Cette approche améliore la résilience de l’infrastructure IA et limite la dépendance technique envers un seul éditeur.

Elle ne crée cependant pas une souveraineté complète : les données peuvent toujours être transmises à des modèles externes exploités par OpenAI, Anthropic, Google ou d’autres fournisseurs.

Une vérification croisée

Plusieurs agents peuvent proposer, critiquer et vérifier une solution.

Cette organisation peut réduire certains angles morts d’un modèle isolé, notamment lorsqu’un agent spécialisé intervient sur une partie précise du problème.

Elle ne garantit toutefois ni l’exactitude ni l’absence de biais. Plusieurs modèles peuvent partager les mêmes erreurs ou accepter collectivement une hypothèse incorrecte.

Une orchestration apprise

Fugu ne s’appuie pas uniquement sur des workflows figés.

Son entraînement combine ajustement supervisé, stratégies évolutionnaires et apprentissage par renforcement afin d’améliorer les décisions de routage et les structures de collaboration.

Quelles sont les limites de Sakana Fugu ?

✅ Points forts⚠️ LimitesAccès à plusieurs modèles via une APIRoutage précis non communiquéCoordination dynamique des agentsLatence moins prévisibleBons résultats sur de nombreux benchmarksÉvaluations principalement publiées par Sakana AIAPI compatible OpenAICompatibilité partielle avec certains paramètresPossibilité d’exclure des fournisseurs avec FuguPool de Fugu Ultra non personnalisableRéduction de la dépendance à un modèleDépendance persistante aux fournisseurs externesAdaptation du workflow à la tâcheDisponibilité géographique limitée

Une transparence limitée

Sakana AI ne révèle pas quel modèle a été sélectionné pour chaque requête ni le détail du workflow généré.

Cette opacité protège sa technologie d’orchestration, mais elle peut poser problème aux organisations qui doivent expliquer précisément le traitement de leurs données ou auditer chaque décision.

Une latence variable

Une requête peut déclencher plusieurs appels successifs ou parallèles.

Fugu Ultra peut donc nécessiter des délais d’expiration nettement plus longs qu’un appel à un modèle unique. La documentation recommande d’augmenter le délai côté client pour les problèmes complexes.

Des coûts moins faciles à anticiper

L’orchestration consomme ses propres jetons en plus de la requête et de la réponse visibles.

Le développeur doit surveiller les champs détaillant les jetons d’orchestration pour comprendre le coût réel de chaque traitement.

Une disponibilité encore restreinte

Au 26 juin 2026, le service n’est pas proposé aux utilisateurs situés dans :

  • l’Espace économique européen ;
  • le Royaume-Uni ;
  • la Suisse.

Un utilisateur situé en France ne peut donc pas encore créer et utiliser normalement le service selon ses conditions officielles.

Comment accéder à Sakana Fugu ?

Dans les régions prises en charge, l’utilisateur doit :

  1. créer un compte sur la console Sakana AI ;
  2. configurer un moyen de paiement ou un abonnement ;
  3. générer une clé API ;
  4. enregistrer cette clé en lieu sûr ;
  5. appeler l’un des modèles depuis un client compatible.

La clé API n’est affichée qu’une seule fois lors de sa création.

Sakana AI propose actuellement les identifiants de modèles suivants :

IdentifiantUtilisationfuguVersion équilibrée pour les usages quotidiensfugu-ultraVersion orientée qualité maximalefugu-ultra-20260615Version datée et figée de Fugu Ultra

L’identifiant daté est utile lorsqu’une application doit conserver un comportement plus stable malgré les futures mises à jour du service.

Comment intégrer Sakana Fugu via son API ?

L’API de Sakana Fugu est compatible avec le SDK OpenAI.

Elle prend en charge :

  • l’API Responses ;
  • l’API Chat Completions ;
  • l’API Models ;
  • les réponses en flux continu ;
  • les appels d’outils ;
  • les sorties JSON structurées ;
  • la recherche Web intégrée.

Sakana AI recommande l’API Responses pour les nouvelles intégrations.

Exemple d’intégration en Python

import os
from openai import OpenAI

api_key = os.environ.get("SAKANA_API_KEY")

if not api_key:
   raise RuntimeError(
       "La variable d’environnement SAKANA_API_KEY est absente."
   )

client = OpenAI(
   base_url="https://api.sakana.ai/v1",
   api_key=api_key,
)

response = client.responses.create(
   model="fugu",
   input=(
       "Analyse cette fonction Python, identifie les risques "
       "et propose une version corrigée."
   ),
   reasoning={"effort": "high"},
   timeout=120.0,
)

print(response.output_text)

Passer de Fugu à Fugu Ultra ne nécessite que de modifier l’identifiant :

model="fugu-ultra"

Pour un traitement complexe, le délai peut devoir être augmenté au-delà de 120 secondes.

Compatibilité OpenAI : quelles limites ?

La compatibilité ne signifie pas que chaque paramètre OpenAI produit exactement le même effet.

Certains paramètres, comme temperature, top_p, seed ou les pénalités de fréquence, peuvent être acceptés mais ignorés.

Les applications doivent donc vérifier la liste des champs réellement pris en charge avant une migration.

Peut-on utiliser Fugu dans Codex ?

Sakana AI fournit une configuration permettant de définir Fugu comme fournisseur de modèles dans Codex CLI.

Cette intégration permet d’utiliser l’interface et les outils de Codex tout en faisant traiter les demandes par Fugu ou Fugu Ultra.

Sur macOS et Ubuntu, un programme d’installation automatisé est proposé. Une configuration manuelle reste nécessaire dans certains environnements, notamment sous Windows.

Dans cette architecture :

  • Codex fournit l’environnement agentique et les outils ;
  • Fugu fournit le modèle orchestrateur ;
  • les agents sélectionnés par Fugu traitent les différentes étapes.

Il ne faut donc pas confondre l’agent de programmation avec le modèle qui alimente son raisonnement.

Peut-on choisir les modèles utilisés par Fugu ?

Avec la version standard de Fugu, l’utilisateur peut exclure certains fournisseurs lors de la création ou de la modification de sa clé API.

Cette option répond aux contraintes liées :

  • à la confidentialité ;
  • à la conformité ;
  • aux politiques internes ;
  • aux fournisseurs autorisés ;
  • à la localisation des traitements.

La liste exacte des modèles sélectionnés pour une requête n’est toutefois pas communiquée.

Fugu Ultra utilise obligatoirement le pool complet prévu par Sakana AI. Sa composition ne peut pas être personnalisée, car ses performances reposent sur cet ensemble d’agents.

Notre avis sur Sakana Fugu

Sakana Fugu présente une approche particulièrement intéressante de l’orchestration multi-agents.

Au lieu de demander aux développeurs de sélectionner manuellement Claude, GPT ou Gemini, puis de construire leurs propres workflows, Fugu encapsule cette complexité derrière une API familière.

Sa combinaison du routage dynamique, de l’apprentissage par renforcement et de l’optimisation évolutionnaire constitue son principal avantage. Ses résultats publiés sur le code, le raisonnement scientifique et les tâches agentiques indiquent que la coordination peut parfois dépasser les performances de chaque modèle utilisé séparément.

Plusieurs limites empêchent néanmoins de conclure trop rapidement à une révolution.

Le routage reste propriétaire, les coûts et la latence sont moins prévisibles, les évaluations indépendantes sont encore rares et le service n’est pas disponible dans l’Union européenne au moment de son lancement.

Fugu paraît donc surtout pertinent pour les équipes qui utilisent déjà plusieurs modèles et veulent externaliser leur sélection et leur coordination. Une organisation ayant besoin d’une traçabilité complète ou d’un contrôle strict de chaque fournisseur pourrait préférer conserver sa propre couche d’orchestration.

Sakana Fugu illustre malgré tout une évolution importante : l’amélioration des performances de l’IA ne dépend plus uniquement de modèles toujours plus grands. Elle peut également provenir d’une meilleure organisation des intelligences existantes.

FAQ

Combien coûte Sakana Fugu ?

Au 26 juin 2026, Sakana AI propose des abonnements et une facturation à l’usage.

FormulePrix affichéUsage indicatif🟢 Standard20 $/moisEssais et utilisation légère🔵 Pro100 $/moisSessions régulières de code et d’analyse🟣 Max200 $/moisTâches longues et utilisation intensive⚙️ Paiement à l’usageVariableProduction et besoins évolutifs

Pour Fugu, la facturation à l’usage dépend du modèle le plus coûteux présent dans le pool actif. Les tarifs des différents agents ne sont pas additionnés.

Pour fugu-ultra-20260615, les prix affichés par million de jetons sont :

Type de jetonsContexte standardContexte supérieur à 272 000 jetons📥 Entrée5 $10 $📤 Sortie30 $45 $♻️ Entrée en cache0,50 $1 $

Les jetons consommés par l’orchestration sont facturés, même lorsqu’ils ne sont pas directement visibles dans la réponse finale.

Ces prix sont susceptibles d’évoluer rapidement après le lancement.

Sakana Fugu améliore-t-il réellement la souveraineté IA ?

Sakana AI présente Fugu comme une manière de limiter le risque lié à la dépendance envers un fournisseur unique.

Cette approche possède une valeur réelle pour la résilience :

  • un modèle peut être remplacé par un autre ;
  • le pool peut évoluer avec le marché ;
  • les capacités ne dépendent pas d’une seule architecture ;
  • la sélection peut s’adapter aux restrictions disponibles.

Il serait néanmoins excessif de qualifier Fugu d’AI sovereignty infrastructure totalement souveraine.

Le service repose encore sur des modèles externes, des API propriétaires et une orchestration dont le fonctionnement détaillé n’est pas public. Une véritable stratégie de souveraineté doit également examiner l’hébergement, les juridictions, les flux de données, les contrats et la possibilité de fonctionner sans fournisseurs étrangers.

Fugu constitue donc surtout une infrastructure multi-fournisseurs et résiliente, plutôt qu’une solution de souveraineté complète.

Sakana Fugu convient-il aux décisions à fort enjeu ?

Fugu Ultra est conçu pour les problèmes complexes sur lesquels la qualité de réponse est prioritaire.

Cela ne signifie pas qu’il peut prendre seul des décisions médicales, juridiques, financières, industrielles ou de sécurité.

Pour les usages à fort enjeu, une organisation doit prévoir :

  • une validation humaine qualifiée ;
  • une traçabilité des sources ;
  • des tests sur des cas représentatifs ;
  • des règles d’escalade ;
  • un contrôle des données transmises.

L’agrégation de plusieurs modèles peut améliorer le résultat moyen, mais elle ne transforme pas une réponse probabiliste en preuve certaine.

You may also be interested in

Launch your store with SellDone!

Create, sell, and automate your business from an all-in-one e-commerce platform.
🇨🇦
🇺🇸
🇫🇷
No credit card required. Start automating in 30 seconds.
monday custom agents
⏰ Store, payments, SEO, marketing, AI, and reporting all in one place (Bonus available via my partner link 🤝)
Try SellDone with a $99 free voucher, no CONDITIONS attached →