Les agents IA peuvent-ils exécuter le consensus blockchain ? Test réel de ETH Zurich : taux de réussite de seulement 41,6%
Parvenir à un consensus en présence de participants potentiellement malveillants est un défi central auquel sont confrontés tous les systèmes décentralisés, connu dans le domaine du calcul distribué sous le nom de problème de tolérance aux fautes byzantines. Les différents mécanismes de consensus de la blockchain visent essentiellement à résoudre ses diverses variantes. L’équipe de recherche de l’ETH Zurich a directement testé, dans l’article « Can AI Agents Agree? », la capacité des agents LLM à atteindre un consensus byzantin : plusieurs agents diffusent et votent de manière répétée des propositions via un réseau entièrement connecté et synchronisé, certains agents agissant comme des nœuds byzantins malveillants cherchant à saboter le processus. L’équipe a utilisé Qwen3-8B et Qwen3-14B, réalisant des centaines de simulations avec différentes tailles de groupes (4, 8, 16 agents) et proportions de nœuds malveillants.
Même en l’absence totale de nœuds malveillants, le taux de consensus effectif n’était que de 41,6 % (Qwen3-14B atteignant 67,4 %, Qwen3-8B seulement 15,8 %). Plus il y a de nœuds, plus il est difficile d’atteindre un accord, le taux de réussite passant de 46,6 % avec 4 agents à 33,3 % avec 16 agents. L’ajout de nœuds malveillants détériore encore le consensus, l’échec se manifestant principalement par des délais d’attente et une stagnation de la convergence (perte de vivacité), plutôt que par une altération des valeurs. Le simple fait de mentionner dans l’invite la « possible présence de nœuds malveillants » a fait chuter le taux de réussite de Qwen3-14B de 75,4 % à 59,1 %, même en l’absence réelle de nœuds malveillants. L’article conclut que le consensus fiable n’est pas encore une capacité émergente sur laquelle on peut compter chez les agents LLM actuels, et recommande la prudence pour les déploiements décentralisés nécessitant une coordination robuste.
Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.
Vous pourriez également aimer
La plateforme de lancement Web4.0 Jumpad.fun a officiellement lancé son premier projet Clawfish.
Les tokens liés à l’IA augmentent, Nvidia prévoit de lancer une plateforme open source
