¿Puede un AI Agent ejecutar el consenso de blockchain? Prueba de ETH Zurich: solo un 41,6% de éxito
Lograr consenso bajo la condición de que algunos participantes puedan actuar de manera maliciosa es el desafío central que enfrentan todos los sistemas descentralizados, conocido en computación distribuida como el problema de tolerancia a fallos bizantinos. Los distintos mecanismos de consenso en blockchain, en esencia, buscan resolver diferentes variantes de este problema. Un equipo de investigación del ETH Zurich probó directamente la capacidad de consenso bizantino de los LLM Agents en el artículo "Can AI Agents Agree?": varios Agents transmiten propuestas y votan repetidamente a través de una red totalmente conectada y sincronizada, mientras que algunos Agents actúan como nodos bizantinos maliciosos que intentan sabotear el proceso. El equipo utilizó Qwen3-8B y Qwen3-14B, realizando cientos de simulaciones con diferentes tamaños de grupo (4, 8 y 16 Agents) y proporciones de nodos maliciosos.
Incluso sin nodos maliciosos, la tasa de consenso efectivo fue solo del 41,6% (Qwen3-14B alcanzó el 67,4%, mientras que Qwen3-8B solo el 15,8%). Cuantos más nodos hay, más difícil es llegar a un acuerdo: la tasa de éxito disminuyó del 46,6% con 4 Agents al 33,3% con 16 Agents. Al agregar nodos maliciosos, el consenso se deterioró aún más, y los fracasos se manifestaron principalmente como tiempos de espera y estancamiento en la convergencia (pérdida de liveness), en lugar de manipulación de valores. Solo con mencionar en el prompt que "pueden existir nodos maliciosos", la tasa de éxito de Qwen3-14B cayó del 75,4% al 59,1%, incluso cuando en realidad no había nodos maliciosos. El artículo concluye que el consenso confiable aún no es una capacidad emergente en la que se pueda confiar en los LLM Agents actuales, por lo que se recomienda cautela en implementaciones descentralizadas que dependan de una coordinación robusta.
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
BlockBeats publica los datos del ranking de plataformas de trading de febrero
BlockBeats publica el ranking de exchanges de febrero: los CEX se reactivan, mientras que los DEX se enfrían
