Os agentes de IA conseguem executar consenso em blockchain? Teste prático da ETH Zurich: taxa de sucesso é de apenas 41,6%
Alcançar consenso sob a condição de que alguns participantes possam agir de forma maliciosa é o principal desafio enfrentado por todos os sistemas descentralizados, conhecido na computação distribuída como o problema da Tolerância Bizantina a Falhas. Essencialmente, todos os tipos de mecanismos de consenso em blockchain buscam resolver diferentes variantes desse problema. Uma equipe de pesquisa da ETH Zurich testou diretamente a capacidade de consenso bizantino de LLM Agents no artigo "Can AI Agents Agree?": múltiplos Agents transmitem propostas e votam repetidamente através de uma rede totalmente conectada e síncrona, com alguns Agents atuando como nós bizantinos maliciosos para sabotar o processo. A equipe utilizou Qwen3-8B e Qwen3-14B, realizando centenas de simulações com diferentes tamanhos de grupo (4, 8, 16 Agents) e proporções de nós maliciosos.
Mesmo sem nenhum nó malicioso, a taxa de consenso efetivo foi de apenas 41,6% (Qwen3-14B atingiu 67,4%, enquanto Qwen3-8B apenas 15,8%). Quanto mais nós, mais difícil é alcançar consenso, com a taxa de sucesso caindo de 46,6% com 4 Agents para 33,3% com 16 Agents. A introdução de nós maliciosos piora ainda mais o consenso, com as falhas ocorrendo principalmente devido a timeout e estagnação na convergência (perda de liveness), e não por manipulação de valores. Apenas mencionar no prompt que "pode haver nós maliciosos" já fez a taxa de sucesso do Qwen3-14B cair de 75,4% para 59,1%, mesmo quando não havia realmente nós maliciosos. A conclusão do artigo é que o consenso confiável ainda não é uma capacidade emergente confiável dos LLM Agents atualmente, e recomenda-se cautela em implantações descentralizadas que dependam de coordenação robusta.
Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.
