Kaya bang patakbuhin ng AI Agent ang blockchain consensus? ETH Zurich aktwal na pagsubok: Tagumpay na rate ay 41.6% lamang
Ang pagkakaroon ng kasunduan sa ilalim ng kondisyon na maaaring may ilang kalahok na gumagawa ng masama ay isang pangunahing hamon na kinakaharap ng lahat ng desentralisadong sistema, na tinatawag na Byzantine fault tolerance problem sa distributed computing. Ang iba't ibang consensus mechanism ng blockchain ay sa esensya ay nagsosolusyon sa iba't ibang anyo nito. Ang research team mula sa ETH Zurich ay direktang sinubukan ang kakayahan ng Byzantine consensus ng LLM Agent sa kanilang papel na "Can AI Agents Agree?": Maraming Agent ang paulit-ulit na nagbo-broadcast ng mga proposal at bumoboto sa pamamagitan ng isang synchronous fully connected network, kung saan ang ilan sa mga Agent ay sadyang gumaganap bilang malisyosong Byzantine nodes upang sirain ang proseso. Gumamit ang team ng Qwen3-8B at Qwen3-14B, at nagsagawa ng daan-daang simulation sa iba't ibang laki ng grupo (4, 8, 16 na Agent) at proporsyon ng malisyosong nodes.
Kahit na walang malisyosong nodes, ang epektibong consensus rate ay 41.6% lamang (Qwen3-14B ay 67.4%, Qwen3-8B ay 15.8% lamang). Habang dumarami ang nodes, mas mahirap makamit ang kasunduan—ang success rate ay bumaba mula 46.6% sa 4 na Agent hanggang 33.3% sa 16 na Agent. Kapag may idinagdag na malisyosong nodes, lalo pang lumala ang consensus, at ang mga pagkabigo ay pangunahing nakikita sa anyo ng timeout at convergence stall (pagkawala ng liveness), sa halip na numerical tampering. Kapag binanggit lamang sa prompt na "maaaring may malisyosong nodes," bumaba ang success rate ng Qwen3-14B mula 75.4% hanggang 59.1%, kahit na sa aktwal ay walang malisyosong nodes. Ayon sa konklusyon ng papel, ang maaasahang consensus ay hindi pa isang emergent capability na mapagkakatiwalaan ng kasalukuyang LLM Agent, kaya't dapat mag-ingat sa mga desentralisadong deployment na umaasa sa matatag na koordinasyon.
Disclaimer: Ang nilalaman ng artikulong ito ay sumasalamin lamang sa opinyon ng author at hindi kumakatawan sa platform sa anumang kapasidad. Ang artikulong ito ay hindi nilayon na magsilbi bilang isang sanggunian para sa paggawa ng mga desisyon sa investment.
