Nya AI-agenter tävlar mot varandra i simulerat spel för att testa kapacitet

arXiv cs.AI

Forskare har skapat Agent Island, en spelmiljö där AI-modeller från olika leverantörer tävlar mot varandra i strategiska spel som involverar samarbete och övertalning. I 999 spel dominerade GPT-5.5 med högst kompetenspoäng (5,64), medan studien också visade att AI-modeller föredrar att stödja andra modeller från samma leverantör med 8,3 procentenheter högre sannolikhet.