AI-agenter blir bättre på cyberattacker - nya modeller klarar fler steg

arXiv cs.AI

Forskare testade sju AI-modeller på komplexa cyberattacker och såg tydliga förbättringar över 18 månader - den senaste modellen (Opus 4.6) klarade i genomsnitt 9,8 av 32 steg jämfört med GPT-4o:s 1,7 steg. Prestandan ökar också kraftigt med mer beräkningstid - 100 miljoner tokens gav upp till 59% bättre resultat än 10 miljoner tokens.