AI-agent kan automatiskt replikera forskningsresultat inom maskininlärning

arXiv cs.AI

Forskare har byggt ett system kallat Paper-replication där en kodningsagent (ett AI-verktyg som skriver och kör kod självständigt) systematiskt kan återskapa påståenden från vetenskapliga maskininlärningsartiklar – till exempel att ett fel ska vara under 5%. I ett test på fyra artiklar klarade alla tolv körningar valideringen och matchade samtliga 158 registrerade påståenden. Det intressanta är inte att AI kan koda, utan att systemet tvingar agenten att faktiskt bevisa sina resultat mot papprets siffror – inte bara säga att det är klart.