Nytt ramverk för att bedöma AI-agenters beslut i automatiserad maskininlärning

arXiv cs.AI

Forskare har utvecklat en "Evaluation Agent" som kan granska mellanliggande beslut hos AI-agenter inom AutoML-system, inte bara slutresultatet. Systemet kan upptäcka felaktiga beslut med 91,9% träffsäkerhet och spåra hur enskilda beslut påverkar slutprestandan med variationer från -4,9% till +8,3%.