Nytt ramverk för att bedöma AI-agenters beslut i automatiserad maskininlärning
arXiv cs.AI
Forskare har utvecklat en "Evaluation Agent" som kan granska mellanliggande beslut hos AI-agenter inom AutoML-system, inte bara slutresultatet. Systemet kan upptäcka felaktiga beslut med 91,9% träffsäkerhet och spåra hur enskilda beslut påverkar slutprestandan med variationer från -4,9% till +8,3%.