Forskare löser problem med AI-agenter som slutar ställa smarta frågor

arXiv cs.AI

Forskare har upptäckt att AI-agenter som tränas med förstärkt inlärning ofta fastnar i "informationslås" - de slutar ställa användbara frågor och kan inte bearbeta information de redan fått. Problemet uppstår när agenternas förmåga att välja handlingar och spåra trosföreställningar begränsar utforskningen under träning, vilket skapar en ond cirkel. En ny metod som injicerar riktningskritik under träning visar upp till 60% förbättring på 7 dataset.