Ny metod låter AI-agenter lära sig av erfarenhet mer effektivt
arXiv cs.AI
Forskare presenterar JERP, en metod som låter AI-agenter simultaneously uppdatera både sin inbyggda beteendepolicy och en extern regelbank baserat på samma interaktionserfarenheter – istället för att hantera dem separat som tidigare. Tanken är elegant: reglerna och modellen hålls i sync med varandra, så att stabila beteenden gradvis absorberas in i modellen medan nyare lärdomar lever kvar som explicita regler. Tester på benchmark-miljöerna AlfWorld och WebShop visar genomgående förbättrad prestanda på komplexa flerstegsuppgifter.