Ny metod låter AI-agenter lära sig av erfarenhet mer effektivt

arXiv cs.AI

Forskare presenterar JERP, en metod som låter AI-agenter simultaneously uppdatera både sin inbyggda beteendepolicy och en extern regelbank baserat på samma interaktionserfarenheter – istället för att hantera dem separat som tidigare. Tanken är elegant: reglerna och modellen hålls i sync med varandra, så att stabila beteenden gradvis absorberas in i modellen medan nyare lärdomar lever kvar som explicita regler. Tester på benchmark-miljöerna AlfWorld och WebShop visar genomgående förbättrad prestanda på komplexa flerstegsuppgifter.

🔗 Läs originalartikeln (arXiv cs.AI)

◀ 3 av 194 ▶