CODE-SHARP: AI-agenter lär sig nya färdigheter autonomt
Forskare har utvecklat CODE-SHARP, ett ramverk som använder Foundation Models för att låta AI-agenter kontinuerligt upptäcka och lära sig nya färdigheter utan fördefinierade belöningsfunktioner. Systemet skapar en hierarkisk arkiv av färdigheter som kod och presterar 134% bättre än expertsystem i komplexa långsiktiga uppgifter i Craftax-miljön.
Djupdykning
CODE-SHARP representerar ett genombrott inom AI-forskningen genom att lösa ett fundamentalt problem: hur AI-agenter kan upptäcka och lära sig nya färdigheter utan att människor behöver definiera belöningsfunktioner i förväg. Metoden använder stora språkmodeller för att kontinuerligt skapa och förfina en hierarkisk samling av färdigheter, organiserade som en graf av exekverbara belöningsfunktioner skrivna i kod. Det revolutionerande är att systemet kan komponera dessa färdigheter för att lösa komplexa, långsiktiga uppgifter – något som visats genom prestanda som överträffar både förtränade agenter och specialistpolicies med över 134 procent i Craftax-miljön. Detta närmande oss betydligt närmare verkligt autonoma AI-system som kan anpassa sig till nya situationer och lära sig färdigheter på egen hand, vilket är avgörande för framtida AI-applikationer inom robotik, speldesign och automatisering. Nyckelinsikt: CODE-SHARP visar vägen mot AI-agenter som kan utveckla sina egna färdigheter utan mänsklig inblandning, vilket är en kritisk milstolpe för autonoma system.