Forskare utvecklar nya ramverk för AI-agenters osäkerhet och planering

Forskarvärlden tar viktiga steg framåt inom AI-agentteknologi genom flera nya genombrott som adresserar fundamentala utmaningar med osäkerhet, planering och minneshantering.

Ett team forskare har utvecklat det första generella ramverket för att mäta osäkerhet hos AI-agenter som arbetar med komplexa, interaktiva uppgifter. Den nya metoden behandlar osäkerhet som en reduktionsprocess snarare än en ackumulering, vilket bättre passar agenter som interagerar med omvärlden. Detta är en viktig utveckling då befintlig forskning främst fokuserat på enkla fråga-svar-scenarier.

Parallellt har forskare lanserat ProAct, ett ramverk som dramatiskt förbättrar AI-agenters förmåga att planera långsiktigt i interaktiva miljöer. Genom en tvåstegs träningsmetod som kallas Grounded LookAhead Distillation lyckas systemet komprimera komplexa sökträd till koncisa resonemangskedjor. En 4 miljarder parametrars modell tränad med ProAct överträffade alla open source-alternativ och konkurrerade framgångsrikt med ledande kommersiella modeller.

Inom minneshantering har forskare publicerat en omfattande översiktsartikel om graf-baserat minne för AI-agenter. Graf-strukturer används för att lagra och organisera information för komplexa uppgifter som flerturssamtal och spelande. Artikeln kategoriserar minnessystem i korttids- och långtidsminne samt analyserar tekniker för dataextraktion, lagring och hämtning.

Slutligen har forskare utvecklat AgenticPay, ett nytt ramverk för att testa AI-agenters förhandlingsförmåga. Systemet innehåller över 110 olika uppgifter från bilaterala förhandlingar till komplexa marknader med flera aktörer. Tidiga tester avslöjar betydande brister i nuvarande språkmodellers förhandlingskapacitet och strategiska tänkande.

Sammantaget pekar dessa framsteg mot mer pålitliga och kapabla AI-agenter som kan hantera verkliga, komplexa uppgifter med större precision och strategic insikt.