FutureWorld: AI-agenter tränas på att förutspå verkliga händelser

arXiv cs.AI

Forskare har skapat FutureWorld, en miljö där AI-agenter tränas genom att göra förutsägelser om verkliga händelser och sedan få feedback när utfallen blir kända. Under flera dagars träning visade tre olika språkmodeller förbättrade prestanda, vilket öppnar för AI-system som kan lära sig kontinuerligt från den verkliga världen.

Djupdykning

FutureWorld representerar en fascinerande vändning inom AI-träning – istället för att mata modeller med gamla data skapar forskarna en miljö där AI-agenter gör verkliga förutsägelser om framtida händelser och får feedback när utfallen blir kända. Det är som skillnaden mellan att träna en pokerspelare med gamla händer versus att låta dem spela live-partier med riktiga pengar på spel. Det som gör detta tillvägagångssätt kraftfullt är att det löser ett grundläggande problem med AI-träning: datakontaminering och "answer leakage" där modeller oavsiktligt redan sett svaren under träning. Genom att förutsäga händelser som bokstavligen inte hänt än får modellerna äkta feedback från verkligheten istället för kurerade datamängder. Resultaten från deras experiment med öppen källkod-modeller som tränade i flera dagar i följd visar att detta kontinuerliga lärande faktiskt fungerar. Men det verkligt intressanta är vad detta säger om framtiden för AI-utveckling – vi rör oss mot system som kan utvecklas genom att interagera med den verkliga världen snarare än genom att bara konsumera mer träningsdata.