Ny inlärningsmetod låter AI-agenter anpassa sig i realtid utan extra träning
Forskare föreslår en metod kallad 'active inference' som låter fysiska AI-agenter – exempelvis autonoma fordon – hantera oväntade situationer i realtid, utan att behöva tränas om. Istället för att skala upp med mer data eller större modeller skalar metoden med agentens faktiska erfarenheter i världen, inspirerad av hur hjärnans basala ganglierna och prefrontala cortex fungerar. I simuleringar på köruppgifter förbättrades inferenseffektiviteten (hur snabbt agenten fattar beslut) med över 36 procent jämfört med etablerade metoder.
Djupdykning
De flesta diskussioner om skalningslagar i AI handlar om att träna gigantiska modeller på ännu mer data – men den här forskningen pekar på något fundamentalt annorlunda: vad händer när modellen redan är tränad och möter verkligheten? Active inference är ett ramverk hämtat från neurovetenskap och teoretiserar att hjärnan konstant försöker minimera skillnaden mellan vad den förväntar sig ska hända och vad som faktiskt händer – en process som kallas att minimera "free energy", vilket ungefär kan förstås som att minska osäkerhet och förvåning. Det forskarna gör här är att formalisera detta som en skalningslag: ju mer verklig erfarenhet en fysisk AI-agent samlar in efter träning, desto bättre blir den, utan att behöva skickas tillbaka till träningsstadiet. Det de flesta missar är att detta egentligen är ett angrepp på ett av de mest grundläggande problemen med dagens AI i robotik och autonoma fordon – distributionsshift, alltså att verkligheten sällan ser ut exakt som träningsdatan. Dagens system fryser ofta till eller fattar farliga beslut när de möter något obekant, medan den här metoden är designad specifikt för att hantera just det. Att resultaten visar 36% förbättrad inferenseffektivitet jämfört med existerande metoder är inte en liten detalj – det är skillnaden mellan ett system som kan köras i realtid på hårdvara i en bil och ett som inte kan det. Om den här typen av test-time adaptation slår igenom på allvar kan det förskjuta konkurrensen i fysisk AI från vem som har störst träningsbudget till vem som bygger de bästa feedbacklooparna med verklig världsdata.