Världsmodeller – här är allt du behöver veta om techvärldens nya snackis

Breakit

Världsmodeller blir nästa stora AI-trend efter språkmodellerna – tekniken ska lära AI att förstå hur fysisk verklighet fungerar. Utvecklingen kan enligt Breakit skapa en ny våg av hårdvarustartups som bygger på denna mer verklighetsnära AI.

Djupdykning

AI-modeller idag är som barn som lärt sig läsa perfekt men aldrig varit utomhus – de kan förklara vad en boll är men har ingen aning om att den studsar när den träffar marken. Världsmodeller försöker lösa detta genom att ge AI en fysisk intuition om hur saker fungerar, byggt på videodata istället för bara text, vilket öppnar helt nya dörrar för allt från robotik till spel och simulationer. Här handlar det egentligen om att bygga AI:ns första "common sense" – den självklara förståelse för fysiken som vi tar för given men som är otroligt komplex att koda. Istället för att bara förutsäga nästa ord i en mening ska AI kunna förutsäga nästa bildruta i verkligheten, vilket kräver förståelse för gravitation, momentum, objektpermanens och tusentals andra naturlagar. Tidpunkten är ingen slump – GPU:ernas kapacitet har nått den punkt där vi kan träna på videomaterial i den skala som krävs, samtidigt som textstackarna börjar sina. Nu kan samma startup som gestikulerar med transformerarkitekturer istället prata om hur deras modell "förstår" att vatten rinner nedförs eller att föremål inte bara försvinner när de hamnar bakom andra saker. Om det lyckas får vi inte bara smartare chatbots utan AI som kan navigera i den verkliga världen – och det kommer kräva helt andra typer av chips än dagens språkmodeller.