DeepSeeks nya AI-modell V4 kan hantera mycket längre prompter

MIT Technology Review

Kinesiska AI-företaget DeepSeek släppte på fredagen en förhandstitt på V4, deras nya flaggskeppsmodell som kan bearbeta betydligt längre prompter än tidigare versioner. Det här är intressant eftersom längre kontextfönster (hur mycket text modellen kan komma ihåg) ofta betyder bättre prestanda för komplexa uppgifter.

Djupdykning

DeepSeek V4 representerar något mer betydelsefullt än bara en ny AI-modell från Kina – det är en signal om att den globala AI-racen inte längre styrs av Silicon Valley ensamt. Företaget har visat att man kan bygga konkurrenskraftiga modeller utan tillgång till Nvidias mest avancerade chips, vilket undergräver USA:s försök att begränsa Kinas AI-utveckling genom exportkontroller på halvledare. Det mest intressanta är att V4 kan hantera mycket längre prompts, vilket öppnar för helt nya användningsområden där AI kan arbeta med komplexa dokument eller ha långa konversationer utan att "glömma" kontexten. Medan amerikanska företag fokuserar på att göra sina modeller smartare, verkar DeepSeek satsa på att göra dem mer praktiskt användbara för verkliga arbetssituationer. För vanliga användare betyder det här att vi snart kan få AI-assistenter som faktiskt kan läsa igenom hela rapporter eller följa med i timslånga möten, inte bara ge svar på korta frågor.