De senaste sex månaderna inom LLM:er på fem minuter

Simon Willison

Simon Willison sammanfattar utvecklingen inom stora språkmodeller under det senaste halvåret, med fokus på nya modeller, verktyg och trender som format AI-landskapet. En kompakt genomgång av vad som hänt sedan våren 2024 för den som vill hänga med i den snabba utvecklingen.

Djupdykning

Medan alla pratade om OpenAI:s GPT-drama och Google Gemini-lanseringen, hände det verkliga genombrottet tyst i bakgrunden – modellerna blev inte bara smartare, de blev billigare och snabbare samtidigt. Den magiska triangeln inom teknik där man vanligtvis måste välja två av tre har plötsligt börjat kollapsa. Claude 3.5 Sonnet presterar bättre än GPT-4 på de flesta benchmarks men kostar hälften så mycket att köra, medan lokala modeller som Llama 3.1 405B nu kan konkurrera med de bästa proprietära alternativen. Det här skapar en helt ny dynamik där företag för första gången kan välja AI-leverantör baserat på annat än ren prestanda – plötsligt spelar pris, integritet och kontroll roll igen. Mest underskattad är "reasoning-vågen" med modeller som o1 som faktiskt pausar och tänker igenom problem steg för steg, istället för att bara spotta ur sig det första bästa svaret. Det låter banalt men förändrar fundamentalt vad AI kan användas till – från snabba svar till djup problemlösning. Ironin är att just när AI börjar leverera på sina löften om att ersätta kunskapsarbete, kraschar värderingarna för AI-företag medan Big Tech pumpar in rekordbelopp i datacenters som om morgondagen inte existerar.