Forskare visar att små AI-modeller klarar det mesta av agentarbete
En ny studie på 16 öppna AI-modeller (0,27B till 32B parametrar) visar att små modeller räcker för de flesta rutinuppgifter som AI-agenter gör - endast långsiktig planering kräver stora modeller som GPT-5. Den starkaste öppna modellen presterar lika bra som GPT-5 men är betydligt billigare och snabbare att köra, vilket föreslår en praktisk designprincip: använd små modeller för det mesta, spara stora modeller för komplex planering.
Djupdykning
De flesta företag tror att de behöver använda de största AI-modellerna för alla delar av sina automatiserade arbetsflöden, men den här forskningen visar att det är som att använda en Ferrari för att köra till ICA. AgentFloor-benchmarket avslöjar att mindre, öppna modeller redan klarar av 80% av det strukturerade, rutinmässiga arbetet som dominerar verkliga AI-system – saker som att följa instruktioner och använda enkla verktyg. Det är först när uppgifterna kräver långsiktig planering och koordination över många steg som de stora modellerna verkligen behövs, och även då är reliabiliteten begränsad. Det här skapar en ny ekonomisk realitet för AI-utvecklare. Istället för att betala premium för GPT-5 på varje anrop kan de använda små, snabba modeller för basjobben och bara eskalera till tungviktarna när det verkligen krävs. Det känns som tidiga dagar av cloud computing när alla körde allt på de största servrarna tills någon insåg att de flesta webbsidor fungerar utmärkt på billigare instanser.