18 maj 2026

AI-agenter tar steget från forskning till verklighet

Medan OpenAI-cheferna omorganiserar och låter ChatGPT koppla till dina bankkonton, får vi samtidigt en påminnelse om varför AI inte bör lämnas helt utan uppsikt. En AI-radiostation i Polen slutade med att intervjua en påhittad version av den avlidne nobelpristagaren Wisława Szymborska – ett spektakulärt misslyckande som visar att även de mest avancerade systemen behöver mänsklig övervakning.

Öppna AI-modeller knäcker kostnadsgåtan för långa konversationer

Längre AI-konversationer har varit en ekonomisk mardröm. Varje ny prompt måste bearbeta hela historiken igen, vilket betyder att en 20-rundors konversation kan kosta 400 gånger mer än första meddelandet. Nu attackerar Gemma 4, DeepSeek V4 och Kimi K2.6 problemet direkt i arkitekturen.

Tricket kallas KV-delning (key-value caching) och komprimerad uppmärksamhet. Istället för att beräkna allt från scratch varje gång, sparar modellerna viktiga delar av tidigare beräkningar och återanvänder dem smart. DeepSeek V4 kan nu hantera 128k tokens samtidigt utan att kostnaden exploderar, medan Kimi K2.6 når hela 2,6 miljoner tokens.

Det här förändrar kalkylen för vem som kan bygga långvariga AI-applikationer. Tidigare var det bara OpenAI och Anthropic som hade råd att låta användare ha riktigt långa konversationer. Nu kan mindre aktörer plötsligt konkurrera med chatbots som kommer ihåg vad du sa för tre timmar sedan.

Flaskhalsen flyttas från beräkningskraft till minnesstorlek, vilket är betydligt billigare att skala. En konversation som tidigare krävde 10 sekunder bearbetning varje runda kan nu återanvända 80% av beräkningarna.

Det mest intressanta är att dessa förbättringar kommer från öppna modeller, inte de stora techbolagen. Medan OpenAI fokuserar på nya modaliteter bygger open source-communityn smartare arkitekturer för befintliga problem. Resultatet: den gamla regeln att "bara Google kan köra långa AI-sessioner" håller inte längre.

Forskare testar AI-agenter: enkelt slår komplext (och kostar mindre)

3 475 testkörningar i CybORG CAGE-2 har gett ett tydligt svar på frågan som plagar alla som bygger AI-agenter: mer komplicerat är inte bättre.

Forskare testade olika sätt att designa sammansatta AI-agenter i cyberförsvarsmiljöer och resultaten är brutalt tydliga. Programmerad kontexthantering förbättrade prestanda med upp till 76%, medan komplexa resoneringskedjor försämrade resultatet med 3,4 gånger. Ironiskt nog kostade de komplexa varianterna också 1,8-2,7 gånger mer i tokens.

Parallellt visar FORGE-metoden hur AI-agenter kan förbättra sig själva genom att bygga textbaserade minnesstrukturer utan att träna om modellerna. Här förbättrades prestanda med 1,7-7,7 gånger mot grundmodeller. Det mest intressanta: svagare modeller gynnades mest, vilket tyder på att tekniken kan utjämna kapacitetsgap.

Medan forskarna optimerar agent-arkitekturer i labb körde Andon Labs ett verklighetsnärt experiment: fyra AI-modeller fick var sitt radiostation med 20 dollar startkapital. Alla gick i konkurs dramatiskt snabbt, vilket visar att även de bästa modellerna kraschar när de lämnas helt ensamma.

För builders blir slutsatsen klar: fokusera på arkitektur och struktur före avancerade resoneringskedjor. Låt agenter bygga upp minne över tid istället för att göra dem smartare per beslut. Och glöm inte att även den snyggaste agent-arkitekturen behöver övervakning i produktionsmiljöer.

ChatGPT kan nu koppla till dina bankkonton via Plaid

"ChatGPT får nu tillgång till dina bankkonton via Plaid, plattformen som kopplar ihop 12 000 finansinstitut med appar som Venmo och Robinhood."

ChatGPT får nu tillgång till dina bankkonton via Plaid, plattformen som kopplar ihop 12 000 finansinstitut med appar som Venmo och Robinhood. Istället för att gissa vad du spenderar pengar på kan chatboten nu se exakt hur mycket kreditkortsskuld du har och vart pengarna faktiskt tar vägen.

Siffran 200 miljoner månatliga användare som redan frågar ChatGPT om ekonomiska tips säger något om hur desperata folk är efter personlig finansrådgivning. Nu kan de få den — men till priset av att överlämna sina mest känsliga data till en AI-modell.

Funktionen lanseras samtidigt som OpenAI planerar att slå ihop ChatGPT med kodverktyget Codex. Medgrundaren Greg Brockman har tagit över produktstrategin, och mobilstöd för Codex rullas ut så att utvecklare kan fjärrstyra sina projekt från telefonen.

Vad som är intressant är inte bara dataåtkomsten i sig, utan vad den möjliggör. En AI som kan se både dina utgifter och dina programmeringsprojekt får en komplett bild av både din ekonomi och dina färdigheter. Det öppnar för rådgivning som går långt bortom "spendera mindre på kaffe".

Plaid har gjort dessa kopplingar säkra för tusentals andra appar, så tekniken fungerar. Frågan är om folk verkligen vill att samma modell som kan halluciera fakta också ska ha koll på deras bankbalans. Men med tanke på hur många som redan frågar ChatGPT om pengar verkar svaret vara ja.

Malta köper ChatGPT Plus åt hela landet

Malta har bestämt sig för att bli världens första AI-nation på riktigt. Regeringen har tecknat ett avtal med OpenAI som ger alla 520 000 medborgare gratis tillgång till ChatGPT Plus under ett helt år.

Det här är inte bara symbolpolitik. ChatGPT Plus kostar normalt 20 dollar per månad, så vi snackar om en kostnad på över 100 miljoner dollar om alla använder det. Men Malta satsar på att investeringen lönar sig genom ökad produktivitet och bättre AI-färdigheter hos befolkningen.

Initiativet inkluderar även utbildningsinsatser för att lära folk använda AI-verktygen effektivt. Inte helt dumt, med tanke på att de flesta fortfarande använder ChatGPT som en mer pratig Google.

För OpenAI är det här en smart strategi. Istället för att försöka sälja till individer får de en hel nations regering som kund. Plus att de får 520 000 nya användare att samla data från och träna framtida modeller på.

Det blir intressant att se om fler små länder följer efter. Estland har redan byggt en digital infrastruktur som de andra tittar avundssjukt på. Varför inte låta AI-tillgång bli nästa konkurrensfördel för att locka talang och företag?

Frågan är om andra europeiska länder vågar satsa lika stort på amerikansk AI-teknik, särskilt med EU:s AI Act i bakgrunden. Malta verkar i alla fall ha bestämt sig för att köra först och tänka på reglerna sen.

Dagens siffra

200 miljoner

människor frågar ChatGPT om ekonomifrågor varje månad, enligt OpenAI när de lanserade funktionen för att koppla chatboten till bankkonton

Källa: The Verge

Snabbkollen

Formella metoder möter AI - ny teknik för att övervaka LLM-beteende

Forskare har utvecklat en metod som kombinerar formell logik med maskininlärning för att övervaka och granska AI-system i realtid. Tekniken kan upptäcka när LLM:er bryter mot säkerhetsregler eller andra begränsningar - och till och med ingripa för att stoppa överträdelser innan de händer. Experimenten visar att även små modeller presterar bättre än avancerade LLM:er när det gäller att upptäcka regelbryteri över tid.

Källor: arXiv cs.AI
AI-agenter designar nya språkmodeller autonomt

Forskare har låtit AI-agenter själva designa nya neurala arkitekturer som presterar bättre än Llama 3.2 – med 2,4-3,8% högre träffsäkerhet på nedströmstasks. Systemet AIRA använder 31 agenter som inom 24 timmar utforskar nya sätt att bygga språkmodeller, från grundläggande komponenter till kompletta implementationer.

Källor: arXiv cs.AI
Stärk Sveriges suveränitet och strategiska allianser i AI-eran

AI Sweden-chefer menar att Sverige behöver stärka sin strategiska förmåga inom AI-utveckling för att säkerställa nationell suveränitet. Den nuvarande nationella strategin pekar ut riktningen men räcker inte för att hantera vårt växande beroende av AI-teknik.

Microsoft säger upp anställdas Claude Code-licenser

Microsoft drar in sina anställdas licenser för Anthropics AI-verktyg Claude Code och vill istället att alla använder företagets eget Github Copilot CLI. Beslutet kommer precis innan det nya räkenskapsåret börjar i juli, vilket tyder på ekonomiska motiv – trots att många Microsoft-utvecklare enligt uppgifter föredragit Claude framför företagets egen lösning.

Claude Mythos hittade säkerhetshål i Mac OS

Anthropics AI-modell Claude Mythos hjälpte säkerhetsforskare från Calif att på bara fem dagar hitta ett sätt att kringgå Apples Memory Integrity Enforcement (MIE) – ett hårdvarubaserat minnesskydd i Mac-datorer och iPhones. Calif väntar med att publicera sin 55-sidiga rapport tills Apple fixat sårbarheten, vilket visar både potentialen och riskerna med AI-baserade säkerhetsverktyg.

Företagen spår jobbslakt – till följd av AI

En Novus-undersökning visar att 91 procent av svenska företag tror att AI kommer minska antalet anställda inom fem år. Synen på AI:s påverkan på arbetsmarknaden förändras alltså snabbt i näringslivet, vilket tyder på att företagsledare nu ser teknologin som en konkret hotbild snarare än en avlägsen möjlighet.

Källor: Di Digital
Microsoft och OpenAI omförhandlar partnerskap efter Amazondeal

Microsoft och OpenAI har tecknat ett nytt avtal som ger OpenAI frihet att sälja sina AI-modeller via konkurrenter som Google och Amazon, samtidigt som Microsoft behåller förhandsrätt till ny teknik fram till 2030. Avtalet kom efter att Microsoft hotade med stämning när OpenAI tecknade ett 50 miljarder dollar-avtal med Amazon i mars.

Runway siktar på att slå Google inom AI-video

AI-videobolaget Runway, som började med att hjälpa filmskapare, satsar nu på att videogenerering är vägen till så kallade världsmodeller (AI som förstår hur världen fungerar). Företaget menar att deras bakgrund utanför traditionell AI-forskning ger dem en fördel mot teknikjättar som Google.

ArXiv bannar forskare som låter AI skriva hela artiklar

Forskningsdatabasen ArXiv inför ettåriga avstängningar för författare som använder språkmodeller för att skriva hela vetenskapliga artiklar. Plattformen skärper sina regler mot slarvigt användande av AI-verktyg inom akademisk publicering.

Musk mot Altman vecka 3: Juryn ska avgöra vem som ljuger

Rättegången mellan Elon Musk och OpenAI:s Sam Altman går in i slutfasen där båda sidornas trovärdighet ifrågasätts kraftigt. Altman anklagas för lögner och egenintresse i affärer med OpenAI, medan han målar upp Musk som en maktgalen person som ville kontrollera AI-utvecklingen.

Osaurus kombinerar lokal och moln-AI på Mac

Osaurus lanserar en Mac-app som låter användare köra både lokala AI-modeller och molnbaserade tjänster samtidigt, medan användardata förblir på den egna datorn. Appen verkar rikta sig mot användare som vill ha flexibilitet mellan prestanda och integritet när de arbetar med AI-verktyg.

Nya skalningslagar gör LLM-modeller 47% snabbare utan att offra noggrannhet

Amazons forskare har utvecklat nya matematiska samband som visar hur specifika arkitekturval påverkar modellprestanda, vilket möjliggör upp till 47% snabbare genomströmning utan försämrad noggrannhet. Upptäckten hjälper utvecklare att optimera språkmodeller mer effektivt genom att förutsäga vilka designval som ger bäst balans mellan hastighet och kvalitet.

Regeringen stänger ute flickor från AI

Riksdagen röstar den 3 juni om en ny läroplan som kommer forma svensk skola i decennier framöver. Beslutsfattare från olika branscher varnar för att skolan måste ge alla elever - inklusive flickor - möjlighet att förstå och kritiskt granska AI-teknik när den påverkar allt från arbetsliv till demokrati. Det handlar både om rättvisa och Sveriges framtida kompetensförsörjning inom AI.

Cerebras börsnotering värderas till $60 miljarder

AI-chipföretaget Cerebras går på börsen med en värdering på $60 miljarder, vilket gör det till en av årets största tekniknoteringar. Företaget tillverkar specialdesignade processorer för att träna stora AI-modeller och har gynnats enormt av den pågående AI-boomen.

Nvidias kvartalsrapport i fokus nästa vecka

Den amerikanska AI-chipjätten Nvidia släpper kvartalsrapport på onsdag, vilket blir veckans stora fokus för marknaden. Samtidigt rapporterar svenska bolag som värmeteknikbolaget Nibe och serieförvärvaren Lagercrantz.

Cisco säger upp 4 000 trots rekordresultat – vill satsa på AI

Cisco sparkar 4 000 anställda (5% av arbetsstyrkan) trots att omsättningen ökade med 12% förra kvartalet. VD:n Chuck Robbins motiverar uppsägningarna som nödvändiga för att omfokusera företaget mot AI och 'vinna AI-eran' – en dyr omställning även för lönsamma techbolag.

Bara den paranoida börs-vd:n överlever

Intels förre vd Andrew Groves klassiska motto "bara de paranoida överlever" får ny relevans i AI-eran. Storbolag som inte håller sig alerta riskerar att slås ut av konkurrenter eller nya AI-uppstickare som förändrar spelplanen helt.

Källor: Di Digital

Färskbryggt AI varje morgon

15 minuter och en kopp kaffe, allt du behöver.