3 juni 2026

AI-agenter börjar erkänna sina brister

AI-agenter har ett problem: de pratar mycket men gör sällan som de säger. Ny forskning avslöjar att gap mellan vad AI-system resonerar om och vad de faktiskt utför är större än väntat - vilket förklarar varför din chatbot kan ge briljanta råd men ändå missa poängen helt.

AI-agenter får uppgiftsdrift när moral krockar med roller

När du tränar en AI-agent att spela advokat, förväntar du dig att den prioriterar klientens intressen. Men nya tester visar att agenter rutinmässigt bryter sin rollkaraktär när de ställs inför moraliska dilemman.

RoleCDE-benchmarken testade 24 000 scenarion där agenternas givna roll krockade med allmänna etiska principer. Resultatet: agenterna valde konsekvent "rätt" moral framför rollkonsistens, även när de uttryckligen instruerats att hålla sig till karaktären.

Det här är inte bara ett akademiskt problem. När finansiella AI-agenter ska ge rådgivning eller juridiska agenter ska argumentera för klienter, spelar rollkonsistens roll för användbarheten. Om en agent systematiskt överger sin tilldelade perspektiv för att vara "snäll", blir den opålitlig för uppgifter där olika synsätt faktiskt behövs.

Parallellt visar annan forskning liknande mönster i personaliserade modeller. TriAlign-studien fann att AI-system ofta ger mindre korrekta svar till vissa demografiska grupper när de försöker anpassa sig — en form av omvänd diskriminering där "rättvisa" skapar orättvisor.

Intressant nog verkar problemet hänga samman med hur alignment-träning fungerar. Modellerna har lärt sig att moral trumps allt, vilket gör dem mindre användbara för verkliga arbetsflöden där du faktiskt behöver en agent som kan argumentera från en specifik position.

För utvecklare som bygger rollbaserade agenter blir detta en praktisk utmaning: hur tränar du system som kan hålla sin roll utan att bli oetiska? Svaret ligger troligen i mer nyanserad träning som skiljer mellan "spela en roll" och "gör skada".

Källor:arXiv cs.AI · arXiv cs.AI · arXiv cs.AI · n8n Blog · arXiv cs.AI · arXiv cs.AI · arXiv cs.AI · arXiv cs.AI · arXiv cs.AI · arXiv cs.AI · arXiv cs.AI · arXiv cs.AI · arXiv cs.AI · arXiv cs.AI · arXiv cs.AI · arXiv cs.AI

Trumps AI-förordning blir tandlös efter teknikjättarnas protester

Den ursprungliga förordningen skulle tvinga AI-företag att låta federala myndigheter granska avancerade modeller innan lansering. Sen ringde någon från Big Tech.

Nu har Trump skrivit under en kraftigt urholkad version där granskningen bara är "frivillig" — ett ord som i branschsammanhang oftast betyder "ignorera om du vill". Förordningen pratar fortfarande om säkerhetsrisker och cybersäkerhet för kritisk infrastruktur, men utan verkliga tänder.

Detta är textboksdefinitionen av hur regleringar föds och dör i Washington. Först kommer den starka retoriken om nationell säkerhet och behovet av kontroll. Sen kommer lobbying-mötena. Till slut får vi en förordning som låter tuff på ytan men är fullständigt tandlös i praktiken.

Det intressanta är inte att Trump backade — det är hur snabbt det gick. Från obligatorisk granskning till "frivilligt ramverk" på nolltid. Teknikjättarna har uppenbarligen lärt sig att flexibilitet fungerar bättre än konfrontation.

För AI-företag betyder det business as usual. Inget kommer ändras i hur modeller utvecklas eller lanseras. Kanske skickar någon en artigt formulerad rapport till NIST då och då, men det är nog det.

Paradoxalt nog kanske detta är bättre än en halvbakad regelverket som ingen förstår hur man ska följa. Men det visar också hur svårt det är att reglera en bransch som utvecklas snabbare än politikernas förmåga att förstå vad som händer.

Källor:The Verge AI · TechCrunch AI

Microsoft lanserar Scout för att konkurrera med OpenClaw

Scout är Microsofts svar på OpenClaw och första försök att bygga vad de kallar "en riktig personlig assistent". Skillnaden mot Copilot är tydlig: där Copilot lever inuti specifika Microsoft 365-appar, kan Scout se och agera över hela ekosystemet.

Omar Shahine, corporate vice president för Microsoft Scout, beskriver det som den första riktiga personliga assistenten de erbjuder kunder. Det betyder kalendrar, utgiftsrapporter, e-postdraftar och allt däremellan i en och samma gränssnitt.

Timing är intressant. Microsoft lanserar Scout på Build-konferensen samtidigt som OpenClaw får allt mer dragkraft inom enterprise. Istället för att låta användare hoppa mellan Microsoft 365 och externa AI-verktyg, försöker Microsoft hålla dem kvar i sitt eget ekosystem.

För utvecklare som bygger interna verktyg är det här relevant av en anledning: Microsoft satsar stort på att göra sin AI-stack mer helintegrerad. Scout representerar deras vision om hur AI-assistenter ska fungera framöver, inte som isolerade chatbots utan som persistenta agenter som förstår kontext över tid och appar.

Det som saknas i presentationen är prissättning och tillgänglighet. Microsoft har en historia av att lansera AI-funktioner som premium-tillägg, så det blir intressant att se om Scout följer samma mönster eller om de trycker hårdare för att konkurrera med OpenClaw.

Frågan är om Microsoft kan leverera på löftet om en "riktig" personlig assistent när Copilot fortfarande kämpas med grundläggande sammanhang mellan olika arbetsflöden.

Källor:The Verge AI · TechCrunch AI

Google samlar in 750 miljarder för att hänga med i AI-racet

"Alphabet behöver 80 miljarder dollar för sin AI-satsning."

Alphabet behöver 80 miljarder dollar för sin AI-satsning. Det är ungefär lika mycket som hela Spotify är värt. Företaget säger att efterfrågan på deras AI-tjänster "överstiger tillgängligt utbud" — ett problem som kostar en förmögenhet att lösa.

Warren Buffett, som tidigare varit skeptisk till techaktier, går nu in med 10 miljarder dollar genom Berkshire Hathaway. Det säger något om hur etablerat AI-infrastruktur blivit som investering, även för traditionella värdefokuserade investerare.

Men här är nyanser värt att lägga märke till: en betydande del av pengarna går faktiskt till anställdas incitamentsprogram snarare än direkt AI-utveckling. Det är ett klassiskt drag när ett företag vill behålla talanger i en het marknad.

Timingen är också intressant. Google tar samtidigt första spadtaget för sitt datacenter i Avesta — ett projekt som legat på is i nio år. Att de äntligen bygger i Sverige just nu antyder att de behöver kapacitet överallt de kan få tag på den.

För alla som bygger AI-produkter visar det här hur snabbt kostnadsstrukturen förändrats. Vad som för två år sedan var "bara lägg till en API-nyckel" kräver nu seriös infrastrukturplanering. Alphabets kapitalinsamling är egentligen en signal om att även de största aktörerna känner pressen att skala snabbare än vad deras befintliga kassaflöde tillåter.

De 80 miljarderna handlar inte om innovation — det handlar om att köpa tid i ett race där alla vet att infrastruktur kommer bli flaskhalsen.

Källor:Computer Sweden · Dagens Industri · Breakit · Dagens Industri · Di Digital

Dagens siffra

98,8%

Framgångsgrad för AI-agenter efter att självläkande orkestrerare implementerats, upp från 94,5%

Källa: arxiv-cs-ai

Snabbkollen

Microsoft lanserar sin första avancerade AI-modell för resonemang

Microsoft presenterade MAI-Thinking-1, sin nya flaggskeppsmodell som utvecklats helt internt utan beroende av OpenAI:s teknik. Företaget påstår att den medelstora modellen matchar ledande konkurrenter inom programutveckling, vilket markerar Microsofts ökade satsning på egen AI-utveckling efter att ha luckrat upp partnerskapet med OpenAI.

Källor: The Verge AI

Skadliga nyhetsflöden kan lura AI-agenter att ändra beslut

Forskare visar att AI-agenter kan manipuleras genom att ändra ordningen på information de läser innan de fattar beslut - i extremfall kunde en vinklad feed ändra sannolikheten för ett specifikt beslut från 5% till 100%. Effekten fungerar även på säkerhetskritiska beslut som att ta bort godkännandegates eller lätta på åtkomstkontroller, vilket betyder att säkerhetstester av AI-system måste inkludera informationsflödet, inte bara den slutliga prompten.

Källor: arXiv cs.AI

NVIDIA och Microsoft samarbetar om enhetlig plattform för AI-agenter

NVIDIA och Microsoft lanserar tillsammans en komplett teknikstack för att köra AI-agenter (självständiga AI-system som kan utföra komplexa uppgifter) över Windows-enheter, Azure-molnet och lokala installationer. Partnerskapet presenterades på Microsoft Build och fokuserar på att ge utvecklare allt från snabb hårdvara till säkra körmiljöer för långvarig AI-resonering.

Källor: NVIDIA AI Blog

Bernie Sanders vill att amerikanska folket ska äga hälften av AI-jättarna

Bernie Sanders föreslår att hälften av AI-företagen ska ägas av amerikanska folket eftersom AI bygger på allmänhetens kunskap och arbete utan ersättning. Senatorn argumenterar i New York Times att folket förtjänar en del av vinsten från teknologi som utvecklats med deras data och kreativitet.

Källor: Breakit

Anthropic tar stort kliv mot börsen – har lämnat in hemliga papper

AI-företaget Anthropic, som står bakom chatboten Claude, har konfidentiellt lämnat in ansökan för börsnotering med en värdering på 9000 miljarder kronor. Det skulle göra det till en av de största börsintroduktionerna inom AI-sektorn någonsin, och signalerar att konkurrensen med OpenAI nu även flyttar till kapitalmarknaderna.

Källor: Breakit

AI-reklam presterar sämre trots att människor inte känner igen den

En Ipsos-studie jämförde 20 riktiga annonser från stora varumärken med AI-versioner skapade av Google Gemini och OpenAI Sora. Trots att bara 25% kunde identifiera AI-reklamen, presterade de mänskligt skapade annonserna 14% bättre på försäljning och 17% bättre på varumärkesstyrka. Forskarna menar att AI bara kan kopiera befintliga konventioner medan människor skapar något nytt.

Källor: Computer Sweden

Morgonkoll: Nedåt i Asien – Anthropic ansöker om börsnotering

Anthropic, skapare av AI-chatboten Claude, har ansökt om börsnotering enligt morgonens rapporter. Företaget, som konkurrerar direkt med OpenAI:s ChatGPT, har tidigare samlat in miljardbelopp från investerare inklusive Amazon och Google. En börsintroduktion skulle ge allmänheten chansen att investera i en av de mest framstående aktörerna inom generativ AI.

Källor: Dagens Industri

GitHubs plan för AI-agenter

GitHub, som startade den moderna AI-kodningstrenden med Copilot, presenterar sin strategi för att hantera den explosiva tillväxten av autonoma kodningsagenter. Plattformen upplever påfrestningar från den ökade användningen av AI-verktyg och behöver anpassa sig för framtidens utveckling.

Källor: Latent Space

Anthropic tar första steget mot börsen

AI-jätten Anthropic har lämnat in börsregistrering till SEC som första steg mot börsnotering, med ett värde på 965 miljarder dollar efter senaste investeringsrundan. Konkurrenten OpenAI väntas också börsnoteras snart och värderas till 852 miljarder dollar – en intressant kapplöpning mellan de två rivalerna som grundades av före detta OpenAI-anställda för fem år sedan.

Källor: Computer Sweden

Industriella mjukvaruledare bygger autonoma AI-ingenjörer med NVIDIA NemoClaw

NVIDIA och över ett dussin ingenjörsmjukvaruföretag utvecklar AI-verktyg som automatiserar hela designprocessen - från CAD-design till simulering och rapportgenerering. Medan tidigare genombrott komprimerat simuleringstider från veckor till timmar, fokuserar denna satsning på att automatisera alla steg runt omkring simuleringarna.

Källor: NVIDIA AI Blog

OpenAI föreslår internationellt institut för ungdomars AI-säkerhet

OpenAI vill att världens länder ska skapa ett internationellt institut för att skydda unga människor från AI-relaterade risker. Förslaget kommer som svar på växande oro över hur AI påverkar barn och tonåringar, särskilt när det gäller deepfakes och skadligt innehåll. Initiativet skulle utveckla globala standarder och säkerhetsåtgärder specifikt för yngre användare.

Källor: OpenAI Blog

AI-agenter använder dialog för att identifiera säkerhetsrisker

Forskare har utvecklat HAZDIAL, ett system där flera AI-agenter diskuterar med varandra för att hitta säkerhetsrisker i industriella system - istället för att bara låta en AI göra bedömningen ensam. Studien visar att strukturerade dialoger mellan agenter (både adversariella debatter och konstruktiva diskussioner) ger bättre resultat än traditionella metoder för riskanalys.

Källor: arXiv cs.AI

Microsoft lanserar verktyg för AI-testning med textbeskrivningar

Microsoft släppte på tisdag ett open source-verktyg kallat Adaptive Spec-driven Scoring som låter utvecklare skapa AI-tester genom att bara beskriva önskat beteende i text. Verktyget syftar till att göra det enklare att utvärdera och testa AI-system utan att behöva skriva komplicerad testkod.

Källor: TechCrunch AI

EU:s AI-satsning på 20 miljarder euro stöter på problem

EU:s ambitiösa plan att bygga fem stora datacenter för AI med en budget på 20 miljarder euro har drabbats av förseningar och finansieringsproblem. Projektet, som är centralt för EU:s AI-strategi, möter nu ökad osäkerhet kring både tidsplan och hur de enorma kostnaderna ska täckas.

Källor: Dagens Industri

Finansinstitut konvergerar mot transaktionsbaserade grundmodeller för egen AI

Banker och andra finansföretag börjar överge sina isolerade AI-system för kreditbedömning och bedrägeridetektering till förmån för stora transaktionsbaserade grundmodeller. Tanken är att få en mer heltäckande bild av kunders finansiella beteende genom att träna en enda AI-modell på all transaktionsdata, istället för att ha separata system som inte pratar med varandra.

Källor: NVIDIA AI Blog

Legora fortsätter shoppa – köper Cadastral

AI-juristen Legora gör sitt senaste förvärv genom att köpa amerikanska Cadastral. Företaget fortsätter sin shoppingrunda för att bygga ut sin AI-baserade juridiska tjänsteplattform.

Källor: Breakit

Oplane tar in 50 miljoner för att förhindra AI-kodfel

Malmöbolaget Oplane har säkrat 50 miljoner kronor för sin tjänst som hjälper utvecklare undvika buggar när de kodar med AI-verktyg. Idén är att medan AI gör kodning supersnabb, så ökar också risken för fel – något Oplane vill lösa.

Källor: Breakit

Amazon stäms för Rings ansiktsigenkänning

Amazon får en grupptalan på halsen efter att Ring-kamerornas ansiktsigenkänningsfunktion påstås lagra bilder på förbipasserande utan tillstånd. Funktionen "Familiar Faces" analyserar ansikten för att känna igen bekanta personer, men nu hävdar en Virginia-boende att detta sker utan samtycke från slumpmässiga fotgängare.

Källor: TechCrunch AI

Vad tyckte du om dagens digest?

AI-agenter börjar erkänna sina brister

AI-agenter får uppgiftsdrift när moral krockar med roller

Trumps AI-förordning blir tandlös efter teknikjättarnas protester

Microsoft lanserar Scout för att konkurrera med OpenClaw

Google samlar in 750 miljarder för att hänga med i AI-racet

Dagens siffra

Snabbkollen

Färskbryggt AI varje morgon