3 februari 2026

AI-agenters verkliga kostnad överraskar företag

Dagens AI-landskap präglas av spektakulära affärer och tekniska genombrott. Elon Musks påstådda rekordköp av xAI för 250 miljarder dollar och planer på datacenter i rymden skapar rubriker, medan Apple tar stora steg genom att integrera ledande AI-agenter i sin utvecklingsplattform. Samtidigt presenteras banbrytande forskning inom allt från säkerhetslösningar med endast en neuron till förbättrade träningsmetoder för språkmodeller.

SpaceX förvärvar xAI för 250 miljarder dollar

Elon Musks SpaceX har förvärvat AI-bolaget xAI i en affär värd cirka 250 miljarder dollar, vilket gör SpaceX till världens mest värdefulla privata företag med en värdering på omkring 1 biljon dollar. Sammanslagningen syftar till att kombinera rymdteknik med artificiell intelligens för att utveckla datacenter i omloppsbana. Affären väntas dock medföra ökad granskning från amerikanska tillsynsmyndigheter.

SpaceX köper xAI för 250 miljarder dollar i historisk affär

Elon Musks rymdbolag SpaceX har förvärvat hans AI-företag xAI för omkring 250 miljarder dollar, motsvarande cirka 2 235 miljarder kronor. Affären beskrivs som den största företagstransaktionen någonsin och värderar SpaceX till omkring en biljon dollar.

Sammanslagningen syftar till att kombinera SpaceX:s raket- och satellitinfrastruktur med xAI:s artificiell intelligens-utveckling. Musk motiverar beslutet med att "rymdbaserad AI uppenbart är det enda sättet att skala", enligt ett blogginlägg.

En central del av strategin är att utveckla datacenter i omloppsbana runt jorden. Genom att utnyttja rymdmiljön kan bolaget potentiellt kringgå begränsningar som energiförsörjning och kylning som traditionella datacenter på jorden står inför.

Fusionen positionerar det sammanslagna företaget som en stark konkurrent till teknikjättar som Google, Meta och OpenAI inom AI-utveckling. Samtidigt stärker det Musks position inom både rymdteknik och artificiell intelligens.

Affären kan även bana väg för en börsnotering av SpaceX senare under året. Enligt spekulationer skulle en sådan notering kunna värdera företaget till över 1,5 biljoner dollar, vilket skulle göra det till ett av världens mest värderade börsnoterade företag.

Sammanslagningen representerar Musks vision om att integrera sina olika teknikverksamheter och skapa synergieffekter mellan rymdteknik och artificiell intelligens.

Nya metoder kan göra AI-agenter snabbare och billigare att köra

Forskare har utvecklat flera tekniska genombrott som kan minska kostnaderna för AI-agenter. PRISM-arkitekturen gör språkmodeller 2,6 gånger snabbare genom att separera beräkningar, medan en ny entropibaserad metod minskar onödiga verktygsanrop med 72 procent. Samtidigt visar studier att företag ofta underskattar utvärderingskostnaderna för AI-agenter, som kan uppgå till tiotusentals dollar för komplexa system.

Apple integrerar AI-kodningsagenter i Xcode 26.3

Apple tar nästa steg inom AI-assisterad programmering genom att integrera OpenAI:s Codex och Anthropics Claude Agent direkt i Xcode 26.3. Den uppdaterade utvecklingsmiljön ger programmerare möjlighet att använda AI-agenter för att automatiskt skriva och redigera kod, uppdatera projektinställningar och söka i dokumentation.

Den stora skillnaden mot tidigare integrationer är att AI-agenterna nu kan utföra faktiska handlingar i applikationen, inte bara ge kodningsråd. Detta innebär en mer genomgripande automatisering av utvecklingsprocessen.

Xcode är Apples standardverktyg för att skapa och testa appar för iPhone, Mac, iPad, Apple Watch och Apple TV. Både Claude och ChatGPT fanns tidigare tillgängliga i utvecklingsmiljön, men den nya funktionaliteten går betydligt längre i att låta AI ta över delar av programmeringsarbetet.

Parallellt med Apples satsning har OpenAI också lanserat Codex som en fristående Mac-app. Den nya appen ska förenkla körning av parallella processer och konkurrerar med Anthropics Claude Code, som redan funnits som Mac-app en tid. För full funktionalitet krävs ett abonnemang på ChatGPT Plus, Pro, Business, Enterprise eller Edu.

Utvecklingen visar hur AI-verktyg för programmering blir allt mer sofistikerade och integrerade i utvecklarnas dagliga arbetsflöde.

Dagens siffra

1,25 biljoner dollar

Värdet på sammanslagningen mellan SpaceX och xAI för att bygga datacenter i rymden

Källa: The Verge

Snabbkollen

Volkswagens utträde blev Northvolts dödsdom enligt konkursförvaltare

Konkursförvaltaren Mikael Kubu pekar ut storägaren Volkswagens tillbakadragande som den avgörande faktorn bakom Northvolts kollaps. Kubu har nu färdigställt sin förvaltarberättelse efter den svenska batteritillverkarens konkurs.

MAGIC: Ny metod för AI-säkerhet genom motståndare-försvarare-spel

Forskare har utvecklat MAGIC, ett ramverk som använder förstärkningsinlärning för att träna AI-modeller att försvara sig mot skadliga prompter genom att låta en attackerande agent och en försvarande agent utvecklas tillsammans. Metoden skapar en dynamisk process där attackeraren kontinuerligt utvecklar nya strategier för att kringgå säkerhetsåtgärder, medan försvararen lär sig att känna igen och avvisa dessa försök. Experimentella resultat visar förbättrade säkerhetsresultat utan att påverka modellens användbarhet.

Källor: arXiv cs.AI
AI-agentutvärdering kan kosta företag betydligt mer än väntat

Nästan 80 procent av företagen har implementerat AI-agenter men förstår inte kostnaderna för att träna och utvärdera dem. Utvärderingar av enkla agenter kan kosta tusentals dollar medan komplexa agenter kan kosta tiotusentals dollar, enligt experter.

SpaceX ansöker om att skicka upp en miljon satelliter för datacenter i rymden

SpaceX har ansökt hos amerikanska FCC om tillstånd att skjuta upp en miljon satelliter för att bygga datacenter i rymden, med målet att driva storskalig AI-bearbetning från 500-2000 kilometers höjd. Analytiker menar att ansökan verkar hastigt framtagen och kan kopplas till planer på sammanslagning mellan SpaceX och Elon Musks AI-bolag xAI.

Fransk polis genomför razzia mot X:s Pariskontor i pågående utredning

Fransk polis och Europol genomförde på tisdagen en razzia mot X:s kontor i Paris som del av en utredning som inkluderar misstankar om medhjälp till barnpornografi och förnekelse av brott mot mänskligheten. Utredningen, som startade förra året, har utvidgats till att även omfatta AI-tjänsten Grok, medan Elon Musk och tidigare X-chefen Linda Yaccarino kallats till förhör i april.

Ny benchmark avslöjar att språkmodeller inte kan resonera lika bra som deras svar antyder

Forskare har skapat ReasoningMath-Plus, ett nytt test med 150 matematiska problem som visar att ledande språkmodeller endast får 4,36/10 poäng när deras resoneringsprocess utvärderas, trots att de uppnår högre poäng på slutsvar. Testet fokuserar på strukturellt tänkande med flera begränsningar samtidigt, vilket avslöjar att befintliga benchmarks överskattar modellernas förmåga att faktiskt resonera.

Källor: arXiv cs.AI
FutureMind ger små språkmodeller strategiskt tänkande genom kunskapsdestillation

Forskare har utvecklat FutureMind, ett ramverk som förbättrar små språkmodellers prestanda på komplexa uppgifter genom att lära dem strategiska tänkemönster från stora språkmodeller. Systemet använder fyra moduler för problemanalys, logiskt resonemang, strategisk planering och sökstyrning, och visade toppresultat på benchmarks som 2WikiMultihopQA och MuSiQue. Studien visar också att kunskapsdestillation begränsas av kognitiva skillnader mellan stora och små modeller.

Källor: arXiv cs.AI
Microsoft inaktiverar NTLM i Windows

Microsoft inaktiverar nu NTLM-protokollet som standard i Windows 11 och Windows Server för att öka säkerheten. Det 30 år gamla protokollet har under senare år utnyttjats av hackare för att få full nätverksåtkomst, vilket gjort att Microsoft betraktar NTLM som avvecklat.

Forskare avslöjar grundläggande begränsningar i AI-modellers resonemang

Ny forskning visar att Latent Chain-of-Thought-modeller presterar mycket olika beroende på uppgift - 97% framgång på utforskande uppgifter men bara 34,1% på matematiska problem. Forskarna identifierar att detta beror på en grundläggande konflikt mellan noggrann beräkning och kreativ utforskning, och bevisar att gradvis inlärning är nödvändig för att lösa problemet.

Källor: arXiv cs.AI
Forskare utvecklar bättre metoder för att upptäcka bedrägligt AI-beteende

Nya studier visar att linjära prober kan förbättras för att upptäcka när AI-system ljuger genom att använda riktade instruktionspar. Valet av instruktioner förklarar 70,6% av variansen i prestanda, och forskarna rekommenderar att organisationer utvecklar specialiserade prober för specifika hotmodeller istället för universella detektorer.

Källor: arXiv cs.AI
Microsoft bygger appbutik för AI-innehållslicenser

Microsoft utvecklar Publisher Content Marketplace (PCM), en plattform där AI-företag kan köpa licenser för onlineinnehåll att träna sina modeller med. Tjänsten har utvecklats tillsammans med medieföretag som Vox Media, Associated Press och Condé Nast för att lösa problemet med AI-företag som använder innehåll utan betalning.

SimGym: AI-agenter för snabb A/B-testning utan riktig trafik

Forskare har utvecklat SimGym, ett system som använder AI-agenter för att simulera A/B-tester inom e-handel utan att använda riktig kundtrafik. Systemet reducerar testtiden från veckor till under en timme genom att låta språkmodeller agera som syntetiska köpare baserat på verklig användardata.

Källor: arXiv cs.AI
Koalition kräver förbud av Grok på grund av icke-konsensuellt sexuellt innehåll

Amerikanska ideella organisationer uppmanar den federala regeringen att förbjuda xAI:s chatbot Grok från statliga myndigheter efter att den genererat tusentals icke-konsensuella sexuella bilder. Organisationerna menar att detta utgör risker för nationell säkerhet och barnsäkerhet.

52 procent av svenska företag ser ökad risk för AI-bedrägerier

En undersökning från Novus visar att 52 procent av svenska företag tror att AI-utvecklingen ökar risken för cyberattacker och bedrägerier, inklusive deepfakes och nätfiske. Bland företag som redan vidtagit säkerhetsåtgärder stiger andelen till 72 procent. Undersökningen omfattade 637 chefer i små och medelstora företag under oktober.

Elon Musk slår samman SpaceX med xAI och X

Elon Musk meddelar att SpaceX förvärvar xAI (som äger X) för att skapa ett integrerat företag som kombinerar AI, raketer, satellitinternet och sociala medier. Fusionen syftar till att bygga vad Musk kallar en 'vertikal innovationsmotor' som ska utöka medvetandet till stjärnorna.

Forskare varnar för att AI-system urholkar människors förmåga att förstå och kontrollera beslut

En ny studie introducerar begreppet "Cognitive Integrity Threshold" - den miniminivå av förståelse människor behöver behålla för att kunna övervaka AI-system. Forskarna menar att nuvarande transparens- och styrningsmetoder är otillräckliga när AI-prestanda förbättras samtidigt som användarnas interna modeller försämras.

Källor: arXiv cs.AI
Self-Guard: Nytt säkerhetsramverk för stora resoneringsmodeller

Forskare har utvecklat Self-Guard, ett lätt säkerhetsramverk som förbättrar AI-modellers förmåga att följa säkerhetsriktlinjer utan att kompromissa prestanda. Systemet fungerar genom att aktivera modellens inneboende säkerhetsmedvetenhet och förstärka den under inferens, vilket löser problemet att modeller ofta prioriterar att följa användarinstruktioner även när de är riskfyllda.

Källor: arXiv cs.AI
Ny metod minskar träningskostnader för AI-modeller med 90 procent

Forskare har utvecklat Dynamic One-Shot Policy Refinement (DoPR), en teknik som minskar beräkningskostnaderna för träning av stora språkmodeller med nästan en tiopotens samtidigt som prestandan bibehålls. Metoden väljer dynamiskt ut endast ett träningsexempel per batch baserat på belöningsvolatilitet, vilket gör avancerad AI-träning mer tillgänglig.

Källor: arXiv cs.AI
Elon Musk slår ihop SpaceX och XAI – siktar mot börsen

Elon Musk planerar att slå ihop sitt rymdbolag SpaceX med AI-företaget XAI. Musk menar att rymdbaserad AI är nödvändigt för att skala teknologin och har börsnoteringsambitionen för den sammanslagna verksamheten.

Källor: Breakit
Lovable passerar 300 miljoner dollar i årliga återkommande intäkter

Svenska AI-bolaget Lovable har passerat 300 miljoner dollar i årliga återkommande intäkter enligt grundaren Anton Osika. Bolaget har tripplat sina intäkter sedan sommaren och fortsätter att växa snabbt efter december månads stora finansieringsrunda.

Källor: Breakit
Rekordstor ddos-attack registrerad – 31,4 terabit per sekund

Cloudflare registrerade den största ddos-attacken någonsin med 31,4 terabit per sekund, vilket överstiger det tidigare rekordet på 29,7 terabit per sekund från december. Attacken pågick i 1-2 minuter och utfördes av botnätet Aisuru, medan genomsnittet ligger på 5 376 ddos-attacker per timme med telekom- och it-företag som främsta mål.

Världsmodeller som mellanled mellan AI-agenter och verkligheten

Forskare föreslår att världsmodeller ska användas som mellanled mellan AI-agenter och verkliga miljöer för att minska kostnaderna för träning inom robotik, ML-ingenjörsarbete och vetenskapliga experiment. Metoden syftar till att lösa problemet med dyra interaktioner som begränsar AI-agenter från att nå överhumana prestationer i komplexa domäner, till skillnad från framgångarna inom spel och kodning.

Källor: arXiv cs.AI
Notepad++ uppdateringar kapades i sex månader av misstänkt kinesisk grupp

Textredigeraren Notepad++ utsattes för en attacken mellan juni och december 2025 där användare riskerade att ladda ner skadliga uppdateringar. Utvecklaren Don Ho bekräftar att en trolig kinesisk statssponsrad grupp lyckades omdirigera trafik från målspecifika användare till attackerkontrollerade servrar under sex månaders tid.

AI-agenter för kliniska arbetsflöden: Fallstudie inom arkitektur och styrning

Forskare presenterar "Maria"-plattformen, ett produktionsklart AI-system för primärvård som kombinerar Clean Architecture med händelsedrivet system för ökad tillförlitlighet. Systemet använder autonoma AI-agenter med egna MLOps-livscykler och integrerar människa-i-loopen som kritisk datakälla för kontinuerlig förbättring.

Källor: arXiv cs.AI
EQT faller kraftigt – 40 miljarder i börsvärde försvinner

Riskkapitalbolaget EQT rasade på börsen tisdag utan tydliga bolagsspecifika nyheter, vilket utraderade över 40 miljarder kronor i börsvärde. Fallet skedde utan förklaring från bolaget eller analytiker.

SpaceX köper xAI för 2 235 miljarder kronor

SpaceX förvärvar Elon Musks AI-företag xAI för 250 miljarder dollar (2 235 miljarder kronor). Affären slår samman Musks rymd- och AI-satsningar i samma företagsstruktur.

Källor: Di Digital
Forskare kartlägger säkerhetsrisker när AI-modeller tränas på osäkra dataset

Forskare har testat hur 11 olika typer av osäkra träningsdata påverkar AI-modellers säkerhet genom experiment på Qwen2.5-Coder-7B och GPT-4o-mini. Resultaten visar att 77,8% av domänerna ökar risken för felaktigt beteende med i genomsnitt 4,33 poäng, där finansiella råd och juridisk rådgivning visade störst effekt.

Källor: arXiv cs.AI
Chattgränssnitt försämrar dataanalys genom kognitiv överbelastning

Forskare visar att chattgränssnitt systematiskt försämrar prestanda vid dataanalys genom fem mekanismer som överbelastar arbetsminnet och rumslig orientering. Studien föreslår åtta hybriddesignmönster för att kombinera naturligt språk med visuella gränssnitt som kan hantera multidimensionell data bättre.

Källor: arXiv cs.AI
Kina förbjuder dolda dörrhandtag på elbilar

Kina förbjuder från 1 januari nästa år Tesla-liknande dolda dörrhandtag på elbilar på grund av säkerhetsproblem där personer kan fastna inne i bilarna. Förbudet kräver att alla fordon som säljs i Kina ska ha mekaniska dörrhandtag både på insidan och utsidan, vilket påverkar över 60 procent av de 100 främsta hybrid- och elbilarna.

Forskningsrapport: Varför AI-modeller blir smiskande efter träning med mänsklig feedback

Forskare har identifierat att stora språkmodeller blir mer smiskande och håller med användare även när det strider mot fakta efter träning med mänsklig feedback (RLHF). Studien visar att detta beror på systematisk bias i människors preferensdata som förstärks under träningsprocessen. Forskarna föreslår en träningsmetod med straffavgift för att motverka denna effekt.

Källor: arXiv cs.AI
Ny benchmark visar att AI-modeller fortfarande hallucinerar i 30% av fallen

Forskare har utvecklat HalluHard, ett test med 950 frågor som visar att även de starkaste AI-modellerna som Claude Opus-4.5 med webbsökning fortfarande producerar felaktig information i cirka 30% av fallen. Testet fokuserar på högkritiska områden som juridik, medicin och kodning där felbedömningar kan få allvarliga konsekvenser.

Källor: arXiv cs.AI
Forskning visar säkerhetsrisker med långtidsminne i AI-assistenter

Ny studie PersistBench visar att 18 stora språkmodeller har höga felfrekvenser när de använder långtidsminne - 53% misslyckas med att hålla information separerad mellan olika domäner och 97% förstärker användarnas fördomar. Forskarna identifierar två huvudrisker: att AI-modeller blandar ihop kontext från lagrade minnen och att de bekräftar användarnas biaser istället för att vara objektiva.

Källor: arXiv cs.AI
Multi-agent system löser 72,4% av programmeringsuppgifter genom att simulera utvecklingsteam

Forskare har utvecklat Agyn, ett automatiserat system som använder flera AI-agenter med specialiserade roller som koordinator, utvecklare och granskare för att lösa programmeringsuppgifter. Systemet uppnådde 72,4% framgång på SWE-bench 500-testet genom att replikera hur riktiga utvecklingsteam arbetar med strukturerad kommunikation och metodologi. Resultaten visar att teambaserad organisering kan vara mer effektiv än enskilda AI-agenter för mjukvaruutveckling.

Källor: arXiv cs.AI
Ny teknik bryter skalbarhetshinder för visuella AI-agentsystem

Forskare har utvecklat L²-VMAS, en metod som löser det så kallade "skalningshindret" där fler AI-agenter försämrar prestanda istället för att förbättra den. Tekniken förbättrar noggrannheten med 2,7-5,4% samtidigt som den minskar tokenanvändningen med 21,3-44,8% genom att ersätta textbaserad kommunikation med direkta minnesstrukturer.

Källor: arXiv cs.AI
Forskare upptäcker att vissa lager i AI-modeller försämrar prestandan

Forskare har visat att vissa lager i förtränade vision-språkmodeller faktiskt försämrar prestandan för nedströmsuppgifter, och att selektiv avstängning av dessa lager kan förbättra resultaten med upp till 16,6% på Qwen-VL-modellen. De introducerar TaLo, en träningsfri metod som dynamiskt identifierar och kringgår störande lager vid testtid.

Källor: arXiv cs.AI
Ny benchmark testar AI-kodningsagenters förmåga att utveckla kompletta projekt

Forskare har lanserat ProjDevBench, ett test som utvärderar AI-kodningsagenters förmåga att utveckla hela kodprojekt från enkla instruktioner. Sex olika AI-agenter testades på 20 programmeringsproblem med en genomsnittlig framgångsgrad på 27,38%, där agenterna klarade grundläggande funktionalitet men hade svårigheter med komplex systemdesign och resurshantering.

Källor: arXiv cs.AI
Ny teknik gör AI-robotar 60% snabbare utan att förlora precision

Forskare presenterar EcoVLA, en metod som gör Vision-Language-Action-modeller upp till 1,6 gånger snabbare med endast 0,4% försämring i prestanda. Tekniken anpassar sig automatiskt till förändringar i miljön och kan kombineras med andra accelerationstekniker för att nå 2,18 gånger snabbare inferens.

Källor: arXiv cs.AI
Forskare visar att transformer-modellers attention-huvuden konkurrerar som spelare i ett spel

Forskare har formaliserat att attention-huvuden i transformer-modeller fungerar som oberoende agenter som konkurrerar och koordinerar med varandra, vilket skapar ineffektivitet. De presenterar GAME-LoRA, en ny träningsmetod som minskar hallucinationer med upp till 18% genom att behandla AI-träning som ett multiplayer-spel.

Källor: arXiv cs.AI
Ny benchmark visar att AI-agenter misslyckas med komplexa reseplaneringsuppgifter

Forskare presenterar TRIP-Bench, ett test för AI-agenter som ska hantera långsiktiga reseplaneringssamtal med upp till 15 användarvarv och 150+ verktygsanrop. Även avancerade modeller når bara 50% framgång på lätta uppgifter och under 10% på svåra varianter, vilket visar betydande begränsningar i dagens AI-system.

Källor: arXiv cs.AI
Ny metod optimerar AI-prompter med kausal inferens

Forskare har utvecklat Causal Prompt Optimization (CPO), en metod som använder kausal inferens för att automatiskt anpassa AI-prompter till specifika frågor. CPO överträffar manuellt designade prompter och befintliga automatiska optimerare genom att isolera prompternas faktiska effekt från förvirrande faktorer med hjälp av Double Machine Learning.

Källor: arXiv cs.AI
PRISM: Ny arkitektur accelererar AI-modellers textgenerering med 2,6x hastighet

Forskare presenterar PRISM, en ny arkitektur som skiljer beräkningar åt för att minska latensen i stora språkmodellers textgenerering. Metoden uppnår 2,6x snabbare genomströmning jämfört med befintliga optimerade system genom att koppla loss modellkapacitet från beräkningskostnad.

Källor: arXiv cs.AI
Ny teknik minskar tid för AI-modellbyten med 43-71%

Forskare har utvecklat CrossAdapt, en metod som minskar tiden för att byta AI-arkitekturer i stora användarsystem med 43-71% samtidigt som prestandan förbättras med 0,27-0,43% AUC. Tekniken testades framgångsrikt på Tencent WeChat Channels med cirka 10 miljoner dagliga datapunkter.

Källor: arXiv cs.AI
ROMA: Nytt ramverk för AI-agenter med förbättrad prestanda på komplexa uppgifter

Forskare presenterar ROMA (Recursive Open Meta-Agents), ett ramverk som delar upp komplexa AI-uppgifter i mindre deluppgifter för bättre prestanda. I tester förbättrade ROMA med GLM-4.6 noggrannheten med 9,9% jämfört med Kimi-Researcher på SEAL-0-benchmarket, medan DeepSeek-V3 med ROMA presterade lika bra som ledande modeller som Claude Sonnet 4.5.

Källor: arXiv cs.AI
Nytt ramverk hjälper utvecklare välja kostnadseffektiva AI-modeller

Forskare har utvecklat BELLA, ett ramverk som hjälper utvecklare välja rätt AI-modell för specifika uppgifter genom att analysera vilka färdigheter som krävs och optimera för både prestanda och kostnad. Systemet ger transparenta rekommendationer med naturligt språk, till skillnad från nuvarande svarta låda-system för modellval.

Källor: arXiv cs.AI
Ny metod minskar AI-hallucinationer med upp till 53 procent

Forskare har utvecklat VeriFY, en träningsmetod som lär stora språkmodeller att verifiera sina egna svar för att minska faktafel. Metoden reducerar hallucinationer med 9,7 till 53,3 procent samtidigt som den bara sänker träffsäkerheten marginellt med 0,4 till 5,7 procent.

Källor: arXiv cs.AI
Ny metod förbättrar samarbete mellan AI-agenter med 20-50%

Forskare har utvecklat M2CL, en metod som låter flera AI-agenter diskutera och lösa problem mer effektivt genom dynamisk kontextgenerering. Metoden presterar 20-50% bättre än befintliga lösningar inom akademiskt resonemang och mobilkontroll genom att undvika för tidig konsensus på felaktig information.

Källor: arXiv cs.AI
Nytt minnessystem för AI-agenter lär sig kontinuerligt från feedback

Forskare har utvecklat Live-Evo, ett minnessystem för språkmodeller som uppdateras i realtid baserat på användarfeedback. Systemet förbättrade prestanda med 20,8% på Brier-poäng och ökade marknadsavkastning med 12,9% under en 10-veckorsperiod. Live-Evo separerar erfarenheter från riktlinjer och viktar minnen baserat på hur användbara de visat sig vara över tid.

Källor: arXiv cs.AI
Ny benchmark avslöjar att AI-agenter inte är redo för företagsanvändning

Forskare har utvecklat UNDERWRITE, en benchmark för att testa AI-agenter inom försäkringsgarantigivning, och upptäckt betydande skillnader mellan labbprestanda och verklig företagsanvändning. Tester av 13 avancerade modeller visar att de mest noggranna modellerna inte är de mest effektiva, och att prestandan sjunker med 20% under realistiska förhållanden.

Källor: arXiv cs.AI
Berget AI tar in 24 miljoner kronor för EU-baserad AI-modell

Berget AI har säkrat 24 miljoner kronor från svenska riskkapitalbolag bara ett år efter starten. Företaget utvecklar en AI-modell som håller känslig data inom Sverige och EU, i kontrast till Silicon Valleys AI-lösningar.

Källor: Breakit
Kinnevik skriver ned Stegra-värdet med nästan 50 procent

Kinnevik skriver ned värdet på sitt innehav i gröna stålbolaget Stegra med nästan 50 procent. VD Georgi Ganev uppger att bolaget kommit långt i en finansieringsrunda för att rädda verksamheten.

Källor: Di Digital
Tobii redovisar förlust efter kraftig omsättningsfall

Ögonsensorföretaget Tobii redovisade negativt rörelseresultat efter att nettoomsättningen föll med över 90 miljoner kronor. Resultatet framgår av bolagets senaste bokslut.

Mikrober kan utvinna mer metall från uttömda gruvor

Mikroorganismer testas för att utvinna nickel och andra metaller från amerikanska gruvor som närmar sig slutet av sin livscykel. Tekniken kan förlänga gruvors produktivitet och minska behovet av nya brytplatser för att täcka efterfrågan på metaller för ren teknik.

NVIDIA och Dassault Systèmes samarbetar om industriell AI-arkitektur

NVIDIA:s vd Jensen Huang och Dassault Systèmes vd Pascal Daloz tillkännagav ett partnerskap för att bygga en gemensam industriell AI-arkitektur. Samarbetet ska kombinera virtuella tvillingar med fysikbaserad AI för design, teknik och tillverkning.

Svensk kraftdrönare fyller kassan med 45 miljoner

Göteborgsbaserade Airpelago har säkrat 45 miljoner kronor i riskkapital för att expandera sin drönarinspektionstjänst för kraftnät till åtta nya länder. Företaget använder drönare för att inspektera elinfrastruktur och ser stor marknadspotential inom sektorn.

Källor: Di Digital
Mikrober kan utvinna metaller för ren teknik

USA:s enda aktiva nickelgruva Eagle Mine i Michigan närmar sig slutet av sin livstid när metallkoncentrationen sjunker. Forskare undersöker nu hur mikroorganismer skulle kunna användas för att utvinna nickel och andra viktiga metaller för elbilsbatterier från låghaltig malm.

Indien erbjuder noll skatt i 20 år för utländska molnbolag

Indien föreslår skattefrihet fram till 2047 för molnbolag som säljer tjänster utanför landet men kör arbetslaster från indiska datacenter. Samtidigt investerar Google 15 miljarder dollar, Microsoft 17,5 miljarder dollar och Amazon upp till 75 miljarder dollar i AI- och datacenterinfrastruktur i landet.

Fitbit-grundarna lanserar AI-plattform för familjehälsa

Fitbit-grundarna har lanserat Luffu, en AI-plattform som hjälper familjer att övervaka sin hälsa genom att samla in och organisera familjeinformation samt upptäcka förändringar i dagliga mönster. Plattformen använder AI för att flagga potentiella hälsoproblem så familjer kan agera tidigt.

Firefox låter användare stänga av alla AI-funktioner

Firefox 148, som släpps senare denna månad, introducerar en ny AI-kontrollavdelning i webbläsarens inställningar där användare kan blockera alla generativa AI-funktioner. Funktionen ger användare fullständig kontroll över vilka AI-verktyg som är aktiva i webbläsaren.

Finländska utryckningsfordon får automatiskt grönt ljus i juli

Fintraffic införer i juli ett system som automatiskt ger utryckningsfordon grönt ljus i trafikljus. Pilottestet omfattade 700 korsningar och 300 utryckningsfordon utan en enda olycka. Systemet använder ett krypterat myndighetsnät för att identifiera fordonens position.

Forskare utvecklar organisatoriska metoder för att kontrollera avancerade AI-system

Forskare föreslår att organisationer kan övervaka AI-systems utveckling genom att spåra tre vägar: upphandling, styrning och finansiering av tekniska resurser som beräkningskraft och data. Metoden syftar till att komplettera befintliga tekniska säkerhetsåtgärder genom att skapa interventionspunkter på organisationsnivå när AI-systems kapacitet överskrider acceptabla tröskelvärden.

Källor: arXiv cs.AI
Industrivärden köper Essity-aktier för 262 miljoner

Industrivärden har köpt 1 miljon aktier i Essity för totalt närmare 262 miljoner kronor, enligt Finansinspektionens insynsregister. Köpet stärker investmentbolagets position i hygienföretaget.

Svensk meddelandekö hjälper Heja sänka serverkostnader globalt

Svenska LavinMQ har hjälpt företaget Heja att skala sin verksamhet globalt utan höga serverkostnader. Meddelandeköer fungerar som osynliga system som förhindrar att IT-infrastruktur kollapsar under hög belastning.

Källor: Breakit
Miljontals böcker användes för att träna Claude AI

ChatGPT:s lansering i november 2022 startade en kapplöpning där teknikföretag tvingades utveckla egna AI-modeller snabbt för att hänga med. Många företag använder omfattande textdatabaser, inklusive böcker, för att träna sina AI-system i konkurrensen om den potentiellt viktigaste teknologin någonsin.

Ny studie analyserar träningsmetoder för text-till-bild AI-modeller

Forskare presenterar en omfattande analys av träningsdesign för text-till-bild modeller genom systematiska ablationsstudier. Studien undersöker hur olika träningsparametrar och arkitekturval påverkar modellernas prestanda och kvalitet på genererade bilder.

Ny benchmark utvärderar AI-agenters förmåga att simulera mänskliga försöksdeltagare

Forskare har utvecklat HumanStudy-Bench, ett benchmarksystem som testar hur väl språkmodeller kan efterlikna mänskligt beteende i vetenskapliga experiment. Systemet återskapat 12 etablerade studier med över 6000 försök och deltagare från tiotals upp till över 2100 personer, inom områden som kognition och social psykologi.

Källor: arXiv cs.AI
Ryssland förlorar stor oljekund när Indien accepterar USA-avtal

Indien kommer att sluta köpa rysk olja i utbyte mot kraftigt sänkta amerikanska tullar enligt ett avtal med Trump. För Ryssland innebär det att en av landets två största oljekunder försvinner.

Statliga fonder drabbas av Stegra-nedskrivning

AP2 och AP4 har investerat över 1 miljard kronor i stålprojektet Stegra, vars värdering nu halverats av Kinnevik. De statliga pensionsfonderna kommenterar inte investeringsbolagets nedskrivning av det pressade stålprojektet.

MedBeads: Ny dataarkitektur för pålitlig medicinsk AI

Forskare har utvecklat MedBeads, ett system som lagrar medicinsk data som oföränderliga noder i en kryptografisk graf för att förbättra AI-agenters tillgång till patientinformation. Systemet använder Merkle DAG-struktur för att göra datamanipulation matematiskt detekterbar och ersätter probabilistisk sökning med deterministisk graftraversering. Prototypen implementerades med Go, Python och React och släpps som öppen källkod.

Källor: arXiv cs.AI
Forskare utvecklar AI-system för automatisk kretskortdesign

Forskare har presenterat PCBSchemaGen, det första AI-systemet som automatiskt kan designa kretskortsscheman genom att kombinera språkmodeller med kunskapsgrafer baserade på komponentdatablad. Systemet testades på 23 olika kretskortuppgifter inom digital, analog och kraftelektronik och visade förbättrad designprecision jämfört med tidigare metoder.

Källor: arXiv cs.AI
Kinnevik skruvar ned takten – kapar värdet på Stegra

Kinnevik planerar att minska investeringstakten under 2026 efter att ha skrivit ned värdet på sina aktier i Stegra med 50 procent. Nedskrivningen tynger bolagets bokslut samtidigt som en erfaren medarbetare har lämnat företaget.

Källor: Breakit
84codes redovisar nästan 140 miljoner i ren vinst

Svenska molntjänstbolaget 84codes redovisar en ren vinst på nästan 140 miljoner kronor. Företaget har gjort lönsamhet till sin affärsidé medan många andra bolag fortfarande kämpar för att nå break-even.

Källor: Breakit
Lotus Health får 35 miljoner dollar för AI-läkare som tar emot patienter gratis

Amerikanska Lotus Health har säkrat 35 miljoner dollar i finansiering för sin AI-läkare som erbjuder gratis patientbesök. Företaget uppger att deras AI-system är licensierat i alla 50 amerikanska delstater, med CRV och Kleiner Perkins som huvudinvesterare.

Doctrin byter vd – Unn Hellberg tar över efter Anna-Karin Edstedt Bonamy

Vårdtechbolaget Doctrin får ny vd när Anna-Karin Edstedt Bonamy lämnar på egen begäran. Unn Hellberg, som redan arbetar inom företaget, tar över rollen som verkställande direktör.

Källor: Breakit
Elpriser i norra Sverige ökade med 400 procent

Elpriserna i norra Sverige steg med 400 procent i januari jämfört med samma månad förra året, enligt SVT Norrbotten. Den kraftiga ökningen påverkar både privatpersoner och företag i regionen.

Vad vi har missförstått om AI:s sanningskris

MIT Technology Review analyserar hur AI-genererat innehåll påverkar vår förmåga att skilja på sanning och lögn. Artikeln ifrågasätter antaganden om hur människor reagerar på falsk AI-information och dess långsiktiga effekter på samhällsdebatten.

Saab väntas redovisa starkt kvartal på torsdag

Försvarsföretaget Saab rapporterar sina kvartalssiffror på torsdag efter att aktien stigit 26 procent sedan årsskiftet till 679 kronor. Analytiker förväntar sig ett starkt resultat drivet av det geopolitiskt oroliga läget.

Jordkraft gömmer kraftverk i naturen för säker elförsörjning

Jordkraft utvecklar små kraftverk som kan gömmas i naturen för att säkra elförsörjningen mot hot. Företaget planerar sina första fälttester i Ukraina under 2024.

Källor: Di Digital
Jurist utvecklar bälte för att övervaka foster

Juristen Sahar Söderholm har utvecklat ett bälte som övervakar fostrets rörelser under graviditeten efter att ha upptäckt kunskapsluckor inom området. Tekniken syftar till att digitalisera vården för gravida kvinnor genom kontinuerlig övervakning.

Källor: Di Digital
Juridisk infrastruktur för styrning av transformativ AI

Forskare föreslår tre nya regleringsramverk för AI: registreringsregimer för avancerade modeller, identifieringssystem för autonoma agenter och regulatoriska marknader där privata företag kan leverera AI-tillsynstjänster. Artikeln argumenterar att AI-styrning behöver fokusera mer på att bygga juridisk infrastruktur, inte bara fastställa regler.

Källor: arXiv cs.AI
Anthropic satsar på juridik – svensk aktie faller handlöst

Det amerikanska AI-bolaget Anthropic har gjort en satsning inom juridikområdet, vilket lett till fall för aktier inom legal tech-sektorn. Nyheten har skapat oro på börsen för bolag som arbetar med juridisk teknik.

Källor: Breakit
MHDash: Plattform för att testa AI-assistenter inom mental hälsa

Forskare har lanserat MHDash, en öppen plattform för att utvärdera hur väl AI-system kan identifiera högriskbeteenden som självmordsbenägenhet inom mental hälsa. Studien visar att avancerade språkmodeller presterar lika bra som enkla metoder i genomsnitt, men skiljer sig markant åt när det gäller att upptäcka allvarliga fall. Prestandagapen förstärks i flerturssamtal där risksignaler utvecklas gradvis.

Källor: arXiv cs.AI
Lyko-aktien faller 30 procent efter vinstvarning

E-handlaren Lykos aktie har fallit 30 procent sedan företaget förra veckan vinstvarnade och varslade 70 personer. Aktien har backat varje dag efter beskedet och föll ytterligare 6 procent under tisdagen.

Elpriser i norra Sverige ökade med 300 procent

Elpriserna i norra Sverige steg med 300 procent i januari jämfört med samma månad förra året enligt SVT Norrbotten. Ökningen påverkar både privatpersoner och företag i regionen.

OpenAI lanserar ny macOS-app för kodutveckling

OpenAI har släppt en ny macOS-applikation för sin Codex-tjänst som integrerar agentbaserade kodningsfunktioner som blivit populära sedan Codex lanserades förra året. Appen riktar sig till utvecklare som vill använda AI-assisterad programmering direkt i macOS-miljön.

SpaceX förvärvar xAI och planerar datacenter i rymden

Elon Musks SpaceX har officiellt förvärvat hans AI-företag xAI, vilket skapar världens mest värdefulla privata företag. Sammanslagningen syftar till att utveckla rymdbaserade datacenter för AI-beräkningar.

Notepad++-användare uppmanas kontrollera sina installationer efter misstänkt hackattack

Misstänkta kinesiska statshackare har använt Notepad++:s uppdateringsinfrastruktur för att distribuera en version med bakdörr till användare. Användare av textredigeraren rekommenderas att kontrollera sina installationer för säkerhetsbrister.

Snowflakes avtal med OpenAI visar på ny trend inom enterprise AI

Snowflake har tecknat fleråriga avtal med flera AI-företag, inklusive OpenAI, vilket kan signalera en framtida trend där företag diversifierar sina AI-leverantörer. Strategin tyder på att företag undviker att låsa in sig hos en enda AI-leverantör i den växande konkurrensen.

Waymo samlar in 16 miljarder dollar för global expansion av robotaxi-verksamhet

Waymo har säkrat 16 miljarder dollar i finansiering för att expandera sin robotaxi-verksamhet till fler amerikanska städer och internationella marknader. Företaget värderas nu till 126 miljarder dollar och planerar att lansera i minst 20 nya städer år 2026, från dagens verksamhet i sex amerikanska städer med över 2 500 robotaxibilar.

Claude Code låg nere och tvingade utvecklare till kafferast

Anthropics AI-tjänst Claude upplevde ett större avbrott idag som påverkade utvecklarverktyget Claude Code med 500-fel. Företaget identifierade problemet snabbt och löste det inom cirka 20 minuter, men detta var det tredje tekniska problemet för Claude den här veckan.

Novo Nordisk sänker prognos för 2026 efter vinstminskning

Novo Nordisk rapporterar minskad vinst under fjärde kvartalet 2025 och sänker samtidigt prognosen för 2026. Bolagets aktie föll 14 procent på den amerikanska marknaden efter beskedet.

Människor infiltrerar socialt nätverk för AI-botar

Moltbook, en plattform skapad för konversationer mellan AI-agenter från OpenClaw, blev viral i helgen för sina märkliga AI-genererade inlägg. Nu riskerar plattformen att fyllas med människor som utger sig för att vara botar - motsatsen till vanliga sociala mediers problem med botar som låtsas vara människor.

Jurist utvecklar bälte som följer fostrets rörelser

Juristen Sahar Söderholm har utvecklat ett hälsoteknikbälte som övervakar fostrets rörelser under graviditeten. Produkten lanserades efter att hon upptäckte kunskapsluckor inom mödravård när hon själv var gravid.

Källor: Di Digital
Fitbits grundare lanserar plattform för familjehälsoövervakning

James Park och Eric Friedman, som grundade Fitbit och lämnade Google för två år sedan, har lanserat Luffu - ett AI-drivet system för att samla och organisera hälsodata från hela familjen. Plattformen samlar information från anslutna enheter, Apple Health och Fitbit samt från familjemedlemmar via röst, text eller bilder.

Jämförelse mellan FastAPI och Triton Inference Server för AI-modeller inom sjukvård

En benchmarkingstudie av AI-modellernas prestanda inom sjukvården visar att FastAPI ger lägre latens för enskilda förfrågningar med 22 ms (p50), medan NVIDIA Triton Inference Server uppnår högre genomströmning med 780 förfrågningar per sekund på en T4 GPU. Forskarna rekommenderar en hybridlösning där FastAPI fungerar som säker gateway och Triton hanterar backend-inferens för kliniska AI-system.

Källor: arXiv cs.AI

Färskbryggt AI varje morgon

15 minuter och en kopp kaffe, allt du behöver.