8 februari 2026

AI tar nya steg framåt med snabbare svar och säkerhetsstudier

Dagens AI-nyhetsdigest bjuder på spännande genombrott inom artificiell intelligens, där forskare presenterar banbrytande lösningar för allt från osäkerhetshantering i språkmodeller till AI-agenters förhandlingsförmåga. Samtidigt utvecklas ny teknik för villkorlig representationsinlärning som kan revolutionera hur AI-system lär sig och anpassar sig. Vi följer också de senaste politiska utvecklingarna som kan påverka teknikbranschens framtid.

Forskare utvecklar nya metoder för att förbättra AI-agenters säkerhet och förhandlingsförmåga

Forskare arbetar intensivt med att förbättra AI-agenters förmågor och säkerhet genom flera nya metoder. En grupp forskare har utvecklat det första generella ramverket för att mäta osäkerhet hos stora språkmodeller (LLM) när de arbetar som agenter i komplexa, interaktiva uppgifter.

Det nya ramverket behandlar osäkerhet som en reduktionsprocess snarare än en ackumulering, vilket bättre passar agenter som interagerar med omvärlden. Forskarna menar att tidigare forskning om osäkerhetskvantifiering har fokuserat för mycket på enkla fråga-svar-scenarier och att området måste anpassas till mer realistiska miljöer med interaktiva agenter.

Parallellt har andra forskare lanserat AgenticPay, ett system för att utvärdera AI-agenters förhandlingsförmåga. Ramverket innehåller över 110 olika uppgifter som sträcker sig från bilaterala förhandlingar till komplexa marknader med flera köpare och säljare. Systemet modellerar marknader där köpare och säljare har privata begränsningar och produktberoende värderingar, och måste nå överenskommelser genom flervändig språklig förhandling.

Tester av ledande språkmodeller med AgenticPay visar betydande brister i förhandlingskapacitet och strategiskt tänkande, vilket understryker behovet av fortsatt utveckling inom detta område.

En tredje forskningsgrupp har utvecklat OD-CRL, ett ramverk som använder ortogonal basoptimering och brusreducering för att förbättra villkorlig representationsinlärning. Metoden konstruerar ortogonala semantiska baser via singulärvärdesnedbrytning och har uppnått nya toppresultat inom klusteranalys, klassificering och informationssökning. Tillsammans representerar dessa framsteg viktiga steg mot säkrare och mer kapabla AI-agenter.

Trump ger stöd till medieförvärv efter tidigare kritik

USA:s president Donald Trump har gjort en helomvändning och ger nu sitt stöd till mediajätten Nexstar Medias föreslagna förvärv av konkurrenten Tegna. Beskedet kommer bara några månader efter att presidenten kritiserade samma uppgörelse.

I ett inlägg på sociala medier förklarar Trump sitt stöd med att "vi behöver mer konkurrens mot fienden". Vad presidenten menar med "fienden" framgår inte tydligt av uttalandet, men det kan syfta på andra stora medieföretag eller medier som Trump tidigare kritiserat.

Nexstar Media är redan en av USA:s största ägare av lokala tv-stationer och ett förvärv av Tegna skulle ytterligare stärka bolagets position på den amerikanska mediemarknaden. Affären har varit föremål för regulatorisk granskning och Trumps tidigare kritik sågs som ett potentiellt hinder för genomförandet.

Presidentens ändrade inställning kommer samtidigt som han beskriver fredagens indirekta samtal med Iran som "väldigt bra". Samtalen genomfördes via Omans regering som mellanhand mellan USA och Iran, och från iranskt håll meddelar man att parterna "skakat hand".

Trump har också stått fast vid sitt ställningstagande kring ett kontroversiellt videoklipp och vägrat att be om ursäkt. "Jag gjorde inget misstag", säger presidenten om det kritiserade materialet.

Den snabba omsvängningen kring medieaffären illustrerar Trumps benägenhet att ändra position i olika frågor, något som präglat hans politiska kommunikation under hela mandatperioden.

Dagens siffra

110

Antal olika uppgifter i AgenticPay-ramverket för att testa AI-agenters förhandlingsförmåga

Snabbkollen

Forskare utvecklar metod för att träna AI med demografiskt representativa preferenser

Forskare har utvecklat Democratic Preference Optimization (DemPO), en metod som använder algoritmisk lottning för att säkerställa demografisk representation när AI-modeller tränas med mänskliga preferenser. Testresultat på Llama-modeller från en till åtta miljarder parametrar visar att metoden ger bättre resultat än traditionella metoder, med effektstorlek som ökar med modellens kapacitet.

Källor: arXiv cs.AI
Europeiska batteribolaget ACC skrotar fabriker i Italien och Tyskland

Det europeiska batteriinitiativet ACC har skrotat planer på två stora batterifabriker i Italien och Tyskland enligt det italienska metallfacket UILM. Beslutet påverkar Europas satsning på egen batteriproduktion för elfordon.

Studie validerar AI-säkerhetsutvärdering för mental hälsa

Forskare har utvecklat VERA-MH, ett automatiserat system för att bedöma säkerheten hos AI-chatbotar inom mental hälsa. Studien visar att systemet har 0,81 i överensstämmelse med klinisk konsensus och kan identifiera osäkra beteenden hos AI-verktyg som miljontals personer nu använder för psykologiskt stöd.

Källor: arXiv cs.AI
Stockholmsbörsen når nytt rekord trots Volvo Cars nedgång

Stockholmsbörsen noterade nytt stängningsrekord under den rapportintensiva veckan. Medan Sobi nådde nya höjder blev Volvo Cars en av veckans stora rapportbesvikelser med kraftiga kursrörelser.

Vidde säkrar 26 miljoner kronor för eldriven snöskoter

Svenska Vidde har säkrat 26 miljoner kronor i nytt kapital för att starta serieproduktion av sin eldrivna snöskoter. Bolaget förbereder nu övergången från utveckling till kommersiell tillverkning.

Källor: Di Digital
Claude introducerar snabbt läge för AI-svar

Anthropics AI-assistent Claude har lanserat ett "fast mode" som påskyndar svarstider för enklare uppgifter. Funktionen optimerar prestanda genom att använda mindre beräkningsresurser för rutinmässiga förfrågningar samtidigt som full kapacitet reserveras för komplexa problem.

Forskare utvecklar asynkron träningsmetod för AI-robotmodeller

Forskare har utvecklat en fullt asynkron träningsmetod för Vision-Language-Action (VLA) modeller som ökar genomströmningen med upp till 59,25% jämfört med befintliga synkrona metoder. Vid djupare optimering kan förbättringen nå 126,67%, vilket löser ett viktigt flaskhalsproblem inom robotik-AI.

Källor: arXiv cs.AI
DeepRead: Strukturmedveten AI-agent förbättrar dokumentsökning

Forskare har utvecklat DeepRead, en AI-agent som använder dokumentstruktur som rubriker och styckeindelning för att förbättra sökning i långa dokument. Systemet konverterar PDF-filer till strukturerad Markdown och indexerar innehåll på styckesnivå med koordinatbaserad metadata. DeepRead visar betydande förbättringar jämfört med befintliga agentbaserade sökramverk genom att kombinera verktyg för både lokalisering och strukturerad läsning.

Källor: arXiv cs.AI
GAMMS: Ny grafsimulator för multiagentsystem

Forskare presenterar GAMMS, en lätt simuleringsplattform för multiagentsystem som använder grafbaserad modellering för att testa agentbeteende i komplexa miljöer som vägnät och kommunikationssystem. Verktyget är designat för skalbarhet och snabb prototyputveckling på standardhårdvara, och stöder olika agenttyper inklusive de som använder stora språkmodeller.

Källor: arXiv cs.AI
M²-Miner: Multi-Agent system för automatiserad datautvinning av mobila GUI-agenter

Forskare har utvecklat M²-Miner, ett automatiserat system som använder Monte Carlo Tree Search och tre samarbetande AI-agenter för att samla in träningsdata för mobila GUI-agenter. Systemet adresserar problemen med höga kostnader och låg datakvalitet i nuvarande metoder genom att automatiskt generera användarbeteende-trajektorier. De fine-tunade GUI-agenterna uppnår topprestanda på flera mobila GUI-benchmarks.

Källor: arXiv cs.AI
Experter har världsmodeller. LLM:er har ordmodeller

Experter arbetar genom att välja strategiska drag baserat på andra aktörer och dolda tillstånd, medan stora språkmodeller (LLM:er) fokuserar på att producera enskilda artefakter. LLM:er behöver utveckla världsmodeller för att hantera mer komplex expertarbete som kräver strategiskt tänkande.

Ny metod minskar felaktig information i AI-system för finansdata

Forskare har utvecklat RLFKV, en förstärkningsinlärningsmetod som delar upp finansiella AI-svar i mindre kunskapsenheter för att minska felaktig information. Metoden testades på FDD-datasetet och ett nytt FDD-ANT-dataset med konsekvent förbättrade resultat.

Källor: arXiv cs.AI

Färskbryggt AI varje morgon

15 minuter och en kopp kaffe, allt du behöver.