9 februari 2026

AI-företag gör entré i Super Bowl-reklam

AI-branschen gör stora satsningar på Super Bowl-reklam samtidigt som falska annonser florerar, vilket speglar teknikens växande mainstream-appeal. Parallellt med marknadsföringen pågår intensiv forskning kring AI-agenters begränsningar och möjligheter, där nya studier ifrågasätter stora språkmodellers rationalitet medan forskare utvecklar innovativa ramverk för osäkerhetshantering och agentträning. Från metodutveckling till praktiska tillämpningar – här är veckans viktigaste AI-nyheter.

Ny forskning avslöjar stora brister i AI-agenters beslutsfattande

Flera nya forskningsstudier kastar ljus över betydande begränsningar hos AI-agenter baserade på stora språkmodeller. En studie visar att dessa modeller inte agerar som rationella agenter med sammanhängande övertygelser, särskilt inom områden som medicinsk diagnostik där korrekta beslut är avgörande.

Forskarna testade om språkmodellernas rapporterade sannolikheter verkligen motsvarar rationella agentbeslut, men resultaten visar att så inte är fallet. Detta väcker allvarliga frågor om användningen av AI-agenter i höginsatsscenarier där felaktiga beslut kan få stora konsekvenser.

Parallellt med dessa upptäckter har forskare utvecklat flera nya metoder för att förbättra AI-agenternas prestanda. SeeUPO, en ny förstärkningsinlärningsalgoritm, visar upp till 54,6 procent relativ förbättring genom att lösa instabilitetsproblem vid träning av språkmodeller som agenter.

En annan innovation är JADE, ett tvålagers-ramverk för att utvärdera AI-agenter på komplexa professionella uppgifter. Metoden kombinerar expertkunskap med flexibel bedömning och upptäcker kritiska fel som andra utvärderingsmetoder missar.

Forskarna har även presenterat ScaleEnv, ett ramverk som skapar interaktiva miljöer från grunden för att träna mer generalistiska agenter. Systemet använder procedurell testning för att säkerställa miljöernas tillförlitlighet.

Trots dessa framsteg inom utvecklingsmetoderna kvarstår grundläggande problem med AI-agenternas rationalitet och beslutsfattande. Forskningen understryker behovet av fortsatt utveckling innan AI-agenter kan användas säkert i kritiska tillämpningar.

Forskare utvecklar nya metoder för att träna och styra stora språkmodeller

Forskare har presenterat två genombrott som kan förändra hur stora språkmodeller utvecklas och kontrolleras. Det första, kallat Jackpot-ramverket, löser ett kostnadsproblem inom förstärkningslärande genom att använda Optimal Budget Rejection Sampling.

Problemet med nuvarande träningsmetoder är att de är extremt dyra, särskilt när modeller genererar svar som sedan används för att förbättra systemet. Forskarna har därför utvecklat en teknik som låter dem använda mer effektiva modeller för att generera träningsdata, samtidigt som de undviker de stabilitetsproblemet som normalt uppstår när olika modeller används i processen.

Jackpot-metoden testades på Qwen3-8B-Base-modellen genom upp till 300 uppdateringssteg, vilket visar att tekniken fungerar i praktiken för storskalig träning.

Parallellt har en annan forskargrupp utvecklat en spelteorietisk approach för att förutsäga och styra hur populationer av språkmodeller beter sig. Metoden använder Nash-jämviktsanalys och modellerar varje AI-agents handlingar som en blandning av olika mänskliga undergrupper.

Denna teknik gör det möjligt att förutse hur AI-system kommer att agera när de interagerar med varandra, och kan fungera som ett styrningslager ovanpå befintliga system. I tester inom sociala medier visade metoden att den kan förhindra politisk uteslutning där vissa befolkningsgrupper annars skulle ignoreras av AI-agenterna.

Båda metoderna representerar viktiga steg mot mer kontrollerbara och kostnadseffektiva AI-system, vilket kan påskynda utvecklingen av säkrare och mer tillgängliga språkmodeller.

AI-företag dominerade Super Bowl-reklam med nya strategier

AI-branschen gjorde ett starkt intryck under årets Super Bowl LX med flera uppmärksammade reklaminitiativ som visade branschens växande inflytande och interna rivaliteter.

Svedka blev det första varumärket någonsin att visa en helt AI-genererad Super Bowl-reklam, vilket markerade en historisk milstolpe för användningen av artificiell intelligens inom reklambranschen. Denna banbrytande ansats demonstrerade hur AI-teknik nu kan skapa komplett reklaminnehåll utan traditionell filmproduktion.

I en ovanlig twist använde AI-företaget Anthropic sin dyra reklamplats för att direkt kritisera konkurrenten OpenAI, vilket synliggjorde de spänningar som finns inom AI-industrin. Detta aggressiva marknadsföringsgrepp visade hur konkurrensutsatta AI-företagen är beredda att använda stora plattformar för att positionera sig mot varandra.

Flera andra varumärken integrerade också AI-teknik i sina reklamfilmer, vilket tyder på att artificiell intelligens snabbt blir en standardkomponent i modern reklam.

Parallellt med de officiella reklamerna spreds en falsk "läckt" OpenAI-reklam via sociala medier. Reklamfilmen visade skådespelaren Alexander Skarsgård med vad som påstods vara OpenAI:s första hårdvaruprodukt - en sfärisk enhet tillsammans med trådlösa hörlurar. Materialet spreds ursprungligen genom en fejkad Reddit-tråd där någon påstod sig vara en frustrerad anställd som av misstag läckt reklamfilmen.

Denna incident belyser hur lätt desinformation kan spridas kring AI-företag och deras produkter, särskilt under stora medieevenemang som Super Bowl.

Japans bytesbalansöverskott nästan fördubblades i december

Japans bytesbalans utvecklades starkt i december med ett överskott på 7.288 miljarder yen, jämfört med 3.675 miljarder yen månaden innan. Den kraftiga ökningen innebär att överskottet nästan fördubblades på bara en månad.

Siffrorna bygger på icke säsongsjusterade data och visar på en betydande förbättring av landets utrikeshandel. Bytesbalansen är ett viktigt mått på ett lands ekonomiska hälsa och speglar skillnaden mellan vad landet exporterar och importerar av varor och tjänster.

Parallellt med de positiva handelssiffrorna står Japan inför politisk förändring. Landet genomförde parlamentsval under söndagen mitt i extremt väder med köld och snöfall. Enligt vallokalsundersökningar vann premiärminister Sanae Takaichis regeringskoalition en jordskredsseger.

Valresultatet väcker dock oro på valutamarknaden. En stark valseger för den sittande regeringen kan leda till förnyad press på den japanska yenen, som redan befinner sig i en svag position. Experter varnar för att valutans utveckling kan påverkas negativt om den politiska stabiliteten leder till fortsatt expansiv ekonomisk politik.

Den förbättrade bytesbalansen kommer som en positiv signal för den japanska ekonomin, men kombinationen med politisk osäkerhet kring valutapolitiken skapar en komplex ekonomisk situation för landet framöver.

Dagens siffra

54,6%

Relativ förbättring som SeeUPO-algoritmen uppnådde vid träning av Qwen3-14B språkmodell för AI-agenter

Snabbkollen

Forskning visar strukturella begränsningar för AI-modellers långsiktiga resonemang

Nya studier visar att stora språkmodeller har en inbyggd instabilitetsgräns som exponentiellt försämrar prestandan i långa resonemangskedjor, oberoende av uppgiftens komplexitet. Forskarna bevisar teoretiskt att beslutsförmågan minskar exponentiellt med längden på exekveringen, vilket förklarar varför AI-modeller plötsligt försämras dramatiskt vid längre uppgifter.

Källor: arXiv cs.AI
New York föreslår treårsstopp för AI-datacenter och krav på märkning av AI-innehåll

New Yorks delstatsparlament överväger två lagförslag som skulle kräva tydlig märkning av AI-genererat nyhetsinnehåll och införa ett treårigt moratorium på byggandet av nya datacenter. Lagen skulle kräva att allt AI-skapat innehåll granskas av en människa med redaktionell kontroll innan publicering.

Forskare kartlägger systematiska brister i stora språkmodellers resonemang

En ny studie presenterar den första omfattande undersökningen av resonemangsfel i stora språkmodeller (LLM). Forskarna kategoriserar fel i tre typer: fundamentala brister i LLM-arkitekturen, applikationsspecifika begränsningar och robusthetsproblem med inkonsekvent prestanda.

Källor: arXiv cs.AI
Forskare utvecklar 4B-parameter AI-agent som överträffar större modeller

Kinesiska forskare har utvecklat AgentCPM-Explore, en kompakt AI-agent med endast 4 miljarder parametrar som presterar bättre än betydligt större modeller som Claude-4.5-Sonnet på flera benchmarks. Modellen uppnår 97,09% träffsäkerhet på GAIA-textuppgifter och visar att mindre AI-modeller kan vara mer effektiva än tidigare trott genom bättre träningsmetoder.

Källor: arXiv cs.AI
Forskare avslöjar stora svagheter hos AI-modeller med grafalgoritmer

En ny studie visar att stora AI-modellers noggrannhet sjunker under 50% när grafer överstiger 120 noder, på grund av minnesbrister och exekveringsfel. Forskarna introducerar GrAlgoBench, ett testramverk som exponerar hur modellerna lider av "övertainking" där överdriven självverifiering försämrar prestandan istället för att förbättra den.

Källor: arXiv cs.AI
Gordon vänder till vinst och drar in 670 miljoner kronor

Gordon redovisar vinst efter att ha ökat intäkterna med 20 procent till nästan 670 miljoner kronor under 2023. Företaget satsar nu på återanvändbara påsar som enligt grundaren Ali Ghoce blir klimatpositiva efter fem användningar.

Källor: Breakit
Rymdchefen: Sverige har strategisk roll i Arktis-konflikten

Försvarsmaktens rymdchef Anders Sundeman menar att konflikten om Grönland ger Sverige en särställning i Arktis. Han framhåller att Sverige har rätt geografiskt läge, polarkunskaper och innovativ industri som kan kombineras strategiskt.

Källor: Di Digital
Section 230 fyller 30 år mitt under intensiv politisk granskning

Den amerikanska internetlagen Section 230, som möjliggjort moderna sociala medier genom att skydda plattformar från ansvar för användarinnehåll, fyller 30 år idag. Lagen möter nu sina största hot någonsin när politiker och domstolar arbetar för att begränsa dess räckvidd.

POP: Ny metod gör stora AI-modeller mer effektiva genom dynamisk beskärning

Forskare har utvecklat POP (Partition-guided Online Pruning), en metod som gör stora AI-modeller mer effektiva genom att dynamiskt ta bort onödiga delar under körning istället för att använda fasta mönster. Metoden fungerar som ett plug-and-play-verktyg utan förbehandling och visar konsekvent högre noggrannhet än befintliga beskärningsmetoder med lägre beräkningsomkostnader.

Källor: arXiv cs.AI
Nytt benchmark testar AI-agenters förmåga att bedriva vetenskaplig forskning

Forskare har lanserat AIRS-Bench, ett testpaket med 20 uppgifter från toppmoderna maskininlärningsartiklar för att utvärdera AI-agenters forskningsförmågor. AI-agenter överträffade mänskliga resultat i 4 av 20 uppgifterna men misslyckades med att nå samma nivå i 16 andra, vilket visar att det finns betydande förbättringsmöjligheter.

Källor: arXiv cs.AI
Teamtailor ökade omsättning men redovisar förlust efter AI-satsningar

Rekryteringsbolaget Teamtailor ökade sin omsättning under förra året men gick från vinst till förlust på grund av stora investeringar. VD Erik Andersson menar att satsningarna positionerar företaget väl inför framtiden när AI förändrar rekryteringsbranschen.

Källor: Breakit
Bioarctics partner får prioriterad granskning i Kina

Eisai, partner till svenska Bioarctic, har fått prioriterad granskning av den kinesiska läkemedelsmyndigheten NMPA för Alzheimermedicinen Leqembi (lecanemab). Ansökan gäller behandling av tidig Alzheimers sjukdom med en subkutan autoinjektor.

EU-kommissionen återupplivar förslag om gemensam insättningsgaranti

EU-kommissionen planerar att återuppliva sitt tio år gamla förslag om ett gemensamt insättningsgarantisystem för EU:s banker. Initiativet syftar till att underlätta gränsöverskridande banksammanslagningar inom unionen.

Lykos skuldsituation hotar bolagets framtid

E-handelsbolaget Lykos befinner sig i en kritisk skuldsituation efter en vinstvarning som sänkt aktiekursen kraftigt. Bolaget borde enligt experter ha genomfört en nyemission för flera år sedan, men riskerar nu att tvingas till det av sina banker.

Ny benchmark visar att språkmodeller saknar djup logisk förståelse

Forskare har skapat LogicSkills, ett test som mäter tre grundläggande logiska färdigheter hos stora språkmodeller. Resultaten visar att modellerna presterar bra på att bedöma giltighet men betydligt sämre på symbolisering och motexempelkonstruktion, vilket tyder på att de förlitar sig på ytliga mönster snarare än äkta logiskt resonemang.

Källor: arXiv cs.AI
Ny forskning visar att traditionella AI-förklaringar inte fungerar för autonoma system

Forskare från flera universitet visar att attributionsbaserade förklaringsmetoder som fungerar för statiska AI-modeller (Spearman ρ = 0,86) inte kan diagnosticera fel i autonoma AI-system som fattar beslut över flera steg. Studien av agentic AI-system visar att problem med tillståndsspårning är 2,7 gånger vanligare i misslyckade körningar och minskar framgångssannolikheten med 49 procent.

Källor: arXiv cs.AI
HyPER förbättrar AI-resonemang genom dynamisk beräkningsfördelning

Forskare har utvecklat HyPER, en metod som förbättrar språkmodellers resonemang genom att dynamiskt balansera utforskning och utnyttjande av hypotesvägar. Metoden uppnår 8-10 procent bättre noggrannhet samtidigt som den minskar tokenanvändningen med 25-40 procent jämfört med befintliga metoder.

Källor: arXiv cs.AI
Ny tokeniseringsmetod förbättrar AI-modeller för brusiga dataset

Forskare har utvecklat QA-Token, en kvalitetsmedveten tokeniseringsmetod som förbättrar AI-modellers prestanda på brusiga verkliga data. Metoden visade 6,7 procentenheter förbättring inom genomik och 30% förbättring av Sharpe-kvoten inom finans. Vid storskalig träning på 1,7 biljoner baspar uppnådde metoden 94,53 MCC i patogendetektering samtidigt som antalet tokens minskade med 15%.

Källor: arXiv cs.AI
Trifuse förbättrar GUI-lokalisering genom multimodal datafusion

Forskare presenterar Trifuse, ett ramverk som kombinerar uppmärksamhetsmekanismer, OCR-text och bildtexter för att lokalisera gränssnittselement utan specifik finjustering av AI-modeller. Systemet testades på fyra benchmarks och visar förbättrad prestanda genom att minska beroendet av annoterad träningsdata.

Källor: arXiv cs.AI
Ny forskning visar hur State Space Models lär sig kod

State Space Models (SSM) kan matcha eller överträffa Transformers på kodförståelse-uppgifter, men forskare visar att SSM:er glömmer vissa syntaktiska och semantiska relationer under finjustering. Ett nytt analysverktyg kallat SSM-Interpret avslöjar att modellerna flyttar fokus mot kortsiktiga beroenden, vilket lett till arkitektoniska förbättringar.

Källor: arXiv cs.AI
AI-agenter överskattar kraftigt sin egen förmåga i nya studier

AI-agenter som endast lyckas med 22% av uppgifterna förutspår ändå 77% framgång, enligt ny forskning om agentic överförtroende. Studien visar att agenter systematiskt överskattar sina chanser att lyckas med uppgifter, både före, under och efter utförande.

Källor: arXiv cs.AI
De bästa gratis kurserna i cloud computing 2026

Företag behöver uppdatera sina molnkunskaper kontinuerligt eftersom AI-arbetsbelastningar och nya plattformstjänster förändrar kraven. Kostnadsfria on-demand-kurser blir strategiskt viktiga för att snabbt utbilda team utan budgetgodkännanden. Bra kurser måste lära ut hållbara begrepp som fungerar mellan leverantörer, vara modulära och koppla teknik till verksamhetspraktik.

Historiskt logisk omstöpning av Wallenbergsfären

FAM och Wallenberg Investments slås samman i en omstrukturering av Wallenbergsfären som påminner om storaffärerna i början av 1990-talet. Sammanslagningen syftar till att förenkla ägarstrukturen inför att sjätte generationen Wallenbergare skolas in.

Stockholmsbörsen når rekordnivåer inför fortsatt rapportflod

Stockholmsbörsens index nådde nya rekordnivåer under den gångna veckan. Kommande vecka fortsätter rapportfloden medan viktiga makrodata väntas från USA, inklusive försenade jobbsiffror och inflationsdata.

Färskbryggt AI varje morgon

15 minuter och en kopp kaffe, allt du behöver.