Forskning visar strukturella begränsningar för AI-modellers långsiktiga resonemang Nya studier visar att stora språkmodeller har en inbyggd instabilitetsgräns som exponentiellt försämrar prestandan i långa resonemangskedjor, oberoende av uppgiftens komplexitet. Forskarna bevisar teoretiskt att beslutsförmågan minskar exponentiellt med längden på exekveringen, vilket förklarar varför AI-modeller plötsligt försämras dramatiskt vid längre uppgifter.
Forskare utvecklar 4B-parameter AI-agent som överträffar större modeller Kinesiska forskare har utvecklat AgentCPM-Explore, en kompakt AI-agent med endast 4 miljarder parametrar som presterar bättre än betydligt större modeller som Claude-4.5-Sonnet på flera benchmarks. Modellen uppnår 97,09% träffsäkerhet på GAIA-textuppgifter och visar att mindre AI-modeller kan vara mer effektiva än tidigare trott genom bättre träningsmetoder.
Forskare avslöjar stora svagheter hos AI-modeller med grafalgoritmer En ny studie visar att stora AI-modellers noggrannhet sjunker under 50% när grafer överstiger 120 noder, på grund av minnesbrister och exekveringsfel. Forskarna introducerar GrAlgoBench, ett testramverk som exponerar hur modellerna lider av "övertainking" där överdriven självverifiering försämrar prestandan istället för att förbättra den.
Gordon vänder till vinst och drar in 670 miljoner kronor Gordon redovisar vinst efter att ha ökat intäkterna med 20 procent till nästan 670 miljoner kronor under 2023. Företaget satsar nu på återanvändbara påsar som enligt grundaren Ali Ghoce blir klimatpositiva efter fem användningar.
Rymdchefen: Sverige har strategisk roll i Arktis-konflikten Försvarsmaktens rymdchef Anders Sundeman menar att konflikten om Grönland ger Sverige en särställning i Arktis. Han framhåller att Sverige har rätt geografiskt läge, polarkunskaper och innovativ industri som kan kombineras strategiskt.
Section 230 fyller 30 år mitt under intensiv politisk granskning Den amerikanska internetlagen Section 230, som möjliggjort moderna sociala medier genom att skydda plattformar från ansvar för användarinnehåll, fyller 30 år idag. Lagen möter nu sina största hot någonsin när politiker och domstolar arbetar för att begränsa dess räckvidd.
POP: Ny metod gör stora AI-modeller mer effektiva genom dynamisk beskärning Forskare har utvecklat POP (Partition-guided Online Pruning), en metod som gör stora AI-modeller mer effektiva genom att dynamiskt ta bort onödiga delar under körning istället för att använda fasta mönster. Metoden fungerar som ett plug-and-play-verktyg utan förbehandling och visar konsekvent högre noggrannhet än befintliga beskärningsmetoder med lägre beräkningsomkostnader.
Nytt benchmark testar AI-agenters förmåga att bedriva vetenskaplig forskning Forskare har lanserat AIRS-Bench, ett testpaket med 20 uppgifter från toppmoderna maskininlärningsartiklar för att utvärdera AI-agenters forskningsförmågor. AI-agenter överträffade mänskliga resultat i 4 av 20 uppgifterna men misslyckades med att nå samma nivå i 16 andra, vilket visar att det finns betydande förbättringsmöjligheter.
Bioarctics partner får prioriterad granskning i Kina Eisai, partner till svenska Bioarctic, har fått prioriterad granskning av den kinesiska läkemedelsmyndigheten NMPA för Alzheimermedicinen Leqembi (lecanemab). Ansökan gäller behandling av tidig Alzheimers sjukdom med en subkutan autoinjektor.
Lykos skuldsituation hotar bolagets framtid E-handelsbolaget Lykos befinner sig i en kritisk skuldsituation efter en vinstvarning som sänkt aktiekursen kraftigt. Bolaget borde enligt experter ha genomfört en nyemission för flera år sedan, men riskerar nu att tvingas till det av sina banker.
Ny benchmark visar att språkmodeller saknar djup logisk förståelse Forskare har skapat LogicSkills, ett test som mäter tre grundläggande logiska färdigheter hos stora språkmodeller. Resultaten visar att modellerna presterar bra på att bedöma giltighet men betydligt sämre på symbolisering och motexempelkonstruktion, vilket tyder på att de förlitar sig på ytliga mönster snarare än äkta logiskt resonemang.
Ny forskning visar att traditionella AI-förklaringar inte fungerar för autonoma system Forskare från flera universitet visar att attributionsbaserade förklaringsmetoder som fungerar för statiska AI-modeller (Spearman ρ = 0,86) inte kan diagnosticera fel i autonoma AI-system som fattar beslut över flera steg. Studien av agentic AI-system visar att problem med tillståndsspårning är 2,7 gånger vanligare i misslyckade körningar och minskar framgångssannolikheten med 49 procent.
HyPER förbättrar AI-resonemang genom dynamisk beräkningsfördelning Forskare har utvecklat HyPER, en metod som förbättrar språkmodellers resonemang genom att dynamiskt balansera utforskning och utnyttjande av hypotesvägar. Metoden uppnår 8-10 procent bättre noggrannhet samtidigt som den minskar tokenanvändningen med 25-40 procent jämfört med befintliga metoder.
Ny tokeniseringsmetod förbättrar AI-modeller för brusiga dataset Forskare har utvecklat QA-Token, en kvalitetsmedveten tokeniseringsmetod som förbättrar AI-modellers prestanda på brusiga verkliga data. Metoden visade 6,7 procentenheter förbättring inom genomik och 30% förbättring av Sharpe-kvoten inom finans. Vid storskalig träning på 1,7 biljoner baspar uppnådde metoden 94,53 MCC i patogendetektering samtidigt som antalet tokens minskade med 15%.
Trifuse förbättrar GUI-lokalisering genom multimodal datafusion Forskare presenterar Trifuse, ett ramverk som kombinerar uppmärksamhetsmekanismer, OCR-text och bildtexter för att lokalisera gränssnittselement utan specifik finjustering av AI-modeller. Systemet testades på fyra benchmarks och visar förbättrad prestanda genom att minska beroendet av annoterad träningsdata.
Ny forskning visar hur State Space Models lär sig kod State Space Models (SSM) kan matcha eller överträffa Transformers på kodförståelse-uppgifter, men forskare visar att SSM:er glömmer vissa syntaktiska och semantiska relationer under finjustering. Ett nytt analysverktyg kallat SSM-Interpret avslöjar att modellerna flyttar fokus mot kortsiktiga beroenden, vilket lett till arkitektoniska förbättringar.
AI-agenter överskattar kraftigt sin egen förmåga i nya studier AI-agenter som endast lyckas med 22% av uppgifterna förutspår ändå 77% framgång, enligt ny forskning om agentic överförtroende. Studien visar att agenter systematiskt överskattar sina chanser att lyckas med uppgifter, både före, under och efter utförande.
De bästa gratis kurserna i cloud computing 2026 Företag behöver uppdatera sina molnkunskaper kontinuerligt eftersom AI-arbetsbelastningar och nya plattformstjänster förändrar kraven. Kostnadsfria on-demand-kurser blir strategiskt viktiga för att snabbt utbilda team utan budgetgodkännanden. Bra kurser måste lära ut hållbara begrepp som fungerar mellan leverantörer, vara modulära och koppla teknik till verksamhetspraktik.
Historiskt logisk omstöpning av Wallenbergsfären FAM och Wallenberg Investments slås samman i en omstrukturering av Wallenbergsfären som påminner om storaffärerna i början av 1990-talet. Sammanslagningen syftar till att förenkla ägarstrukturen inför att sjätte generationen Wallenbergare skolas in.