Forskare löser problem med AI-agenters minnesförlust i långa samtal Forskare har identifierat ett problem som kallas "Attention Latch" där AI-agenter fastnar i gamla instruktioner och ignorerar nya kommandon under långa konversationer. De utvecklade en lösning som separerar planering från utförande och lyckades öka framgångsfrekvensen från 0,1% till 71,5% i komplexa uppgifter. Metoden testades på stora språkmodeller som GPT och Claude med statistiskt signifikanta förbättringar.
AI-system förbättrar ultraljudsbilder med fysik-informerade algoritmer Hugging Face presenterar NV-Raw2Insights-US, ett AI-system som använder fysik-baserade neurala nätverk för att förbättra kvaliteten på ultraljudsbilder i realtid. Tekniken kombinerar maskininlärning med ultraljudsfysik för att ge skarpare bilder och bättre diagnostik, vilket kan vara särskilt värdefullt inom medicinsk bildbehandling.
OpenAI får sälja produkter via Amazon efter överenskommelse med Microsoft OpenAI har nått en överenskommelse med sin största ägare Microsoft som tillåter företaget att sälja produkter via Amazons molntjänst AWS, samtidigt som Microsoft får en större andel av intäkterna. Avtalet löser en juridisk konflikt kring OpenAIs 50 miljarder dollar-affär med Amazon och ger OpenAI mer frihet att välja sina molnleverantörer.
OpenAI och Microsoft justerar sitt partnerskap OpenAI och Microsoft har omförhandlat sitt samarbetsavtal för att förenkla strukturen och skapa långsiktig klarhet kring partnerskapet. Ändringarna ska stödja fortsatt AI-innovation i stor skala, även om de specifika detaljerna inte avslöjas.
CIO:er saknar tydlig AI-strategi i sina företag 31 procent av IT-cheferna upplever att bristen på tydlig AI-strategi är den största utmaningen för AI-initiativ, enligt Foundrys undersökning av 800 CIO:er. Andra stora problem inkluderar brist på intern AI-expertis (40 procent) och otydliga ansvarsförhållanden mellan avdelningar. Som AI-experten Rishi Kaushal förklarar: strategin måste utvecklas kontinuerligt eftersom AI-tekniken förändras från vecka till vecka.
Forskare utvecklar AI-agenter som automatiskt skapar kunskapsstrukturer från text Forskare har testat hur olika AI-arkitekturer kan omvandla ostrukturerad text till formella ontologier (kunskapsstrukturer som beskriver relationer mellan koncept). Deras multi-agent-system med fyra specialiserade roller - domänexpert, manager, kodare och kvalitetssäkrare - presterade betydligt bättre än en enkel AI-agent, särskilt tack vare bättre planering från början.
Google investerar nya miljarder i Anthropic Google planerar att investera ytterligare 10 miljarder dollar (92 miljarder kronor) i AI-företaget Anthropic, som ligger bakom chattboten Claude – och summan kan växa till 40 miljarder dollar på sikt. Med tidigare investeringar på 3 miljarder äger Google nu drygt 14 procent av företaget som konkurrerar direkt med OpenAI. Pengarna ska användas för att bygga ut AI-infrastrukturen, vilket visar hur dyrt kapplöpningen om att dominera AI-marknaden verkligen är.
Forskare testar om grafiska "tankekartor" gör AI-modeller smartare i samarbete Nya experiment med över 3000 tester visar att så kallade "belief graphs" (grafiska representationer av vad AI:n tror att andra vet) bara hjälper språkmodeller när de används för att styra beslut, inte bara som bakgrundsinformation. Intressant fynd: Gemini-modeller följer nästan alltid rekommendationer medan Llama 70B trotsigt ignorerar 90% av de korrekta råden den får.
Nytt test mäter AI:s noggrannhet i medicinska röntgenrapporter Forskare har skapat CT-FineBench, ett test som granskar hur exakta AI-genererade röntgenrapporter verkligen är genom att ställa specifika frågor om diagnostiska detaljer. Tidigare mätmetoder har bara jämfört ordval, men det nya testet korrelerar bättre med läkares bedömningar och är känsligare för faktafel som kan påverka patientvård.
LangChain hjälper företag följa EU:s AI-lagstiftning EU:s AI-lag träder i kraft 2 augusti 2026 och ställer krav på spårbarhet och dokumentation av AI-system. LangChain lanserar verktyg genom LangSmith och sitt open source-bibliotek som automatiskt loggar AI-aktivitet och hjälper utvecklare att följa de nya reglerna.
LLM:er används för att förbättra sociala färdigheter på jobbet Stanford HAI undersöker hur stora språkmodeller kan träna anställda i kommunikation och konfliktlösning på arbetsplatsen. Forskningen visar att AI-baserad coaching kan hjälpa till med allt från svåra samtal med chefer till att navigera teamdynamik, vilket öppnar nya möjligheter för personlig utveckling inom organisationer.
Applied Intuition bygger AI för fordon i extrema miljöer Applied Intuition utvecklar AI-system för fysiska fordon som gruvriggar, drönare, lastbilar och krigsfartyg som måste fungera i de mest utmanande miljöerna. Företaget fokuserar på så kallad "Physical AI" som kan hantera verkliga situationer där fel kan få katastrofala konsekvenser, till skillnad från chatbots som bara hanterar text.
Analytica förbättrar AI-agenters analysförmåga med strukturerad sannolikhetsbaserad logik Forskare har utvecklat Analytica, en ny arkitektur för AI-agenter som använder "mjuk propositionell resonemang" för att göra mer pålitliga analyser inom ekonomi och politik. Systemet delar upp komplexa problem i träd av delpropositioner som valideras parallellt, vilket resulterade i 15,84% bättre träffsäkerhet än vanliga modeller och uppnådde 71,06% träffsäkerhet i tester. Det intressanta är att metoden minskar både systematiska fel och slumpmässig variation - två huvudproblem som gör dagens AI-agenter opålitliga för verkliga analyser.
Så fungerar AI:n som hanterar din jobbansökan Alva Labs utvecklar AI-system som ska minska fördomar i rekryteringsprocesser och göra det rättvisare för både företag och kandidater. Ludvig Wettlén från företaget betonar att målet är att tekniken ska underlätta för jobbsökande, inte bara effektivisera för arbetsgivare.
Talkie: En 13B språkmodell med 1930-talskänsla Simon Willison presenterar 'talkie', en 13 miljarder parameters stor språkmodell som tränats att kommunicera som om den vore från 1930-talet. Modellen kombinerar modern AI-teknik med historisk språkstil, vilket visar hur stora språkmodeller kan anpassas för specifika tidsperioder eller stilar.
Spårning av historiken för OpenAIs nu avskaffade Microsoft AGI-klausul OpenAI hade tidigare en klausul som skulle stoppa Microsofts tillgång till företagets teknologi när artificiell allmän intelligens (AGI) uppnås, men denna bestämmelse har nu tystlåtet försvunnit. Klausulen var tänkt att skydda AGI från att kommersialiseras, men verkar ha tagits bort i samband med OpenAIs omstrukturering till ett vinstdrivande företag.
Microsoft släpper VibeVoice för röstkloning Microsoft har lanserat VibeVoice, ett AI-verktyg som kan klona röster med bara några sekunders ljudinspelning. Tekniken använder neurala nätverk för att återskapa röstmönster och tonfall, men väcker frågor om missbruk och deepfakes.
Matar AI-agenter med data – värderas till 440 miljoner Stockholmsbolaget Redpine har värderat sig till 440 miljoner kronor i en ny investeringsrunda för sin plattform som matar AI-agenter med realtidsdata som inte finns öppet på internet. Det unga bolaget bygger infrastruktur för att ge AI-system tillgång till privat och strukturerad data i realtid.
Över 600 Google-anställda kräver stopp för militär AI-användning Mer än 600 Google-anställda, inklusive många från DeepMind AI-labbet, har undertecknat ett brev till VD Sundar Pichai där de kräver att företaget nekar Pentagon att använda Googles AI-modeller för hemligstämplade ändamål. Brevet varnar för att Google annars riskerar att bli associerat med skador utan att veta om det eller kunna stoppa det.
DeepMinds David Silver samlar in 8,8 miljarder för AI som lär sig utan mänsklig data David Silver, tidigare forskare på DeepMind, har samlat in 8,8 miljarder kronor till sitt nya AI-bolag Ineffable Intelligence för att bygga AI-system som kan lära sig helt utan mänskligt träningsdata. Bolaget som grundades för bara några månader sedan värderas redan till 40,8 miljarder kronor – vilket säger något om hur heta investerare är på alternativ till nuvarande AI-metoder.
LangChain byggde AI-agent som ökade försäljningskonvertering med 250% LangChain utvecklade en AI-agent för sitt säljteam som ökade leadkonverteringen med 250% samtidigt som varje säljare sparar 40 timmar per månad. Agenten automatiserar delar av försäljningsprocessen genom att hantera kundinteraktioner och kvalificera leads, vilket visar hur AI-verktyg börjar få konkreta resultat i affärsprocesser.
Ny säkerhetsprotokoll stoppar AI-beslut innan de verkställs Forskare föreslår ett "Right-to-Act" protokoll som fungerar som en säkerhetsspärr som kan blockera AI-beslut innan de verkställs i verkligheten. Till skillnad från nuvarande system som försöker förutsäga risker, använder detta en strikt checklista där alla villkor måste uppfyllas - annars stoppas handlingen helt. Det är som att ha en säkerhetsbromse som inte kan överröstas av hög AI-konfidans.
FormalScience: AI-system hjälper forskare översätta fysik till formell kod Forskare har utvecklat FormalScience, ett AI-system som hjälper domänexperter att översätta informella vetenskapliga resonemang till formellt verifierbar kod. Systemet testades på 200 universitetsnivå fysiksuppgifter och uppnådde perfekt formell giltighet, men forskarna identifierade betydande utmaningar med semantisk drift – när AI:n ändrar innebörden medan den försöker formalisera resonemanget.
Musk mot Altman – idag startar rättegången Elon Musk och Sam Altman möts idag i domstol i en rättegång om OpenAI:s framtid, där Musk vill göra om bolaget och peta Altman från ledningen. Tvisten handlar om tusentals miljarder kronor och kan påverka hela AI-branschens utveckling framöver.
DeepSeeks nya AI-modell V4 kan hantera mycket längre prompter Kinesiska AI-företaget DeepSeek släppte på fredagen en förhandstitt på V4, deras nya flaggskeppsmodell som kan bearbeta betydligt längre prompter än tidigare versioner. Det här är intressant eftersom längre kontextfönster (hur mycket text modellen kan komma ihåg) ofta betyder bättre prestanda för komplexa uppgifter.
AI-agenter lär sig säkerhetsregler från enkla varningssignaler Forskare visar att språkmodeller kan upptäcka dolda säkerhetsregler genom att bara få enkla ja/nej-varningar när de gör farliga handlingar. EPO-Safe-metoden låter agenten utveckla egna säkerhetsspecifikationer på 5-15 episoder, vilket är intressant eftersom agenten aldrig ser den verkliga belöningsfunktionen - bara en bit per tidssteg som säger "farligt" eller "säkert".
Promptim: experimentellt bibliotek för prompt-optimering LangChain lanserar Promptim, ett experimentellt kodbibliotek som automatiserar prompt-optimering för AI-modeller. Verktyget lovar att spara tid för utvecklare och förbättra AI-prestanda genom att automatiskt justera hur man formulerar instruktioner till språkmodeller.
AI:s 'vanföreställningsspiraler' (och vad man ska göra åt dem) Forskare vid Stanford HAI har identifierat ett fenomen där AI-system fastnar i 'vanföreställningsspiraler' - när modeller förstärker sina egna felaktiga antaganden genom upprepning. Problemet uppstår när AI-system tränar på data som de själva eller andra AI-system har genererat, vilket kan leda till att felaktigheter förstärks exponentiellt över tid.
LangChains AI-rapport 2024 visar utvecklingsmönster för språkmodeller LangChain har släppt sin årliga AI-rapport som analyserar hur utvecklare bygger applikationer med stora språkmodeller genom deras LangSmith-plattform. Rapporten visar konkreta användningsmönster och trender inom LLM-utveckling baserat på verklig produktdata från tusentals projekt.
Meta tecknar miljardavtal med AWS för AI-agenter Meta har tecknat ett avtal värt flera miljarder dollar med AWS och kommer att köpa hundratusentals Graviton 5-chipp för sina AI-agenter. De nya chippen är 25 procent snabbare än föregångaren och ska hantera CPU-intensiva processer som krävs för Metas AI-satsning.
Investerare satsar på Skyes AI-app för iPhone innan lansering Skye har säkrat investeringar för sin AI-app som ska fungera som en intelligent hemskärm för iPhone, redan innan appen ens lanserats. Intresset visar att investerare tror på mer AI-integrerade iPhone-upplevelser när Apple fortfarande håller tillbaka med sina egna AI-funktioner.
OpenAI godkänt för amerikanska myndigheter OpenAI har fått FedRAMP Moderate-certifiering (en säkerhetsstandard för molntjänster till amerikanska myndigheter) för både ChatGPT Enterprise och sitt API. Det betyder att amerikanska federala myndigheter nu officiellt kan använda OpenAI:s tjänster utan att bryta mot sina säkerhetsregler.
Ubuntu Linux får AI-funktioner under nästa år Canonical planerar att integrera AI-funktioner i Ubuntu Linux under det kommande året, både som bakgrundsfunktioner för att förbättra befintliga OS-verktyg och som helt nya AI-native arbetsflöden. Funktionerna kommer inkludera förbättrade tillgänglighetsverktyg som tal-till-text samt agentic AI-funktioner för olika uppgifter.
Kina stoppar Metas köp av AI-startupen Manus Kina har blockerat Metas planerade uppköp av AI-bolaget Manus för 2 miljarder dollar, där startupen utvecklar AI-agenter för marknadsanalys och programmering. Affären hamnade i kläm mellan USA:s restriktioner mot kinesiska AI-investeringar och Kinas vilja att hindra teknikföretag från att flytta utomlands för att undvika tillsyn. Ett tydligt exempel på hur geopolitiken nu forma AI-marknaden.
En AI-hälsocoach kan förändra ditt mindset Stanford HAI utforskar hur AI-baserade hälsocoacher kan hjälpa människor att förändra sina mentala mönster och beteenden. Tekniken kombinerar personlig data med AI:s förmåga att ge skräddarsydda råd, vilket kan göra hälsocoachning mer tillgänglig än traditionella metoder.
Företag måste bygga om sin datainfrastruktur för AI Många företag upptäcker att deras största hinder för AI-adoption inte är tekniken utan deras röriga data - medan konsument-AI är snabb och smidig kräver företags-AI omfattande ombyggnad av datainfrastrukturen. Det mindre glamorösa arbetet med att organisera och strukturera data visar sig vara avgörande för att faktiskt kunna implementera AI i stor skala.
Det saknade steget mellan hype och vinst MIT Technology Review reflekterar över klyftan mellan AI-hype och verklig lönsamhet, inspirerat av en anti-AI-demonstration i London i februari. Artikeln verkar utforska hur AI-branschen kämpar med att omvandla teknisk potential till faktiska affärsresultat.
Google DeepMind ingår partnerskap med Sydkorea för AI-forskning Google DeepMind har tecknat ett partnerskap med Sydkorea för att accelerera vetenskapliga genombrott med hjälp av avancerade AI-modeller. Samarbetet fokuserar på att använda DeepMinds frontier AI-teknik inom forskningsområden, vilket markerar en betydande satsning på AI-driven vetenskap i regionen.
Meta satsar på rymdbaserad solenergi för datacenter Meta planerar att driva sina AI-datacenter med solenergi som samlas in i rymden. Det är ett sätt att hantera den enorma energihungern som AI-träning och inferens kräver – datacenter för AI förbrukar betydligt mer ström än vanliga servrar.
Googles röstöversättning i Meet rullas ut till mobiler Google Meet får nu realtidsöversättning av tal på mobiltelefoner, vilket låter användare höra möten översatta till sitt eget språk direkt i appen. Funktionen använder AI-driven språkbearbetning för att automatiskt översätta talat innehåll live under videosamtal.
Lovable investerar i Atech – vill bli "Lovable för hårdvara" Hårdvarustartupen Atech har stängt sin första kapitalrunda med uppbackning från AI-verktyget Lovable och scoutpengar från Sequoia och Andreessen Horowitz. Företaget vill göra elektronik och robotik lika enkelt som att bygga en hemsida idag – en intressant parallell till hur AI-verktyg förenklar mjukvaruutveckling.
Irankriget driver upp priserna på AI-servrar Irans attacker mot saudisk petrokemi har stoppat produktionen av specialplast för kretskort, vilket lett till 40 procent prisökning på komponenter som används i AI-servrar. Kombinerat med redan hög efterfrågan från AI-sektorn skapar detta nu en global brist på viktiga elektronikkomponenter.