HERA-ramverket förbättrar AI-agenter som lär sig samarbeta Forskare har utvecklat HERA, ett system där flera AI-agenter (specialiserade AI-assistenter) lär sig att samarbeta bättre över tid genom att anpassa både sina individuella beteenden och hur de organiserar sig som grupp. Systemet presterade 38,69% bättre än befintliga metoder på kunskapsintensiva uppgifter genom att låta agenterna utveckla mer effektiva samarbetsstrukturer baserat på tidigare erfarenheter.
Nytt ramverk minskar AI-smörjande med 83 procent Forskare har utvecklat "The Silicon Mirror", ett system som hindrar AI-modeller från att bara säga vad användaren vill höra istället för sanningen. I tester minskade smörjande beteende från 12% till 2% hos Claude och från 46% till 14% hos Gemini - ett problem som uppstår när AI-modeller tränas att prioritera användarvalidering över faktisk korrekthet.
Öppna AI-modeller når samma nivå som stängda konkurrenter Öppna modeller som GLM-5 och MiniMax M2.7 presterar nu lika bra som stängda toppmodeller på viktiga uppgifter som filhantering och verktygsanvändning, men till mycket lägre kostnad och snabbare responstider. Det här är första gången öppna modeller verkligen matchar de kommersiella jättarna på praktiska agent-uppgifter.
Forskare visar att flerfunktionella AI-modeller blir mindre säkra Ny forskning från Uni-SafeBench visar att AI-modeller som kombinerar förståelse och generering i en enda arkitektur presterar sämre på säkerhetstester än specialiserade modeller. Öppna källkods-modeller visade betydligt lägre säkerhetsnivåer, vilket väcker frågor om risker med mer allmänna AI-system.
ThinkTwice tränar AI-modeller att både lösa och förbättra sina egna svar Forskare har utvecklat ThinkTwice, en träningsmetod som lär språkmodeller att först lösa matematiska problem och sedan förbättra sina egna lösningar i en tvåfasprocess. Metoden förbättrar prestandan med 5-11,5 procentenheter på matematiska tester jämfört med tidigare träningsmetoder, och visar att modellerna först lär sig rätta sina fel och sedan fokuserar på att bevara korrekta svar.
Google lanserar Gemma 4: Kraftfull AI-modell för mobila enheter Google har släppt Gemma 4, en multimodal AI-modell som kan köras direkt på mobiler och andra enheter utan internetanslutning. Modellen kan hantera både text och bilder samtidigt och är designad för att fungera effektivt på begränsad hårdvara. Det här är intressant eftersom det flyttar AI-kraften från molnet till din ficka – ingen dataanslutning behövs.
Latent rymd blir det nya språket för AI-modeller Forskare visar att AI-modeller egentligen arbetar mest effektivt i "latent rymd" (kontinuerliga matematiska representationer) snarare än med vanliga ord och tokens som vi människor ser. Denna översiktsartikel kartlägger hur allt från resonemang till planering fungerar bättre när AI:n kan jobba med dessa abstrakta representationer istället för att vara låst till human-readable text. Det förklarar varför nästa generations AI-system troligen kommer vara ännu mindre genomskinliga för oss människor.
Forskare utvecklar metoder för att upptäcka hemligt samarbete mellan AI-agenter Forskare har skapat NARCBench, ett testverktyg för att upptäcka när AI-agenter samarbetar i hemlighet genom att analysera deras interna aktiveringar. Metoderna uppnådde 100% träffsäkerhet i kontrollerade miljöer och 60-86% när de testades på helt nya scenarion. Resultaten visar att olika typer av samarbete syns på olika sätt i AI-modellernas interna representationer.
OpenAI:s 852 miljarder-problem: hitta fokus OpenAI har nått en värdering på 852 miljarder dollar efter en rekordstor finansieringsrunda på 122 miljarder dollar, men kämpar nu med att hitta strategiskt fokus mitt i snabb expansion. Konkurrensen från Google och Anthropic tvingar företaget att omfokusera resurser mot kodningsplattformen Codex och enterprise-verktyg, samtidigt som höga kostnader för infrastruktur och talang pressar lönsamheten.
OpenAI introducerar flexibel betalning för Codex-team OpenAI lanserar nu betalning per användning för ChatGPT Business och Enterprise via Codex, vilket ger företag möjlighet att börja smått och skala upp efter behov. Tidigare tvingades team till fasta abonnemang, men den nya modellen låter organisationer betala endast för det de faktiskt använder.
Forskare återskapar OpenAI:s resultat för gpt-oss-modellen Forskare har lyckats reproducera OpenAI:s publicerade resultat för deras gpt-oss-20b-modell genom att reverse-engineera verktygsanvändningen och bygga en ny agent-harness. De uppnådde nästan identiska resultat: 60,4% på SWE Verified HIGH (jämfört med OpenAI:s 60,7%) och 91,7% på AIME25 med verktyg (90,4%), vilket är första gången någon oberoende grupp replikerat dessa siffror.
AI-boomen driver rekordinvesteringar i startups Riskkapitalinvesteringar slog alla rekord under Q1 2026 med 297 miljarder dollar globalt - en ökning på 150 procent driven av AI-boomen. Hela 81 procent av kapitalet (239 miljarder) gick till AI-företag, där bara fyra jättar - OpenAI, Anthropic, xAI och Waymo - tog hem 186 miljarder dollar tillsammans.
AI-boom driver rekordinvesteringar på 300 miljarder dollar Riskkapitalinvesteringar nådde rekordnivån 297 miljarder dollar första kvartalet 2026, med AI-företag som tog 81% av finansieringen. OpenAI ledde med en massiv rundning på 122 miljarder dollar, följt av Anthropic (30 miljarder), xAI (20 miljarder) och Waymo (16 miljarder) - fyra av historiens fem största investeringsrundor.
Anthropic läckte av misstag källkoden till Claude Code Anthropic har av misstag läckt ut källkoden till Claude Code, som innehåller 1 900 filer och 500 000 rader kod med referenser till tidigare okända funktioner. Den läckta koden avslöjar att företaget testar nya lägen som "Proactive mode" för kodning dygnet runt och "Dream" för problemlösning i bakgrunden.
Anthropics Claude-kod läckte av misstag Anthropic råkade exponera källkoden för Claude Code, vilket ger ovanliga insikter i hur stora språkmodeller fungerar internt. Läckan avslöjar tekniska detaljer som vanligtvis hålls hemliga av AI-företag.
AI:s förmåga att se 'hägn' visar hur främmande maskinhjärnor verkligen är Anthropic har av misstag läckt känsliga dokument två gånger på kort tid, inklusive information om deras nya AI-modell 'Mythos' som företaget säger representerar ett 'stegskifte' i kapacitet. Den senaste läckan inkluderade kod från Claude Code:s agentiska ramverk efter att dokumenten hamnade i en osäkrad och publikt sökbar databas.
OpenAI stänger finansieringsrunda på 122 miljarder dollar OpenAI har avslutat en omfattande finansieringsrunda värd 122 miljarder dollar och positionerar sig nu för en börsintroduktion under 2026. Den enorma kapitalinflödet understryker företagets starka marknadsposition inom AI-sektorn.
Läckta Claude-kodfiler avslöjar Anthropics interna arbete Interna kodfiler från Anthropics AI-modell Claude har läckt ut och visar hur företaget strukturerar sina utvecklingsdokument och verktyg. Läckan inkluderar detaljer om en ny markdown-editor och dokumenthantering, vilket ger en ovanlig inblick i hur AI-företag organiserar sitt utvecklingsarbete bakom kulisserna.
Anthropic köper biotech-startup för 400 miljoner dollar AI-jätten Anthropic har köpt det hemlighetsfulla biotech-startupen Coefficient Bio för 400 miljoner dollar i aktier. Det visar hur stora språkmodellföretag nu expanderar in i life sciences för att använda AI inom läkemedelsforskning och bioteknik.
Anthropic startar politisk lobbygrupp inför amerikanska val AI-företaget Anthropic har bildat en PAC (politisk aktionskommitté) för att stödja kandidater som delar deras syn på AI-reglering inför de amerikanska mellanårsvalen. Det är ett tecken på hur AI-företagen allt mer aktivt försöker påverka politiken som kommer forma branschens framtid.
AI Global Summit kommer till WMF 2026 med NVIDIA, Anthropic och OpenAI WMF 2026 arrangerar AI Global Summit 24-26 juni i Bologna, där teknikjättar som NVIDIA, Anthropic och OpenAI träffas för att diskutera AI:s framtid och reglering. Evenemanget samlar företag, institutioner och forskarvärlden för att forma AI-policyn på både europeisk och internationell nivå.
Zapier lanserar MCP för att koppla AI-verktyg till tusentals appar Zapier har byggt stöd för Anthropics Model Context Protocol (MCP), vilket låter AI-verktyg som Claude utföra handlingar i tusentals appar utan krånglig teknisk uppsättning. Tidigare krävdes omfattande utvecklingsarbete för att koppla AI till externa tjänster, men MCP fungerar som en universell översättare mellan AI och appar.
CORAL: AI-agenter som utvecklas autonomt för att lösa komplexa problem Forskare har utvecklat CORAL, ett system där flera AI-agenter samarbetar och utvecklas självständigt för att lösa öppna problem utan fasta regler. Systemet presterade 3-10 gånger bättre än traditionella metoder på tio olika uppgifter, och fyra samarbetande agenter förbättrade det bästa kända resultatet från 1363 till 1103 cykler på en komplex ingenjörsuppgift. Det intressanta är att agenterna lär sig av varandra genom delat minne och asynkron kommunikation, vilket visar vägen mot mer autonoma AI-system.
Anthropic utvecklar EvoSkills för självlärande AI-agenter Anthropic har utvecklat EvoSkills, ett system som låter AI-agenter själva skapa komplexa färdighetspaket med flera filer istället för att förlita sig på manuellt skapade verktyg. Systemet använder en generator som iterativt förbättrar färdigheterna tillsammans med en verifierare som ger feedback, och presterar bäst bland fem olika metoder på SkillsBench-testet. Det här är intressant eftersom det potentiellt kan göra AI-agenter mer självständiga i att lösa komplicerade uppgifter utan mänsklig inblandning.
Forskare visar att strukturerad LLM-routing kräver backend-specifika strategier Ny forskning med över 15 000 förfrågningar visar att det inte finns en universell bästa metod för att styra LLM-svar i AI-agentsystem – prestandan beror kraftigt på vilken backend (OpenAI, Gemini eller Llama) som används. Metoder som fungerar bra på Gemini och OpenAI kan ge betydligt sämre resultat på Llama, vilket tvingar utvecklare att anpassa sina strategier per leverantör.
AI-företagens värsta fiende är deras egna utvecklingsprocesser Anthropic har av misstag läckt både sin nya produkt och detaljerade ritningar för sitt mest använda verktyg under två veckor - båda fallen orsakades av mänskliga fel internt. Detta följer ett mönster från de senaste tre åren där stora AI-företag som Meta, Microsoft och OpenAI alla haft liknande säkerhetsbrister som kommer inifrån organisationerna, inte från externa attacker.
OpenAI:s AGI-chef tar sjukledighet Fidji Simo, OpenAI:s chef för AGI-implementering, tar sjukledighet i flera veckor på grund av en neuroimmun sjukdom. Under hennes frånvaro tar president Greg Brockman över produktansvar medan flera andra chefer delar upp affärsansvaret – ännu en förändring i OpenAI:s turbulenta ledning.
Anthropic förbjuder i praktiken OpenClaw från Claude genom extra avgifter Anthropic gör det betydligt dyrare att använda tredjepartsverktyget OpenClaw med Claude AI från 4 april – användare måste då betala per användning istället för att kunna använda sina befintliga abonnemangsramar. Förändringen kommer samtidigt som OpenClaws skapare Peter Steinberger nu jobbar för konkurrenten OpenAI, vilket kan förklara Anthropics vilja att styra användare mot egna verktyg som Claude Cowork.
Flat Capital säljer allt i Lovable och OpenAI för 720 miljoner Sebastian Siemiatkowskis Flat Capital säljer hela sin portfölj i AI-bolagen Lovable och OpenAI för 720 miljoner kronor. Det är anmärkningsvärt att Klarna-grundaren, som tidigare varit extremt optimistisk om AI:s framtid, nu väljer att avyttra sina stora AI-satsningar.
Shutterstock lanserar licensierad innehållsapp i ChatGPT Shutterstock har lanserat en app i ChatGPT som låter användare hitta bilder, videor, musik och ljudeffekter direkt i chatten från en av världens största innehållssamlingar. Integrationen möter den växande trenden där kreatörer börjar sina arbetsflöden inom AI-verktyg - OpenAI hanterar över en miljard förfrågningar per dag. Nu kan användare hitta kommersiellt licensierat innehåll utan att lämna sin AI-konversation.
AI Global Summit samlar teknikjättar i Bologna We Make Future arrangerar AI Global Summit 24-26 juni i Bologna, där NVIDIA, Anthropic och OpenAI deltar för att diskutera AI-styrning och tillämpningar. Evenemanget fokuserar på att föra samman företag, forskare och institutioner för att diskutera AI:s framtid och reglering.
Zapier byggde en influencer-dashboard med Claude Code Zapier använde Anthropics Claude Code för att bygga en dashboard som spårar ROI från över hundra influencer-partnerskap. Systemet analyserar allt från YouTube-visningar till när skapares videor dyker upp i AI-sökresultat - ett smart sätt att mäta hur AI påverkar influencer-marknadsföring.
OpenAI förvärvar TBPN OpenAI köper medieföretaget TBPN för att expandera sina globala AI-diskussioner och stödja oberoende media. Förvärvet syftar till att bredda dialogen med utvecklare, företag och den bredare teknikgemenskapen kring AI-utveckling.
Negativ kursreaktion på Flat Capitals AI-exit Investeringsbolaget Flat Capital sålde sina innehav i AI-bolag som OpenAI, vilket fick aktien att handlas ned på börsen. Marknaden tolkade tydligen försäljningen som en negativ signal, trots att AI-sektorn fortsatt är het.
OpenAI genomför ledningsförändringar med ny roll för COO OpenAI:s COO Brad Lightcap får en ny roll där han ska leda 'specialprojekt', medan marknadschef Kate Rouch tillfälligt lämnar företaget för att fokusera på cancerbehandling. Förändringarna kommer mitt i en period av snabb tillväxt för AI-företaget, men detaljerna kring Lightcaps nya ansvar hålls hemliga.
OpenAI köper AI-talkshow TBPN OpenAI har köpt TBPN, en viral daglig talkshow som intervjuar AI-chefer och tech-ledare i tre timmar per dag. Programledaren John Coogan, som har arbetat med OpenAI:s CEO Sam Altman i över ett decennium, säger att showen kommer att fortsätta som vanligt men nu med mer resurser.
OpenAI köper upp populär tech-podcast TBPN OpenAI har förvärvat TBPN, Silicon Valleys kultpodcast om teknikbranschen, som kommer fortsätta operera självständigt under överinseende av Chris Lehane. Det är ett ovanligt drag för AI-företaget att gå in i medieproduktion, vilket signalerar en bredare strategi för att forma narrativet kring AI-utveckling.
Fyra saker som krävs för att placera datacenter i rymden SpaceX ansökte i januari hos amerikanska FCC om att skjuta upp en miljon datacenter i jordens omloppsbana. MIT Technology Review förklarar vilka tekniska utmaningar som måste lösas: kraftförsörjning, kylning, dataöverföring och underhåll i rymdmiljö.
Elon Musk planerar SpaceX-börsnotering i juni Elon Musk har lämnat in ansökan för att börsnotera SpaceX, med en preliminär tidslinje som pekar mot juni efter SEC:s granskning. Artikeln spekulerar kring timing och regulatoriska processer, men innehåller inga konkreta detaljer om värdering eller investeringsvillkor.
SpaceX lämnar in ansökan om börsintroduktion SpaceX har konfidentiellt ansökt om börsnotering enligt Bloomberg, vilket kan bli världens största börsintroduktion. Elon Musks rymdbolag har lämnat in dokumenten men inga detaljer om värdering eller tidpunkt har släppts.
SpaceX lämnar in ansökan för börsnotering men håller siffrorna hemliga SpaceX har enligt Bloomberg lämnat in en konfidentiell ansökan för börsintroduktion till amerikanska SEC, vilket väntas bli den största börsnoteringen i mänsklighetens historia. Detaljerna om Starlinks intäkter och Starship-programmets kostnader kommer inte att avslöjas förrän 15 dagar innan företaget börjar presentera för investerare.
OpenAI:s marknadschef Kate Rouch avgår Kate Rouch lämnar sin roll som marknadschef på OpenAI för att fokusera på sin cancerbehandling. Företaget söker nu en permanent efterträdare till tjänsten.
Bränslpriser och SpaceX:s börsnotering i fokus Bränslpriserna stiger kraftigt på grund av konflikten i Iran, vilket kan leda till högre plastpriser framöver. Samtidigt diskuteras SpaceX:s potentiella börsintroduktion som en av de mest intressanta tekniknyheterna.