VitaBench 2.0: Nya test visar att AI-agenter fortfarande har svårt med personalisering Forskare har utvecklat VitaBench 2.0, ett testverktyg som mäter hur bra AI-agenter är på att förstå användarpreferenser över tid och agera proaktivt. Resultaten visar att även de mest avancerade språkmodellerna fortfarande har stora svårigheter med verklig personalisering - de missar viktiga ledtrådar från fragmenterade användarinteraktioner och lyckas sällan bygga upp en sammanhängande bild av vad användaren faktiskt vill.
AI-modeller kan manipulera sin egen träning för att förstärka oönskade bias Forskare har upptäckt att AI-modeller som tränas med mänsklig feedback (RLHF) kan påverka sin egen träningsdata för att förstärka bias och felaktig information. När modellen genererar svar med högre kvalitet men som innehåller partiskhet, väljer människor dem ändå baserat på kvaliteten – och träningsalgoritmen lär sig att förstärka dessa bias. Problemet är strukturellt inbyggt i hur RLHF fungerar och svårt att lösa utan att försämra svarkvaliteten.
AI-röstsystem kan kapas med dolda ljud Säkerhetsforskare har utvecklat AudioHijack, en attackmetod som använder dolda ljudsignaler för att kapa AI-röstsystem genom att manipulera musikklipp, videor eller röstsamtal. Tekniken fungerar med 79-96% träffsäkerhet och testades framgångsrikt mot 13 AI-modeller, inklusive kommersiella tjänster från Microsoft och Mistral. Angripare kan få AI:n att genomföra webbsökningar, ladda ned filer och skicka mejl med känslig data.
Företag kämpar med att implementera AI-agenter trots stora ambitioner 85% av företagen vill bli 'agentiska' (använda autonoma AI-system) inom tre år, men 76% erkänner att deras nuvarande infrastruktur inte klarar av förändringen. Gapet mellan ambition och genomförande visar att många organisationer behöver omstrukturera sina processer och arbetsflöden innan de kan dra nytta av AI-agenter på företagsnivå.
NVIDIAs nya Vera-processor utmanar konkurrenterna NVIDIA lanserar Vera CPU som är specialdesignad för agentic AI (AI-system som kan agera självständigt) med snabba kärnor och massiv minnesbandbredd. Första benchmarks från Phoronix visar lovande prestanda, särskilt när alla processorkärnor arbetar samtidigt. Intressant att se NVIDIA expandera från grafikkort till processorer för att möta AI-fabrikernas nya krav.
Verklighetscheck: AI-jobbaniken är överdrivet Trots all hysteri om att AI hotar kontorsjobb finns det fortfarande mycket lite bevis för att tekniken faktiskt har påverkat jobben i stor skala. MIT Technology Review menar att paniken är större än den faktiska effekten – åtminstone än så länge.
Microsoft Copilot Cowork läcker filer Microsoft Copilot Cowork har ett säkerhetsproblem som gör att AI-assistenten kan extrahera och läcka känsliga filer från företags system. Detta visar återigen hur AI-verktyg kan skapa oväntade säkerhetsrisker när de får tillgång till företagsdata.
Suno-användare lyssnar bara på sina egna AI-genererade låtar En växande trend på Suno-forumet visar att människor slutar lyssna på traditionell musik och istället enbart konsumerar sina egna AI-genererade låtar. Användare beskriver det som en "beroendeframkallande addiction" och säger att de inte längre använder Spotify – de lyssnar bara på sina egna AI-skapade "bangers" dygnet runt.
OpenRouter mer än fördubblar värderingen till 1,3 miljarder dollar på ett år OpenRouter, som låter utvecklare använda flera AI-modeller genom en API, har samlat in 113 miljoner dollar i en Serie B-runda ledd av CapitalG och nått en värdering på 1,3 miljarder dollar. Företaget rapporterar en femfaldig ökning av användningen på sex månader, vilket tyder på att framtiden med flera konkurrerande AI-modeller är här nu.
Startup betalar indiska gig-arbetare för att träna världens robotar Human Archive, grundat av forskare från Berkeley och Stanford, betalar gig-arbetare i Indien för att bära kameror och sensorer som samlar in verklig träningsdata för AI och robotik. Företaget satsar på att Indiens enorma gig-ekonomi kan bli en guldgruva för den fysiska data som robotlabb desperat behöver för att träna sina system.
Är SaaS död? MCP gör comeback Model Control Protocol (MCP) - Anthropics standard för AI-agenter att prata med externa verktyg - kan förändra hur vi bygger mjukvara. Istället för traditionella SaaS-appar kan AI-agenter snart komma åt data och funktioner direkt via standardiserade protokoll, vilket potentiellt gör mellanliggande gränssnitt överflödiga.
SVT bantar redaktionerna – men plockar in 16 nya AI-specialister SVT genomför ett sparpaket som skär över 100 tjänster samtidigt som de anställer 16 AI-specialister för att bygga automationsteam. Det visar hur svenska medieföretag balanserar kostnadsbesparingar med teknikinvesteringar – traditionella journalistjobb försvinner medan AI-kompetens prioriteras.
AI-svensken hyllas av Daniel Ek efter jätterundan AI-bolaget Modal, lett av svensken Erik Bernhardsson, har nått en värdering på 43 miljarder kronor och siktar på att trefaldiga intäkterna till 10 miljarder nästa år. Bolaget planerar att dubbla sin arbetsstyrka i Stockholm och överväger börsnotering inom 3-4 år, samtidigt som grundaren fått uppmärksamhet från Spotifys Daniel Ek.
De tjänar 230.000 per dag på bankernas "AI-ångest" Två företagare tjänar 230.000 kronor per dag genom att hjälpa Wall Street-banker med AI-implementering när finanssektorn despererat försöker automatisera processer. Efterfrågan på AI-experter exploderar när bankerna inser att de ligger efter i utvecklingen och behöver extern hjälp för att inte tappa konkurrenskraft.
Bank of America höjer riktkurs för Apple med hänvisning till agentisk AI Bank of America höjer sin riktkurs för Apple till 380 dollar från 330 dollar och menar att bolaget har "betydande möjligheter" inom agentisk AI (system som kan utföra komplexa uppgifter självständigt). En upprevision på 15 procent som visar hur AI-potentialen nu driver värderingen även för traditionella teknikjättar.
Efter kurskraschen – svensken befordras till AI-chef Joel Hellermark, 29-årige grundare av svenska Sana som köptes upp av Workday förra året, befordras nu till AI-chef för hela koncernen. Det sker efter att hr-mjukvarubolaget har haft en tuff period på börsen och bytt vd.