Import AI om superövertalning, självförsörjande AI och vägar mot ASI Senaste numret av Import AI tar upp tre tunga teman: AI:s förmåga att övertala människor på ett sätt som överstiger mänsklig kapacitet, system som kan underhålla sig själva utan mänsklig inblandning, och olika tänkbara vägar mot ASI (artificiell superintelligens). Intressant nog undersöker numret också hur trosliknande övertygelserna kring 'singulariteten' faktiskt är – en fråga som säger lika mycket om AI-kulturen som om tekniken själv.
OpenAI-styrelseledamoten som bygger verktyg för att knäcka AI-system Zico Kolter, styrelseledamot i OpenAI, och Matt Fredrikson från säkerhetsföretaget Gray Swan förklarar varför AI-säkerhet är ett eget fält – inte bara vanlig cybersäkerhet med AI-twist. Kärnan i deras arbete är 'red-teaming' (att aktivt försöka lura eller bryta mot AI-system för att hitta svagheter) och hur svårt det är att bygga modeller som faktiskt håller när någon verkligen försöker manipulera dem.
Ny inlärningsmetod låter AI-agenter anpassa sig i realtid utan extra träning Forskare föreslår en metod kallad 'active inference' som låter fysiska AI-agenter – exempelvis autonoma fordon – hantera oväntade situationer i realtid, utan att behöva tränas om. Istället för att skala upp med mer data eller större modeller skalar metoden med agentens faktiska erfarenheter i världen, inspirerad av hur hjärnans basala ganglierna och prefrontala cortex fungerar. I simuleringar på köruppgifter förbättrades inferenseffektiviteten (hur snabbt agenten fattar beslut) med över 36 procent jämfört med etablerade metoder.
OpenAI lanserar säkerhetsverktyg för att hitta och laga kodbrister i stor skala OpenAI har lanserat Daybreak – en uppsättning AI-drivna säkerhetsverktyg som inkluderar Codex Security och GPT-5.5-Cyber, designade för att hjälpa organisationer hitta, bekräfta och åtgärda säkerhetshål i kod. Det intressanta här är att OpenAI nu går från att bygga AI-modeller till att erbjuda specialiserade verktyg för cybersäkerhet – ett område där automation kan göra stor praktisk skillnad.
PaperClaw: AI-agent skriver hela forskningsartiklar från ax till limpa Forskare har byggt PaperClaw, ett multi-agent-system (flera AI-agenter som samarbetar) som självständigt kan ta ett forskningsprojekt från idéstadiet till färdig vetenskaplig artikel – inklusive litteratursökning, hypotesgenerering och kodkörning. Systemet håller koll på hela processen i ett gemensamt minne så att en lång körning kan pausas och återupptas, och en människa kan kliva in när som helst för att förbättra resultatet. Det intressanta är inte att AI kan skriva text, utan att det faktiskt kör experiment och bara citerar källor som verifierats mot öppna databaser – vilket adresserar det klassiska problemet med AI som hittar på referenser.
Digitala kognitiva tvillingar: nya AI-system som modellerar din hjärna kräver ny reglering Forskare varnar för en ny typ av AI-system de kallar 'kognitiva digitala tvillingar' (CDT) – modeller som kontinuerligt uppdateras för att simulera en specifik persons tankesätt och fatta beslut i dennes ställe. Problemet är att befintlig AI-reglering, som EU:s AI-förordning, bara täcker datanvändning och automatiserade beslut – inte själva representationen av en persons kognition, vilket är det verkligt känsliga steget. Artikeln föreslår ett ramverk med fem principer (auktoritet, autonomi, tillgång, ansvarsskyldighet och tillgänglighet) och påpekar risker som 'skuggtvillingar' – CDT-versioner av dig som skapas utan din vetskap.
Anthropics fejd med regeringen: tre saker att hålla koll på Anthropic hamnade i konflikt med den amerikanska regeringen efter att i april ha avslöjat att de byggt en AI-modell kallad Mythos – och fejden har sedan dess eskalerat. Det handlar i grunden om spänningen mellan AI-bolagens vilja att arbeta självständigt och statens intresse av insyn och kontroll. Tre konkreta saker att bevaka framöver: hur transparenskraven utvecklas, vad det innebär för andra AI-bolag, och om Anthropic behåller sitt rykte som det 'ansvarsfulla' alternativet.
AI-agenter som aldrig slutar jobba – möt 'loopen' Det senaste steget inom agentisk AI (system som självständigt utför uppgifter) kallas 'the loop' – en modell där en hel svärm av AI-agenter arbetar kontinuerligt i bakgrunden utan att någonsin stanna. Tanken är att AI inte längre väntar på instruktioner utan helt enkelt alltid är igång, vilket väcker både intressanta möjligheter och uppenbara frågor om kontroll och resursåtgång.
NVIDIA lanserar AI-verktyg för vetenskaplig forskning – från materialkemi till mörk materia På ISC-konferensen i Hamburg presenterar NVIDIA tre nya mjukvarubibliotek som ska göra det snabbare att använda AI inom naturvetenskap: DAQIRI och ALCHEMI NIM (färdiga AI-moduler för kemi och materialforskning) samt cuPhoton för astronomi. Det intressanta här är att NVIDIA inte längre bara säljer hårdvara – de bygger alltmer specialiserade AI-verktyg riktade direkt mot forskare inom specifika discipliner.
Five Eyes varnar: kraftfull AI kan lamslå företag och regeringar inom månader Underrättelsetjänsterna i Five Eyes-samarbetet (USA, Storbritannien, Kanada, Australien och Nya Zeeland) varnar för att AI-modeller med potential att allvarligt skada både företag och regeringar kan vara verklighet inom några månader. Det krävs samordnade insatser från hela organisationer och samhället för att möta hotet, enligt ett gemensamt uttalande som rapporterats av The Guardian. Det intressanta här är inte bara själva hotet utan att det är underrättelsemyndigheter – inte AI-forskare – som nu höjer rösten.
AI-styrningens blinda fläck: vi saknar bevis för att fatta säkra beslut Forskare pekar på ett grundläggande problem i hur organisationer hanterar AI-styrning: vi fokuserar på vad ett system ska klara av – säkerhet, rättvisa, tillförlitlighet – men glömmer att faktiskt samla in tillräckliga bevis för att veta om det lyckas. De kallar detta 'AI Evaluability Gap' och föreslår ett ramverk med sex egenskaper som bevisen måste uppfylla, bland annat att de ska vara observerbara, verifierbara och tidsmässigt giltiga. Det är en torr men träffsäker iakttagelse: utan evidensgrund är AI-styrning mest önsketänkande på papper.
Trump backar: Anthropic är inte längre ett säkerhetshot Donald Trump säger i en intervju med Axios att han ändrat uppfattning om AI-bolaget Anthropic och inte längre ser det som ett nationellt säkerhetshot. Bakgrunden är en dispyt om exportkontroll av modellerna Fable 5 och Mythos 5 – när administrationen beordrade Anthropic att blockera utländska användare valde bolaget att stänga av åtkomsten för alla, vilket tydligen imponerade på Trump som berömde vd Dario Amodei för att ha agerat 'mycket snabbt och ansvarsfullt'.
Prompt Injection som rollförvirring Prompt injection – där en angripare lurar en AI-modell att följa skadliga instruktioner gömda i text den bearbetar – kan förstås som ett rollkonfusionsproblem: modellen kan inte skilja på vem som faktiskt har rätt att ge den order. Det är ett grundläggande säkerhetsproblem för AI-agenter (system som agerar självständigt på uppdrag av användare), eftersom de ofta hanterar opålitligt innehåll från nätet eller e-post. Utan tydliga mekanismer för att separera betrodda instruktioner från opålitlig data förblir angreppsytan stor.
Moebius 0.2B: En bildbehandlingsmodell som nu körs direkt i webbläsaren Simon Willison har portat Moebius 0.2B – en liten AI-modell för inpainting (att fylla i eller ersätta delar av bilder) – så att den kan köras helt i webbläsaren utan server, med hjälp av Claude Code som kodassistent. Det intressanta här är inte bara modellen i sig, utan att en 0.2 miljarder parametrar stor modell nu är tillräckligt kompakt för att fungera direkt i din webbläsare.
Amazon testar Hindi-version av Alexa+ i Indien Amazon expanderar sin nya konversations-AI Alexa+ till Indien och bjuder in användare att testa en Hindi-version av tjänsten. Det är ett tydligt tecken på att Amazon satsar på att ta Alexa+ utanför den engelskspråkiga marknaden – något som kan bli avgörande för hur brett assistenten faktiskt används.
NVIDIA bygger AI-agenter för telekombranschen NVIDIA lanserar AI-agenter riktade mot telekomoperatörer för att automatisera nätverkshantering, kundtjänst och backoffice-funktioner dygnet runt. Tanken är att gå från enkel uppgiftsautomatisering till verklig autonomi – där AI-agenterna själva korrelerar data och tar nästa steg utan mänsklig styrning. Intressant nog är det telekom, snarare än de mer omtalade branscherna, som verkar ligga långt fram i den här omställningen.
OpenAI använder AI för att hitta säkerhetshål i öppen källkod OpenAI lanserar ett nytt initiativ där AI används för att söka igenom och lappa säkerhetsproblem i öppen källkod (programvara vars kod är fritt tillgänglig för alla). Det intressanta här är att OpenAI positionerar sig som en säkerhetsaktör snarare än bara en modellbyggare – ett område som hittills dominerats av specialiserade säkerhetsföretag.
USA:s AI-forskningsprogram når 700 projekt med NVIDIA-infrastruktur Det amerikanska forskningsprogrammet NAIRR, drivet av National Science Foundation, har under två år stöttat över 700 forskningsprojekt inom allt från proteinförutsägelse till hantering av smittoutbrott. NVIDIA har bidragit med molnbaserade resurser som ger forskare direkt tillgång till AI-infrastruktur. Det intressanta här är egentligen hur statligt finansierad AI-infrastruktur börjar forma vetenskaplig forskning i bred skala – inte bara inom tech.
Nordkoreanska hackare planterade skadlig kod i AI-ramverket Mastra Microsofts säkerhetsavdelning pekar ut den nordkoreanska gruppen Sapphire Sleet som ansvarig för skadlig kod som hittades i över 140 npm-paket kopplade till Mastra – ett ramverk som används för att bygga AI-agenter. Målet verkar ha varit att stjäla inloggningsuppgifter, API-nycklar och kryptoplånböcker från utvecklare. Det är samma grupp som tidigare attackerat HTTP-klienten Axios i april.