Finjustering av AI-modeller försämrar säkerhetsanpassning Forskare visar att finjustering av vision-språkmodeller på skadlig data skapar allvarliga säkerhetsproblem som sprider sig till orelaterade uppgifter. Redan 10% skadlig data i träningsdata orsakar betydande försämring av säkerhetsanpassning, och multimodal utvärdering avslöjar 70% högre missanpassning jämfört med endast textbaserad utvärdering.
AgentLAB: Ny benchmark för att testa AI-agenters säkerhetsbrister Forskare har lanserat AgentLAB, den första benchmarken för att mäta hur sårbara AI-agenter är för långsiktiga attacker som utnyttjar flera interaktioner över tid. Testet omfattar 644 säkerhetsfall och visar att nuvarande AI-agenter fortfarande är mycket känsliga för komplexa attacker som "intent hijacking" och "memory poisoning" (minnesförgiftning).
KLong: Träning av LLM-agent för extremt långsiktiga uppgifter Forskare har utvecklat KLong, en öppen AI-agent som tränas för att lösa extremt komplexa uppgifter som kräver många steg. Modellen på 106 miljarder parametrar presterar 11,28% bättre än Kimi K2 Thinking (1 triljon parametrar) på PaperBench-testet genom en ny träningsmetod som gradvis förlänger uppgifternas tidsramar.
Google lanserar Gemini 3.1 Pro och musikgenerering med Lyria 3 Google släppte Gemini 3.1 Pro i förhandsversion med förbättrad problemlösning och resonemang, samtidigt som de integrerade musikgenereringsmodellen Lyria 3 i Gemini-appen. MiniMax lanserade också sin M2.5-modell med 230 miljarder parametrar som uppnår toppresultat inom kodning och agentuppgifter.
Advideolab lanserar AI-plattform som automatiserar UGC-videoskapande för e-handelsvarumärken Norska Advideolab har lanserat en AI-plattform som skapar UGC-liknande reklamvideos från endast en produktbild, vilket eliminerar behovet av traditionell filminspelning och influencer-samarbeten. Plattformen stöder över 52 språk och kan generera veckor av marknadsföringsinnehåll på minuter istället för dagar, medan traditionella creator-partnerskap kostar mellan $200-1,000 per video.
OpenAI närmar sig rekordfinansering på över 126 miljarder dollar OpenAI är nära att slutföra en finansieringsrunda som kan inbringa över 100 miljarder dollar, vilket skulle värdera ChatGPT-skaparen till över 850 miljarder dollar. Amazon förväntas investera upp till 50 miljarder dollar, SoftBank 30 miljarder och andra stora tech-aktörer som Nvidia och Microsoft deltar också i den första fasen som ska slutföras i slutet av februari.
AI-forskare varnar för luckor i Europas AI-skydd EU:s AI-förordning träder i kraft stegvis från februari 2025 med böter på upp till 35 miljoner euro, men AI-forskare och civilsamhället varnar för att betydande skyddsluckor kvarstår. Ojämn verkställningskapacitet mellan medlemsländerna hotar att undergräva förordningens effektivitet trots dess horisontella ramverk som påminner om GDPR.
Anthropic studerar AI-agenters självständighet Anthropic har genomfört en egen studie av AI-agenters autonomi, liknande METR:s tidigare forskningsdata (METR är en organisation som mäter AI-risker). Studien fokuserar på hur självständigt AI-system kan agera och fatta beslut utan mänsklig övervakning.
EU:s AI-lag påverkar företag utanför Europa EU:s AI-lag kommer att gälla för företag utanför Europa som utvecklar högrisk-AI-system som används inom EU, även om företagen inte har fysisk närvaro i Europa. Företag bör börja förbereda sig nu inför lagen som träder i kraft i augusti.
Macron: Europa ska vara en 'trygg plats' för AI-innovation Frankrikes president Emmanuel Macron sa vid AI-toppmötet i New Delhi att EU kommer fortsätta forma spelreglerna för artificiell intelligens tillsammans med allierade som Indien. Han beskrev Europa som en 'trygg plats' för innovation och investeringar, samtidigt som kontinenten leder vägen med sin AI-lag som antogs 2024 och nu träder i kraft stegvis.
Agentisk AI kräver nya regler för ansvarsfull användning Agentisk AI (system som kan fatta beslut självständigt) ökar riskerna för dataintegrity och kräver starkare styrningsramar enligt Unisys. Företag behöver göra nya AI-riskbedömningar även för befintlig programvara när AI-funktioner läggs till. Principerna för ansvarsfull AI inkluderar rättvisa, säkerhet, ansvarsskyldighet och transparens.
AI:s miljarddollar-kapitalmaskineri enligt a16z Riskkapitalfirman Andreessen Horowitz har investerat över 10 miljarder dollar i AI-företag genom vad de kallar en 'kapital-flywheel' - där investeringar i modellföretag, infrastruktur och talang förstärker varandra. Martin Casado och Sarah Wang från a16z beskriver hur de systematiskt bygger upp ett ekosystem där deras portföljföretag stöttar varandra genom både kapital och teknisk expertise.
Stockholmsbaserad AI-webbläsare Strawberry lanserar öppen beta för att automatisera webarbetsflöden Stockholmsbaserade Strawberry har lanserat sin AI-drivna webbläsare i öppen beta efter ett år av sluten testning, med autonoma AI-agenter som kan navigera, klicka och utföra flerstegsuppgifter åt användaren. Webbläsaren riktar sig särskilt mot roller inom försäljning, rekrytering och drift där repetitivt manuellt arbete är vanligt. Företaget har nyligen säkrat 6 miljoner dollar i såddfinansiering från investerare som General Catalyst och EQT Ventures.
Kontakt.io lanserar AI-agenter för sjukhusoperationer Kontakt.io presenterar en svit av AI-agenter som ska hjälpa sjukhus att matcha utbud och efterfrågan, öka kapacitet och optimera patientflöden. Lösningarna kombinerar data från journalsystem (EHR) och lokaliseringsteknologi (RTLS) för att skapa en digital tvilling av sjukhuset och ge realtidsinsikter om vårdprocesser.
AI sparar tid – men vinsten äts upp av merarbete En ny Workday-rapport visar att 85% av anställda sparar 1-7 timmar i veckan med AI, men nästan 40% av den sparade tiden går åt till att korrigera och faktakolla AI-genererat innehåll. Företag som lyckas bäst med AI återinvesterar frigjord tid i kompetensutveckling och strategiskt arbete, men många fokuserar fortfarande bara på mer teknik istället för utbildning.
Bugg låter Copilot läsa hemliga mejl En bugg i Microsoft 365 Copilot fick AI-assistenten att ignorera känslighetsetiketter och läsa konfidentiella mejl. Microsoft har rullat ut en fix i början av februari, men det kan ta tid innan den når alla användare.
Uptiq samlar in 250 miljoner kronor för AI-lösningar inom finanssektorn Uptiq har säkrat 25 miljoner dollar (cirka 250 miljoner kronor) i Serie B-finansiering för att skala sin AI-plattform som är specialbyggd för banker och kreditföreningar. Företaget används redan av över 140 finansiella institutioner och har bearbetat transaktioner värda mer än 1 miljard dollar genom sin Qore-plattform. Pengarna ska användas för att lansera en självbetjäningsplattform för utvecklare inom finanssektorn.
Google integrerar AI-musikmodellen Lyria 3 i Gemini Google har lagt till musikmodellen Lyria 3 i Gemini, vilket låter användare skapa AI-genererad musik från textbeskrivningar på sekunder. Du kan be om en specifik stil som "humoristisk R&B-låt om en strumpa" och sedan justera tempo, röst och stil efteråt, eller till och med skapa musik baserat på foton och videos.
OpenAI nära att avsluta megarunda – på 900 miljarder (!) OpenAI står inför att genomföra en historisk finansieringsrunda värd 900 miljarder kronor, vilket skulle göra ChatGPT-skaparen till ett av världens mest värdefulla privata företag. Denna megarunda skulle befästa OpenAI:s position som ledare inom AI-utveckling och ge bolaget enorma resurser för fortsatt forskning och expansion.
DeepL lanserar AI-översättning på AWS Marketplace AI-översättningsföretaget DeepL blir nu tillgängligt via AWS Marketplace, vilket gör det enklare för företag att köpa och implementera deras språk-AI-lösningar. Tjänsten erbjuder säker och precis översättning genom DeepL API, och företaget har genomgått AWS tekniska granskning för säkerhet och driftsäkerhet.
Abstract lanserar AI-Gen Composable SIEM för säkerhetsoperationer Säkerhetsföretaget Abstract lanserar AI-Gen Composable SIEM, en ny arkitektur för säkerhetsoperationer som bygger AI direkt in i dataströmmen istället för att lägga till det som en efterkonstruktion. Företaget växte med 380% i årlig återkommande intäkt 2025 och menar att traditionella SIEM-plattformar (säkerhetsinformations- och händelsehanteringssystem) inte klarar av den 25-30% årliga ökningen av säkerhetsdata. Den nya modulära arkitekturen gör att organisationer kan köra hotdetektering i realtid och använda AI för att automatiskt prioritera och undersöka säkerhetshot.