Dolda störningar mellan promptmoduler kan påverka AI-agenters beslut
arXiv cs.AI
Forskare har identifierat ett smygande problem i AI-agenter byggda av flera promptmoduler: när du ändrar en modul kan beteendet hos en annan förändras, utan att de delar några variabler. I ett test med Claude Sonnet 4.6 (144 försök) visade sig innehållsförändringar i icke-relevanta moduler ha en mätbar effekt (Cohen's d = 0,63), även om inget enskilt beslut flippade – ett subtilt fel som kan ackumuleras över tusentals beslut i ett driftsatt system. Det intressanta här är att problemet är arkitekturellt: transformermodellers självuppmärksamhet (den mekanism som låter AI 'läsa' hela sin kontext på en gång) skapar inga naturliga gränser mellan sammankopplade promptblock.