Dolda störningar mellan promptmoduler kan påverka AI-agenters beslut

arXiv cs.AI

Forskare har identifierat ett smygande problem i AI-agenter byggda av flera promptmoduler: när du ändrar en modul kan beteendet hos en annan förändras, utan att de delar några variabler. I ett test med Claude Sonnet 4.6 (144 försök) visade sig innehållsförändringar i icke-relevanta moduler ha en mätbar effekt (Cohen's d = 0,63), även om inget enskilt beslut flippade – ett subtilt fel som kan ackumuleras över tusentals beslut i ett driftsatt system. Det intressanta här är att problemet är arkitekturellt: transformermodellers självuppmärksamhet (den mekanism som låter AI 'läsa' hela sin kontext på en gång) skapar inga naturliga gränser mellan sammankopplade promptblock.

🔗 Läs originalartikeln (arXiv cs.AI)

◀ 18 av 194 ▶