Utvecklare smugglade in prompt som fick AI-verktyg att radera kod

Ars Technica

En frustrerad utvecklare gömde en dold prompt i sitt bibliotek jqwik som instruerade AI-kodningsverktyg att radera applikationsutdata. Sabotaget riktade sig mot så kallade 'vibe coders' som förlitar sig på AI för kodning utan att förstå vad som händer.

Djupdykning

En utvecklare smugglade in en dold prompt injection i sitt populära Java-testbibliotek jqwik som instruerade AI-kodningsverktyg att radera applikationsutdata. Attacken riktade sig specifikt mot så kallade "vibe coders" – utvecklare som förlitar sig på AI för att generera kod utan att förstå vad den egentligen gör. Det som gör detta extra intressant är att det exponerar en fundamental sårbarhet i hur AI-kodningsverktyg fungerar. När GitHub Copilot eller liknande verktyg läser kod för att förstå kontexten, tolkar de också dolda instruktioner som kan manipulera deras beteende. Det här är inte bara en teknisk kuriositet – det visar att hela ekosystemet av AI-assisterad programmering kan hijackas på samma sätt som traditionella prompt injections fungerar. Attacken fungerar eftersom AI-verktygen behandlar kommentarer och dokumentation som instruktioner, inte bara som passiv text. Den här incidenten kommer troligen att tvinga fram säkerhetsstandarder för hur AI läser och tolkar befintlig kod, ungefär som hur webbläsare införde samma-origin-policies för att stoppa skadlig JavaScript.