PaperClaw: AI-agent skriver hela forskningsartiklar från ax till limpa

arXiv cs.AI

Forskare har byggt PaperClaw, ett multi-agent-system (flera AI-agenter som samarbetar) som självständigt kan ta ett forskningsprojekt från idéstadiet till färdig vetenskaplig artikel – inklusive litteratursökning, hypotesgenerering och kodkörning. Systemet håller koll på hela processen i ett gemensamt minne så att en lång körning kan pausas och återupptas, och en människa kan kliva in när som helst för att förbättra resultatet. Det intressanta är inte att AI kan skriva text, utan att det faktiskt kör experiment och bara citerar källor som verifierats mot öppna databaser – vilket adresserar det klassiska problemet med AI som hittar på referenser.

Djupdykning

Forskarvärlden har länge kämpat med ett grundläggande problem: det tar år att gå från idé till publicerad artikel, och mycket av den tiden spenderas på repetitivt arbete som litteratursökning, hypotestestning och formatering. PaperClaw försöker automatisera hela den kedjan – inte bara skriva text, utan faktiskt köra kod, söka i vetenskapliga databaser och bygga upp ett "hypothesis map" (tänk ett levande träd av idéer som växer eller dör beroende på vad experimenten visar) som stoppas automatiskt när bevisen håller. Det de flesta missar i rapporteringen om AI-forskning är att hallucinationsproblemet – att modeller hittar på referenser och resultat – länge har gjort sådana system oanvändbara i praktiken. PaperClaw adresserar det specifikt genom att bara citera källor validerade mot öppna vetenskapliga index och bara rapportera experiment som faktiskt körts, vilket är en betydligt mer trovärdig design än de flesta konkurrerande system. "Human-in-the-loop" låter som en säkerhetsventil, men här är det snarare en produktfunktion: systemet kan pausa mitt i en lång körning, en människa kan kliva in och justera riktningen, och sedan fortsätta – utan att tappa kontexten från tidigare steg. Det är mer som att ha en assistent som aldrig glömmer vad ni pratade om förra veckan än ett vanligt AI-verktyg du ger ett nytt uppdrag varje gång. Om systemet håller vad det lovar förskjuts forskarens roll från att producera kunskap till att välja vilken kunskap som är värd att producera – och det är en ganska radikal omdefiniering av vad det betyder att vara akademiker.