AI-system löser forskarmatematik med flera samarbetande agenter

arXiv cs.AI

Forskare har utvecklat RMA (Research Math Agents), ett AI-system som löser avancerade matematiska problem på forskningsnivå genom att låta flera specialiserade agenter samarbeta. Systemet klarade av att lösa åtta av tio forskningsproblem från First Proof-benchmarken och presterade bättre än GPT-5.2R genom att kombinera litteratursökning, bevisverifiering och iterativ förbättring. Det är första gången AI tacklar riktigt komplexa matematiska problem som kräver djup förståelse och långsiktig planering, snarare än bara tävlingsmatematik.

Djupdykning

OpenAI har skapat Research Math Agents (RMA), ett system som faktiskt kan lösa matematikproblem på forskningsnivå – inte bara skolmatte eller tävlingsuppgifter som de flesta AI-system hittills klarat av. Det stora genomslaget här är att RMA kan göra det som krävs för riktig matematisk forskning: söka genom litteratur, bygga upp kunskapsbanker, och iterativt förbättra bevis genom flera omgångar av feedback mellan specialiserade agenter. Vad som gör detta annorlunda är att systemet inte bara ger ett svar – det arbetar som en forskargrupp där olika "agenter" har olika roller och kommunicerar genom ett delat minne. När systemet testades på tio forskningsproblem från experter löste det åtta av dem, vilket överträffade både GPT-5.2R och andra avancerade system. Det intressanta är att framgången inte kom från någon enskild smart komponent, utan från hur alla delar arbetade tillsammans – precis som hur de bästa matematiska genombrotten ofta kommer från tvärvetenskaplig kollaboration snarare än ensamma genier.

🔗 Läs originalartikeln (arXiv cs.AI)

◀ 9 av 19 ▶