GrandCode blir första AI-system att slå alla mänskliga deltagare i programmeringstävlingar

arXiv cs.AI

Forskare har utvecklat GrandCode, en AI-agent som som första system konsekvent besegrar alla mänskliga deltagare i liveprogrammeringstävlingar på Codeforces – inklusive legendära grandmasters. Systemet använder flera AI-agenter som samarbetar (hypotesgenerering, problemlösning, testgenerering) och tränas med en ny förstärkningslärningsmetod kallad Agentic GRPO. Det här markerar att AI äntligen har överträffat de starkaste mänskliga programmerarna på de mest utmanande kodningsuppgifterna.

Djupdykning

Google har just krossat den sista mänskliga fästningen inom programmering. GrandCode är det första AI-systemet som konsekvent vinner live-tävlingar mot världens bästa programmerare – inklusive legendära grandmasters som tidigare verkade opåverkliga. Det som gör systemet så kraftfullt är hur det orkesterar flera AI-agenter som arbetar tillsammans: en genererar hypoteser, en annan löser problem, en tredje skapar testfall, och så vidare, alla tränade genom förstärkningsinlärning för att förbättra sig i realtid. Det här är betydligt mer än bara en teknisk milstolpe. Competitive programming kräver inte bara kodningsförmåga utan också kreativ problemlösning, strategiskt tänkande under tidspress och förmågan att hantera helt nya utmaningar – exakt de kognitiva färdigheter vi trodde skulle vara säkra från automatisering längst. När AI nu dominerar även detta område börjar gränsen mellan mänsklig och artificiell intelligens suddas ut på ett sätt som kommer påverka allt från rekrytering av mjukvaruingenjörer till hur vi definierar mänsklig expertis.

🔗 Läs originalartikeln (arXiv cs.AI)

◀ 1 av 18 ▶