M²-Miner: Multi-Agent system för automatiserad datautvinning av mobila GUI-agenter
Forskare har utvecklat M²-Miner, ett automatiserat system som använder Monte Carlo Tree Search och tre samarbetande AI-agenter för att samla in träningsdata för mobila GUI-agenter. Systemet adresserar problemen med höga kostnader och låg datakvalitet i nuvarande metoder genom att automatiskt generera användarbeteende-trajektorier. De fine-tunade GUI-agenterna uppnår topprestanda på flera mobila GUI-benchmarks.
Djupdykning
M$^2$-Miner representerar ett betydande genombrott inom utvecklingen av GUI-agenter genom att lösa det kritiska problemet med att skapa högkvalitativ träningsdata för mobila gränssnitt. Systemets multi-agent-arkitektur med InferAgent, OrchestraAgent och JudgeAgent automatiserar processen att generera användarinteraktionsdata, vilket drastiskt reducerar kostnaderna jämfört med manuell annotering samtidigt som datakvaliteten förbättras. Den innovativa användningen av Monte Carlo Tree Search (MCTS) kombinerat med intent-återvinningsstrategier gör det möjligt att extrahera mer varierade och värdefulla interaktionsmönster från mobilapplikationer. För svensk tech-industri är detta särskilt relevant då utvecklingen av intelligenta GUI-agenter blir allt viktigare för att skapa mer intuitiva användarupplevelser i mobilappar och digitala tjänster. Den progressiva träningsstrategin och de imponerande benchmarkresultaten visar att automatiserad datagenerering nu kan konkurrera med eller överträffa traditionella metoder. Nyckelinsikt: M$^2$-Miner demokratiserar utvecklingen av avancerade GUI-agenter genom att eliminera behovet av kostsam manuell dataannotering samtidigt som prestandan förbättras.