Box Maze: En processarkitektur för pålitligare AI-resonemang
arXiv cs.AI
Forskare presenterar Box Maze, en ny arkitektur som ska göra stora språkmodeller mer pålitliga genom att dela upp resonemangsprocessen i tre lager: minnesförankring, strukturerad slutledning och gränsupprätthållande. I tester med modeller som DeepSeek-V3 och Qwen minskade felfrekvensen från 40% till under 1% när AI-systemet utsattes för adversariella prompter (medvetet vilseledande instruktioner).