Box Maze: En processarkitektur för pålitligare AI-resonemang

arXiv cs.AI

Forskare presenterar Box Maze, en ny arkitektur som ska göra stora språkmodeller mer pålitliga genom att dela upp resonemangsprocessen i tre lager: minnesförankring, strukturerad slutledning och gränsupprätthållande. I tester med modeller som DeepSeek-V3 och Qwen minskade felfrekvensen från 40% till under 1% när AI-systemet utsattes för adversariella prompter (medvetet vilseledande instruktioner).

🔗 Läs originalartikeln (arXiv cs.AI)

◀ 2 av 56 ▶