NEX: Ny metod för att välja bästa AI-resonemang utan manuell märkning

arXiv cs.AI

Forskare presenterar NEX, ett system som automatiskt kan bedöma kvaliteten på AI-modellers resonemang genom att analysera neuronaktivering i två faser - utforskning och utnyttjande. Metoden kan identifiera bättre modellvarianter och rankordna svar utan att behöva rätta svar, vilket testas framgångsrikt på Qwen3-familjen av modeller.

Djupdykning

Forskare har utvecklat NEX, en metod för att automatiskt bedöma kvaliteten på AI-modellers resonemang utan att behöva korrekta svar som referens. Metoden bygger på att analysera hur neuroner i språkmodeller aktiveras under olika faser av problemlösning - en utforskningsfas där nya idéer genereras och en exploateringsfas där modellen fokuserar på de mest lovande lösningarna. Detta är särskilt relevant eftersom dagens AI-system ofta genererar flera olika svarstankar och behöver välja den bästa, vilket traditionellt kräver mänsklig bedömning eller kända facit. NEX kan identifiera vilka AI-modellvarianter som presterar bäst genom att bara titta på aktiveringsmönster i neuronnätverk, vilket skulle kunna dramatiskt minska kostnaden för att utveckla och förbättra AI-system. Tekniken har testats på Qwen3-modeller och visar lovande resultat för att förutsäga prestanda på olika resonemangsproblem. För svensk AI-utveckling innebär detta potentiellt billigare och snabbare sätt att optimera svenska språkmodeller utan att behöva stora mängder märkt träningsdata. Nyckelinsikt: NEX erbjuder en väg mot mer kostnadseffektiv AI-utveckling genom att automatisera kvalitetsbedömning av modellers resonemang baserat enbart på intern neural aktivitet.