AI-modeller i grupp fattar bättre beslut – upp till 37 procentenheter lägre felmarginal

arXiv cs.AI

Forskare testade om flera AI-modeller tillsammans kan efterlikna det fenomen där stora grupper av människor gemensamt når förvånansvärt träffsäkra svar. I ett experiment med 960 promptar mot GPT-5, Gemini 2.5 Pro och Claude Sonnet 4.5 minskade felprocenten med upp till 37 procentenheter när modellernas svar kombinerades. Intressant nog visade modellerna också en viss självkännedom – de tenderade att ange bredare osäkerhetsintervall just när deras svar faktiskt var sämre.