Startup försöker bota AI-modellers grupptänk

MIT Technology Review

Stora språkmodeller som ChatGPT och Gemini har ett inbyggt grupptänk-problem – be dem välja ett slumpmässigt tal mellan 1 och 10 och du får nästan alltid 7. Ett startup försöker nu lösa detta genom att göra modellernas utdata mer genuint varierade, vilket är mer komplicerat än det låter eftersom slumpmässighet och kreativitet inte är samma sak för en AI.

Djupdykning

AI-modeller är tränade på mänsklig text, och mänsklig text är allt annat än slumpmässig – vi har favoritmönster, favoritexempel och favoritsvar på nästan allt. När du ber ChatGPT om ett slumptal mellan 1 och 10 och får 7, är det för att sjuan är statistiskt överrepresenterad i träningsdatan som "det typiska slumptalet" (det kallas ibland för "the lucky 7 bias"). Det startup:en i artikeln pekar på är ett strukturproblem: modellerna optimerar för det mest sannolika svaret, inte det mest korrekta eller kreativa, vilket skapar en slags konvergens mot medelmåttan. Det som kallas "groupthink" här är egentligen att miljarder parametrar alla dragit åt samma håll under träningen, och resultatet är en modell som är bättre på att låta rimlig än att faktiskt tänka utanför de inbyggda spåren. Det flesta pratar om AI-hallucineringar som problemet, men det motsatta problemet – att modellerna är för förutsägbara och homogena i sina svar – är minst lika allvarligt för alla som försöker använda AI för genuint kreativt eller analytiskt arbete.

🔗 Läs originalartikeln (MIT Technology Review)

◀ 4 av 16 ▶