AI-modeller påverkas av tidigare bedömningar i samma konversation
arXiv cs.AI
En stor studie med över 75 000 API-anrop visar att språkmodeller blir partiska när de utvärderar saker efter varandra i samma konversation – negativa bedömningar i historiken påverkar 1,6 gånger mer än positiva. Effekten är störst när modellen från början är osäker, och större modeller löser inte problemet helt.