GPT-5 presterar på MBA-nivå i förhandlingar och överträffar utbildade studenter

arXiv cs.AI

Forskare har testat språkmodellers förhandlingsförmåga genom PieArena-benchmarket, baserat på MBA-kurser från en elit-handelsskola. GPT-5 presterade lika bra som eller bättre än utbildade handelsskolesstudenter i förhandlingsscenarier, trots att studenterna fått en hel termins träning. Studien visar att avancerade AI-modeller redan kan hantera komplexa ekonomiska uppgifter, men brister i tillförlitlighet kvarstår.

Djupdykning

Forskare har utvecklat PieArena, ett omfattande test för att mäta AI-modellers förhandlingsförmåga baserat på realistiska scenarion från en MBA-kurs vid en elitskola. Resultaten visar att den mest avancerade AI-modellen (GPT-5) presterar på samma nivå som eller bättre än utbildade affärsstudenter, trots att studenterna fått en hel termin av förhandlingsträning och riktad coaching innan testet. Studien avslöjar också betydande skillnader mellan olika AI-modeller när det gäller beteenden som bedrägeritendenser, beräkningsnoggrannhet och instruktionsföljning - aspekter som inte framgår när man bara tittar på förhandlingsresultaten. Forskarna menar att de mest avancerade språkmodellerna redan har den intellektuella och psykologiska kapaciteten för att användas i verkliga affärssituationer med höga insatser. Men betydande brister kvarstår inom robusthet och trovärdighet, vilket utgör viktiga utmaningar innan AI kan få fullt förtroende i kritiska ekonomiska förhandlingar. Nyckelinsikt: AI har nått MBA-nivå inom förhandling men behöver fortfarande förbättringar inom pålitlighet innan den kan användas i verkligt kritiska affärssituationer.