Forskare förbättrar AI:s vardagslogik med maskinell fantasi

arXiv cs.AI

Forskare har utvecklat en ny metod där språkmodeller får "föreställa sig" bilder för att bättre förstå vardagslogik och minska mänskliga fördomar i textdata. Systemet, kallat Imagine, låter AI:n generera bilder internt under resoneringsprocessen och presterar bättre än befintliga zero-shot-metoder på flera benchmarks. Metoden visar att visuell information kan hjälpa språkmodeller att resonera mer som människor gör.