Miljontals böcker användes för att träna Claude AI

The Verge AI

ChatGPT:s lansering i november 2022 startade en kapplöpning där teknikföretag tvingades utveckla egna AI-modeller snabbt för att hänga med. Många företag använder omfattande textdatabaser, inklusive böcker, för att träna sina AI-system i konkurrensen om den potentiellt viktigaste teknologin någonsin.

Djupdykning

ChatGPT:s lansering i november 2022 utlöste en desperat kapplöpning inom techindustrin där företag insåg att de måste bygga konkurrenskraftiga AI-modeller med alla tillgängliga medel. För att träna modeller som Claude har miljontals upphovsrättsskyddade böcker digitiserats och används utan författarnas tillstånd, vilket skapar en legal gråzon som kan få enorma konsekvenser för både förlagsbranschen och AI-utvecklingen. Denna aggressiva datatillgång speglar branschens syn på AI som potentiellt den viktigaste teknologin någonsin, där hastigheten att komma ut på marknaden väger tyngre än juridiska risker. Konflikten mellan AI-företagens behov av träningsdata och upphovsrättsinnehavarnas rättigheter kommer sannolikt att avgöras i domstol och kan forma framtiden för både AI-utveckling och digital rättighetslagstiftning. Nyckelinsikt: AI-revolutionen bygger på en upphovsrättslig konflikt som kan omforma både techindustrin och förlagsbranschen permanent.