Encyclopedia Britannica stämmer OpenAI medan vuxenläget väntar

OpenAI får hantera både juridiska problem och innehållsmoderation samtidigt denna vecka. Encyclopedia Britannica och Merriam-Webster har lämnat in en stämning som påstår att ChatGPT har "memorerat" deras upphovsrättsskyddade material och kan spotta ut nästan identiska kopior på begäran.
Det här är inte bara ytterligare en upphovsrättsstämning. Britannica hävdar specifikt att GPT-4 kan reproducera betydande delar av deras innehåll ordagrant, vilket tyder på att modellen bokstavligen har lagrat deras texter istället för att bara lära sig från dem. För dig som bygger AI-produkter är det en viktig skillnad: det ena är träning, det andra är potentiell piratkopiering.
Medan juridiska teamet jobbar med det problemet planerar OpenAI att lansera sitt länge efterlängtade "vuxenläge" för ChatGPT. Funktionen kommer att tillåta "pikanta" textkonversationer men inte bildgenerering, röst eller video. OpenAI kallar det smut snarare än pornografi, vilket låter som en distinktion som kommer att testas hårt både av användare och moderatorer.
Timing är intressant. Samtidigt som OpenAI försvarar sig mot påståenden om att ha kopierat encyklopediskt innehåll, rullar de ut en funktion som kommer att generera helt annat sorts innehåll. Det visar den balansgång AI-företag måste göra: att pusha gränserna för vad modeller kan göra samtidigt som de hanterar allt från upphovsrättsfrågor till innehållspolicy.
För builders innebär det här två lärdomar: säkerställ att din träningsdata faktiskt är legal att använda, och förbered dig på att dina innehållsriktlinjer kommer att utmanas på sätt du inte förväntat dig.


