JD.com bygger AI-system för att hantera tiotals miljarder produkter

arXiv cs.AI

Kinesiska e-handelsjätten JD.com har byggt ett eget AI-system – kallat Oxygen AIIC – som använder stora språkmodeller (LLM) och bildmodeller (VLM) för att automatiskt förstå och kategorisera produkter i deras katalog på tiotals miljarder varor. Systemet når 94,2% precision och hanterar hundratals miljoner produktuppdateringar per dag, vilket minskat kvalitetsproblem i produktinformation med 37%. Det intressanta här är inte bara siffrorna utan att det visar hur AI-infrastruktur i den här skalan ser ut i praktiken – långt ifrån ett labb, utan ett industriellt system som kör på Huaweis egna AI-chips.

Djupdykning

Kinas näst största e-handelsplattform JD.com har publicerat en teknisk genomgång av sitt interna AI-system för produktkataloghantering – och siffrorna är svindlande. Vi pratar tiotals miljarder produkter (SKU är bara branschspråk för "unik produkt"), hundratals miljoner uppdateringar per dag, och ett system som måste förstå allt från elektronik till färsk mat med tillräcklig precision för att faktiskt vara användbart. Det som gör Oxygen AIIC tekniskt intressant är inte bara att det använder stora språkmodeller (LLMs) och bildigenkänningsmodeller (VLMs) – utan att det körs på Huaweis egna Ascend-chip, vilket är ett direkt svar på att USA har blockerat Nvidias exportlicenser till Kina. Det de flesta missar när de läser den här typen av systembeskrivningar är vad problemet egentligen handlar om: det är inte ett AI-problem, det är ett kunskapsgrafsproblem i industriell skala. Varje dag lanseras nya produktkategorier som AI:n aldrig sett – en ny typ av hårvårdsprodukt, ett nytt sportformat – och systemet måste kunna uppdatera sin förståelse av världen utan att falla sönder. Att 80% av produktattribut nu fylls i automatiskt när en handlare listar en ny vara låter som en intern effektiviseringsvinst, men det är egentligen avgörande för sökkvaliteten: om attributen är fel hittar du aldrig produkten. Det här är i praktiken ett infrastrukturellt svar på samma utmaning som Amazon, Zalando och svenska Klarna brottas med – hur du skapar strukturerad, tillförlitlig produktdata i en värld där sortimentet växer snabbare än någon människa kan hantera.