Meituan tränar biljonparametersmodell helt på kinesiska chip

Computer Sweden

Kinesiska matleveransjätten Meituan har lanserat LongCat-2.0, en språkmodell med en biljon parametrar som tränats på 50 000 kinesisktillverkade AI-chip – utan ett enda amerikanskt. Det är intressant just nu eftersom USA:s exportrestriktioner tvingat fram just den här typen av inhemsk teknikutveckling, och det verkar fungera: bolaget hävdar att modellen matchar GPT-5.5 och Claude Opus i vissa kodningstester, dock utan oberoende verifiering. Modellen släpps som öppen källkod och klarar upp till en miljon tokens i kontext (hur mycket text den kan hantera på en gång).

Djupdykning

Meituans lansering av LongCat-2.0 är egentligen mindre en story om en ny AI-modell och mer en story om vad som händer när USA skruvar åt exportkranen. Kinesiska bolag har länge förlitat sig på Nvidias H100- och A100-chipp för att träna stora modeller, men sanktionerna har tvingat fram en inhemsk chipindustri i turboläge — det Meituan demonstrerar här är att den industrin nu faktiskt kan leverera i stor skala. Ett kluster med 50 000 inhemska chipp som klarar att träna en biljonparametersmodell är inte självklart, parametrar är ungefär "antalet inställningsbara knappar" i modellen och fler betyder generellt mer kapacitet men också enormt mycket mer beräkningskraft. Det de flesta missar är att den riktigt stora nyheten inte är modellens prestanda i sig — benchmarks mot GPT och Claude är lätta att pynta till sin fördel och ännu inte verifierade — utan att det nu finns ett fungerande alternativt träningsinfrastrukturekosystem som inte beror av västerländsk halvledarteknik. USA:s exportrestriktioner antogs delvis för att bromsa kinesisk AI-utveckling, men risken är att de i stället accelererat Kinas förmåga att bygga precis den oberoende chipstack som gör restriktionerna irrelevanta på sikt.

🔗 Läs originalartikeln (Computer Sweden)

◀ 2 av 19 ▶