Estland testade AI:er mot rysk propaganda – Claude vann stort

"Estlands statliga språkinstitut testade vilka AI-modeller som bäst motstår rysk propaganda – och Anthropic dominerade helt."
Estlands statliga språkinstitut testade vilka AI-modeller som bäst motstår rysk propaganda – och Anthropic dominerade helt. Claude Opus 4.7 toppade med 94,9 av 100 poäng, medan OpenAI:s starkaste modell GPT-5.4 bara nådde 88,9 poäng.
Testet omfattade 14 områden där Ryssland aktivt försöker påverka opinionen: Krims status, Ukrainakriget, Natos historia och Sovjets annektering av Baltikum. Forskarna från ELI arbetade tillsammans med försvarsorganisationen Propastop för att identifiera dessa strategiska narrativ.
Resultatet säger något intressant om hur olika AI-företag tränat sina modeller. Anthropics fokus på "constitutional AI" och säkerhet verkar ge konkreta fördelar när modellerna konfronteras med sofistikerad desinformation. Det är inte bara en akademisk övning – när AI-verktyg används för faktakoll, innehållsmoderering eller som informationskällor blir denna typ av motståndskraft kritisk.
För organisationer som bygger med AI blir det här en ny dimension att överväga vid valet av modell. Om din produkt hanterar kontroversiellt eller politiskt känsligt innehåll kanske reliabiliteten under informationskrigföring väger tyngre än ren prestanda på benchmarks.
Att ett litet land som Estland, som lever med rysk desinformation som vardagsmat, nu systematiskt testar AI-modellers motståndskraft är också symptomatiskt för vart världen är på väg. Det här blir troligen en standardmätning framöver, precis som vi idag mäter bias och hallucineringar.

