Microsoft lanserar verktyg för AI-testning med textbeskrivningar

TechCrunch AI

Microsoft släppte på tisdag ett open source-verktyg kallat Adaptive Spec-driven Scoring som låter utvecklare skapa AI-tester genom att bara beskriva önskat beteende i text. Verktyget syftar till att göra det enklare att utvärdera och testa AI-system utan att behöva skriva komplicerad testkod.

Djupdykning

Microsoft släpper ett verktyg som låter utvecklare skapa AI-tester genom att bara beskriva vad de vill testa i vanlig text – ungefär som att säga "kolla om chatbotten blir otrevlig när folk frågar om politik" istället för att koda komplexa testscenarier. Det här adresserar ett av AI-utvecklingens största problem: hur man systematiskt testar om modeller beter sig som de ska när miljoner användare börjar experimentera med dem på oväntade sätt. Medan alla fokuserar på att bygga smartare AI så är det här tysta arbetet med att göra AI-testning mindre teknisk som faktiskt kan avgöra vilka företag som lyckas skala sina produkter säkert. Samma mönster såg vi med webbutveckling – först byggde alla hemsidor, sen kom verktygen som gjorde det enkelt att testa att de faktiskt fungerade. När AI-tester blir lika enkla att skriva som en vanlig mening kommer vi troligen se en explosion av mindre företag som vågar lansera AI-funktioner – precis som när WordPress gjorde det möjligt för alla att bygga webbsidor utan att kunna koda.