Hur många AI:er krävs för att läsa en PDF?

The Verge AI

Luke Igel och vänner stötte på problem när de försökte gå igenom 20 000 sidor med Jeffrey Epstein-dokument som släpptes av House Oversight Committee i november. Justitiedepartementet släppte senare över tre miljoner PDF-filer, men deras OCR-teknik (optisk textigenkänning) var så dålig att dokumenten blev praktiskt taget osökbara.

Djupdykning

När tre miljoner PDF-filer från Jeffrey Epstein-utredningen släpptes av amerikanska justitiedepartementet blev det tydligt hur dåligt våra verktyg är för att hantera stora mängder information – trots att vi lever i AI-eran. Luke Igel och hans vänner stötte på det som många av oss känner igen: opålitlig OCR (optical character recognition, dvs teknik som omvandlar bilder av text till sökbar text), urusel sökfunktion och PDF-visare som känns som från stenåldern. Det här illustrerar en större utmaning för alla som arbetar med innehåll på sociala medier: våra verktyg för att analysera, söka igenom och förstå stora mängder content har inte hängt med i utvecklingen. När varje dag innebär att sålla genom hundratals inlägg, kommentarer och dokument för att hitta relevanta insights eller skapa innehåll, blir bristerna i våra nuvarande verktyg smärtsamt uppenbara. Nyckelinsikt: AI har gjort det möjligt att generera mer innehåll än någonsin, men våra verktyg för att organisera och söka igenom all denna information släpar fortfarande långt efter.