Hardwarefabrikant Hitachi heeft een methode ontwikkeld om grote hoeveelheden audio in zeer korte tijd op sleutelwoorden te doorzoeken. Het bedrijf ontleedt hiertoe de audio in zogeheten fonemen en indexeert deze.
De techniek die Hitachi ontwikkelde, analyseert een geluidsstroom eerst en zet de data om in fonemen. Een foneem is een 'geluidselement': de kleinste klankeenheid die een betekenisverschil aangeeft. Deze fonemen worden in een index opgeslagen. Wanneer de data eenmaal geïndexeerd is, kan gericht naar specifieke fonemen gezocht worden.
Om het doorzoeken van de fonemen te versnellen, heeft Hitachi de indexeermethode zo ontworpen dat onnodige opslag van gegevens wordt voorkomen. Hitachi zegt ook de bestaande zoekalgoritmes voor stemgeluid te hebben verbeterd en versneld. Volgens Hitachi moet de methodiek het mogelijk maken binnen drie seconden tweeduizend uur aan geluidsdata op sleutelwoorden te doorzoeken.
De zoektechnologie zou ingezet kunnen worden om in video's naar specifieke audiopassages te zoeken. Een andere mogelijke toepassing is het analyseren van opgenomen gesprekken bij bijvoorbeeld callcenters.