Afgelopen donderdag liep een demonstratie van de spraakherkenningsfunctie uit Windows Vista behoorlijk mis. Waar de software 'Dear Mom' had moeten herkennen, werd dit geïnterpreteerd als 'Dear Aunt'. Ook enkele pogingen de schade te herstellen, liepen op niets uit. Video's van de fout verschenen al vrij snel op internet en verschillende sites duiden deze problemen aan als Microsofts zoveelste onmogelijkheid goede software te bouwen. De zaak ligt echter een stuk genuanceerder dan door andere nieuwssites is weergegeven. Afgelopen zaterdag verscheen een artikel op het weblog van Rob Chambers, werkzaam bij Microsoft op de afdeling die spraakherkenningssoftware ontwikkelt, waarin hij aangaf wat het probleem was vorige week donderdag: moeilijkheden met de voorversterking van het microfoongeluid. Onder normale omstandigheden wordt alle inkomende audio zodanig verwerkt dat het geluid goed bruikbaar is voor het herkennen van woorden.
Door de aanwezigheid van bugs in het audiosubsysteem, was het voor de software niet mogelijk om controle te krijgen over de voorversterking van het geluid, die via de 'Microphone Setup Wizard' was ingesteld. Toen dat vervolgens wel lukte, liep men tegen een tweede bug aan. Deze zorgde ervoor dat de binnenkomende audio te maken kreeg met clippingproblemen en er alsnog geen goede herkenning kon plaatsvinden. De bugs waren een maand geleden al opgelost in Windows Vista, aldus Larry Osterman die verantwoordelijk was voor dat deel van de software. Tijden de demonstratie werd echter gebruikgemaakt van een oudere build waarin de bugs nog wel aanwezig waren. Men was hiervan op de hoogte en had dan ook maatregelen genomen om het optreden van de problemen te voorkomen. Tijdens de proefsessies liep men dan ook nergens tegenaan. Op het moment suprème ging het echter mis. Osterman sloot zijn weblogposting hierover dan ook af met een 'Mea Culpa'.