Ontwikkelaars bij Google hebben een algoritme voor het herkennen van huisnummers in Street View-beelden naar eigen zeggen sterk verbeterd. Het algoritme zou mede dankzij de hulp van input via zijn reCaptcha-dienst tot 90 procent van moeilijk leesbare huisnummers herkennen.
Google gebruikt voor huisnummerherkenning ocr-algoritmen die zijn ontwikkeld voor het analyseren van fotomateriaal van StreetView, onderdeel van Google Maps, en reCaptcha, een antispam-beveiligingssysteem. Laatstgenoemde gebruikt deels foto's van huisnummers voor het tonen van captcha's. Dagelijks worden reCaptcha's meer dan honderd miljoen maal getoond.
Inmiddels zegt Google dankzij het gebruik van neurale netwerktechnologie en verbeterde algoritmen in staat te zijn om tot 90 procent van moeilijk leesbare huisnummers die uit meerdere cijfers bestaan, een aparte dataset die is onderzocht, te herkennen uit beelden die zijn geschoten voor Street View. Door moeilijk leesbare huisnummers ook voor te schotelen aan internetgebruikers via reCaptcha zou de herkenning zelfs vergroot worden tot 99,8 procent.
De verbeterde ocr-algoritmes zouden volgens Google ook tot 99 procent van de bestaande tekst-captcha's kunnen oplossen. Desondanks zou het onderzoek hebben geholpen bij het verbeteren van zijn reCaptcha-dienst, mede door minder tekst-captcha's te tonen aan internetgebruikers.