Elke toerist zal het herkennen, verkeersborden en andere aanwijzingen in een taal die je niet kan lezen. Voor je het weet heb je de verkeerde afslag genomen of iets gedaan wat eigenlijk verboden is. Een nieuw stukje software genaamd Sign Translator kan vanaf nu helpen. De tool draait op een handheld en kan teksten op verkeersborden in allerlei vreemde talen lezen en vertalen naar het Engels. Maak een foto van het verkeersbord met de ingebouwde digitale camera in je PDA. De software herkent de tekst in de foto en vertaalt deze in seconden naar het Engels. De Sign Translator gebruikt een drietal technieken om tot de vertaling te komen:
The system is based on three technologies: automatic detection, optical character recognition and language translation. Using a hierarchical three-layer framework, the detection system identifies the text from the jumble of the surrounding scenery. After the first layer detects possible text regions, the second layer sorts information such as color and shape to narrow the selection.
The third layer performs layout analysis using complex algorithms to achieve a high detection rate. After the detection process is complete, OCR goes into action. "Once the system has located the sign, it has to be able to recognize what the text is," Yang said. In the third stage, the recognition results are ready for translation.
De tekstherkenning van de Sign Translator is met 92 procent behoorlijk succesvol, de vertalingen gaan echter maar voor 30 procent goed, hieraan moet nog gewerkt worden voordat de software bruikbaar is voor de toerist. Het team van ontwikkelaars wil een combinatie van twee technieken gaan gebruiken om dit percentage hoger te krijgen: Example-Based Machine Translation (EBMT), wat gebruik maakt van voorbeelden en Statistical-based Machine Translation (SMT) wat gebruik maakt van statische analyse. De laatste techniek kan ook een deel van een woord herkennen, iets wat de eerste techniek niet lukt.