Onderzoekers van de Carnegie Mellon University hebben de bekende captcha's voorzien van een update waardoor ze gebruikt kunnen worden als hulp voor het digitaliseren van oude boeken, tijdschriften en kranten. Daarnaast wordt de dienst gecombineerd met spam-protectie voor e-mailadressen.
De nieuwe dienst om captcha's te leveren voor websites is gelanceerd onder de naam reCaptcha. Captcha's, wat eigenlijk een afkorting is voor 'Completely Automated Public Turing Test to Tell Computers and Humans Apart', zijn oorspronkelijk ook ontwikkeld door de Carnegie Mellon University in opdracht van Yahoo. Een vervormd woord moet door de gebruiker worden herkend en worden ingetypt alvorens een registratie of gebruikersactie definitief is. Met de test moeten spammers en andere geautomatiseerde systemen die misbruik willen maken van de aangeboden dienst buiten de deur worden gehouden. De nieuwe reCaptcha-dienst toont twee vervormde woorden die door de gebruiker moeten worden herkend. Eén van de twee vervormde woorden is bekend bij de computer, het andere woord nog niet. De antwoorden van de gebruikers voor het onbekende woord worden opgeslagen en de antwoorden van verschillende gebruikers gecombineerd om uiteindelijk de 'vertaling' van het woord te bepalen.
Het onbekende woord in de reCaptcha is afkomstig van gescande boeken, tijdschriften en kranten die door het Internet Archive worden gedigitaliseerd. Woorden die door ocr-software niet worden herkend, dienen als invoer voor de reCaptcha's. De universiteit hoopt zoveel mogelijk traditionele captcha's te kunnen vervangen door reCaptcha's om zodoende de inspanningen van het publiek nuttig te kunnen aanwenden. De onderzoekers schatten dat dagelijks ruim zestig miljoen captcha's worden opgelost, waarmee 150.000 manuren eigenlijk worden weggegooid. ReCaptcha moet een deel van deze verloren arbeid nuttig gaan maken door het ocr-process te helpen. Om ook het grote publiek te laten profiteren van de nieuwe dienst, biedt reCaptcha ook een gratis dienst aan onder de naam Mailhide. Hiermee is het mogelijk om een e-mailadres te beschermen tegen spammers. Om een e-mailadres te kunnen zien, dient eerst een reCaptcha te worden opgelost.