Facebook zet kunstmatige intelligentie in om tekst in plaatjes te begrijpen. Het systeem genaamd Rosetta herkent niet alleen de tekst, maar begrijpt ook de context. Het systeem wordt op Facebook en Instagram ingezet om onder andere haatberichten te vinden.
Facebook geeft op zijn website uitleg over Rosetta. Volgens het sociale netwerk is het gebruik van traditionele ocr-technieken niet voldoende, omdat de manier waarop tekst in afbeeldingen staat steeds verandert en ook omdat met ocr de context niet begrepen kan worden.
Rosetta maakt gebruik van een machinelearningmodel dat meer dan een miljard plaatjes met tekst van Facebook en Instagram heeft bekeken. Het gaat om openbare afbeeldingen. Voor het herkennen van tekst gebruikt de kunstmatige intelligentie Faster R-CNN.
In eerste instantie is het model getraind met alleen korte woorden, van maximaal vijf letters. Nadat het systeem al die woorden onder de knie had, zijn er steeds langere woorden toegevoegd. De kunstmatige intelligentie kan overweg met verschillende talen en tekens, moment herkent Rosetta onder andere Engels, Arabisch en Hindi.
Rosetta wordt al breed gebruikt door verschillende teams binnen Facebook en Instagram. Met de technologie worden onder andere haatberichten opgespoord. Facebook zegt nog lang niet klaar te zijn met het systeem. Er moet ondersteuning komen voor veel meer talen en het herkennen van tekst in video blijft een uitdaging.
Onderzoekers van Facebook hebben een paper geschreven over Rosetta, met de titel: Large scale system for text detection and recognition in images.