Het Duitse technologiebedrijf DeepL heeft dinsdag zijn vertaaldienst beschikbaar gemaakt. Het bedrijf claimt betere vertalingen te bieden dan Google Translate en Bing, onder meer door verbeterde deeplearningalgoritmes en een brondatabase van de Linguee-zoekdienst.
DeepL noemt zichzelf de 'nauwkeurigste automatische vertaaldienst ter wereld'. Momenteel biedt de dienst 42 taalcombinaties tussen Nederlands, Engels, Duits, Frans, Italiaans en Pools. "Aan het eind van het jaar moeten dat 230 taalcombinaties zijn", zegt Hans Mooijer, projectmanager voor Nederland en Engeland aan Tweakers. "Dan hebben we Mandarijn, Japans, Portugees en Russisch toegevoegd. Onze neurale netwerken zijn nu aan het trainen op deze talen. Het duurt ongeveer zes weken voor het netwerk klaar is met zo'n training."
Voor de claims over de betere prestaties verwijst hij naar de BLEU-scores, waarbij BLEU staat voor bilingual evaluation understudy. Teksten van menselijke vertalers worden hierbij geautomatiseerd vergeleken met kunstmatige. Het idee is dat hoe dichter de kunstmatige tekst bij die van de vertaler ligt, hoe hoger de kwaliteit. "DeepL heeft Googles record van een BLEU-score van 28,4 punten bij de gestandaardiseerde WLT Newstest 2014 Engels - Duits verbroken met een score van 31,1", aldus Mooijer.
Dat DeepL betere prestaties biedt, komt volgens Mooijer door de ervaringen met Linguee, de andere dienst van het bedrijf. Deze zoekmachine ging in 2009 van start en stelt gebruikers in staat te zoeken naar tweetalige teksten. "Met een webcrawler zoekt de dienst naar vertalingen. Een algoritme analyseert de teksten en we maken gebruik van professionele vertalers. Zo konden we machinelearningsystemen op meer dan een miljard vertalingen van hoge kwaliteit trainen."
Daarnaast werkt DeepL met convolutional neural networks, die normaliter vaak voor beeldherkenning ingezet worden, aangevuld met attention mechanisms, die zich concentreren op bepaalde elementen in teksten en bij andere delen in het neurale netwerk informatie kunnen opvragen. Mooijer: "Stel het netwerk moet de zin 'I switch off the light' vertalen. Switch kan op meerdere manieren vertaald worden waaronder uitschakelen, dus het netwerk gaat in zijn dataset op zoek naar voorbeelden waar 'uit' staat in zinnen." Verder maakt het bedrijf gebruik van Beam Search, dat een systeem van waarschijnlijkheden inzet bij het omzetten naar een doelzin.
Google en Facebook maken sinds kort ook gebruik van neurale netwerken voor het vertalen van teksten, maar volgens Mooijer kan DeepL zijn voorsprong behouden door snel in te spelen op nieuwe ontwikkelingen op het gebied van deep learning. Bij het bedrijf werken twintig man en het hoofdkantoor staat in Keulen. De vertaalmodellen traint DeepL in IJsland, op een supercomputer die 5,1 petaflops kan leveren. "Energie is daar goedkoop, waardoor we de kosten laag kunnen houden", verklaart Mooijer.
DeepL heeft geen advertenties. Geld wil het bedrijf verdienen met het verstrekken van licenties op een api, wat Google ook doet met zijn Translate-dienst. Daarnaast verdient het bedrijf aan de reclame op Linguee.