Vertaaldienst DeepL voegt next-gen taalmodelmodel en DeepL Write toe aan api

Vertaaldienst DeepL heeft zijn api uitgebreid met zijn next-gen Large Language Model-technologie en toegang tot AI-schrijfassistent DeepL Write. Daardoor kunnen bedrijven de tools integreren in hun eigen applicaties, zowel voor intern als voor extern gebruik.

DeepL stelt dat het vernieuwde taalmodel vertalingen van hogere kwaliteit oplevert. Dat model was al wel beschikbaar via DeepL zelf, maar zat nog niet in de api van het bedrijf verwerkt. Volgens DeepL zijn de vertalingen vanuit het Engels naar het Japans en Chinees 1,7 keer beter dan die van het oude model. Vertalingen tussen Engels en Duits zijn 1,4 keer beter dan de vorige versie. Het taalmodel is nu beschikbaar voor vertalingen in 33 talen, waar Nederlands er ook één van is.

Verder kan schrijfassistent DeepL Write voortaan via dezelfde api-interface gebruikt worden als DeepL Translator. DeepL Write verscheen in 2023 en laat gebruikers een tekst schrijven, waarna het taalsuggesties doet. Het gaat om suggesties op het gebied van onder meer grammatica, woordkeuze en schrijfstijl. DeepL Write is beschikbaar voor teksten geschreven in het Duits, Engels, Spaans, Frans, Italiaans en Portugees.

Door Eveline Meijer

Nieuwsredacteur

15-05-2025 • 18:44

23

Reacties (23)

23
23
19
2
0
2
Wijzig sortering
Ik gebruik de DeepL API voor een tweetalige (NL/EN) website met nogal wat vakjargon. Werkt verbluffend goed, ook bij zinsconstructies die in de andere taal totaal anders zijn. En ook veel vaktermen worden goed vertaald. Maar het blijft oppassen. Je moet het altijd nalezen en soms is het alinea's lang helemaal perfect waardoor je concentratie verslapt. Juist dan komt er een een stuk totale nonsens of erger: één verkeerd woord dat alles op z'n kop zet. B.v. een zeilschip dat de zeilen strijkt is dan ironing the sails.
Kan me voorstellen dat AI wel kan helpen bij het aanpassen van de vertaling aan de context. Op een schrijfassistent zitten mijn redacteuren niet te wachten.
Wij gebruiken het om chatbot en livechat gesprekken te vertalen voor een berg grote Nederlandse klanten zoals Eneco en Efteling. Werkt ook echt super goed, en heb je bepaalde woorden die niet lekker vertaald worden dan kun je een bepaalde vertaling forceren en past de rest van de zin zich gewoon aan.
en past de rest van de zin zich gewoon aan
Ik vrees dat wij daar geen gebruik van kunnen maken. Het gaat bij ons om WordPress posts die via een plugin (Polylang) als geheel een retourtje DeepL maken, maar dat is niet dynamisch. Zou wel mooi zijn.
Wij maken wel gebruik van hun API en een Pro abonnement en gebruiken dan de glossaries functie. Een plugin zou dat dus zeker kunnen gebruiken, maar die dan niet gok ik.

Je kunt dan wel glossaries aanmaken met een DeepL Pro account, maar Polylang moet dan wel het juiste glossary id meesturen bij het verzoek naar DeepL, en dat kan het niet zo te zien. Jammer, want lijkt me niet heel moeilijk dat te ondersteunen als je mensen zelf glossaries laat aanmaken via de API en dat niet in de plugin bouwt.

[Reactie gewijzigd door lepel op 16 mei 2025 12:12]

Ik zou denken dat een LLM ook behoorlijk goed is in het checken van een vertaling?
Moet niet moeilijk zijn om op te pikken dat 'ironing the sails' niet echt logisch is.
Klopt. Het gaat ook (vind ik) verbluffend goed en we hebben de indruk dat het al weer beter is dan toen we een jaar geleden startten. Maar eens in de ongeveer 3 nieuwsberichten van ca. 500 woorden vinden we een misser. Niet altijd zo bizar als dat voorbeeld, maar wel erg genoeg om toch voorlopig nog te blijven nalezen. Ik heb zelf geen kennis van hoe LLM's en AI varianten intern werken maar o.a. hier op Tweakers lees ik dat nieuwe vormen van AI weer een slag beter zijn in het controleren.
Beetje ironie in je teksten moet kunnen toch? :+

[Reactie gewijzigd door JorisM op 15 mei 2025 23:33]

Zeer interessant. Hoe verhoudt deze api tot de google translate api? (Voor als we dan toch richting EU services gaan)

[Reactie gewijzigd door fenrirs op 15 mei 2025 19:19]

DeepL is echt absoluut niet te vergelijken met Google Translate of andere simpele machinevertalingen, en ook niet met bijv. ChatGPT als vertaalmachine. DeepL loopt op dit vlak zo ver voor op de rest dat het een beetje is als een computer vergelijken met pen en papier.

De kwaliteit van Google Translate is echt heel laag, bruikbaar als je moet weten wat er ongeveer staat maar niet interessant voor het vertalen van documenten die je uit wil geven. DeepL is de enige die in de buurt komt van enige kwaliteit uit volledig automatisch vertalen. Ook bij DeepL heb je nog niet de kwaliteit van een professionele vertaler, maar het is wel te gebruiken voor interne documenten bijvoorbeeld.

Maar het is ook heel verschillend van branche tot branche. Juridische teksten kan DeepL met twee vingers in z'n neus, maar spec sheets of hele niche termen gaan nog wel eens mis.
Ik vind persoonlijk de kwaliteit van vertalingen van DeepL de laatste tijd (lees: het afgelopen half jaar of zo) slechter dan vroeger.

Zodanig veel slechter dat ik inmiddels de app ook niet meer op m'n computer heb en weer terug ben bij het vergelijken tussen Google Translate en DeepL.

Google Translate geeft bijvoorbeeld correct aan dat er 2 varianten zijn voor een vertaling (vrouwelijk/mannelijk), DeepL gokt maar wat.
Wat je je moet realiseren is dat er nog geen enkele vertaalmachine is die volledig zelfstandig een document kan vertalen met de kwaliteit van een mens. Er zit zoveel nuance en voorkeur in dat dat gewoon onmogelijk is nog.

Voor vergelijken van losse termen kun je dan beter Linguee gebruiken, die zoekt door de bronnen die ook gebruikt zijn om DeepL te trainen en laat meteen een hele rits gevonden resultaten zien die niet alleen theoretisch de juiste vertaling zijn maar ook daadwerkelijk gebruikt worden.
Voor vergelijken van losse termen kun je dan beter Linguee gebruiken, die zoekt door de bronnen die ook gebruikt zijn om DeepL te trainen en laat meteen een hele rits gevonden resultaten zien die niet alleen theoretisch de juiste vertaling zijn maar ook daadwerkelijk gebruikt worden.
Ik had het eigenlijk niet over losse termen maar zinnen waar in bepaalde talen (bijvoorbeeld Spaans) nuance zit in of het een man of een vrouw is.

Een dom voorbeeld: "Ik ben moe" kan zowel "Estoy cansado" zijn (als "ik" een man is) of "Estoy cansada" (als "ik" een vrouw is). Google geeft dat netjes aan, DeepL gokt welke van de 2.

Google Translate vs DeepL: https://imgur.com/a/TJ7fK9I
Hier loop ik de laatste tijd ook vaak tegenaan

Net nog bijvoorbeeld vertaalde DeepL 'kanojo' in een Japanse tekst naar het neutrale 'vrouw' terwijl uit de context duidelijk was af te leiden dat het hier in de betekenis van 'vriendin (partner)' werd gebruikt wat de tekst gelijk een hele andere lading geeft.

Dan is het toch och vervelend dat je dit niet handmatig aan kan passen (althans, ik zag er geen optie toe)
Mijn ervaring is dat ChatGPT toch heel wat betere vertalingen aflevert als DeepL en Google. Hieronder een voorbeeld met een spreekwoord, wat sowieso lastig is. Maar ChatGPT heb ik nog nooit op een verkeerde interpretatie van de betekenis kunnen betrappen. DeepL heeft er moeite mee, en Google Translate inverteert deze soms gewoon.

Vertaal naar het Engels: "prijs de dag niet voor het avond is".
* DeepL: "do not price the day before it is evening" 😂 hoe dan??
* GoogleTranslate: "don't praise the day before it's evening" 😐 kan, het kan
* ChatGPT "Don't count your chickens before they hatch." 😃 dat lijkt er meer op.
* Van Dale: “the opera isn’t over until the fat lady sings”, maar ook “there’s many a slip ‘twixt the cup and the lip” 🥳
=> papier wint!
Ik heb nog geen ervaring met de nieuwe API, maar 2 jaar geleden was deepL wel echt de go-to voor mij, bij google kreeg je heel directe vertalingen, tot aan steenkolen Engels aan toe, bij deepL kreeg je contextuele vertalingen die meer de "essence"/betekenis van de zin vertaalde wat 9/10 keer is wat je eigenlijk wilt.
Hoe bereken je dat het model 1.7 of 1.4 keer beter is dan het vorige model?
Je hebt tests om fouten in vertalingen te testen. Zie het als een grote bibliotheek met input en verwachte output. Daar kun je vervolgens een score aam hangen (BLEU score).
Hoe bereken je dat het model 1.7 of 1.4 keer beter is dan het vorige model?
Wat ik zo kon vinden zo:
Blinde tests met vooraanstaande linguïsten hebben aangetoond dat het nieuwe model voor vertalingen vanuit het Engels naar het Japans en Chinees (vereenvoudigd) resultaten produceert die 1,7× beter zijn dan die van het oude model, en ook voor vertalingen tussen Engels en Duits is er sprake van een verbetering van 1,4×.
en:
Het next-gen-model van DeepL doet het qua vertaalkwaliteit ook beter dan de concurrentie: uit blinde tests uit 2024 is gebleken dat de vertalingen van DeepL minder bewerkingen nodig hebben dan die van onze concurrenten. Vergeleken met Google Translate hadden de vertalingen van DeepL 2× minder bewerkingen nodig voor een vlekkeloos resultaat en vergeleken met ChatGPT-2024 zelfs 3x minder.
Bron: https://www.emerce.nl/wire/nextgen-llmmodel-deepl-write-nu-beschikbaar-via-deepl-api

Volgens DeepL zelf zijn deze vergelijkingen gebaseerd op blinde tests met taalkundigen, waarin vertalingen van meerdere systemen vergeleken werden zonder dat bekend was welk model ze had gegenereerd. Daarbij werd zowel gekeken naar voorkeur als naar hoeveel bewerkingen nodig waren voor een goed eindresultaat. Er wordt nergens gesproken over automatische evaluatiemethoden zoals BLEU of COMET, en ook niet over het gebruik van gebruikersdata of interacties in hun editor. In elk geval niet bij betaalde klanten, zover ik weet zijn gratis gebruikers free game maar de vraag is of dat goede metingen oplevert.

Zie ook: https://www.deepl.com/en/blog/next-gen-language-model
https://www.deepl.com/en/products/api

[Reactie gewijzigd door jdh009 op 15 mei 2025 20:34]

Vast ook met ai :p
Ik gebruik ook altijd deepL voor vertalingen. Veel natuurlijker dan chatgpt. Alleen integratie binnen office/word is niet echt top, loopt vaak vast of niet beschikbaar terwijl ik betaalde versie heb.
Mooi, nu kan google translate ook van mijn telefoon af. Hoe minder google, hoe beter. Alleen google Earth staat er nog op.
ik hoop dat MacWhisper snel een update uitrolt zo dat ik ook dit nieuwe model van DeepL via mijn API-key kan gebruiken vanuit MacWhisper app.
Heeft iemand tips voor mijn situatie? Mijn vriendin is Japans, wij communiceren nu grotendeels door Gemini te gebruiken en te copy pasten in onze chat app(Line). We hebben ook een chat bot in ons gesprekje die onze berichten automatische vertaald (japans naar engels en vise versa). Maar die chat bot is zo slecht dat we altijd uitwijken naar Gemini of Google Translate als we wat meer willen vertellen.

We willen ontzettend graag overstappen op DeepL. Liefst ook als chatbot die gewoon ieder bericht vertaald zodra er een japanse of engelse chatbericht gestuurd wordt. Ik wil het graag uitzoeken als ik hier zelf een extensie voor moet maken. Maar ben niet zo technische als sommigen hier.

Alvast bedankt!

Op dit item kan niet meer gereageerd worden.