DeepL brengt versie vertaalsoftware uit met LLM-integratie

Vertaaldienst DeepL heeft een versie voor zakelijke gebruikers aangekondigd met integratie van een groot taalmodel. Het taalmodel is specifiek getraind op eigen data en moet daardoor betere en menselijkere vertalingen mogelijk maken.

Klanten met een Pro-abonnement kunnen het model uitproberen door in een dropdown 'next-gen model' te kiezen, meldt DeepL. Het aantal ondersteunde talen is beperkt: Engels, Duits, Japans en vereenvoudigd Chinees. Ondersteuning voor andere talen volgt binnenkort, maar het bedrijf geeft daar geen tijdsindicatie voor.

Het taalmodel maakt gebruik van eigen data van de afgelopen zeven jaar. Het is onbekend hoe DeepL aan die data komt en of daar bijvoorbeeld teksten tussen zitten die gebruikers van de gratis dienst hebben ingevoerd. Het taalmodel moet hallucinaties beperken, maar het is onbekend hoe DeepL dat precies voorkomt. DeepL is een Duits bedrijf.

Door Arnoud Wokke

Redacteur Tweakers

18-07-2024 • 15:20

30

Reacties (30)

30
30
22
3
0
1
Wijzig sortering
prima vertaalsoftware. Wel een interessante vraag of de input van d egebruikers gebruikt wordt voor de training. Deepl zegt daarover op hun website:
"De teksten van DeepL Pro-abonnees worden niet opgeslagen op een permanente opslagplaats, maar alleen in RAM. Vertalingen van documentbestanden worden alleen tijdelijk op de schijf opgeslagen voor de uitvoering van de vertaling. In dit geval worden ze versleuteld met hypermoderne symmetrische versleuteling, waarbij de sleutel alleen in een vluchtig geheugen en op het systeem van de abonnee wordt opgeslagen. De teksten van DeepL Pro-abonnees worden niet gebruikt om onze modellen te trainen. Bovendien worden de woordenlijstparen van DeepL Pro-abonnees opgeslagen in een permanente opslagplaats om cross-platform beschikbaarheid te waarborgen, terwijl de woordenlijstparen van gratis gebruikers alleen worden opgeslagen in de lokale opslag van de browser."
maar of dat geldt voor de LLM integratie staat daar niet bij. En dit gaatalleen over pro-abonnees, dus wat gebeurt er met incidentele teksten?
Naar mijn idee loopt DeepL echt een beetje achter. Leuk dat ze nu een LLM gebruiken, maar voor dat handje vol ondersteunde talen is het behoorlijk beperkt. Voor de hand liggende LLM's zoals claude en ChatGPT vertalen ook prima en in 99% van de gevallen zelfs beter dan google translate en DeepL.
Ze zullen echt aan de bak moeten willen ze mee gaan concurreren.
Het voordeel van DeepL tegen de chat-interface van ChatGPT voor vertalingen, is dat je direct de uiteindelijke tekst aan kunt passen (waarna DeepL aan de hand van je aanpassingen, de rest van het document scant en zo nodig verder aanpast). Bij ChatGPT krijg je het hele document opnieuw voorgeschoteld en moet je er maar van uit gaan dat er geen ongewenste veranderingen plaats hebben gevonden.

Of DeepL nu een eigen LLM of ChatGPT of een andere LLM gebruikt maakt eigenlijk niet zo veel uit als je specifiek op zoek bent naar een applicatie die je kan helpen met (professionele) vertalingen.
In 99% van de gevallen beter dan DeepL, dat is nogal een statistiek, heb je daar bronnen voor?
Is uiteraard subjectief en gebaseerd op mijn eigen ervaring. Hiermee doel ik op wat op mij overkomt als een 'natuurlijke' vertaling in de mate waarop een zin is opgebouwd, zoals een native een zin of paragraaf zou schrijven.
Hah, ChatGPT tekst (ook vertaalde) is juist vaak makkelijk te herkennen door de schrijf stijl. Wanneer ik DeepL gebruik merk ik niet op dat het een bepaalde, typerende, stijl heeft. Maar goed, dat is ook subjectief.
Lijkt me het onderwerp van dit nieuwsbericht :) Maar eh... ChatGPT kan uitstekend vertalen, om even snel een tekst te vertalen is DeepL toch veel handiger en vertaalt stukken beter dan bijvoorbeeld Google Translate.

Verder heb ik DeepL via de PageTranslate-extensie in LibreOffice beschikbaar... het zal voor ChatGPT wellicht ook nog komen, maar voorlopig is DeepL daarmee de te gebruiken engine om een document te vertalen.
Ondertussen gebruik ik DeepL om met veel Oostblok-collega's te communiceren en zijn ze onder de indruk en gebruiken de meesten het nu ook. Dus, "achter lopen" is ook maar relatief.
Ik moet zeggen dat ik uitermate tevreden ben met DeepL.
Nu moet ik wel zeggen dat ik niet bekend ben met LLM vertalingen
Anoniem: 718943 @Magnaat19 juli 2024 00:09
Ah ja. Zakelijk.

[Reactie gewijzigd door Anoniem: 718943 op 22 juli 2024 13:20]

Fijn dat DeepL dit beschikbaar gaat stellen, ook al is het op termijn. De gebrekkige accuratesse bij vertalingen door andere partijen, zoals bijvoorbeeld ChatGPT, leveren weinig efficiëntie op wanneer de teksten veel vaktermen bevatten. Ter info, ik ben werkzaam in de juridische sector.

Ook een beetje in reactie op wat @Magnaat hierboven stelt.
Dat kun je eenvoudig oplossen door de standaard vertaalfouten in een document te plaatsen en toe te voegen aan de prompt. Heb dit zelf geïmplementeerd voor een security awareness training en een vertaling naar de lokale taal voor alle vestigingen.
Dank voor de tip! Zal dit intern eens bespreken.
Wellicht enigszins off-topic maar ik ben wel benieuwd naar andermans inzichten voor wat betreft taaldocenten op (middelbare) scholen? Hoe snel vordert de techniek en zijn bepaalde vakken dan nog wel relevant?
Ben ik ook benieuwd naar, je kunt al hardware kopen die je als draadloze oortjes indoet en dat vertaalt alles voor je.

Op mijn Galaxy s24 ultra kan ik in het engels bellen en dan hoort de andere persoon alles wat ik zeg maar dan in het Chinees, frans of een andere ondersteunde taal. Heb het al een aantal keren gebruikt en werkt top.

Als het op zo'n snelheid gaat dan zie ik het wel gebeuren dan steeds minder mensen een 2e of 3e taal zullen spreken, want waarom zou je?
Omdat je meer doet in je leven dan alleen via oortjes communiceren.
Dat real time vertalingen hun use cases hebben wil niet zeggen dat een tweede taal leren nutteloos is, staat compleet los van elkaar.
Ik zeg ook niet dat het nutteloos is, maar dat mensen minder geneigd zullen zijn om een extra taal te spreken. Zelf spreek ik zeven talen vloeiend, inclusief geschrift (Nederlands, Engels, Duits, Spaans, Frans, Arabisch en Mandarijn) en momenteel ben ik Japans aan het studeren. Ik doe dit niet omdat het moet, maar omdat ik het fantastisch vind en hoe andere mensen zijn omtrent cultuur.

Zelf reis ik ook heel veel en als je de lokale taal kunt, dan beleef je een reis/vakantie heel anders en mensen zijn natuurlijk veel opener omdat ze het gemakkelijk vinden om in hun moedertaal te spreken.
Nou, ik denk dat wie veel contacten met het buitenland heeft of vaak naar een bepaald land gaat, de noodzaak om een taal te leren nog wel zal zien. Aan de andere kant, een taal leren om toegang te krijgen tot kennis in een vreemde taal heeft denk ik zijn langste tijd wel gehad. In Nederland spreekt iedereen één of meer vreemde talen, ik maar wordt zeer veel onderwijstijd aan gespendeerd. In landen als Japan en China doet men dat niet en de onderwijstijd kan dan ook aan andere zaken besteed worden. In die landen is het volstrekt normaal dat iemand met een universitaire opleiding geen Engels kan. Ik denk dat dat de toekomst is.
Het team op kantoor die onder andere de helpdesk runnen en met klanten communiceren in binnen- en buitenland maken veelvuldig gebruik van ChatGPT en DeepL, waarbij de laatste vooral voor zeer lange teksten gebruikt wordt zoals handleidingen. Het zijn fantastische hulpmiddelen maar , en daar ben ik streng op, niet meer dan een hulpmiddel. Als je niet begrijpt wat je zegt maakt het niet uit of je ChatGPT of DeepL gebruikt dan is en blijft het goeddeels klets, want hoe weet je nu of je antwoord geeft op de vraag?
Niet iedereen heeft een uitstekend taalgevoel en is bekend met allerlei nuances die in bijv Nederlands of Engels/Duits net even heel anders uitpakken.
Iemand die zijn eindwerk of scriptie moet inleveren is niet anders denk ik dan wat wij op kantoor doen, je beheerst iets, je hebt kennis, je iets heel moois gemaakt en AI kan je helpen om tekst leesbaarder te maken of helpen met een goed geformuleerde samenvatting. Maar net als met mondeling Nederlands vroeger bij je eindexamen, je hebt het gelezen en er een mening over of je valt door de mand met het enkel lezen van een samenvatting. En diegene die met enkel samenvattingen een 8+ haalde op zijn mondeling heeft waarschijnlijk toch wel het taalgevoel en de kwaliteiten om het eindexamen te halen.
Ik denk niet dat een docent Nederlands of Engels straks overcompleet zijn, als je niet snapt wat je zegt heeft CharGPT echt niet zoveel zin, uitzonderingen daargelaten.
Ik zit in de vertaalwereld (met één teen, en vooral aan de technische kant, maar heb veel contacten) en het gaat toch echt nog wel heel wat jaartjes duren voordat vertalen door een computer hetzelfde niveau heeft als een goede professionele vertaler.

LLMs hebben toen ChatGPT ineens opkwam een flinke sprong gemaakt, maar zijn sindsdien nagenoeg niet vooruit gegaan, er zijn zelfs veel vlakken waarin ze achteruit zijn gegaan. DeepL is altijd marktleider geweest en is dat nu nog, die hebben gewoon heel veel teksten van o.a. de Europese Unie geïndexeerd in Linguee en op basis daarvan vertaalmodellen gemaakt, dat die nu een LLM zijn gaan gebruiken op de achtergrond zal ze aan de ene kant flexibeler maken maar aan de andere kant zal het de kwaliteit van de output niet ten goede komen.

Ik ben geen taalkundige dus ik kan weinig zeggen over de exact techniek van DeepL en de kwaliteit daarvan, maar in mijn ervaring is het gewoon nog niet zo goed. Je moet echt nog per segment vertalen met vertaalsoftware omdat je anders de structuur van de tekst volledig kwijt bent, en 9/10 keer moet je de output die je krijgt corrigeren op hele simpele foutjes maar ook op gebruik van totaal verkeerde woorden.

Ik heb wel een keer een tekst door Google Translate, ChatGPT, en DeepL laten vertalen, en daarnaast zelf (met enige voorzet van DeepL, maar per segment en met directe correcte) vertaald, en het verschil zou je nog van schrikken. Google Translate is compleet onbruikbaar voor alles behalve losse woordjes, ChatGPT maakt er een heel ander verhaal met dezelfde strekking van, DeepL gebruikt voor hetzelfde woord 5 verschillende vertalingen en is gewoon niet consequent.

Of ik nu nog iemand zou aanraden om een opleiding in de richting van vertalen te gaan doen weet ik niet, maar taalkundigen zullen we nog heel lang nodig blijven hebben (die LLMs moeten ook gevoed en gecorrigeerd worden), en docenten al helemaal. Tot we op het punt komen waar de hele wereld dezelfde taal spreekt gaat daar niks aan veranderen.
Mijn ervaring is dat Deepl beter is dan Google, maar vaak check ik even bij Google of daar nog wat beters uit komt en soms is dat zo.
In mijn (beperkte) ervaring is vrijwel elk alternatief beter dan Google.

Wanneer je vaak naar/ van een bepaalde taal moet vertalen loont het vaak de moeite om te kijken of er een groot lokaal softwarebedrijf/ databoer is die een eigen vertaalprogramma heeft. Meestal is de vertaling daarvan naar/ van Engels beter dan die van de grote internationale aanbieders. Bij vertalen naar/ van Nederlands kan die betere kwaliteit wel weer tenietgedaan worden.
Of wat dacht je om het zelf te vertalen? Als je toch denkt wat de betere versie uit 2 teksten is? Waarom niet een betere tekst zelf maken? Is dit de weg die we opwandelen? Totaal ongediplomeerde mensen zonder skills die denken door een app te gebruiken mee te kunnen met de gediplomeerden? Ah rot op man, heel dat AI wereldje komt 100 jaar te vroeg, AI leert uit google en youtube, wat 97% propaganda is, leugens zijn, scripted, staged, memes, baiting, provocaties, sarcasme etc. Good luck zou ik zeggen, als ik ooit op het werk één mail krijg van een mdwkr die ChatGPT gebruikt ligt die buiten.
Anoniem: 201953 @peterbrand19 juli 2024 21:01
Google kan met veel meer talen overweg, is dan 100% beter dan DeepL😉
Het taalmodel maakt gebruik van eigen data van de afgelopen zeven jaar. Het is onbekend hoe DeepL aan die data komt en of daar bijvoorbeeld teksten tussen zitten die gebruikers van de gratis dienst hebben ingevoerd.
Ik maak zowel gebruik van DeepL.com als https://www.linguee.nl (ook van DeepL). Het valt op dat dit vooral de EU talen zijn en dat bij de voorbeelden vaak EU-(wets)-teksten staan. Wellicht gebruikt DeepL de EU-teksten (die in alle talen vd EU-lidstaten beschikbaar moeten zijn!) als input en leerschool.

[Reactie gewijzigd door Tweaker626 op 22 juli 2024 13:20]

Ik heb pas de originele tekst uit een opera van Puccini door ChatGPT gehaald, aangeven dat het een oud Italiaanse tekst betrof en gevraagd om een Nederlandse vertaling.

Dat ging professioneel goed. Vergelijkbaar met een vertaler die 6 uur werk verricht.

Vertalen via Google Translate gaat totaal mis op diezelfde tekst.
Ik zie op de site geen pro. Is starter ook een pro abonnement ?
Ja, de naam van hun betaalde aanbod is DeepL Pro en dat is dan onderverdeeld in verschillende niveaus abonnementen. Bovenaan de abo pagina staat groot DeepL Pro en de link is dan ook: https://www.deepl.com/pro

Iets explicieter benoemen ze 'DeepL Pro Starter', 'DeepL Pro Advanced' etc. op o.a. deze help pagina.
Hopelijk komt het ook in de API beschikbaar. Ik gebruik dat om hele directories in 1x te vertalen dmv. parallelle streams. Werkt als een tierelier en duurt maar een paar minuten.
een Pro-abonnement kunnen het model uitproberen door in een dropdown 'next-gen model' te kiezen
Pro-abonnementen zijn alle betaalde abonnementen, maar ik zie het bij Pro-Starter abo nergens het dropdown (menu)

Mijn jaar betaald abo zit er nu bijna op en ik heb gecanceld, want met alle alternatieven is €90 per een jaar echt veel te duur. €2 of 3 per maand is echt het maximum wat zo'n dienst waard is IMHO.

Wat trouwens ook een opmerkelijk keuze om met deze talen te beginnen? Er zijn op de wereld ruim 3x zoveel mensen die Spaans of Frans spreken dan Duits of Japans.

Op dit item kan niet meer gereageerd worden.