Mozilla maakt offline vertalingen Firefox-webpagina's mogelijk

Mozilla brengt een gratis extensie voor Firefox uit waarmee vertalingen lokaal en offline uitgevoerd kunnen worden. De dienst maakt gebruik van machine learning om accuraat een tekst te vertalen en vereist geen verwerking via de cloud.

De gratis browserextensie gebruikt dus geen extern datacentrum om vertalingen te genereren, maar doet dit direct op het systeem van de gebruiker. In de praktijk verschilt offline of via de cloud vertalen weinig voor de gebruiker; doorgaans heeft iemand vanzelfsprekend internet om überhaupt op een webpagina te belanden. Het idee is dan ook vooral dat er geen data over en weer verzonden hoeft te worden, wat volgens Mozilla voor privacyvoordelen zorgt.

"Het doel van Mozilla was om een websitevertalingsplugin te ontwikkelen die lokaal werkt. Dit houdt in dat de engines, taalmodellen en vertalingsalgoritmes volledig opgeslagen en uitgevoerd moeten worden op de computer van de gebruiker zodat er geen data naar de cloud gestuurd hoeft te worden. Dit maakt het proces volledig besloten."

Momenteel kan Firefox Translations alleen webpagina's in het Spaans, Estisch, Duits, Tsjechisch, Bulgaars, Noors, Portugees en Italiaans naar het Engels vertalen. Mozilla werkt aan de vereisten voor het vertalen van enkele andere talen, maar Nederlands zit daar vooralsnog niet bij.

De uitdaging bij het ontwikkelen van het offline vertalingssysteem was volgens het Amerikaanse bedrijf het ontwikkelen van een machine learningalgoritme dat snel genoeg is op een normale cpu. Ook zouden de berekeningen niet mogen berusten op de gpu, de processor die doorgaans voor de verwerking van taken binnen deep- en machine learning zorgt. De extensie is het resultaat van Project Bergamot, een samenwerkingsverband van verschillende universiteiten en met financiering van de Europese Unie.

Firefox vertaling

Update, 19.00: In de tweede alinea werd op een verwarrende manier gebruikgemaakt van de term 'praktisch nut'; dit is verduidelijkt.

Door Yannick Spinner

Redacteur

03-06-2022 • 17:49

58

Reacties (58)

58
41
25
3
0
0
Wijzig sortering
Het praktische nut van het offline vertalen van teksten via een internetbrowser is vrij klein
Gele kaart, Tweakers/@YannickSpinner. Privacy is een groot goed. Bijvoorbeeld (de vertaalserver van) Google weet welke foute sites je allemaal vertaalt. Google weet veel, en daarom wil een groeiend aantal mensen het niet langer gebruiken. Mensen adviseren elkaar ook hoe je kunt stoppen met het lekken van data naar andere servers. Zo kan je automatisch Twitter-links openen in Nitter. Of verbergen welke andere media je kijkt. En nu dus ook sites vertalen zonder te lekken wat je leest. Het praktische nut is oprechte privacy, en een veilig gevoel als je iets vertaalt wat je niet mag lezen.

[Reactie gewijzigd door Sando op 23 juli 2024 15:43]

Bijzonder dat een journalist besluit of iets wel of niet bruikbaar is. Juist in tijden waar de wetgeving steeds vaker lijkt aan te geven dat cloud-diensten zoals Google's analytics eigenlijk helemaal niet legaal zijn in Europa, en waar mensen steeds meer end-to-end encrypted met elkaar communiceren. Een online-vertaal oplossing die dan alsnog gebruikt zou worden voor het bericht in die end-to-end encrypted chat wordt gestopt is dan natuurlijk een prima kijkje in het leven van mensen, waar deze oplossing van mozilla netjes lokaal zijn werk doen en dus geen data lekt.
Inplaats van twitter-nitter redirect zou je kunnen kijken naar https://github.com/libredirect/libredirect. Dit is een fork van privacy-redirect en doet automatisch de redirect voor veel sites(onderanderen twitter, reddit, youtube, etc). Je kan het zelf instellen voor wat je wilt en kan dus de public server lijst die erin staat gebruiken of een custom instance toevoegen die je zelf host. Ik zie dat je inderdaad all privacy-redirect hebt gelinkt met 'andere media'. Maar zou altijd een kijkje nemen naar libredirect. Een zeer handig programma vind ik.

[Reactie gewijzigd door Stetsed op 23 juli 2024 15:43]

Ik doe een beroep op de videoscheids! Met 'praktisch nut' refereer ik naar de praktijk; er is voor de gebruiker geen praktisch verschil tussen offline en cloudbased vertalen. Daarna komt het privacyaspect dat je (in mijn optiek terecht) aankaart naar voren.
Edit: Om verdere verwarring te voorkomen heb ik de zinnen in kwestie aangescherpt. Dank voor de feedback!

[Reactie gewijzigd door YannickSpinner op 23 juli 2024 15:43]

Akkoord! d:)b
(Zowel videoscheids als aanpassing)
@YannickSpinner Weet je ook welke gebruiker beter is: een proces of een mens?

En hoezo log jij dan in je cloud om daar iets te gaan vertalen? En in welk scenario dan? Of welke vertaalapp heb je het over? Ik kan me er weinig bij voorstellen. Ik klik gewoon middle click en ik vertaal direct, system-wide, en met 2 klikken ga ik evt. online op zoek.

Je weet dat zo ongeveer alle geautomatiseerde vertalingen van oudsher vanuit text-mode workflows gedaan worden en een zeer conservatieve workflow onderhouden? Misschien wel de meest conservatiefste uit heel de IT en ICT.

[Reactie gewijzigd door Bulkzooi op 23 juli 2024 15:43]

Verkeerd getagd?
In mijn comment leg ik uit wat de gedachte achter het schrijfproces was en geef ik aan de zin wat te hebben aangescherpt. Dus ik begrijp je feedback op de comment niet helemaal? Of refereer je naar het artikel zelf?
Ik begrijp de link tussen mijn comment en de jouwe niet helemaal dus daar wilde ik uit interesse meer over weten, maar je reacties vind ik bot en niet constructief. Als er feitelijke onjuistheden in het artikel staan hoor ik dat graag, maar in deze thread laat ik het voor wat het is.
Inplaats van bot reageren kun je misschien eens beter proberen uit te leggen wat je precies wilt vertellen. Ik kan er in elk geval geen touw aan vastknopen en ook ik snap de referentie naar @YannickSpinner's reactie niet.
Ik heb nog eens nagelezen maar in het principe valt mijn boodschap niet duidelijker te formuleren. Bovendien vindt ik dat ondanks mijn goede en behulpzame reply's yannick het niet duidelijker maakt en enkel meer verwarring zaait met zijn reply's. Ook de vragen die ik stel om meer verduidelijking in de situatie te scheppen laat hij aan zich voorbij gaan.

Welk stukje is dan zo moeilijk, @Josk79 ?
Van je gehele bericht Bulkzooi in 'Mozilla maakt offline vertalingen Firefox-webpagina's mogelijk' begrijp ik niet wat je ermee wilt zeggen en wat het met het voorgaande bericht van YannickSpinner te maken heeft.
Wat heeft dat met 'er is voor de gebruiker geen praktisch verschil tussen offline en cloudbased vertalen' te maken? Behalve privacy en het nodig hebben van een internetverbinding?
Bij Google Translate hoef je niet in te loggen, of begrijp ik je punt nog steeds niet?
Vraag me af wat dat met een browserextensie te maken heeft. En voor LaTeX zou je zowel cloudgebaseerde als lokale vertaaloplossingen kunnen gebruiken via een API, toch? Dat hoeft praktisch niet te verschillen.
Misschien moet je het artikel nog eens nalezen...
Deze thread begon met commentaar op deze comment:

'Het praktische nut van het offline vertalen van teksten via een internetbrowser is vrij klein'
Je begrijpt dat die comment óók reageert op het stukje met betrekking tot vertalen via een internetbrowser? Dat jij LaTeX erbij haalt is leuk voor je, maar offtopic.

Maar laten we deze discussie stoppen. Ondertussen is duidelijk waar de verwarring is ontstaan.
Maak dan een thread om aan te haken op dit artikel en bespreek jouw workflow. Zeker interessant!
Helemaal mee eens.. Het privacy aspect van deze lokale dienst is geen niche gebeuren maar een heel serieuze overweging voor veel mensen. Voor mijzelf ook.

Een privacy-respecterende online vertaaldienst zou wel een goede optie zijn geweest maar lokaal is op zich nog mooier mits het goed werkt. Wel is het heel lastig om de kwaliteit van Google Translate te evenaren omdat die hun AI model zeer goed hebben getraind voor veel talen.

Maar inderdaad, google weet inderdaad veel te veel van me.
Helaas worden de beide extensies, waar je naar verwijst, slecht bijgewerkt.
Gister wilde ik een Zweedse site vertalen, woorden en zinnen (die ik altijd vertaal via de bang !deepl wat ddg accepteerd en het direct vertaald op deepl.com) gaat altijd prima, maar een hele site vertalen was toch lastiger.

Ik heb wat Firefox plugins bekeken maar ze maakten allemaal gebruik van Google translate. In de opties was er bij bijvoorbeeld de https://addons.mozilla.or...x/addon/simple-translate/ een mogelijkheid om deepl te gebruiken maar daarvoor moet je wel een eigen api key invoeren. Opzich prima, maar om die te krijgen moet je je registreren, en daarbij een credit card nummer opgeven. Aangezien ik die niet heb kwam ik toch wéér bij Google uit.

[Reactie gewijzigd door Reezy op 23 juli 2024 15:43]

Ook is de juiste vertaling van Estonian Ests, niet Estisch.
Maar als je zoveel aan je privacy hecht, dan heb je er toch al voor gezorgd dat je niet te traceren bent tijdens het surfen? En dan ga je sowieso toch niet vertalen via Google? In dat licht is de meerwaarde van offline vertalen beperkt.
En dan ga je sowieso toch niet vertalen via Google? In dat licht is de meerwaarde van offline vertalen beperkt.
In dat licht is de meerwaarde dus identiek aan de waarde van een vertaalservice an sich, omdat je nu überhaupt over een vertaalservice kunt beschikken en voorheen niet.
Want er zijn geen vertaalmachines anders dan Google op internet?
@Sando
offline vertalen wil niet zeggen dat je het kan vergelijken met een server of een vertaalservice. Je moet het vergelijken met lokaal vertalen. Het privacy component heeft initieel betrekking op het systeem, niet op de service, dus in dit geval een addon in een browser op een OS. Als je het hebt over services, dan komt ook authenticatie nog aan bod en ook bijbehorende ToS, of EULA of hoe ze het ook noemen in contractrecht.

@killercow het is inderdaad wordlingo. Maar niet alle talen zijn gelijk gecreëerd. Dat een journalist of advocaat iets meent heeft geen enkele juridische waarde. Zeker nu niet meer, waarbij de politiek steeds verder achter de feiten gaat aanlopen en programeertalen alle sectoren in het data domein rulen. Politici daarentegen... die mensen worden geacht te weten waar ze over praten. Helaas is wat zij veronderstellen niet universeel gedragen, zowel niet op nationaal niveau, en al helemaal niet op internationaal niveau. Uitzondering hierop is het medisch wetboek, wat helemaal een puinhoop is en zelfs geen internationale directives heeft.

Either way, het is niet logisch om offline translaties aan privacy te verbinden. Vertalen is gewoon een generieke systeemfunctie en universele behoefte. Als je dat wel doet, dan gaat men allerlei workflows en bijbehorende terminology door elkaar halen. Dat is een chaos.

[Reactie gewijzigd door Bulkzooi op 23 juli 2024 15:43]

Heb je oprecht geprobeerd je eigen comments te lezen? Ik begrijp werkelijk niet wat je bedoelt.

Zeg je nou bijvoorbeeld dat vertalen per definitie geen dienst hoort te zijn en daarom “by design” geen privacy probleem moet introduceren?

Of zeg je dat diensten die vertalen by design geen privacy schenden?

Of zeg je iets heel anders?

Het zal wel aan mij liggen
Wat je alleen uit het oog verliest is in je diverse reacties dat het in dit artikel niet gaat om de reguliere procesmatige vertalingen van jouw LaTeX vertaalproces, maar dat het in dit artikel gaat om just-in-time on-demand computervertalingen van content die alleen in talen die niet/minder door die eindgebruiker beheersd worden beschikbaar is. (commentaar onder de artikelen is bedoeld om de inhoud van het artikel nader te bespreken. Voor een thread over het algemene onderwerp computervertalingen is het forum het juiste platform.)

Je hele LaTeX workflow en de pro's en cons van offline danwel cloudbased vertalen zijn daar niet van toepassing.Voor de typische LaTeX vertaal workflow heb je over het algemeen meer geduld, omdat het een vertaald document oplevert wat ook verder gedeeld en gelezen wordt door meerdere gebruikers die de betreffende taal beheersen en interesse hebben in het document.

Als gevolg van het per individu on-demand just-in-time karakter van de vertaal-aanvraag waar het artikel over gaat is privacy bij dat type vertaling een uiterst relevant aspect van offline versus cloud-based.
En cloud-based is al de nodige jaren de de-facto standaard voor dit type vertalingen vanwege het grote processing capaciteitsvoordeel (sneller verwerkt) wat ideaal is voor deze vertalingen waar de gebruiker op zit te wachten (on-demand, just-in-time) die daarna meteen weer de prullenbak in kunnen.
Je reageerde op een comment dat geschreven is in de reactie-draad van, en daarmee in de context van, een artikel op de frontpage. Dat betekent dat je altijd ook die context in ogenschouw moet nemen en dat het in de comments hier dus gaat om "automatische of druk-op-de-knop vertaling van vreemdtalige webpagina's door een browser" - het fenomeen waar de firefox plugin voor bedoeld is.
Daar zijn vertaalworkflows compleet out-of-context (net als overigens programmeertaalvoorkeuren) en dus off-topic.
Kijk dit is mooi, hier ben ik wel blij mee. Ik probeer ook zo min mogelijk Google te gebruiken. Lokaal vertalen past daar mooi bij. Je wilt je privé teksten eigen nergens naar sturen onnodig. Verder is het ook handig om voor jezelf vertalingen te verbeteren.

Google maakt ook echt van die domme fouten, door heen en weer te vertalen. Turkije heeft bv onlangs zijn internationale naam van Turkey veranderd naar Türkiye vanwege de verwarring (al dan niet bewust) met kalkoen. Ga je nu Türkiye van Turks naar Nederlands vertalen, staat er alsnog kalkoen ipv Turkije 😂

[Reactie gewijzigd door HakanX op 23 juli 2024 15:43]

Helaas maakt deze Mozilla extensie nog wel gebruik van Google... :'(

Blijkbaar had ik het verkeerd begrepen

[Reactie gewijzigd door Ruuuuuubje op 23 juli 2024 15:43]

Bummer :| had gehoopt op een betere vertaal algoritme.
Blijkbaar zat ik er naast, maar of het beter is is de vraag. Wie weet wat de toekomst brengt...
Waar zie je dat? De vertaling wordt in je browser gedaan, Google wordt helemaal niet aangeroepen.

Wel deel je van alles en nog wat met Mozilla en de onderzoekers die achter dit project staan.
Je hebt absoluut gelijk, ik begreep dat uit eerdere reacties hier (maar intussen aangepast) en misschien begreep ik die personen verkeerd.
Project pagina van deze vertaalservice erbij gepakt, en inderdaad nergens het woord Google te vinden (gelukkig)
het ontwikkelen van een machine learningalgoritme dat snel genoeg is op een normale cpu
Huh, dat machinelearning-algoritme draait toch niet lokaal? Alleen het vertalingsalgoritme draait lokaal neem ik aan.
Over het algemeen is het vooral het trainen van een AI/ML model wat veel rekenkracht kost. Het gebruiken van is vaak een stuk makkelijker. Natuurlijk word dat ook zwaarder naarmate het model groter word, en ik weet niet hoe groot een model voor vertalen is, maar waarschijnlijk draai je al genoeg AI/ML modellen op je telefoon zonder dat je het weet ;)
Dus Mozilla Firefox levert de browserengine, en Project Bergamot de addon met queries om vertalingen te managen op een lokale database. Of snap ik het nou niet?
Project Bergamot is a consortium coordinated by the University of Edinburgh with partners Charles University in Prague, the University of Sheffield, University of Tartu, and Mozilla.
Ik zie geen enkele reden voor een text-mode user om een browser engine te gaan gebruiken, en ik zie geautomatiseerde vertalingen allemaal overstappen naar een systeem en workflow met enkel text-mode. Zowel vanuit veiligheidsperspectief, als vanuit usability.

Menselijke gebruikers, laat ik mijzelf pakken, ben nog altijd uitermate happy met middle-click mouse button toewijzing aan Babylon, systeemwide op Win7 Utlimate.. Ik zie ook negatief toegevoegde waarde om deze feature naar de browser te verplaatsen. Da's een degeneratie van de OS mogelijkheid om te vertalen t.o.v. de systeemtaal, een feature waar je historisch gezien toch al veel moeite voor moest doen om gebruiksvriendelijk en toegankelijk te maken. Pure redunancy, en dan te bedenken dat ze FirefoxOS gewoon hebben draaien op telefoons.

Ongelofelijk hoe die NGO's resources verkwanselen. Maar ja, Mozilla staat nou ook niet echt bekent om veilig stewardship, en America is middeleeuws qua consumentenbescherming. Bovendien laat de invloed van bigtech, biggov & bigdata zich voelen. Maar dat is dan ook een uphill battle, waarbij Mozilla waarschijnlijk een Borland lot te wachten staat.

[Reactie gewijzigd door Bulkzooi op 23 juli 2024 15:43]

Mensen (jij en ik wellicht niet) gebruiken Google Chrome's vertaalfunctie. Mozilla Firefox heeft die vertaalfunctie nog niet. Mozilla wil niet alle inhoud van webpagina's naar Google/Bing/Yandex Translate doorsturen.

Mozilla levert daarom een vertaalsysteem voor hun browser dat geen data naar internet verstuurt en daarnaast ook nog eens open en vrij te gebruiken is, gebaseerd op een algemener project van de EU om vertalingen mogelijk te maken. Hoe is dat verspilling? In een samenwerkingsverband waar men verschillende talen spreekt, is betere toegang tot vertaalsoftware toch juist alleen maar belangrijk?

Wil je een offline, native vertaling die buiten de browser werkt? Pak de code en bouw er een GUI omheen die op je middenmuisknop reageert. Gewoon normale C++-code, die toevallig ook tot WebAssembly kan worden gecompiled om in een browserextensie te werken.
Ik kan ook al geautomatiseerd vertalen, maar niet met code waarvan ik kan zien wat het doet met de invoer die ik het geef of zonder de inhoud naar internet te sturen.

Europa wil graag een systeem dat niet zo afhankelijk is van Amerikaanse bedrijven en daar kan ik alleen maar achter staan. Wellicht weet jij hier een beter alternatief voor, maar zelfs in Europa zie ik alleen maar matige Google-translate-alternatieven met een eigen cloud-service, zoals DeepL.

Op dit item kan niet meer gereageerd worden.