Meta wil realtime AI-vertaalsoftware voor 'honderden talen' maken

Meta werkt aan realtime vertaalsoftware die volgens het bedrijf moet werken voor 'iedereen in de wereld'. Dat meldt Meta-ceo Mark Zuckerberg tijdens een presentatie waarin het bedrijf zijn AI-plannen uiteenzet. Het is niet bekend wanneer die software moet verschijnen.

Meta meldt dat het bedrijf aan twee vertaalprojecten werkt. Het bedrijf noemt een 'No Language Left Behind'-project, waarmee Meta een AI-model wil ontwikkelen dat talen kan leren waarvan weinig schriftelijke voorbeelden zijn, zoals talen die primair worden gesproken. Het bedrijf noemt daarbij voorbeelden als Asturisch, Luganda en Urdu. Vertaalsoftware maakt doorgaans gebruik van geschreven hulpbronnen bij het leren van een taal.

Daarnaast werkt Meta naar eigen zeggen aan 'universele vertaalsoftware', die in real time 'honderden talen' onderling speech-to-speech moet kunnen vertalen, zonder dat deze eerst getranscribeerd moeten worden. Het bedrijf zegt dat veel huidige vertaalsoftware spraakvertalingen eerst omzet in tekst voordat deze daadwerkelijk vertaald worden.

Meta schrijft onder meer dat de vertaalsoftware ten goede zou komen aan zijn eigen producten. Het bedrijf noemt in zijn blogpost dat de software gebruikt kan worden door AR-brillen om realtime gesprekken te vertalen, bijvoorbeeld op een markt in het buitenland. Het bedrijf spreekt ook over realtime vertalingen in virtuele ruimtes in de metaverse. Meta meldt echter niet wanneer deze software klaar moet zijn voor gebruik en deelt ook geen roadmap. Het bedrijf zegt alleen dat het 'vooruitgang boekt'.

Meta werkt al langer aan AI-modellen en vertalingen. Het bedrijf maakt daarvoor bijvoorbeeld gebruik van Laser, een opensourcetoolkit voor taalverwerking die momenteel 'meer dan 125 talen' omvat. Meta zegt deze toolkit te hebben uitgebreid met spraakmogelijkheden om de software te maken. Het bedrijf spreekt ook over CoVoST 2, een dataset met 22 talen die voornamelijk worden gesproken. Recent bouwde het bedrijf ook een supercomputer, die op termijn 16.000 Nvidia A100-gpu's moet bevatten en gebruikt wordt voor AI-werk. Het bedrijf gaf eerder al aan die supercomputer te gebruiken voor spraakherkenning en analyse van spraak en tekst.

Meta deed de aankondiging tijdens een online Meta-evenement dat is gericht op AI. Daar toonde het bedrijf ook een prototype waarmee gebruikers VR-werelden kunnen maken op basis van beschrijvingen.

Door Daan van Monsjou

Nieuwsredacteur

24-02-2022 • 08:42

60

Reacties (60)

Sorteer op:

Weergave:

Van:

"Hallo, zullen we iets gaan drinken?"

Naar:

"Hello, would you like to drink some refreshing Coca Cola, now available at your locale?"
it's funny because it's true, lol
Lijkt me nogal belangrijk. Hiermee krijgt facebook nog meer informatie over je die ze goed kunnen gebruiken: 'Meta schrijft onder meer dat de vertaalsoftware ten goede zou komen aan zijn eigen producten'.
Kortom; nog meer persoonlijke advertenties op basis van nog meer informatie.
Natuurlijk blijft het bedrijfsmodel van facebook data.

Maar ze verkopen wat mij betreft ook een boel onzin
Het bedrijf zegt dat veel huidige vertaalsoftware spraakvertalingen eerst omzet in tekst voordat deze daadwerkelijk vertaald worden.
Als je voice naar voice wil vertalen zul je eerst ge gesproken stem moeten herkennen, de woorden. Die zul je dan toch in tekst moeten gaan omzetten. Vanuit die tekst zul je dan in de andere taal moeten gaan vertalen.
Daar komt nog een probleem bij dat realtime nooit mogelijk zal zijn.
Als ik begin met praten, begin je met een zin waarbij het dan alle kanten uit kan gaan qua zinsopbouw. Uiteindelijk zul je wil je een correcte vertaling krijgen altijd een seconde of langer moeten wachten totdat iemand zijn / haar hele zin heeft afgemaakt.
Dat ding wacht dan ook tot je uw hele zin hebt uitgesproken he...
Ik hoop dat jij dat in real life ook doet :-D
Als je een andere taal spreekt (beheerst) en hoort als mens dan hoef je normaal niet te wachten met de vertaling in je hoofd tot de ander zijn/haar zin heeft uitgesproken. Als mens ben je dan in staat om te begrijpen wat er bedoeld wordt.
Verschil is natuurlijk dat je in dat geval als mens en kennis hebt van de andere taal. Heb je die niet en moet er door een machine vertaald worden zul je altijd idd moeten wachten tot de zin is uitgesproken.
Klopt, echter zal een vertaalcomputer nooit op deze manier kunnen werken. Taal is niet erg precies en onze hersenen vullen de "gaten" in met ervaring. Zodoende kunnen we ook al een goed beeld krijgen tijdens het spreken of lezen. We kennen de context. Schrijvers maken hier trouwens gebruik van door dit te gebruiken binnen hun verhaal bewust gaten te plaatsen, die de lezer op het verkeerde been brengen. Om over politici maar te zwijgen.
Een vertaalcomputer kan niet woord voor woord vertalen, omdat je zo simpelweg geen correcte zin krijgt. Zinsbouw is in verschillende talen anders. Frans zet bijvoeglijke naamwoorden vaak achter het zelfstandig naamwoord. Bovendien kennen ze voor werkwoorden een toekomende tijd, waar wij het hulpwerkwoord zullen bij gebruiken. Dat maakt echt realtime vertalen tot een probleem. "Ik zal....". De computer begint met "Je", maar moet de rest van de zin wachten totdat duidelijk wordt, dat ik iets ga doen. "Je ferai". En erger wordt het als ik iets NIET zal doen. "Je ne ferai pas", terwijl ik in het Nederlands het niet pas achteraan net voor het woordje doen plaats. En dan heb ik het nog niet over beeldspraak. "It's raining cats and dogs" wordt uiteraard niet vertaalt tot het regent katten en honden. Hoewel, als er een vliegtuig vol katten en honden overvliegt en het ruim gaat open, zodat de arme beestjes naar hun dood vallen, zou je dat poëtisch wellicht zo kunnen zeggen.
Als je een andere taal spreekt (beheerst) en hoort als mens dan hoef je normaal niet te wachten met de vertaling in je hoofd tot de ander zijn/haar zin heeft uitgesproken. Als mens ben je dan in staat om te begrijpen wat er bedoeld wordt.
Het is gevaarlijk om alvast van iets uit te gaan wat 'waarschijnlijk gezegd gaat worden'. Zolang een zin meerdere kanten uit kan gaan, zal je in veel gevallen toch moeten wachten tot het einde van de zin. Ook als er helemaal geen vertaling nodig is; dus ook als een engels sprekende persoon tegen een engels sprekende persoon praat.
De vertaling is dus nooit realtime, want dat is feitelijk onmogelijk.

Meta wil de vertaling niet eerst omzetten naar tekst, transcriberen, maar direct van spraak naar spraak. Dat kan alleen als de AI letterlijk weet welke uitgesproken tekst 1 op 1 naar de gesproken tekst in een andere taal kan worden omgezet. Dat betekent dus heel veel tekstvertalingen inleren. Wellicht vanuit 1 standaard taal, zeg het Engels.

Al met al zal dit leiden tot enorm veel taalarmoede. Het 1 op 1 'realtime' vertalen kan alleen als je bochten gaan afsnijden en nuances in taal links laat liggen. Het zal een eenheidsworst aan vertalingen opleveren. Hier word ik echt droevig van. Niet dat ik een taaliefhebber ben. Het resultaat van dit alles zal de wereld er niet beter op maken, is zo mijn inschatting. Ik vind het zelf leuk om een nieuwe taal te leren. Dan leer je namelijk niet alleen de taal, maar ook de cultuur kennen.

Over een x aantal jaar gaat niemand meer dus vreemde talen leren. En leren we ook elkaars cultuur steeds minder waarderen. Kun je vrolijk met iedereen 'realtime' communiceren. Maar niet meer 'realtime' elkaar begrijpen. En waar dat alles toe kan leiden, tja...

Dit soort ontwikkelingen toejuichen is mijn optiek bijzonder kortzichtig. Maar hey, let's make the world a better place...
Dat is in veel landen de defacto norm. Dat wij in Nederland veel talen leren is als ik naar andere landen kijk eerder uitzondering dan regel. De laatste jaren neemt de kennis van Engels wel toe, maar daar voor was het toch echt spreek onze taal maar. Ook als we in jou land zijn.
Nederland is dan ook een echt handelsland.
Als je voice naar voice wil vertalen zul je eerst ge gesproken stem moeten herkennen, de woorden. Die zul je dan toch in tekst moeten gaan omzetten. Vanuit die tekst zul je dan in de andere taal moeten gaan vertalen.
Waarom zo dat altijd via tekst moeten?
Het is denkbaar dat een analfabeet (een mens dus) twee talen spreekt, en dus kan vertalen van de ene naar de andere taal.
Bij spraak vertaalsoftware die via tekst werkt, zijn er twee AI's (neurale netwerken), de eerste werkt op audio en genereert tekst, de tweede krijgt die tekst als input en genereert tekst in de andere taal, die dan weer naar audio omgezet wordt.
Waarom zou je geen vertaal AI kunnen hebben die twee stappen in een keer doet, en dus op de audio-input werkt, en meteen tekst in de andere taal genereert.
Ik denk dat menselijke hersenen het ook zo doen.
Als je als mens 2 talen spreekt ben je daarvoor uiteindelijk ook getraind. Uiteindelijk moet jij als mens ook alles verwerken. d.w.z jou oren zetten geluid ook om in stroompje / data waar je hersenen kunnen werken.
Maar ook daar als jij 2 talen beheert is wat jij hoort ook omgezet naar de kennis lees database die je in je hoofd hebt. Ga je nog een stap verder kun je zeggen het is geen tekst in je hersenen maar er zit dat die weet welk woord wat betekend, een database dus.
bij computer is er ook een database, of dat nu tekst in binair 0-1 of iets daar tussen er zit iets wat weet welk woord wat is.
Uiteindelijk moet dat omgezet worden naar een andere taal. Maar wederom voor een vertaling moet je de zin begrijpen en weten welk woord wat is in die context
Dus in bijv: ik zit op een bank voor de bank
deepl vertaal dit met: I sit on a bench in front of the bank
google zegt: I sit on a couch in front of the couch

google vertaald letterlijk terwijl deepl inhoudelijk grammaticaal kijkt. deepl werkt ook met deeplearning.

Maar hoe je het ook doet een vertaalslag betekend dat je een database met woorden en grammatica in de ene taal hebt en die dan kan omzetten naar andere taal.

Het kan natuurlijk vloeiend gaan zodat het lijkt 2 stappen in 1 keer maar intern zal er toch een tussenstap met getrainde database /grammaticaal moeten zijn.

Menselijke hersenen zijn complex maar neem voorbeeld school en leren van taal. Dom woordjes leren van NL>EN of omgekeerd. De werking van menselijke hersenen is complex en dat we die echt begrijpen, klein beetje.

[Reactie gewijzigd door bbob op 26 juli 2024 01:27]

De database die jij noemt, waar dus de betekenis van woorden in 'staat', kan gewoon onderdeel zijn van het neurale netwerk.
Dat zal die idd ook wel zijn als je ook grammaticaal wil vertalen. Neemt niet weg dat er als je van ene naar andere taal vertaald je na het horen het eerst moet omzetten naar de informatie in je hersenen, zoals een mens dat ook doet met horen of liplezen. Van daaruit kun je dan de vertaalslag gaan maken.
Jij snapt ook een halve zin, probleem is alleen dat je behoorlijk wat content nodig hebt om dit te trainen. Dit bij mainstream talen vaak nogwel omdat bijv. Muziek of films of luisterboeken zowel een tekstversie als een gesproken versie beschikbaar zijn.

Als we daarna meer naar dialecten gaan kijken wordt het al een heel stuk lastiger.

Kortom een goed ai model kan dit zonder problemen het leren, echter genoeg resources vinden die tevens gevalideerd worden wordt een uitdaging
Als ik kijk naar vertalingen spring deepl.com er met kop en schouders bovenuit in vergelijking tot google translatie of anderen. Zijn volgens mij de enige die op dit moment een redelijke goede inhoudelijke vertaling kunnen doen en niet de letterlijke zoals google.

Maar goed als facebook er genoeg geld tegen aan gooit komen ze misschien ook in de buurt
Lijkt me nogal belangrijk. Hiermee krijgt facebook nog meer informatie over je die ze goed kunnen gebruiken: 'Meta schrijft onder meer dat de vertaalsoftware ten goede zou komen aan zijn eigen producten'.
Kortom; nog meer persoonlijke advertenties op basis van nog meer informatie.
Tja, dan zou je dat ook van Google kunnen (moeten?) vertellen. Die zijn al een tijdje met iets soortgelijks bezig.
Google is op op veel gebieden van AI actief en ik denk dat je wel kun stellen dat ze in algemene zin markleider AI zijn. Inderdaad, ze zijn hier ook al een tijd mee bezig. Het kan natuurlijk zijn dat Facebook meer prioriteit gaat geven aan deze specifieke toepassing dan Google. Je kunt nu eenmaal niet markleider zijn in alle toepassingen van AI.
Facebook is met Pytorch verreweg groter dan Google, iniedergeval met hoeveel mensen hun ML framework gebruiken
We kunnen ook met zijn allen niks doen en gewoon weer gaan jagen om aan het eten te komen...
Ik zie dit echt gebeuren in de toekoms je bril die een taal herkend en vertaald voor je, waarbij je dan in je native language kan antwoorden en de ontvanger ook een bril heeft.
Een oortje met microfoon is denk ik praktischer dan een bril
Niet altijd, tijdens een vergadering wel, maar zoals opd e afbeelding op straat lijkt me een oortje onvoldoende. Daar denk ik eerder aan een bril met bone conducting audio en een klein schermpje voor wanneer er teveel lawaai is.
Groot gelijk, awesome reactie van je, eigenlijk helemaal spot on :-D

PS ik vind effectief dat je gelijk hebt, we zijn stukje bij stukje onze taal aan het...
Dat is niet alleen in het Nederlands, engels leent bijv. Veel spaanse, franse en Duitse woorden.

Dit komt onder andere door een cool gehalte etc.

Hier zijn complete studies op gegaan.
Nog meer mensen die aan babblefish moeten denken denken? :)
Nee, wel aan een Universal translator
Als ik aan goede vertaling denk, denk ik uitsluitend aan deepl, de enige vertaalmachine die niet letterlijk vertaald maar ook inhoudelijk en qua zinsopbouw.

Schreef het hierboven al facebook wil geen tekst vertalen, dat is wat mij betreft onzin. Als ik spreek zal een systeem toch echt eerst maar spraak intern naar tekst moeten omzetten. Vanuit die tekst kan het dan gaan vertalen. Daarbij moet er ook nog een pauze/vertraging in zitten zodat ik eerst mijn hele zijn kan afmaken. Pas als je een hele zin hebt kun je een echte goede vertaling maken. Zo niet krijg je weer van die kromme letterlijke google vertalingen.
Ze zeggen duidelijk dat een boel talen geen geschreven variant hebben maar uitsluitend als gesproken taal bestaan. Dus jouw aanname dat ze toch eerst naar tekst moeten is incorrect. Als er geen geschreven versie van een taal bestaat dan kun je dat niet doen.

Je zou wel iets als dit kunnen doen: https://aclanthology.org/N16-1109.pdf
Misschien kun je mij verklaren als er geen geschreven versie van een taal is hoe men dan weet wat de vertaling is.

Uiteindelijk zal men dan zelf toch iets moeten verzinnen als tekst om het in een andere taal laat staan grammaticaal om te zetten.

Als ik roept gherctyui hoe moet je dat dan vertalen zonder te weten wat je daarmee bedoeld.
Het algoritme moet jou uitspraak herkennen, dat intern omzetten naar iets anders. Intern zal er altijd iets moeten zijn waarmee de herkende uitspraak omgezet zal moeten worden.
Ja er zal een tussenlaag moeten zijn waar audio naar moeten worden omgezet, het unieke van dit systeem lijkt dat ze daar niet geschreven versies van de talen voor gebruiken, maar iets anders, waardoor ze in staat zijn een vertaling van NL naar FR, niet via EN te hoeven laten lopen.

Maar ik werk niet bij meta, ik lees ook alleen maar het artikeltje.
Daar staat dat ze laser gebruiken. Wil je weten hoe dat werkt dan kun je onderstaande links doornemen.

Zero-shot transfer across 93 languages: Open-sourcing enhanced LASER library
https://ai.facebook.com/b...gual-sentence-embeddings/

Massively Multilingual Sentence Embeddings for Zero-Shot
Cross-Lingual Transfer and Beyond

https://arxiv.org/pdf/1812.10464.pdf
Zoals je zegt een tussenlaag dat kan dan natuurlijk ook een zelf verzonnen universele taal zijn.
Uiteindelijk is het in die zin eenvoudig, wat jij zegt moet herkend worden, je woorden de zin.
Dat betekend als ik dit zeg deze zin van verbaal naar non verbaal omgezet moet worden. Of dat een andere tussentaal is niet niet het moet ergens omgezet worden van verbaal naar non verbaal.
Dan moet het systeem zien dat je een zin gemaakt hebt. Dat als geheel zien om dan weer een juiste vertaling vanuit de tussenlaag te maken.

Ze kunnen het mooi omschrijven maar de basis is bovenstaande. Begrijp dat ze tegenwoordig leuk met marketing termen gooien om het anders te omschrijven of te doen voorkomen hoe geavanceerd het wel niet is.
Ik denk dat je de Babel Fish bedoelt (van The hitchhiker's guide to the galaxy).
Die naam is overigens een 'woordgrap' betreffende de Babylonische Spraakverwarring die in de Bijbel wordt beschreven in Genesis 11:1-9.

(( In een notendop: De mensen wilden na de zondvloed een stad stichten met een toren tot in de hemel maken zodat ze beroemd zouden worden en niet over heel de Aarde hoefden te verspreiden. God bekeek het allemaal en zorgde ervoor dat alle mensen (die eerst allemaal dezelfde taal spraken) elkaar niet meer konden verstaan. Hierop is de bouw van de toren (en de stad) gestaakt en God verspreidde de mensen over de wereld. De stad werd door God Babel genoemd ))
Ja, die bedoelde ik inderdaad. Kennelijk heb ik het verkeerd geschreven. Als ik het met goed herinner, een visje dat je in je oor stopt en alles vertaald. Uiteraard een referentie naar de toren van Babel.
Moet Asturisch niet Asturiaans zijn, naar de regio Asturië (Asturias) in het noorden van Spanje? (Waar ik toevallig woon)
De EU en alle andere Nederlanders die ik hier ken spreken over Asturiaans.

https://www.europarl.euro...996-0387_NL.html?redirect
Zover ik het weet. (ik heb niet de waarheid in pacht, maar zo heb ik het in m'n hoofd zitten)

Het bijvoeglijke woord Asturiaans bestaat niet (al zou je kunnen stellen dat als een woord vaak genoeg gebruikt wordt, dat het wel bestaat. Taal faciliteert tenslotte communicatie, niet andersom :) en laten we eerlijk zijn. Asturiaans bekt wel heel lekker). De verleiding is nog groter, omdat het bijvoeglijk naamwoord in de lokale taal "asturiano" is.

Zoals je zelf al zei, gaat het om het het prinsdom (dacht ik?, anders regio) "Asturië".
De "Algemene Regel" voor aardrijkskundige regios/plaatsen/e.d. die eindigen met de -ië uitgang in de Nederlandse taal zoals "Australië, Normandië, België", krijgen een "-isch". Die worden dus respectievelijk "Australisch(e), Normandisch(e), Belgisch(e)". We hebben het dus over de 'Asturische taal' of bijvoorbeeld 'Asturische cider'. De schrijver van de brief in de EU schreef het dus verkeerd (of de vertaler maakte in elk geval een fout). (overigens volgen niet alle woorden die regel: Roemenië (Roemeens), Italië (Italiaans), enz. enz). Dit heeft veelal te maken met de vervoegingsmethoden en spelling van de oorspronkelijk taal (România, (limba) română en Italia, italiano.)

In de linguïstische literatuur staat de taal officieel bekend als Asturisch, en het het komt zelden voor dat als iets eenmaal is geregistreerd onder een bepaalde naam, dat het dan veranderd.
Het is idd "principado (prinsdom) de Asturias", een autonome regio van Spanje, maar tegenwoordig met een president ipv een prins. Asturiano is trouwens Spaans, in de lokale taal is het Asturianu (je herkent de taal ook voornamelijk aan die "oe" klank.

Wat de officiële benaming is het Nederlands is heb ik zo snel nergens kunnen vinden, (ook niet op de sites van het groene boekje of ANS) en online lijkt het beide evenveel voor te komen. De algemene regel ken ik, maar de lokale vervoeging vergelijkbaar is met je voorbeeld van Italië (het is asturano of asturana), een lokale inwoner is een Asturiaan, niet een Asturiër en de Nederlandse taal staat natuurlijk ook bekend om het aantal uitzonderingen.

Ik houd het bij wat de lokale (NL) mensen zeggen en wat lekker bekt - Groeten uit Asturias! :Y)
Taal en computers gaan moeilijk samen. De ontwikkeling van het vertalen heeft nooit stilgestaan en invloeden als de koude oorlog en de komst van neurale netwerken hebben die ontwikkeling alleen maar geaccelereerd.
In het dagelijks leven hebben we (soms ongemerkt) veel te maken met computervertalingen zoals chatbots, robotjournalistiek (gegenereerde weerberichten), vertaalde Wikipedia flarden en uiteraard de bekende vertaalmachines.
Tot dusver redelijk in de hand te houden. Wanneer echter deze taalmachines een primaire functie gaan krijgen (zoals Meta het schetst in een virtuele wereld) zijn er best heel wat uitdagingen en gevaren.

De zogenoemde AI wordt namelijk getraind met datasets, vaak publieke teksten. Waar men niet snel bij stilstaat is dat deze teksten licht stereotyperend zijn. In combinatie met logica, statistiek en ook grammaticale barrières kan dit stereotype enorm versterkt worden.
Daarvoor dit voorbeeld; probeer maar eens in Google Translate deze zin te vertalen: "Martijn is verpleger", daaruit komt keurig terug "Martijn is a nurse".
Wanneer dat Engelse zinnetje weer terug wordt vertaald gebeurt er iets geks, het wordt "Martijn is verpleegster".

Omdat in de dataset van Google het onzijdige woord "nurse" vaker in verband wordt gebracht met "verpleegster" in plaats van "verpleger" wordt het stereotype dat verpleegkunde een "vrouwenberoep" is in stand gehouden.

Een ander voorbeeld is het onschuldig lijkende idee om een bot te maken die teksten van recensies om kan zetten naar een cijfer. Op die manier hoefden gasten enkel hun gevoel uit te spreken en niet tot beoordeling over te gaan.
Wat opviel in de resultaten was dat een bepaald Mexicaans restaurant een overwegend negatieve score kreeg met best positieve recensies. De Amerikaans getrainde bot bleek echter getraind met een dataset waar het woord "Mexicaan" een negatieve lading had (in Amerika bijvoorbeeld vaak in verband gebracht met "illegaal").

Deze voorbeelden heb ik schaamteloos overgenomen uit onderstaand lunchgesprek van De Nieuwe Wereld, aanrader!
https://www.youtube.com/watch?v=ho1XotURhrE

Bron van Mexicaans restaurant:
https://books.google.nl/b...PA289#v=onepage&q&f=false
Omdat in de dataset van Google het onzijdige woord "nurse" vaker in verband wordt gebracht met "verpleegster" in plaats van "verpleger" wordt het stereotype dat verpleegkunde een "vrouwenberoep" is in stand gehouden.
Dat komt omdat sommige talen expliciet onderscheid maken tussen geslachten bij zelfstandig naamwoorden en bij anderen uit de context moet worden gehaald, indien aanwezig.

Overigens voegt Google Translate netjes de context toe en vertaalt "verpleger" naar "male nurse". En bij andere talen met geslachtsbepaling in het zelfstandig naamwoord gaat het ook prima, zoals Frans.

In het Duits maakt Google Translate er weer "männliche Krankenschwester" van wat ronduit absurd klinkt...

Overigens heeft dit niets met stereotypering te maken want er is gewoon een neutraal zelfstandig naamwoord dat de lading veel beter dekt; verpleegkundige. Dat sommige talen enkel neutrale zelfstandig naamwoorden hebben en anderen weer niet is geen stereotypering maar gewoon een van de rare nukken van talen.
Ik zou het jammer vinden als wij onze taal zouden moeten aanpassen op iets dat de computers beter begrijpt. Het geslacht van woorden kan communicatie efficiënter maken en is inderdaad voor de computer lastig als er weinig context is.

Dit heeft zeker wel met stereotypering te maken, want als de term "verpleger" statistisch gezien vaker voor zou komen in de samenleving had het algoritme van Google Translate dit verkozen boven "verpleegster".
Het feit dat er een "betere" (onzijdige) term voor is staat daar los van.

Hoewel het voorbeeld onschuldig lijkt en er altijd wel een oplossing achteraf is ben ik bang voor de ontwikkeling waarin gebruikers steeds meer vertrouwen hebben in de techniek en uitkomsten steeds minder verifiëren. Vooral als het op zo'n grote schaal "makkelijk" wordt gemaakt door Meta.
Maarja dat is een ander hoofdstuk :)
Je voorbeelden doet me denken aan wat Google een hele tijd geleden had met het woord autochtoon. Het systeem kende dat woord niet, maar wilde het 'corrigeren' naar 'allochtoon'. (de "bedoelde u xyz" functie)

Je kreeg dus al snel ongelukkige correcties:
Een Google zoekopdracht naar "Criminele autochtoon" kreeg als reactie "Bedoelde u Criminele allochtoon?".

Je ziet inderdaad vaak dat vertalingen soms kant nog wal raken. Over het algemeen gaat het natuurlijk "best aardig", maar soms gaat het ook compleet mis en is het ook erg verwarrend, tot op het niveau dat je niet eens begrijpt wat er bedoeld wordt, of dat je 'foute zaken' krijgt die stereotyperend of seksistisch zijn zoals je al aangaf.
De beste vertaal robot die ik op het moment ken is Deepl
Doet het echt veel beter dan google of zo.
Ik vind dit een heel goed doel van Facebook, realttime vertalingen zouden zeker mensen helpen als ze bijvoorbeeld op vakantie zijn. Het helpt ook mensen meer te verbinden online, je zou bijvoorbeeld makkelijk youtube videos van andere landen kijken, krijg je weer wat andere perspectieven mee.

Maarja, het blijft Facebook he. Dus ik vrees dat de reden voor deze AI niet nobel is, maar om nog meer advertenties door stotten te kunnen douwen en nog meer persoonlijke data te verzamelen.
Krijg je dan ook reclame in je vertaling?
Dan kunnen ze in allerlij talen lezen dat ze moeten stoppen met hun data vergaring en dat niemand zin heeft in die onzin van Mark

Op dit item kan niet meer gereageerd worden.