Google heeft een tool opensource beschikbaar gemaakt waarmee ontwikkelaars een watermerk kunnen plaatsen op tekst die met AI gegenereerd is. Ook helpt het zogenaamde SynthID Text om te identificeren of teksten gemaakt zijn met generatieve AI.
Een large language model genereert teksten steeds per token, legt Google DeepMind uit op zijn website. Zo'n token kan een enkel karakter representeren, maar ook een heel woord of een deel van een zin. Om te bepalen welk token gebruikt moet worden, krijgt iedere mogelijke optie een waarschijnlijkheidsscore om te bepalen hoe groot de kans is dat dit de juiste is. Hoe hoger de score, hoe groter de kans dat het token gebruikt wordt.
SynthID kijkt echter niet naar welk token gebruikt wordt, maar bepaalt hoe waarschijnlijk het is dat het taalmodel deze tokens genereert. Op basis daarvan past de tool de uiteindelijke score iets aan. Die nieuwe score vormt samen met de uiteindelijke woordkeuze van het taalmodel een watermerk. Daarnaast kan SynthID identificeren of een tekst door AI gegenereerd is of niet. Daarvoor vergelijkt de tool het scorepatroon van een tekst met het verwachte scorepatroon van teksten met en zonder watermerk.
Volgens Google heeft dit alles geen impact op de kwaliteit, accuraatheid of snelheid van het genereren van tekst. Ook zou de tool werken op teksten die zijn aangepast, ingekort of geparafraseerd. Wel heeft SynthID wat beperkingen. Zo kan het minder goed omgaan met korte teksten, herschreven teksten en vertaalde teksten. Ook heeft het moeite met reacties op feitelijke vragen.
Google introduceerde de tool al in 2023, maar voegde de opties voor teksten deze lente pas toe. De opties werden toen ook geïntegreerd in Gemini, het taalmodel van Google zelf. Nu zegt het bedrijf op X dat de tool breder beschikbaar wordt gemaakt, door deze opensource te delen. Ontwikkelaars en bedrijven kunnen de tool daardoor nu gratis gebruiken.
Google is niet het enige bedrijf dat een dergelijke tool heeft. OpenAI beschikt ook over een tool dat AI-teksten een watermerk kan geven en dergelijke teksten kan identificeren. Deze tool is echter nog niet uitgerold.