Onderzoekers van Google hebben een database vrijgegeven met meer dan 3000 zogenaamde deepfake-video's. Die dataset kan worden gebruikt door andere onderzoekers en ontwikkelaars om tools te bouwen die dergelijke nepvideo's en afbeeldingen beter kunnen herkennen.
De dataset is toegevoegd aan de FaceForensics Benchmark. Dat is een een systeem waarin meerdere technologieën voor het maken en detecteren van deepfake-video's en ander materiaal te vinden zijn. De Benchmark is gebouw door de Technische Universiteit van München en de Federico II-universiteit van Napels, en wordt gesponsord door Google.
Deepfake-technologieën bestaan inmiddels al een paar jaar. De technologie erachter wordt steeds beter. Deepfakes zijn foto's of video's die automatisch zijn gemaakt op basis van deep learning, en hebben vaak niet meer dan een paar bronbeelden nodig om nauwelijks van echt onderscheiden te zijn. Google zegt dat deep learning veel nuttige toepassingen kan hebben, maar dat er ook veel risico's en uitdagingen aan verbonden zijn. Deepfakes zijn zo'n uitdaging, omdat ze volgens het bedrijf steeds vaker worden gebruikt om individuen of zelfs hele gemeenschappen te schaden. Zo ontstond er onlangs nog ophef over een website waarbij de controversiële Canadese psycholoog Jordan Peterson werd geïmiteerd.
Google heeft nu zelf een dataset ontwikkeld van video's. Het bedrijf betaalde acteurs om video's op te nemen, en bouwde op basis daarvan duizenden deepfake-video's door er bestaande deepfake-algoritmes op los te laten. Die dataset is door iedereen te gebruiken. Onderzoekers kunnen de video's bestuderen om beter te begrijpen hoe deepfakes in elkaar zitten, en hoe zij tools kunnen maken die die video's kunnen herkennen. Eerder dit jaar stelde Google al een andere dataset beschikbaar van deepfake-audio-bestanden.