Netflix komt met een eigen AI-videotool genaamd VOID, wat staat voor Video Object and Interaction Deletion. De tool is gemaakt voor het bewerken van beelden waarbij door de bewerking de interactie tussen objecten verandert. De tool is verkrijgbaar onder de Apache License 2.0-licentie en gebruikt verschillende andere taalmodellen.
Volgens onderzoekers van Netflix kan VOID in allerlei situaties beelden aanpassen, met grote gevolgen voor de overige objecten in de beelden. Zo noemen de onderzoekers het voorbeeld van twee auto's die tegen elkaar botsen. VOID moet de ene auto kunnen verwijderen, waarna de tweede auto gewoon blijft doorrijden.
Ook tonen de onderzoekers een rij van omvallende blokken. Door VOID de middelste blokken te laten verwijderen, zou het laatste blok in de rij niet meer moeten omvallen. In tegenstelling tot 'gewone' videomodellen bewerkt VOID niet alleen visueel de beelden, maar dus ook inhoudelijk om de beelden in de nieuwe context kloppend te maken. Overigens zijn er meer modellen die over deze functie beschikken.
Het is onduidelijk in hoeverre Netflix de tool wil gaan gebruiken voor zijn eigen content. Vooralsnog gaat het om een wetenschappelijke tool die via Hugging Face te downloaden is. Gebruikers mogen het model onder de Apache License 2.0 hergebruiken, aanpassen en onder vermelding van deze licentie verspreiden.
Meerdere 'passes' voor eindresultaat
VOID werkt door de inputbeelden meermaals te analyseren en te bewerken om tot een realistisch resultaat te komen. Gebruikers zouden in eerste instantie een object kunnen aanklikken om het te verwijderen. Het zogenoemde vision language model verwijdert het object en maakt een berekening van hoe de andere objecten in de scène zouden moeten reageren.
Voor dat proces wordt Googles Gemini via een api-call gebruikt, waarna SAM2 van Meta wordt gebruikt om een laag bovenop de beelden te genereren. Ook de modellen Kubric van Google en Humoto dragen bij aan de beeldverwerking en -generatie.
De tweede pass is bedoeld om artefacten en andere visuele fouten te verwijderen. Deze tweede ronde is optioneel en vermoedelijk hangt het van de scène en de situatie af of er fouten in de eerste versie zitten.
Update, 13.00 uur – Er is informatie toegevoegd over de andere gebruikte modellen die Netflix 'bundelt' om VOID te kunnen maken. Met dank aan Quintiemero.