Google toont nieuwe AI-videogenerator Veo 2 die 4k-video's kan genereren

Google heeft de tweede generatie van zijn AI-videogenerator Veo aangekondigd. Deze update brengt verschillende verbeteringen mee ten opzichte van zijn voorganger, waaronder ondersteuning voor 4k-resolutie en video's van meerdere minuten lang.

Volgens Google onderscheidt Veo 2 zich door een beter begrip van realistische bewegingen en natuurkundige principes. De software kan ook specifieke cinematografische effecten toepassen en reageert op gedetailleerde instructies over cameralenzen en opnametechnieken, zo stelt het bedrijf. Ook zou het model minder last hebben van typische AI-fouten, zoals het genereren van extra vingers of ongewenste objecten.

De videogenerator is momenteel beschikbaar via VideoFX, een experimentele tool binnen Google Labs. Geïnteresseerden kunnen zich aanmelden via een wachtlijst. Google is van plan om Veo 2 in 2025 te integreren in YouTube Shorts en andere diensten.

Googles Veo 2-aankondiging volgt kort op de release van OpenAI's Sora. Deze concurrerende videogenerator is beschikbaar voor betalende Plus- en Pro-gebruikers van ChatGPT, maar nog niet in de Europese Unie. Waar Sora zich beperkt tot 1080p-video's van maximaal twintig seconden, claimt Google met Veo minutenlange 4k-video's te kunnen produceren.

Naast Veo 2 introduceert Google ook een vernieuwde versie van zijn beeldgenerator Imagen 3. Deze software is direct beschikbaar via ImageFX in meer dan honderd landen, maar wederom nog niet in de Europese Unie. Daarnaast lanceert het bedrijf Whisk, een nieuwe experimentele tool die het mogelijk maakt om afbeeldingen te combineren en te bewerken met behulp van AI. Whisk is vooralsnog alleen in de Verenigde Staten beschikbaar.

Om misbruik tegen te gaan worden alle gegenereerde beelden en video's die met Googles tools geproduceerd worden, voorzien van een onzichtbaar SynthID-watermerk.

Door Andrei Stiru

Redacteur

17-12-2024 • 13:48

36

Lees meer

YouTube is twintig jaar oud
YouTube is twintig jaar oud .Geek van 14 februari 2025

Reacties (36)

36
36
16
3
0
19
Wijzig sortering
Van de voorbeelden die ik heb gezien is Veo 2 echt vele malen beter dan Sora. Google maakt een stevige inhaalslag op OpenAI, dat is wel duidelijk.

[Reactie gewijzigd door 3raser op 17 december 2024 14:04]

Hierbij wel een kleine nuance. OpenAI legt uit waar hun model wel en niet goed in is op https://openai.com/index/sora/. Sora is inmiddels beschikbaar voor een breder publiek, maar Veo 2 nog niet. Hierdoor is Google in staat om veel verschillende voorbeelden te genereren en de beste te kiezen, waarbij ze kunnen focussen op de tekortkomingen van Sora.
Veo is niet beschikbaar voor een breed publiek, maar de voorbeelden die ik geef zijn volgens mij wel van normale gebruikers en niet van Google zelf. Dan nog kan er natuurlijk sprake zijn van cherry picking, maar dat kunnen ze bij Sora ook doen. De kwaliteit verschilt wel dusdanig dat ik me niet kan voorstellen dat er geen groot verschil tussen de twee is.
Het zijn de gebruikers die, als ik de YT-reviews mag geloven, hebben aangegeven dat Google Veo2 zich veel beter aan de opdracht houdt en ook een beter visueel resultaat oplevert.

Ik vind het ontzettend indrukwekkend hoe dit werkt en meestal is het resultaat verbluffend goed, niet van "echt" te onderscheiden. En soms zie je toch de tekortkomingen van AI, zoals in dat filmpje op het skateboardpark, waarbij het skateboard zich niet aan de wetten van de fysica houdt en tijdens snelle trucs verandert in een rare blob / blur. Ook zie je dat er geen cijfers of onleesbare cijfers worden gebruikt in het instrumentarium van de driftende auto. Het is dus niet alsof Google alleen perfecte video's heeft gepubliceerd, ook zij zijn eerlijk over de beperkingen.

Maar waar gaat dat heen joh? Kun je straks AI een verhaaltje laten schrijven met de favoriete onderwerpen van je kind, om dat voor het slapen gaan voor te lezen? Kun je Netflix straks vragen over een film over [insert onderwerp] en krijg je dan tailor made films met precies jouw voorkeuren, die naarmate je er meer gebruik van maakt, ook steeds beter gaan aansluiten op alle nuances die jij graag ziet? Of open world games waar de wereld live, fotorealistisch voor je wordt gegenereerd aan de hand van keuzes die je al eerder hebt gemaakt in het spel?
Mijn kinderen gebruik al zeker een jaar ChatGPT om verhalen voor het slapen gaan te schrijven. ChatGPT 3 had nog wat meer sturing nodig, maar ChatGPT 4 schrijft gewoon goede verhalen, vooral als je duidelijke instructies geeft zodat het verhaal beter uitgespreid wordt en het eind niet afgeraffeld wordt. (en m'n zoon heeft het verhaal ook wel eens door ChatGPT laten vertellen).

Mijn instructies die ik zelf gebruik als ik help met een verhaaltje te maken zijn:

Ik geef je zo een concept voor een verhaal. Je moet daarbij de volgende regels volgen:
Bedenk eerst een ruwe opzet en verhaal lijn, denk dan uit welke hoofdstukken het verhaal uit gaat bestaan en schrijf dan de hoofdstukken. Zorg dat er leuke en spannende gebeurtenissen in zitten met veel humor. Denk aan de character development. Zorg dat belangrijke delen van het verhaal zoals de ontknoping/oplossing aan het einde van het verhaal niet afgeraffeld worden (dus niet te kort) en dat deze goed spanning opbouwen. De doelgroep voor dit verhaal zijn tieners.

Let op: Soms als de groffe uitwerking van de hoofdstukken al wat langer wordt vraagt ChatGPT eerst of je het zo goed vind en of je wil dat hij verder gaat met het uitschrijven.
Naast dat het heel gaaf is dat dit nu kan ben ik ook heel sceptisch.. De fake beelden, de kunst en passie die vaak gestopt wordt in het maken van beeld materiaal verdwijnt. Straks krijgen wij "reclame op maat" of een wereld leider in een fake video die chaos creeerd.
Klopt, begint gewoon een beetje ‘eng’ te worden dat we dit nu kunnen 🙈
Dit soort dingen horen we al jaren en jaren op technology.. Maar er is nooit iets relevant gebeurt vanwege nieuwe technologie.
De wereld leider in een fake video die chaos creeerd lijkt me ook geen issue, dat kunnen wel decennia, en er is nog nooit wat gebeurt.
Vergeet niet dat er experts zijn die vake van echt kunnen onderscheiden dus deze fakes kunnen al snel debunked worden.
"Maar er is nooit iets relevant gebeurt vanwege nieuwe technologie."
Hoe kijkt u dan naar deze situaties?

Foto die heeft bijgedragen aan de opinie rondom Joegoslavië
https://bertvanvondel.nl/the-picture-that-fooled-the-world/

Foto's die die hebben bijgedragen aan de opinie rondom de inval van Irak
https://www.cbsnews.com/pictures/powells-photos/

Meisje dat zelfmoord pleegde vanwege deepfakes
https://www.ndtv.com/worl...ed-her-fake-nudes-4927916

Feestje dat uitliep op rellen, mogelijk gemaakt door massa-uitnodiging op Facebook/sociale media
Wikipedia: Project X Haren

Ik neem aan dat je contextueel iig zoiets bedoelt. Want als ik je uitspraak letterlijk zou nemen is deze natuurlijk compleet onwaar. Nieuwe technologie heeft natuurlijk allerlei relevante gebeurtenissen teweeggebracht. Mobiliteit door allerlei nieuwe vormen van vervoer, informatiedeling via telefoon, tv, internet.
Hoe erg dit soort dingen zijn.. dat deze dingen gebeuren is niet alleen van deze tijd. Dit gebeurd al jaar en dag, ook voor het internet. Natuurlijk niet op deze manier.... Maar was toen op andere manieren.

Ik wil het niet goed praten, natuurlijk niet... en het liefst zou ik dit ook niet zien. Maar dit is nooit te voorkomen, ook niet met stilstand. We moeten die samen oplossen... in mijn opinie met opvoeding en waardig met elkaar omgaan...
Dan heeft het zijn schade al gedaan.
Dit soort dingen horen we al jaren en jaren op technology.. Maar er is nooit iets relevant gebeurt vanwege nieuwe technologie.
Dat jij die voorbeelden niet kent, wil niet zeggen dat ze niet zijn voorgekomen. @tomaat23 noemt al enkele voorbeelden waarbij "deep fake" beelden de publieke perceptie hebben beïnvloed. Was het vroeger nog een "photoshop" waarbij iets weggepoetst of bijgeplakt was, tegenwoordig is het video of audio die bijna onzichtbaar is verwerkt. En dat brengt me op het volgende punt dat je mijns inziens fout hebt:
Vergeet niet dat er experts zijn die vake van echt kunnen onderscheiden dus deze fakes kunnen al snel debunked worden.
Op dit moment weet AI soms niet dat een mens 2 armen en 10 vingers heeft, of wordt er vergeten een oor aan het hoofd te plakken. Maar dat is AI in de kinderschoenen. Die fouten heb ik in de Veo2-filmpjes niet gezien en er zitten echt video's bij die voor mij 100% realistisch zijn. Die experts zijn nml dezelfde mensen die AI trainen en wijzen op de fouten. Er komt gewoon een moment dat AI al die "usual suspects" qua fouten niet meer maakt en niet meer van echt is te onderscheiden. Het is echt naïef om te denken dat dit geen effect gaat hebben. En dan nog: die experts zijn op een gegeven moment dagen bezig om zo'n video te debunken, terwijl de fake video's in luttele minuten kunnen worden gegenereerd. We zullen worden overspoeld met fake news dat zo realistisch is, dat we het geloven en de experts kunnen dan roepen wat ze willen, niemand hoort het meer, want "the damage has been done".

Verder krijg je het probleem dat met zoveel realistische fake video's, het echte nieuws ook wantrouwend wordt gevolgd. Want met al die mensen die de NOS/NPO/whatever niet meer geloven ("Fake news media", dank je Trump), gaan die ook geloven dat wat daar wordt uitgezonden, fake is. En wat als dat inderdaad per ongeluk sporadisch zo is? Hoe ga je nog snel nieuws brengen van een ramp ergens waar je niet zomaar een journalist bij hebt, als je eerst dagenlang met een expert de videobeelden moet onderzoeken of het wel waar is?
Kunst en passie is vaak niet te zien aan een video, je ziet een mooie video maar misschien is het gefilmd op een verschrikkelijke set met een cameraman die iets te handtastelijk is en een regiseur die iedereen continue aan het uitschelden was...

Dus dat zegt niet zo veel, en om iets goed uit AI te krijgen moet je alsnog de juiste input leveren, dat gaat uiteindelijk een kunst op zich worden en zorgt er juist ook voor dat mensen die de ideeen wel hebben maar niet te middelen alsnog mooie dingen kunnen maken en delen.
En t maakt nieuwe dingen mogelijk die voorheen te duur/ondenkbaar waren. Neemt niet weg dat ik t heel sneu vind voor de mensen die hierdoor hun werk gaan verliezen. Hopelijk verloopt de transitie geleidelijk (al zie ik dat niet zo snel gebeuren (pun intended))

Maar als iemand zonder tijd en middelen om zulke beelden zonder AI te creeren kijk ik uit naar de dag dat ik thuis zelf de ideen die al jaren door mijn hoofd dwalen eens op mijn TV te zien.
Het is van alle tijden dat mensen hun baan verliezen door technologische ontwikkelingen, het is sneu maar wel een logisch gevolg van vooruitgang.
Maar hier verliezen ze hun baan aan technologie die net van hun de kennis heeft gestolen.
Tja, de reden maakt denk ik weinig uit. Vroeger verloren de telefoondames hun baan omdat er ineens een automatische telefooncentrale was, de melkman werd vervangen door een SRV wagen en die werd vervangen door de buurtsuper.
Het maakt in zoverre uit dat als ze die SRV-wagen gevuld hadden met melk die ze eerder van de melkman hadden gestolen de politie er wel degelijk bovenop zou duiken.
Dit is een eindeloze discussie.

Als AI daadwerkelijk één op één zou kopieren heeft u recht. Maar dat is in het geval van generative AI niet het geval (in mijn mening, is geen wettelijke uitspraak over gedaan en dus eindeloze discussie).
Generative AI genereert content die inspiratie haalt uit bronnen van het net. Net zoals elke webdesigner inspiratie haalt uit designs van goed ontwikkelde websites, awwwards et cetera.
Zolang een authoriteit zoals een rechter of een overheidsinstantie geen wettelijke uitspraak doet hierover, blijft het de ene mening tegenover de andere mening.

Ik ben van mening dat AI leert hoe een kunst student leert van leonardo da vinci of van gogh. die maakt dan weer iets zelf. Misschien kopieert hij de stijl, maar het blijft een unieke creatie. zo gaat generative AI ook te werk.

hoe beter je prompt hoe unieker je resultaat.

En ontopic van verdwijnende banen.. ja, dat klopt. is de natuurlijke gang van zaken. Zo komen er ook weer nieuwe banen. Denk:
- Webtext copy prompter
- Fashion Image prompter
- LoRa Trainer voor eCommerce. Een Lora per product die vervolgens voor oneindige SoMe ads kan worden ingezet zonder kosten van een photoshoot.
- Checkpoint trainer voor brands zoals Nike

En dat zijn dan "eindgebruikers" die als banen kunnen worden gebruikt. Dan hebben we het nog niet eens over de knappe koppen die de techniek daadwerkelijk maken, ontwikkelen en onderhouden.
Het hoeft helemaal geen eindeloze discussie te zijn. Eventuele parallellen met hoe een mens leert zijn niet relevant. Een AI is een stuk software, een stuk gereedschap. Gemaakt door mensen, gebruikt door mensen. Om dat stuk gereedschap te fabriceren zijn grondstoffen gebruikt. Voor geen enkel ander gereedschap vindt men het oké dat de leveranciers van grondstoffen niet gecompenseerd worden. De exacte technische werking van AI doet daar niets aan af.

Kijk, ik ben een groot fan van AI, ik gebruik het dagelijks volop en het scheelt me bakken met tijd. Maar laten we niet doen alsof het daarom allemaal prima is wat OpenAI en consorten gedaan hebben. Daar mogen ze best eens voor ter verantwoording worden geroepen.
Dat is precies wat ik bedoel.. u ziet het als grondstoffen, ik zie het als inspiratiebronnen.
En tenzij er een wettelijke uitspraak over gedaan wordt, is dit wat u verkondigd, en ik verkondig, dus puur een mening. Geen feit. Andere kijk op zaken zorgt er dus voor dat het zonder interventie van een machtsinstantie altijd een discussie van meningen blijft.

Ik heb er verder ook geen baat bij om uw mening te veranderen. Zodra hier wettelijk wordt vastgelegd hoe Machine Learning gezien wordt door de wet dan leg ik mij daar bij neer en is dat het nieuwe feit. Voor nu is er nog geen feit, alleen een mening.
Dat is natuurlijk onzin. Als ik een tafel een stoel noem, dan is dat niet 'een mening' waar we het later nog wel eens over kunnen hebben, of aan een rechter kunnen vragen. Ik plaats mezelf dan simpelweg buiten de discussie. Op z'n minst mag je dan de geaccepteerde definities van gebruikte woorden erbij pakken en uitleggen waarom jij vindt dat ze ook van toepassing zijn op de huidige generatie van AI. Of uitleggen hoe ze uitgebreid moeten worden om ook die AI te duiden en waarom. Voor de duidelijkheid, Van Dale geeft bij het woord inspiratie 'bezieling'. Succes.

Maar je zegt me niet te willen overtuigen, dus je mag het ook laten. Je merkt het vanzelf wel, als er inderdaad een rechter mee lastiggevallen gaat worden.
u heeft recht op uw mening. fijne dag
Coca Cola heeft dit onlangs geprobeerd met hun klassieke kerstman reclame.
Tja AI is here to stay. Hoe gaaf en geweldig of hoe onwenselijk en eng we het ook vinden. Het zal ongetwijfeld leiden tot verlies van banen, benadeelde echte kunstenaars, en misbruik voor verkeerde doeleinden. Dat is iets dat we zoveel mogelijk met wetgeving kunnen proberen te beperken, maar ik denk dat het al dweilen met de kraan open is. We kunnen ons denk ik beter focussen op mensen leren er mee om te gaan, hoe je echte beelden van AI beelden kunt onderscheiden, niet alles dat je leest en ziet zomaar aannemen als waarheid, en hoe je dit kunt toetsen voor jezelf.
Het maken van beelden middels AI gebeurt nog steeds op basis van een prompt.
Die prompt is door mensen geschreven, en de prompt bepaalt ook in hoge mate hoe het beeld er uiteindelijk uit komt te zien.
Vergelijk het met collage kunst, daar is het ook de kunstenaar die plakt en knipt en daarna inkleurt en verft.
Misschien ontstaat er wel een nieuwe vorm van kunst, met AI beeldgeneratoren kun je beelden maken die in een fotostudio zowat niet te realiseren zijn.
Mee gaan met de tijd, en er op aanpassen zal toch de enige optie zijn.
Mensen waren vroeger ook bang van auto's.
Snap de meerwaarde nog altijd niet van een generatieve AI die fotos of videos maakt.

Naar mijn mening is het nog altijd heel erg een hypefactor zonder enige meerwaarde. Ja owke je kunt voor een paar tientjes een nieuwe coca cola reclame laten maken, maar het ziet er toch ook uit als een paar tientjes.

Beetje hetzelfde als, iedereen kan kunst maken, maar niet alles is kunst, soms is het gewoon troep en dat heb ik met generatieve afbeeldingen en videos een beetje.

[Reactie gewijzigd door Dlsruptor op 17 december 2024 14:07]

De kwaliteit zal niet blijven zoals het nu is, zoals je verwijst naar de coca cola reclame. Kijk naar de beginjaren van Computer Generated Images. Dat zag er ook uit als een blokkendoos, 40 jaar geleden.

Als je kijkt hoe groot de stappen zijn die generatieve AI maakt gaat het echt geen 40 jaar duren voordat het volwassen is, maar veel sneller.
Niet alle verf op een doek is kunst, net zoals niet alles wat gegenereerd is het zien waard is, maar dat diskwalificeert toch niet het volledig medium?
Jij hebt dat met generatieve afbeeldingen en video's... ik heb dat met de huidige niet generatieve afbeeldingen en video's.
Iedereen denkt dat hij artiest is, en de keuze online, streaming etc... is er in overvloed waardoor er enorm veel bagger is ook
"generate a video of a white family", iemand deze prompt al geprobeerd ;)? https://www.reddit.com/r/...age_generator_refuses_to/
Indrukwekkend hoor!

Echter als ik de video op 4K bekijk dan ziet het er toch allemaal een beetje raar en fuzzy uit. Ik ben bang dat de laatste paar procent verbetering ontzettend duur gaan worden.
Ik ben zelf nu bezig met Runway om AI video’s te maken. Het is leuk, maar soms ook frustrerend om iets voor elkaar te krijgen met een prompt. Als Google dat beter voor elkaar heeft wil ik die overstap gaan maken om daar video’s mee te gaan maken.

Op dit item kan niet meer gereageerd worden.