Nieuwe AI van Google DeepMind maakt soundtracks voor video’s

Google DeepMind werkt aan een kunstmatige intelligentie die soundtracks kan genereren voor video’s. Het geluid wordt gegenereerd aan de hand van de beelden die de AI te zien krijgt in combinatie met tekstuele inputs.

De technologie, video-to-audio, kan geluid genereren door videopixels te herkennen. De AI kan muziek genereren, maar ook dialoog en omgevingsgeluiden. De technologie kan gebruikt worden met video’s die door AI zijn gegenereerd, zoals die van Google Veo of OpenAI’s Sora. V2A werkt ook met echte beelden, bijvoorbeeld met films zonder geluid.

De technologie werd getraind op bestaande video en audio, en ook op met AI gegenereerde beschrijvingen van geluiden en transcripties van dialogen. V2A heeft daardoor specifieke geluiden leren associëren met bepaalde beelden. De technologie werkt ook met tekstuele inputs. Die laatste kunnen volgens Google DeepMind vooral gebruikt worden om al gegenereerde audio te verbeteren.

Er zijn volgens Google DeepMind nog hindernissen. De geluidskwaliteit neemt bijvoorbeeld af als de beelden van slechte kwaliteit zijn. Stemgeluid wordt ook nog niet goed gesynchroniseerd met lippen op het scherm, vooral als de beelden met AI zijn gegenereerd. Google DeepMind heeft niet gezegd wanneer de tool beschikbaar komt. Voordat dit gebeurt, zal de technologie worden onderworpen aan ‘strenge veiligheidsbeoordelingen en tests’.

Vorig nieuwsartikel Volgend nieuwsartikel

Door Andrei Stiru

Redacteur

Feedback • 18-06-2024 14:51 18

18-06-2024 • 14:51

Lees meer

Google brengt AI-videogenerator Veo 2 uit voor Gemini Advanced en Whisk Nieuws van 15 april 2025

Google DeepMind introduceert Gemini-model voor robots Nieuws van 13 maart 2025

OpenAI brengt AI-videogenerator Sora uit, maar nog niet in de EU Nieuws van 9 december 2024

Google DeepMind toont AI-model dat speelbare 3d-werelden kan genereren Nieuws van 4 december 2024

Google brengt tool uit om watermerk op AI-gegenereerde tekst te plaatsen Nieuws van 24 oktober 2024

Meta en Universal sluiten deal om 'ongeautoriseerde AI-muziek' aan te pakken Nieuws van 12 augustus 2024

Google brengt Gemini-paneel voor Gmail uit voor zakelijke abonnees Nieuws van 25 juni 2024

Google werkt aan AI-functie voor Chrome om browsegeschiedenis te doorzoeken Nieuws van 17 juni 2024

YouTube test QR-codes voor kanalen en AI-samenvattingen van livechats Nieuws van 15 juni 2024

Google repareert actief misbruikte 'privilege escalation'-bug in Pixel-telefoons Nieuws van 13 juni 2024

YouTube lijkt te experimenteren met injecteren advertenties in video zelf Nieuws van 13 juni 2024

Google Drive begint met mails sturen als herinnering voor ongeopende bestanden Nieuws van 13 juni 2024

Google laat locatiegeschiedenis niet meer zien op desktop Nieuws van 6 juni 2024

Google brengt 'schrijfassistent' NotebookLM uit in Nederland en België Nieuws van 6 juni 2024

Google brengt Gemini-Android-app uit in België en Nederland Nieuws van 5 juni 2024

Meer producten en artikelen

Bedrijfsnieuws Google Kunstmatige intelligentie Video

IT-banen

Meer vacatures

Reacties (18)

-Moderatie-faq

Wijzig sortering

Dooxed 18 juni 2024 15:13

Ik zoek eigenlijk iets andersom: ik heb een muziekmix van zeg 1 a 2 uur (veel zonder stem) en ik wil daar een video bij genereren in een bepaald thema en stijl. Kent iemand een tool daarvoor? Liefst superminimalistisch, met alleen een licht bewegende achtergrond.

[Reactie gewijzigd door Dooxed op 22 juli 2024 16:54]

geerttttt @Dooxed • 18 juni 2024 15:42

WinAmp had in de jaren negentig allemaal kekke visualisation plugins...

Shadow_J @geerttttt • 18 juni 2024 15:45

Op 1 of andere reden dacht ik hier ook direct terug aan.
Ik kan me niet voorstellen dat er bij YouTube geen gelijkaardige optie beschikbaar is.

Wat ik vaak zie zijn loop video's dat ingesteld worden, maar deze lopen natuurlijk niet synchroon met de bassen of andere instrumenten in de video's. Maar het is alvast leuker dan naar een foto te staren, zeker als je vaak via chromecast wat youtube setjes opzet zoals ik doe

iSpace_61 @Dooxed • 18 juni 2024 15:47

Kijken naar gratis Gif's of Korte videos (vast genoeg bronnen daarvoor) . Dit kan je dan 2 uur lang repeaten in een video editor, muziek/audio er onder plakken voila.

Stoney3K

Video

@Dooxed • 18 juni 2024 15:55

Winamp AVS Visualisation Toolkit?

Noxious @Dooxed • 18 juni 2024 17:22

Ik zie een aantal mensen de WinAmp visualizer noemen.

Inmiddels is er BeatDrop, een moderne stand-alone applicatie die op basis van dezelfde Milkdrop2 visualisatie werkt: https://github.com/OfficialIncubo/BeatDrop-Music-Visualizer

Je zou een preset kunnen maken naar wens qua stijl, de 'preset slideshow mode' kunnen uitzetten en de output van de visualiser capturen met bijv. OBS Studio terwijl de muziek speelt.

donbaco @Dooxed • 18 juni 2024 20:27

Dream Machine van Lumalabs?

Ruffian 18 juni 2024 15:10

Mooi al die aankondigingen maar ik wil inmiddels ook met beeld en geluid gaan spelen.
Is er een beta invite methode hiervoor?

Baf 18 juni 2024 15:28

Dat kan toch alleen maar oninteressante muzak opleveren?

air2

@Baf • 18 juni 2024 16:02

check de video, dat is geen muziek, maar gewoon spraak

njh @air2 • 18 juni 2024 16:04

Er zit toch echt muziek bij de spraak

iqcgubon @Baf • 18 juni 2024 16:06

"Hmm, human music. I like it."

Sluw 18 juni 2024 16:04

Het is leuk speelgoed maar ik kan me voorstellen dat dit soort tools oneindige stromen aan oninteressante content gaan opleveren. Er wordt nu al 500 uur aan videomateriaal per MINUUT geüpload naar youtube, dat wordt straks helemaal een vloedgolf.

Pulletjen @Sluw • 18 juni 2024 16:53

Net als die AI ingesproken dropship ads op youtube, too much allemaal

Ruffian @Sluw • 18 juni 2024 20:02

Maar YouTube gaat dit uiteindelijk filteren doordat je verplicht een vinkje 'Gemaakt met AI' moet aanvinken.
En die content zal dan weer er uit gefilterd kunnen worden.

Ik zag bij het toevoegen van een boek bij Amazon KDP al deze optie, kwestie van tijd.

Soulbringer320 18 juni 2024 16:10

ik zoek een AI tool, waar ik een aantal mp3's in gooi en de tool deze mixt.

BiaggioLuciano 18 juni 2024 17:49

Ik heb hier dubbele gevoelens over: aan de kant vet! Mooi dat iedereen binnenkort hun eigen producties kunnen maken zonder te specialiseren in verschillende kunstvormen. Maar ik vrees eigenlijk dat beginnende artiesten (of zelfs huidige) hierdoor minder werk krijgen, en de producties die wel volledige menselijk invoer hebben, zullen achterlopen op een gegenereerde video. Waardoor menselijke kunst juist alleen voor de rijke en vrije mensen is.

Maar goed tot nu toe ben ik alleen aan het speculeren. En kan ik hopen op een betere toekomst, maar deze ontwikkelen verzuren mijn visie wel een beetje op mijn vak.

Ruffian @BiaggioLuciano • 18 juni 2024 20:04

Zoals ik er tegen aan kijk en dit al jaren op die manier doe, de artiest moet optreden, dat CDtje moet niet het eindresultaat zijn. En dat zal AI voorlopig nog niet vervangen lijkt mij.

Op dit item kan niet meer gereageerd worden.

Lees meer

IT-banen

Reacties (18)

Sorteer op:

Weergave: