Google toont generatieve AI die realistische filmpjes kan maken

Google heeft een demo getoond van een generatieve AI die filmpjes van tot vijf seconden lang kan maken. De tool heet Lumiere. Het gaat nog om een demo waarvan het nog niet bekend is wanneer Lumiere beschikbaar wordt voor gebruikers.

Lumiere is in staat om fotorealistische filmpjes te genereren gebaseerd op tekstuele inputs. Ook is het mogelijk om afbeeldingen deels of volledig te animeren. Verder kan Lumiere de stijl van een afbeelding, bijvoorbeeld een tekening, nabootsen en er vervolgens video’s mee maken. Het is zelfs mogelijk om video’s te editen met het programma. In een van de voorbeelden die Google toont, verandert niet alleen de kleur, maar ook het model van een jurk die een vrouw draagt, enkel door een tekstuele input te geven.

In een paper die op arXiv gepubliceerd werd, beschrijft het onderzoeksteam van Google hoe de software werkt. Het team ontwikkelde een nieuwe architectuur, genaamd 'Space-Time U-Net'. Die maakt het mogelijk om een filmpje in één keer te genereren. Dat moet de architectuur onderscheiden van bestaande modellen, die in een eerste stap gespreide keyframes genereren, waarna de tussenliggende frames met temporele superresolutie worden aangevuld. Temporele superresolutie is een techniek in de beeldverwerking die wordt gebruikt om de tijdsresolutie van een video te verbeteren. Het doel is om tussenliggende frames te genereren op basis van de bestaande frames in een video, waardoor de framerate van de video effectief wordt verhoogd. Bij Lumiere is dat niet het geval, die genereert de beelden zonder die superresolutie.

De gegenereerde output is momenteel beperkt tot video's van slechts vijf seconden lang met een resolutie van 1024x1024 pixels. Google beschouwt dat zelf als lage resolutie, maar het is onduidelijk of toekomstige versies van het systeem een hogere resolutie zullen ondersteunen. Momenteel is Lumiere een onderzoeksproject en dus nog niet beschikbaar voor het grote publiek. Wanneer en of dat zal gebeuren, is niet bekend.

Door Andrei Stiru

Redacteur

25-01-2024 • 16:28

113

Submitter: JapyDooge

Reacties (113)

113
111
40
0
0
59
Wijzig sortering
Met deze snelheid van ontwikkelingen voorzie ik wel dat er over 10 jaar een abbonementsvorm uitgebracht wordt, bijvoorbeeld NetflixGPT waarmee ze de AI-chips op hun serverpark kunnen bekostigen. En dan zeg je tegen Alexa dat je een romantische komedie van 50 minuten met bepaalde acteurs wilt zien, dan gaat NetflixGPT een film genereren voor je, en kun je achterover leunen.
Hoewel de techniek dat misschien toestaat denk ik dat dit juridisch niet mogelijk gaat zijn, ivm met portretrechten, auteursrechten etc
De rechten kunnen gekocht worden natuurlijk.
En intussen is al vaak genoeg bewezen dat fictieve karakters erg populair kunnen worden.

Ik zie bijvoorbeeld voor me dat Netflix een serie maakt met fictieve karakters, en dat je na het zien van de serie je eigen afleveringen kan genereren op basis van die karakters. De karakters hebben dan bepaalde eigenschappen (net zoals een RPG) die bepalen hoe ze reageren op de scenario's die je als gebruiker schrijft. Zou best interessant kunnen zijn.
Denk dat dat nog wel tegen gaat vallen. YouTube zal ongetwijfeld volgestampt worden met AI animatie voor peuters, maar waarom zou je je eigen soap of sf aflevering willen maken? Je gaat toch ook niet naar een restaurant om daar zelf je eten te bereiden? Daarnaast neemt de complexiteit enorm toe wanneer er niet alleen geloofwaardige beweging moet zijn, maar ook een consistent verhaal en goed acteren.

Het is net zoiets als na een geslaagde maanlanding denken dat je ook wel even naar Proxima Centauri kan en terug.
Het gaat sneller dan je denkt. Er zijn al levensechte AI influencers met honderdduizenden volgers, opgezet door commerciële bedrijven om voor geld producten van derden aan te prijzen. Waarvan het publiek dus eerst niet wist dat het geen echte mensen waren.
In hoeverre zo'n account zelfstandig opereert of beheert wordt door een echter persoon is niet zo duidelijk. Een AI die volkomen geautomatiseerd content maakt en reageert lijkt me niet erg waarschijnlijk.
maar waarom zou je je eigen soap of sf aflevering willen maken?
Ik denk dat dit met de creatieve geest van de mens te maken heeft. Waarom maken mensen films (voor anderen), waarom schrijven mensen boeken, waarom maken mensen schilderijen en zo kan ik nog heel lang doorgaan. Je wilt bijvoorbeeld een film die anders eindigt dan de films die je normaal ziet.
En als je zo'n film kan maken, dan laat je die ook aan je omgeving zien en misschien kun je er een commercieel succes van maken.
@Atomsk
Ik zou anders graag naar een restaurant gaan hoor, waar ik bepaalde opties geef, en 1 of ander star trek machine bereid de perfecte maaltijd voor mij
Zijn de meeste personages in fictie niet fictief? Sinds Homer is het inderdaad al miljoenen keer bewezen dat fictieve personages populair kunnen worden.
Het probleem is dat dit soort AI eigenlijk niks “zelf” bedenkt.
Het gebruikt data van andermans foto’s,video’s text etc om daarna een soort remix ervan te maken.
Dus ik denk dat er juridisch wel een groot obstakel kan vormen voor commerciële AI.
En volgens mij zijn veel landen er ook mee eens dat AI geen auteursrechten kan krijgen over de content die het “creëert”.
Is dat niet wat wij mensen ook doen? Kan jij iets bedenken zonder je referentiekader aan te spreken? Misschien zijn creatieve mensen beter in het remixen van de werkelijkheid dan anderen. Mensen kunnen dit wel doelmatiger dan ai denk ik. Aan de andere kant hangt dat ook van je prompt af.
Maar de beste LLM heeft qua parameters maar slechts zo’n 1% van de brein kracht van de mens 🧠. Is dus ook niet zo gek dat het nog niet in alles beter is als je maar slechts 1% brein kracht kunt gebruiken.

[Reactie gewijzigd door Minimise op 22 juli 2024 16:45]

Het is geen goede vergelijking, we weten niet zo goed hoe menselijke neuronen werken. In elk geval draaien onze hersenen geen stochastic gradient descent om te leren. Die modellen verbruiken enorm veel meer energie, terwijl ze kleiner zijn en wel gemaakt op veel meer trainingsdata dan een mens ooit zou kunnen verwerken. Het is gewoon totaal niet relevant om dergelijke vergelijkingen te maken.

Binnen de AI weten we wel hoe je modellen maakt en evalueert op generalisatie. In het geval van commerciële modellen is zowel het model als de trainingsdata echter niet beschikbaar voor anderen, dus kan er ook niet geverifieerd worden tot op welke hoogte zo'n model correct generaliseert of gewoon een kleine variatie van trainingsdata aan het uitspugen is.
Bij benadering wordt deze vergelijking altijd gemaakt met de hoeveelheid connecties in het menselijke brein wat betreft Artificial Super Intelligence. Waarbij men verwacht dat het beter is om meer connecties te hebben dan een mens om ASI capaciteiten te unlocken! Het verbruikt meer stroom omdat silicon transistor zoveel stroom vreten!
Het maakt altijd kleine variaties van de training data, als je 10000 CPU uren het testen heb besteed, dan had je dat makkelijk kunnen zien!

[Reactie gewijzigd door Minimise op 22 juli 2024 16:45]

Dat klinkt leuk, maar er is dus geen enkele reden om te denken dat als we nog 100x meer parameters gebruiken en voldoende data erin stoppen dat die modellen dan ineens magisch veel beter worden. Uiteraard zal het in totaliteit accurater zijn, maar het is niet zo dat het ineens dingen zal kunnen die het nu niet kan, zoals redeneren of rekenen.

De meest gebruikte term is overigens Artificial General Intelligence (AGI) in plaats van ASI.

Computers doen al sinds het begin dingen die een mens niet zou kunnen en we hebben in elk geval al sinds de jaren 90 AI-modellen die dingen doen die een mens nooit zou kunnen evenaren, zoals de 'meest relevante' web content zoeken. In die zin hebben we allang super-intelligence bereikt. Het is alleen niet algemeen en dat zal het ook niet binnen afzienbare tijd worden.
AGI is een computer brein gelijk aan het menselijk brein op vrijwel alle brein taken. ASI is het menselijk brein voorbijstreven op vrijwel alle brein taken. Zoeken alleen is slechts een sub taak en leidt niet tot generalisatie van kunstmatige intelligentie om menselijke intelligentie voorbij te streven. En dat meer parameters leiden tot magisch betere eigenschappen voor bijvoorbeeld humor en sarcasme detectie was al lang bekend!

[Reactie gewijzigd door Minimise op 22 juli 2024 16:45]

Computers hebben geen brein, maar chips. Mijn punt is dat AI al tientallen jaren op specifieke taken beter is dan mensen en we vinden steeds meer taken/processen waarbij dat lukt. Een generieke AI is niet in zicht dus praten over ASI is prima, maar het is goed om je te realiseren dat je dan aan het fantaseren bent.

Neem bijvoorbeeld zelfrijdende auto's. Dat is toch ineens veel moeilijker gebleken dan gedacht. Een auto die zelfstandig rijdt op onze huidige straten in ons huidig verkeer is ook niet in zicht. Het staat op geen enkele roadmap, want niemand die daar aan werkt acht dat realistisch. Daar heb je toch ook geen AGI voor nodig om dat voor elkaar te krijgen, maar het probleem is dat verkeerssituaties modelleren en daar dan acuut beslissingen in nemen nog verre van lukt. Je hoeft geen supermens te zijn om veilig auto te kunnen rijden. Er zit dus duidelijk nog wel een extreem gat tussen menselijk leren en AI modellen. Ze zijn echter ook gewoon niet hetzelfde, het heeft meer zin bezig te zijn met hoe we AI wel nuttig kunnen inzetten, vooral complementair aan onze capaciteiten.
Technologische singulariteit wordt ook pas rond 2045 verwacht. Dus nog 2 decennia om te investeren. Ik zou 100X ook niet zo makkelijk onderschatten, aangezien GPT-4 op veel universiteitsexamens nu al automatisch een 5.5 en bij uitzondering een 9 kan halen, bij 100X mag jij bij de meeste examens overal zo rond een 9 verwachten.

[Reactie gewijzigd door Minimise op 22 juli 2024 16:45]

Nee LLMs kunnen niet echt een examen maken. Ze kunnen niet eens een lijst woorden correct sorteren of een som maken.

Ze kunnen plausibele tekst genereren die gelijkaardig is aan teksten waarop het getraind is, inclusief de examenvragen die ook in de trainingsdata zaten. Dat maakt je niet intelligent.

In zekere zin weten ze nu al meer dan welk mens dan ook, maar dan wel alles bezien door een wazige bril. Ze doorgronden helemaal niets.
Veel beter kunnen doen alsof ze het kunnen doorgronden komt ook wel magisch er bij met biljoenen extra parameters, net zoals die humor detectie en sarcasme detectie die er magisch bijkwamen met extra parameters, dus dan zullen 100X zoveel mensen denken dat ze zelfbewust zijn zoals die Google ingenieur die zelf dacht dat het veel stommere Google model Lambda dat nog vele malen dommer was dan GPT-3 zelfbewust zou zijn!
Maar denk je niet dat de ontwikkeling van zelfrijdende autos nu ook een enorme ontwikkeling gaat door maken, hand in hand met ai?
De vooruitgang die geboekt is rond zelfrijdende auto’s kwam al van AI, namelijk de modellen voor computervisie die rond 2015 een sprong van behoorlijk slecht naar (in de meeste gevallen) superhuman hebben gemaakt. Dat kwam door de ImageNet competitie, georganiseerd onder andere door Fei-Fei Li van Stanford (zij heeft daar recent een persoonlijk boek over gepubliceerd). Dat succes is breder getrokken en we kunnen nu sensorinformatie als nooit tevoren modelleren en analyseren. Deze ontwikkeling heeft ook de nieuwe golf vooruitgang in generatieve AI teweeg gebracht.

Wat we niet goed hebben ingeschat destijds is dat beslissingen nemen in dergelijke contexten heel moeilijk is. Je kunt dus de scene om je heen correct analyseren (dat kunnen systemen nu beter en consistenter dan wij dat kunnen) en toch niet veilig een auto kunnen besturen. Wat er dan precies ontbreekt is denk ik onbekend, een stuk intuïtie, voorspelbaarheid van wat er kan en hoe andere bestuurders zich kunnen gedragen, hoe jij je hoort te gedragen, etc.

Beslissingen nemen in beperktere contexten zoals spellen (schaken, Go) is blijkbaar toch wel behoorlijk veel makkelijker. Dat is echter ook een risicoloze setting, niemand wordt in gevaar gebracht als de AI toch een domme beslissing neemt. Het ontwikkelen van iets dat je in de praktijk kunt brengen (zoals AlphaGo) is dan ook makkelijker. Je kunt een auto niet in het wild laten leren, dat moet al goed zijn voor je start.
Eigenlijk mist er ook nog een stuk marketing! Tesla Full Self Driving kan ook 5-sterren Uber chauffeurs nadoen, net zoals ChatGPT Pulitzer winnende schrijvers na kan doen. Beiden AI teams bij Tesla en OpenAI werden onder andere geleid door Andrej Karpathy.

Daarnaast mist het vooral de rand gevallen met veel voetgangers, slecht weer, verkeersafsluitingen, rare verkeersregelaars , etcetera.

[Reactie gewijzigd door Minimise op 22 juli 2024 16:45]

Nee dat is dus allebei echt totaal niet waar. Dat jij dat denkt is omdat er teveel marketing is.
Haha, dat is wel heel negatief, hè?
En lekker beknopt ;)

[Reactie gewijzigd door Jefrey Lijffijt op 22 juli 2024 16:45]

En natuurlijk volstrekt niet onderbouwd en uit je duim gezogen 😜
Wikipedia is gedateerd, maar ook daar vermelden mensen de level 5 voor de FSD Beta v12.1.2

GAIA en andere benchmarks zijn te simpel voor complexere programmeertaken, zoals het bouwen van een nieuw besturingssysteem vanaf 0 en niet alleen maar taken zoals een python scriptje van 10 regels code van GitHub en Stackoverflow kopiëren.
Ik heb geen idee van die update, maar hier schrijven ze dat het nog niet eens Level 3 gaat zijn, gewoon Level 2+ zoals het al is.

Ik snap je reactie op de GAIA benchmark niet. Daar scoren huidige LLMs al heel slecht op. Hierboven schreef je nog dat ChatGPT een boek zou kunnen schrijven, nu zeg je dat een test waarop GPT4 al slecht scoort zelfs nog onvoldoende gaat zijn om te beoordelen of het complexere taken zou kunnen uitvoeren. Dat kan toch moeilijk beide waar zijn?
Ja, dat zijn allemaal leuke onderdelen van #MisinformationWar

Ja, FSD Bèta kan steeds meer elementen van rijgedrag na doen zoals het ontwijken van sommige geparkeerde autos, maar nog steeds te vaak tot stilstand komen.

Ja, GPT-4 kan gewoon een boek schrijven met zinnen die parodieën zijn van prijswinnende schrijvers. Ik heb dit zelf meerdere malen geprobeerd en op Amazon als ebook gepubliceerd, omdat Amazon ebook review niet zoveel let op kleine inconsistenties. Maar GPT-4 levert teveel inconsistenties op bij compilers voor het schrijven van een besturingssysteem, omdat die in tegenstelling tot de Amazon ebook reviewers wel heel gevoelig zijn wat betreft inconsistenties.
Ja dat is precies wat wij ook doen. Het grootste verschil is dat de 'vorm van het model' van onze hersenen (middels ons DNA) al gealigneerd is met de realiteit. We kunnen daardoor tijdens ons leven veel efficiënter leren. We leren als mensheid dus ook over de generaties heen, middels evolutie.

Machine learning modellen leren ook over generaties heen, doordat we daar onderzoek naar doen. Transformers (de 'T' in ChatGPT) zijn maar een idee voor een model en waarschijnlijk zijn er nog wel veel betere modellen te bedenken, die de patronen achter de trainingsdata beter kunnen herkennen en daarmee een betere omschrijving van de werkelijkheid kunnen geven.

Creativiteit is dan nog een ander interessant punt met meerdere betekenissen. Het schrijven van een wetenschappelijke tekst is een creatief proces, net als het schrijven van fictie. Hoe dicht je bij de werkelijkheid moet blijven verschilt wel.
Toch zijn er volledig nieuwe muziekstijlen, kunststijlen etc bedacht door mensen. En dat is iets wat AI vooralsnog niet kan. Iets nieuws bedenken met een gedachte daarachter. Iets als blikvoorbeeld het kubisme, happy hardcore etc.

Dat is een remix met iets nieuws toegevoegd. Dat nieuw toevoegen, dat kan AI niet. Tenminste niet met een intentie.

Die schildpad maakt bewegingen die een normale schildpad nooit zal maken met zijn hoofd. Maar dat is een gebrek aan training van het model. Daar zit geen intentie aan van iets speciaals maken.
AI zelf zou dat ook wel kunnen, maar de nuttigheid ervan weegt nog niet op tegen de gigantische hoeveelheid rekenkracht die daar voor nodig is. Pre-training, remixen, sparse attention, enzovoorts zijn slechts vereenvoudigingen om sneller een antwoord te krijgen uit het LLM

[Reactie gewijzigd door Minimise op 22 juli 2024 16:45]

Ofwel precies zoals mensen dus ook doen. Maar ik geloof zeker wel dat AI dadelijk fotorealistische video's kan maken zonder direct bestaande content te gebruiken.
Daar is een aflevering van Black Mirror van in het laatste seizoen.
Tot je een typfout maakt en opeens Tom Hollander als Spider-Man hebt in plaats van Tom Holland.
Bekijk zeker aflevering 1 van seizoen 6 van Black Mirror even! Staat op Netflix. Raakt heel veel wat je hier beschrijft en de weg die het kan inslaan als AI de vrije hand krijgt in series die je kijkt.
Joan is Awful, een Black Mirror aflevering met precies dit scenario.

Aanrader!
Nog even los van de juridishe en ethische vragen over b.v. copyright over de data waar het model mee is getrained en portretrecht:

De stroom en hardware kosten zullen veel te hoog blijven over deze tijdspanne.
10 jaar zal niet genoeg zijn om dit op een niveau te brengen waarbij dit in abonnementsvorm "on demand" zal kunnen. Dan moet het echt voor b.v. minder dan 10ct per uur aan content kunnen.

In het "beste" geval kunnen filmstudios dit gaan doen.
Het probleem met alle creatieve AI is dat je eruit krijgt wat je erin stopt. Dit is bij mensen ook zo, maar wat je erin stopt is de individuele levenservaringen van elke creator en de AI is getraind op het internet, dat voor iedereen hetzelfde is. Dan krijg je wat je nu al ziet met Midjourney en Dall-E: een sterke neiging om steeds hetzelfde soort content te genereren, die je actief moet bestrijden als je iets anders wil. Ofwel aanvaard je een amalgaam van populaire cultuur ofwel moet je je eigen visie tot in de fijnste details beschrijven en hopen dat de AI ook luistert.

Zelf ben ik tegen deze muur aangelopen toen ik icons voor karakters in een indie game probeerde te genereren. De AI is getraind op fantasy tropes en het was moeilijk of onmogelijk om het ding deze uit het hoofd te praten.

Uiteindelijk kom je er wel na heel wat prompten, maar bij films kun je geen 20 prompts lanceren om te itereren op het resultaat. Het moet er van de eerste keer boenk op zijn, en ik vraag me af of de huidige AI's hiertoe in staat zijn.

Ik ben alleszins niet geïnteresseerd in muziek-AI's behalve dan voor muzak die er niet toe doet. De twee bands die ik volg, hebben allebei hun genre uitgevonden en dit is voor mij meer waard dan "genereer me eens 2 uur aan popmuziek in de stijl van Taylor Swift met lyrics waarin ze verliefd is op Trump".
Als content creator (cinematografie en fotografie) doen dit soort innovaties altijd pijn in mijn hard. Elk creatief proces wordt zo langzamerhand gereduceerd tot een nikszeggende fastfood burger zonder ziel. Maar, ik begrijp ook dat het niet tegen te houden is. Een wereld waarin straks het meeste fake is, je zou er maar in leven.
Ik begrijp jouw bedenking en ga er tot op zekere hoogte in mee, maar anderzijds werd ook de opkomst van fotografie en film met het nodige argwaan bekeken (om eerlijk te zijn, kies ik doelbewust deze sectoren op basis van het profiel dat je hier beschrijft). Er zijn bv veel animatiefilms die wat mij betreft voldoen aan het label "fastfood zonder ziel", maar anderzijds zijn er ook pareltjes die je raken tot in het diepst van je ziel.
Uiteraard gaat de analogie ook op voor boeken, strips, foto's, toneel, dans, ...
We zullen het maar beschouwen als weer wat voer voor genuanceerd denken ;)
Je kan het ook zien als dat je juist veel creatiever wordt. Je moet wel vertellen wat er gemaakt moet worden. Het wordt eenvoudiger om wat je voor ogen hebt te maken. En elke film is nu toch een verhaal gespeeld door acteurs en dus 'fake'
Uitstekend punt, alhoewel ik hem op een net andere manier zie. Het is competitie. Makkelijk te verslaan ook, als je goed bent in wat je doet. Competitie is een motivator.

Het zou zomaar kunnen dat dankzij dit fenomeen mensen weer gaan leren wat echt "mooi" is.

[Reactie gewijzigd door gimbal op 22 juli 2024 16:45]

Anoniem: 91634 @honey26 januari 2024 00:37
Zelf heb ik dat met digitale fotografie waarbij het de standaard is de foto's zover te bewerken tot dat de ziel er uit is.
En bij muziek dankzij autotuning.

Dit heeft voor mij ook er tot toe geleid dat ik weinig moeite hebt met ai content gezien in mijn ogen allemaal net zo kunstmatige is als over bewerkte foto's en muziek waarbij autotune is gebruikt.

[Reactie gewijzigd door Anoniem: 91634 op 22 juli 2024 16:45]

Dat is natuurlijk als je AI zonder ziel ziet. Maar wie zegt dat AI over 20 jaar geen eigen zelfbewustzijn en creativiteit heeft?
Dus ga je nog 20 jaar zielloze mass-generated content kijken? Leuk zeg.

Nu zit AI nog in de 'ik kan jou hier mee helpen fase'. Maar het grote geld zit hem in het uurloon van mensen uitsparen. En ga jij dan nog gelukkig zijn, als je eigen input nergens meer nodig is?

Je job zal waarschijnlijk verdwijnen, al je entertainment is machine generated, je haalt bijna nergens nog plezier uit want je kan niks meer zonder dat een AI het voorgekauwd heeft. Wat een leuke toekomst, ik kijk er echt naar uit :+

Als dit zo doorgaat ga ik mooi een beroep leren waar ik voldoening uithaal en wat niet dadelijk vervangen zal worden door iets zielloos. Stukadoor of zo.

En ik weet dat dit ubernegatief klinkt, en dat velen denken dat automatisatie niks nieuws is. Alleen is de adoptiesnelheid wel een paar duizend keer hoger met AI dan bijvoorbeeld de industriële revolutie. En het is veel moeilijker om mensen fysiek te vervangen (door een robot à la Tesla of Amazon) dan ze digitaal te vervangen.

Anders gezegd: een arbeidermaatschappij vervangen gaat niet zomaar, een dienstenmaatschappij zoals BE / NL is relatief gemakkelijk. De snelheid van digitale informatie is zo groot dat bepaalde jobs nu al bedreigd zijn (scenaristen, schrijvers, content proofers, etc). Je hebt geen glazen bol nodig om te weten dat alle digitale jobs weldra heel schaars, al dan niet overbodig worden.

[Reactie gewijzigd door humpus op 22 juli 2024 16:45]

Of die ziel nu AI is of één of andere mens die ik niet ken... wat maakt dat uit.
Als ik een serie of film kijk is dat geschreven/gemaakt door iemand ja. Of dit een echte mens is of AI is... dat maakt mij niks uit toch? Het zit enkel in uw hoofd moest het wel iets uitmaken.

Maar goed, dat is bij veel dingen zo... Of mijn kleren gemaakt zijn door kinderen in bangladesh of door goed betaalde arbeiders in europa. Dat voel ik merk ik ook niet.
Enkel het geweten zal er anders bij varen.
Ik snap precies wat je bedoeld en vooral waar nog de creativiteit dan blijft en ook video dan een grote eenheidsworst gaat worden.
Dat dachten we ook toen de computer kwam. En de digitale camera.
Ja maar dat is het punt... het heeft geen ziel. En die ziel is nu net waar mensen naar op zoek zijn. Tenminste... mensen die je serieus wil nemen. De rest was toch al nooit je bewuste doelgroep, dat zijn meer drive by viewers die afhaken bij de eerste reclame.

Ik zie hetzelfde in de wereld van kunst. Mensen die blij worden van "kunst" gemaakt door een software algoritme... waren toch al niet de mensen die bereid zijn om 200, 500, 1000, etc. euro te lappen voor echte kunst. Het waren nooit je klanten, je hoeft ook niet te vrezen dat je die kwijtraakt. De echte klanten zijn op zoek naar de ziel die jij in je werk aan kunt brengen.
Check de aflevering 'Joan Is Awful' (Black Mirror, seizoen 6, aflevering 1) met Salma Hayek. Sluit hier naadloos op aan.

[Reactie gewijzigd door Hoofmark op 22 juli 2024 16:45]

Sterker nog, kijk alles als je de serie niet kent. Geniaal.
Daar moest ik ook gelijk aan denken. Het is eng hoe dichtbij een aantal van de black mirror afleveringen bij de werkelijkheid zijn gekomen.
Als de wet van Moore hier ook van toepassing is, dan wordt de volgende stap erg groot!
Valt nog wel mee toch, volgend jaar is maar x2 van nu, dat jaar daar op is het x4 van nu, over 8 jaar zit je op x256 van nu :+
En over 8 jaar 256x z'n grootte stap als nu :+

Riemen vast!

[Reactie gewijzigd door watercoolertje op 22 juli 2024 16:45]

Over 10 jaar je persoonlijke holodek.

Hé Google, maak even een verhaal met blauwe konijnen op planeet Zilog. (Kijken of er dan ook Z80 chips in voorkomen 🤓 )
Dat samen met de nieuwe vloer van Disney en klaar!
https://www.youtube.com/watch?v=m3Sh6mu4zbs
De open vraag blijft toch wel hoeveel creativiteit er daadwerkelijk in zit. Als je bijvoorbeeld vraagt naar een schilderij van een nacht met sterren, en het komt gewoon met Van Gogh aanzetten dan is dat gewoon een suffe uitkomst.

De ambitie van machine learning en AI is om daadwerkelijk modellen te bouwen die de werkelijkheid vatten. Dat is niet hetzelfde als bestaande dingen kunnen mixen. Dat is ook heel cool, maar qua inzetbaarheid toch wel enigszins beperkt en het levert direct vragen op in welke mate je plagiaat aan het plegen bent, zeker als de modellen zelf geen idee hebben hoe dicht hun output bij trainingsvoorbeelden in de buurt zit.
ik denk dat je inschatting van wat er nu al mogelijk is met content-generators een zware onderschatting is. Het stukje learning is al verder dan "wat moet ik maken om als correct te worden geïnterpretteerd", maar dat we nu zelfs al zitten aan "wat is een aangenaam resultaat" en weldra komen aan "is dit het niveau van een professional", maar dan wel aan een veel hogere snelheid. De volgende stap is dan het in vraag stellen of we hiervoor nog wel mensen nodig hebben. Diezelfde laatste vraag is er een die al in het begin van de industriële revolutie gesteld werd en zie hoe ver we 200 jaar later al zijn.
Wellicht komt mijn commentaar te kritisch over.

Voor programmeren zijn we al 15 a 20 jaar op zoek naar manieren om code te delen, want de meeste functies zijn al talloze keren opnieuw geprogrammeerd. Dat een LLM dat oplost was te verwachten, en echt fantastisch natuurlijk. Daarbij is repetitie en een stukje style transfer dus genoeg. In de meeste gevallen is code generiek, er zijn talloze mensen die dat hetzelfde kunnen produceren en het is vermoedelijk vooral getraind op open source code die onder een vrije licentie beschikbaar is gemaakt (MIT ofzo). Dus meestal wordt daar (in de context van LLMs) niet over auteursrechtenschending nagedacht.

Voor teksten die iets beschrijven, bijvoorbeeld copy voor de omschrijving van een product, ben je ook niet op zoek naar creativiteit. Gewoon een variatie/mix van zaken die al eerder geschreven zijn is prima. Ons vocabulaire is super klein in vergelijking met hoeveel tekst er op het web staat, dus voor zoiets zijn er ook maar zoveel mogelijkheden. Idem wellicht voor plaatjes op je powerpoint slides, die zijn gewoon voor opsmuk en vertellen niet an sich het verhaal. In zo'n context ook prima als je iemand zijn stijl steelt, zoals een eigen tekening of foto, maar dan als Van Gogh.

Anders is dat toch wel als je denkt daadwerkelijk iets creatiefs moet brengen dat op zichzelf een product is. Bijvoorbeeld een stuk tekst in een wetenschappelijk artikel of een roman. Totaal onacceptabel als dat gewoon geïmiteerd is van een bestaande tekst. Dat moet geproduceerd vanuit een echt begrip van de werkelijkheid, gecombineerd met de expressie middels taal. Het tweede kunnen huidige LLMs zeer goed, wellicht beter dan welk mens dan ook, maar het eerste is een open vraag.

Het is voor mij (als iemand die al een hele tijd met de fundamenten van machine learning bezig is) wel duidelijk dat het grote publiek de capaciteiten juist heel sterk overschat, door een reeks factoren. We zien copywriters al ontslagen worden, waarbij hun werk door een AI vervangen wordt. Dat zijn echt armzalige teksten kan ik je garanderen. Het enige valide excuus is dat het misschien in die context te weinig uit maakt wat de kwaliteit en het niveau creativiteit is.
hoezo kan een LLM wetenschappelijke artikels schrijven? Totaal niet... LLM is zeer goed in onzin vertellen en het geloofwaardig laten overkomen. Wetenschappelijk zijn ze niks waard.
Het wordt nu al actief ingezet om stukken van wetenschappelijke artikels te schrijven en zelfs onderzoeksvoorstellen.

Niet door mij, even voor de duidelijkheid. Maar ik hoor daar echt enthousiaste verhalen over van collega’s. Dat gaat verder dan de grammatica en spelling verbeteren.
Je hebt het over een heleboel verschillende dingen. Een zinnige, samenhangende tekst is nog iets compleet anders dan een mooi beeld. De analyse van wat aantrekkelijk is, heeft een algoritme al redelijk goed door, misschien omdat het intellectueel gezien relatief weinig voorstelt en meer aansluit bij onze oerinstincten die we delen met andere dieren.
Ik snap wat je bedoelt, die plaatjes zijn zeker appealing. Ik bedoelde in de eerste plaats dat ze wellicht toch vaak heel dicht bij bestaande beelden blijven die dat ook zijn. Om een andere invulling te geven aan Starry Night dan Van Gogh moet je begrip van die term hebben, wat het visueel inhoudt. Daar heb ik mijn twijfels bij. Het hangt er ook heel erg vanaf wat je wil en waarvoor je het wil gebruiken, vandaar dat ik juist heel verschillende soorten contentgeneratie aandroeg. Specifiek op pixelniveau beelden aantrekkelijk maken of zelfs realistischer kan al heel goed inderdaad.
je moet eens kijken op youtube waar volledige tutorials staan hoe je een instagram-model kan maken en daarvoor kan je gewoon een random-character-generator gebruiken die je dan wat tweakt tot je iets krijgt wat je leuk vindt en daarmee kan je dan oneindig veel foto's en filmpjes van genereren. De beroemste is wellicht Aitana López, maar niemand die weet hoeveel er nog zijn.
Wat voor garantie heb je dat deze artificiële persoon niet heel erg op een echt persoon lijkt?
Met de hoeveelheid mensen dat er in de wereld rondlopen kan ik je quasi garanderen dat er wel iemand op zal lijken. Wat jij impliceert is dat het nog altijd een getweakte kopie is van een echte mens, terwijl dat helemaal niet meer nodig is en voor de eigenaar ervan net een risico is dat het niet waard is om te nemen. De menselijke vorm is dusdanig bekend dat je vanaf een simpele rudimentaire basisvorm vertrekt en élke eigenschap tot in het kleinste detail kan tweaken tot op de porie nauwkeurig. Wat er nu gedaan wordt is gewoon de poses en achtergronden randomisen en er wat accessoires bij creëren op vraag van de adverteerders.
De ambitie van machine learning en AI is om daadwerkelijk modellen te bouwen die de werkelijkheid vatten. Dat is niet hetzelfde als bestaande dingen kunnen mixen.
Bestaande dingen mixen kan al; de AI hoeft geen voorbeeld te hebben van een skatende teddybeer om een afbeelding van een skatende teddybeer te maken. Het moet daartoe alleen zijn getrained op skaten en teddyberen.
Inderdaad, mixen kan het wel. Maar kan het ook een nieuwe teddybeer verzinnen? En zal het weten waar voor ons de grens ligt of iets als teddybeer beschreven zou worden? Zal het ook weten of die nieuw is of een kopie van wat het gezien heeft?
Het is niet ontworpen om nieuwe dingen te verzinnen en ook niet om überhaupt iets te weten, maar de resultaten van het mixen kunnen er voor mensen wel nieuw uitzien.
Het kan zeker op basis van een input prompt die iets nieuws bevat een passend resultaat geven, bvb een teddybeer met groen-wit geblokte neus.
Dit vind ik dus typisch weer voorbeelden van nutteloos gebruik van AI en zelfs eerder gevaarlijke ontwikkelingen. Stel iemand pikt je foto van internet en maakt hier een AI gegenereerd filmpje van dat je ergens iets zogenaamd pikt in een winkel. Hij/zij gaat vervolgens naar politie en laat dat filmpje zien, dan sta je wel even mooi voor schut.

Daarnaast word ook alle werk van echte creators hiermee totaal teniet gedaan en kan je als enthousiaste creator je boeltje pakken.
daar heb je geen AI voor nodig, dat kan nu ook al...
Het is niet omdat je iets kan misbruiken dat het daarom een slechte ontwikkeling is
Zeker kan een handige videocreator dit ook maar via AI kan dit veel sneller en is het voor veel meer mensen bereikbaar. En ja het hoeft geen slechte ontwikkeling te zijn maar je weet eigenlijk al op voorhand dat er misbruik van gemaakt gaat worden.
Het wordt met de dag erger.
Wie gaat er nog echt van vals kunnen onderscheiden als nu ook “bewegende beelden” maakbaar zijn op simpel verzoek.
De manipulatie van de massa wordt met de dag erger en als je dan bedenkt wat maar nodig was om WO1 te starten of een inval in Irak om een paar wazige foto’s van “weapons of mass destruction” :'(

[Reactie gewijzigd door klakkie.57th op 22 juli 2024 16:45]

Google liet 7 jaar geleden ook zien dat je telefoon voor je de kapper ging bellen en een afspraak voor je inplannen. Ik heb daar nooit iemand meer over gehoord. Als ze iets als werkend product kunnen verkopen dan zullen ze dat doen, deze tool van het artikel gaat daarom nooit door hen voor een eindgebruiker ontwikkeld worden schat ik

Bedankt voor de correcties! Ik wist niet dat het bestaat en werkt, dit is zeker interessant en geeft mij extra vertrouwen in het opvolgen van door Google getoonde interessante technologieën

[Reactie gewijzigd door OLED op 22 juli 2024 16:45]

Dat bestaat wel degelijk, maar enkel beschikbaar in een beperkte lijst van landen Amerika onder de naam Google Duplex.

Hier kan je de support pagina vinden met de functionaliteiten:
https://support.google.com/business/answer/7690269

*edit* aangepast na comment

[Reactie gewijzigd door manmad op 22 juli 2024 16:45]

Dat kan zeker wel met Google Assistant, maar is vooralsnog beperkt tot Engels en alleen in de VS.

https://support.google.com/assistant/answer/13370665
Dus omdat ze ooit iets hebben aangekondigd wat ze niet meer actief gebruiken, heb je hier geen vertrouwen in?
Bizar hoe snel deze ontwikkelingen gaan. Kan me geen voorstelling maken hoe dit over tien of twintig jaar zal zijn. Waarschijnlijk voer je dan een filmscript in en rolt er in realtime een film uit.
Gewoon een paar steekwoorden. Film op basis van categorie X, duur van 120 minuten met een goede afloop, geschikt voor 12+.

Vraag ik mij meteen af, hebben streamingsdiensten dan nog bestaansrecht.
Absoluut.
Je gaat geen film kijken als je het verhaal kent (of hebt moeten vertellen).
Je kijkt een film om verrast te worden.
Anoniem: 454358 @Bender25 januari 2024 20:13
Och ik kijk anders genoeg films of series die ik al tig keer heb gezien.
Maar idd een zelfgefabriceerd filmpje zal weinig uitnodigend zijn lijkt me
Je kunt ook vragen om een verrassend einde. Heb zojuist even aan Bard gevraagd om me te verrassen. Hij kwam o.a. met een verrassend feitje, een verrassende gedachte en heeft zelfs een verrassend gedicht geschreven :)

Kwaliteit is het nog net niet maar zo kun je vast ook wel een film laten genereren.
bwa, op sommige sites kijk ik filmpjes waar ik het einde maar al te goed ken :-)
Vraag me af wat ik dan te zien zou krijgen als ik een verrassing wil op het einde... Liever niet eigenlijk :p
Ik denk dat een script invoeren niet eens nodig is. Wellicht over een paar jaar wat steekwoorden invoeren, en er rolt een film uit. Over een jaar of 20 misschien wel gedachtelezen en het maakt complete speelfilms. Moet je geen perverse gedachten hebben.
Doe maar wel perverse gedachten eigenlijk, misschien dat het dan de "film" nog ietwat interessant maakt.
Aangezien het tegen die tijd nog steeds Amerikaanse streamingsdiensten zijn maak ik me daar geen illusies over. Dat wordt er “netjes” uit gefilterd of anderszins onmogelijk gemaakt om te genereren…
Persoonlijk denk ik eerder dat je dit als een tool moet zien voor makers, niet zo zeer een tool die alles zelf doet. Een beetje hoe we van originele matte painting zijn gegaan naar volledige VFX. Dat wordt met dit soort tools nog makkelijker gemaakt.

Het daadwerkelijk regisseren naar een goed geheel, dat lijkt me toch iets waar nog steeds mensen zelf bij aan te pas moeten komen. Het zal ongetwijfeld nog veel verder uitgediept worden en beter worden in kwaliteit. Maar nu zijn het vaak nog LSD-achtige korte shots die er behoorlijk 'stock' uitzien, lastig te fine-tunen ook naar wens.

Maar super gave technologie.
Mwa , waarschijnlijk zal je tegen je pc of smartphone kunnen zeggen " maak me eens een 3 uur durende Star Wars film/game theater , waar de New Kids uit Neerkantje Darth Vader Verslaan " , en de AI het binnen 2 minuten klaar heeft.

Of je het alle boeken uit het Dune universum geeft, en vraagt " maak me er een tv serie van "

Want zodra Hollywood het kan om via AI films te maken .. zullen Smartphone makers het zeker ook wel kunnen .

Geen Hollywoke meer nodig :Y) als je het er niet mee eens bent , maak je je eigen film gewoon !

[Reactie gewijzigd door Metallize op 22 juli 2024 16:45]

What a time to be alive
Dat denk ik ook, of denk aan een boekverfilming. Daar zal zeker de nodige problematiek uit voortvloeien voor filmmakers.
Dat ligt aan het script. Garbage In, Garbage Out :)
Dat ligt toch echt een de videos die je dan zelf kijkt, het aanbod op YT is zo breed dat je de inhoud van YT niet over 1 kam kan scheren.

Op dit item kan niet meer gereageerd worden.