Stemacteurs gaan staken na mislukte onderhandelingen gamestudio's en uitgevers

De Amerikaanse acteursvakbond SAG-Aftra gaat vanaf vrijdag staken. De vakbond voor stemacteurs in Hollywood heeft geen akkoord kunnen bereiken met verschillende gamestudio's en uitgevers, waaronder Electronic Arts en Ubisoft, over het gebruik van AI.

De afgelopen anderhalf jaar heeft SAG-Aftra met de studio's en uitgevers onderhandeld over de voorwaarden van het Interactive Media Agreement-contract, waarin betere arbeidsvoorwaarden en meer bescherming tegen het gebruik van AI worden vermeld, schrijft de vakbond in een persbericht. De vakbond zat om de tafel met onder andere Activision, Disney, Electronic Arts, Insomniac Games, Take 2 Productions en de gamedivisie van Warner Bros.

Hoewel de bedrijven toezeggingen hebben gedaan over onder andere betere lonen, hebben ze 'niet voldoende gegarandeerd dat ze acteurs beschermen tegen het gebruik van AI'. “De videogame-industrie genereert jaarlijks miljarden dollars aan winst. De drijvende kracht achter dat succes zijn de creatieve mensen die die games ontwerpen en maken. Dat geldt ook voor de SAG-Aftra-leden die memorabele en geliefde gamepersonages tot leven brengen. Ze verdienen en eisen dezelfde fundamentele bescherming als artiesten in film, televisie, streaming en muziek, namelijk eerlijke compensatie en het recht om toestemming te geven voor het gebruik van hun gezichten, stemmen en lichamen door AI", zegt Duncan Crabtree-Ireland, uitvoerend directeur van SAG-Aftra.

Het is nog niet duidelijk hoeveel stem- en motioncaptureacteurs precies gaan meedoen aan de staking. De vakbond heeft in het najaar van 2023 ook het werk neergelegd, nadat de leden 'bijna unaniem' voor een staking hadden gestemd.

Door Loïs Franx

Redacteur

26-07-2024 • 09:25

213

Reacties (213)

213
208
106
0
0
64

Sorteer op:

Weergave:

Damn, ik wilde dat AI banen ging overnemen zodat ik meer tijd kon spenderen aan creatieve en kunstzinnige dingen. Maar blijkbaar zijn dat juist de dingen die we door AI gaan laten doen. 8)7
Dit. AI maakt wel de muziek, films, acteert, schrijft, etc, zodat jij als pakketsorteerder aan de slag kan in de Amazon warenhuizen. Da's de wereld die waar we op het moment op aan het afstevenen zijn.

[Reactie gewijzigd door jaxxil op 26 juli 2024 10:21]

Grappig, ik dacht dat robotisering de repetitieve taken ging overnemen, zoals pakketjes sorteren in Amazon warenhuizen.
Ook dat gaat steeds meer geautomatiseerd worden. Mensen zijn hebberig, willen altijd meer, zijn snel ontevreden, worden ziek en zijn egocentrisch. Machines niet.
.
BTW, ik vind dat reageerders op Fora, ook auteursrechten hebben. Waarom alleen (stem)acteurs en auteurs. Reageerders op Fora maken ook content.
BTW, ik vind dat reageerders op Fora, ook auteursrechten hebben. Waarom alleen (stem)acteurs en auteurs. Reageerders op Fora maken ook content.
In veel gevallen staat in de algemene voorwaarden dat veel rechten naar de site gaan waar je het op plaatst. Standaard heb je inderdaad auteursrecht over wat je schrijft.
Je hebt ook die auteursrechten; fora hebben alleen een gebruikslicentie.

Dat kan ook niet anders: je bent niet in dienst en je hebt je auteursrecht op een reactie niet schriftelijk overgedragen.
Mensen die hebberig zijn en altijd meer willen zijn juist de types die die robots willen inzetten om ons te vervangen om nog meer winst te maken...
Ze zitten al bij elke loonsverhoging of weet ik veel wat wanneer de personen die de meerwaarde via productie creëren een groter deel van de koek willen te dreigen dat ze ofwel naar een goedkoper land gaan trekken (maar gelukkig lukt dit niet altijd omdat een bedrijf/product veel meer is dan enkel loonkost en er nog genoeg andere vereisten zijn zoals infrastructuur en opleidingsniveau) of ze ons gaan vervangen door machines, laat ze maar doen zeg ik.
Het staat je vrij om zelf een onderneming te beginnen. Je kan dan zoveel mogelijk mensen aannemen en op jouw loonlijst zetten als je wilt.
Let wel. Als ondernemer ben je opeens geen mens van vlees en bloed. Politici bombarderen jou opeens als een soort van super mens met meer an 30 uur in een dag. In plaats van dat de door jouw gecreëerde werkgelegenheid wordt gewaardeerd, ziet de overheid jou nu opeens als melkkoe die je kan opzadelen met stapels bureaucratie en die kan uitmelken door middel van vennootschapsbelastingen, sociale bijdragen, loonbelastingen, zorgbijdragen en gegarandeerde inkomenverstrekker bij ziekteverzuim.
Dus als jouw werknemer met zijn dronken kop een blessure oploopt op wintersport mag jij gewoon doorbetalen.
Kom maar op. Wordt ondernemer en zeg dan nog eens wie misbruik maakt van wie.

[Reactie gewijzigd door babbeloo op 26 juli 2024 17:58]

Dat wil ik niet, laat ze maar doen, maar het mag ook een gedaan zijn met dit non-agrument te gebruiken bij enige kritiek op de bedrijven en hun hebberigheid...
Want eens je met publiek bedrijf zit ben je soms geen eigen baas van je bedrijf meer, maar een stroman van hyperrealistische aandeelhouders in verschillende vormen die er zo veel mogelijk geld moet uitpersen ten koste van alles, mensen zijn gewoon een kostenpost en pasmunt (maar zichzelf gretig opslag geven elk jaar is nooit een probleem) zolang de winst maar blijft stijgen, iets wat eigenlijk onmogelijk is, als economische genieën mag men eens een ander systeem bedenken dan oneindige groei.
Als alles, letterlijk alles, moet wijken voor (meer) geld, wat ik vrij walgelijk en compleet onethisch vind, en hebben we gefaald als maatschappij, een leven is meer dan cijfers alleen.

Je hoeft geen econoom te zijn om te zien dat kapitalisme inherent kapot is en zwaar misbruikt wordt.
In de VS is er dacht ik 300 triljoen (tot de 18de dus) van de middenklasse weggevloeid naar de 1 of 0.1%, ook dankzij die pedofiele aap van een president die nu terug massa's achterlijken achter zich heeft en het eerste waar die aan gaat zitten zijn hun centen, over misbruik gesproken.

En als je werknemer zo dom is om op wintersport, wat een luxe is voor de meeste, met zijn zatte kop ergens tegen knalt, gaat het nooit een groot licht geweest zijn, dat is even achterlijk als dronken met de auto rijden. Dus ben je niet echt een topbaas als je dat nog niet door hebt.

[Reactie gewijzigd door Wim Cossement op 27 juli 2024 11:35]

Robotisering is iets anders dan AI.
Een computer kan immers zo uit de doos geen pakketje vastpakken / optillen / etc. Daar heb je nog voor honderdduizenden euro's/dollars aan grijpertjes en transportbandjes en sensoren en en en voor nodig.

Een computer kan zo uit de doos wel een LLM AI draaien.
Tja, maar helaas blijkt dozen vinden met allerlei verschillende groottes en gewichten in een enorm gebouw een lastig te robotiseren taak. Niet volledig onmogelijk, maar wel te duur t.o.v. loonkosten. Dus daar huren we gewoon mensen voor in die dag in dag uit door dat gebouw slenteren en bestellingen bij elkaar zoeken.

Nou blijkt met generatieve AI dat content reproduceren waarvan er al een hoop vrijelijk beschikbaar is omdat mensen het tof vinden, zoals films, muziek, verhalen, tips en advies, artikelen, etc, dat dat relatief makkelijk is. Dat betekent dat er misschien wat winst te behalen valt door mensen volledig uit die velden te halen, dus is het volle kracht vooruit wat dat betreft.
Mja het blijkt gewoon dat mensen heel lastig te vervangen zijn in veel situaties. Je kunt het aantal vast wel terugdringen, maar er zal toch nog altijd iemand aanwezig moeten zijn, zo lijkt het (voor de komende paar decennia).

Het vereist grote investeringen die je heel langzaam terugverdiend. Dus daarom gebeurt het nog te weinig op de plekken waar het beter zou zijn. Daarentegen is AI voor stemacteurs weer goedkoper, dus daar ga je het eerder zien.
Haha, wat een bangmakerij ook hè. Laten we vooral hopen dat AI die pakketsorteerder kan overnemen, net als vrachtwagenchauffeurs of treinmachinisten. Banen die allang geautomatiseerd hadden moeten worden, maar vanwege conservatieve bezwaren maar niet van de grond komen. En of ook muziek, kunst of film net zo goed door AI zal worden gemaakt als mensen betwijfel ik, maar zo ja, helemaal prima. Tijd om de mens nuttiger en leefbaarder te maken en de digitalisering een keer vaart te laten maken.
Dat klinkt als een utopie; dan ben ik benieuwd waar het beloningssysteem dat we nu gebruiken naartoe gaat. De mens is een hebberig ding en grote bedrijven gaan er niet voor zorgen dat hun AI onze banen overnemen met als doel dat de gewone mens achterover kan gaan leunen. Het is nu misschien haalbaar, sure, maar daar verdienen ze niks mee. (Terwijl dat inderdaad grotendeels misschien niet meer zou hoeven).
Hoe kun je banen automatiseren als de techniek nog niet zo ver is dat de machines om dit te doen gebouwd kunnen worden?
zijn al studies met AI gemaakte muziek die met een stuk klassiek gecomposeerde muziek als winnaar uit de bus kwam op een muziek festival waarbij mensen niet wisten dat het AI gegenereerd was. AI kan dit dus nu al net zo goed, zo niet beter dan mensen.
De door de computer bewerkte en gemaakte muziek is inmiddels wijdverbreid en horen we heel veel. Mijn conclusie is dat dit zeer matig is. Het is wat dat betreft te vergelijken met orderpicken en lopende band werk. De schrijver van het algoritme schrijft voor wat een computer moet doen. Er zit net zo weinig creativiteit en schoonheid in als bijvoorbeeld orderpicken, waar je ook je eigen draai niet aan kan geven.

De volgende situatie zit er helaas niet in. Orderpicker in magazijn: Aha, klant #762091 bestelt een paar blauwe sokken maat 39-42. Weet je wat, ipv deze sokken doe ik een slagroomspuit in de doos, zodat deze klant een slagroomtaart kan bakken.

Hoe dan ook, de kunstliefhebber hoort het bij muziek direct als een computer het gemaakt of sterk bewerkt heeft en het staat hem direct tegen. Bij het schrijven van van boeken en scenarios voor films, series en games zal het niet anders zijn. Je krijgt 13-in-een-dozijnkwaliteit, want een computer denkt niet out-of-the-box en zal precies doen wat hem opgedragen wordt.

Ik ben overigens ook vrij sceptisch over de term AI, want intelligentie is veel meer dan stroompjes tussen neuronen, iets wat een computer kan simuleren. Hormonen spelen een uitgebreide rol. Hoewel, als je de nadruk op artificial oftwel kunstmatig legt, dan klopt het verhaal weer wel. Bang voor Skynet word ik er niet van ;)

De smaak van de consument, het publiek, zal het laatste woord hebben.

[Reactie gewijzigd door ABD op 26 juli 2024 11:49]

Eerlijk gezegd denk ik dat het een kwestie van tijd is totdat AI volledige series en films kan maken die het goed doen in sales. Het is niet dat de bioscopen en muziek hitlijsten nu vol staan met echt unieke en creatieve dingen.

Als voorbeeld, ben iedere film heeft wel een Romeo & Juliet achtige romance. En het overgrote deel van pop muziek is gebaseerd op 4 akkoorden
Maar wie heeft daar baat bij? Word de wereld beter als Disney 500 Marvel films per jaar kan produceren? Is dat echt waar mensen op zitten te wachten?
Ik zou het een ramp vinden. Alle mensen die deze verhalen maken tot wat ze zijn, met vakmanschap en creativiteit (ja, zelfs in de honderdste Marvel film) worden eruit gewerkt. Onze waardering voor films keldert, want we kunnen iedere dag iets nieuws kijken tot het een soort eenheidsworst word.

De enige die hier baat bij zouden hebben zijn de aandeelhouders.
Je bedoelt die films die stampvol zitten met matige CGI in plaats van echte vakmanswerk die echte sets en animatronics bouwen?
Ik geloof dat creativiteit juist weer tot bloei komt wanneer AI tools ver genoeg ontwikkeld zijn. Dan kan iedereen ongehinderd door budgets, gatekeepers of tijd zijn/haar eigen creativiteit uitleven.
De schrijver van het algoritme schrijft voor wat een computer moet doen. Er zit net zo weinig creativiteit en schoonheid in als bijvoorbeeld orderpicken, waar je ook je eigen draai niet aan kan geven.
Generatieve AI werkt niet met vastgesteld algoritmes maar probeert het volgende element (pixel, muzieknoot, woord) te voorspellen op grond van een groot model. Dat model is gevormd door trainingsdata. In het geval van muziek heeft het model zeer veel melodieën geanalyseerd en met de bijgevoegde classificaties (bijv. genre, zanger(es), associaties) wordt langzaamaan een netwerk aan parameters gevormd.
Dat model is vervolgens in staat om vanuit een beginstand te voorspellen wat het volgende element moet zijn (met enige variatie). Zo kan het op grond van de gegevens in "de prompt" de melodie en andere onderdelen opbouwen; steeds op basis van wat de trainingsdata heeft bijgedragen aan het model.
Dit is een beetje zoals wij ook leren. We horen veel muziek en bij muziek die als "Blues" wordt aangeduid hebben we gehoord dat steeds dezelfde vier akkoorden in een bepaalde volgorde gebruikt worden.Verdere metainformatie bepaalt nog duidelijker welk pad in het netwerk gevolgd kan wordenl
Bij het schrijven van van boeken en scenarios voor films, series en games zal het niet anders zijn. Je krijgt 13-in-een-dozijnkwaliteit, want een computer denkt niet out-of-the-box en zal precies doen wat hem opgedragen wordt.
Er is op sommige punten veel behoefte aan 13-in-een-dozijnkwaliteit. Doktersromannetjes worden veel gelezen, maar het is natuurlijk geen kwalistiet die "literatuur" mag heten. Bij films heb je romcoms die een zeer voorspelbaar verhaal hebben. Er zijn genoeg TV-series die volgens een strak stramien worden opgebouwd. Het verhaal is voorspelbaar en je kunt er letterlijk de klok op gelijkzetten wanneer bepaalde dingen gebeuren.
Prima materiaal om automatisch te genereen.

Op andere punten zijn ook heel nuttige toepassingen te bedenken. Het is inmiddels mogelijk om van een video de tekst te vertalen, de vertaling met een op de oorspronkelijke video lijkende stem voor te lezen en ook de video te bewerken dat de mond correct meebeweegt. Heel handig als je content produceert en dit eenvoudig beschikbaar kan stellen in meerdere talen. Voor een vertaler en presentator is dat minder leuk, maar er zijn genoeg gevallen waarin er totaal geen budget beschikbaar is om vertalers en andere presentatoren in te huren. In die gevallen gaat het niet ten koste van werkgelegenheid. Hopelijk blijft de vraag naar ambachtelije producten bestaan en kan AI een rol spelen voor de markt waarvoor ambachtelijke producten gewoon te duur zijn.
Nou....nuance is op z'n plaats. De AI gebruikt bestaande fragment van films, boeken, audio en husselt dit door elkaar. De verhalen en filmpjes zijn ronduit slecht. Want de combinaties van fragmenten dient toch echt wel een bepaalde lijn te volgen. m.b.v. heel veel ingrepen (via de prompt zeg maar), valt er nog wat zinnigs van te maken. Maar dat betekent dus gewoon ander werk.

Waart de (stem)acteurs wel terecht bang voor zijn is dat imitaties worden gemaakt met de AI. Dat is een stuk minder creatief natuurlijk.

De AI zou juist een prima pakketsorteerder kunnen zijn.
Dat zeiden ze ook al toen de stoommachines uitgevonden werden, daarna de robots, etcetc
Tijdens de industriële revolutie werd ook veel te weinig rekening gehouden met de werkers. Voorheen goedbetaalde banen werden fabriekswerk, voor een fractie van het loon en onder slechte werkomstandigdheden.

Als we niet uitkijken gebeurt hier hetzelfde. Goede banen verdwijnen, er komt niet vervullend fabriekswerk voor in de plaats, zodat de rijken nog rijker kunnen worden.

Wel op veel kleinere schaal, want GenAI is lang niet zo breed inzetbaar als geclaimt word. Maar logisch dat stemacteurs hun onderhandelingspositie gebruiken om zich niet de kaas van het brood te laten eten.

[Reactie gewijzigd door Wolfos op 26 juli 2024 13:57]

Ze zeiden van de stoommachine dat die ging acteren en films ging maken? :?
https://www.saturdayeveni...am-powered-robot-of-1868/

Daar gingen mensen toen wel van uit ja, dat een robot ze kan vervangen.
Maar dat is mijn punt totaal niet, het gaat om het type werk wat ze vervangen. AI zoals het nu bestaat vervangt mensen in creatief werk wat ze graag doen, en laat dom fysiek werk over aan de mensen omdat goed bewegende robots maar ingewikkeld zijn. Precies het omgekeerde van hoe je het wil hebben, en van de visie in het artikel wat je gelinkt hebt.
De videotheekmedewerker bestaat ook niet meer, iets wat vaak iemand met passie deed omdat films zijn hobby waren.

Wil dat zeggen dat we nu nog steeds videotheken zouden moeten hebben?

Al die mensen hebben ook gewoon een andere baan gevonden, en er zijn meer dan genoeg banen. Waarom zou een creatief iemand andere rechten moeten hebben dan andere?
Het gaat niet om "recht op banen", maar om technologie gebruiken om het menselijk leven beter te maken. Het hele punt van automatisering is dat we meer tijd kunnen besteden aan de dingen die we fijn vinden, niet minder.
Ah het Wall-E scenario :P
De enige reden dat de kunst nu door AI wordt gedaan is omdat de output digitaal is (je ziet AI nog weinig beeldhouwen). Zodra we betere robotica hebben worden fysieke banen ook gewoon geautomatiseerd.
Dat vind ik wel het ironische aan het hele AI verhaal.
De creatieve mensen hadden zoiets van "wij zijn niet te vervangen, want een ai heeft geen ziel en kan dus niks bedenken dat origineel is, dus laat maar komen", maar zij zijn nu de eerste die vervangen worden.
Nope. De creatie is al gedaan en wordt verder 'uitgebuit' door de AI. Het creatieve deel komt dus van de mensen en de reproductie vanuit de AI.
Dit is enkel een perspectief vanuit de mens en is per definitie niet objectief, aangezien een mens niet objectief over zichzelf kan praten. Het berust op het intrinsiek waarderen van creatie van de mens en stapt over het feit heen dat deze net zo goed jarenlang voorbeelden heeft gezien van allerhande briljante artiesten en kunstenaars.

Het valt alleen nu enorm op omdat AIs het hele web scrapen en niet mondjesmaat hier en daar wat leren. En omdat AIs hier gewoon achterlijk snel in zijn, zeer systematisch. Terwijl het leerproces van de mens slomer en organischer is.

Maar om de mate van effectiviteit van de AI in het reproduceren voorop te stellen in de argumentatie gaat geen oplossing bieden, daar iedereen op deze manier enkel zijn eigen belang voorop stelt. Dat zien we dus ook wel in het artikel; en is al vaker gebleken dat gesprekken tussen kunstenaar en (ik noem het maar even) regisseur erg stroef verlopen.

[Reactie gewijzigd door A Lurker op 26 juli 2024 12:19]

Dit is enkel een perspectief vanuit de mens en is per definitie niet objectief, aangezien een mens niet objectief over zichzelf kan praten.
Waarom niet? Omdat we een belang hebben? Deze AI is niet eens een 'denkende' AI dus objectiviteit is in dit opzicht niet van belang. Er is maar 1 partij - dat zijn dus mensen.
Je kan best objectief zijn over jezelf toch?
deze net zo goed jarenlang voorbeelden heeft gezien van allerhande briljante artiesten en kunstenaars.
Dat noemen we derhalve dan inspiratie en is dus niet reproductie. Iets waar een mens notoir (en objectief) minder goed in is dan machines/computers (en dus AI).
Terwijl het leerproces van de mens slomer en organischer is.
Deze AI leert eigenlijk niet. Conclusies worden hem/haar/het opgedrongen (door mensen).
We gaan het niet eens worden (en dat is prima; agree to disagree) dus ik zal enkel op je eerste statement reageren:
[...]
Waarom niet? Omdat we een belang hebben? Deze AI is niet eens een 'denkende' AI dus objectiviteit is in dit opzicht niet van belang. Er is maar 1 partij - dat zijn dus mensen.
Je kan best objectief zijn over jezelf toch?
Nee dat kun je niet, net zoals dat als je een veroordeelde dat laat doen het een wellus nietus wordt met de rechter tussen of hij geen straf of wel een straf moet krijgen. Die wellus nietus zitten de artiesten en AI-gebruikers nu in.

Ik kies niet echt een kant, ik probeer echter een spiegel voor te houden dat bagatelliseren dat een AI niet leert er een semantische discussie van maakt wat 'leren' dan is. Dat soort argumentatietechniek lost helaas niks op in het hele probleem.

Zolang AI uit fundamentale/semantische redenen afgekeurd blijft worden door de gedupeerden komt er geen oplossing.

[Reactie gewijzigd door A Lurker op 26 juli 2024 12:50]

Nee dat kun je niet
Objectiviteit is toch niet voorbehouden aan een derde partij? Wij kunnen toch bijv. objectief beoordelen of een mens/mens-aap/ander dier behaard is of niet? Hebben we toch geen geen derde partij voor nodig?

Jouw voorbeeld van de veroordeelde en een rechter is een voorbeeld waarin de belangen verstrengeld zijn. Tussen AI en mens bestaan geen verstrengelde belangen - de AI heeft geen belangen....
ik probeer echter een spiegel voor te houden dat bagatelliseren dat een AI niet leert er een semantische discussie van maakt wat 'leren' dan is.
Ik bagatiliseer bekritiseer deze AI - die is namelijk zo dom als het achtereind van een varken - en ook dat kan nuttig zijn....maar het blijft dom.
Het probleem wat hier speelt heeft eigenlijk niets met AI te maken - er is een systeem gemaakt wat heel goed mensen kan imiteren. Net zoals we systemen hebben die heel goed beelden kunnen reproduceren. En daar hebben we regels voor opgesteld - omdat auteursrecht wel een belangrijk recht is.
Beweren dat mensen alleen maar leren op basis van statistiek klopt (gelukkig) namelijk niet.

Om dan te denken dat deze AI overal voor ingezet kan worden is gewoon naief.

Dus 2 verschillende punten:
  • deze nep AI vs echte AI
  • is gebruik van deze AI nu wel/niet reproductie (aangezien nu wel kleine wijzigingen worden gemaakt)
Was dit een echte AI, die dus creatief zou zijn en begrip had voor situaties dan was het tweede punt ook weer anders.
Ik zal het objectiviteitsargument los laten, daar heb je goede punten.

Maar over die belangen: de AI heeft inderdaad geen belangen, de personen die de AI gebruiken wel. Voor mij is door transitiviteit (by proxy) de morele verantwoordelijkheid bij de persoon die de AI inzet. Dat is intrinsiek verworven. Daar moet de discussie wat mij betreft over gaan; wat zijn de morele en wettelijke spelregels waarbinnen die AI gebruikt mag en dient te worden.

Het heeft voor mij dan ook geen enkele zin om die entiteiten (AI en AI-gebruiker) uit elkaar te halen in de discussie. Dat loskoppelen opent weer het originele argument dat de AI dus op fundamenteel vlak ('creatieve/oncreatieve/neppe/kopieer tool die artiesten van hun werk berooft') verworpen dient te worden. En dat is de wellus nietus waar je niet uit gaat komen.

Een mes wordt ook niet fundamenteel verworpen ook al kun je er onfatsoenlijk mee rondzwaaien tijdens een messendemonstratie of misdaden mee begaan. En ook niet omdat het een dom ding is zonder belangen (evident bij een mes, en daar dus een nutteloos argument). Het dient te worden bekeken in zijn gebruik, met alle context en natuurlijk met de uitoefener ofwel de kok ofwel nonchalante messenwerper ofwel de misdadiger met kwade intenties; allemaal enorm afhankelijk van de context. En dus is dat relevant (en ik zou willen opperen essentieel) in de discussie om ergens te komen.

Ik begrijp dat je niet alle AI verwerpt, dus in mijn messenanalogie zou je ook steekmes kunnen lezen, dwz een deelverzameling van de categorie messen, deze mag wat mij betreft ook niet verworpen worden op enkel fundamentele redenen.

Dat onderscheid tussen neppe en echte AI is overigens enkel gestoeld op semantische en daarmee arbitrair onderscheid om wederom iets op fundamenteel en subjectieve wijze te verwerpen.

Het is mij geen verrassing dat een discussie over AI zelden of nooit leidt tot resultaat; de persoon met de andere mening heeft namelijk ook fundamentele redenen om de AI wel te gedogen/toe te staan/te gebruiken; en dit levert de impasse op die overal zichtbaar is in de maatschappij omtrent AI op dit moment.

[Reactie gewijzigd door A Lurker op 26 juli 2024 15:41]

Het heeft voor mij dan ook geen enkele zin om die entiteiten (AI en AI-gebruiker) uit elkaar te halen in de discussie.
Jawel toch? De huidige AI is slechts een tool die data gebruikt en resultaat geeft. En daar zit de crux. Die data die wordt gebruikt is nu vrij te gebruiken - daar rust auteursrecht / copyright op. Dat is data van iemand anders; een specifieke stem dus.
Het is mij geen verrassing dat een discussie over AI zelden of nooit leidt tot resultaat; de persoon met de andere mening heeft namelijk ook fundamentele redenen om de AI wel te gedogen/toe te staan/te gebruiken; en dit levert de impasse op die overal zichtbaar is in de maatschappij op dit moment.
De discussie is dus eigenlijk niet over AI - de discussie gaat over "van wie is de data (=stem)" en wat mag je er mee doen.
De hudige AI is enkel en alleen een data omzetter. Waarbij mensen dan nog ingrijpen omdat de dataset wat vervuild kan zijn en/of de output fine-tuning nodig heeft. Puur een conversie - big-data in => specific data out.
Dat is geen semantiek. Anders gezegd; het is totaal niet boeiend hoe de tool wordt genoemd

De discussie over echte AI is op gang gebracht maar we hebben nog geen echte AI.
99% van wat creatieve mensen doen is ook een vorm van reproductie.
Ik maak zelf ook schilderijen en mijn stijl en techniek is zeer sterk beïnvloed door een aantal kunstenaren die ik heb "gekopieerd".
Wat ik doe is niet anders dan wat AI doet, AI kopieert een stijl en kan ook gemakkelijk meerdere stijlen combineren tot iets wat niet direct herleidbaar is.
Maar als het goed is (of anders gezegd: als je werk door velen wordt beschouwd als mooi/goed) dan heb je 'echte' kunst....

Bij verhalen schrijven gebeurt natuurlijk hetzelfde. Maar de zinnige(!) combinatie van onderdelen geeft iets wat wordt gezien als 'nieuw'. En de 'lijm' tussen de onderdelen is misschien nog wel moeilijker. Want een 'en dan gebeurt er dit en toen gebeurde er dat' is nu eenmaal geen goed lopend verhaal. Al bevat het wellicht wel leuke elementen.

Doordat we technieken gebruiken om kunst te maken lijkt het of het dus gedaan kan worden door mensen (of AI) die de techniek beheersen maar we weten al vrij lang dat dit niet zo is.
Bij abstracte kunst ligt het soms wat moeilijk omdat hier juist het onbestaande / totaal onverwachte, heel zwaar telt en dat, zodra we het gezien hebben, het niet meer nieuw is.

Deze AI is niet in staat zijn eigen 'werk' te beoordelen anders dan het weer door een statistische controle heen te halen.
Nu ben ik ook niet van mening dat een AI iets creatiefs kan, het kan iets doen in de stijl van. Maar niet echt iets nieuws bedenken. True, bijna alle "creatieve" uitingen zijn iets in de stijl van maar ik vind ai toch wel heel middelmatige resultaten geven.
Het zijn dan in de regel ook niet de creatieve mensen die aan het roer staan bij de bedrijven die dergelijke beslissingen nemen. Praatpakken en bonentellers maken de dienst uit en die zien enkel winstmarges en beurswaardes. De rest is bijzaak of slechts een middel tot dit doel.

Het wordt pas duidelijk dat men niet te vervangen is, zodra men er achter komt dat er een hoge navraag is naar een authentiek product. Zie ook hoe bij games de indie scene opbloeide nadat bleek dat er toch een niet te verwaarlozen deel van de markt interesse had in wat anders dan FIFA 2xxx, NFS X en de zoveelste Ubisoft game die al even "original" is als Fantasy games Final.
Een groot deel van de creatieve sector vind zichzelf dan ook belangrijker dan ze daadwerkelijk zijn. Alleen al in de muziek stikt het van de gatekeepers die niet met de tijd mee willen gaan en als gevolg amper een boterham kunnen verdienen
Ik zou het eerder vergelijken met deep-fakes. In essentie komt het ook op hetzelfde neer.
Dit dus! Ik krijg het idee dat, met name games, flink baat hebben bij AI. Met name omdat ik het gevoel heb dat het niet meer houdbaar is om details in games toe te voegen door mensen. Kijkt naar de grote games, waar we elk jaar verwachten dat ze mooier en gedetailleerder worden. De beperkende factor is het geld vs de mankrachten die ze er tegen aan gooien. En dat is dus prima met AI op te lossen. Waarom zelf handmatig 100 blikjes genereren die door de straat rollen als je ook met 1 druk op de knop AI dit kunt laten doen.

persoonlijk denk ik dat b.v. cyberpunk veel baat zou hebben gehad met AI hulp.
hmm mooi verwoord, tnx!
Dit is heel frustrerend. Ik ben nu 44 jaar, ik heb 12 jaar als zelfstandige gewerkt in de 3D/VFX industrie en nu 15 jaar deeltijds, fantastische tijden. Ik zou volgend jaar op pensioen willen gaan en creatief willen bezig blijven maar eerlijk gezegd is de fun en de uitdaging weg door verregaande automatisatie in 3D apps en ook AI.

Het gevoel, de uitdaging om met beperkte 3D tools een 3D animatiefilm te maken anno 2000 was onbeschrijfelijk. Nu wordt het uiteindelijk prompt to 3D of prompt to video. Zo zo saaaaaai 🙂.
Dat is een gevolg van de vele nieuwe technieken. Dankzij CNC machines is beeldhouwen ook anders geworden zeg maar. Dankzij 3D printers is mallen maken en vormen gieten ook niet meer altijd nodig.
Maar bij al die nieuwe technieken zie je een rode draad; iemand moet een 'creatief' ontwerp maken. Pure reproductie is lang niet altijd interessant. De nuances waren altijd al van belang. Waarom is de Mona Lisa bijzonder en zijn andere geschildere portretten minder bijzonder....
Zelfs bij pure reproductie (dus een foto maken zonder nabewerking) is compositie belangrijk. Bij verhalen zijn de gebeurtenissen of karakters op zichzelf misschien niet uniek maar is de combinatie ervan dat wel....en(!) is niet elke combinatie dus ook een echt boeiend verhaal.
Damn, ik wilde dat AI banen ging overnemen zodat ik meer tijd kon spenderen aan creatieve en kunstzinnige dingen. Maar blijkbaar zijn dat juist de dingen die we door AI gaan laten doen. 8)7
Nee hoor, je kan dat nog steeds doen alleen kan je er niet van leven. Ten eerste omdat het overgrote deel van de mensen, zoals iedere keer duidelijk wordt gedemonstreerd op Tweakers, het totaal niet nodig vindt om voor jouw creatieve inspanningen te betalen. Onder de redenering dar als ze jouw werk kopiëren ze immers niets van jou stelen want je hebt het origineel toch nog steeds?

Ten tweede omdat de vraag naar kwaliteit op creatief gebied ontzettend laag is. Voor de absoute top willen mensen best nog wel (veel) betalen, maar voor alles daaronder vinden ze YouTube of TikTok niveau goed genoeg. Hetzelfde heeft de goedkope digitale camera en bij audio het middensegment HiFi de nek omgedraaid. De telefoon was fotografisch goed genoeg en een MP3-tje klinkt net zo lekker op een paar speakers van de Action als op een setje Bose. De groep mensen die wel betere kwaliteit maar niet direct de top wil is simpelweg te klein om iets voor te ontwikkelen.

En als laatste: de markt is al overvol met mensen die 'iets' met video, muziek of andere creatieve uitingen doen. Voor een paar duizend euro kan je al alle apparatuur aanschaffen waarmee je resultaten op technisch vrijwel hetzelfde niveau kan produceren als professionals met vele malen duurdere apparatuur. En vele van die professionals hebben al moeite genoeg om het hoofd boven water te houden..

Ik denk dat AI goed genoeg is om op veel creatieve vlakken een niveau dat een stukje boven 'bagger' uitstijgt te bereiken. En voor veel mensen is dat goed genoeg.

Dus spendeer zeker meer tijd aan creatieve dingen! Ga er alleen niet van uit dat je daar je boterham wel mee kunt verdienen als je maar hard genoeg werkt...
Het is gedaan met die stem auteurs. De huidige staat van de AI stem generatie is zo goed dat 90% van de stem acteurs niet meer nodig zijn.

En dit geld niet alleen voor Hollywood, maar ook in het bedrijfsleven en voor reclames en zo.

[Reactie gewijzigd door dutchruler op 26 juli 2024 10:17]

Een AI stem trekt natuurlijk geen extra kijkers, ze gebruiken niet voor niks vele bekende acteurs en actrices.
Dus het zal ze in de AAA nooit niet vervangen, alleen de massa/goedkope producties.
Ik kan je zeggen dat het over grote gedeelte van kijkers/spelers niet weet wie de stemacteur is. Morgan Freeman heeft wel een zeer unieke stem die bijna iedereen eruit kan plukken, en ik zou het ook geweldig vinden als ze met hem een overeenkomst kunnen sluiten zodat we nooit zijn stem hoeven te missen
In Far Cry hebben ze toch ook Giancarlo Esposito gebruikt (zowel grafisch als stem)... Die naam zal veel mensen niks zeggen. Maar "Moff Gideon" in The Mandolorian. Speelt ook in "Better Call Saul" als Hermano dacht ik van Los Pollos en misschien minder bekend van Revolution. Maar ik had in een ver verleden ooit eens far cry gespeeld, maar die wou ik toen kopen, maar had em gewonnen via een wedstrijd. Maar zijn personage vond ik toch persoonlijk wel een meerwaarde.

Maar dit past ook niet in elke game, denk bijvoorbeeld aan World of Warcraft. Dan is er bijvoorbeeld Snoop Dogg sking die in COD Vanguard zat, dat is verkocht geweest als een gek. Er was ook een Terminator skin bijvoorbeeld. Maar denk niet dat je met Celine Dion ver komt bijvoorbeeld of je moet een game over de Titanic maken. Maar zet Grogu in een game en die verkoop zelfs als die pokkeslecht is. Wie wil er nou niet met baby yoda als character spelen :)

En Shrek is een mooi voorbeeld, Eddy Murphy. Die ga ik kijken gewoon voor Eddy Murphy, Na de eerste vond ik het maar "flauwer" worden. Maar gewoon omdat je weet dat het grappig zal worden, zal ik hem toch wel kijken.

[Reactie gewijzigd door cricque op 26 juli 2024 10:22]

Past niet in world of warcraft? Zijn we de Mr. T collaboration alweer vergeten? :o
YouTube: World Of Warcraft - Mr. T Night Elf Mohawk Commercial [4K AI Upscale]
Toen jij vroeger naar een tekenfilm keek wist jij wie die stemacteurs waren?
Met AI wordt het eigenlijk alleen maar beter want je hebt onbeperkte variaties nu
Voor Nederlandse films, absoluut. Dat zijn namelijk altijd de zelfde acteurs als in de Nederlandse (tekenfilm) series / Sesamstraat / Soaps. Dat was echt zo'n klein cirkeltje dat ze makkelijk herkenbaar zijn.
Nou de meeste kinderen tot een jaar of 8 zullen het niks uitmaken.

En daarnaast is het herkennen van stemmen ook alleen maar omdat jij daar mee opgegroeid bent. Niet omdat die stemmen beter zijn.

Dus de nieuwe generatie kinderen zullen opgroeien met AI stemmen en de keuze hebben hun tekenfilm helemaal interactief en naar wens te maken . En raar opkijken als jij over een seriële tekenfilm/show praat met maar een paar stemmen.
Tot nu toe zijn alle AI stemmen gebaseerd op bestaande stemmen. Dus dat verandert niet zo veel. En die interactiviteit ga ik betwijfelen. Dat is al een keer geprobeerd en de conclusie was, daar is geen behoefte aan. Mensen willen gewoon een film kijken en niet zelf bepalen hoe deze verloopt. Als je interactiviteit wil, daar zijn computerspellen voor uitgevonden ;)
Typisch een antwoord van mensen die te lang gewend zijn aan een bepaalde situatie.
beetje zoals "Mobiel??, waarom zou ik bereikbaar willen zijn"

We gaan zien hoe goed jouw antwoord standhoud in de komende tijd. Ik geef het zo'n 2 tot 5 jaar.
En dat vind ik zelf ontzettend hatelijk. Als kind kijkende naar nl versies van Pokemon oid vond ik vreselijk, die stemmen kwamen overal terug.
Het is wel duidelijk dat je niet verder wilt kijken dan je eigen perceptie. Een AI stem is redelijk, en kan prima functioneren op een achterground/extra karakter, maar voor je primaire cast? Ik geloof best dat je daar bepaalde (winstgevende) series mee kan maken, maar niks dat echt gaat scoren. Ook in 2-5 jaar niet, want wanneer emotie toegepast moet worden, dat zit er gewoon nog niet in. Zelfs iets achterlijks als de Pokemon, die niet verder komen dan "pika pika", weten daar ver in te gaan.

Gaat AI toegepast worden? Jazeker. Grootschalig, en winstgevend.
Gaat het in de komende <5 jaar mensen volledig vervangen in "top" titels? Absoluut niet.
Kijk voor de grap maar eens naar het udio 1.5 model. Vergelijk dat met een paar maanden geleden, vergelijk dat met suno en elevenlabs.

Denk dan even door tot een paar maanden verder en doen een poging een idee te vormen waar udio 2.0 zal zijn.

Ga nu even een paar jaar verder en je zult zien dat het meer uitzondering zal zijn dna normaal dat we echte stemacteurs nog gebruiken.

echt moeilijk om dit in te zien is dit niet.
Emotie kan gewoon aangeleerd worden door zo'n systeem, doorsnee fatsoenlijke acteur heeft het ook gewoon aangeleerd middels truukjes etc.
Natuurlijk weet ik dat. Brock uit Pokémon herken ik gelijk als hij andere karakters inspreekt.

...

Hoe bedoel je er zit een mens achter?
Ik durf te wedden dat het 90% van het casual publiek geen reet interesseert wie de stem acteurs zijn.
Ik kan me voorstellen dat ze dat gebruiken voor random NPC's in open world games en zo. Daar gaan maar weinig mensen zo uitgebreid naar zitten luisteren dat het gebruik van AI dan storend zou zijn, maar het levert wel een stukje immersie op.

Ik heb geen idee hoe zwaar text-to-speech is om uit te voeren, maar als dat geen te zware wissel op je systeem trekt zou je dat op termijn zelfs kunnen gebruiken om niet alleen bestaande NPC's in games te verzorgen (en dan hoef je dus niet vooropgenomen dialoog in je game te stoppen, wat weer een hoop opslag scheelt), maar ook om bijvoorbeeld DLC, uitbreidingen en mogelijk zelfs mods kunt laten inspreken.
Over het algemeen herken ik stemacteurs niet aan de stem. Mij zal het dus niets uitmaken wie of wat de stem doet, als die maar past bij het product.
In AAA ook hoor, je overschat de bekende acteurs enorm als je denkt dat de meerderheid door stemmen van een bekend figuur iets kopen.
Dan wat is de rede voor een productie maatschappij om dure acteurs aan te trekken voor hun stem?
Waarom zouden ze dat doen? Omdat het werkt....
Tja, omdat ze denken dat het werkt. Ondertussen gaat een groot deel van het budget (van zowel spellen als films) op aan veel te dure mensen die denken dat ze onvervangbaar zijn. Mij en een hoop anderen haalt het echt geen reet uit van wie de stem is, als het maar past bij de karakter.

Voor acteurs op beeld is het een ander verhaal, die zijn sowieso een stuk herkenbaarder. De gemiddelde stem totaal niet, goede microfoon, dichtbij de microfoon zitten en misschien nog wat mixen en zelfs de meest kneuzige mannen hebben een zware stem. Bron: Twitch.
Wie zou er meer kennis hebben of het werkt qua marketing, een random tweakers gebruiker of marketing bureaus voor de grootste producties in de wereld..
Veel grote games floppen de laatste tijd. Niet in de minste plaats doordat er teveel gespendeerd wordt aan randzaken en de gameplay te wensen overlaat. Je kunt je afvragen of de game developers nog goed in contact staan met de gaming consument. Marketing gaat vaak wel goed, dat moet gezegd. Vrij wel iedere grote game genereert hype die gevolgd wordt door teleurstelling.
Ik niet in ieder geval, maar er zijn steeds meer boxoffices die tegenvallen en AI is nog zeer nieuw dus ik kan me niet voorstellen dat ze daar nou al een uitgebreid marketingonderzoek voor gedaan hebben, laat staan in het echt getest hebben (lees: een film met ondersteuning van AI).

En je vergeet een belangrijk detail: in het artikel genoemde AAA bedrijven zijn er niet uitgekomen met onderhandelingen met deze acteurs, dus ik denk dat het voorbarig is om te zeggen dat AAA nooit met AI gaat werken.

[Reactie gewijzigd door Seditiar op 26 juli 2024 12:24]

Ik zou geen RDR willen spelen met een AI Arthur.
Een stemacteur is niet alleen een stem, maar ook een acteur. Een computerstem is alleen dat eerste. Net als programmeurs vs AI heb je hetzelfde issue: iemand moet alsnog bedenken wat de juiste gewenste uitkomst is, hier een prompt voor maken, en het resultaat beoordelen. De kunst van het bepalen van het gewenste resultaat en het beoordelen daarvan blijft toch mensenwerk. En dan niet voor een stem die een veredelde screenreader is voor puur praktische technische oplossingen, maar voor kunst in de breedste zin van het woord wel. Een stem in die situaties is zoveel meer dan 'de juiste woorden zeggen zonder als machine te klinken'.

En een deel zal sowieso wel AI worden, wanneer dat nu ook al op een goedkope manier wordt geproduceerd (ik kijk soms cartoons mee met mijn dochter en sommige daarvan klinken alsof men gewoon tekst zit op te lezen), maar ik hoop dat er markt genoeg overblijft voor professionals om een goede boterham te kunnen verdienen.
Die Vlaamse en Nederlands vertalingen van tekenfilms zijn soms wel echt goed hoor. Zeker van die bekende Disney Films, dan heb je bijvoorbeeld Urbanus of Philippe Geubels, die herken je uit de duizend. En het is toch een kunst op zich om je daar in in te kunnen leven en dat goed te doen. Je hebt alleen je stem, en ik heb daar toch dikwijls bewondering voor.
Maar als kind hoe vaak dacht je. 'hey dat is Urbanus!' of zat je gewoon helemaal in het verhaal.

Net zoals elke papa Sinterklaas kan zijn toch?
Maar ligt de kunst van het bepalen van het gewenste resultaat en het beoordelen daarvan niet voor het overgrote deel bij de regisseur? Met AI hebben regisseurs, zeker in de toekomst, meer mogelijkheden. Je kunt vrijwel oneindig veel "takes" doen met verschillende intonaties, ritme etc.
Als je beelden ziet achter de schermen bij opnames zie je dat het heel vaak opnieuw moet en dat het een zware tol eist op de stemacteurs, het zijn lange dagen en het kost veel energie.

Daarmee ontken ik niet dat stemacteurs, zeker de goede, zelf natuurlijk ook meedenken en een unieke "touch" geven aan hun personage, maar wat betreft de punten die jij noemt (bepalen resultaat en beoordelen) verandert er weinig als je een AI stem gaat gebruiken.
Een AI acteur is wel 10 stappen verder dan de stem vervangen voor een bestaand acteerwerk. Dat laatste is al lastig om dat overtuigend te laten klinken. Het klinkt tot dusver vooral onbedoeld grappig.
Zelfde geldt voor verhalen geschreven door AI. Je komt alle tropes tegen, maar het is ontzettend onsamenhangend.

Tot dusver zie ik alleen pogingen tot nabootsen van iets wat al bestaat. En als je kijkt naar de manier waarop die modellen nu getraind worden, lijkt het me ook niet echt een goedkope dienst als AI echt creatief gaat worden.
het kern wat je zegt is "tot dusver"
Je hebt het namelijk over iets wat nog maar een paar jaar bestaat en nu pas echt een beetje voorgang gaat krijgen.

Zeker als straks de grotere AI modellen getraind zijn. puntje van de ijsberg
Dat 'tot dusver' sloeg op het nabootsen van iets wat al bestaat. Dat is heel wat anders dan acteren. Text-to-speech acteert niet.
Ik vraag me ook af hoe straks al die investeringen in AI terugverdient worden.
AI stem generatie is zo goed dat 90%
Nee dus. De AI genereert geen stem....hij gebruikt een bestaande stem [van een mens dus] om teksten uit te spreken. Daarbij is de emotie echt wel een dingetje - een mens zal dus waarschijnlijk de AI instrueren om een bepaalkde emotie te gebruiken.
Al die ellende die wordt 'opgelezen' door AI geeft echt wel vreemde prikkels. In een game prikken we daar doorheen omdat het secundair is. Maar een voordracht door een AI-stem....bijzonder slecht om aan te horen omdat het soort van monotoon wordt (welliswaar niet letterlijk maar de emotionele variatie ontbreekt gewoon). Logisch want deze AI begrijpt tenslotte niet wat deze 'zegt'.
Nee de AI gebruikt helemaal geen bestaande stem, maar heeft geleerd hoe een stem klinkt en kan dat dan ook doen.

Je moet je ook bedenken dat deze technologie erg nieuw is, en de voortgang gaat zo snel dat het bijna niet te behappen is.

Kijk bijvoorbeeld maar eens naar de laatste versie van udio 1.5 en luister naar de stemmen en het gevoel en timing.

Je bent echt aan het achterlopen als je niet inziet dat dit hele grote veranderingen gaat brengen
AI gebruikt helemaal geen bestaande stem, maar heeft geleerd hoe een stem klinkt en kan dat dan ook doen.
Dat is toch feitelijk een bestaande stem gebruiken....??? :?
Je bent echt aan het achterlopen als je niet inziet dat dit hele grote veranderingen gaat brengen
Ik zeg: je bent echt gevoelig voor hype als je niet ziet dat dit geen echte AI is.... dat wil nog niet zeggen dat het geen slimme/goede/bruikbare tool is natuurlijk. En dat het veranderingen gaat brengen wordt toch niet betwist? Juist niet. Ik betwist echter wel dat deze 'AI' creatief is of zaken begrijpt. Dat is al eerder uitgelegd; een kunstenaar (die per definitie creatief zou moeten zijn) die geschilderde kunst maakt is niet hetzelfde als iemand die goed schildert. Het is een nuance maar wel van belang. Hetzelfde geldt voor het vertellen/schrijven van een verhaal. Dat is niet alleen een reeks van gebeurtenissen achter elkaar gezet.

Als je nu nog niet inziet wat deze AI nu werkelijk inhoudt dan ben ik vooral erg verbaasd.
Nee. Een bestaande stem is één van de 8 miljard stemmen op deze wereld, dat is nu net het hele punt. Een AI genereerten gebruikt een nieuwe stem die lijkt op menselijke stemmen, maar niet identiek is aan een bestaande stem.
Dat is nu toch juist waar de stemacteurs over vallen? Dat hun stem wordt nagebootst?
En een AI kan toch uit zichzelf geen stem maken of hebben? Dus het 'baseren op' noemen we ook wel imiteren. Inderdaad niet identiek maar lijkt dus op de stem van een ander (of misschien zelfs meerdere mensen).
Een AI kan uit zichzelf prima een stem hebben of maken. Dat hoeft niet eens op basis van bestaande stemmen! Je kunt een Text-To-Speech AI zelfs trainen met een Speech-To-Text AI - is de nieuwe AI verstaanbaar?

Nu krijg je betere resultaten als je een AI traint met een heel scala aan stemmen, maar alsnog krijg je dan een stem die nieuw is, en geen imitatie van één speciale stem uit de trainset.
Een AI kan uit zichzelf prima een stem hebben of maken. Dat hoeft niet eens op basis van bestaande stemmen!
Deze AI kan dat toch niet? Deze gebruikt bestaande data en combineert deze. En enkel een klank maken van een letter of een woord en deze achter elkaar zetten hadden we al vrij lang (zelfs op de C64....) maar dat was natuurlijk geen stem. Intonaties en klanttonen en combinaties van meerdere woorden, die daardoor anders klinken, dat is een stem. En dat kan nu enkel worden nagebootst.
geen imitatie van één speciale stem uit de trainset.
Dat klopt - hij [deze AI] kan deze mengen. Maar dan is herkenbaarheid dus bijna nul. En die herkenbaarheid is soms juist zo belangrijk ("He is from that movie!").
En m.b.t. de bezwaren: 1 op 1 nadoen was eigenlijk altijd al een heikel punt (portretrecht, autersrecht, copyright....). Maar nu hebben we dan ook deelreproductie. Want een deel van de stem wordt nagebootst. Maar net zoals bij muziek- en film-fragmenten, zijn daar ook strenge regels voor nodig.
Nee, dat is niet hoe een moderne test-to-speech AI werkt. Stukjes .wav file achter elkaar zetten is al 20 jaar achterhaald.

En nee, het is ook geen "mengsel" waarbij je van 26 stemmen één letter neemt, of zo. Er zijn geen identificeerbare delen. Bij LLM's is dat anno 2024 nog wel eens een issue, vanwege word vectors Ergens moeten de woorden vandaan komen, en een LLM die getrained wordt op deze post zal het woord "ezelepuk" van mij moeten leren. Maar dat speelt dus totaal niet met stemmen.
Neural networks maken altijd gebruik van complexe interpolatie en dus het mengen van data. De trainingsfaze bestaat uit het fitten van een functie (het model) op de in- en uitvoerdata, om zo een schatting te kunnen maken van de uitvoer voor andere invoerwaardes.

Dit speelt bij alle neural network gebaseerde zaken: LLM, image generators, detectors, audio generators, ... Je kan je model enkel gebruiken voor dingen ruwweg binnen de regio van je invoer vallen.

Bij stemgeneratie krijg je een mengeling van zaken als stemkleur, intonatie, ...
Als je bijvoorbeeld geen vrouwenstemmen hebt, dan zal je model geen vrouwenstemmen kunnen nabootsen omdat je model geen kennis heeft van deze "regio" in de data én omdat NN's behoorlijk slecht zijn in extrapoleren. In dat opzicht klopt het wat Tintel zegt: dit soort AI's mengt stemmen. En het lijkt me vanzelfsprekend dat niet iedereen daarop zit te wachten.
Je kan zelfs een AI een model maken dat een biologische mond, met stembanden en lucht modellen en de hele mikmak maken.

En dat model kan gebruikt worden om alle menselijke stemmen na te maken die je wilt.

Stemmen zijn helemaal niet zo uniek. Er zijn zoveel mensen die hetzelfde klinken. Dat heeft te maken
niet alleen je stembanden, maar ook je manier van praten, je accent, cultuur, manier van spreken.

Maar uiteindelijke kan de AI dit zelf ook wel bedenken.
Je kan wel zeggen het is gekopieerd, maar vanaf wel niveau is dat niet?

Wij komen ook allemaal uit het zelfde zaadje en ontvouwen onszelf tot merendeels hetzelfde poppetje :P
Je kan zelfs een AI een model maken dat een biologische mond, met stembanden en lucht modellen en de hele mikmak maken.
Imitatie dus.... maar de output is dan uniek inderdaad.
Stemmen zijn helemaal niet zo uniek.
plus
Dat heeft te maken
niet alleen je stembanden, maar ook je manier van praten, je accent, cultuur, manier van spreken.
= veel variabelen => grote kans om uniek te zijn.
En het uniek zijn is ook niet waar de grootste nadruk op ligt; op herkenbaarheid ligt de nadruk.

En het punt is ook niet zozeer dat de AI dus een eigen stem kan maken - het punt is dat de AI deze kan baseren op andermans stem.
Wij komen ook allemaal uit het zelfde zaadje en ontvouwen onszelf tot merendeels hetzelfde poppetje
Blijkbaar niet want ik ben dus geen bekende stemacteur ondanks dat ik ook wel kan praten.... :9

Juist het feit dat we op elkaar lijken maar niet/nooit hetzelfde zijn is toch interessant?
interessant wellicht, maar zeker niet nodig voor het vervangen van stemacteurs.

Als ik een spannend verhaal heb gemaakt (zelf of met AI) dan wil ik stemmen die passen bij het verhaal lijn.
En of dit nu een bekend persoon is of niet maakt niks uit.
Jij maakt dat het punt, de herkenbaarheid en dat de AI een stem zou baseren op een specifiek persoon, maar dat is voor deze staking slechts een (klein) deel van de reden. Pure imitatie is namelijk al verboden, dus een studio kan niet de stem van Tom Cruise namaken en dan zonder compensatie daarmee een game in elkaar draaien. Elementen nemen zou kunnen, dat is ook moeilijk op te sporen of hard te maken, en daar willen de acteurs logischerwijs afspraken over maken (maar in die gevallen ligt de nadruk niet op herkenbaarheid). Over dat stuk waren de studio's het al vrijwel 100% eens met vakbond.

Het belangrijkste punt, en het punt waar de deal op stukgelopen is, is dit:

"The voice actors, who authorized the strike with a 98.32% "yes" vote, want big game makers to inform the union when they plan to use generative AI in a way that would replace the work of actors."

Ze willen dus afspraken maken die het gebruik van alle AI stemmen aan banden legt, om de werkgelegenheid van stemacteurs te beschermen. Dat is logisch, want dat is hun taak. Maar het zal in de praktijk vooral gaan om nieuwe, unieke stemmen die niet herkenbaar zijn en niet gemaakt zijn door het imiteren van specifieke personen.
Ja dat is waar. Met dit punt ['we willen werk'] van de stemacteurs bond ben ik het ook niet helemaal eens. Maar.... als de AI alleen maar heeft leren spreken door juist de stemmen van stemacteurs te gebruiken (en niet door stemmen te gebruiken waarvoor de rechten zijn ingekocht), dan hebben ze wel een punt.
Stemacteurs vallen er niet zozeer over dat hun stem wordt nagebootst, ook al wordt dat wel ook genoemd. Dat gebeurt namelijk, uitzonderingen daargelaten (zie rel Scarlett Johansson), niet specifiek met hun stemmen. Het mag ook gewoon niet. Ze vallen er vooral over dat een groot deel van hun werk waarschijnlijk zal verdwijnen, door het gebruik van "nieuwe" AI stemmen. Door nu voor de (middel)lange termijn afspraken te maken die het gebruik van AI beperken hopen ze te redden wat er te redden valt.

[Reactie gewijzigd door dikkechaap op 26 juli 2024 16:05]

Door nu voor de (middel)lange termijn afspraken te maken die het gebruik van AI beperken hopen ze te redden wat er te redden valt.
Ja, dat kan ook een agenda punt zijn - wat moeilijker ligt. Stellen dat je ingehuurd moet worden omdat je nu eenmaal werkt wilt is nu eenmaal malligheid.
Ja, maar het is natuurlijk wel de kerntaak van de vakbond. De schrijvers in Hollywood hebben het bijv. voor elkaar gekregen: https://www.theguardian.c...e-artificial-intelligence.
Het blijft mi wel uitstel van executie, dit is alleen houdbaar zolang er nog (veel) mensenwerk nodig is. Dat is bij schrijvers waarschijnlijk een stuk langer het geval dan bij stemacteurs.
Ja idd. Een stem is helaas slechts een onderdeel van het verhaal en niet het verhaal zelf. CGI heeft natuurlijk ook allerlei mensen in die industrie wel werk gekost. Maar ondertussen ook weer opgeleverd natuurlijk.
Dit is van alle tijden - om te kunnen 'timmeren' hoef je nu alleen nog maar sterk genoeg te zijn om de tacker vast te houden....maar het maken van die dingen kost wel meer moeite dan het maken van een hamer.

En eigenlijk is het ook niet erg. Uiteindelijk willen we bepaalde taken niet zelf uitvoeren en proberen we dit uit te besteden.... aan mensen of robots of computers of een combinatie daarvan.
Ik denk vooral dat wat jij denkt over kunst en creativiteit en dat dit niet door een AI gedaan kan worden erg ondoordacht is.

Een kunstenaar is ook alleen maar de opsomming van wat die geleerd heeft en zijn levenservaringen.

Je kan je wel onder een rots gaan verstoppen en doen alsof de AI golf niet gaat komen, maar overspoeld ga je toch worden.

Als ik jou was zou ik maar snel leren zwemmen.

Dit heeft niks te maken met een hype die wel weer weg gaat. En alleen al het feit dat je onderscheid maakt tussen 'deze' AI tenopzichte van een eventuele andere zegt mij al dat je het niet begrijpt.

Alles wordt AI. De reden is dat het vrijwel niks gaat kosten en dat het zo veel mogelijkheden bied. AI is de electriciteit en wordt alleen maar groter.
Nu op dit moment wordt arbeid gedaan door AI niet belast dus is het relatief goedkoop. Grootste kosten zijn de huur van de hardware en de kosten van de stroom. Datasets om te trainen zijn nog praktisch gratis want men pakt gewoon data zonder ervoor te betalen.

Maar dit veranderd nu al. Er moet steeds vaker betaald worden als data gewoon bij elkaar gepakt wordt, bijvoorbeeld aan krantenuitgevers.

Nadat men de stem van een bekende actrice gebruikt had om een model te trainen, trok men dit toch maar terug nadat er een rechtszaak dreigde.

En qua inkomstenbelasting, ook dat zal vanzelf gaan veranderen. Straks moet er ook gewoon een variant op de inkomstenbelasting betaald worden als een AI het werk verricht.

Tot slot de milieu impact begint ook duidelijker te worden. Al die stroom vretende data centers die nodig zijn die ook nog eens ons water vervuilen zodra het 25 graden is, ook dat begint nu pas langzaam door te dringen bij het publiek.
Uiteindelijk zal er inderdaad meer belasting betaald moeten worden door bedrijven voor het gebruik van AI.
De basisinkomen moet toch ergens van betaald worden als bijna niemand meer werk heeft.
Nadat men de stem van een bekende actrice gebruikt had om een model te trainen, trok men dit toch maar terug nadat er een rechtszaak dreigde.
Je refereert hier naar de AI voice van Open AI dat die te veel zou lijken op Scarlett Johansson alleen dit klopt natuurlijk niet. een AI kan elke stem namaken omdat het weet hoe stemmen werken, niet omdat haar stem gekopieerd is. Hoeveel imitators zijn er die hun brood verdienen omdat hun stem klinken als een bekende persoon?
tot slot de milieu impact begint ook duidelijker te worden. Al die stroom vretende data centers die nodig zijn die ook nog eens ons water vervuilen zodra het 25 graden is, ook dat begint nu pas langzaam door te dringen bij het publiek.
Ook dit klopt niet. Als je bijvoorbeeld naar Microsoft kijkt en ook google en tesla zie je dat ze vrijwel co2 neutraal zijn. Microsoft wil in 2030 zelfs CO2 negatief zijn

Watergebruik is wel een probleem, maar dat heeft vooral te maken met de locaties van de datacenter. Microsoft en bijvoorbeeld aan het kijken naar gebruik van zeewater zodat grondwater niet aangetast wordt.

Uiteindelijk hebben we water genoeg op deze wereldbol
Microsoft voegt chemicalian toe aan het water dat ze gebruiken en daarna weer lozen. Daar zit het probleem.
Heb je ook bron informatie?
Want iets roepen en bewijzen is natuurlijk niet hetzelfde
Een kunstenaar is ook alleen maar de opsomming van wat die geleerd heeft en zijn levenservaringen.
Dat doet een kunstenaar heel wat tekort denk ik....
Je kan je wel onder een rots gaan verstoppen en doen alsof de AI golf niet gaat komen, maar overspoeld ga je toch worden.
Beetje dom als je nagaat dat deze AI vooralsnog juist mensen nodig heeft...

En hoe je bij de vreemde kritiek komt van "onder een rots verstoppen" is mij een raadsel. Ik bestrijd het idee dat deze AI ook maar iets met intelligentie te maken heeft.
Dat het nuttig kan zijn is ben ik het zeker wel mee eens.
En alleen al het feit dat je onderscheid maakt tussen 'deze' AI tenopzichte van een eventuele andere zegt mij al dat je het niet begrijpt.
Oh? Dit is een LLM AI.... de 'andere' zou een AI zijn die begrijpt wat deze aan elkaar 'breidt' [puur op basis van vervuilde(!) statistieken]. Als jij denkt dat bijv. schrijven niets meer is dan wat ideeen en/of cliches van het Internet bij elkaar schrapen en deze achter elkaar zetten dan heb je blijkbaar nog nooit een goed boek gelezen....
Dat doet een kunstenaar heel wat tekort denk ik....
Niet echt. een kunstenaar onttrekt zijn/haar waarde aan wat andere er van denken.
Ik geloof best dat er altijd wel vraag zal blijven naar "menselijke" kunst, alleen niet omdat de AI
dit niet beter zou kunnen, maar puur om subjectieve en emotionele redeneren.
En hoe je bij de vreemde kritiek komt van "onder een rots verstoppen" is mij een raadsel. Ik bestrijd het idee dat deze AI ook maar iets met intelligentie te maken heeft.
Dat het nuttig kan zijn is ben ik het zeker wel mee eens.
Uiteindelijk zijn onze hersentjes ook maar een biologische computertjes. En waarschijnlijk zal wel blijken dat het niet eens een erg ingewikkelde computers zijn.

Ik heb het trouwens niet over LLM AI, maar over AI. en in de context van dit artikel gaat het over vervanging van stemacteurs. De meeste stem AI is trouwens meer van het diffusion model volgens mij en dus een soort neefje van de LLM in de zin dat het transformers gebruikt.

Dat er meer technieken gaat komen en dat er andere AI's komen geloof ik wel. Maar uiteindelijk zelfs met de huidige technieken kunnen de stem acteurs hun baan nafluiten. Die zijn zo goed als obsolete
Niet echt. een kunstenaar onttrekt zijn/haar waarde aan wat andere er van denken.
Nee toch? Plenty kunstenaars die gewoon doen wat ze willen doen. Iets creatiefs doen kan inderdaad heel basaal zijn en is dus heel goed na te bootsen. Maar als het zo simpel was dan hadden we toch allemaal al lang bestseller schrijvers moeten zijn? Want we lezen en zien allemaal van alles en als je dat maar een beetje leuk achter elkaar zet dan heb je dan toch een mooi/goed verhaal?

En het moeilijke is: na het bedenken van iets kunstzinnigs/moois/leuks/grappigs (vergeet humor niet...) denken we soms al snel: "dat had ik ook wel kunnen bedenken / was niet moeilijk / lag voor de hand". Maar dat is achteraf....precies wat deze AI nu ook doet. Bij veel zaken is het overigens de dubbelzinnigheid - die nu juist niet expliciet wordt genoemd, die iets extra's toevoegd. En deze dubbelzinnigheid ontgaat de AI dus ook volledig.
Uiteindelijk zijn onze hersentjes ook maar een biologische computertjes.
Misschien... maar toch gebruiken we op dit moment intern andere technieken dan alleen maar statistiek en reproductie. Biologisch zijn we allemaal ongeveer gelijk [qua hersenen] maar de software is blijkbaar bij iedereen toch wel verschillend. :Y)
Nee toch? Plenty kunstenaars die gewoon doen wat ze willen doen. Iets creatiefs doen kan inderdaad heel basaal zijn en is dus heel goed na te bootsen. Maar als het zo simpel was dan hadden we toch allemaal al lang bestseller schrijvers moeten zijn? Want we lezen en zien allemaal van alles en als je dat maar een beetje leuk achter elkaar zet dan heb je dan toch een mooi/goed verhaal?

En het moeilijke is: na het bedenken van iets kunstzinnigs/moois/leuks/grappigs (vergeet humor niet...) denken we soms al snel: "dat had ik ook wel kunnen bedenken / was niet moeilijk / lag voor de hand". Maar dat is achteraf....precies wat deze AI nu ook doet. Bij veel zaken is het overigens de dubbelzinnigheid - die nu juist niet expliciet wordt genoemd, die iets extra's toevoegd. En deze dubbelzinnigheid ontgaat de AI dus ook volledig.
Wellicht heb je gelijk. Uiteindelijk zoals ik al schreef hangt het ervan af wat andere ervan denken.
Misschien... maar toch gebruiken we op dit moment intern andere technieken dan alleen maar statistiek en reproductie. Biologisch zijn we allemaal ongeveer gelijk [qua hersenen] maar de software is blijkbaar bij iedereen toch wel verschillend. :Y)
Ik begrijp dat je dit grappig bedoelt, alleen is onze software beperkt tot wat er in onze hersentjes passen. Dit is met AI wel anders. Nu is het nog dat je ontzettende grote datacenters en modellen nodig hebt om een beetje goede AI te maken terwijl onze hersentjes zo klein zijn en maar een paar honderd wat gebruiken.

Alleen datacenters kan je altijd wel weer meer van bouwen en de voortgang staat ook niet stil en chips worden kleiner en zuiniger. de chip in mijn koelkast is al slimmer dan de super computers die gebruikt werden voor de maanlanding. Dus dat zal in de toekomst ook wel gelden voor AI

en dan hebben we nog niet eens gesproken over fusion en quantumcomputing.
Kunstenaars zijn ontegenzeggelijk creatief, en AI kan dat op dit moment nog niet matchen. Aan de andere kant, over het algemeen onderschatten we hoezeer mensen ook voortbouwen op wat ze gezien en geleerd hebben, zelfs de meest creatieve mensen. Het is niet voor niks dat je bij een schilderij uit de 17e, 18e of 19e eeuw meteen kunt zien of het bijvoorbeeld uit Japan of West-Europa komt (een beetje deskundige ziet ook uit welk atelier). Of dat een deskundige op basis van de stijl van de aangebrachte decoratie een stuk aardewerk kan plaatsen in een tijdspanne van enkele decennia.
"Want we lezen en zien allemaal van alles en als je dat maar een beetje leuk achter elkaar zet dan heb je dan toch een mooi/goed verhaal?" -> dat we allemaal min of meer dezelfde info hebben om op te bouwen betekent natuurlijk niet dat iedereen dezelfde skills heeft om daar iets nieuws van te maken. Wel hebben wel allemaal die info nodig om überhaupt iets van niveau te maken, daarin zijn mensen ook nauwelijks anders dan AI.
Wat er overblijft qua open kwestie is de skillset van AI om iets "nieuws" te maken, en dat lijk je enigszins te onderschatten (los van ontwikkelingen in de toekomst).
Wat er overblijft qua open kwestie is de skillset van AI om iets "nieuws" te maken, en dat lijk je enigszins te onderschatten
Dat komt omdat de huidige AI alleen maar combineert op basis van statistiek en dan "komt vaker voor" => eerder goed/waar. Dat betekent dat iets totaal nieuws 'bedenken' gewoon niet kan gebeuren.
Dan de analogie van ongeveer gelijke data input =/> niet altijd een goed verhaal. En is het dus heel genuanceerd welke combinaties 'goed' zijn. En juist het feit dat de combinatie nog niet bestaat en dat de individuele 'waarheid' van een element dus eigenlijk ondergeschikt lijkt te zijn, betekent dat deze AI dus (bijna) nooit een goed verhaal zou kunnen maken. Ook omdat deze niet kan teruglezen en beoordelen of het nog steeds wel 'lekker loopt'.
Wat dus wel zou kunnen is dat de AI honderden voorstellen eruit gooit en dat mensen deze beoordelen (is wel heel veel werk...) en kunnen besluiten of een verhaal wel goed loopt.
Iets nieuws maken is niet hetzelfde als iets nieuws bedenken, wat overigens een lastig te definiëren valt. Een LLM kan absoluut iets nieuws maken, ik neem aan dat daar geen misverstand over bestaat. Je voorbeeld over een goedlopend nieuw verhaal is een van de lastigere dingen, hoewel zeker niet fundamenteel onmogelijk. Een dertien-in-een-dozijn detective waarbij een nieuw verhaal wordt gegeneerd door het combineren van elementen uit duizenden bestaande verhalen behoort bijvoorbeeld tot de mogelijkheden. En laten we eerlijk zijn: dat is ook wat een deel van de minder creatieve schrijvers (al dan niet bewust) doet. Hoeveel moeite zal een LLM op termijn hebben om een nieuwe Baantjer aflevering te maken, die niet te onderscheiden is van een "echte"?

Bij andere kunstvormen (inclusief stemacteurs) ligt dit weer anders.

Wat ik verwacht dat LLM's vooral zullen doen is het aan mensen duidelijk maken hoe weinig echte creativiteit of redeneercapaciteiten je nodig hebt om iets te maken dat als origineel en steekhoudend wordt beoordeeld.
Hoeveel moeite zal een LLM op termijn hebben om een nieuwe Baantjer aflevering te maken, die niet te onderscheiden is van een "echte"?
Ik denk dat het juist heel erg moeilijk is om een goed lopende aflevering te maken. Het zijn nauwelijks benoembare nuances die zorgen dat een verhaal goed loopt. Al kunnen we soms wel goed beoordelen welke fouten zorgen voor slecht verhaal verloop. Een verhaal is namelijk niet zoiets als een film van alle werkelijke gebeurtenissen chronologisch achter elkaar. Daarom is een gewone foto maken ook niet zo moeilijk meer maar een bijzondere foto maken juist weer wel (en natuurlijk lukt dat soms ook wel eens per ongeluk). Maar een hele film maken die per ongeluk een goed verhaal laat zien (en dus niet elke seconde!), is heel erg moeilijk.
We hebben heel veel mooie dingen die lijken te ontstaan door het navolgen van een bepaalde techniek maar we hebben ook zaken die zich (nog?) niet hebben laten vangen in een technische handleiding.
Humor is ook zoiets. Zelfs simpele humor dient een opzet te hebben, een uitvoering en punchline en een nabewerking. Een scheet laten op een podium is echt niet altijd humor maar kan toch grappig zijn.
Heb je dan een site waar je goede AI stemmen kunt vinden? Ik ben op zoek maar vind het nog tegenvallen.
En wat let de game studio's dan gebruik te gaan maken van AI stemmen welke op alle manieren gevormd kunnen worden ?

Edit; las over het AI stukje.

Maar dan alsnog hoef je natuurlijk niet perse DIE stemmen te gebruiken als je alle kanten op kan met AI

[Reactie gewijzigd door Jeroenzer op 26 juli 2024 09:29]

Ik denk dat dat nu nog geen groot risico is omdat AI toch de emotie nog niet kan overbrengen met een stem. Een (goeie) voiceactor kan dat wel heel goed.
Zodra gamestudio's nu overstappen op AI stemmen gaan ze denk ik wel een flinke stap terug in de tijd. Puur voor de ervaring en immersie van de speler in het verhaal.

Maar ik kan er naast zitten natuurlijk
Ik moet zeggen dat als ik een AI stem iets hoor oplezen ik nog zeker wel kan horen dat het geen mens is. Maar dat hoeft natuurlijk niet lang meer te duren, over 5 jaar zal die techniek wel weer een heel stuk verder zijn.
Nou, als ik de artikelen van www.theatlantic.com beluister, dan denk ik dat de ontwikkelingen veel sneller zullen verlopen. Ik hoor het verschil niet meer tussen mens en machine. Maar, dit zijn natuurlijk “neutrale” stemmen zoals die van nieuwslezers. Ben inderdaad benieuwd wanneer AI emoties in stemmen inde de knie krijgt. Exciting times ahead inderdaad.
Maar, dit zijn natuurlijk “neutrale” stemmen zoals die van nieuwslezers.
Die dus zo min mogelijk emotie moeten tonen...
Maar bij een verhaalvertelling, een gesprek of een voordracht is emotie - aan hand van wat de tekst betekent (wat ook dubbelzinnig kan zijn!), juist heel belangrijk.
En juist het feit dat de AI nu niet kan beoordelen of tekst emotioneel geladen is en/of dubbelzinnig, betekent dit dus dat ze tekort schiet.
Je hebt AI stem en je hebt AI stem. Sommige betaalde AI voice systemen zijn al amper tot niet meer te onderscheiden van echt.
In een game als Red Alert is het juist een toevoeging als de stem nogal computerachtig klinkt.

Ik weet het niet hoor. Vroeger werd alles met de hand getekend, nu is dat een niche. De dag komt voor sommige beroepen dat het werk veranderd. Wellicht zelfs vervalt.
De dag dat de desbetreffende kunstvormen sterven. Ach, EA, Disney en elke grote platenlabel waren toch al op weg dit dood te maken met laagdrempelige, effortloze content zonder diepgang. De pure kunst zal een steeds kleinere groep aanspreken en interesseren. Dat bewijzen de verkoopcijfers wel.
Ik weet niet of het vroeger nou echt zoveel beter was hoor! Maar eens, het is vrij zeldzaam dat er iets uitkomt wat met trots gepresenteerd mag worden.
Mensen hebben over het algemeen snel last van nostalgie bias en deze onderwerpen zijn vrij subjectief. Toch kan je stellen dat al deze content vormen steeds veiliger en geformuleerder worden uitgebracht. Denk aan de meest indrukwekkende, emotionerende kunststukken die je kent. Vaak zijn dit werken waar perfectionistisch op werkelijk elk detail werd gehamerd door grootmeesters die hun vak en de context waarin ze zich begaven begrepen en konden verklaren. Denk even aan de beat van Billie Jean waar Quincy Jones 90 versies moest produceren voor MJ tevreden was. De schilderwerken van een Vermeer die soms jarenlang in aanmaak waren, de stopmotion film Pinocchio van Guillermo del Toro die ook 12 jaar productietijd kende. In contrast zijn het vaak de franchises met een uitgemolken karakter (CoD/FIFA) die elk jaar een nieuwe versie hebben waarbij je je eigenlijk afvraagt wat er nou fundamenteel nieuw of verfrissend aan is.
Je benoemt, mijns inziens, hoogtepunten. Terecht natuurlijk, maar als je kijkt naar wat er is geproduceerd en wat er een bepaald niveau heeft, dan vraag ik me af of het heden ten dage inderdaad beroerder is dan vroeger. Een film als Inside Out 2 zullen mijn kinderen blijven herinneren als een hele leuke film, net als ik Armageddon me zal blijven herinneren. Niet echt een film die kan tippen aan de hedendaagse technieken overigens. Typisch het nostalgie bias inderdaad. Eigenlijk zou je een AI moeten inzetten om de statistieken tevoorschijn te toveren ;)
tja, ik weet niet of dat zo lang houdbaar is. Universele slechte films/series/muziek lijken toch te bestaan....

Juist omdat dan content 'uitgepoept' wordt is men het misschien ook wel op een gegeven moment zat?
AI voor dit soort dingen is ideaal voor erboven op. Doe gewoon alles wat je normaal zou doen met echte voice actors, gewoon nog steeds met echte voice actors.

Gebruik daar bovenop AI om on the fly dialoog te produceren voor bijv random quests. Dan heeft AI daadwerkelijk een meerwaarde, het zorgt voor meer game. Ipv dat het achteruit gaat dat npc's steeds zieliger beginnen te klinken.

Maar ben bang dat het uiteindelijk gewoon een tool wordt om kosten te drukken (aka, geen VA's meer te hoeven inhuren) wordt.
Als je de snelheid van AI ontwikkelingen ziet, kijkend naar de OpenAI demo waarbij juist de intonatie en emotie binnen stemmen werden getoond, zou het mij niets verbazen als dit binnen een jaartje grootschalig ingezet kan worden.
Staken is juist een zeer groot risico.
Als een grote ontwikkelaar zoals EA wat budget tegen AI gooit, dan hebben ze binnen de paar jaar een gamma aan AI stemmen die bijna even goed zijn als echte stemmen.
Misschien zullen sommige stem acteurs beter zijn, maar niet alle stem acteurs zijn even goed.

Ik gok dat binnen 5 jaar alle stemacteurs in de game industrie werkloos zijn.
Heel veel VA werk is ook gewoon bagger, in die gevallen is AI dan al snel een upgrade. Ook maakt het VA mogelijk in projecten die er normaal het budget er niet voor zouden hebben. En natuurlijk de technologische vooruitgang die het kan betekenen. Dynamisch gegenereerde dialogen afhankelijk van jouw input, NPC's die ECHT kunnen reageren op de huidige staat van de game (ipv altijd dezelfde 3 voor opgenomen zinnetjes te herhalen).

Dus ik denk dat de normalisering er van onvermijdelijk is en dan ga je het uiteraard ook in grotere projecten zien om kosten te drukken of minder afhankelijk te zijn van vakbonden.
Ik denk dat dat nu nog geen groot risico is omdat AI toch de emotie nog niet kan overbrengen met een stem.
https://play.ht/ en velen anderen zijn helaas voot stemacteurs al zover.
Je kan 1 goede stem acteur hebben die de emoties overbrengt. Hoeft niet eens een goede stem te zijn. Een stagiaire of zo.

En dan met ai de stem veranderen naar wat je wil. Geen enkel probleem
Idd en dan heb je dus feitelijk een hele knappe stem omvormer. Maar geen AI met een stem. Als een tekst nog niet is uitgesproken dan weet de AI ook niet hoe deze moet worden voortgebracht. Wij beoordelen bij het spreken ook niet elk woord apart en eigenlijk ook niet per zin, maar het hele verhaal.
Je snapt het nog steeds niet. Je zit te argumenteren waarom het nu nog steeds niet goed genoeg is, alleen denk je niet eraan dat dit een wezenlijke andere Techniek en nog helemaal in de kinderschoenen staat.
Wat snap ik niet?

Ik stel dat deze AI geen eigen stem heeft als je als bron andermans stem gebruikt..... onze stem (met de daarbij passende emoties) worden gevormd aan de hand van het moment van het gesprek (dus context) en hoe je als mens in het leven staat zeg maar.

Deze techniek betekent dat op hele knappe wijze een imitatie van meerdere stemmen kan worden gemaakt - een mix dus. Iets wat mensen trouwens ook kunnen. Dat heeft niets te maken met "nog niet goed genoeg". Deze techniek is een combinatie techniek en daarbij worden bestaande stemmen gebruikt.
Nogmaals je snapt het niet. Er wordt helemaal niks geïmiteerd, maar er wordt gegenereerd op basis van wat de AI geleerd heeft hoe stemmen en geluid werkt.
Nogmaals - zo werkt deze AI niet. Die gebruikt patronen en statistiek om een mix van bestaande stemmen te maken. Die kan dan misschien wel zoveel stemmen imiteren dat het herkennen erg moeilijk wordt.
Dat moet ook wel want de AI weet niet welke emotie hoort bij een bepaalde zin - dat zeg je notabene zelf
Je kan 1 goede stem acteur hebben die de emoties overbrengt.
Omdat wij als mensen begrijpen dat de zin "hij is dood" in de ene context een andere emotie heeft / kan hebben, dus andere klank zullen we dat doen. Dat kan deze AI dus niet....tenzij de inspreker het "voor gedaan". Dus......imitatie.

Deze AI combineert input data - het bedenkt / genereert geen nieuwe data. Nu kun je stellen dat de combinatie nieuw is en derhalve de stem ook.
Maar begrijpen doet hij niets.
Ik heb het gevoeld dat we hier op 'repeat' draaien. Er wordt geen patronen en statistiek gemaakt van een mix van bestaande stemmen.

Als ik jou was zou ik me wat meer verdiepen in het difusion model. Het heet ook niet voor niks 'generatieve AI' niet knip en plak AI
Klopt maar geliefde stemmen en stemtypes komen van een mens en niet van een computer. Als je bepaalde types met AI gaat genereren dan zet je wel een complete beroeps bevolking buiten spel. Daarnaast worden die modellen ergens mee getrained en dat zijn uiteindelijk menselijke stemmen.

Dat je een usecase hebt voor AI stemmen begrijp ik wel, zeker als je bijvoorbeeld een AI npc hebt die situationeel moet gaan reageren. Maar ik ben het wel met de acteurs willen dat hun unieke stemmen niet voor AI training worden gebruikt en/of nagebootst worden.
Ik denk dat dit uitzonderlijke gevallen zijn, specifiek binnen de game-industrie. Waar je bij films en tv-shows vaak bekende acteurs en actrices ziet, wat zich vertaalt in een bepaald budget en karakters die vaak op die personen lijken, is dit zelden het geval in de game-industrie. Sterker nog, heb jij ooit een spel gekocht vanwege een specifieke stemacteur? En daar ligt dan ook het pijnpunt, AI vervangt makkelijker "bottom" end, of het nou foto's zijn, acteurs, stem acteurs, tekst. Dus niet verwonderlijk dat gamestudios hier dan ook niet in megaan, waarom zou je betalen voor iets wat een computer net zo goed, zo niet beter in verschillende talen kan tegen lagere kosten?
Begrijp je punt maar de stemmen maken de beleving wel 100 keer beter. Nee je koopt het niet voor de stemmen maar het zijn wel die stemmen die het iconisch maken en er leven aan geven. Denk aan Duke Nukem: Jon St. John of Geralt from Rivia: Doug Cockle, of bijvoorbeeld tekenfilms. The Joker: Mark Hamill, Scooby Doo: Frank Welker, Smurfen: Frans van Dusschoten (de nieuwe stemmen waren beduidend minder).
Moet ik dit nu sarcastisch lezen?
Duke Nukem wordt echt niet beter door die stemacteur die wat one liners voorleest. Genoeg mensen die dat zeker even goed kunnen en veel kans dat wat prutsen met een AI stem bijna hetzelfde geeft.
Daar snij je een goed punt aan dat serieze gevolgen heeft:
.. AI vervangt makkelijker "bottom" end, ..
Dit geldt voor stemactuers met een kleine rol (geen Trevor Philips), maar ook voor motion capture acteurs, muziekmakers, graphisch designers. De hele creatieve content business, tot en met de beste acteurs, musici en graphisch artiesten begonnen .. onderaan, bij de "bottom" end. Zonder deze "bottom" end komt er geen aanwas van nieuw talent naarboven. Iedereen in de creatieve content business is begonnen op een kwaliteitsniveau dat momenteel wellicht door AI kan worden vervangen, maar als we dat gaan doen zijn we over een generatie deze hele sector verloren geraakt aan AI.

En dat is AI die alleen bestaat doordat het getrained is op (momenteel voornamelijk zonder consent van) de "top" end van de creatieve content business. Ik snap deze artiesten best dat ze willen dat hun creaties niet (en überhaupt niet zonder toestemming) worden gebruikt.

[Reactie gewijzigd door cl4ss op 26 juli 2024 11:31]

Sterker nog, heb jij ooit een spel gekocht vanwege een specifieke stemacteur?
Nee, maar het heeft in een aantal gevallen wel degelijk verschil gemaakt.
Het is ook zeker niet zelden dat er 'bekende' stemmen in games zitten. Dat die stemacteurs niet dezelfde status hebben als 'echte acteurs' is soort van logisch maar toch ook weer niet. Er zijn wel degelijk voice-actors die bij iedere conventie duizenden fans trekken.
Je kunt het 'bottom-end' noemen maar stemacteurs brengen een karakter tot leven.
Ik zal vast niet de enige zijn geweest die The Witcher 3 heeft gespeeld en de geweldige stem van Geralt in de Netflix-serie moest missen.

Wanneer een 'echte' bekende acteur een animatiefilm of game inspreekt is het ook opeens geen 'bottom-end' meer. Omdat je dan opeens te maken hebt met een merknaam, managers, advocaten en een duidelijk contract dat geen misbruik toestaat.
Er worden duidelijke regels gesteld voor wat er gedaan mag worden met alle scans en opnames die van acteurs gemaakt worden, zodat ze niet opeens opduiken in films, series, games of een GPS-stem waar ze nooit voor getekend hebben.

De 'bottom-end' stemacteurs hebben die luxe vaak niet. De stemacteurs die een karakter van een iconische en zeer herkenbare stem voorzien zullen veel makkelijker het slachtoffer worden van een contract waar simpelweg in staat dat hun stem voor alle toekomstige games gebruikt gaat worden.
Iets dat in eerste instantie heel positief klinkt als het uitgangspunt is dat de persoon die stem daadwerkelijk in moet spreken en daarvoor betaald krijgt. Niet positief als de stem door AI wordt gecreëerd.
Het zelfde geldt overigens ook voor modellen die hun gezicht en/of lichaam laten scannen om vervolgens tot in eeuwigheid van dagen in nieuwe games op te duiken. Ik betwijfel of Mark Vanderloo betaald krijgt iedere keer als de iconische kop van Commander Shepard ergens gepubliceerd wordt.
Mark Meer, de voice-actor voor Shepard, zal wel werk hebben gehad om nieuwe zinnetjes in te spreken voor de Mass Effect Legendary Edition, maar dat zal ook ophouden als dat met AI kan.

Ik ga er van uit dat de 2 namen die ik noem je niets zeggen. En dat is gedeeltelijk het probleem.
Die personen waren niet minder belangrijk voor het Commander Shepard karakter in Mass Effect dan bijv. een Tom Hanks als Woody in Toy Story.
Het verschil is dat Tom Hanks stem in de toekomst niet middels AI zal worden gedaan en dat een op die van Scarlett Johanssons lijkende stem niet door ChatGPT gebruikt mag worden.
waarom zou je betalen voor iets wat een computer net zo goed, zo niet beter in verschillende talen kan tegen lagere kosten?
Het antwoord is 'computer'.
Het is op het moment al behoorlijk slecht gesteld met de creativiteit in medialand en het simpele feit dat computers en AI alles makkelijker, sneller en goedkoper kunnen wil niet zeggen dat we dat als iets positiefs moeten zien.
Creativiteit, fantaseren, dingen verzinnen en creëren zijn typisch menselijke eigenschappen.
Op het moment dat je AI inzet voor alles dan benader je het punt waarop je je af gaat vragen waarom we überhaupt nog moeten nadenken en zijn we robots.
Ik denk wel hetzelfde voor animatie films en dergelijke, waarom ze een Mario door Chris Pratt in laten spreken bijv. Dat gebeurd ook bij games, Elder Scrolls Oblivion had bij Sean Bean en Patrick Steward er in zitten (en volgens mij is daar 99% van het VA-budget naar toe gegaan). En bij Destiny dat je acteurs zoals Peter Dinklage, Nathan Fillion, Bill Nighy, en een hele lading anderen. Dat voegt toch echt wel iets toe aan de beleving (alleen jammer dat ze dan VA's moeten re-casten als ze te duur blijken voor sequels). Dus dat gebeurd zeker wel.

Maar wel een interessante stelling, heeft iemand interesse gekregen in Destiny vanwege die cast? Dat denk ik niet, het is een leukigheid ja, maar eigenlijk zonde van het geld want de spelers accepteren ook heus wel als dat minder bekende acteurs zijn (sterker nog, het trekt alleen maar negatieve aandacht als zo'n VA vervangen wordt, zoals bij Peter Dinklage het geval).

Aan de andere kant, een game zoals Red Alert 3 moet het juist compleet van de cast hebben, want dat is wat die game leuk maakt. De game zelf is behoorlijk matig, maar de single player is zo vermakelijk om doorheen te spelen dankzij een excentrieke Tim Curry enzo.

[Reactie gewijzigd door Zoop op 26 juli 2024 14:54]

Klopt, maar ze kunnen dan gewoon bijvoorbeeld gewoon mensen vragen die wat leuks willen verdienen met een prima stem en vervolgens iets mee doen ipv een stem acteur die veel meer vraagt.

Je hebt naturlijk niet speciaal stem acteurs nodig om iets in te spreken. er leven 8 miljard mensen op deze bol die allemaal een stem hebben, de een nog mooier dan de ander.
Dit is precies wat ik verwacht \ vrees
Je neemt veel gewone mensen, geeft die een contract dat je alles met hun data (stem / motion capture / ...) kan doen wat je wil en geeft die eenmaal veel geld (wat dat ook mag betekenen)

Hoeveel verschillende (stem) profielen zou je kunnen maken uit een data set van 100 of 1000 verschillende personen?
Als je bepaalde types met AI gaat genereren dan zet je wel een complete beroeps bevolking buiten spel.
En wat is precies het probleem? Dat noemen ze nou vooruitgang.

Bepaalde beroepen verdwijnen en daar komen andere beroepen voor terug.

[Reactie gewijzigd door jbhc op 26 juli 2024 10:27]

Het probleem is de oneerlijke concurrentie. Op menselijke arbeid wordt een belasting heffing in rekening gebracht, arbeid geleverd door een AI en/of robot is onbelast.
Zeg je dat ook over een lasrobot?
Sinds wanneer zijn btw en dividend belasting geen belasting meer?

Daarnaast zie ik niet hoe die oneerlijke concurrentie zou zijn. Of spijkert de hoefsmid nog steeds nieuwe hoefijzers onder onder jouw auto? Want banden zijn oneerlijke concurrentie, toch?
Klopt maar geliefde stemmen en stemtypes komen van een mens en niet van een computer.
Het jaar 2024 zou wel eens het laatste jaar kunnen zijn, waarin deze stelling waar is...
Als je bepaalde types met AI gaat genereren dan zet je wel een complete beroeps bevolking buiten spel.
Ja, en? Lullig dat ze iets anders moeten gaan doen, maar dat hebben de hoefsmid en kolenboer ook gedaan. En wat dacht je van de vuilnismannen en vrouwen die zijn/worden vervangen door een robotarm?
Daarnaast worden die modellen ergens mee getrained en dat zijn uiteindelijk menselijke stemmen.
Daar heb je er een paar miljard van. Ook heb je gewoon de biologische werking van stembanden, ons gehoor en de gebruikte taal, daarmee moet het ook mogelijk zijn om stemmen te produceren.
Maar ik ben het wel met de acteurs willen dat hun unieke stemmen niet voor AI training worden gebruikt en/of nagebootst worden.
Dat is een andere discussie, nu heb je het over de persoonlijke eigenschappen van een stem die bij één acteur horen. Dat is imho namaak en dat moet je niet willen.
In films snap ik t, dat je niet zo snel een andere AI stem gaat gebruiken, of dat je gebruik wil maken van een bekend iemand's stem. Maar in games? Die gamestudio's willen vast een grote diverse wereld creëren met veel NPC's, en dan is AI veel goedkoper als t goed werkt.

Willen deze stem acteurs alleen dat men hun eigen stem niet mogen namaken, of überhaupt dat er geen AI gebruikt gaat worden in de game industrie?
Ik denk dat het ook minder krampachtig overkomt in games aangezien de personages er toch al niet levensecht uit zien.

Maar het vernietigd weer een manier voor mensen om hun geld te verdienen, dus ongeacht doet het me pijn. Daarnaast zit er geen lol in. Als ik bijvoorbeeld naar de Machine Games Indiana Jones game kijk, de stemacteur komt echt verdraaid dicht bij de stem van Harrison Ford - dat vind ik een kunst. Als het een software algoritme was geweest dan is het op geen enkele manier boeiend of interessant meer.
Ik denk dat er genoeg geld te verdienen is omdat het anders toch onbetaalbaar is. Dus ofwel je breidt de games uit met meer stemmen dan anders mogelijk waren, of ze zitten er gewoon helemaal niet in. Je mist als acteur niks.

Als jij de basis legt voor veel karakters, dan ben je alsnog betrokken bij het bouwen van een game.

Ik denk dat ze vooral in moeten spelen op dat stemmen niet over meerdere games gebruikt mogen worden, dan dat ze helemaal AI moeten verbieden, want dat gaat ze toch niet lukken.

Daarnaast is een echt ingesproken hoofdpersoon toch nog altijd beter dan een nepperd.
namelijk eerlijke compensatie en het recht om toestemming te geven voor het gebruik van hun gezichten, stemmen en lichamen door AI
Als game developer zou ik toch gewoon geen kopie van een echt persoon meer maken en lekker met AI een karakter maken.
Ik denk dat ze het liefst zouden zien dat AI voor stemmen in het geheel worden verboden. Da's voor de stemacteurs natuurlijk het best-case scenario want dan moet je overal een mens voor inhuren. Dat lijkt me echter geen haalbare kaart aangezien er nu al AI wordt gebruikt voor stemmen, maar dan vooral in reclames. Da's dus een gepasseerd station.

Wat mij betreft mag het gebruik van échte stemacteurs om AI modellen te trainen onder een zelfde soort recht als bijvoorbeeld portretrecht gaan vallen. We doen heel moeilijk over deepfakes als het gaat om beeldmateriaal, maar dit is natuurlijk eigenlijk hetzelfde.

ALDI heeft het al voor elkaar - hun reclames worden door een AI gegenereerde stem ingesproken, die getraind is door een handjevol medewerkers. Met hun toestemming, uiteraard. Persoonlijk vind ik 'm niet klinken want het is het allemaal nét niet. Je hoort dat er iets aan mankeert (ik in ieder geval) maar precies benoemen wat het is, lukt me niet.
Ik zie liever dat AI het vervelende bulkwerk vervangt. Niet het creatieve.

In de creatieve wereld (tekenwerk, acteurs, muziek, stemacteurs e.d.) zou AI de mens moeten assisteren, maar niet vervangen.
Waarom zou dat moeten?
Heb je als creatieveling nog waarde als AI het ook kan?
Als programmeur heb je toch ook geen waarde meer als AI het kan.
"Heb je als creatieveling nog waarde als AI het ook kan?"

Het hele punt van creativiteit is het menselijk element dat iets nieuws creëert. Als je dat compleet vervangt door AI dan is het geen creativiteit meer. Dan is het simpelweg "lopende band bulkwerk" geworden.
AI kan dus ook iets nieuws creëren.
Waar is de waarde van de menselijke toevoeging dat je daar dan voor wil betalen?

Moeten we ook stoppen met autos gebouwd door robots omdat daar geen menselijk element van creatie in zit?
Een auto op zich is een hulpmiddel en geen expressie.

Het ontwerp en eventuele opdrukken kunnen dat wel zijn, maar die worden niet door de fabrieksrobots ontworpen.
Maar dan bepaal jij nu voor andere dat een auto een hulpmiddel is en geen expressie.

En alsnog.. Wat is het argument?
Je stel de mens nu als slaaf die waarde moet creëren voor een economie. Jammer dat je het zo ziet, maar helaas begrijpelijk.

We vergeten dat we leven op een natuurlijke aarde met mensen van vlees en bloed. De economie is onze creatie, daar moeten we iets aan gaan veranderen. We kunnen niet machteloos blijven toekijken tot onze eigen createies ons het leven zuur maken.
Je stel de mens nu als slaaf die waarde moet creëren voor een economie. Jammer dat je het zo ziet, maar helaas begrijpelijk.
Dat is nu toch ook zo?
Je hebt een baan omdat je geld wil verdienen. Die baan bestaat omdat het waarde creeert voor een bedrijf en daarmee ook de economie.
Het geld wat je uitgeeft dankzij je baan, is ook onderdeel van de economie.
We vergeten dat we leven op een natuurlijke aarde met mensen van vlees en bloed. De economie is onze creatie, daar moeten we iets aan gaan veranderen. We kunnen niet machteloos blijven toekijken tot onze eigen createies ons het leven zuur maken.
Allemaal leuk en aardig, maar het is ook niet alsof we nog de jager-verzamelaar zijn om de overleven.
Het feit dat je zelf ook achter een computer zit geeft ook aan dat je zelf ook niet in je eigen verhaal gelooft.
Het gaat er meer om dat mensen juist het creatieve werk willen doen. Iets wat grote bedrijven blijkbaar maar al te graag willen vervangen.
En zoals cl4ss zegt: mensen zijn geen slaaf voor de economie. Niet alles draait om waarde creëren voor iemand anders.
Het gaat er meer om dat mensen juist het creatieve werk willen doen. Iets wat grote bedrijven blijkbaar maar al te graag willen vervangen.
Er zijn ook genoeg mensen die nog met de hand een auto zouden willen bouwen.
Maar gezien robotisering daar veel goedkoper voor is en mensen goedkopere autos willen is dat toch een logisch vervolg.
Niet alles draait om waarde creëren voor iemand anders.
Dit is zeker waar, het draait om waarde te creëren voor jezelf.
Daarmee kun je echter niet afdwingen dat andere moeten gaan betalen voor waarde die jij voor jezelf creëert.
Over 30 jaar lezen we dit soort artikelen hoofdschuddend als achterhoede gevechten.
Dat zou heel goed kunnen, maar dan nog is het soms best goed dat er verzet is. Want als AI doorgroeit in capaciteiten dan wordt dit de grootste verschuiving in arbeid aller tijden, of beter: verdwijning van arbeid. Zo'n overgang kan gaan met meer of minder pijn, en staken kan helpen om de mensen in het oog te houden. De ultrakapitalisten hoeven niet gelijk alle voordeel te hebben op dag 1, zonder dingen netjes af te handelen.

Voor werkers zal er uiteindelijk niet noodzakelijk een andere baan zijn (als steeds meer AI wordt), of ze zullen zich verregaand moeten omscholen naar een krapteberoep. Teruggaan naar school terwijl je genoeg moet verdienen om je huur of hypotheek te betalen is erg lastig, afhankelijk van de financiën, zelfs in de rijkste landen ter wereld (laat staan elders).

En ergens gaandeweg zal er een geheel nieuw economisch model nodig zijn, om toch nog waarde te kunnen verspreiden zonder het loon-naar-werken-concept van de afgelopen eeuwen. Zodat mensen kunnen eten. Ook kunnen er decennia aan tijd zitten tussen de ene groep die haar werk verliest en de andere. Dus dat de eerste doelwitten nu tegenstribbelen is niet gek; er is geen geweldige opvang als er hele beroepsgroepen tegelijk hun werk verliezen.

Deze overgang moet met menselijkheid en redelijkheid gebeuren, en niet te ver richting keihard geld verdienen. Zelfs als het allemaal toch zover komt uiteindelijk, is de weg daar naartoe nog steeds van belang.

[Reactie gewijzigd door geert1 op 26 juli 2024 12:35]

Vooralsnog zie ik echter vooral pogingen om AI contractueel te verbieden, en geen pogingen om de overgang soepel en met het oog op de mensen te laten verlopen. Naar mijn idee zijn dergelijke pogingen volstrekt kansloos, en kan er beter naar een weg worden gezocht die past in een wereld waar deze technologie beschikbaar is.

Puur vanwege de mogelijkheid om karakters op de actie van een speler te laten reageren zouden ontwikkelaars wel gek zijn om geen AI te gebruiken. Naast het drukken van de kosten zijn de mogelijkheden gewoon te interessant om te negeren.
Die contracten zijn voor het huidige dienstverband, de huidige opdracht en/of tot het volgende moment van onderhandelen met de vakbond, wat eens per handvol jaren is. Dus dit geldt allemaal niet voor de lange termijn. AI zal alsnog haar weg vinden naar dit vakgebied als het verschil in kosten groot genoeg wordt tussen mensen inhuren en AI inzetten, met behoud van acceptabele kwaliteit en dergelijke. Dan zullen de stemacteurs steeds minder kunnen eisen in volgende rondes. Ze gaan dan gewoon minder vaak ingehuurd worden, of contracten zullen dan niet verlengd worden omdat de AI het werk daadwerkelijk overneemt.
Gegenereerde AI stemmen moeten ook resulteren in het uitbetalen naar stem acteurs.
Net zoals Spotify de artiesten betaald wanneer hun streams worden afgespeeld.
Immers, de AI modellen moeten getrained worden en hiervoor is data nodig.
Als een bepaalde acteur zeg 3% heeft geleverd van de dataset van een AI, dan zou deze ook 3% van de opbrengst moeten krijgen die de AI genereert.
Trainen op stemmen kan natuurlijk gebeuren met amateurs, met stemmen is het wat gemakkelijker aan knopjes draaien om ze te wijzigen dan met afbeeldingen.

En je kunt nog even naar je cijfers kijken, als je een werknemer die 3% van de input levert ook 3% van de opbrengst geeft dan blijft er uiteindelijk 0,0 over voor de rest.
Het is erg begrijpelijk allemaal vanuit de stem acteurs, maar ik denk toch dat er relatief weinig aan te doen gaat zijn. Dit voelt toch een beetje aan de hulpjes bij de boeren ooit die protesteerde tegen de trekker.

Het zal toch richting vertalen gaan. Ik denk dat er nog steeds erg goede vertalers zijn, als in mensen, die boeken of iets vertalen. Maar een reisbrochure die beschikbaar moet zijn in 26 talen, dat gaat tegenwoordig toch met AI. Ik denk dat hetzelfde gaat gebeuren met stem acteuren. Grote films, grote games, sure er blijft altijd die mensenlijke touch (net als met boeken), maar voor dingen die relatief weinig uit maken denk ik toch dat het gaat vervangen worden met AI.

[Reactie gewijzigd door jaenster op 26 juli 2024 09:34]

Sorry maar mijn applicatie bijvoorbeeld (zo een 15000 lijnen tekst al dan niet volzinnen) klopt voor geen meter in het Frans. Van Engels naar Frans is al beter dan van Nederlands naar Frans. Nu voor de gemiddelde persoon zal dit "goed genoeg" zijn, maar professioneel, in de verste verte niet. Mijn Frans is nu niet slecht, maar het is nu ook niet dat ik alles in het Frans machtig ben, maar als het zelfs faalt op relatief simpele dingen, nee. Nederlands - Engels is ook niet helemaal zonder fouten hoor.

Ik ben nu ook niet de meester in het Frans schrijven, spreken en verstaan is helemaal geen probleem, maar daar haal ik zelfs fouten uit.
Bij applicatie vertaling mist er een hoop context die je niet hebt, en met een beetje pech worden er verschillende synoniemen in een taal door elkaar gebruikt etc. En als iemand die software heeft geschreven en erg slecht is in duits: Het zal je verbazen hoeveel slecht duits sprekende nederlanders die vertaling zelf deden met hun brakke duits. Ik sprak het gelukkig slecht genoeg om het aan beter sprekende te vragen.

Dus grappig genoeg, gok ik dat jou voorbeeld niet vertaalt is via AI. Overigens is copilot erg goed in het vertalen van stukjes text in code. Omdat het de context weet van het project (in tegenstelling tot online vertalers en dingen als chatgpt) en de termen daardoor kent etc. Maar ook een duidige vertalingen gebruikt, omdat het de context weet van de andere al vertaalde items.
Slechte vertaling boeit grote fabrikant volgens mij niets, mijn recente Samsung TV heeft gewoon automatisch vertaalde schermen erin zitten.

Als hij geen hdmi input heeft (omdat het device nog uitstaat) zegt ie:

"voeding van apparaatfout controleren"

Lijkt gewoon een slechte automatisch vertaalde zin te zijn
Voor hoofdrolspelers in een gameverhaal zou ik nog altijd een stemacteur gebruiken, maar voor achtergrond characters zou ik echt niet de moeite doen. Zoals de bewakers in Skyrim bijvoorbeeld..
Als ze AI gaan gebruiken voor simpele geluiden, bijvoorbeeld voor Yoshi in een Super Mario Game, dan zou ik het nog snappen. Maar vaak spelen stem acteurs ook fysiek mee in een spel, want laten we eerlijk zijn, heel veel word tegenwoordig al met Motion capture gedaan. Ik snap ook wel dat games ontwikkelen steeds duurder word en dat men kosten wilt besparen, maar ik denk niet dat dit de oplossing is, sterker nog dit doet in mijn ogen aftrek aan het werk wat acteurs vaak heel goed neerzetten.

Op dit item kan niet meer gereageerd worden.