Chinees staatspersbureau introduceert 'ai-nieuwslezer'

Het Chinese staatspersbureau Xinhua gaat een 'ai-nieuwslezer' inzetten. De presentator is een computergegenereerde kopie van een echte nieuwslezer bij het bureau en zijn stem is ook gebaseerd op die van zijn tegenhanger van vlees en bloed.

De digitale Zhang Zhao stelt zich voor in een kort YouTube-filmpje. Hoewel de 'nieuwslezer' redelijk weet te overtuigen, valt wel duidelijk te zien dat bij de mond een aardig uncanny valley-effect aan de gang is. Ook zijn stem klinkt vooralsnog als een verveelde robot, hoewel dat wellicht ook het geval is bij de Zhang Zhao van vlees en bloed.

De presentator wordt gebracht als zijnde een vorm van ai, maar het is niet helemaal duidelijk of dat wel zo is. Wat we zien is een geanimeerd 3d-model van een nieuwslezer met lipsynchronisatie voor de text-to-speech. Niets daarin duidt op een kunstmatige intelligentie die zelfstandig bepaalde taken kan uitvoeren. Ook zijn voorleestekst wordt door mensen ingevoerd.

Xinhua zet in totaal twee van deze nieuwslezers in; eentje voor Engels en eentje voor Chinees, hoewel ze vermoedelijk hetzelfde uiterlijk hebben. De nieuwslezer wordt per direct ingezet op de verschillende kanalen van Xinhua. Volgens de South China Morning Post is de ai-nieuwslezer tot stand gekomen in samenwerking met het bedrijf achter de Chinese zoekmachine Sogou.

Op het gebied van robot-nieuwslezers is Japan ook aardig aan de weg aan het timmeren. De '23-jarige' Erica moet ergens in 2018 in Japan aan de slag gaan als nieuwslezeres. Zij is echter een echte robot en niet door een computer gegenereerd.

Vorige .geek Volgende .geek

Door Mark Hendrikman

Redacteur

Feedback • 08-11-2018 13:33 45

08-11-2018 • 13:33

Lees meer

Stemacteur HAL 9000 is overleden .Geek van 12 november 2018

Ai-bot voor gezichtsidentificatie kan nu radiosterrenstelsels herkennen .Geek van 1 november 2018

Google-onderzoek laat ai eigen voortbewegingstechnieken ontwikkelen .Geek van 10 juli 2017

Ai van team van Nederlandse wetenschapper krijgt highscore in Ms. Pac-Man .Geek van 15 juni 2017

NPO heeft 29 AWS-servers gereedstaan na belangstelling voor ai-fototool .Geek van 7 juni 2017

Meer producten en artikelen

Wetenschap Cgi China Kunstmatige intelligentie

IT-banen

Meer vacatures

Reacties (45)

-Moderatie-faq

Wijzig sortering

Verwijderd 8 november 2018 13:56

Beetje eng dit, ik reken er nog steeds op dat echte mensen met inzichten, integriteit en eigen denk vermogen mij het nieuws brengen.. en niet een "puppet" dit letterlijk alles leest en het op een "menselijke" manier brengt.

choi99 @Verwijderd • 8 november 2018 14:09

De gemiddelde nieuwslezer/es van vlees en bloed doet over het algemeen ook niks anders dan de autocue voorlezen. Ik voorspel dan ook dat een aardige percentage van de nieuwslezers/sen gemakkelijk vervangen kunnen worden door robots.

Carharttguy @choi99 • 8 november 2018 14:19

De gemiddelde nieuwslezer(es) is wel een journalist die gebeten is door nieuws, niet zomaar mensen die toevallig kunnen lezen..

Soms zijn er toch ook kleine interviews tijdens het nieuws, en een bepaalde (gedempt natuurlijk) emotie tijdens het nieuws kan naar mijn inziens ook de nieuwservaring verbeteren.

GateKeaper @Carharttguy • 8 november 2018 17:16

Dan heb jij deze nooit gezien:

https://www.youtube.com/watch?v=ksb3KD6DfSI

Lokale nieuwszenders die allemaal exact hetzelfde vertellen. Ik geloof niet dat dat hier in Nederland anders is. Misschien wat afwijkende teksten, maar als je kranten hier lees, is 't ook allemaal 1:1 ANP knip en plak werk. Onze tv zenders, en daarmee nieuwskanalen, zijn ook eigendom van slechts 2 grote media bedrijven.

Carharttguy @GateKeaper • 8 november 2018 22:52

Ik heb in België toch een andere kijk op ons medialandschap. We hebben qua nieuws eigenlijk 2 grote keuzes: De openbare omroep één en de commerciële omroep VTM. Er is een duidelijk verschil tussen de twee, maar toch allebei kwaliteitsvol, veel beter dan dat Youtube filmpje, dat is echt eng.

Keerzijde

@Carharttguy • 8 november 2018 15:47

Nee, kijk maar bij ons met Philip Freriks a.k.a. "De Hakkelaar"
Dat was een typisch voorbeeld van een (goede?) journalist die ABSOLUUT NIET kon voorlezen.
Wat was dat steeds weer een drama zeg.
Dan nog liever zo'n AI lezer, die de klemTOON af en toe kompleet verkeerd legt

Liberteque @Keerzijde • 8 november 2018 17:57

Wat een superlatieven zeg.. lol zo erg was het nu ook weer niet

Calamor @Verwijderd • 8 november 2018 16:03

Vind dit ook wel een enge kant opgaan. Al kijk ik zelf maar zelfde nieuws op tv en zal er maar weinig merken. Maar door dit wordt het steeds meer lastiger om filmpjes te geloven dat het echt is. Dat zie je al met het nep Obama youtube filmpje. En het wordt alleen maar echter, dat zie je al bij films.

Kenzi

China

8 november 2018 13:43

Neem dit met een dikke korrel zout.
Zie de "AI" translator van iFlytek wat gewoon een persoon van vlees en bloed achter het scherm bleek te zijn > https://www.scmp.com/tech...omated-speech-translation

Dit soort dingen komt zo vaak voor in China. Deels omdat de marketingpraatjes voor lopen op de techniek en deels omdat iedereen snel wil cashen. Toon snel een demo (of het nou echt is of niet) en dan gauw IPO! Snel verdiend, en daarna verdwijnt het bedrijf weer.

somososan 8 november 2018 13:36

slechte lip sync moet ik zeggen. zijn hele kaak beweegt niet eens. Komt niet bepaald door de turing test heen.

Djesse8999 @somososan • 8 november 2018 13:40

Het is bij de test van belang dat de omstandigheden zodanig zijn dat het om intelligentie gaat en niet om andere eigenschappen zoals bijvoorbeeld uiterlijke verschijning;

https://nl.wikipedia.org/wiki/Turingtest

somososan @Djesse8999 • 8 november 2018 13:45

Ik begrijp wat de Turing test inhoud, maar mijn aanname bij deze ai nieuwslezer is dat het vooral audiovisueel gelijk is. En daar falen ze nog mee. Maar dat ligt denk ik eerder aan de culturele bias van de Aziatische nieuwslezer vorm, in het westen zijn we wat expressiever met lichaamstaal.

meer ontopic:
Is dit echt AI? het lijkt hier meer gebruikt als verzamelnaampje voor deep learning.

[Reactie gewijzigd door somososan op 29 juli 2024 03:01]

bbob

China
Kunstmatige intelligentie

@somososan • 8 november 2018 14:19

Nee dit is geen AI.

Hij beweegt een beetje maar niet goed genoeg om voor echt mens door te gaan. Lip bewegingen moeten met de ingegeven text synchroon lopen, werkt ook niet echt.

Wil het meer ai zijn zul je een ai systeem duizenden euro aan video moeten laten analyseren. het systeem moet dat uitgesproken worden herkennen, matchen aan lip bewegingen maar ook de mimiek van het de mens. Dat kan ook glimlach, verbazing, met je ogen knipperen. Bewegen van je handen.
Als je het over ai wil hebben zul je dit allemaal moeten meenemen zodat je een unieke virtuele ai persoon krijgt die dynamisch kan reageren op tekst en situatie.

Zo ver zijn we nog lang niet maar dit is een leuk begin.

Fireshade @bbob • 9 november 2018 10:08

Wil het meer ai zijn zul je een ai systeem duizenden euro aan video moeten laten analyseren. het systeem moet dat uitgesproken worden herkennen, matchen aan lip bewegingen maar ook de mimiek van het de mens. Dat kan ook glimlach, verbazing, met je ogen knipperen. Bewegen van je handen.
Als je het over ai wil hebben zul je dit allemaal moeten meenemen zodat je een unieke virtuele ai persoon krijgt die dynamisch kan reageren op tekst en situatie.

Je doelt naast intelligentie op fysiek een mens nabootsen. Dat fysieke heeft helemaal niets met (kunstmatige) intelligentie te maken. Een ijzeren doos zou (in de toekomst) gewoon kunstmatig intelligent gemaakt kunnen zijn. Het lijkt niet op een mens, maar is wel AI.

bobberg @somososan • 8 november 2018 17:32

Nee, dit is niet echt AI. De tekst wordt ingetypt zoals in het filmpje beschreven staat en door text to speech software vertaald naar spraak. Dit kan al best lang met software of cloud-services van meerdere bedrijven. Een van de betere waar je als developer gebruik van kan maken is van Google genaamd Wavenet Sowieso is de definitie van AI nog erg verspreid en niet echt duidelijk. Je zou dit op zijn best een zwakke AI kunnen noemen, omdat het poogt echt te lijken.

Op dit moment zijn er twee dingen bij deze nieuwslezer waar volgens mij machine learning is toegepast: text to speech software (niet met de stem van de echte nieuwslezer) en er is een algoritme wat bij de bijhorende zinnen een bepaald beeld-flow laat zien, wat ik enigszins knapper vind, maar ook hier zie je dat het nog verre van perfect is. In mijn definitie zou sterkere AI bijvoorbeeld echt een conversatie moeten kunnen houden en gedrag vertonen als die van een mens. Omdat de conversatie nu een one-way street is, kan je vind ik niet echt spreken van gedrag. Stel je voor, een AI die tijdens het nieuws vragen aan reporters zou kunnen stellen. Wel verbazend om te zien dat zelfs nieuwslezers nu weg geautomatiseerd kunnen worden.

[Reactie gewijzigd door bobberg op 29 juli 2024 03:01]

Travelan @somososan • 8 november 2018 13:41

Er zijn altijd mensen die bij een vooruitgang in technologie gelijk gaan klagen dat het niet direct is wat ze hadden gehoopt.

Technology moves step by step. You can't skip one step and expect anything to happen. This is not science fiction.

Medabi3 8 november 2018 13:59

Stiekem toch wel een beetje eng, vooral als dit echt realistisch gaat worden. 24/7 propaganda, sensationele headlines zodat de hele bevolking hier niet meer raar van opkijkt, vijandelijke politieke video's gemaakt met een AI nieuwslezer enzovoorts. Maar goed, het zal ook wel voor goed gebruikt kunnen worden.

Carharttguy @Medabi3 • 8 november 2018 14:20

Alsof je daarvoor ook een 'AI' nieuwslezer voor nodig hebt. Zie Noord-Korea, daar doen ze het gewoon met mensen.

GateKeaper @Carharttguy • 8 november 2018 17:39

Alleen Noord-Korea? Ik twijfel wel eens of het nieuws hier in het westen echt zo betrouwbaar is als we denken. Zie ook deze: https://www.youtube.com/watch?v=ksb3KD6DfSI

Medabi3 @Carharttguy • 8 november 2018 14:24

Een AI maakt dit allemaal wel een stuk makkelijker natuurlijk.

Liberteque @Medabi3 • 8 november 2018 17:55

Nou een ingebedde drone die precies doet wat er gezegd wordt lijkt me simpeler voor propaganda doeleinden dan dit..

analog_ @Liberteque • 8 november 2018 20:10

Je kan gepersonaliseerde boodschappen in je nieuwsbericht stoppen met deze techniek.

Liberteque @analog_ • 9 november 2018 14:18

Die kunnen dan toch ook op de prompter?

analog_ @Liberteque • 10 november 2018 00:25

Niet voor 1 miljard verschillende boodschappen.

Martinspire 8 november 2018 13:36

En waarom doen ze dit met AI en niet met de nieuwslezer? Prestige of omdat er anders teveel zaken moeten worden ingesproken (je maakt tenslotte sneller een tekstbestand dan een video)

CopyCatz @Martinspire • 8 november 2018 13:58

Mensen zijn duur he, en afhankelijk van het regime wil het natuurlijk nog wel eens voorkomen dat een persoon van vlees en bloed iets niet wil voorlezen. Daarnaast zijn sommige nieuwslezers toch al spreekbuizen, dus wat is er makkelijker dan die spreekbuis digitaliseren. Zal wel weer gedownvote worden, maar je kan je gaan afvragen waar dit heen gaat. Op deze manier kun je onwelgevallige journalisten gewoon laten verdwijnen en ze gewoon op tv laten doorleven.

Medabi3 @CopyCatz • 8 november 2018 14:02

Niet alleen dat. Ook kan je dit als een politiek wapen gebruiken zodra je politici kan nabouwen met deze software. Dan kan je een flink aantal propaganda uitzenden waarop het lijkt dat een politici van een (vijandig) land heel duivels is.

MPC60 @Medabi3 • 8 november 2018 15:03

Je hebt al technieken waarmee je complete interviews kan faken die bijna niet van echt te onderscheiden zijn.

Dark Angel 58 @CopyCatz • 8 november 2018 18:05

Mensen zijn duur?
Nee hoor, geld is het probleem... Zolang geld nog bestaat... kijken we naar de kosten!

Verwijderd 8 november 2018 13:40

De AI is zodat de nieuwslezer kan improviseren wanneer er iets fout gaat met de tekstinvoer?

Mooie ontwikkeling, en ik weet niet in hoeverre dit in games en animatiefilms wordt gebruikt, maar als dit een beetje goed wordt doorontwikkeld heb je binnenkort geen voice actors meer nodig. En kun je geanimeerde spellen/films voor verschillende markten uitbrengen met een goede lipsync dat voor iedere spraak anders moet zijn