Chinees staatspersbureau introduceert 'ai-nieuwslezer'

Het Chinese staatspersbureau Xinhua gaat een 'ai-nieuwslezer' inzetten. De presentator is een computergegenereerde kopie van een echte nieuwslezer bij het bureau en zijn stem is ook gebaseerd op die van zijn tegenhanger van vlees en bloed.

De digitale Zhang Zhao stelt zich voor in een kort YouTube-filmpje. Hoewel de 'nieuwslezer' redelijk weet te overtuigen, valt wel duidelijk te zien dat bij de mond een aardig uncanny valley-effect aan de gang is. Ook zijn stem klinkt vooralsnog als een verveelde robot, hoewel dat wellicht ook het geval is bij de Zhang Zhao van vlees en bloed.

De presentator wordt gebracht als zijnde een vorm van ai, maar het is niet helemaal duidelijk of dat wel zo is. Wat we zien is een geanimeerd 3d-model van een nieuwslezer met lipsynchronisatie voor de text-to-speech. Niets daarin duidt op een kunstmatige intelligentie die zelfstandig bepaalde taken kan uitvoeren. Ook zijn voorleestekst wordt door mensen ingevoerd.

Xinhua zet in totaal twee van deze nieuwslezers in; eentje voor Engels en eentje voor Chinees, hoewel ze vermoedelijk hetzelfde uiterlijk hebben. De nieuwslezer wordt per direct ingezet op de verschillende kanalen van Xinhua. Volgens de South China Morning Post is de ai-nieuwslezer tot stand gekomen in samenwerking met het bedrijf achter de Chinese zoekmachine Sogou.

Op het gebied van robot-nieuwslezers is Japan ook aardig aan de weg aan het timmeren. De '23-jarige' Erica moet ergens in 2018 in Japan aan de slag gaan als nieuwslezeres. Zij is echter een echte robot en niet door een computer gegenereerd.

Door Mark Hendrikman

Redacteur

08-11-2018 • 13:33

45 Linkedin

Reacties (45)

45
45
21
2
0
20
Wijzig sortering
Beetje eng dit, ik reken er nog steeds op dat echte mensen met inzichten, integriteit en eigen denk vermogen mij het nieuws brengen.. en niet een "puppet" dit letterlijk alles leest en het op een "menselijke" manier brengt.
De gemiddelde nieuwslezer/es van vlees en bloed doet over het algemeen ook niks anders dan de autocue voorlezen. Ik voorspel dan ook dat een aardige percentage van de nieuwslezers/sen gemakkelijk vervangen kunnen worden door robots.
De gemiddelde nieuwslezer(es) is wel een journalist die gebeten is door nieuws, niet zomaar mensen die toevallig kunnen lezen..

Soms zijn er toch ook kleine interviews tijdens het nieuws, en een bepaalde (gedempt natuurlijk) emotie tijdens het nieuws kan naar mijn inziens ook de nieuwservaring verbeteren.
Dan heb jij deze nooit gezien:

https://www.youtube.com/watch?v=ksb3KD6DfSI

Lokale nieuwszenders die allemaal exact hetzelfde vertellen. Ik geloof niet dat dat hier in Nederland anders is. Misschien wat afwijkende teksten, maar als je kranten hier lees, is 't ook allemaal 1:1 ANP knip en plak werk. Onze tv zenders, en daarmee nieuwskanalen, zijn ook eigendom van slechts 2 grote media bedrijven.
Ik heb in België toch een andere kijk op ons medialandschap. We hebben qua nieuws eigenlijk 2 grote keuzes: De openbare omroep één en de commerciële omroep VTM. Er is een duidelijk verschil tussen de twee, maar toch allebei kwaliteitsvol, veel beter dan dat Youtube filmpje, dat is echt eng.
Nee, kijk maar bij ons met Philip Freriks a.k.a. "De Hakkelaar"
Dat was een typisch voorbeeld van een (goede?) journalist die ABSOLUUT NIET kon voorlezen.
Wat was dat steeds weer een drama zeg.
Dan nog liever zo'n AI lezer, die de klemTOON af en toe kompleet verkeerd legt ;)
Wat een superlatieven zeg.. lol zo erg was het nu ook weer niet
Vind dit ook wel een enge kant opgaan. Al kijk ik zelf maar zelfde nieuws op tv en zal er maar weinig merken. Maar door dit wordt het steeds meer lastiger om filmpjes te geloven dat het echt is. Dat zie je al met het nep Obama youtube filmpje. En het wordt alleen maar echter, dat zie je al bij films.
Neem dit met een dikke korrel zout.
Zie de "AI" translator van iFlytek wat gewoon een persoon van vlees en bloed achter het scherm bleek te zijn > https://www.scmp.com/tech...omated-speech-translation

Dit soort dingen komt zo vaak voor in China. Deels omdat de marketingpraatjes voor lopen op de techniek en deels omdat iedereen snel wil cashen. Toon snel een demo (of het nou echt is of niet) en dan gauw IPO! Snel verdiend, en daarna verdwijnt het bedrijf weer.
slechte lip sync moet ik zeggen. zijn hele kaak beweegt niet eens. Komt niet bepaald door de turing test heen.
Het is bij de test van belang dat de omstandigheden zodanig zijn dat het om intelligentie gaat en niet om andere eigenschappen zoals bijvoorbeeld uiterlijke verschijning;

https://nl.wikipedia.org/wiki/Turingtest

;)
Ik begrijp wat de Turing test inhoud, maar mijn aanname bij deze ai nieuwslezer is dat het vooral audiovisueel gelijk is. En daar falen ze nog mee. Maar dat ligt denk ik eerder aan de culturele bias van de Aziatische nieuwslezer vorm, in het westen zijn we wat expressiever met lichaamstaal.

meer ontopic:
Is dit echt AI? het lijkt hier meer gebruikt als verzamelnaampje voor deep learning.

[Reactie gewijzigd door somososan op 8 november 2018 13:48]

Nee dit is geen AI.

Hij beweegt een beetje maar niet goed genoeg om voor echt mens door te gaan. Lip bewegingen moeten met de ingegeven text synchroon lopen, werkt ook niet echt.

Wil het meer ai zijn zul je een ai systeem duizenden euro aan video moeten laten analyseren. het systeem moet dat uitgesproken worden herkennen, matchen aan lip bewegingen maar ook de mimiek van het de mens. Dat kan ook glimlach, verbazing, met je ogen knipperen. Bewegen van je handen.
Als je het over ai wil hebben zul je dit allemaal moeten meenemen zodat je een unieke virtuele ai persoon krijgt die dynamisch kan reageren op tekst en situatie.

Zo ver zijn we nog lang niet maar dit is een leuk begin.
Wil het meer ai zijn zul je een ai systeem duizenden euro aan video moeten laten analyseren. het systeem moet dat uitgesproken worden herkennen, matchen aan lip bewegingen maar ook de mimiek van het de mens. Dat kan ook glimlach, verbazing, met je ogen knipperen. Bewegen van je handen.
Als je het over ai wil hebben zul je dit allemaal moeten meenemen zodat je een unieke virtuele ai persoon krijgt die dynamisch kan reageren op tekst en situatie.
Je doelt naast intelligentie op fysiek een mens nabootsen. Dat fysieke heeft helemaal niets met (kunstmatige) intelligentie te maken. Een ijzeren doos zou (in de toekomst) gewoon kunstmatig intelligent gemaakt kunnen zijn. Het lijkt niet op een mens, maar is wel AI.
Nee, dit is niet echt AI. De tekst wordt ingetypt zoals in het filmpje beschreven staat en door text to speech software vertaald naar spraak. Dit kan al best lang met software of cloud-services van meerdere bedrijven. Een van de betere waar je als developer gebruik van kan maken is van Google genaamd Wavenet Sowieso is de definitie van AI nog erg verspreid en niet echt duidelijk. Je zou dit op zijn best een zwakke AI kunnen noemen, omdat het poogt echt te lijken.

Op dit moment zijn er twee dingen bij deze nieuwslezer waar volgens mij machine learning is toegepast: text to speech software (niet met de stem van de echte nieuwslezer) en er is een algoritme wat bij de bijhorende zinnen een bepaald beeld-flow laat zien, wat ik enigszins knapper vind, maar ook hier zie je dat het nog verre van perfect is. In mijn definitie zou sterkere AI bijvoorbeeld echt een conversatie moeten kunnen houden en gedrag vertonen als die van een mens. Omdat de conversatie nu een one-way street is, kan je vind ik niet echt spreken van gedrag. Stel je voor, een AI die tijdens het nieuws vragen aan reporters zou kunnen stellen. Wel verbazend om te zien dat zelfs nieuwslezers nu weg geautomatiseerd kunnen worden.

[Reactie gewijzigd door bobberg op 8 november 2018 17:48]

Er zijn altijd mensen die bij een vooruitgang in technologie gelijk gaan klagen dat het niet direct is wat ze hadden gehoopt.

Technology moves step by step. You can't skip one step and expect anything to happen. This is not science fiction.
Stiekem toch wel een beetje eng, vooral als dit echt realistisch gaat worden. 24/7 propaganda, sensationele headlines zodat de hele bevolking hier niet meer raar van opkijkt, vijandelijke politieke video's gemaakt met een AI nieuwslezer enzovoorts. Maar goed, het zal ook wel voor goed gebruikt kunnen worden. :P
Alsof je daarvoor ook een 'AI' nieuwslezer voor nodig hebt. Zie Noord-Korea, daar doen ze het gewoon met mensen.
Alleen Noord-Korea? Ik twijfel wel eens of het nieuws hier in het westen echt zo betrouwbaar is als we denken. Zie ook deze: https://www.youtube.com/watch?v=ksb3KD6DfSI
Een AI maakt dit allemaal wel een stuk makkelijker natuurlijk.
Nou een ingebedde drone die precies doet wat er gezegd wordt lijkt me simpeler voor propaganda doeleinden dan dit..
Je kan gepersonaliseerde boodschappen in je nieuwsbericht stoppen met deze techniek.
Die kunnen dan toch ook op de prompter?
Niet voor 1 miljard verschillende boodschappen.
En waarom doen ze dit met AI en niet met de nieuwslezer? Prestige of omdat er anders teveel zaken moeten worden ingesproken (je maakt tenslotte sneller een tekstbestand dan een video)
Mensen zijn duur he, en afhankelijk van het regime wil het natuurlijk nog wel eens voorkomen dat een persoon van vlees en bloed iets niet wil voorlezen. Daarnaast zijn sommige nieuwslezers toch al spreekbuizen, dus wat is er makkelijker dan die spreekbuis digitaliseren. Zal wel weer gedownvote worden, maar je kan je gaan afvragen waar dit heen gaat. Op deze manier kun je onwelgevallige journalisten gewoon laten verdwijnen en ze gewoon op tv laten doorleven.
Niet alleen dat. Ook kan je dit als een politiek wapen gebruiken zodra je politici kan nabouwen met deze software. Dan kan je een flink aantal propaganda uitzenden waarop het lijkt dat een politici van een (vijandig) land heel duivels is.
Je hebt al technieken waarmee je complete interviews kan faken die bijna niet van echt te onderscheiden zijn.
Mensen zijn duur?
Nee hoor, geld is het probleem... Zolang geld nog bestaat... kijken we naar de kosten!
De AI is zodat de nieuwslezer kan improviseren wanneer er iets fout gaat met de tekstinvoer? ;)

Mooie ontwikkeling, en ik weet niet in hoeverre dit in games en animatiefilms wordt gebruikt, maar als dit een beetje goed wordt doorontwikkeld heb je binnenkort geen voice actors meer nodig. En kun je geanimeerde spellen/films voor verschillende markten uitbrengen met een goede lipsync dat voor iedere spraak anders moet zijn :)

Dan kun je ook uitbreidingen in spellen met nieuwe dialogen snel verwerken.

[Reactie gewijzigd door 110124 op 8 november 2018 13:42]

Wat als hij gehackt word?
Dat kun je pas echt fake nieuws 2.0 de wereld in helpen...
Hadden beter wat geld in de spraak kunnen stoppen, dit niveau text to speech hadden we in de jaren 90 al.
Kan de NOS nog wat van leren.
NOS ai kiest straks zijn eigen truien uit en komt met ingebouwde retoriek: "kunnen mijn lippen dat zeggen, ja dat kunnen ze zeggen!".
Dionne Stax v. Fortnite... :9
Off topic: Nu al beter dan Tom Egbers 8)7
Waarom doet mij dit denken aan Deus Ex: Human Revolution ?? ;)

[Reactie gewijzigd door 923789 op 8 november 2018 13:44]

Ik dacht gelijk aan Eliza Cassan uit hetzelfde spel inderdaad.

Op dit item kan niet meer gereageerd worden.

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee