Chinese AI voor maken plaatjes geeft geen resultaat bij politiek gevoelige input

ERNIE-ViLG, een Chinees alternatief voor onder meer Dall-E om afbeeldingen te genereren aan de hand van input via tekst, geeft geen resultaat bij politiek gevoelige input. De software weigert onder meer dienst bij gebruik van namen van politici en woorden als Tiananmen.

Ook bepaalde woorden die te maken hebben met revolutie en democratie lijken geen resultaat op te leveren, meldt MIT Technology Review. De software is onderdeel van Wenxin, een project van de Chinese techgigant Baidu. Een demo van de software verscheen eind augustus online.

Het gebruik van filters is gebruikelijk bij dergelijke systemen. Ook Dall-E blokkeert bijvoorbeeld input van seksuele woorden, beelden van medische handelingen en gezichten van bekende mensen. Het is voor het eerst dat een dergelijk systeem een filter heeft die geen resultaat geeft bij input die in een enkel land politiek gevoelig ligt. Het is gebruikelijk voor Chinese software om resultaten die politiek gevoelig liggen in het land te blokkeren.

De software gaf tot deze week als foutmelding terug dat er 'gevoelige woorden waren gevonden', maar inmiddels heeft Baidu dat aangepast naar 'de content die is ingevoerd voldoet niet aan de relevante regels'. Het is onbekend welke termen de software precies filtert; een lijst daarvan is niet beschikbaar.

ERNIE-ViLG, Chinese AI-plaatjesmaker van Baidu
ERNIE-ViLG, Chinese AI-plaatjesmaker van Baidu

Door Arnoud Wokke

Redacteur Tweakers

15-09-2022 • 11:54

52

Reacties (52)

Sorteer op:

Weergave:

Ik vermoed dat "Stable Diffusion" en Midjourney al meer gebruikt worden dan Dall-E 2 (en die Chinese en Russische tegenhangers van Dall-E op korte termijn beperkte impact hebben omdat er nu al zoveel AI art models zijn).

Eerder had ik nieuws gesubmit over MidJourney en het opensource gaan van Stable Diffusion, maar helaas is dit niet opgepikt door Tweakers. Ik denk wel dat deze twee inmiddels even groot (en misschien ook belangrijker) zijn als Dall-E 2. Stable Diffusion wordt sinds de opensource release (22 aug dus nog maar drie weken geleden) gebruikt door een hele reeks sites en mobile apps, waaronder:

- https://beta.dreamstudio.ai/ (van de ontwikkelaars van Stable Diffusion)
- https://pixelz.ai/
- https://www.starryai.com/
- https://nightcafe.studio/
- https://www.artbreeder.com/beta
- https://replicate.com/ (bied een heleboel AI "models" om te gebruiken/upscalen/style-transferren)
- https://huggingface.co/spaces/stabilityai/stable-diffusion
- iOS app "Wonder- AI Art generator"
- Photoshop plugin: https://www.getalpaca.io/ (in private beta)
- Photoshop plugin: https://christiancantrell.com/#ai-ml

Het voelt ook alsof die release al een jaar geleden is.

Ook leuk, op https://lexica.art/ kan je vrijwel alle afbeeldingen terugvinden die gegenereerd zijn in de Stability Diffusion beta op Discord. Ik kon daar ook mijn afbeeldingen terugvinden :).

De impact van AI art gaat op veel fronten trouwens:
- inspiratie/moodboarding voor schilders: https://youtu.be/GwagpfL_BEU
- maken van videoclips bij muziek: https://www.instagram.com...M-cX/?igshid=YmMyMTA2M2Y=
- voor achtergronden in website designs: https://youtu.be/-Emf7un0Wt4
- genereren van art assets voor games: https://www.youtube.com/watch?v=blXnuyVgA_Y

De drie grote westerse AI's (Dall-E 2, MidJourney en Stable Diffusion) hebben wel duidelijk allemaal een eigen "stijl". Ze kunnen ook elkaar aanvullen. Je kan de output van de ene als input bij de andere gebruiken en dan vragen om variaties, verbeteringen of met inpainting delen veranderen of met outpainting de afbeeldingen uitbreiden.
Daar eindigt het ook niet. Je kan je output door allerlei AI's gooien, bijvoorbeeld een AI die gespecialiseerd is in het fixen/verbeteren van gezichten en daarna door een AI die upscaling doet. Er zijn dan ook al tools zoals chaiNNer waarmee je een afbeelding door een reeks AIs kan laten gaan.

Als je meer wil weten over AI art zijn dit momenteel goede bronnen:
- "MattVidPro AI" kanaal op YouTube - https://www.youtube.com/channel/UC5Wz4fFacYuON6IKbhSa7Zw
- Scott Detweiler's kanaal op YouTube - https://www.youtube.com/c/ScottDetweiler

En een paar leuke afbeeldingen die ik heb gegenereerd die op m'n Instagram staan:
- Owl gentleman - https://www.instagram.com/p/ChNwPtJjDy-/ (Stable Diffusion)
- Cat homies just cruisin' - https://www.instagram.com/p/ChVWYOdjnIG/ (Stable Diffusion)
- Beagle cat with a hat - https://www.instagram.com/p/Cgk8DsLDIkz/ (MidJourney)
- Auto's en bliksem - https://www.instagram.com/p/ChQWGJEjy7A/ (MidJourney)
- Nog wat auto's met mist en lichteffecten - https://www.instagram.com/p/ChQVQwEDD42/ (MidJourney)
- Een sneeuwvos - https://www.instagram.com/p/ChYIH6MDHnj/ (Stable Diffusion)

De meeste afbeelding heb ik een paar uur voor lopen klooien met aanpassen van prompts en bekijken van variaties. Maar ik had ze nooit zelf kunnen tekenen ;).

[Reactie gewijzigd door spellcoder op 22 juli 2024 15:15]

Promopost voor wat? Niet voor mij... ik ben webdeveloper en als hobby doe ik af en toe aan fotografie en het maken van muziek in GarageBand. Of voor de technologie? Maar dit is hardstikke mooi speelgoed en je kan er heel grappige dingen mee maken (met rare prompts zoals "fraggle salad" en kijken wat de AI er van maakt).

Maar kunst is niet dood ofzo. Er zal een shift zijn in waarde en beoefenen van bepaalde soorten kunst. De AI maakt geen schilderwerken met echte relief, interactiviteit etc en snapt momenteel ook nog niet hoe objecten en mensen met elkaar interacteren.. Het zal misschien wel de aandacht op timelines bij bijvoorbeeld Instagram verdringen, dus "echte" kunstenaars moeten dan terugvallen op kanalen waar ze zich richten op "echte" kunst.. Maar Instagram, Facebook etc worden toch al geregeerd door dans-video's enzo.

Om gericht AI art te maken moet je trouwens allerlei stylen, artiesten, belichtings-termen, fotografie termen gebruiken. Dus je zou ook kunnen zeggen dat het mensen bewust maakt van allerlei kunststromingen.

[Reactie gewijzigd door spellcoder op 22 juli 2024 15:15]

Kijk, daar zeg je het zelf al. "Om gericht AI art te maken moet je trouwens allerlei stylen, artiesten, belichtings-termen, fotografie termen gebruiken".. Je gebruikt dus werkelijk het eerdere werk van anderen als basis om je "eigen" werk te maken. Vind je dat zelf eerlijk naar die artiesten toe die het grondwerk gelegd hebben en jaren geïnvesteerd hebben in hun eigen stijl te ontwikkelen om dan nu in enkele weken herleid te worden naar een prompt van enkele woorden?

[Reactie gewijzigd door Katsu op 22 juli 2024 15:15]

90% van de "art" is gewoon bladvulling of decoratie. Stockfoto's, kaften van boeken, enz. Dit kan gerust door een AI gegenereerd worden.

Wat een AI niet kan, is iets nieuws maken. Ik volg enkele artiesten (muzikanten) die ofwel een eigen genre geschapen hebben, ofwel binnen dit genre hun eigen koers varen. De kans dat een AI hetzelfde kan, is nul. Uiteraard kan een AI wel generieke rommel maken, dus de les is: maak geen generieke rommel.
iedereen kopieert elkaar, de pc heeft dit alleen gestreamlined.
Spijtig dat posts over computers zoveel bijval krijgen, ten koste van de broodwinning van zovele typisten.
Ik denk dat je niet bang hoeft te zijn voor dit soort tech. Uiteindelijk gaan we naar een toekomst waarin mensen kunst maken omdat ze het leuk vinden, niet omdat het 'nodig is' (gezien AI het dan ook wel kan). En liefhebbers (kijkers) van de kunst zullen het blijven kopen van echte mensen, omdat ze het een leuk idee vinden dat het door echte mensen is gemaakt.

Een beetje zoals schaakcomputers: die kunnen het al tijden veel beter dan mensen, toch bestaat schaak nog steeds. Want mensen vinden dat mooi om te spelen, en/of om anderen het te zien spelen.
Erg kort door de bocht. Mensen creëren, gebruiken daarbij tools, hulpmiddelen en alles wat te bedenken valt. Ik zie Dall-e2 en Midjourney als tools om nieuwe platen te creëren.

De waarde van een creatie hangt volgens mij niet perse af van hoe het precies is gemaakt. Ik ben soms een aantal volle werkdagen bezig met 1 foto, soms meerdere werkweken met 1 animatie. En de combinatie van prompt to image tools en andere bewerkingsprogramma's is pas echt interessant als de gebruiker ze (creatief) inzet.

Een vrij simpel concept maar met een leuk resultaat:
https://youtu.be/C9ImnP2EIy4
Desintermediatie wordt altijd verdedigd met het argument dat je niet bang moet zijn van computers als je een persoonlijke band met je publiek kan opbouwen. En dat is waar. Maar daarmee krijgt men vaak ook meer dan wat men verhoopte (een "persoonlijke band").

Degenen die het best de computer kunnen verslaan in het opbouwen van een persoonlijke band met hun publiek, zijn degenen die functioneel gesproken charismatische sekteleiders zijn. Dat wordt niet zo genoemd omdat dat een term is uit een andere discipline, de godsdienstwetenschappen, maar dat vat wel perfect de kenmerken van het soort persoon dat in staat is een sterk persoonlijk merk uit te bouwen in een influencer-economie. De ironie is dan dat tech nerds een nieuwe hyperreligieuze samenleving gecreëerd hebben terwijl ze persoonlijk vaak uitermate minachtend staan t.a.v. religie.

[Reactie gewijzigd door EmbarrassedBit op 22 juli 2024 15:15]

Die _wilde_ je niet investeren, niet "wou".

Zeg je dat ook als iemand een CD opzet? Je zou zelf kunnen leren piano te spelen maar dat "wou" je niet.

Als iemand een foto maakt? Je had een schilderij kunnen maken maar dat "wou" je niet.

Je had te voet kunnen gaan i.p.v. met de trein maar dat "wou" je niet.

Je had bomen kunnen hakken in het bos maar dat "wou" je niet.
Als je mensen moet aanvallen op hun spelling dan geef je enkel aan dat je zelf niks inhoudelijks te vertellen hebt.
8)7
Voor het enkelvoud zijn wilde en wou allebei correcte verledentijdsvormen.

Voor het meervoud is wilden de correcte verledentijdsvorm. In de spreektaal wordt voor het meervoud weleens wouden of wouen gebruikt, maar in verzorgd taalgebruik kunt u die vormen beter vermijden.
https://www.vlaanderen.be...n/wilde-wou-wilden-wouden
Als je de moeite neemt om de 'grammar-nazi' uit te hangen, neem dan ook even de moeite om te kijken of waar je over struikelt ook wel echt fout is. Want beide vormen zijn correct.

Zie bv. https://taaladvies.net/willen-wilde-of-wou-wilden-of-wouden/ en ook https://onzetaal.nl/taalloket/wilden-wouden-wouen-wouwen

Ik wou dat het anders was...
Daar kan ik alleen maar één ding op zeggen..... wauw (of wouw? wou?)!
Jammer dat promoposts zoals deze die in wezen de broodwinning van een hoop echte artiesten afneemt zoveel bijval krijgt.
Je had ze wel zelf kunnen tekenen, mits oefening en tijd. Maar die wou je niet investeren dus here we are.
Oke, maar de post is informatief en om nou gelijk zo subtiel te gaan bashen...

Je bedoelt waarschijnlijk de echte programmeur? Ik denk dat die persoon zelfs wel een engineer was, die die AI models codeerde.

Maar bij artiest denk ik eerder aan het circus waar een act wordt opgevoerd. Die act kan je evt gewoon kopen, zoals Hans Kazan doet.

Bovendien, wat moet een handje vol kwasten nou tegen een leger aan servers? Die kwasten kunnen toch gewoon servers gaan schilderen?

[Reactie gewijzigd door Bulkzooi op 22 juli 2024 15:15]

Ik ben niet heel goed thuis in de Chinese wereld, maar volgens Google is "Tianmen" een berg. Wil iemand uitleggen waarom dat politiek gevoelig is/waarom die input niet wordt geaccepteerd?

Edit: volgens mij is het een typo in het artikel en moet het Tiananmen zijn, wat een plein is

[Reactie gewijzigd door maurict op 22 juli 2024 15:15]

Dat gaat over het studentenprotest op het Tiananmen-plein in 1989, welke door de Chineze overheid met bizar harde hand werd neergesabeld. Dit wordt gezien als een grote mensenrechtenschending in de verdere wereld, maar China wil doen alsof het nooit gebeurd is.
Ik denk dat er ergens een 'an' verloren is gegaan in het artikel.
Misschien gebruikt Tweakers een Chinees text input script die 'gevoelige' woorden automatisch aanpast :+
Tiananmen square. Google maar eens. Zeer gevoelig onderwerp daar
Klinkt heel controversieel, tot je erachter komt dat we in het westen dingen die te maken hebben met naakt of geweld censureren in dergelijke AIs (gedaan door midjourney, dall-e en basically alle grote partijen). Natuurlijk een ander soort probleem maar wel hilarisch om dan net te doen alsof wij geen (/ alleen maar ""goede"") censuur hebben.
"Ja maar in China gebeurt die censuur op basis van de verwachtingen van de Communistische Partij van China. Zie je dat woord 'communistisch' in de naam? Dat is een oud woord voor 'slecht'. In onze vrije samenlevingen is er geen censuur, enkel 'moderatie'. Wanneer een handjevol dertigers en veertigers in Californië vermoeden dat bepaalde meningen en feiten slecht zouden kunnen zijn voor de aandelenkoersen van hun bedrijven, omdat het gekende kliekje van deugmensen in universiteiten en de media bepaald heeft dat iets niet klopt of dat het laakbaar is en de overheid vraagt in te grijpen, dan dragen ze hun legertje lageloonwerkers in de Filippijnen op om je te matigen. Dat is helemaal anders dan in China, want je hebt theoretisch de mogelijkheid om je eigen social media-platform uit de grond te stampen."

Edit: typo.

[Reactie gewijzigd door EmbarrassedBit op 22 juli 2024 15:15]

Wat controversieel is veranderd met de tijd. Elvis Presley werd ook vulgair genoemd in zijn tijd. Nu vinden we dat preutse onzin. En als je kijkt wat gewoon normaal gevonden wordt tegenwoordig omtrent seksuele uitspattingen. Draaien onze voorouders zich om in hun graf.

Dat is het zelfde met censuur. Wat de één vindt wat niet kan zou een volgende niets uitmaken.

Wel mogen de communistische regeringen die nu nog bestaan snel verdwijnen. Al heb ik het idee dat we er zelf uiteindelijk ook weer op terug komen. Maar dan in een modernere versie. De samen en inclusieviteit van tegenwoordig stuurt langzaam die kant op.
Was te verwachten, het was pas echt groot nieuws geweest als het niet zo was :D
Tja was te verwachten, een chinees alternatief wat zich ook gelijk aan de chinese richtlijnen houdt. Zo kunnen ze de andere AI-software verbieden en de inwoners naar deze variant sturen.
Winnie-the-Pooh is ook politiek gevoelig blijkbaar..

Overigens werken pro-chinese politiek gevoelige inputs wel gewoon..

[Reactie gewijzigd door Verwijderd op 22 juli 2024 15:15]

Mag winnie de pooh wel?
Een randvoorwaarden van het gebruik van Chinese software. Ik zie het probleem niet. Iemand kan een alternatief maken als ze er wel problemen mee hebben natuurlijk.
Behalve als ze in China wonen of daar familie hebben, "natuurlijk." Dan kan die theoretische iemand of zijn/haar familie heel handig verdwenen worden.
Dan kan die theoretische iemand of zijn/haar familie heel handig verdwenen heropgevoed worden.
Fixed, kameraad. :+
Het zou een randvoorwaarde voor elk commercieel bedrijf moeten zijn.


Bedrijven willen liever niks met politiek te maken,
je krijgt dan gesodemieter zoals in de VS waar er een ongezonde relatie bestaat tussen (landelijke) overheid (vertegenwoordigders), grote multi-nationals en MSM.

Oa Facebook en Twitter hebben al aangetoond dat ze makkelijk te sturen zijn en google en apple hebben ook al een enge record mbt privacy en (locatie) tracking. Links lullen, rechts vullen.
Niet alleen in de VS hoor. Ook gewoon hier in het gave Nederland. Overal in de wereld. Als er een entiteit bestaat die het kan betalen om mensen om te kopen en er mee weg te komen via een legertje advocaten gaat macht hebben over veel mensen en politici.
Mogelijk weten veel mensen dit niet maar DALLE2 doet vanaf het begin ook al een soortgelijke 'aanpassingen' alleen dan met inclusiviteit: Reducing Bias and Improving Safety in DALL·E 2

This technique is applied at the system level when DALL·E is given a prompt describing a person that does not specify race or gender, like “firefighter.”

Dit is problematisch en uiteraard 'politiek'. Dat is een van de reden dat Stable Diffusion volledig open-source vrijgegeven is.

We zien nu dus diverse variaties uitkomen met alle positieve en negatieve aspecten van de mensheid. Precies zoals open-source bedoelt is... Er schijnt zelfs al een bot te zijn die iedere drie minuten 'Fury porn' genereert.. Het internet is een golden shower van creativiteit :+
Bedoel je die bot die elke 40 seconden een afbeelding genereert van de blote kont en balzak van een fursona?
Van de rest wel netjes een bron geven maar van de furry porn bot niet. Jammer. :p
https://www.vice.com/en/a...s-furry-porn-ai-generator Hier is een Vice artikel over de bot met wat relevante links in...
Er schijnt zelfs al een bot te zijn die iedere drie minuten 'Fury porn' genereert.. Het internet is een golden shower van creativiteit :+
Fury porn? Woede/wraakporno? Aw, yeah. :+

[Reactie gewijzigd door The Zep Man op 22 juli 2024 15:15]

Wat problematisch is, is dat de meeste datasets zeer biased zijn. Daar een tegenmechanisme voor inbouwen is juist goed en niet per se politiek.

Je kunt het natuurlijk wel politiek maken. En dit tegen bias in sturen kan op zich weer voor andere problemen zorgen, maar het lost er meer op, vermoed ik.
Wat problematisch is, is dat de meeste datasets zeer biased zijn.
Gezien de training data gemaakt is door mensen zullen alle datasets biased zijn.

Daar een tegenmechanisme voor inbouwen is juist goed en niet per se politiek.
Politiek is de wijze waarop in een samenleving de belangentegenstellingen van groepen en individuen tot hun recht komen.
Of het goed of slecht is, is perspectief. Vind je het ook goed wat deze chinese variant doet?
De 'founder' van Stable Diffusion geeft hier meerdere voorbeelden van in een interview (erg interessant als je in AI zit): The Man behind Stable Diffusion

En dit tegen bias in sturen kan op zich weer voor andere problemen zorgen, maar het lost er meer op, vermoed ik.
Als je naar geschiedenis van de mensheid kijkt, dan zie je dat de meer wij ons ermee bemoeien, de meer problemen het creëert. Verder remt het veelal enkel ontwikkelingen...

Ik begin wel: Wie vindt jij dat de 'biases' en 'tegenmaatregelen' moet bepalen? De Chinezen? De Amerikanen? Of de Russen? ;)
Als je naar geschiedenis van de mensheid kijkt, dan zie je dat de meer wij ons ermee bemoeien, de meer problemen het creëert. Verder remt het veelal enkel ontwikkelingen...
De geschiedenis van de mensheid heeft nu voor het eerst ML/AI. En het bijsturen gebeurt ook op andere vlakken, denk aan iets stoms als smart devices die elektriciteit verbruiken als het groener is.

Biases gaan over tegensturen, niet over censuur, dat is iets heel anders en niet vergelijkbaar met bias.

Het gaat nu ook over informatie, niet over het maken van politieke beslissingen. Als je daar aan alle kanten gaat bijsturen en te veel fouten maakt krijg je de onvrede die je nu in de samenleving hebt. Da's een beleidsprobleem, geen informatieprobleem imo.
Mogelijk weten veel mensen dit niet maar DALLE2 doet vanaf het begin ook al een soortgelijke 'aanpassingen' alleen dan met inclusiviteit: Reducing Bias and Improving Safety in DALL·E 2

This technique is applied at the system level when DALL·E is given a prompt describing a person that does not specify race or gender, like “firefighter.”

Dit is problematisch en uiteraard 'politiek'. Dat is een van de reden dat Stable Diffusion volledig open-source vrijgegeven is.

We zien nu dus diverse variaties uitkomen met alle positieve en negatieve aspecten van de mensheid. Precies zoals open-source bedoelt is... Er schijnt zelfs al een bot te zijn die iedere drie minuten 'Fury porn' genereert.. Het internet is een golden shower van creativiteit :+
lol, ik kan me nog herinneren dat Trump Truth Social begon, na een fork van Mastodon.

En... Open Source is niet gratis; het betreft vooral een development methodiek. Maar maak je met 3 billion en 2 trillion parameters maar geen zorgen over de diversiteit van de uitkomst van de AI modellen in kwestie.

Het wordt tijd voor een review van wat worfklows en chain-methodieken van AI-modellen zonder taal voorkeur.

[Reactie gewijzigd door Bulkzooi op 22 juli 2024 15:15]

Waarvan akte! Geen nieuws is ook nieuws.

Op dit item kan niet meer gereageerd worden.