Stability AI brengt Stable Diffusion XL volgende maand uit

Stability AI brengt Stable Diffusion XL volgende maand uit. Het model om afbeeldingen te genereren is onder meer beter in het renderen van handen en kan bovendien nog steeds draaien op een moderne thuiscomputer.

Stability AI kondigde donderdagavond versie 0.9 aan, met de bedoeling versie 1.0 halverwege volgende maand uit te brengen. Stable Diffusion XL heeft zich in de twee maanden sinds de aankondiging van de bèta verder ontwikkeld, zo claimt de maker.

De systeemvereisten zijn onder meer een Nvidia RTX 20-kaart of nieuwer, met 8GB aan vram. Bij AMD-kaarten is 16GB aan vram nodig, maar AMD-kaarten werken alleen op Linux-systemen. Bij Nvidia-kaarten zijn Windows 10 en Windows 11 ook een optie. Het systeem moet in alle gevallen minstens 16GB aan werkgeheugen hebben. Stable Diffusion concurreert onder meer met Midjourney en OpenAI Dall-E voor het genereren van afbeeldingen.

Stable Diffusion XLStable Diffusion XLStable Diffusion XL

Door Arnoud Wokke

Redacteur Tweakers

22-06-2023 • 21:17

68

Reacties (68)

68
64
22
3
0
25
Wijzig sortering
Op MacOS gebruik ik DiffusionBee
Ik vind zelf Mochi Diffussion beter aangezien die Apple's CoreML volledig gebruikt en dus de Neural Engine benut. Dat betekent dus snellere resultaten met veel minder ram gebruik. Zitten ook veel meer functies in dat programma zoals meer ControlNet modellen ondersteuning en is ook gewoon open source ;)
Het enige nadeel is dat standaard modellen eerst wel omgezet moeten worden voor CoreML support, maar toch.
Thanks voor de tip!
Ik ben zelf aan het kijken naar een M2 Pro (mac Mini) of beter (Mac Studio), niet specifiek voor AI maar het is nice to have, ze hebben echter allemaal een 16‑core Neural Engine... De M2 Ultra heeft een 32‑core Neural Engine, maar dat zijn eigenlijk gewoon twee M2 chips aan elkaar geplakt. Ik ben of zoek naar benchmarks, maar ik kom niets consistent tegen. Dat is wellicht ook niet zo vreemd omdat er zo snel wordt veranderd/verbetert op dit vlak en het eigenlijk moeilijk bij is te houden als je daar niet 100% inzit...

Ik las hier en daar dat het omzetten van de modellen ook niet vlekkeloos gaat, ook al volg je de instructies...
Het wordt ook continu verbeterd. In macOS Sonoma zijn zelfs ook weer door Apple zelf toegevoegde verbeteringen die Stable Diffusion sneller maken. Benchmarks zijn moeilijk maar op mijn 10c M2 Pro Mini genereert een fotootje zo tussen de 10 en 25 seconden.
Goeie tip, dank.

ControlNet zit nu ook in Diffusion Bee trouwens.
Ja maar daar heb je niet alle modellen beschikbaar
Excuseer mijn n00bheid, maar ik heb net Mochi Diffusion gedownload en krijg te zien: "Could nog get model subdirectories". Hoe kan ik net als DiffusionBee snel aan de slag?
Dan is mijn advies om het na te vragen op de Github of op de Discord. Ik heb dat probleem namelijk niet meegemaakt.
Dankje.

Ik heb net handmatig een willekeurig model gedownload van huggingface.co/coreml/ en in de user/MochiDiffusion/models/ map gezet... dat werkt in ieder geval al :). Dus ik kan vooruit.
Hopelijk post er iemand tips hoe je het makkelijk draaiend krijgt op een windows PC :-)
Dat is allang geen groot ding meer met WSL, zal dit ook wel onder werken. Op alle grote desktop OS'en is het trouwens zo'n beetje geen ding meer met al die integraties van de andere systemen (of de mogelijkheden daartoe).

[Reactie gewijzigd door crazyboy01 op 23 juli 2024 14:40]

Een half jaar geleden was het nog niet mogelijk in WSL, wellicht dat dit veranderd is? Daarom draai ik het gewoon op Linux met ROCm.
Het is me inmiddels gelukt via WSL op WIN10 met Docker om ook mijn RTX3080M aan te spreken. Niet elke built herkent de videokaart, maar deze werkt voor mij.
Cool dat dat werkt!

Mag ik vragen waarom je met een Nvidia kaart het via WSL wilt doen? Voor AMD is het gewoon de betere optie door ROCm; voor Nvidia is het niet altijd gesneden koek met drivers. Mijn laptop met een 3070m en PopOS ging in het begin niet helemaal lekker tot ik bepaalde suspend features had uitgeschakeld.

Edit:
Enige reden waarom ik het zou doen is om mijn normale systeem schoon te houden van allerlei Python installaties (en of andere tooling).

[Reactie gewijzigd door Sp3ci3s8472 op 23 juli 2024 14:40]

Vooral hobbymatig leren werken met de hele stack. Ook nog op zoek naar antwoord op de vraag of ik beter dual boot kan doen of WSL voldoende is.

Daarnaast zag ik in veel tutorials dat Automatic1111 regelmatig breaking updates heeft. Nu kan ik in een extra container nieuwe releases testen.
Probeer: disco diffusion
Voor de huidige versie: gewoon de repo van automatic1111 clonen, datamodel downloaden en je bent er al (bij mij werkte het eigenlijk out of the box)
Yep, super makkelijk. Gewoon repo clonen, een datamodel online vinden (zijn er best veel), webui-user.bat starten en je kan gelijk beginnen.
Yes, zo doe ik het ook. Heb een PC headless draaien, dan kan je aan webui-user.bat ook nog --listen toevoegen zodat ie ook verbindingen van andere apparaten op t netwerk accepteert. Zo gebruik ik mijn laptop op t werk, via VPN, om afbeeldingen te genereren op de PC thuis.

Zelfs op mijn 1080TI is ie nog best vlot. Sneller dan op mijn MacBook Pro M2 waar ik het laatst lokaal op probeerde te draaien. Die is beduidend langzamer in genereren
same, werkt best goed OOB. ik ben allen compleet niet goed in dingen als controlnet en latent coupling. dus mijn images zijn vrij basic, maar het werkt.
Het is echt heel makkelijk, je hebt op github versies die je gewoon installeert. Stable Diffusion WebUI en EasyDiffusion bijvoorbeeld. WebUI is mijn favoriet, het is echt heel simpel om daar ook extension op te installeren om zelf een "LoRa" te trainen met je eigen foto's.
Google is your best friend.
Ik heb zelf een Photoshop integratie gemaakt. Als je dat hebt, kan je via de adobe exchange PixelPet installeren. Het draait op eigen servers zodat de gebruiker geen moeite heeft. Je kan gewoon de gratis credits er doorheen te jagen (+/- 500 images) zonder verdere verplichtingen. Dat geeft je de mogelijkheid om heel makkelijk even met Stable Diffusion te spelen. Er zit een groot aantal modellen en controlnets in. No strings attached.

Ik vind het zelf supertof maar de toestroom valt wat tegen. De kosten zijn hoog dus ik weet nog niet hoelang we doorgaan.
No offense, maar al die artiesten hebben het ook geleerd over de rug van zij die hen voor gingen. Van de klassieke (waar geen copyright meer op rust) tot de moderne (waar nog wel copyright op rust). Het aantal artiesten dat hun vak heeft geleerd zonder dat te doen op de basis van anderen zijn er zo goed als niet.

Vroeger tekende ik ook veel na van boekjes, TV en comics, nadat je dat als (keuze) vak op school kreeg, ging je men ook langs alle historische werken om de verschillende technieken te leren. En zo ging dat ook op vervolgopleidingen. Niet alleen vanuit een artistiek oogpunt, maar absoluut ook vanuit een commercieel oogpunt. Niet alleen tekenen, schilderen, maar ook fotografie, videografie, lettertypes maken, vormgeving van producten, etc.

En vergis je niet, er zijn zat artiesten die prima kunnen produceren in een stijl van iemand anders en velen doen dat ook. Vaak is het een combinatie van verschillende stijlen...

De ene artiest maakt een foto van een dier of mens en tekent/schildert die na, soms gebeurt er zelfs trace werk. Anderen hebben dat een keer gezien en kunnen dat daarna perfect reproduceren vanuit het geheugen. Dat maakt de ene niet een 'betere' of 'echtere' artiest dan de ander...

Daarnaast zijn er zat artiesten hier heel happy mee, want die hoeven nu niet meer een jaar te besteden aan het produceren van stenen of bomen uit spel XYZ. Die produceren (concept) art en AI kan vervolgens er een oneindige variatie van produceren. Sure, in de eerste instantie lijkt het alsof die artiest geen werk meer heeft voor een jaar, maar die kan nu dat jaar andere (concept) art produceren. Dus ipv. van primair bezig zijn met constant het wiel opnieuw uit te vinden kunnen ze nu doen wat de meeste artiesten wel leuk vinden, creatief zijn ipv. lopende band werk...

Hetzelfde met schrijvers, hoeveel schrijvers zijn opgegroeid met de boeken van anderen, veel daarvan rust nog steeds copyright op...
Maar de AI leert niet, hij neemt gewoon. De AI generators snappen helemaal niet wat ze doen, er wordt helemaal niet bij nagedacht. Het wordt simpelweg uit een dataset getrokken. Jullie proberen allemaal diefstal te vergoeilijken omdat je te lui bent een tutorial te volgen of een potlood op te nemen. Laat ons eerlijk zijn, het gaat jullie helemaal niet om de kunst maar om het hebben er van: zo snel, zo goedkoop en zo makkelijk mogelijk. It’s a race to the bottom and you’re too blind to see it.
Maar de AI leert niet, hij neemt gewoon.
Kan je heel specifiek duiden waar het verschil zit? Als ik 'leer' dat 2+2 4 is 'neem' ik ook het antwoord in mij op... zijn onze hersenen niet gewoon 1 grote dataset?

Luiheid, snelheid en prijs kunnen een motivatie zijn, maar dat kan je ook zeggen van mensen die Excel gebruiken voor berekeningen ipv pen en papier. Mensen die het zich expres moeilijk maken zijn eerder de uitzondering dan de regel. Als volgens jouw definitie de meerderheid van de mensheid een luie dief is is er waarschijnlijk iets mis met je definitie.
Maar de AI leert niet, hij neemt gewoon.
En hoe is dat anders dan bij mensen? Denk jij (nog) na hoe je potlood of penseel vasthoud? Ga jij constant de theorie over perspectief doorlopen in je hoofd? Nee, een hele hoop is allang automatisme tegen de tijd dat dit je vak wordt. Ik zou zelfs willen stellen dat veel werk van lopende band illustratoren geheel niet over 'nagedacht' wordt voorbij 'dit moet er reproduceert worden', vervolgens pas je daar al je aangeleerde (standaard) tekenvaardigheden op uit.
Jullie proberen allemaal diefstal te vergoeilijken omdat je te lui bent een tutorial te volgen of een potlood op te nemen.
BS! Ik heb zelf jaren lang getekend/geschilderd voor hobby en opleiding, dus te lui omdat aan te leren en een potlood te pakken is geheel onzin! Het ligt er echter aan wat je wil hebben en waarvoor je het nodig hebt.

Ik heb vroeger veel zelf zitten prutten met CMSen en webdesign omdat er niets was die XYZ deed, wat ik wilde. Ondertussen is de keuze zo ruim in open source CMS producten dat ik wel wat vind dat ik nodig heb, als ik dat nodig heb (via het CMS zelf of via 3rd party producten). Zo ook met illustraties, soms heb ik ABC nodig voor een projectje, dan is dat zelf maken bijzonder inefficient qua tijd, maar zelfs het zoeken naar een illustratie die al bestaat is bijzonder lastig en vaak niet vindbaar. En een (goede) illustrator vinden die bij de illustratie stijl past is lastig. Zelfs de illustratoren die je kent hebben gewoon geen ruimte in hun schema om voor jou een 1-off te maken en als ze dat wel hebben is een 1-off vaak de relatieve hoofdprijs. Wat voor velen niet betaalbaar is en niet reëel is voor een monster illustratie in een adventure dat je voor nop maakt... Waarbij ik vroeger dan wel eerder een potlood oppakte, heb ik met der tijd daar minder tijd voor. Dit is dus iets functioneels waar je een illustratie voor wil hebben (volgens jou specs).

Als ik gewoon zelf lekker wil tekenen/schilderen, dan laat ik dat niemand anders doen, ook geen AI.

En ik ben zeer benieuwd of jij open staat te gaan betalen voor alles wat je ooit heb nagetekend of door bent geïnspireerd om je vaardigheden op dit niveau te krijgen... Of is dat een 'can of worms' die 'artiesten' liever niet opentrekken omdat een dergelijke actie hun ook weer nadelig beïnvloed? Net als de introductie van AI. En imho zijn de mensen die klagen over AI geen artiesten, want creatief nadenken lijkt geheel te ontbreken. Het zijn meer de mensen die 'art by rote' beoefenen en hoe anders is zo een mens-robot van een AI/LLM model?
Laat ons eerlijk zijn, het gaat jullie helemaal niet om de kunst maar om het hebben er van: zo snel, zo goedkoop en zo makkelijk mogelijk. It’s a race to the bottom and you’re too blind to see it.
'kunst' en illustraties zijn imho twee heel verschillende zaken, sure, een illustratie kan 'kunst' zijn, maar dat is het niet 'by default'. Net als een foto 'kunst' kan zijn of een heel functioneel middel. Een Piet Mondrian is 'kunst' omdat dit zo is besloten, een dergelijke collectie kleuren in een heel andere setting zou een slordige puinhoop zijn.

Daarnaast vraag ik me af of jij terug wilt naar de tijd waarbij je elk boek met de hand moet illustreren, zodat alleen de rijkste het kunnen veroorloven... Nee, de drukpers was ook een zeer fijne uitvinding voor illustratoren, ook al werd dat toen ook vast zo niet gezien.

Wat jij kennelijk niet begrijpt is dat ik een 'race to the bottom' op bepaalde vlakken aanmoedig, kosten en gemak, absoluut! Kwaliteit, nee dankje!

Ik ben de afgelopen 25 jaar in IT eigenlijk alleen maar bezig geweest met mijn eigen positie overbodig te maken. Niet door alleen incidenten op te lossen, maar juist de achterliggende problemen. Implementatie van efficiëntere systemen/procedures waardoor een heleboel minder mensen een veel grotere groep klanten kan bedienen. Het liefst is een issue al opgelost voordat de klant hoeft te bellen! En dat is allemaal op basis van kennis/kunde van zij die voor ons zijn geweest (en zelfs eigen ervaring/kunde).

Maar zal ik jou baas bellen dat je voortaan je beveiligingstaken lopend wil doen, zonder mobiele telefoon omdat je geen dief wil zijn van al die andere colleage die je nu benadeeld door het gebruik van een auto/fiets/mobiel? Rapportjes schrijven met de hand? Inktpot, ganzenveer, op papyrus? Of wil je zelfs een steen, een bijtel en nog een steen hebben om je rapporten voortaan in spijkerschrift op te leveren... ;)
Dat zullen wiskundigen ook gezegd hebben bij de uitvinding van de rekenmachine. Maar de boekhouder die alles ambachtelijk uit zijn hoofd doet, heeft geen klanten hoor. Je kunt beter de technologie omarmen dan je verzetten, tegenhouden kan je toch niet. Uiteindelijk genereert het (mits goed getrained) gewoon uniek werk, de kwaliteit is goed en wordt steeds beter. Het biedt enorm veel creatieve vrijheid. Klanten met een kleiner budget kan je in minder tijd, veel hogere kwaliteit bieden én een grotere hoeveelheid. Zoveel klanten zijn er niet die een complex kunstwerk kunnen betalen dat met de hand gemaakt is.

Misschien ben jij "too blind to see" dat je enkel weerstand biedt uit jouw angst om je baan te verliezen. Maar maak je geen zorgen, de komende jaren gaat het heel hard voor iedereen met een baan achter de computer. Of er komt een oplossing voor iedereen, of we zijn allemaal de klos.

Ik zit ook in de creatieve sector, het is onwijs gaaf om hiermee te werken.
Misschien ben jij "too blind to see" dat je enkel weerstand biedt uit jouw angst om je baan te verliezen.
Er kan in 6 jaar een hoop veranderen, maar ik betwijfel dat dit hier het issue is, hoogstens hobbyist:
Katsu in 'Gemeente Enschede wil drones inzetten voor beveiliging'
Sja.. Een voorbeeld van slechte implementatie is natuurlijk nergens bewijs voor. Het is wel het zoveelste bewijs dat de overheid niet zo handig is met aanbestedingen, maar dat is een ander verhaal.

Ik denk dat het echt héél hard gaat de komende tijd jaren. Er zijn zo onwijs veel ontwikkelingen nu en er wordt ook veel interessant onderzoek gedaan. Zo blijkt o.a. dat mensen liever AI gegenereerd slecht nieuws horen over hun medische situatie dan rechtstreeks van de dokter. Daarmee gaat het "ai heeft geen empathie" argument ook down the drain.

Bedenk maar 1 baan achter de computer die straks niet geautomatiseerd beter kan. Houd daarbij in je achterhoofd dat AI letterlijk alle kennis van alle boeken instant er bij kan pakken. Daar kunnen onze puddingbreintjes simpelweg niet tegenop.

Dat levert een hoop white collar werkloosheid op en daarna mogelijk zelfs een existentieel crisis risico.

[Reactie gewijzigd door Sebben op 23 juli 2024 14:40]

Dat levert een hoop white collar werkloosheid op en daarna mogelijk zelfs een existentiële crisis.
Volgens mij is een existentiële crisis wat anders:
existentiële crisis

Dan een "existential risk,":
https://en.wikipedia.org/wiki/Global_catastrophic_risk

De ene is 'The Truman Show', de andere is 'Terminator'... ;)

Maar er is al veel langer onderzoek gedaan naar onze maatschappij waarbij er heel veel (kantoor)werk is wat eigenlijk geen functie heeft, niet alleen in de praktijk, maar dat wordt ook door veel mensen zo ervaren. Dit issue is al decennia oud en wordt alleen maar groter. Er wordt al heel lang gedacht aan oplossingen voordat die 'bubbel' inklapt. Maar er komt heel veel tegengas vanuit de overheid/business hierop, maar dat zijn meestal juist niet de mensen die dat werk specifiek moeten doen. Of alleen maar zien "Maar wat als ik geen werk heb!?!?"... De mensen die bovenaan de maatschappij staan met macht en/of geld houden deze constructie in stand OF om hun postie te kunnen behouden OF omdat ze zeer onzeker zijn over wat een alternatief brengt. Het gros van de bevolking kan zich geen maatschappij voorstellen waarin zij niet zouden moeten werken...
Er is geen overheid of bedrijf die AI kan tegenhouden. De geest is uit de fles. Misschien openbaar wel maar stiekem geven ze er keihard gas op. AI = superpower, van hetzelfde of zelfs groter kaliber als een nucleaire bom. Niemand wilt het risico lopen dat straks China het wel heeft en het westen niet.

Het gaat toch veel verder dan onzinbaantjes opruimen? Boekhouders zijn compleet overbodig straks. Je vertelt je AI waar je facturen staan op je pc en de belastingaangifte, toeslagaanvragen en subsidieregelingen worden vervolgens allemaal automatisch geregeld. Het zijn simpele regels maar (bijna) iedereen heeft er een hekel aan, er hoeft zo geen mens aan te pas te komen.

Met behulp van AI kan per kind een studieprogramma volledig op maat gemaakt worden en continu bijgestuurd worden, waardoor ze precies de juiste uitdaging hebben en de juiste toon om ze aan te spreken, gemotiveerd te houden en aan te moedigen. Dingen waar een leraar simpelweg geen tijd voor heeft. Of er vervolgens nog een baan over blijft na hun studie 15 jaar later, is weer een andere vraag.

Andere beroepen die significant minder belangrijk worden: makelaars, vertalers, juridisch adviseurs, journalisten en schrijvers, bibliotheek personeel, HR, reisbureaus, project managers, analisten, social media managers, content strategen, klantenservice, etc etc.
Anoniem: 125883 @Katsu25 juni 2023 08:49
Jij klinkt als de typische anime/manga fanartist die ligt the bleiten omdat zijn illustraties op Danbooru terechtkwamen en die gebruikt werd om de AI te trainen.

Wat die artiesten allemaal doen is ook maar I. P. kopiëren van SAO, Konosuba, AOT, etc. En er ook geld aan verdienen door yaoi of hentai doujinshi te verkopen bij Toranoana, booth of zelfs een tafeltje neerzetten op shotafest of comiket.

Wat als al die productiehuizen en uitgevers ineens hun creaties met hand en tand zouden beschermen?

En je kunt niet anders dan toegeven dat veel van die mensen gewoon proberen zo goed mogelijk te lijken op het origineel.

Er zijn op Twitter trouwens genoeg artiesten die helemaal geen probleem hebben met A. I. en het integreren in hun workflow. Zijn zij dan luie tamzakken?

Of de mangaka die 3D software gebruikt om zijn locaties te ontwerpen en dan een lineart renderer/shader erop loslaat? Ook een luie tamzak? Hiroya Oku (Gantz) is er zo eentje.
Maar dat is een fotograaf dus ook lui? Want hij schildert niet...
En als er truc fotografie wordt toegepast? Ook lui?
Dan is een inkleurder ook lui - want hij tekent de lijnen niet..
Dan is een tekenaar ook lui want hij bedenkt niet wat hij wil tekenen - dat betekent de scenarist.
Zelfs verhalen worden gebaseerd op een set van 'tropes' - zijn alle schrijvers dan lui omdat ze 'slechts' combineren?
Is een houthakker lui omdat hij z'n bijl gewoon koopt i.p.v. zelf maakt?
Deze AI is een tool om plaatjes te genereren en kan weer flink meer dan 'slechts' registreren.
Ook het gebruik van deze tool en bedenken wat deze tool moet combineren is toch creativiteit?
Sorry hoor waar maak ik het belachelijk? Ik geef aan dat iedere artiest tools nodig heeft (en gebruikt) en dat die tools soms heel complex zijn. Ook stel ik dat een artiest het werk van anderen nodig heeft om zijn/haar creaties te maken. Maar het blijft creatief.

Jij stelt dat de tool niets snapt.
De AI generators snappen helemaal niet wat ze doen
Maar de gebruikers daarvan dus wel. Er is geen AI die geheel zelfstandig maar een berg images uitstuurt. Deels zou het via scripts kunnen maar dan moet iemand nog die scripts schrijven.
It’s a race to the bottom and you’re too blind to see it.
Nee, we zijn met z'n allen bezig om het onszelf makkelijk te maken. Dat we om die reden dus nu heel makkelijk beelden kunnen reproduceren is daar een voorbeeld van.
En we gebruiken met z'n allen de voortbrengselen van anderen. Dat jij denkt dat het alleen maar telt als je het met een potlood of kwast hebt getekend/geschilderd, daar zit het probleem.
Dat het daarom nu ook mogelijk is om combinaties te maken van andere creaties....tja...dat kon al heel lang (knippen en plakken werkte ook al). Maar opeens als het middels een AI tool bijna automatisch gedaan kan worden, dan is het opeens pure diefstal?

Als jij 'jouw' creaties alleen voor jezelf wilt houden; prima - dan moet je ze dus niet publiceren of ten toon stellen. Want anders wordt het gebruikt op de een of andere manier.
Want een artiest raakt nadat die artiest een gallerij, museum of tentoonstelling bezoekt inderdaad ook niet geïnspireerd.
Nogal elitair, de ene mag een artiest zijn en de ander niet..
Niemand houdt je tegen om artiest te zijn. Er liggen potloden in de winkel, en youtube staat vol met artiesten die gratis hun kennis delen. Wees gewoon eerlijk tegen gezelf: je wil geen moeite doen of er geen tijd aan spenderen. Je wil alles, en nu. Niet denkende aan wie er aan onder door gaat.
De wereld heeft honderden beroepen gekend die op dit moment geen enkele waarde meer hebben. Mensen kunnen zich aanpassen en werk gaan doen waar daadwerkelijk vraag naar is. Er is geen inherent recht op een baan als 'stock fotograaf' voor marketingfolders dus als we daar minder van nodig hebben moeten die maar wat anders gaan doen.
Echte creatievelingen en kunstenaars zijn vaak wat meer open-minded en hoor ik eigenlijk amper zeuren over AI, die zien gewoon kansen en mogelijkheden in plaats van iets wat je direct moet onderdrukken.
Wat een larie. Als je er als kunstenaar onderdoor gaat door AI ben je weinig waard en kan je best een andere niche zoeken om wat te aan te modderen.
Om te kotsen die auto's. Pakken al het werk van de koetsiers af.
Om te kotsen die telefoons. Pakken al het werk van de postbodes af.
Om te kotsen die zonnecellen. Pakken het werk van de turfstekers af.

Hoe lang moet ik nog doorgaan?
Ik zie het als iedereen de mogelijkheid geven om hun creativiteit te uiten. Geweldige nieuwe ontwikkeling.

[Reactie gewijzigd door Rogers op 23 juli 2024 14:40]

Iedereen kon al een potlood vastnemen of photoshop openen. Er stond nooit een beperking op creativiteit, je had er enkel wat tijd en moeite voor nodig. Dingen die jullie het blijkbaar niet waard vinden.
Vind je een camera vastpakken en dingen vastleggen ook diefstal en waardeloos?
Ik had op een zinvolle discussie gehoopt maar krijg alleen maar agressieve vooringenomen statements, beledigingen en onwaarheden van jou. Met die attitude kan je inderdaad downvotes verwachten.
Voordat je weer begint te fulmineren kan ik je aanraden eens naar de workflow van AI artiesten te kijken, de echte uitschieters doen nl behoorlijk wat meer dan een paar woorden inkloppen.
Hoeveel artiesten maken hun eigen houtskool of hun eigen verf? Is Photoshop ook geen valsspelen dan omdat je opeens dingen kan waar iemand met alleen een stukje houtskool een heleboel meer voor moet doen en kunnen?

En je doet alsof iedereen een illustrator van hetzelfde niveau kan worden. Er is een reden waarom de ene illustrator (schilder, fotograaf, etc.) beroemd wordt en veel geld krijgt en de andere er amper van kan rondkomen... Not everyone is created equal! En ja, de meeste kunnen het boekje volgen van hoe je een mens tekent en na flink wat oefening, is dat wat honderden miljoenen mensen ook al kunnen, dat maakt nog geen illustrator, laat staan 'kunst'.

De waarde die we aan dergelijke zaken hangen is afhankelijk van wie, waarom en hoe deze wordt gemaakt. Ik hecht heel veel waarde aan de 'tekening' die mijn nichtje van anderhalf voor mij heeft gemaakt, maar als een professionele illustrator bij mij aankomt met een dergelijk kaliber tekening... Tja...

Zo ook heb ik een mooie cover of full-page illustratie in een boek, die kan ik erg op prijs stellen. Als ik wil kan ik daar wellicht een poster van kopen en die aan de muur hangen. Ik kan er wellicht ook een nog veel duurdere ets, litho of zeefdruk van kopen. Ik zou ook een heleboel geld kunnen neerleggen voor het origineel...

En ik heb in het verleden illustratoren betaald voor (rechten op hun) illustraties. Is dat lui? Zelfs in een periode dat ik zelf ook tekende. Waarom, die maakte illustraties voor een bedrag dat ik het niet kon of überhaupt dat niet kon omdat ik hun ontwerpen prachtig vond. Zelfs een gast die van klei een landkaart maakte, daar een foto van maakte en vervolgens bewerkte in Photoshop. Een resultaat waar ik een week loon in heb gestoken omdat ik nooit een resultaat als dat kon bereiken in een week (if ever). Ben ik dan nog steeds lui?

Er zijn genoeg mensen die de prijs van een superauto belachelijk vinden, naast dat ze het geld er niet voor hebben, het nooit er aan uit zouden geven. Dat geld voor allerlei zaken, van auto to computer, van huis tot meubilair, tot interieur aankleding. De ene wil een origineel, de andere neemt genoegen met een print op een stukje metaal die ze met magneetjes ophangen zodat ze makkelijk volgende maand weer wat nieuws kunnen ophangen...
Dat is erg overdreven. De AI genereert zelf de beelden gebaseerd op basis van aangeleerde text to image data sets als voorbeelden. Zoals hoe ziet een banaan eruit, wat is de stijl van Van Gogh. Het kopieert geen foto's.
Niet anders dan dat een artiest naar het museum ging om te schetsen en stijlen aanleert. Het gaat nu alleen opeens met een gigantische snelheid en dat heet vooruitgang.

Probeer het eens zelf uit. Kapitalistisch is het niet met bijvoorbeeld Stable Diffusion wat open source is en ook lokaal zonder internetverbinding werkt. Bijvoorbeeld Easy Diffusion.
Iemand enig idee waarom AMD kaarten 2x zoveel VRAM nodig moeten hebben?
Geen idee maar ze hebben hele slechte deep-learning drivers. AMD en deep-learning moet je gewoon echt niet aan beginnen. Ben er ooit twee middagen aan kwijtgeraakt tot na een zeer lang draadje te volgen een vrij basele functie niet bleek te bestaan

[Reactie gewijzigd door Osiummaster op 23 juli 2024 14:40]

Open source zelfs. Dus het is niet echt concurrentie voor Dall-e en midjourney - dat zijn remote black boxes waarbij je geen idee hebt wat ze met je data doen, hoe ze werken etc. Voor het maken van plaatjes geen enorm probleem maar met text generatie (chatgpt enzo) of vertalingen etc zeker wel.
Diffision / Diffusion
Het blijft verwarring geven 😉
Gebruik gerust de feedbackknop om typos door te geven.
Ik wist dat iemand zich geroepen zou voelen om dit te gaan zeggen.
Het zou super zijn als handen gefixed worden in de meeste text-to-image modellen.. de specs liegen er niet om, ik draai Stable-diffusion (middels easy-diffusion) op mijn Macbook Pro uit 2019 en ondanks dat het voor 20 stappen met dpm++ sampler toch 10-20 minuten kan duren op 512x786 blijf ik me enorm verbazen wat zo een model voor elkaar krijgt met mijn prompts.
Kan je grotendeels oplossen door bij de negative prompt op te geven dat je vingers, handen, benen of armen realistisch wilt hebben (zie vele voorbeelden op youtube). Ondertussen is de DLM engine ook al sterk verbeterd t.o.v. een paar maanden terug.

Bij Midjourney is dit nog beter onder controle en heb ik het sinds versie 5, amper meer plaatjes gehad met een vuist en 7 vingers of 4 spaghetti benen door elkaar.
Zelfs op mijn 2022 MacBook Pro M2 is het traag met Automatic1111. Thuis op mijn 1080TI (oude GPU), gaat het 4x zo snel als op mijn moderne MacBook.
Zeker niet snel, maar ik draai het gewoon s’nachts op vele prompts/seeds met 20 samples en alles wat ik dan ‘wel tof’ vind gooi ik nog eens 50 samples boven op of laat ik meer varianten op maken.

Gewoon geduld hebben in dat geval en ben vooral blij dat mijn Macbook gewoon iets knaps kan maken op mijn brainfarts

[Reactie gewijzigd door ultimasnake op 23 juli 2024 14:40]

Volgens mij is die versie niet echt geoptimized voor Mac, maar op de github wiki staan wel een aantal suggesties die je kan proberen om het ding sneller te maken.
Je moet vooral geduldig zijn, als je tevreden bent met een afbeelding kan je bijvoorbeeld met paint-to-image nieuwe handen genereren. Dan "verf" je de handen op afbeelding en genereer je tientallen nieuwe foto's tot er eentje tussen zit met juiste handen. Maar met de computer die je hebt, lijkt me dat inderdaad veel te lang duren.

Vergeet niet dat al deze applicaties nog relatief nieuw zijn.
Thanks voor de tip! En ach wat is lang als je de laptop ik de nacht laat stomen en in de ochtend mogelijk wat tofs te zien krijgt (doe een laag aantal steps voor het idee en draai die dan weer verder als de basis leuk/goed was)
Die is er al. Dankzij ControlNet is het al mogelijk handen, voeten, tanden en andere complexe objecten te fixen of gewoon in één keer correct te genereren.
ik hoop dat dit de features van controlnet en latent couplers makkelijker maakt.
ik heb geen idee hoe die dingen werken, ik heb tutorials gekeken en het is alleen maar uitleg over wat de techniek is maar niet zo zeer hoe het toe te passen.

als dit gewoon mee kan owrden genomen in de prompt zou dat heel chill zijn.

Op dit item kan niet meer gereageerd worden.