OpenAI verbetert beeldgenerator en moet minder fouten in details maken

OpenAI heeft Images 2.0 uitgebracht, een verbeterde versie van de beeldgenerator. De verbeterde versie moet onder meer kleine teksten beter kunnen genereren, waardoor de beelden minder herkenbaar als AI-beelden zijn. Het model kan ook zelf zoeken op het internet om afbeeldingen beter te kunnen genereren.

Images 2.0 moet objecten in afbeeldingen beter plaatsen en deze ook beter met elkaar verbinden, schrijft OpenAI. Kleinere teksten moeten ook beter gegenereerd worden en het model moet composities en 'visuele smaken' beter begrijpen. Daardoor zouden de afbeeldingen 'minder aanvoelen als AI-gegenereerd en meer alsof ze bewust zijn ontworpen', stelt het bedrijf.

Het verbeterde afbeeldingenmodel begrijpt visuele stijlen bijvoorbeeld beter, waardoor stijlen zoals foto's, pixelart, cinematische afbeeldingen en manga's nu beter tot hun recht moeten komen. OpenAI stelt dat het model nu consistenter omgaat met texturen, belichting, composities en details. Het model moet ook flexibeler zijn met beeldverhoudingen en kan beelden genereren die zo breed zijn als 3:1 en zo smal als 1:3.

OpenAI geeft Images 2.0 ook recentere informatie mee: tot en met december 2025. Zo moet het model bijvoorbeeld uitlegartikelen beter genereren. Images 2.0 kan nu ook als 'denkmodel' gebruikt worden, waarbij het model langer doet over het genereren maar ook meer taken uitvoert. Het model kan bijvoorbeeld informatie zoeken op het internet, meer uitleggen over het denkproces en verschillende afbeeldingen tegelijk genereren. Gebruikers kunnen zo bijvoorbeeld stripboeken genereren, of meerdere posters in verschillende beeldverhoudingen.

Het verbeterde afbeeldingenmodel moet ook beter overweg kunnen met talen buiten het Latijns schrift, specifiek Japans, Koreaans, Chinees, Hindi en Bengaals. Images 2.0 is volgens OpenAI 'niet perfect'. Het model kan bijvoorbeeld nog niet zo goed overweg met puzzels en routekaarten. Het model komt vanaf deze week naar alle ChatGPT-gebruikers.

OpenAI ChatGPT Images 2.0OpenAI ChatGPT Images 2.0OpenAI ChatGPT Images 2.0
OpenAI ChatGPT Images 2.0OpenAI ChatGPT Images 2.0

Door Hayte Hugo

Redacteur

22-04-2026 • 20:03

18

Submitter: keverjeroen

Reacties (18)

Sorteer op:

Weergave:

Laatst heb ik voor een uitvaart stokoude beschadigde familiefoto's ingescand en met behoud van alle details laten repareren en inkleuren volgens de juiste tijdsgeest. Die tijdsgeest kon ChatGPT zelf bepalen aan de hand van veel kleine details in de foto. Je moest zeer streng zijn in de prompting om reconstruren van de gezichten te voorkomen, maar uiteindelijk lukte dit goed.

Al met al zeer indrukwekkend. Het eindresultaat staat nu op groot formaat ingelijst bij mijn schoonvader (86) die er zeer emotioneel onder was. Kleuren en sfeer waren spot-on :-)

Temidden van alle social media onzin, oplichting en AI-Slop is deze ontwikkeling gewoon ontzettend nuttig en mooi.
Kun je de gebruikte prompts delen? Wellicht is het leerzaam / behulpzaam voor anderen (ik ben wel benieuwd).
Wat een slechte voorbeelden! 😂

Dat fotoalbum, sepia ding. Een bordje "one way" die aan twee kanten pijlen heeft. Ik zie benen achter mensen vandaan komen, maar geen lichamen.

Die strip. Letterlijk het eerste plaatje: Hij zit alleen in de auto, met een tekstbalonnetje naar niemand. En zijn blazer is roze.
Tweede plaatje: opeens een vrouw naast hem en hij draagt opeens een blauwe blazer.

Die college zaal foto-in-foto. In de... de tweede foto en diepere foto's: De studenten zitten heel anders. Ontbreken of er zijn juist extra studenten.

Als dit moet aantonen dat er minder fouten in details gemaakt wordt, dan is dit het juist NIET volgens mij...

[edit: was nog wat vergeten.]

[Reactie gewijzigd door MarvinJames op 22 april 2026 21:22]

Ik ben zeer benieuwd, als Organisator van de Coderdojo probeer ik al een tijdje een ministrip te genereren als promotie en content voor sociale media. Het taal model maakt op basis van de onderwerpen tijdens de sessies en onderdelen van de nieuwsbrief en posts op social media een script en maakt hier mini stripverhalen van. Maar tijdens het genereren gaat het met tekst en continuïteit van de karakters steeds mis. Ontzettend veel spelfouten en karakters en tekenstijlen die per strip totaal verschillen, terwijl alles juist enorm strak omkadert is door stijl instructies en pose omschrijvingen ect.
Als je een lokaal model van Qwen hiervoor gebruiken kunt (veel video geheugen), kun je een LoRa trainen voor karakter continuïteit.
Tekst gaat daarin ook goed als de karakters duidelijk benoemd zijn (ook tijdens de LoRa training).
Worden er weer kW aan energie verspild om veelal waardeloze plaatjes te genereren. Buiten dat, hoe betaald zich dit terug voor OpenAI (en concurrenten)? Die paar tientjes per maand zijn toch niet dekkend?
Die prijzen zullen uiteindelijk door het dak gaan met bedragen van >€100 per maand. Maar eerst je klanten verslaafd en afhankelijk maken
Gewoon indrukwekkend dat je van de meest complexe configuratie schermen beroerde fotos kunt maken en gpt herkent het scherm en denkt mee over bepaalde instellingen.
Er is toch weinig revolutionair aan OCR?
Dat klopt platte OCR is er al langer. Gekoppeld aan redenering niet. Perceptie + interpretatie + redenering.
Perceptie, interpretatie en redenering zijn er niet. Er is de illusie van die 3 zaken, omdat de tekstvoorspeller op basis van zijn trainingsdata "weet" wat de meest voorkomende instellingen zijn.

Dat is absoluut een knap staaltje wiskunde + rekenkracht, maar ook niet meer dan dat.
We hoeven het geen ‘echte perceptie’ te noemen, maar het systeem doet wel degelijk perceptie-achtige transformaties die functioneel bruikbaar zijn.
Ik gaf het vanmiddag de opdracht om van een screenshot van 4 personen een pasfoto te genereren. Hij maakt uit zichzelf de personen mooier en onherkenbaarder. Irritant
Ja ChatGPT weigert personen herkenbaar aan te passen. Anders zou je er allemaal nare dingen mee kunnen doen zonder toestemming van die mensen.
Ik gaf het vanmiddag de opdracht om van een screenshot van 4 personen een pasfoto te genereren. Hij maakt uit zichzelf de personen mooier en onherkenbaarder. Irritant
Kennelijk is het dus al zo ver dat het mensen begrijpt, want de gemiddelde mens op internet poetst ook graag de foto op.
Haha, het begrijpt mij niet. Ondanks uitdrukkelijk bevel, kreeg ik het niet voor elkaar.
Harder op het doek duwen maakt je schilderij niet mooier.
Moet zeggen dat dit een verbetering is, maar als even kijkt toch vrij duidelijk ai afbeeldingen voor de foto's.

Om te kunnen reageren moet je ingelogd zijn