Google maakt Imagen 4-afbeeldingen duurder en belooft betere tekst in beeld

Google maakt Imagen 4 beschikbaar als betaalde preview in de Gemini-api en als beperkte gratis test in Google AI Studio. De nieuwste versie van de tekst-naar-afbeeldingtool biedt volgens de techreus een 'aanzienlijk verbeterde weergave vergeleken met onze eerdere afbeeldingsmodellen'.

De techgigant brengt twee Imagen 4-modellen uit. De reguliere versie is volgens Google bedoeld voor de meeste taken, terwijl het Ultra-model ontworpen is om nauwkeurig instructies te volgen en daarmee 'betere resultaten moet leveren dan andere toonaangevende modellen voor het genereren van afbeeldingen'. Het is niet duidelijk of Google hiermee ook specifiek Midjourney V7 en Dall-E 3 bedoelt.

Het reguliere Imagen 4-model heeft een prijs van 0,04 dollar per gegenereerde afbeelding, terwijl Imagen 4 Ultra 0,06 dollar per afbeelding kost. Imagen 3, die sinds november vorig jaar beschikbaar is, kostte 0,03 dollar per afbeelding. Google kondigt 'in de komende weken' extra tiers aan. Gegenereerde afbeeldingen bevatten nog steeds een onzichtbaar digitaal SynthID-watermerk voor transparantie over het gebruik van de AI-tool.

Door Sabine Schults

Redacteur

25-06-2025 • 14:18

13

Reacties (13)

Sorteer op:

Weergave:

Hoe accuraat zijn deze modellen nu precies? Ik genereer voor de gein wel eens wat, zoals Trump als halve-kip om te verwijzen naar TACO in WA-gesprekken. Maar verder heb ik het nog niet echt gebruikt op professioneel vlak. Is het mogelijk om bijv. je website logo's te ontwerpen of andere zaken?
Ik ben van mening dat het professioneel ook goed te gebruiken is, maar niet kant en klaar.

Uit een prompt komt niet in één keer het perfect logo of de perfecte afbeelding naar boven. Vooralsnog komt er sowieso geen bruikbaar logo uit (op dit moment). Maar je kunt wel heel goed ideeën en elementen genereren, die je met (iets als) Photoshop weer kunt combineren.

Twee voorbeelden:
  • Op de website Unsound Mind zie je een gedeelte met grijze wolken en bloemen/planten die daarom heen zweven (scroll-effect). Al deze elementen zijn - weliswaar met dagenlang genereren, aanpassen met Photoshop en repeat - gegenereerd met AI (Dall-E/ChatGPT).

    Door bijvoorbeeld elementen - zoals bloemen - te genereren op een transparante achtergrond, zijn ze makkelijk te gebruiken en hoef je ze dus niet uit te knippen of zoiets.
  • De foto's op deze poster van een musical - in het thema 60's en de Vietnamoorlog - zijn ook gegenereerd met AI (Midjourney). Ook hier geldt: dit heeft dagen gekost om dit voor elkaar te krijgen (en nog zitten er fouten in).

    Dan is het uniform niet goed (verkeerde uniform of rare glitch), dan zitten de handen raar, dan klopt de omgeving niet, dan verandert de hoek van waar de foto is genomen, etc.

    Maar uiteindelijk heb ik wel het idee kunnen uitvoeren, wat zonder AI niet mogelijk had geweest. Ik had zelf niet deze foto's kunnen maken.
Generieke dingen, zoals: "Genereer een foto van twee lachende mensen op kantoor.", voor een LinkedIn bericht: prima. Maar hele specifieke zaken of wensen genereren, waarbij de details echt belangrijk zijn, dat is zonder dat je zelf heel veel bewerkt, echt (nog) niet reëel.

[Reactie gewijzigd door MarvinJames op 26 juni 2025 23:42]

Mijn ervaring is vooral beperkt tot chatgpt, daar heb je in de praktijk niet zoveel aan als je wat geavanceerde afbeeldingen wilt laten maken voor bijvoorbeeld een presentatie.

Zitten altijd goede elementen in, alleen is de tekst erin ineens in een hele andere taal bijvoorbeeld. Keer geprobeerd wat informatie op een landkaart te laten zetten, komt hij ook totaal niet uit.

Wel leuk om jezelf er als lego poppetje uit te laten zien.
Het is leuk voor grapjes, maar wat voor mij het grootste obstakel is om het professioneel te gebruiken, is de lage resolutie. Hoge resolutie is kennelijk best een uitdaging voor de Ai modellen. Ze lijken specifiek op vaste (lage) resoluties getrained. Ik heb zitten experimenteren met open source modellen, en de gegenereerde modellen zijn prachtig in de native bedoelde resolutie. Maar ga je de resolutie hoger instellen dan ontstaat er een soort tiling / herhaling van "ai" generaties. Kijk bijvoorbeeld wat er gebeurd als ik deze generatie hoger instel dan de standaard 1024x1024:
https://imgur.com/a/p5zoGIV (don't judge, het was de standaard prompt wat er in zat ;) )
Interessante uitkomst. De oplossing is dan eigenlijk om het dus in de native resolutie te genereren en dat dan weer met een andere AI te upscalen. Naja, was er alweer een beetje klaar mee. Het hele lokaal draaien van modellen is echt verre van gebruiksvriendelijk. Allerlei github repositorys klonen, mega verschillende tooltjes, nodes linken, vram beperkingen naja, lokale AI's is in mijn ogen op dit moment echt voor de nerds.

[Reactie gewijzigd door satoer op 26 juni 2025 14:01]

Iemand als test al een kaart van Nederland laten maken of een klok die niet 10 voor 2 aangeeft ?
Volgens mij zijn die linkjes niet publiek; ik zie er in ieder geval niks behalve een stapel popups over drive access, privacy policies, cookies en meer :P
Volgens mij kan je het niet sharen zonder dat iemand een Google account nodig heeft. Maar ik heb hem op iedereen gezet dus als het goed is als je inlgod met je Google account werkt t

Sowieso weer ik niet waar je al die popups vandaan haalt met Brave heb ik die überhaupt nog niet gezien

[Reactie gewijzigd door PaulHelper op 25 juni 2025 18:06]

Die klok kan het 2.5 flash model ook al zo te zien.
Dit is een beetje onduidelijk. Ik ben vrij zeker dat de LLMs niet zorgen voor image gen. Image naar text waarschijnlijk wel maar text naar image wordt als ik het goed heb los naar imagen gegeooit. Wat dat precies inhoud durf ik dan niet te zeggen maar niet voor niks dat ze het nu apart houden
Dat stripboek effect is wel cool! Eindelijk je eigen stripboek maken met alleen de creativiteit van bet bedenken! 🥳
Maar typisch dat in de opeenvolgende 'tekeningen' van dat stripboek de verhoudingen van het ruimteschip veranderen....
Dus zo'n AI-strip vind ik al meteen minder goed.... :X
Eens, mijn opmerking was ook cynisch bedoeld.

Op dit item kan niet meer gereageerd worden.