Stability AI heeft een lichtere versie uitgebracht van Stable Diffision 3. Het model, dat Stable Diffusion 3 Medium heet, heeft twee miljard parameters en kan draaien op grafische kaarten die consumenten thuis kunnen hebben staan.

Stable Diffusion 3 Medium

De Medium-versie van het model waarmee gebruikers met tekstprompts afbeeldingen kunnen genereren heeft 5GB aan VRAM nodig om te functioneren, al adviseert het bedrijf wel minimaal 16GB aan VRAM. Daarmee is het minder veeleisend dan de reguliere versie van Stable Diffusion 3, dat acht miljard parameters heeft.

Het werkt onder meer met grafische kaarten van Nvidia en AMD, meldt het bedrijf. Het model is te vinden op Hugging Face. Stability AI bracht eerder dit jaar al de reguliere versie van Stable Diffusion 3 uit. Stability zei eerder dat Stable Diffusion 3 een combinatie van diffusion transformer architecture en flow matching gebruikt. Het is voor het eerst dat Stable Diffusion die technieken krijgt. Diffusion transformer architecture is een proces waarbij een datamodel in kleine stukjes wordt opgebroken en gegenereerd, waardoor een afbeelding uit meerdere van die kleine stukjes wordt opgebouwd in plaats van als geheel. Flow matching is een technologie waarbij afbeeldingen beter kunnen worden gegenereerd vanuit ruis zonder de berekening constant te moeten herhalen. Dat moet de generator een stuk sneller maken. Verder zou Stable Diffusion 3 nieuwe technieken bevatten om misbruik van het model tegen te gaan.