Qualcomm heeft een demo getoond van AI-afbeeldingengenerator Stable Diffusion dat draait op een Snapdragon 8 Gen 2-soc van een onbekende telefoon. De software genereert daar een afbeelding van een kat in fantasystijl in minder dan 15 seconden.
Het gaat om een afbeelding van 512 bij 512 pixels, met de citeria 'super cute fluffy cat warrior in armor, photorealistic, 4k, ultra detailed, vray rendering, unreal engine'. Dat leidde in de video tot een resultaat na 14,42 seconden. Qualcomm zegt dat het voor het eerst is dat Stable Diffusion op een smartphone werkt, maar uitzoekwerk van The Verge wijst uit dat iemand het bedrijf al voor was. Wel is het zo dat die persoon er in zijn tests met een Snapdragon 865 één uur over deed, dus wat efficiëntie betreft kan Qualcomm beweren dat het een primeur heeft.
In de video toont het de software in actie, maar daarnaast heeft het Amerikaanse bedrijf nog driemaal het resultaat met dezelfde invoer getoond. Daarnaast deelt het ook het resultaat van de prompt 'Japanese garden at wildlife river and mountain range, highly detailed, digital illustration, artstation, concept art, matte, sharp focus, illustration, dramatic, sunset, hearthstone, art by Artgerm and Greg Rutkowski and Alphonse Mucha'. Dit lijkt ook een product van dezelfde hardware en software, maar Qualcomm zegt dat niet nadrukkelijk. Qualcomm kon het resultaat zo snel bereiken door optimalisaties door te voeren aan zijn Qualcomm AI Stack. Verder spreekt het van 'strak hardware- en software-co-ontwerp'. In zijn posting gaat het meer in op technische details.
Stable Diffusion is een opensourcemodel dat gebruikt kan worden voor het genereren van afbeeldingen op basis van tekstinvoer. Gebruikers kunnen de software draaien op een pc, in tegenstelling tot diensten als Dall-E, die alleen via de cloud beschikbaar zijn. De software wordt ondersteund door veel gpu's met 8GB of meer geheugen. De software is gratis beschikbaar op GitHub. Er zijn ook online demo's van de AI-beeldgenerator beschikbaar.