Stable Diffusion-maker Stability AI brengt 3d-rendertech uit

Stability AI heeft Stable Video 3D uitgebracht. Dat is een tool die zich richt op het omzetten van 2d-foto's in een 'orbitaal' 3d-model. SV3D is beschikbaar voor zowel commercieel als niet-commercieel gebruik.

De tool is gebaseerd op Stable Diffusion, de afbeeldingengenerator van het bedrijf. Er zijn twee varianten: SV3D_u en SV3D_p. De eerste variant kan beelden maken met slechts één afbeelding als input zonder dat het uitmaakt hoe de camera precies stond toen de afbeelding werd genomen. Hierdoor is het mogelijk om beelden om te zetten in 3d-modellen zonder camerabewegingen. SV3D_p is de krachtigere variant, die ook in staat is om video's te produceren langs vooraf gedefinieerde camerabewegingen.

Volgens Stability AI lost SV3D consistentieproblemen op waarmee oudere modellen, zoals Stable Zero123, te kampen hadden. Dat wordt gedaan door middel van neural radiance fields, een techniek die wordt gebruikt om foto’s om te vormen tot 3d-objecten, in combinatie met meshrepresentaties. Dat laatste is een soort digitale vorm van draadframes die computers helpt om objecten in 3d te begrijpen en weer te geven.

SV3D maakt ook gebruik van een nieuwe aanpak om belichtingsproblemen aan te pakken. Het verlichtingsmodel is losgekoppeld van andere aspecten van de video, zoals vorm en textuur. Volgens Stability AI helpt dit om de belichting consistent te houden en ervoor te zorgen dat het object er realistisch uitziet vanuit verschillende hoeken.

SV3D is voor commercieel gebruik beschikbaar voor alle Stability AI-abonnees. Niet-commerciële gebruikers kunnen de zogenoemde modelgewichten, de parameters die het model heeft geleerd tijdens het trainingsproces, downloaden op Hugging Face. Ook de onderzoekspaper is gratis te lezen.

Stability AI
Stability AI

Door Andrei Stiru

Redacteur

19-03-2024 • 11:45

21

Reacties (21)

21
21
10
2
0
10
Wijzig sortering
Ik vind de AI video naar model via Gaussian Splatting veel indrukwekkender omdat ook reflecties worden weergegeven. Wat voorbeeldjes:

https://lumalabs.ai/captu...55-4423-aeac-b08f017dda22
https://lumalabs.ai/captu...fc-4f9d-a186-3c4117f37231
https://lumalabs.ai/captu...fe-4ea7-872c-584ef30f0108
https://lumalabs.ai/captu...66-45d2-94b5-ffd4c55a92f0

(Je kan met AWSD toetsen door het model wandelen)

Even een accountje aanmaken, een object of omgeving filmen, uploaden en binnen een uur heb je volledig 3D model waarvan je de pointcloud of mesh kan downloaden. Simpeler is het nooit geweest. Hele achtertuin gefilmd, en pointcloud van gemaakt om nieuwe tuin indeling te kunnen maken in Twinmotion.

Account kan je aanmaken op: https://lumalabs.ai/dashboard/captures

[Reactie gewijzigd door Robonus op 23 juli 2024 12:21]

Moet je wel die omgeving kunnen filmen. Met deze techniek kun je met een paar foto's van een (niet meer bestaand) jaren 70 interieur die hele kamer omzetten naar een 3D model.
Die techniek heet photogrammetry.

Edit:
Op de verkeerde gereageerd.

[Reactie gewijzigd door XnbX op 23 juli 2024 12:21]

Gaussian splatting is eigenlijk een nieuwe vorm van photogrammetry die om kan gaan met minder foto's en ook veel grotere omgevingen. Een groot verschil is dat er geen 3D mesh van gemaakt word maar een point cloud.
Kijk dat wist ik nog niet. Kan je die point cloud ook omzetten naar een Stl of Obj?
Je kan exporteren naar:
GLTF, USDZ, OBJ, PLY pointcloud, PLY mesh, 360 image of een export voor Unreal 5 Engine.
Volgens mij kan dat niet met de standaard 3D Gaussian Splatting repo? Die levert enkel een PLY-formaat met custom parameters.

Heb je een andere tool waarmee je dit doet?
Dit zit bij deze site iig gewoon in de standaard opties, zie screenshot:

https://i.imgur.com/XmULuwm.png
Je kan Gaussian Splatting modellen ook direct in Unreal en Unity openen. Er zijn al verschillende opensource plug-ins in ontwikkeling.
Wow, klikken op één van die filmpjes crashte niet alleen mijn Firefox, maar ook mijn Spotify. Heftig om te renderen op mijn Samsung A50
Zou deze ook bijvoorbeeld schetsen van karakters kunnen omzetten in een volledig 3dmodel? Dat zou echt gaaf zijn.
Tja, wat is een schets? Een paar streken van een potlood waarschijnlijk niet. Maar maak je daarvan met een andere genAI een afbeelding, dan wel: zie de PDF paper op pagina's 18-20 voor wat voorbeelden.
Nee, de output van deze tool is geen 3D model maar een video die 360 graden eromheen draait. Het lijkt me meer een onderzoeksproject dan een tool die klaar is voor productie.

[Reactie gewijzigd door Wolfos op 23 juli 2024 12:21]

Dat strookt niet met de inhoud van het artikel - daar staat dat het geavanceerde model ook een turntable-animatie maakt, maar het maakt hoe dan ook een 3D-model.
Dit kan wel met deze ComfyUI workflow: https://civitai.com/model...srdrawingsketch3dobjmodel
Dit werkt met TripoSR, wat ook bij Stability AI vandaan komt. Het is wat primitief, maar de output is een .obj bestand, die je bijvoorbeeld in Blender kunt importeren.
Deze website kan het al een beetje https://www.meshy.ai/

Zowel text to 3D model. Als schets naar 3D model. En ook een model inladen en laten texturen.

[Reactie gewijzigd door nr12 op 23 juli 2024 12:21]

Dit is heel interessant voor de mensen met een 3D-printer, al zal er nog wel wat handmatige clean-up nodig zijn.
Dat is waar ik ook aandacht, echter is het nog steeds van een "bestaand" object. Voor mensen zoals ik (met FDM en Resin printers) is de techniek achter de app Luma en dan in het specifiek hun Genie model (?) interessanter gezien het text to model is. https://lumalabs.ai/genie?view=create

Je tikt wat je in je hoofd hebt en het model maakt een STL voor je, en dat is echt super tof want dan kan je hem vragen waar je naar opzoekt bent ipv iets wat je hebt gevonden om te zetten.

Mijn buurman, ook een 3d print fan, heeft het nu al een paar keer ingezet voor D&D scenery en items waarin door de kleine schaal de bestanden die eruit komen meer dan prima toegepast kunnen worden, vooral omdat hij daarna met een lik verf van zelfs een drol iets magisch kan maken

(ik print vaker dingen van minstens 30CM hoog met een max van een 1 op 1 schaal Gal Gadot Wonder Woman hahah)

[Reactie gewijzigd door ultimasnake op 23 juli 2024 12:21]

Super interessant! Zou dit ook gebruikt kunnen worden om bijvoorbeeld spritemaps (van oude games bijvoorbeeld) te converteren naar volwaardige 3D modellen?
Kijk daar hebben we iets aan 😉

Op dit item kan niet meer gereageerd worden.