Intel heeft zijn Latent Diffusion Model for 3D getoond. Dat is een AI-model waarmee 3d-beelden gegenereerd kunnen worden. Volgens Intel is het het eerste model dat een dieptemap kan genereren om 'levendige' driedimensionale 360-gradenbeelden te creëren.
Volgens Intel is dit LDM3D-model in staat om een dieptekaart en driedimensionale afbeelding te creëren op basis van een tekstprompt 'met bijna dezelfde hoeveelheid parameters' als bestaande modellen die 3d-afbeeldingen genereren. De fabrikant stelt dat de relatieve diepte voor iedere pixel nauwkeurig geschat wordt, wat ontwikkelaars 'veel tijd moet besparen bij het ontwikkelen van scenes'. Als voorbeelden noemt Intel dat dit model gebruikt kan worden bij het maken van virtualrealitygames en virtuele musea.
De dataset voor LDM3D bestaat uit 10.000 voorbeelden van de LAION-400M-database. Die bestaat uit 400 miljoen afbeeldingen en bijbehorende beschrijvingen. Voor het schatten van de relatieve diepte van de pixels wordt het Dense Prediction Transformer-model gebruikt. Op basis van de gegenereerde 2d-afbeelding en dieptekaart maakt de geïntegreerde DepthFusion-applicatie van Blockade Labs vervolgens een 360-gradenprojectie. Laatstgenoemde AI-bedrijf toont in een video op Twitter enkele voorbeelden van 360-gradenomgevingen die met dit model zijn gegenereerd. Intel heeft LDM3D open source gemaakt via HuggingFace.