Apple heeft een machinelearningmodel uitgebracht waarmee gebruikers afbeeldingen kunnen bewerken. Ze moeten hiervoor een tekstprompt invullen, bijvoorbeeld 'verwijder de vrouw uit de foto', waarna automatisch de gewenste bewerking wordt uitgevoerd.
Het machinelearningmodel, MGIE, kan verschillende soorten bewerkingen uitvoeren, waaronder afbeeldingen bijsnijden, draaien en de helderheid aanpassen. Ook kunnen Photoshop-achtige manipulaties worden uitgevoerd. In een voorbeeld dat Apple in zijn onderzoekspaper toont, kunnen gebruikers bijvoorbeeld groenten toevoegen aan een foto van een pizza salami of iets anders weergeven op het beeldscherm van een afgebeelde laptop.
MGIE maakt gebruik van multimodal large language models om het verzoek van gebruikers te kunnen begrijpen en vervolgens tot op de pixel nauwkeurige aanpassingen te kunnen maken, legt Apple uit. Het bedrijf heeft hiervoor samengewerkt met onderzoekers van de Universiteit van Californië.
De code, data en voorgetrainde modellen van MGIE zijn op GitHub geplaatst. Ook is er een demo beschikbaar op Hugging Face Spaces. Het is nog onduidelijk waar Apple dit AI-model voor wil gaan gebruiken.