Twee onderzoekers van Google hebben een deeplearningsysteem onder de naam Creatism ontwikkeld. Dat is in staat om foto's uit Street View om te zetten in professioneel ogende foto's door hetzelfde werkproces als een fotograaf toe te passen.
De onderzoekers schrijven dat de 'virtuele fotograaf' 40.000 afbeeldingen heeft doorzocht en een selectie heeft gemaakt op basis van compositie. Uit het bijbehorende onderzoek blijkt dat daarbij handmatig afbeeldingen werden verwijderd die sterke vertekening vertoonden of waarin mensen of wegen duidelijk zichtbaar waren. Vervolgens maakte het systeem een uitsnede en voerde het verschillende bewerkingen van de gekozen panorama's uit om tot een eindresultaat te komen.
Het systeem voerde de bewerkingen uit aan de hand van een aangeleerd begrip van esthetiek. Het leerproces vond plaats aan de hand van professionele foto's die automatisch werden opgedeeld in verschillende aspecten, aldus de onderzoekers. De belichting in de foto's werd gecreëerd aan de hand van een procedure die ze zelf 'dramatic mask' noemen. Daarvoor gebruikten ze een generative adversarial network, waarbij het ene neurale netwerk probeert de belichting van afbeeldingen te verbeteren en het andere netwerk onderscheid moet maken tussen de bewerkte foto's en professionele foto's.
De onderzoekers werkten samen met zes professionele fotografen die de uiteindelijke foto's moesten beoordelen in vier categorieën: point and shoot, goede foto's, semi-professioneel en professioneel. Daarbij kwamen veertig procent van 179 afbeeldingen met een hoge voorspelde score in die laatste twee categorieën terecht. De onderzoekers hebben een collectie van de beste foto's online gezet.