Meta heeft een AI-tool gepresenteerd die objecten in foto's zou moeten herkennen zonder erop getraind te zijn. Tools tot nu toe werken alleen op gebieden waar wel data van in de trainingsset zit. De dataset is bovendien veel groter dan voorgaande tools, claimt Meta.
Meta noemt de tool Segment Anything. Het is getraind op ongeveer elf miljoen afbeeldingen en in totaal een miljard maskers op die afbeeldingen. Mensen hebben het model getraind door feedback te geven op de maskers en die te annoteren. Daardoor kan het model nu objecten herkennen in foto's die het niet eerder heeft gezien.
Meta heeft ook de paper en een demo online gezet. Bij die demo kunnen gebruikers zelf foto's uploaden en het systeem maskers laten aanmaken daarvoor. De demonstratie laat geen labels zien bij die objecten. Wel laat het precies zien waar het model grenzen trekt voor objecten. Het model werkt met 'prompting', waarbij Segment Anything probeert na te gaan hoe waarschijnlijk het is dat een bepaald punt bij een bepaald object hoort.
Meta wil met de techniek in de toekomst AR-brillen objecten laten herkennen zonder dat het model die eerder heeft gezien. Vervolgens moet het mogelijk zijn om daar in de software acties bij uit te voeren. Het is lang niet het eerste algoritme voor objectherkenning. Dat zit in de camerasoftware van elke moderne smartphone. Ook het herkennen van objecten hoort daarbij, hoewel die vooral werken met getrainde data.