Meta presenteert AI-tool voor ongetrainde objectherkenning in afbeeldingen

Meta heeft een AI-tool gepresenteerd die objecten in foto's zou moeten herkennen zonder erop getraind te zijn. Tools tot nu toe werken alleen op gebieden waar wel data van in de trainingsset zit. De dataset is bovendien veel groter dan voorgaande tools, claimt Meta.

Meta noemt de tool Segment Anything. Het is getraind op ongeveer elf miljoen afbeeldingen en in totaal een miljard maskers op die afbeeldingen. Mensen hebben het model getraind door feedback te geven op de maskers en die te annoteren. Daardoor kan het model nu objecten herkennen in foto's die het niet eerder heeft gezien.

Meta heeft ook de paper en een demo online gezet. Bij die demo kunnen gebruikers zelf foto's uploaden en het systeem maskers laten aanmaken daarvoor. De demonstratie laat geen labels zien bij die objecten. Wel laat het precies zien waar het model grenzen trekt voor objecten. Het model werkt met 'prompting', waarbij Segment Anything probeert na te gaan hoe waarschijnlijk het is dat een bepaald punt bij een bepaald object hoort.

Meta wil met de techniek in de toekomst AR-brillen objecten laten herkennen zonder dat het model die eerder heeft gezien. Vervolgens moet het mogelijk zijn om daar in de software acties bij uit te voeren. Het is lang niet het eerste algoritme voor objectherkenning. Dat zit in de camerasoftware van elke moderne smartphone. Ook het herkennen van objecten hoort daarbij, hoewel die vooral werken met getrainde data.

Meta Segment AnythingMeta Segment AnythingMeta Segment Anything
Meta Segment AnythingMeta Segment Anything

Door Arnoud Wokke

Redacteur Tweakers

06-04-2023 • 13:35

15

Reacties (15)

15
14
7
0
0
5
Wijzig sortering
Lijkt erop dat er als meer budget en resources worden ingezet op het gebied van AI. Lijkt haast een volledige omwenteling te zijn sinds ChatGPT. Ik denk dat we binnen een paar jaar veel verder gaan staan dan we momenteel durven denken.
AI is al 5-10 jaar behoorlijk hot - eigenlijk sinds Deep Learning doorgebroken is. Een belangrijke factor was NVidia's CUDA support voor een heleboel AI libraries. ChatGPT is representatief voor een sub-veld van AI, de zogenaamde generatieve (creatieve) AI's. Maar dit artikel gaat over een AI die voorwerpen herkent. Het derde gangbare AI type zijn game-AI's zoals AlphaGo.
De laatste pakweg 10 jaar hebben de grote bedrijven allemaal bakken met geld aan AI onderzoek uitgegeven, zonder al te veel te laten zien van hun voortgang. Sinds de presentatie van chatGPT is het plotseling publiek geworden hoe ver 1 bedrijf gekomen is en voelen de andere bedrijven de druk om ook te laten zien waar ze staan.
Welnee. ChatGPT was zeker niet de eerste AI die publiek werd. Google's DeepMind was ook vrij publiek, bijvoorbeeld. En ImageNet en ResNet waren ook geen grote geheimen.
Ja eens. Voor mijn gevoel gaat het nu ook in een soort stroomversnelling. Of het is een hype die overwaait, al acht ik de kans klein..
Vraag mij af waarom wel de weerspiegeling van de windmolen in het water als object wordt gemarkeerd en de weerspiegeling van het gebouw niet. En de hele rij bomen wordt als één object gezien maar een aantal bomen dan weer als apart object.

Ik kan mij voorstellen dat dit enorm bruikbaar is, zeker voor een platform als meta, en dat er nog ruimte voor verbetering is.

[Reactie gewijzigd door Sukeltje op 29 juli 2024 11:33]

Meta wil met de techniek in de toekomst AR-brillen objecten laten herkennen zonder dat het model die eerder heeft gezien.
Dit is natuurlijk wel mooie technologie. Echter lijkt het er nu op alsof ze bijpassende kleuren aan het uitknippen zijn.
knap toch wel en het gebouw zal wat te weinig contrast met het water hebben of zo.

Het is nog jonge technologie ik ben toch best wel onder de indruk
Ik ben nog niet heel erg onder de indruk als ik naar de plaatjes kijk, dat ziet er niet beter uit dan de photoshop 'wand-select' tool.
Volgensmij snap je niet helemaal waar het artikel over gaat.
Adobe heeft tegen wording een auto object and person select waar hun eigen sensai ai achter zit. Moet zeggen dat het ook mijn eerste associatie was. Daarbij krijg je ook een lijst / voorbeeld van alle objecten en personen die hij denkt te herkennen in de foto. Wat hij niet doet volgens mij is zeggen wat het object is. Mensen derlt hij wel op in onderdelen dus hoofd, ogen, mond, neus, handen, etc.
Niet getraind op een dataset, maar het wordt wel getraind waar je uiteindelijk ook een dataset hebt waar het model zich weer op traind.

[Reactie gewijzigd door moonlander op 29 juli 2024 11:33]

Puh, veel belangrijker is het nieuws dat meta AI gaat inzetten voor het genereren van adevertenties...
Maar dat was denk ik nog niet doorgesijpeld tot de redactie.,
Dit vertoond wel verdomd veel overeenkomsten met de technieken die Mapillary gebruikte, al voordat ze overgenomen werden door Facebook Meta.

Op dit item kan niet meer gereageerd worden.