Deeplearningmodellen voor onder meer iot-toepassingen krijgen steeds meer voet aan de grond. Ze worden krachtiger, maar ook op het gebied van vertrouwen en uitlegbaarheid van algoritmen worden stappen gezet. IBM draagt bij aan de ontwikkeling hiervan in de opensourcegemeenschap. Zonder dat er een direct commercieel belang is, stelt het geavanceerde tooling, modellen en datasets beschikbaar in een Git-omgeving.

Developers die op zoek zijn naar vrij beschikbare deeplearningmodellen kunnen goed terecht bij IBM Developer. Met de Model Asset eXchange (MAX) vinden zij een groot aanbod van opensourcemodellen voor veelvoorkomende toepassingen: van het verwerken van data uit teksten en foto's tot audio en video. Deze zijn veelal ready-to-run en kunnen draaien als microservice met Docker of Kubernetes, maar ook zijn er trainbare modellen.

Geen enterprise-it zonder open source

IBM's commitment aan open source is niet nieuw. "We doen dit al ruim twintig jaar. We ondersteunen projecten en waar we potentie zien, adopteren we ze ook om ze bruikbaar te maken voor We hebben in wezen heel veel wielen gebouwd, zodat anderen ze niet opnieuw hoeven uit te vinden. enterpriseomgevingen", zegt Damiaan Zwietering, developer advocate voor IBM. "Tegelijk houden we deze projecten open source. In het algemeen is dit onze benadering voor open source."

Deze aanpak geldt ook voor de Model Asset eXchange. "We hebben daarbij bijvoorbeeld getrainde algoritmen die heel handig zijn voor het herkennen van emoties in tekst." De Model Asset eXchange bevat een grote repository aan modellen, waarbij de gedachte van IBM is geweest om deze zo eenvoudig mogelijk te maken in gebruik. "We hebben in wezen heel veel wielen gebouwd, zodat anderen ze niet opnieuw hoeven uit te vinden. Met elke programmeertaal zijn ze te gebruiken, via een api".

IBM host de modellen zelf voor testdoeleinden, maar voor productiewerk is het aan te raden ze te downloaden en zelf te implementeren, bijvoorbeeld in een Docker-omgeving. "Wij hosten de modellen in een Git-omgeving en je kunt ze testen, bijvoorbeeld voor het classificeren van enkele beelden. Deze omgeving is echter niet geschikt voor het verwerken van duizenden beelden per seconde. Dat kan wel als je de modellen downloadt en in een eigen omgeving inzet. Dat kan overal zijn, lokaal in een datacenter, in een container in de cloud of op iot-devices."

Praktische toepasbaarheid maakt interessant

De eXchange is sinds een jaar beschikbaar en volgens Zwietering tot dusver behoorlijk 'onder de radar' gebleven. "Tot nu toe is vooral sprake geweest van testen, maar de eXchange begint inmiddels wel tractie te krijgen in de developercommunity." Vooral de mogelijkheid om deze modellen ook echt naar de edge te brengen, maakt ze interessant. Zwietering geeft een voorbeeld van een praktijktoepassing waarbij een beeldherkenningsmodel de wijzerplaat van een drukmeter monitort en zo de druk in een buizensysteem voortdurend bewaakt. "Dit model maakt het mogelijk. Je kunt het op een goedkoop edgedevice met een camera zetten en voor de gebruiker heeft het grote waarde als het gaat om de veiligheid en continuïteit van een belangrijk fabrieksproces."

Er is een dringende behoefte aan vertrouwen als het gaat om ai. De op de MAX beschikbare modellen maken onder meer gebruik van technieken als lstm (long short-term memory) en zijn krachtiger dan de op dit moment veelgebruikte tooling. Maar performance alleen is niet alles. Nu ai steeds meer toepassingen krijgt in bedrijfsprocessen, neemt ook de algehele behoefte toe aan systemen die zorgvuldig afgewogen beslissingen maken, niet te manipuleren zijn en bovendien uitlegbaar zijn voor verschillende stakeholders. "Er is een dringende behoefte aan vertrouwen als het gaat om ai", zegt Romeo Kienzler, global chief data scientist en deep learning engineer bij IBM. "Open source speelt een belangrijke rol in het opbouwen van vertrouwen, omdat de code en de gebruikte technieken zichtbaar zijn voor iedereen."

MAX en DAX: een onafscheidelijke tweeling

Bovenstaande is een belangrijke overweging geweest voor IBM om extra in te zetten op de Model Asset eXchange; het ondersteunende team werd onlangs verdubbeld in omvang. IBM onderhoudt bovendien de Data Asset eXchange (DAX), wat een curated catalog is met daarin open data assets met een omvangrijke set metadata voor verschillende gebruiksdoeleinden. "MAX en DAX zijn voor ons niet los te zien van elkaar, omdat open modellen baat hebben bij open data als het gaat om het reproduceren van resultaten en de re-trainability van deze modellen", zegt Kienzler. "Dit vergroot het vertrouwen in ai-modellen".

IBM leidt de dans als het gaat om grote it-bedrijven die bijdragen met opensourcetooling voor ai. Deze is er bijvoorbeeld voor data lineage, uitlegbaarheid, robuustheid en trust & bias detection/mitigation, merkt Kienzler op. Hij wijst op tools als AI Fairness 360, AI Robustness 360 en AI Explainability, die zijn gedoneerd aan de Linux Foundation. "Daarmee is echt een stap gezet in de richting van het democratiseren van enterprise-ai". De verwachting is dat er nieuwe modellen voor specifieke doeleinden op de DAX zullen verschijnen. "Een anomaliedetector bijvoorbeeld en modellen voor data die moeilijk te verwerken zijn, zoals gesproken tekst", zegt Kienzler.

Deep Learning Works - Praktische informatie Datum: donderdag 12 september 2019 Locatie:

B.1, B. Building Amsterdam.



Programma:

15.00-15.30 uur - Inloop

15.30-17.30 uur - Workshop

17.30-18.15 uur - Diner

18.15-18.45 uur - Keynote 1 | Romeo Kienzler

18.45-19.30 uur - Keynote 2 | TBA - onderwerp Deep Learning

19.30-21.00 uur - Borrel

Maak gebruik van bestaande kennis

Voor developers die zich verder willen verdiepen in bijvoorbeeld machinelearning om natuurlijke taal te verwerken, heeft Zwietering nog een praktische tip. "Ik kom veel developers tegen die zich hierin verdiepen en vervolgens vast komen te zitten. Ik zou adviseren om een model uit de DAX te nemen of in ieder geval iets off-the-shelf en van daaruit verder te kijken wat je kunt verbeteren. Neem bijvoorbeeld het automatisch beantwoorden van e-mails. Er zijn al veel opensourceprojecten die zich hierop richten. Als je dit allemaal zelf gaat bedenken, kom je steeds meer vragen tegen en ontdek je dat het een complex vakgebied is. Natuurlijk kun je hierin ook een expert worden, maar dat kost tijd en moeite. Tijd en moeite die je misschien beter kunt gebruiken om tot een praktische toepassing te komen."

