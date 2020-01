De meeste treinen van de NS rijden op windenergie, maar data zijn steeds vaker de belangrijkste 'brandstof' van het mobiliteitsbedrijf. Inzichten uit data zorgen voor een steeds efficiëntere bedrijfsvoering en vormen ook de basis voor innovaties waar de treinreiziger uiteindelijk plezier van heeft. Welkom in de wereld van Data & Analytics bij de NS.

Wat zou de NS zijn zonder zijn data? Martijn Scheele, hoofd van de afdeling Data & Analytics bij NS, denkt even na en geeft dan het volgende antwoord: "Data zijn cruciaal voor ons. Zonder data varen we blind in de aansturing van de operatie." Hij noemt de ruim 140 bronsystemen met informatie over uiteenlopende zaken, variërend van kaartverkoop en check-in-gegevens tot onderhoud en materieel. Deze leveren een schat aan data op ("Aantallen gigabytes noem ik niet, dat verandert elke maand") die de NS voor tal van toepassingen gebruikt.

Binnen de NS neemt D&A een centrale plek in. "Wij zijn een van de weinige afdelingen die de hele NS-organisatie kunnen bedienen. Dat alleen al maakt het werk hier bijzonder." D&A telt op dit moment ruim 160 medewerkers en groeit ieder jaar met ongeveer twintig nieuwe collega's. Wat maakt het leuk om hier te werken? "Als je hier binnenkomt merk je dat je snel aan slag kunt met nieuwe cloudtechnologie en producten als Power BI en Databricks. Je werkt hier ook met verschillende soorten collega's, van traditionele developers tot statistici. Creativiteit wordt hier gewaardeerd, maar we zijn geen vrijheid-blijheid-clubje. Er is een bepaalde mate van standaardisering in de producten die wij maken. Dat betekent aan de andere kant ook dat je niet alles zelf hoeft uit te vinden. En we vinden het belangrijk dat collega's goed geschoold zijn, daar is ook budget voor."

Advanced Analytics

D&A verwerkt data voor grofweg drie doelen. Het eerste is Business Intelligence, waarbij D&A de data Dat geldt ook voor de steeds grotere hoeveelheden 'stromende data' uit IoT-systemen die worden gebruikt voor real-time analyses op het Hadoop-dataplatform. opwerkt tot bruikbare stuurinformatie, gepresenteerd in rapportages en dashboards. Het tweede is het doorsturen van data voor onder meer het CBS en de Nederlandse overheid. Maar het meest tot de verbeelding spreekt het gebruik van Advanced Analytics. De zitplaatszoeker in de NS-app voor reizigers is daarvan een voorbeeld; deze gebruikt data uit de veertig 'Gotcha!'-meetstations van ProRail onder het spoornetwerk om op basis van het gewicht van treinstellen de drukte te berekenen. Op deze manier kunnen reizigers via de zitplaatszoeker zien in welk treinstel nog voldoende plek is. Iets minder bekend is dat de NS deze data ook gebruikt om de afstelling van treinen in de onderhoudswerkplaatsen te verbeteren. "Data die uiteindelijk ook zorgen voor een grotere beschikbaarheid van materieel en minder vertraging voor reizigers." Dat geldt ook voor de steeds grotere hoeveelheden 'stromende data' uit IoT-systemen die worden gebruikt voor real-time analyses op het Hadoop-dataplatform. "En mocht er eens sprake zijn van een uitvallende trein, dan kunnen we gegevens uit stationsgebieden gebruiken, waaronder incheckgegevens, om te bepalen hoeveel bussen we in moeten zetten."

Privacy en gemak

De overheid is ook geïnteresseerd in deze gegevens, die helpen de veiligheid in stationsgebieden te vergroten. "In het geval van calamiteiten worden ze - geanonimiseerd natuurlijk - gedeeld met onder meer de politie." Bij hoge uitzondering mogen opsporingsdiensten vragen om individuele gegevens. Een voorbeeld daarvan was het oplossen van de serie treinbranden in 2017, op het traject tussen Amsterdam Centraal, Haarlem en Zandvoort.

Zorgvuldig omgaan met gegevens staat daarbij altijd centraal. “We hebben goede wetgeving in Europa om de privacy van burgers te beschermen. We zoeken naar mogelijkheden om reizen makkelijk te maken, waarbij de reiziger altijd zelf beslist welke gegevens hij of zij met ons wil delen. Zo loopt er op dit moment een aanvraag bij de Autoriteit Persoonsgegevens om de geaggregeerde check-in- en check-out- "Dat doen wij door vol in te zetten op automatische DevOps-pipelines in onze nieuwe omgeving." gegevens te mogen gebruiken om de zitplaatszoeker te verbeteren.”



De veilige omgang met persoonsgegevens is overigens verder na te lezen in het privacybeleid van de NS. Voor veilige verwerking kijkt de NS onder meer nadrukkelijk naar de beschikbaarheid en veiligheid van omgevingen. Scheele noemt bijvoorbeeld het niet meer inzetten van bestaande (legacy-)rapportages als gevolg van de nieuwe AVG-wetgeving. Voor de nieuwe omgeving (ACE, zie verderop in dit artikel) wordt veiligheid gewaarborgd door onder meer het aantal mensen te minimaliseren dat toegang heeft tot productiegegevens. “Dat doen wij door vol in te zetten op automatische DevOps-pipelines in onze nieuwe omgeving.”

Treinen rijden vaker door data

Het zijn proeven als deze die vaak de media halen, maar ook op minder zichtbare gebieden werkt D&A aan een betere treinreis. Zo is er de inzet van predictive maintenance, waardoor treinen minder vaak uitvallen. Ook het real-time monitoren van de 'de-icing' van materieel wanneer treinen in de winter ‘s nachts kunnen bevriezen verloopt een stuk effectiever door inzet van data. "Dat merk je als reiziger doordat je trein beschikbaar is waar dit vroeger misschien minder vaak het geval was. Maar je weet daarbij natuurlijk niet dat dit komt doordat we een dataproduct inzetten."

Data verandert veel

Het maken van de omslag van een mobiliteitsbedrijf naar een datagedreven logistieke organisatie is een Zo is er de inzet van predictive maintenance, waardoor treinen minder vaak uitvallen. grote uitdaging, zo wordt wel duidelijk in het gesprek met Martijn. Deze uitdaging speelt op verschillende niveaus: van de data tot de collega’s binnen de organisatie zelf. "We moeten data op een volwassen manier behandelen, eenduidig bewaren en er 100 procent 'AVG-proof' mee werken, en dit natuurlijk altijd met het oog op de impact die we ermee maken op ons bedrijf en de reiziger."

Een uitdaging waar Data & Analytics op dit moment mee heeft te maken, is het goed ontsluiten van data. Hiertoe is het project ACE (Adoptie Cloud Ecosysteem) opgezet. “Wij geloven in de waarde hiervan voor het bedrijf. Voor ons houdt dit het opwerken van data in, waarbij we ‘vuile’ data schoonmaken, dus als het ware geschikt om ze vaker te gebruiken. Dus niet alleen voor dat ene vraagstuk waar we op dit moment mee bezig zijn om onze collega’s te helpen, maar ook voor toekomstige vragen.” Het toepassen van synthetische data binnen de ACE-omgeving, zoals de AVG voorschrijft, is nieuw. “Tegen de verwachtingen in zijn onze teams enthousiast over het werken met synthetische data. Het helpt ook in het automatiseren van testtrajecten zodat bij wijzigingen de omgeving veilig blijft.”

De grootste uitdaging is echter misschien wel het veranderen van zaken die vaak al jaren op een bepaalde manier worden gedaan, maar door het werk van D&A toch een stuk beter blijken te kunnen. "Doe het maar eens: ga een monteur die al dertig jaar zijn vak beheerst vertellen dat hij zijn onderhoudsboekje voortaan niet meer nodig heeft omdat wij de data hebben om precies te voorspellen wanneer een treinstel naar de werkplaats moet. Maar dat maakt ons werk ook zo relevant. Onze treinen rijden overal, en iedereen heeft wel een mening over de NS. En door het data-denken overal in de organisatie te krijgen, kunnen wij helpen dat bedrijf te verbeteren, want veranderen doe je samen. Dat is toch gaaf?"

