Netflix heeft een interne tool die het gebruikt om data te verzamelen en door te sturen opensource gemaakt. De tool kan worden gebruikt om bijvoorbeeld grote hoeveelheden serverlogs te verzamelen en naar een centrale server te sturen.
De tool, met de naam Suro, kan omgaan met verschillende soorten data. Suro wordt door Netflix gebruikt om de 1,5 miljoen 'server-events' per seconde te verzamelen. Het gaat dan bijvoorbeeld om serverlogs, activiteiten van gebruikers of andere operationele gegevens. Die worden door Suro verzameld en kunnen daarna naar verschillende bestemmingen worden doorgestuurd, zoals een Hadoop-cluster of een ElasticSearch-cluster, waarmee trends zoals storingen inzichtelijk kunnen worden gemaakt.
Vanaf nu is de tool opensource beschikbaar, zo heeft Netflix bekendgemaakt. Suro is zelf overigens ook gebaseerd op een opensource-tool: het is een ver doorontwikkelde en aangepaste versie van Chukwa, een tool van de Apache Foundation voor het verzamelen van data. Volgens Netflix kan één Suro-instance 60.000 berichten per seconde verwerken.
Waarom Netflix de tool opensource maakt, is niet duidelijk. Het gebeurt vaker dat bedrijven hun tools opensource maken, zoals Facebook bijvoorbeeld deed met zijn php-versneller en database-software Cassandra.