Wetenschappelijke instellingen en bedrijven gaan namens de Europese Unie onderzoek doen naar het inperken van de complexiteit van 'big data'. Ze krijgen hiervoor van de EU een subsidie van 3,8 miljoen euro.
'Big data', een verzamelnaam van het opslaan van gegevens en het samenvoegen daarvan, is tegenwoordig in toenemende mate een probleem aan het worden. Databases groeien flink doordat bedrijven en particulieren enorme hoeveelheden informatie opslaan. Het blijkt echter bijzonder lastig om in al die data het overzicht te bewaren.
De instellingen doen in het kader van het BigStorage-project onderzoek naar hoe de talloze gegevens inzichtelijk blijven. Ze bekijken onder meer of ze bestaande algoritmes kunnen verbeteren, zodat de software de gegevens beter 'snapt' en ze dus makkelijker kan vinden en koppelen. Daarnaast houden de onderzoekers zich bezig met de achterliggende theorieën en de benodigde hardware. Ten slotte leiden ze professionals op voor het beheren van big data.
Het BigStorage-project loopt vier jaar en er doen verschillende Europese instellingen aan mee, maar geen Nederlandse en Belgische instanties. Het gaat om de Mainz University, de Technische Universiteit Madrid en het Spaanse Barcelona Supercomputing Center. Daarnaast werken het Duitse German Climate Computing Centre, het Griekse Foundation for Research and Technology en het Franse onderzoeksinstituut Inria er aan mee. Ten slotte voegen Seagate, CA, Fujitsu en het Franse Commissariat à l'énergie atomique zich bij het initiatief.
Behalve Europa doen wereldwijd meer instanties onderzoek naar 'big data'. Zo stelde de Amerikaanse regering zich onlangs nog ten doel om binnen tien jaar exaflops-clusters te bouwen, omdat big data nu al 'revolutionaire impact' op de commerciële en wetenschappelijke sectoren heeft.
De supercomputer die op dit moment het beste kan omgaan met enorme hoeveelheden data, is de Tianhe-2 van de Chinese National University of Defense Technology. Het systeem levert 33,86 petaflops, gemeten met de Linpack-benchmarks. Het Amerikaanse Department of Energy bouwt momenteel twee systemen die elk 100 petaflops moeten kunnen leveren als ze in 2017 gereed zijn. Petaflops staat voor 1015, oftewel een biljard floating point operations per second; bij exaflops is dat 1018 flops, oftewel een miljard miljard.