Als je denkt aan dataopslag, dan denk je waarschijnlijk aan harde schijven of ssd's. Voor je pc zijn dat prima opties, maar voor langetermijnopslag op grote schaal brengen die veel nadelen met zich mee. Hdd's, ssd's en andere vormen van grootschalige en langdurige archiefopslag verslijten met de tijd en krijgen te maken met zaken als bit rot. Ze moeten daarom om de zoveel jaar vervangen worden, wat kosten en extra stroomgebruik met zich meebrengt.
Microsoft Research werkt daarom aan Project Silica, een onderzoeksproject waarmee onderzoekers zeven terabytes aan read-only data opslaan op een vierkant stukje glas van 120 bij 120mm. Dat glas gaat volgens Microsoft duizenden jaren mee, is veilig voor malware, verbruikt tijdens het idlen geen stroom en kan sneller uitgelezen worden dan bijvoorbeeld tape. Het is ideaal voor grootschalige opslag voor kritieke data die tot ver in de toekomst beschikbaar moet blijven, bijvoorbeeld voor nationale archieven of overheden.
Silica moet op termijn dan ook dienen als praktische methode voor cold storage, ter vervanging van bijvoorbeeld tape of andere archiefmedia. Tweakers sprak met Richard Black, researchdirector van Project Silica, om te praten over deze glasopslagtechniek, de voordelen van glas en de werking ervan.
Het begin van Silica
Project Silica is eind 2016 begonnen, vertelt Black aan Tweakers. "Duurzame en rendabele langetermijnopslag is een onopgelost probleem en de behoefte eraan blijft alsmaar groeien. Het probleem is dat bestaande archiveringsmedia verslijten en vele malen vervangen moeten worden gedurende de periode waarin je je data wilt bewaren. Of het nu hdd's of tapes zijn, ze hebben een eindige levensduur. Dat leidt tot kosten, uitstoot en energiegebruik. En die kosten nemen toe met de levensduur van de data: hoe langer je die bewaart, hoe meer het je kost."
"We waren bij Microsoft al een tijdje op zoek naar een opslagmedium dat beter zou passen bij de eisen voor dit gebruiksscenario. Bij Microsoft Research en Azure stuitten we al vroeg op werk van de Universiteit van Southampton in het Verenigd Koninkrijk. Deze universiteit had een afdeling die het Opto-electronics Research Center heette en een nieuw natuurkundig effect ontdekte, namelijk de mogelijkheid om glaskristallen te modificeren met behulp van een femtosecond laser."
"Na verschillende bezoeken aan Southampton, zag ons team een kans. Dus we begonnen een samenwerking met hen. We werkten de eerste tweeënhalf jaar samen aan het project en sindsdien werken we er aan door. Het is nog steeds een onderzoeksproject om de technologie voor glasopslag te ontwikkelen en te kijken of we de natuurkunde kunnen temmen om dit te laten werken."
Waarom glas?
Waarom Microsoft uiteindelijk voor die glastechniek koos als alternatief voor traditionele opslagmethoden? Omdat het volgens de techgigant verschillende voordelen met zich meebrengt. "De grootste troef van het glas is zijn duurzaamheid. Die duurzaamheid leidt tot verschillende andere goede eigenschappen", vertelt Black. "Glas is bestand tegen temperatuur, vochtigheid, deeltjes en elektromagnetische velden. Het gaat zo lang mee dat je de media niet om de paar jaar hoeft te vervangen. Je kunt je gegevens gewoon in het stuk glas bewaren zolang als nodig is."
:fill(white):strip_exif()/i/2006572364.webp?f=thumblarge)
"Het is ook immutable, of write once, read many. Zodra je de gegevens hebt geschreven, ben je klaar; die kunnen dan niet meer veranderd worden. Dat is zeer wenselijk bij archiefopslag. Gebruikers weten dat de data veilig is als het eenmaal geschreven is. Er zijn geen bugs, malware of staatshackers die de archiefstukken kunnen aanpassen. Dat is een goede eigenschap."
"De prestaties zijn ook een voordeel. Als je denkt aan magnetische tapes, die vaak gebruikt worden voor archiefopslag, dan zit er meer dan een kilometer tape in een cartridge. Als je iets wilt lezen, dan moet je dat eerst uitrollen of terugspoelen. Op een stuk glas kun je gemakkelijk de data opzoeken die je wilt uitlezen. En de capaciteit is ook goed. Zowel de data als het glas zelf zijn transparant. Daardoor kun je honderden lagen data boven op elkaar krijgen in een stuk glas van 2mm dik. Zo kunnen we ook een hogere opslagdichtheid bereiken dan tape."
"Dan is er ook de beschikbaarheid. Glas is heel gemakkelijk te maken. Je hoeft je geen zorgen te maken dat het opraakt of wat er gebeurt als er maar één leverancier in de wereld is en die ophoudt te bestaan, of iets dergelijks. Ten slotte is er de duurzaamheid. Het kost weinig energie om te maken, gebruikt geen energie wanneer de data niet wordt gelezen en is gemakkelijk te recyclen. Die voordelen komen allemaal voort uit de duurzaamheid van het glas."
Data schrijven met een laser
Zodoende begon Project Silica dus bij Microsoft Research. Het project bestaat uit vier 'labs', die verschillende aspecten van archiefopslag omvatten: schrijven, lezen, decoderen en opslag. Het geheel begint dus bij het beschrijven van de glazen plaatjes met behulp van een krachtige laser.
Met behulp van de natuurkundige ontdekkingen van Southampton, ontwikkelden onderzoekers van Microsoft een manier om leesbare data te verwerken in glaskristallen. Die data wordt geschreven in de vorm van honderden lagen met symbolen genaamd voxels. "Voxels zijn eigenlijk gewoon driedimensionale pixels; een pixel is tweedimensionaal, een voxel is een volume pixel", legt Black uit. Die voxels bevatten de data die later kan worden uitgelezen. Die data hangt af van de positionering van de voxel. Door onder meer de oriëntatie aan te passen, kunnen de onderzoekers verschillende bits aan data verwerken in iedere voxel.
Hoe dat schrijven precies werkt? "Je neemt een kleine hoeveelheid energie. Die concentreer en time je in een femtoseconde (een biljardste van een seconde, red.). Vervolgens focus je die energie met een lens. Daarmee geef je een puls aan een zeer klein stukje in het glas. De intensiteit van het licht op dat focuspunt is dan zo hoog dat je er het kristal mee kunt aanpassen; je kunt zo dus permanente symbolen in het glas aanbrengen. Die aanpassingen zijn asymmetrisch; we kunnen onder andere de draaiing beïnvloeden. Dat maakt het mogelijk voor ons om meerdere bits in een voxel te verwerken, aan de hand van de oriëntatie van de voxel op meerdere assen."
In het kort schrijft een laser dus voxel voor voxel gegevens in het glas. Honderden laagjes van dergelijke miniscule voxels worden boven op elkaar geplaatst. Zo kan in een stukje glas van 2mm dik en ter grootte van een dvd momenteel meerdere terabytes aan data worden opgeslagen. In theorie kan die dichtheid volgens Black verder worden opgehoogd, hoewel het onderzoeksteam daar momenteel niet meer mee bezig is. "We kunnen dat in de toekomst wel verder opschalen, als dat nodig is", vertelt de researchdirector.
/i/2006572358.png?f=imagenormal)
Schrijfsnelheden van Silica
Black kan niet vertellen wat de huidige schrijfsnelheden van Silica zijn. Het beschrijven van 7TB data op zo'n stukje glas 'zou even duren', vertelt hij wel. "We weten hoe we de schrijfsnelheden concurrerend moeten maken, en dat zouden vele megabytes per seconde moeten zijn. Ik kan je geen concrete cijfers geven, maar in theorie is het mogelijk om snel en meerdere voxels tegelijkertijd te schrijven. In ons onderzoek doen we dat niet; dat zou pas gebeuren in een productiefase."
"Onze laser werkt met pulsen. Die pulsen kunnen vrij snel achter elkaar komen. Je schrijft de symbolen en beweegt gaandeweg de laser over de lengte van het glas. Je kunt dat vergelijken met de manier waarop een barcodescanner dat doet. Je hebt dus een snelle reeks pulsen die we allemaal in het glas laten vallen. Iedere individuele puls schrijft een voxel in het glas. Dus ja, op deze manier schrijven we één voxel per puls. Maar op een hdd schrijf je ook op één magnetisch domein per keer."
"De andere manier om snel te schrijven, is dat de puls uit de laser héél veel energie heeft. Eigenlijk heb je niet zoveel energie nodig om de symbolen in het glas te schrijven. Je kunt de puls dan opsplitsen in meerdere bundels, en die allemaal op het glas richten. Je kunt zo één laser gebruiken om een hoop symbolen tegelijkertijd te schrijven. Dat zijn enkele manieren waarop we snel kunnen schrijven. We hebben de verwerkingscapaciteit gaandeweg al met 10.000 keer versneld ten opzichte van 2016, toen de natuurkunde oorspronkelijk werd ontdekt in Southampton."
Data lezen met microscopen
Ieder stukje glas wordt na het schrijven geverifieerd en kan dan worden opgeslagen totdat het weer gelezen moet worden. Dat lezen gebeurt niet met een laser, maar met een computergestuurde microscoop. Het stuk glas wordt daarvoor in een reader geplaatst. Met de microscoop wordt een van de lagen voxels in focus gebracht. Daar wordt vervolgens een afbeelding van geschoten met een camera, waarna die gedecodeerd kan worden. De microscoop kan daarna een andere laag in beeld brengen, en zo verder.
/i/2006572362.png?f=thumblarge)
glasplaatje. Bron: Microsoft
Volgens Microsoft is glas ook op dit gebied relatief robuust; de data blijft leesbaar, ook als er bijvoorbeeld krassen op de plaat zitten. "Dat is het mooie van data in glas, in plaats van data op glas. Als je kijkt naar opslagmedia die een oppervlak etsen of modificeren, dan zijn krassen of slijtage een probleem. Met glas hebben we een soort marge rondom de gegevens. De data zit veilig binnen in het medium. De microscoop heeft ook een vrij smalle depth of field, dus krassen of stofdeeltjes zijn niet in focus tijdens het lezen van de data." Ook hierbij kan Black geen concrete leessnelheden noemen, maar volgens hem kan de techniek ook concurrerend zijn met andere typen archiefmedia.
Decoderen van de data met machinelearning
Voxels zijn analoge data, maar moeten bij het uitlezen worden omgezet naar digitale informatie die daadwerkelijk begrepen kan worden door een computer. "We gebruiken daar machinelearning voor", vertelt Black. "En dat doen we niet omdat dat trendy is."
Volgens Black heeft het gebruik van machinelearning twee grote voordelen. "Machine learning is heel goed in het classificeren van afbeeldingen, al helemaal als je het model goede trainingsdata kan geven. Wij kunnen perfect gelabelde trainingdata aan ons machinelearningnetwerk geven, aangezien we precies weten welke gegevens in een stukje glas horen te zitten; we hebben de originele kopie immers nog. Het blijkt dat ons machinelearningmodel het beter doet dan traditionelere technieken voor digitale signaalverwerking."
"Machinelearning maakt ons ook flexibeler als onderzoekers. We sleutelen dagelijks aan dingen. We voeren veranderingen en verbeteringen door of experimenteren met de reader of writer. Met klassieke digitale signaalverwerking is dan een enorm team van onderzoekers nodig dat zijn tijd besteedt aan het uitzoeken van die veranderingen en het tweaken van het algoritme. Dat zou onze voortgang vrij traag maken. Met machinelearning hoef je alleen het model opnieuw te trainen. Als de data vervolgens in beeld is op de microscoop, vindt het machinelearningmodel wel een manier om het terug te vinden."
Silica-bibliotheken
Het laatste aspect van Project Silica omvat een opslagmethode voor de glazen opslagmedia zelf, in de vorm van een Silica Library. Deze bibliotheken bestaan uit grote rijen opslagrekken die iets weg hebben van boekenkasten. Volgens Microsoft zijn de library's ontworpen rondom de werking van Project Silica's glazen opslagplaatjes en het feit dat die lang meegaan.
"Veel hedendaagse tapebibliotheken zijn nog ontworpen voor de workloads rond back-ups van mainframes uit de jaren zestig. Er is heel weinig innovatie geweest op dat gebied. De moderne workload lijkt daar gewoonweg niet op; het gaat vooral om kleine randomreadacties. Bovendien wil je, als je een medium hebt dat millennia meegaat, dat niet plaatsen in een bibliotheek waar de componenten slijten. We wilden daarom volledig passieve rekken, die net zo lang meegaan als de media die we erin zetten, of in ieder geval net zo lang als het gebouw eromheen."
"Daarom hebben we de bibliotheek herontworpen", vertelt Black. Deze Silica-bibliotheek is gebaseerd op modulaire rekken, waarin de glazen plaatjes worden geplaatst. Die worden op hun plek gehouden door de zwaartekracht en de rekken zelf bevatten dan ook geen elektronica. De rekken zijn volgens Microsoft 'incrementeel' in te zetten, waarmee ze gedurende hun levensduur uitgebreid kunnen worden met nieuwe modules.
De glazen media kunnen worden opgehaald door kleine robots, genaamd shuttles. Die kunnen zelfstandig de rekken beklimmen en de benodigde stukjes glas ophalen om naar de reader te brengen. De robots worden pas actief als er glas is om op te halen, zo vertelt Microsoft.
Een prototype van een Project Silica-library
Tot slot
Project Silica kan veelbelovend zijn voor de toekomst van archiefopslag. Voorlopig is het echter nog niet zover. Het is namelijk onduidelijk wanneer Project Silica in de praktijk gebruikt zal worden. Black kon daar tegenover Tweakers geen uitspraken over doen, hoewel hij benadrukte dat het momenteel alleen nog een onderzoeksproject is.
Zelfs wanneer dat gebeurt, is het onwaarschijnlijk dat je ooit eindigt met een Silica-schijf in je pc of laptop. Gezien zijn read-only eigenschappen is deze techniek niet geschikt voor dagelijks gebruik. Maar voor archiefopslag en langetermijnback-ups kan Silica op de lange termijn wellicht een praktischer en duurzamer alternatief vormen voor bestaande opslagmedia.