Onderzoekers van het New York Genome Center hebben een efficiënte en robuuste methode voor het opslaan van data in dna voorgesteld. Als proof-of-concept wisten ze een besturingssysteem, video en giftcard op te slaan en zonder errors terug te krijgen.
De afgelopen jaren zijn er grote stappen gezet bij het opslaan van data in dna, maar volgens de onderzoekers van Team Erlich, betrokken bij het New York Genome Center, is er ruimte voor verbetering. Ze wijzen erop dat bestaande methodes niet altijd even goed schaalbaar zijn en meestal gebreken vertonen bij het terughalen van de informatie.
Ze stellen daarom een nieuwe methode met de naam DNA Fountain voor. Deze strategie zou het theoretische maximum benaderen van de Shannon-capaciteit om informatie per nucleotide op te slaan. Bij DNA Fountain verwerken ze een bestand in een serie niet-overlappende segmenten met een bepaalde lengte. Vervolgens coderen ze die in korte datapakketjes, droplets, die over een kanaal met ruis verstuurd kunnen worden. Dna-opslag is namelijk te vergelijken met een communicatiekanaal met ruis. De droplets van 38 bytes bevatten een payload van 32 bytes, een seed van 4 bytes en nog eens 2 bytes voor error correcting code. De seed correspondeert met de staat van de toevalsgenerator ten tijde van het maken van de droplet. Hierdoor stelt de seed een decoder-algoritme in staat de identiteiten van de segmenten in de droplet af te leiden.
Met hun methode denken de onderzoekers data in theorie ongelimiteerd te kunnen kopiëren met behoud van data-integriteit. Bij een test encodeerden ze een gecomprimeerd bestand van 2.146.816 bytes in dna. De tarball bevatte het complete Kolibri-besturingssysteem, een Amazon-giftcard van 50 dollar, een korte video en een afbeelding van de gouden plaat van het Pioneerprogramma. Het bestand wisten ze volledig zonder fouten terug te halen, waarbij het decoderen negen minuten duurde met behulp van een Python-script op een standaard laptop.
De wetenschappers hebben hun onderzoek in een pre-publicatie met de naam Capacity-approaching DNA storage vrijgegeven. De paper heeft nog geen peer-review gehad.