Wordt het nog wat met die DNA-opslag?

De omzetting van digitaal in dna-taal

De omzetting van digitaal in dna-taal (afb: Science)

DNA is niet alleen voor medici en genetici een begeerlijk onderzoeksdoel, maar ook voor informatici. DNA is met zijn vier ‘letters’ een geweldig opslagmedium. Onderzoekers van de Amerikaanse Columbia-universiteit en van het New Yorkse genoomcentrum hebben DNA gebruikt om een besturingssysteem en een korte film op te slaan. Ze stellen dat de opslagdichtheid honderd keer groter is dan een eerder ontwikkelde methode.
Met al die (en steeds meer) gegevens die we digitaal opslaan zouden we wel eens tegen de grenzen van de huidige harde schijven en magneetbanden kunnen aanlopen. DNA wordt gezien als een fantastisch opslagmedium. Je kunt, niet eens bij wijze van spreken, alle gegevens die we tot nu toe in de wereld hebben vastgelegd opslaan op een hoeveelheid DNA die in een emmer past.
De onderzoekers hebben nu een algoritme ontworpen waarmee je met je telefoon de informatie kunt ontsluiten die op DNA is opgeslagen, zoals een korte film. Ik heb altijd mijn twijfels als het over DNA. Het is biologisch materiaal en daar mee kwetsbaar, maar de onderzoekers beweren dat DNA een uiterst betrouwbaar opslagmedium is.
De opslageenheden op DNA, de nucleotiden, zijn verhoudingsgewijs uiterst klein (want op molecuulmaat) en de informatie zou honderden jaren kunnen worden opgeslagen als je maar zorgt dat het DNA koel en droog bewaard wordt. Dat blijkt uit het DNA van een 430 000 jaar geleden overleden voorouder van ons, die in een grot in Spanje werd ontdekt.
“DNA vergaat niet zoals cassettebandjes of cd’s en het veroudert niet. Als dat wel zo zou zijn dan hebben we grotere problemen”, zegt informaticus Yaniv Ehrlich van de Columbia-universiteit. Samen met Dina Zielinski van het genoomcentrum in New York hebben zes bestanden gecodeerd en opgeslagen op DNA: een volledig besturingssysteem, een Franse film uit 1895 (L’Arrivé du train à La Ciotat), een cadeaukaart van Amazon, een computervirus, een Pioneerplaat en een studie van informatietheoreticus Claude Shannon uit 1948.
Ze comprimeerden de bestanden in een moederbestand en splitsten de gegevens vervolgens in korte reeksen binaire code. Vervolgens werden de codereeksen opgeslagen in ‘druppels’ en hingen de enen en de nullen aan de vier nucleotiden (A, C, G en T). Het algoritme wiste lettercombinaties die foutgevoelig zijn en koppelde een streepcode aan elk ‘druppeltje’.

DNA-stukjes

Zo ontstond een lijst van 72 000 DNA-stukjes, elk 200 nucleotiden lang. Die werd naar een bedrijfje in San Francisco gestuurd (Twist Bioscience) dat zich bezighoudt met het omzetten van digitale gegevens in biologisch materiaal. Twee weken later kregen de onderzoekers het resultaat van die omzetting terug.

Om daar hun oorspronkelijk bestanden weer uit te halen gebruikten ze een moderne DNA-uitleestechniek, waarna het algoritme de genetische code omzette in binaire. Ze vonden hun bestanden precies zo terug als dat ze die in het DNA hadden laten opslaan. Foutloos. Ze toonden ook aan dat ze in principe een oneindig aantal kopieën van de opgeslagen informatie konden maken door gebruik te maken van de polymerasekettingreactie. Die schenen ook foutloos te zijn, evenals kopieën van kopieën.
Het bleek dat ze op die manier 215 petabytes (peta is een factor 1015) aan informatie op 1 g DNA konden opslaan, honderd keer meer dan met de methode die George Church, Nick Goldman en Ewan Birney eerder in 2013 hadden ontwikkeld.

Praktisch?

Dat is allemaal heel indrukwekkend, maar is het ook praktisch? De onderzoekers hebben 7000 dollar betaald om de informatie op het DNA-molecuul vast te leggen. Dan hebben we het over 2 MB aan gegevens. Ze moesten nog eens 2000 dollar neertellen (een dollar is tegenwoordig bijna een euro) om die gegevens uit te lezen.
De prijs voor het uitlezen van DNA is de laatste jaren gekelderd, maar of dat ook zal gebeuren met DNA-synthese is maar de vraag. “Investeerders zouden het risico wel eens niet willen nemen om de kosten naar beneden te brengen”, zegt biochemicus Sri Kosuri van de universiteit van Californië in Los Angeles.
Ehrlich blijft optimistisch: “We moeten meer aandacht besteden aan het tijdvretende moleculaire coderen.”

Bron: EurekAlert

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Deze site gebruikt Akismet om spam te verminderen. Bekijk hoe je reactie-gegevens worden verwerkt.