IT

Synthetische DNA könnte in Zukunft helfen, Unmengen an Daten zu speichern

Mario Lips

Von Mario Lips

Sa, 19. September 2020 um 19:24 Uhr

Bildung & Wissen

Wie können die Datenmassen künftig sicher und kostengünstig gespeichert werden? Eine mögliche Lösung: DNA. Damit könnten auf Salzkörngröße 230 Jahre HD-Videos gespeichert werden.

Vor mehr als 50 Jahren haben magnetisierbare Materialien die Ära der Lochkarten als Speichermedien für Computer beendet. Bald soll auch deren Zeit gekommen sein – synthetische DNA ist als Speicher der heißeste Kandidat, um die Datenflut in den Griff zu kriegen.

Steuererklärungen, Kontoauszüge, Zeitungsartikel: Dank der Digitalisierung sind Informationen schnell und unkompliziert verfügbar. Doch je mehr Anteile des täglichen Lebens in Einsen und Nullen übersetzt werden, desto mehr Raum benötigen diese Daten. Allein die Videoplattform Youtube muss in jeder Minute mehr als 500 Stunden hochgeladenes Filmmaterial speichern – so entstehen jede Stunde Dutzende Terabyte an Daten, die in gigantischen Rechenzentren weltweit aufbewahrt werden.

Wie bleiben die Daten längerfristig zugänglich?

IT-Unternehmen stehen daher vor der Herausforderung: Wie können Daten künftig sicher und kostengünstig gespeichert werden? Bislang verschlingen der Betrieb und die Kühlung von Servertürmen enorm viel Energie und Platz.

Ein weiteres Problem: Wie bleiben die Daten längerfristig zugänglich? CDs sind nicht für die Ewigkeit gemacht. Und auch der technologische Fortschritt bringt Probleme mit sich, die vermutlich jeder schon erlebt hat: Neuere Computer verzichten auf Diskettenlaufwerke und auch Abspielgeräte für alte Videokassetten verschwinden aus dem Handel. Die Suche nach einem Speichermedium mit einer längeren Halbwertszeit liegt also nahe. Mehrere Arbeitsgruppen glauben mittlerweile fest daran, mit DNA diesen Datenträger gefunden zu haben.

6000 Terabyte finden Platz in einem Salzkorn

Ganz neu ist diese Idee nicht. Bereits im Jahr 1959 erwähnte der Physiker Richard Feynman DNA in einem Vortrag als Informationsträger im Nanomaßstab. Damals war noch sehr wenig über unser Erbmaterial bekannt. Heute staunen Forscher immer wieder, wie ausgefeilt der Informationstransfer von der DNA zu den lebensnotwendigen Prozessen in einer Zelle abläuft. Ein stattlicher Apparat an Kontrollmechanismen reguliert, wie Erbinformationen im lebenden Organismus verarbeitet werden.

Das biologische Potenzial, das die DNA bietet, interessiert die IT-Forscher jedoch nicht: Sie stellen lediglich ein langes Molekül her, dessen Bausteine sie nach Belieben zu einer Zeichenfolge kombinieren – einem Code. DNA eignet sich dafür bestes, sie ist ja bereits ein natürlicher Code: Sie besteht aus den vier Basen Adenin, Thymin, Cytosin und Guanin. Die Forscher übersetzen nun einen klassischen Computer-Code aus Nullen und Einsen in eine Abfolge dieser vier Basen. Der Code wird bei Bedarf später von einem künstlichen Lesesystem dechiffriert, also von der molekularen Ebene wieder zurückübersetzt.

Mit der biologischen Funktion von DNA, nämlich der Codierung von Proteinen, hat das nichts mehr zu tun: Für jede natürliche Zelle kommt bei diesem Code nur noch ein unverständliches Kauderwelsch heraus. Kritiker der Gentechnik brauchen sich also nicht zu sorgen. Etwas "Lebendiges" schaffen die Wissenschaftler hier keinesfalls.

"Die Vorteile sind die hohe Speicherdichte und die enorme Haltbarkeit von DNA"Robert Grass, ETH Zürich
Mit DNA hat die Natur über Millionen Jahre ein bewährtes Speichermolekül entwickelt, das in einigen Punkten Magnetbändern oder optischen Disketten überlegen ist. "Die Vorteile sind die hohe Speicherdichte und die enorme Haltbarkeit von DNA", erklärt Robert Grass, Professor am Institut für Chemie und Bioingenieurwissenschaften an der ETH Zürich. 200 Exabyte, also 200 000 000 Terabyte an Daten ließen sich in einem Gramm DNA unterbringen, so der Chemiker. Um es besser zu veranschaulichen: 6000 Terabyte finden Platz in einem Salzkorn. Das entspricht dem Speicherplatz von 12000 der derzeit größten I-Phones. Oder aber gut 230 Jahre HD-Video von Netflix.

Auch die Haltbarkeit überzeuge in zweifacher Hinsicht. DNA wird, so lange es Leben gibt, immer einer der wichtigsten Informationsträger sein – auch wenn eine globale Katastrophe eine lange zivilisatorische Zwangspause bescheren würde. Außerdem beweisen die Sequenzierungen des Genoms der Neandertaler oder eines 700 000 Jahre alten Pferdes, wie stabil das Molekül sein kann.

Es gibt eine eindrucksvolle Instrumente

Was vielversprechend klingt, birgt in der Praxis aber noch manche Tücken. So dauert beispielsweise der Zusammenbau der DNA-Stränge extrem lang und verursacht erhebliche Kosten. Doch auch wenn heutzutage das Speichern eines Megabytes in DNA noch mit rund 1000 Euro zu Buche schlägt, macht dies den Computerwissenschaftlern kaum Sorgen. Vom rasanten Fortschritt in der medizinischen Forschung profitieren alle Bereiche, die mit DNA arbeiten. Kosteten die ersten Sequenzierungen des menschlichen Genoms vor knapp 20 Jahren noch einen zweistelligen Millionenbetrag, ist dies heute für rund 1000 Euro möglich.

Seit etwa zehn Jahren dokumentieren internationale Teams ihre Entwicklungssprünge mit eindrucksvollen Experimenten. So speicherten Wissenschaftler am European Bioinformatics Institute (EBI) im Jahr 2012 mehr als 700 Kilobyte Daten fehlerfrei auf DNA ab. Darunter befanden sich 154 Sonette von Shakespeare, ein Text der Entdecker der DNA-Struktur sowie Teile von Martin Luther Kings "I have a dream"-Rede als Audio-Clip. Schon vier Jahre später legte eine Gruppe der University of Washington in Kooperation mit Microsoft nach: Sie hielten ein Musikvideo und die Erklärung der UN-Menschenrechte auf DNA fest – mit einer Gesamtgröße von 200 Megabyte. Im vergangenen Jahr hat der IT-Konzern zudem den ersten Prototypen eines vollautomatischen Speicher- und Lesegerätes vorgestellt.

Netflix-Serie "Biohackers" wurde als DNA-Molekül konserviert

Im vergangenen Monat machte die in Freiburg spielende Netflix-Serie "Biohackers" mit einem besonderen Werbegag auf sich aufmerksam. Die etwa 100 Megabyte große erste Folge hatten die Produzenten zur Premiere auch als DNA-Molekül konservieren lassen. "Diese Aktion diente dazu, die Technologie einem breiteren Publikum zugänglich zu machen", sagt Grass, der an dem Projekt beteiligt war. Mitarbeiter im Labor von Grass verpacken die künstlich erzeugten DNA-Abschnitte in Nanometer kleine Glaskügelchen, wo sie vor Umwelteinflüssen gut geschützt sind.

Doch nicht nur eine gute Verpackung garantiert eine sichere Speicherung wichtiger Daten. Auch eventuelle Fehler, die beim Schreiben, Lesen oder bei der Aufbewahrung entstanden sind, müssen möglichst eliminiert werden. Ein Spezialist auf diesem Gebiet ist Reinhard Heckel, Professor für maschinelles Lernen an der TU München. Er und sein Team haben zu dem Projekt einen speziellen Algorithmus beigesteuert, der Fehler bei der Informationsübertragung korrigiert. Durch ein gezieltes Maß an Redundanz, also eine Dopplung an Datenfragmenten, kann auch schadhafte DNA gut interpretiert werden.

Den letzten Meilenstein in puncto Speichervolumen erreichte das Unternehmen Catalog, eine Ausgründung des Massachusetts Institute of Technology (MIT). Den Mitarbeitern war es im Jahr 2019 gelungen, die gesamte Textfassung von Wikipedia (16 Gigabyte) auf DNA zu bannen. Das Start-Up sammelt Millionenbeträge, um einem großen Ziel näherzukommen: der Kommerzialisierung der neuen Technologie.

Die wichtigste Hürde, die dafür noch genommen werden muss: Es dauert bisher noch extrem lang, die DNA passend zusammenzubauen, also den Code zu schreiben. Die Jungunternehmer haben eine Maschine entwickelt, die mit weit höherer Geschwindigkeit arbeitet als der von Microsoft vorgestellte Prototyp. Der Apparat hat die Ausmaße einer kleinen Druckerpresse und arbeitet teilweise wie ein Tintenstrahldrucker. Um die Geschwindigkeit zu erhöhen, werden vorgefertigte kurze DNA-Stränge zusammengefügt. Auf diese Weise können laut Firmenangaben zwölf Megabit pro Sekunde in Form von DNA gespeichert werden. Die Inhalte von Wikipedia konnten die Forscher somit bei einem vorsichtigen Testlauf in wenigen Stunden in DNA übersetzen.

Noch ist die Speichergeschwindigkeit ziemlich langsam

Im Vergleich zur Speichergeschwindigkeit einer herkömmlichen Festplatte ist die Bio-Variante rund 200 Mal langsamer. Doch das soll sich ändern. Für das kommende Jahr hat ein Sprecher von Catalog die zweite Generation des DNA-Schreibegeräts versprochen – mit einer 1000-fach höheren Geschwindigkeit. Damit wird das Angebot des Unternehmens für potentielle Kunden zunehmend interessant.

Ein Freiburger Forscher, der eines Tages von den neuen Speichermedien profitieren könnte, ist Rolf Backofen. Als Professor am Institut für Informatik (IIF) der Universität Freiburg produziert auch er riesige Datenberge – und könnte sich die DNA-Methode durchaus als eine Speichermöglichkeit vorstellen. Derzeit sieht Backofen den großen Nutzen von DNA-Speichern aber in der Langzeitarchivierung. Künftige Kulturen könnten so einen genauen Einblick in unser heutiges Leben bekommen. Die immense Speicherdichte der DNA erlaubt, sämtliche Geschehnisse der Welt digital zu konservieren, ohne dass ein Geschichtsschreiber diese filtert.

Auch Björn Grüning, ebenfalls vom Institut für Informatik, sieht DNA-Storage als Schritt in die richtige Richtung. "Schon in wenigen Jahren könnte es Anbieter von DNA-Speicher geben, bei denen man Backups beispielsweise im Katastrophenfall abruft", meint Grüning. Auch mit konventionellen Speichern könne in Notsituationen die Wiederherstellung von Daten Tage dauern. Dass Google und Youtube im schnellen Tagesgeschäft mit DNA arbeiten, hält er vorerst jedoch für ausgeschlossen.