El ADN y almacenamiento de datos.

 

Por Jesús Sainz

    A finales de la década de 1970, una teoría extraña comenzó a abrirse camino en torno a la comunidad científica. El pionero de secuenciación de ADN Frederick Sanger y sus colegas acababan de publicar su documento histórico con la secuencia del genoma del virus Phi X174.

Jesús Sáinz Maza
Científico y Coordinador de la Sección

    De este genoma, algunos dijeron que contenía un mensaje de extraterrestres. Los investigadores japoneses Hiromitsu Yokoo y Tairo Oshima exploraron algunas de las razones por las cuales los extraterrestres podrían elegir comunicarse con humanos a través del ADN: Es duradero y puede ser fácilmente replicado. Además, es omnipresente en la Tierra y es poco probable que se vuelva obsoleto mientras la vida continúe, y sería conveniente para los alienígenas que esperan que los humanos desarrollen las tecnologías de secuenciación necesarias para decodificar sus mensajes.

   La tesis no fue tomada en serio, y los propios investigadores admitieron que no había un patrón obvio para el genoma de Phi X174. Pero para el biólogo George Church, un estudiante graduado de la Universidad de Harvard la especulación era intrigante. “No lo creía”, dice sobre la teoría alienígena, “pero plantó la idea de que uno podría codificar mensajes en ADN biológico”.

   En teoría, unos pocos kilogramos de ADN podrían almacenar todos los datos de la humanidad, pero existen desafíos prácticos que superar. En ese momento, por supuesto, había un obstáculo evidente: el costo. En aquel entonces, “sintetizamos 10 nucleótidos por $ 6,000, y eso se consideró un buen trato. Obviamente, no se puede codificar mucha información en 10 nucleótidos.

   Unas décadas más tarde, sin embargo, las cosas comenzaron a cambiar. La síntesis de oligonucleótidos se estaba volviendo más rutinaria, y los investigadores podían escribir pequeñas cantidades de información arbitraria en ácidos nucleicos por menos de un dólar por base. En 2001, por ejemplo, un equipo de la Mount Sinai Medical School escribió dos citas de Dickens que suman 70 bytes en secuencias de ADN, codificando cada letra del alfabeto como combinaciones de las bases A, C y T (por ejemplo, AAA = A, AAC = B, etc.). En 2010, el grupo de Craig Venter sintetizó artificialmente todo el genoma de la bacteria Mycoplasma mycoides, alrededor de 1.1 millones de pares de bases.

   Church y dos colegas de Harvard tradujeron un borrador en HTML de un libro de 50,000 palabras sobre biología sintética, en código binario, lo convirtieron en una secuencia de ADN, codificando 0s como A o C y 1s como G o T, y “escribió” la secuencia con una impresora de ADN de inyección de tinta en un microchip como una serie de fragmentos de ADN. En total, el equipo hizo 54,898 oligonucleótidos, cada uno incluyendo 96 bases de datos junto con una secuencia de 22 bases en cada extremo para permitir que los fragmentos se copien en paralelo usando la reacción en cadena de la polimerasa (PCR) y una base única de 19 Secuencia de “dirección” que marca la posición del segmento en el documento original.

   El DNA resultante contenían alrededor de 650 kB de datos en una forma tan compacta que el equipo predijo un potencial de almacenamiento para su método de más de 700 terabytes. por milímetro cúbico. Este resultado no solo representa de lejos el mayor volumen de datos jamás codificados artificialmente en el ADN, sino que mostró una densidad de datos de varios órdenes de magnitud mayor que la del disco duro promedio de un ordenador.

   Recientemente, el mundo de la informática ha comenzado a reconocer una crisis inminente: los seres humanos se están quedando sin espacio para almacenar sus datos, nos acercamos a los límites de la tecnología basada en silicio. En dicha situación, no es de sorprender que, en abril pasado, Microsoft hiciera un trato con la startup de biología sintética Twist Bioscience para investigar el almacenamiento de datos en ADN.

    La necesidad de almacenamiento de datos no hace sino crecer: Los hospitales necesitan almacenar toda la información de salud para siempre, las instituciones de investigación tienen cantidades masivas de datos de proyectos de investigación, los fabricantes quieren almacenar datos recopilados de millones de sensores en sus productos. Con continuas mejoras en el volumen de información que puede empaquetarse en el ADN, los datos se pueden almacenar a densidades que van de millones de gigabytes por gramo, dicha molécula parece ser la solución para el almacenamiento. A medida que los costos de la síntesis y secuenciación de oligonucleótidos continúan disminuyendo, el desafío para los investigadores y las empresas será demostrar que el uso del ADN para el almacenamiento, y tal vez incluso otras tareas actualmente realizadas por dispositivos electrónicos, es práctico.

   Como el ADN tiene cuatro bases, la molécula puede contener potencialmente hasta dos bits por nucleótido, por ejemplo, codificando las secuencias 00, 01, 10, 11 como A, T, C, G. Las secuencias resultantes pueden imprimirse en un microchip o guardarse en un tubo de ensayo y almacenarse en un lugar fresco, oscuro y seco, como un refrigerador. La recuperación de la información implica rehidratar la muestra, amplificar los fragmentos mediante PCR, y luego secuenciar y volver a ensamblar el código de nucleótido completo.

  En la práctica, el almacenamiento de ADN presenta varios desafíos que son el foco de los esfuerzos de investigación actuales. El mayor desafío sigue siendo el costo de leer y especialmente escribir ADN. Aunque algunas compañías, como Twist, ofrecen síntesis por menos de 10 centavos por base, escribir volúmenes significativos de datos sigue siendo prohibitivamente costoso. Para llevar el almacenamiento de datos de ADN más allá del campo de la investigación, hace falta que el precio en el precio de escribir ADN sea cinco órdenes de magnitud menor.

   Se están investigando actualmente aplicaciones de almacenamiento y computación de ADN. Se ha conseguido incluso almacenar un fragmento de una película en una secuencia de ADN y se están explorando las posibilidades de esta molécula para hacer cálculos. Cualquiera que sea el futuro del ADN en estas tecnologías complejas, tales proyectos son un testimonio de su potencial y un indicador de cómo el campo ha progresado en un período de tiempo muy corto. En un futuro cercano el ADN probablemente se algo más que la molécula de la herencia.

Artículos relacionados :