New York Times Syndicate

Lo que viene… almacenamiento de datos en codificación ADN

Hemos llegado a una etapa donde toda la información del mundo podría almacenarse en un volumen cercano a 9 litros de vino -una caja-. Y es así como un grupo de la Universidad de Illinois ha demostrado que las moléculas de ADN pueden ser la base de un sistema de almacenamiento de archivo enorme. 

Los datos computacionales han sido descritos como microscópicas manchas magnéticas, cargas eléctricas e incluso patrones de puntos liliputienses que reflejan rayos láser. Finalmente pudieran entrar en el tejido de la vida misma, codificados en las moléculas orgánicas que se ensartan como perlas para formar cadenas de ADN.

En dos experimentos recientes, un equipo de científicos computacionales en la Universidad de Washington y Microsoft y un grupo separado de la Universidad de Illinois han demostrado que las moléculas de ADN pueden ser la base de un sistema de almacenamiento de archivo potencialmente capaz de almacenar toda la información digital del mundo en aproximadamente nueve litros de solución, aproximadamente la cantidad de líquido contenida en una caja de vino.

La nueva investigación demuestra que archivos digitales específicos pueden ser recuperados de un conjunto de datos potencialmente enorme. La nueva tecnología de almacenamiento también sería capaz de conservar cantidades inmensas de información de manera segura durante un milenio o más, dijeron los investigadores.

También abordaría un evidente talón de Aquiles en el centro de los sistemas de almacenamiento de datos microelectrónicos: los discos y cintas magnéticos, e incluso los sistemas de almacenamiento ópticos, almacenan información de manera segura cuando mucho durante só
lo un puñado de décadas.

Los avances recientes sugieren que pudiera haber una nueva manera de almacenar una cantidad enorme de datos computacionales durante siglos en vez de décadas.

La capacidad de almacenamiento del ADN es asombrosa comparada con incluso los sistemas de almacenamiento electrónico o magnético más avanzados. Teóricamente, es posible almacenar un exabyte de información, si fuera codificada en ADN, en el volumen de un grano de arena. Un exabyte es aproximadamente el equivalente a 200 millones de DVD.

En su naturaleza, las moléculas de ADN pueden portar las instrucciones genéticas que gobiernan el desarrollo y funcionamiento de los organismos vivos. El costo de secuenciar o "leer" el código genético está cayendo más rápidamente que el costo de la memoria computacional, y los tecnólogos están empezando a hacer avances en su capacidad para sintetizar más rápidamente las cadenas compuestas de secuencias arbitrarias de las pequeñas moléculas orgánicas conocidas como oligonucleótidos, los bloques básicos que conforman el ADN.

Los científicos computacionales dicen que creen que conforme continúen cayendo los costos de la secuenciación y creación de ADN sintético, pronto será posible crear una nueva clase de sistemas de almacenamiento híbridos.

"En el último año, repentinamente se nos ocurrió que esta fusión de la tecnología computacional y la biología será de donde procedan los avances futuros", dijo Douglas M. Carmean, un investigador de Microsoft que había sido un destacado diseñador de chips de microprocesamiento en Intel Corp.

Experimentos previos realizados por científicos del Instituto Europeo de Bioinformática en Hinxton, Inglaterra, en 2013, y en 2012 en la Universidad de Harvard, demostraron que era posible almacenar archivos de datos en ADN y luego leer la información de nuevo en forma digital. El grupo de Harvard recibió atención internacional por almacenar miles de millones de copias de "Regenesis", un libro escrito por el genetista de Harvard George Church y Ed Regis.

Los equipos de investigación de la Universidad de Illinois y de la Universidad de Washington y Microsoft se han basado en ese trabajo almacenando información en forma de ADN y luego recuperando un archivo específico de los datos. Los científicos de Illinois fueron capaces de codificar partes de las páginas de Wikipedia de seis universidades, y luego seleccionar y editar partes del texto escrito en ADN correspondiente a tres de las instituciones educativas.

Investigadores de la Universidad de Washington y Microsoft decidieron que debido a la enorme capacidad de almacenamiento potencial del ADN, sería mejor usarlo simplemente para almacenar datos en vez de reescribirlos. Pudieron almacenar cuatro pequeños archivos de imágenes y luego recuperarlos independientemente con solo un error.

Además de refinar las técnicas de reensamblaje computarizado, los grupos de investigación siguen trabajando en mejorar la tecnología de almacenamiento básico.

"Hemos incrementado nuestro trabajo de 2012 en unas cien veces", dijo Church. Su laboratorio está trabajando en colaboración con Technicolor, S.A., una compañía francesa que tiene una gran operación en datos digitales y archivamiento de películas. "El gran problema es reducir el costo en otras mil veces, lo cual es nuestro foco de atención actual", añadió.

El laboratorio de Harvard está tratando de codificar y recuperar "A Trip to the Moon", una película muda francesa de 1902.

Los investigadores de la Universidad de Washington y Microsoft se han asociado con Twist Bioscience, una empresa emergente de San Francisco que ha desarrollado un sistema basado en semiconductores que acelera la producción de cadenas de ADN personalizadas en las cuales se pueden codificar datos digitales.

Los científicos reconocen que su cuello de botella actual está en la capacidad para escribir la información en el ADN, pero dicen que esperan que la tecnología empiece a mejorar rápidamente en el futuro cercano.

"Se trata absolutamente de la tecnología y la miniaturización de la escala de la reacción" usada para crear el ADN sintético, dijo Emily Leproust, directora ejecutiva de Twist.

Actualmente, toma solo segundos almacenar y recuperar datos usando cartuchos de cintas magnéticas; ampliamente utilizados por los centros computacionales corporativos para mantener copias de archivo. Pero los cartuchos mismos a menudo son almacenados en estantes o en elaborados sistemas de recuperación robóticos; recuperarlos y poner los datos en línea para tener acceso a ellos puede tomar horas.

El costo y la velocidad de codificar la información digital en ADN pronto se reducirán en varios órdenes de magnitud, dijo Leproust, haciendo a la tecnológica competitiva con el almacenamiento magnético.

Aunque es lento en su velocidad de recuperación comparado con la memoria electrónica y magnética, el ADN será mucho mejor en términos de la escala de los datos que puede almacenar y la escala del tiempo.

"El ADN es un medio notable para el almacenamiento a largo plazo", dijo Karin Strauss, un arquitecto computacional de Microsoft. "Todo lo que se tiene que hacer es mantenerlo frío y seco".

También lee: