Professional Documents
Culture Documents
llegamos a la ristra de ceros donde se nos hace difcil determinar cuntos hay y
casi seguro que tenemos que pasar el dedo de uno en uno para contarlos sin
equivocarnos. Deslizamientos en las repeticiones, lo que en ingls se llama
"slippage", es lo que le ocurre tambin a las enzimas que leen y escriben las
secuencias del ADN, causando errores o mutaciones. La mejor manera de evitar
que ocurra esto es no repitiendo muchas veces seguidas ninguna letra. Esto se
puede conseguir asignando A al 0, T al 1, C al 2 y G al 3.
Este sistema de codificacin de los bio-ordenadores tiene las siguientes
propiedades:
1. Es uniforme, ya que todos los smbolos estn codificados por 4 letras. Esto es
una novedad ya que los cdigos propuestos hasta ahora, hechos por
informticos, estn formados con un nmero variable de letras para conseguir
minimizar el tamao de los documentos. Para un bilogo parece ms lgico, ya
que la evolucin lo ha hecho de la misma forma, hacer un cdigo con un nmero
constante de letras. Llevado a la prctica, el sistema que propongo produce
documentos con un menor nmero de letras que las otras propuestas.
Esta uniformidad permite, adems, generar programas informticos mucho ms
simples para traducir una secuencia codificada en tetranario a sus
correspondientes significados, como letras, nmeros, espacios, colores, etc.
En los ltimos meses han aparecido dos informaciones en la prensa que, aunque
a priori podran parecer distantes, estn muy relacionadas. Una est relacionada
con los ordenadores: Microbios que empaquetan 200 GB. Investigadores chinos
logran que las bacterias almacenen y descifren los datos. La segunda est
relacionada con la seguridad: Atencin, tienda protegida por ADN. Un sistema
antirrobo innovador utiliza cadenas genticas para identificar las propiedades y
marcar a los ladrones. La relacin entre ambas noticias est en que ambas usan
el lenguaje del ADN.
Cmo un microbio puede almacenar cualquier informacin?, cmo podemos
usar el ADN para marcar algo o a alguien?, se contestan de la misma manera:
usando el lenguaje que usa el ADN para llevar la informacin hereditaria de un
organismo, no para producir clulas y rganos sino para almacenar informacin a
base de letras y nmeros. Cmo? Fcil si entendemos cmo es el ADN y cmo
podemos usarlo.
Desde mediados del pasado siglo sabemos que toda la informacin hereditaria
que se transmite de padres a hijos, humanos, ratones, gusanos, bacterias,
cebollas o cualquier otro ser vivo, se encuentra en las molculas de ADN que se
transmiten por los gametos (vulos las hembras, espermatozoides los machos).
Dnde est la informacin que hace que unas molculas hagan un perro y otras
una mosca? Esta informacin est codificada en el orden en que se encuentran
estas cuatro letras. La codificacin de la vida estriba en que la secuencia de
letras se leen de tres en tres y cada trio determina a un aminocido. Por tanto, en
el orden en que se encuentren los trios de letras, o tripletes, ser el orden en que
se unan los aminocidos para dar las protenas con las que estamos hechos los
seres vivos.
Cmo convertir este lenguaje en las letras, nmeros y smbolos que usamos al
escribir? Para esto podemos pensar en una similitud con el lenguaje de los
ordenadores.
Un ordenador funciona slo con 0 y 1. Como para escribir todos los caracteres y
smbolos necesitamos 27 letras ms 10 nmeros ms un centenar largo de
smbolos, los informticos decidieron que usando los 0 y 1 de ocho en ocho se
pueden obtener 28 = 256 caracteres diferentes, lo que es ms que suficiente.
Cada uno de estos 0 y 1 se les denomina un bit y al grupo de ocho bits se llama
byte. Cuando decimos que nuestro ordenador tiene una memoria de 100 MB
queremos decir que puede almacenar cien millones de bytes o smbolos.
Con el ADN podemos pensar de la misma forma, pero en lugar de dos bits 0 y 1
usa cuatro bits A, T, G y C por lo que los mismos 256 caracteres se pueden
obtener haciendo grupos de cuatro, ya que 44 = 256. As como en informtica
podemos asociar el byte 01000001 a la letra A y 00100101 al smbolo (, en
bioinformtica podramos asociar esta letra al byte GACC y el parntesis a TGCA.
Ya tenemos la codificacin o el diccionario para conocer qu byte le corresponde
a qu carcter o smbolo. Nos queda cmo materializarlo, cmo grabar la
informacin que queramos en el ADN, por ejemplo este artculo.
Para ello haramos uso de unas mquinas, comercializadas desde hace unos
veinte o treinta aos, que sintetizan fragmentos de ADN con el orden, o
secuencia, de letras que queramos. Actualmente las longitudes ms largas que
se pueden sintetizar en estos aparatos oscilan entre 150 y 200 letras, pero
posteriormente las podramos unir para dar molculas de ADN de longitudes
mucho mayores.
Ahora podemos entender las dos noticias con que iniciaba este artculo.
Un uso del ADN como portador de la informacin que queramos introducirle est
siendo ya aplicado con xito como sistema de marcaje de objetos o personas con
una finalidad antirrobo. En varios paises se ha implantado ya la tecnologa de
fabricar secuencias de ADN y pegar estas molculas a objetos de alto valor como
sistema de marcaje, invisible al ojo humano pero detectable por mtodos
moleculares sencillos. Estas molculas no tienen que ser muy largas, con 10
letras se pueden fabricar 410 secuencias diferentes que significa ms de un
milln de secuencias listas para marcar otros tantos objetos. Junto con el marcaje
de los objetos de la tienda, el contrato incluye el uso de una secuencia, especfica
de cada tienda, para marcar a las personas que entran en estos locales mediante
unos microvaporizadores invisibles que llevan la secuencia de ADN especial. Este
ADN quedar unido a la piel, pelos y ropa de los clientes de forma temporal (creo
que en pocas semanas desaparece) y permite, si es necesario, comprobar si una
persona bajo sospecha estuvo o no en un local determinado.
El futuro de estas tecnologas depende de nuestra imaginacin; la Ciencia, como
la imaginacin humana, no tiene lmites.
Cmo se puede guardar en el ADN, con slo cuatro letras, todo cuanto
queramos, un libro entero, una imagen con miles de millones de colores o un
concierto?
Mi contestacin siempre es
Con los diez dgitos que usamos para escribir los nmeros cuntos nmeros se
pueden escribir?
Enseguida descubren por ellos mismos que todo es cuestin del nmero de
dgitos, de letras en el caso del ADN, que se usen.
En todos los seres vivos la codificacin se lleva a cabo de tal forma que cada tres
letras del ADN determina a un aminocido. La unin ordenada de un determinado
nmero de aminocidos dan una protena. Si la protena tiene 600 aminocidos
stos han de venir codificados en el ADN en mil ochocientas letras y el orden de
esas letras es lo que determina el orden de los aminocidos. A ese grupo de
letras es a lo que se conoce como un gen. En nuestro ADN tenemos unos treinta
mil genes.
Por qu 256 smbolos? Porque los ordenadores funcionan con 0 y 1 y los que
llamamos personales funcionan asignando a cada letra, nmero o smbolo, un
cdigo formado por ocho dgitos binarios para obtener una panoplia de 2x2x2x...
= 28 = 256 smbolos. A cada 0 y 1 se le denomina dgito binario o bit (binary
digit) y a cada grupo de 8 bits se le llama un Byte.
Dado que las molculas de estas nuevas letras del ADN no existen en el mundo
biolgico, no las pueden sintetizar ningn ser vivo. Por tanto, estos ADN
semisintticos slo se podrn duplicar si se les introducen en las clulas las
nuevas molculas sintticas. En caso contrario dejarn de reproducirse y se
perdern. Luego parece lgico pensar que si para la memoria de los ordenadores
moleculares se usasen molculas semisintticas de ADN, stas no podran
infectar a ningn ser vivo y quedaran, como consecuencia, excluidas de las
normas aprobadas por el NIH pudiendo ser sintetizadas con cualquier longitud.
Una propiedad aadida de esta nueva codificacin se puede deducir del siguiente
clculo. Ocho letras distintas agrupadas de tres en tres dan un total de 83 = 512
grupos. Dado que slo necesitamos 256 cdigos, sobran otros 256 grupos que se
pueden usar para aadir redundancia a los smbolos ms usados: letras y
nmeros. Si cada letra o nmero puede ser codificado por cuatro cdigos
distintos, se puede deducir que har disminuir la frecuencia de mutacin o
errores causados por cambios aleatorios de una letra por otra.
Por tanto, esta nueva codificacin mejora a todas las anteriores propuestas por
su menor frecuencia de errores, menor tamao para igual informacin,
imposibilidad de contaminar a ningn ser vivo, posibilidad de sintetizar molculas
de ADN de cualquier longitud y, finalmente, en algn futuro, y dada la gran
estabilidad de esta molcula, la posibilidad de ser evidente para cualquier ser
inteligente, terrestre o no terrestre, del futuro, la implicacin de contener una
informacin codificada diseada artificialmente.
Referencias
1.
http://alfoogle.blogspot.com.es/2013/10/codigo-para-leer-y-escribir-conadn_29.html
4. Malyshev, D. A., Dhami, K., Quacha, H. T., Lavergne, T., Ordoukhanianb, P.,
Torkamanic, A. and Romesberg, F. E. (2012) Efficient and sequence-independent
replication of DNA containing a third base pair establishes a functional six-letter
genetic alphabet. Proc Nat Acad Sci USA 109: 12005-12010.
5. Malyshev, D. A., Dhami, K., Lavergne, T., Chen, T., Dai, N., Foster, J. M., Corra,
I. R. and Romesberg, F. E. (2014) A semi-synthetic organism with an expanded
genetic alphabet. Nature. doi: 10.1038/nature13314.
Una prediccin formulada por Gordon Moore en 1965, conocida como la ley de
Moore, dice que la potencia de los ordenadores, su capacidad de memoria y el
nmero de chips se duplica cada 18 meses mientras que su tamao se hace la
mitad. Sin embargo, los chips no se pueden hacer infinitamente pequeos, hay
un lmite en el cual dejan de funcionar correctamente. En consecuencia, la
computacin digital tradicional no tardar en llegar a su lmite. Surge entonces la