You are on page 1of 19

A Dynamic Programming Algorithm for RNA

Structure
Prediction Including Pseudoknots
Elena Rivas and Sean R. Eddy*

Se presenta una implementacin del algoritmo que


genera la estructura mnima de energa ptima para una
sola secuencia de ARN, utilizando ARN estndar plegable
a parmetros termodinmicos aumentados por unos
parmetros que describen la estabilidad termodinmica
de pseudonodos.

Una estructura de ARN est dominada por las


interacciones de apareamiento de bases, la mayora de
los cuales son pares Watson-Crick entre bases
complementarias. La estructura de bases apareadas de
un ARN es llamada estructura secundaria. Debido a que
los pares de Watson-Crick son una interaccin
estereotipadas y relativamente simples, ARN precisa
prediccin de estructura secundaria parece ser un
objetivo alcanzable.

El modelo termodinmico para el ARN de no


pseudonudos la estructura secundaria incluye algunas
interacciones estereotipadas, como bases apiladas de
tallos apareados, hairpins, bulges, bucles internos, y
multi-bucles. Formalmente, las estructuras no
pseudoanudadas obedecen una convencin "que anida":
que para dos pares de bases i,j y k,l, ya sea i<k<l<j o
i<j<k<l. Un pseudonudo de ARN es definido como una
estructura que contiene los pares bajos que violan la
convencin de anidacin.

Preeliminares
Una lnea plana continua representar la espina dorsal de
una secuencia de ARN con sus 5-end colocados en el
lado izquierdo del segmento. La N representar la
longitud (en el nmero de nucletidos) del ARN. Las
interacciones secundarias sern representadas por lneas
onduladas que unen las dos posiciones que actan
recprocamente en la cadena.

Representacin esquemtica de los


algoritmos anidadas
Para

describir el algoritmo se introduce dos NxN


matrices, son llamadas . Estas matrices son definidas del
modo siguiente: es la puntuacin del mejor plegado
entre las posiciones i y j, a condicin de que i y j estn
emparejados entre s; mientras que es la puntuacin de
la mejor plegado entre las posiciones i y j
independientemente de si i y j estn apareados entre si o
no.

La
lnea ondulada en indica que la relacin entre i y j
estn definitivamente emparejados, y similarmente la
lnea discontinua en indica que la relacin entre i y j es
desconocida. Tambin forman parte de nuestra
convencin que para un fragmento dado, el nucletido i
es en el 5-end y el nucletido j es en el 3-end, tal que i.
El propsito del algoritmo de programacin dinmica
anidada es llenar el matrices con pesos numricos
apropiados por medio de algn tipo de clculo recursivo.

Superficie: es cualquier secuencia alternante de lneas


continuas y onduladas que se cierra sobre s mismo.
Superficie irreducible: es una superficie de tal manera
que si uno de los H-enlaces (o interacciones
secundarias) es roto, no hay ninguna otra superficie
contenida en el interior, es decir, un IS no puede ser
reducido a cualquier otra superficie. El orden de un IS
es dado por el numero de lneas onduladas, lo cual es
igual al numero del intervalo de lneas continuas.

La
recursin para dada en la figura, y puede ser
expresada como:

Cada lnea da la puntuacin oficial de uno de los


diagramas en la Figura 4. El diagrama de la izquierda se
calcula como la puntuacin del mejor diagrama de la
derecha. Las condiciones de iniciales son:

Aqu

representa la funcin de puntuacin para un IS de


orden n. Este algoritmo general es bastante imprctico,
porque un el cual tiene orden adhiere una complejidad de
al calculo. Para hacer esto til, se debe de truncar la
expansin en ISs hasta algn orden en la recursin para
en la figura.

El truncamiento ms simple debe pararse en el orden


cero. En esta aproximacin ninguno de los Iss, se dan las
puntuaciones especializados. Slo tenemos que dar una
puntuacin especfica para un par de bases, B. La
recursividad para se simplifica en la figura 5 y puede
ser representada de la forma:

La
matriz es similar a definido antes, con la
especificacin de aparecer dentro de un par de bases.
Este sencillo algoritmo calcula el plegado con el mximo
nmero de pares de bases. Para un orden mayor a 0 se
tiene la siguiente funcin de recursin:

representa la puntuacin para generar una multiloop. Las reglas


termodinmicas de Turner tambin penalizan a una cantidad para
cada par de cierre en un multiloop. Al iniciar un multiloop estamos
especificando ya uno de sus pares de cierre; esta puntuacin de
cierre de par est representado aqu por la .

Las
relaciones de recursividad utilizados para llenar la
matriz incluyen: los nucletidos de cadena sencilla,
pares externos, y bifurcaciones. La recursin puede ser
expresado como:

La condicin de frontera se expresa como:

Q representa el puntaje para un nucletido


de cadena sencilla y P el puntaje para un par
externo.

Descripcin del algoritmo de


pseudonudo
Los
pseudonudos son
configuraciones no anidadas y no
pueden ser descritas solamente
con las matrices . El punto clave
del algoritmo de pseudonudo es el
empleo matrices GAP adems de .

El
de programacin dinmica
pseudonudo
algoritmoutiliza
matrices de agujero o GAP
como una generalizacin de las matrices .
Definamos como el grafo que describe el
mejor plegado que conecta los segmentos[i, k]
con [l, j],.
Definamos a como el grafo que describe el
mejor plegado que conecta los segmentos[i, k]
con [l, j],.
Para a completar se introduce la matriz y su
contraparte

Las
matrices son contenidas como un caso particular de
las matrices GAP. Cuando no hay ningn agujero k=l-1,
entonces por construccin:

La
recursin para la matriz no-gap es dada por:

Los parmetros
adicionales son:

la puntuacin de un par en un multiloop no anidado.


una puntuacin genrica para generar una multiloop no anidado.
la puntuacin para generar una pseudonudo interno.


Similarmente
para :

Los
parmetros adicionales son:
la puntuacin por introducir un pseudonudo.

You might also like