Professional Documents
Culture Documents
coincidir si y slo si existe una biyeccin en el alfabeto que transforma una cadena a la
otra.Tambin propuso un algoritmo O (n + m) a tiempo para calcular todas las subcadenas
ubicaciones de un texto t donde un patrn p partidos con parmetros. ms tarde en [10], se
demostr que si el tamao del alfabeto es a lo sumo 3, a continuacin, dos cadenas son-Pal
equivalente si y slo si esas cadenas parametrizada partido. De ah la coincidencia de
patrones palndromo puede ser resuelto en tiempo O (n + m) tiempo para alfabetos ternarios
y ms pequeos.
En este trabajo, presentamos soluciones eficientes para los alfabetos ms grandes. En primer
lugar, se presenta un algoritmo que resuelve el problema en O (n + m) tiempo para alfabetos
arbitrarios. Este algoritmo es una versin palndromo-pattern-matching del Morris-Pratt [14]
patrn de algoritmo de coincidencia. En segundo lugar, proponemos otro algoritmo que utiliza
una nueva estructura de indexacin de texto llamaron a los rboles de sufijos palndromo. Se
demuestra que los rboles de sufijos palndromo se pueden construir en O (n min { log n,
ingrese log registro }) tiempo con O (n) el espacio, donde es el tamao del alfabeto.
Usando el rbol de sufijos palndromo, podemos resolver el problema en O (m min { log n,
ingrese log registro } + r) el tiempo, donde r es el nmero de posiciones de texto para
informar. Obviamente nuestro rbol sufijo palndromo enfoque nos proporciona una solucin
de tiempo lineal cuando es una constante.
Los algoritmos de este artculo son aplicables a varios problemas prcticos, por ejemplo, en la
bioinformtica. Por ejemplo, similar secuencias palindrmicas a menudo necesitan ser
identificadas en el ADN y ARN anlisis de la secuencia [12]. Las secuencias que tienen
similares estructuras palindrmicas pueden codificar para estructuras similares 3-D de las
respectivas molculas, lo que lleva a una posible funcional interpretacin de las secuencias
identificadas. Debido al tamao de los genomas, la eficiencia de los mtodos de bsqueda es
de gran importancia.
2. Preliminares
Let ser un alfabeto finito. Un elemento of * se llama una cadena. La longitud de una
cadena W se denota por | W |. La cadena vaca es una cadena de longitud de 0, es decir, |
|. = 0 Let + = * - {}. Cuando una cadena W est representado por la concatenacin de
cadenas x, y y z (es decir, w = xyz), entonces x, y y z son llamados un prefijo, subcadena, y el
sufijo de W, respectivamente. El carcter i-simo de un cadena w es denotado por w [i] para 1
i | w |, y la subcadena de una cadena w que comienza en la posicin i y termina en la
posicin j es denotado por w [i: j] para 1 i j | w |, es decir, w [i: j] = w [i] w [i + 1]. . . w
[j]. Para mayor comodidad, vamos w [i: j] = si j <i. Para cualquier cadena w, vamos wR
denotan la cadena invertida de w, es decir, wR = w [| w |] w [2] w [1]. Una cadena W se
denomina palndromo si w = w R. Si | w | es par, entonces w se llama un palndromo, incluso,
es decir, w = xxR para algn x *. Si | w | es impar, entonces w se denomina palndromo
impar, es decir, w = xaxR para algn x * y . El radio de un palndromo es w | w | 2. El
centro de una subcadena palindrmica w [i: j] de una cadena W es i + j 2. Una subcadena
palindrmico w [i: j] se llama el palndromo mxima en el centro de i + j 2 si no hay otros
palndromos en el centro de i + j 2 tienen un radio mayor que w [i: j], es decir, si w [i - 1] = w
[j + 1], i = 1, o j = | w |. En particular, un palndromo mxima W [i: | W |] se llama un
palndromo sufijo de w. Deje Pals (w) el conjunto de todos los palndromos mximas
centroizquierda distinta donde cada elemento est codificada por una pareja de su centro y el
radio, a saber,