Professional Documents
Culture Documents
Herramientas
informticas
para el anlisis estructural
de cidos nucleicos y
protenas
ALINEAMIENTO MLTIPLE DE SECUENCIAS
2006
Nancy I. Lpez
ALINEAMIENTO DE SECUENCIAS
Comparacin
alineamiento de a pares.
Alineamiento mltiple comparando varias secuencias relacionadas
Utilidad
. Destacar regiones de similitud, divergencia o mutaciones
. Motivos, estructura y funcin en protenas. Resaltar errores en la prediccin
de la secuencia de protenas o en la secuencia misma
. Seleccionar primers de una familia de genes.
. Realizar anlisis evolutivos (filogenia)
rboles filogenticos
Alineamientos mltiples
La premisa bsica de un alineamiento mltiple es que para
cada columna en el alineamiento cada residuo de cada
secuencia es homlogo. Esto significa que ha evolucionado
desde la misma posicin en una secuencia ancestral comn sin
insercin ni delecin.
informacin sobre estructura y funcin de protenas
modo de evolucin
filogenia. En el caso de la filogenia molecular el resultado del anlisis
depender del alineamiento previo. Inspeccionar cuidadosamente ese
alineamiento para ver que se incluye y que no.
En caso de utilizar genes que codifican protenas: usar secuencia de
protenas o de DNA.
Programa CLUSTAL
alineamiento global para un conjunto de secuencias
Las secuencias son alineadas de a pares y los pares con puntaje
(score) ms alto son luego agrupados con otras secuencias y
los grupos (clusters) son armados de acuerdo a la similitud.
rbol gua no da informacin filogentica. Secuencias similares
ms cercanas en el rbol (archivo.dnd)
Alineamiento mltiple constituye un paso fundamental.
Hasta 1989 alineamientos a mano. ClustalW ClustalX
BioEdit
Matrices
DNA identity
matrix
Gonnet 250
rbol gua
Archivo de datos
>s1
GCTCGGTATGTTGGTCGGCGCCATTGTCGATCAACGGCGCCATTGTCGATCAACGGCGCCATTGTCGATCAAA..
.............
>s2
GAcACTGCCCTCCCGATGCAGGGAAAAATCGGCGCCATTGTCGATCAATGAGCAGTAACGAACAAAATGC.......
.........
>s3
GCAAAGCgCacTTcAaATCaGGGCTCGACATCATCaCATAGCCCAccACGTCGTAAATgCCCGGCTTGACCAG
...
Nodos
Ramas
Nodos
terminales:
OTUs
(Datos)
Nodos
internos:
antecesores
hipotticos
Raiz: nodo
del cual los
otros
descienden
. Da
direccin
Patrn de ramificacin:topologa
Number of
Taxa
3
Number of
unrooted trees
Number of rooted
trees
15
15
105
105
945
945
10395
10395
135135
135135
2027025
10
2027025
34459425
Nr=(2n-3)!/[2n-2*(n-2)!], n 2
Nu=(2n-5)!/[2n-3*(n-3)!], n 3
Nr para n = Nu para
n+1
Mtodos para la
construccin de rboles
Mtodos de distancia
filogenticos
Utilizan matrices de distancia
UPGMA: Unweighted Pair Group Method with Arithmetic Mean.
NJ-Neighbour Joining. Vecino ms cercano
Minimum evolution. Utiliza el mtodo de cuadrados mnimos.
Mtodos discretos
Matriz de distancias
Sitios
Secuencias
1 2 3 4 5 6 7
1
2
3
4
T
A
A
A
T
A
A
A
A
T
A
A
T
T
A
A
T
T
A
A
A
A
T
A
A
A
A
T
Distancias
1 0
2 30
3 5 40
4 5 4 20
___________
1 2 34
Diferencia o divergencia entre las secuencias
.- Rpidos
.- informacin restringida al rbol
Mtodos discretos
Analizan cada columna dentro del
alineamiento y construyen el mejor rbol
que se ajusta a esa condicin
.- lentos
.- ricos en informacin. Hiptesis para cada
columna dentro del alineamiento. Puede
obtenerse informacin sobre evolucin
de sitios especficos en la molcula (Ej.:
sitios catalticos o regiones regulatorias).
Programas
ClustalW Alineamiento
Graficar con Treeview, Phylodraw
NJ-Plot
PHYLIP
MEGA 3.1 Es el ms fcil de manejar
PAUP* (POP STAR). Es el ms
sofisticado y verstil
TRABAJO PRCTICO
1. Tutorial de ClustalW
Secuencias simples
Alineamiento mltiple. Analizar. Observar rbol gua.
ClustalW para construir el rbol. Modificar opciones en la
ventana Phylogenetic tree. Mtodo utilizado por el
programa es el del NJ-Vecino ms cercano (Neighbour
Joining). Elegir entre los posibles formatos de rbol
(Neighbour, Phylip, Distance)
Con el archivo obtenido del CLustalW (. ph)entrar en el
programa Treeview y graficar el rbol. Observar distintos
tipos de rboles. Definir el outgroup