You are on page 1of 39

Anlises filogenticas

Charley Staats staats@cbiot.ufrgs.br

Conceitos
Taxonomia: classificao de organismos Filogenia:
evoluo de um grupo selecionado de organismos Relaes entre entidades diversas (genes, protenas, orgos) derivadas de um ancestral comun

Filogenia
Descobrir ligaes evolutivas entre organismos
Anlise de mudanas que ocorrem em diferentes organismos durante evoluo

Encontrar e compreender relaes entre uma sequencia ancestral e suas descendentes


Evoluo de uma famlia de sequencias

Estimar o tempo de divergncia entre um grupo de organismos que compartilham um ancestral comum.

Sequencias similares, ancestral comum

O Alvo de anlises na Filogenia


De uma sequencia ancestral comum, duas sequencias de DNA divergem Com o acmulo de mutaes, estas sequencias se diferenciam Nmero de mutaes o principal alvo das anlises

Anlise filogentica e de sequencias


Se 2 seq de 2 organismos so similares
Provm de um ancestral comum

Anlise filogentica e de sequencias


Com base em alinhamento mltiplo de sequencias, podemos fazer inferncias sobre a ancestralidade comum das sequencias. As mais prximas filogeneticamente so disposta mais agrupadas Taxa de similaridade utilizada na confeco de rvores filogenticas

O Que uma arvore filogentica


Ilustrao das relaes evolutivas entre um grupo de organismos/sequencias Cada rvore possui ns e ramos

Terminologia
Ns terminais

Ramos

A B

C
D
N Ancestral ou Raiz da rvore
Ns internos ou pontos de divergncia

Representa TAXA (genes, Populaces, espcies, etc.) usada para inferir a filogenia

Filogenia de humano
Humans Gorillas Chimpanzees

Chimpanzees
Bonobos

Bonobos Orangutans
Humans 15-30

Gorillas
Orangutans 14 MYA

MYA

DNA Mitocondrial

Estratgia clssica

Dois tipos de rvores


Cladograma (rvore com raiz)

Fenograma

Como construir rvores filogenticas


1. Que tipo de dado?
Mtodos baseados em caracteres: usa os caracteres alinhados diretamente para a inferencia da rvore
Taxa
Species Species Species Species Species A B C D E

Characters
ATGGCTATTCTTATAGTACG ATCGCTAGTCTTATATTACA TTCACTAGACCTGTGGTCCA TTGACCAGACCTGTGGTCCG TTGACCAGTTCTCTAGTTCG

Como construir rvores filogenticas


1. Que tipo de dado
Mtodos baseados em distncia: transforma o alinhamento de sequencias em distncias entre os pares com base no clculo da semelhana

Species Species Species Species Species

A B C D E

---0.23 0.87 0.73 0.59

0.20 ---0.59 1.12 0.89

0.50 0.40 ---0.17 0.61

0.45 0.55 0.15 ---0.31

0.40 0.50 0.40 0.25 ----

Mtodos de inferncia da rvore

Mtodos baseados em Caracteres


Todos estes mtodos assumem que a substituio de um carcter independente dos demais Maximum Parsimony :
Construo de rvore com o mnimo possvel de substituies Utilizado com sequencias muito similares!

Mtodos baseados em Caracteres


Maximum Likelihood :
Modelo matemtico Clculos de probabilidade que calculam o melhor escore para as variaes no conjunto de dados Muito consumo de CPU e memria

Mtodos baseados em matrizes


Teoria do relgio molecular
Todas as mutaes so neutras e acontecem em taxas aleatrias

UPGMA:
rvore com raiz

Neighborn-joining :
rvore sem raiz

Mtodos baseados em matrizes


1. Alinhamentos mltiplos 2. Clculo de matrizes de distncia de todas sequencias comparadas 3. Construo da rvore baseada nas matrizes

UPGMA

NJ vs UPMGA

Analisando Seqs no MEGA

Analisando seqs no Mega


Fazer alinhamento mltiplo no Clustal do arquivo hsp20.fas Salvar alinhamento (salvar como hsp20.aln) Acessar mega

Analisando seqs no Mega


Acessar mega Drosophila-ADH.meg

Maximum Likelihood

MP

You might also like