Doutorando no Programa de Ps-graduao Interunidades em Bioinformtica - USP
Resumo:
A comparao entre sequncias representa o corao da bioinformtica, que inclui
tambm as anlises filogenticas. o primeiro e mais importante passo para a anlise estrutural, funcional e evolutiva de sequncias recm-sintetizadas, cuja informao ainda no foi descrita. Como o DNA, RNA e protenas refletem os processos da evoluo de cada organismo, o alinhamento dessas macromolculas pode gerar inferncias sobre a relao entre organismos distintos. O primeiro passo na comparao de sequncias o alinhamento aos pares, onde duas sequncias so comparadas, utilizando penalidades de match e mismatch, alm de penalidades para abertura e extenso de gaps para escolha do melhor alinhamento, porm essa comparao poder ser por duas formas: utilizando alinhamentos locais, onde apenas pequenas regies de alta similaridade so identificadas; e utilizando alinhamentos globais, onde as duas sequncias sero comparadas desde do primeiro ao ltimo stio. Para anlise de evoluo, cuja comparao entre sequncias assume que as mesmas so homlogas, essa ultima abordagem (alinhamento global) mais indicada, visto que alinhamentos locais so utilizados para identificao de homologia atravs de anlise de similaridade. Entretanto, a comparao apenas de duas sequncias no gera informao suficiente para classificao de diversos organismos ou para identificao de perfil de famlias de protenas. Para essas abordagens o uso do alinhamento mltiplo mais indicado, pois permite comparaes de mais de 2 sequncias por vez, o que gera mais informao sobre um determinado conjunto de dados. O alinhamento mltiplo consiste na realizao de todas comparaes par a par possveis das N sequncias de um dado, onde elas sero classificadas por sua similaridade (utilizando uma rvore guia QUE NO FILOGENTICA), de onde o alinhamento mltiplo ser gerado juntando os alinhamentos aos pares de forma hierrquica. Devido sua natureza heurstica, ou seja, que no garante encontrar o alinhamento ideal e mais correto, o alinhamento mltiplo deve ser frequentemente averiguado manualmente para correo de possveis erros metodolgicos. Diversos programas implementaram os algoritmos de alinhamento mltiplo, entretanto o um dos mais utilizados atualmente o ClustalX, pois um dos que possuem interface amigvel ao usurio. Entretanto, para realizar o alinhamento mltiplo necessrio um arquivo com todas as sequncias que sero comparadas na anlise.
Para iniciar o programa clique 2 vezes no cone:
Para carregar o conjunto de dados clique em FILE, LOAD SEQUENCES. Uma janela ser aberta onde ir navegar at o arquivo contendo os dados.
Aps carregar os dados, necessrio otimizar os parmetros do alinhamento par a par e
mltiplo. Para isso clique em ALIGNMENT, depois ALIGNMENT PARAMETERS, primeiro em PAIRWISE ALIGNMENT PARAMETERS. Uma janela ir abrir. Modifique os parmetros GAP OPENING para 10 e GAP EXTENSION par 0.10. Aps isso clicar em OK Clique em ALIGNMENT, depois ALIGNMENT PARAMETERS, primeiro em MULTIPLE ALIGNMENT PARAMETERS. Uma janela ir abrir. Modifique os parmetros GAP OPENING para 15 e GAP EXTENSION par 1. Parmetros propostos por Hall, porm poderemos modificar para melhorar o alinhamento de acordo com seu conhecimento prvio.
Modificar o formato do arquivo de saida para fasta. V em ALIGNMENT depois em
OUTPUT FORMAT, e tirar de clustal e colocar para FASTA. Para realizar o alinhamento clique em ALIGNMENT depois em DO COMPLETE ALIGNMENT. Depois de algum tempo o alinhamento ser gerado, e os arquivos com a arvore guia e o alinhamento no formato indicado no output sero gerados na pasta indicada. Modifiquem os parmetros de abertura e extenso de gaps para melhorar o alinhamento. Lembre-se: A arvore gerada pelo clustal no pode ser usada como arvore filogentica. Ela gerada apenas por similaridade simples, sem nenhuma correo de substituies, alm da sua montagem no utilizar nenhum algortimo refinado de reconstruo de topologias. O alinhamento dever ser avaliado utilizando um programa de edio de alinhamento como o GeneDoc ou Bioedit.
O que aconteceu quando modificamos os parmetros de gap?
O que acontece quando aumentamos os parmetros de abertura e extenso? O que acontece quando diminumos os parmetros de abertura e extenso?