Professional Documents
Culture Documents
Objetivos
O que Bioinformtica Bioinformtica versus Biocomputao Dilogo entre bilogos moleculares e cientistas da computao Bioinformtica: protemica e genmica A Bioinformtica no Brasil caso Genesul A Bioinformtica e a iniciativa privada Sequenciamento de genomas: tcnicas e equipamentos Bases de Dados biolgicos Anotao de Genomas Softwares Principais locais de pesquisa no Brasil em Bioinformtica Congressos
O que Bioinformtica
Desenvolvimento de ferramentas e mtodos computacionais para anlise, manipulao, construo, edio e gerenciamento de dados biolgicos. Anlise em laboratrio de dados biolgicos difcil e custosa. Portanto, tcnicas computacionais so essenciais [1].
[1] Machine Learning Approaches to Gene Recognition Mark W. Craven and Jude W. Shavlik IEEE AI in Molecular Biology (1994)
Bioinformtica
versus
Biocomputao
... Or to come right to the point, how do we train bacteria to make transistors? Seymour Cray pai do supercomputador [2]
[2] FORBES, Nancy / Imitation of Life: How Biology is Inspiring Computing / MIT Press (2004)
Genmica: Anlise, edio, manipulao de Genomas Banco de Dados biolgicos Genmica funcional Anotao de genomas
Comeou como uma iniciativa da Coopercitrus e Fapesp com o objetivo de sequenciar o genoma completo da Xylella fastidiosa. http://www.xylella.lncc.br/
Diversos projetos de sequenciamento esto em curso no Pas: brGene - http://www.brgene.lncc.br/ OMM - http://www.omm.lncc.br/ PIGS - http://www.genesul.lncc.br/ Leifsonia xyli - http://www.leifsonia.lncc.br/ Genoma Caf - http://www.cenargen.embrapa.br/biotec/genomacafe/index.html Genoma Banana - http://genoma.embrapa.br/musa/index.html/ RioGene - http://www.riogene.lncc.br/ entre outros
Genesul
Rede de laboratrios de Bioinformtica, de Sequenciamento e de Dignstico dos Estados de Santa Catarina, do Paran e do Rio Grande do Sul. O projeto financiado pelo MCT e pela FAPERGS. O projeto tem como objetivo sequenciar a bactria Mycoplasma hyopneumoniae. Essa bactria causa grandes danos ao porco, o que prejudica a produo no Sul do Pas. Aps o sequenciamento, o objetivo o desenvolvimento de vacinas. ESTADO ATUAL: Mycoplasma hyopneumoniae, Mycoplasma hyopneumoniae 7448 e Mycoplasma hyopneumoniae 7442 j sequenciados
O sequenciamento de genomas atrai grande interesse comercial. Coopercitrus e Embrapa so hoje as principais empresas que usam da bioinformtica para auxiliar o estudo dos genomas. A Bioinformtica acelera os estudos do genoma. Velocidade imprescindvel no mercado.
Sequenciamento: tcnicas
Extenso direta da fita a partir do primer de uma fita de nica face. Utiliza-se uma DNA polimerase. Os primers tm comprimento de 18 a 25 bases.
Sequenciamento: tcnicas
Terminaes em 4 didexidos (uma para cada base). A polimerase no se extende aps essas terminaes. So formadas diversas sequncias de vrios tamanhos. Produzem sequncias terminadas sempre em A, C, G e T.
10
Sequenciamento: tcnicas
Utiliza-se marcadores com ndices de refrao diferentes (um para cada base). Utilizado para sequenciamento automatizado. Os produtos so separados por tamanho.
11
Shotgun
12
Shotgun
13
Shotgun
14
Shotgun
15
Shotgun
Os reads so montados em contigs e regies single-stranded (h sequncia para somente uma fita). Essas regies so identificadas para posterior sequenciamento, produzindo assim a sequncia completa.
16
Shotgun A tcnica Shotgun aplicvel a tamanhos diversos de DNA. A nica considerao sobre o tamanho da poro do vetor de clonagem. Essa deve ser a menor possvel. Por exemplo, a porcentagem de DNA do Cosmdio de aproximadamente 20%. Com isso, ao resequenciar um DNA que usa o Cosmdio como vetor de clonagem, 20% dos reads desse DNA so perdidos.
17
Nucleotdeos / Aminocidos: GenBank Protenas: Swiss-Prot TrEMBL Motivos: Prosite Interpro Estruturas 3D: PDB
18
NCBI - GenBank
O National Center of Biotechnology Information comeou suas atividades em 1988. Seus principais objetivos so: Estabelecimento de Banco de Dados pblicos Pesquisa em Biologia Computacional e processos ligados doenas Desenvolvimento de Software Anlise de dados de genomas e informtica mdica
OBS: Ao contrrio do Swiss-Prot, o Genbank no curado. Portanto, os seus dados podem possuir inconsistncias.
19
NCBI - GenBank
20
http://www.ncbi.nlm.nih.gov/
Swiss-Prot - TrEMBL
O Swiss-Prot uma base de dados curada de protenas que tem como objetivo: prover um alto nvel de anotao (descrio da funo de protenas, seus domnios estruturais, modificaes ps-translacionais, variantes, etc.) um nvel mnimo de redundncia alta integrao com outras bases de dados. O TrEMBL um suplemento de anotao por computador do Swiss-Prot que contm todas as sequncias de nucleotdeos do EMBL ainda no integradas no Swiss-Prot.
21
Swiss-Prot - TrEMBL
Incio: 1986
22
http://br.expasy.org/sprot/
PDB
23
PDB
24
http://www.rcsb.org/pdb/index.html
Anotao de genomas
Descubrir, analisar, mapear, pesquisar as funes e caractersticas dos genes no genoma dos organismos
25
Softwares de Bioinformtica
Montagem e Consenso Phred Phrap Consed Alinhamento Sequencher ClustalW Staden Edio BioEdit Sequencher Propsitos Gerais EMBOSS
26
Softwares de Bioinformtica
Phred
Interpreta os arquivos de sequenciamento de DNA, verifica os nucleotdeos e designa valores de qualidade para cada base.
Phrap
Montagem de sequncias de DNA obtidas atravs do processo de Shotgun.
Consed
Visualizao, edio e acabamento da montagem de sequncias criadas com o Phrap.
27
http://www.phrap.org
Softwares de Bioinformtica
Staden Package
Pacote de softwares de Bioinformtica para: Montagem (gap, pregap, vectorClip, screenSeq, findRenz, trev) Deteco de Mutaes (traceDiff, hetscan, gap4) Anlise de Sequncias (spin, makeWeights) Manipulao e Leitura de arquivos de sequenciamento (convertTrace, getComment)
28
http://staden.sourceforge.net/
Softwares de Bioinformtica
ClustalW
Software de propsitos gerais para alinhamento mltiplo de DNA ou protenas. Ele produz alinhamentos mltiplos de sequncias divergentes com significado biolgico. Ele calcula o melhor alinhamento para as sequncias, alinha-as umas com as outras.Assim, as identidades, similaridades e diferenas entre as sequncias podem ser vistas. Relao evolutiva pode ser visualizada atravs de Cladogramas ou Filogramas.
29
Softwares de Bioinformtica
EMBOSS
http://emboss.sourceforge.net/
30
[4] EMBOSS: The European Molecular Biology Open Software Suite / Rice,P. Longden,I. and Bleasby,A. Trends in Genetics 16, (6) pp276277
Nordeste: Laboratrio de Bioinformtica da UFPE http://biolab.cin.ufpe.br/ Centro Oeste: EMBRAPA http://asparagin.cenargen.embrapa.br/pt/ Sudeste: UFRJ http://www.bioinfo.ufrj.br/ LNCC http://www.lncc.br/~labinfo USP So Paulo http://www.ime.usp.br/posbioinfo/ UFMG http://www.ufmg.br/bioinformatica/ FIOCRUZ UNICAMP http://www.lbi.ic.unicamp.br Sul: PUCRS UFRGS http://www.inf.ufrgs.br/~crym/LabBioInf/
31
Congresso Nacionais Congresso Brasileiro de Gentica Sociedade Brasileira de Gentica http://www.sbg.org.br Simpsio Brasileiro em Bioinformtica Sociedade Brasileira de Computao http://www.unisinos.br/simposio/bsb/index_port.php Congressos Internacionais ISMB http://www.iscb.org/ismb2005/sigs.html RECOMB http://www.broad.mit.edu/recomb2005/ International Society for Computational Biology http://www.iscb.org/
32
Referncias Bibliogrficas
[1] Machine Learning Approaches to Gene Recognition Mark W. Craven and Jude W. Shavlik IEEE AI in Molecular Biology (1994) [2] Imitation of Life: How Biology is Inspiring Computing FORBES, Nancy / MIT Press (2004) [3] Slides da disciplina Tpicos Especiais em Computao VI: Introduo Bioinformtica do semestre 2005/1 do Insituto de Informtica da UFRGS Prof. Dra. Ana Lcia C. Bazzan (2005) [4] EMBOSS: The European Molecular Biology Open Software Suite Rice,P. Longden,I. and Bleasby,A. -Trends in Genetics 16, (6) pp276277 [5] Bioinformatic tools for DNA/protein sequence analysis, functional assignment of genes and protein classification Rehm, B.H.A . -Applied Microbiology Biotechnology 57, pp579-592 (2001)
33
www.inf.ufrgs.br/~rrferreira/bioinf rrferreira@inf.ufrgs.br