You are on page 1of 49

Resumo de BIOMOL APLICADA Distribuio de genes nos genomas - primeiras palavras para o roteiro de aulas Quando pensamos no DNA

como mensageiro da informao gentica, no nos ocorre de imediato que nem tudo o que est contido no genoma codifica uma protena ou um RNA estrutural (tRNA ou rRNA). Mas, numa segunda anlise da questo, fica bvio que entre os genes deve haver algum espao, para elementos controladores do fluxo da informao gentica. J vimos em outros pontos deste portal a estrutura dos genes procariotos e eucariotos e sabemos que de fato so antecedidos e sucedidos por regies controladoras. Alm disso, sabemos que entre os xons h introns mais ou menos extensos, mas no olhamos ainda com ateno para as regies fora destas reas codificantes ou controladoras e para distribuio dos genes num genoma. Ser que o genoma aumenta em proporo direta com o nmero de genes que ele contm? No h relao clara entre o tamanho do genoma e a complexidade gentica. No entanto, entre os diferentes filos h a necessidade de um aumento mnimo do genoma, o que pode ser refletido em um aumento da complexidade anatmica e fisiolgica. O tamanho do genoma das bactrias , de fato, aproximadamente proporcional ao nmero de genes que ele contm (figura abaixo).

Fig. 1. Relao entre o tamanho do genoma e o nmero de genes em bactrias. J em eucariotos parece no existir uma relao entre o tamanho do genoma e o nmero de genes dos organismos (Figura 2). Podemos exemplificar com D. melanogaster que possui um genoma maior que o de Caenorhabditis elegans entretanto seu nmero de genes menor. H, apesar disso, uma correlao positiva entre o aumento da complexidade e o aumento dos genomas, embora haja excees como mostrado na figura 2. Este aumento devido tanto ao afastamento maior entre os genes como presena de ntrons, que tendem a ser maiores nos organismos mais complexos, em especial nos mamferos.

Uma correlao muito mais forte existe entre o tamanho do proteoma e a complexidade do organismo. Embora este no seja o tema desta pgina, podemos nos perguntar como isso ocorre, isto , como, sendo o nmero de genes no muito diferente entre um verme (c. elegans) e o home, seus proteomas so to diferentes em tamanho.Isso primariamente resultado do Splicing alternativo. Vimos no primeiro mdulo que o Splicing alternativo permite que um nico gene seja responsvel pela sntese de protenas diferentes, o que contraria o dogma central (Figura 3 e 4).

Fig. 3. (A) Mecanismo clssico de expresso gentica; um gene transcrito numa cpia de cadeia nica de RNA (transcrito primrio) que depois editado pela remoo de intres (.splicing.) originando o RNA mensageiro que traduzido numa protena.

Fig.4: Principais tipos de splicing alternativo. Em procariotos os genes que codificam produtos com funes relacionadas componentes de uma mesma via metablica, por exemplo - ocupam posies adjacentes no cromossomo e so co-transcritos. Antes de falarmos nos genes eucariotos e sua distribuio no genoma, preciso enfatizar que Uma parte substancial dos genomas de organismos eucariotos consiste em seqncias moderada e altamente repetitivas, e a porcentagem de seqncias repetitivas geralmente

maior nessas espcies com os genomas maiores (Figura 5). A maioria dessas seqncias repetitivas parece ter surgido por transposio. Isso particularmente evidente no genoma humano, onde 45% do DNA derivado de transposio (Figura 6).

Fig 5. Proporo de diferentes seqncias no genoma. Fonte: Lewin B et al. 2004, Gene VIII.

Fig 6 . Distribuio dos diversos tipos de sequncias de nucleotdeos no genoma humano. As repeties esto representadas por transposons, grandes duplicaes e repeties simples. Nas outras categorias de sequncia tambm pode haver repeties mais ou menos extensas. Uma pequena proporo codificante para protenas (xons). A distribuio mostrada semelhante para todos os mamferos e para uma grande parte dos vertebrados Os genes codificadores de protenas em humanos podem ser comparados com os genes de procariotos, dos eucariotos unicelulares, dos animais invertebrados e dos vertebrados? Vimos que os humanos compartilham 21% de seus genes com todas as formas de vida. Estes so os genes de manuteno de cada clula, os quais regulam a maquinaria celular bsica. A

maioria dos genes de manuteno evolui lentamente e vem sendo copiada, com poucas modificaes, ao longo de bilhes de anos. Outros 32% dos nossos genes so homlogos aos genes de todos os eucariotos, mas no aos das bactrias. Eles tambm so genes de manuteno celular que refletem a grande complexidade do metabolismo celular dos eucariotos. Cerca de 24% de nossos genes so compartilhados com outros animais, mas no com eucariotos unicelulares, nem com procariotos. Esses genes animais compreendem genes como os Hox, que controlam o desenvolvimento. Outros 22% de nossos genes so compartilhados somente com vertebrados. Incluem genes que atuam no sistema imune e nervoso (Figura ).

Fig.5. Genes e distribuio na natureza. Complexidade surge pela adio de novas funes gnicas. A expanso de nossos conhecimentos sobre seqncias genmicas est possibilitando formular perguntas sobre a evoluo do genoma e respond-las. Aqui vo alguns exemplos de perguntas que podem ser feitas sobre evoluo genmica: 1. Por que o DNA de algumas espcies mais longo do que o de outras? 2. H espcies que tm mais DNA codificador do que outras espcies? E se assim, por qu? 3. Como as diferentes partes dos genomas mudam de tamanho durante a evoluo? 4. Qual uma conseqncia das diferenas de contedo G+C de genomas diferentes? Genes nos genomas virais Os vrus foram um dos tpicos de discusso mais quentes desde sua descoberta no incio do sculo XX. Uma definio sobre o que so vrus proposta por Andr Lwoff (ganhador do Nobel em 1967 com Jacob e Monod os descobridores do operon lac) caracterizava estas entidades como portadores de pequeno tamanho (inferior a 250 nm), apenas um tipo de cido nuclico (RNA ou DNA), sem enzimas necessrias para produzir energia, incapazes de automultiplicao e parasitas intracelulares obrigatrios. Apesar de todas estas aparentes limitaes na definio, h uma diversidade enorme de vrus. A estrutura do DNA

A estrutura do DNA hoje em dia conhecida por qualquer colegial bem informado, assim como a Teoria da Relatividade. Porm, como a Relatividade, sua compreenso parcial e, para fins de pesquisa, realmente insuficiente. Tambm para aqueles que desejam estudar as novas tcnicas em gentica molecular, fundamental um conhecimento mais aprofundado da estrutura do DNA, de sua replicao e dos mecanismos de transcrio da informao gnica. Mais uma vez lembramos que no pretendemos dar todo este conhecimento atravs deste texto, mas apenas servir de guia para o estudo do assunto. A estrutura em hlice dupla para o DNA foi proposta por Watson e Crick, que se basearam em parte nos resultados da difrao de raios X , obtidas por Rosalind Franklin. O modelo proposto em 1953 o que chamamos hoje em dia de DNA B. Nesta hlice as duas cadeias de DNA esto ligadas entre si por pontes de hidrognio, que so ligaes fracas no covalentes, formadas entre bases opostas nas duas cadeias (ou fitas). O pareamento muito especfico: a base purnica Adenina pareia somente com a base pirimidnica Timina, enquanto que a outra base purnica, Guanina, pareia com a base pirimidnica Citosina. Por isso, o nmero de bases A tem que ser igual ao de T, enquanto o nmero de bases C ser sempre igual ao de G. O pareamento AT e GC (regra de Chargaff) se faz por duas e trs pontes de hidrognio, respectivamente. Assim, a sequncia de bases de uma fita no igual da outra, porm complementar: dada a sequncia numa fita, a sequncia de bases da outra estar prontamente determinada. Estas caractersticas do modelo de Watson e Crick so bem conhecidas. H outras, menos conhecidas porm no menos importantes. As duas fitas so antiparalelas. O que significa isto? Para compreender esta caracterstica preciso antes discutir-se um pouco a forma com que uma nova molcula de DNA feita. Arthur Kornberg isolou no fim dos anos 50 uma enzima capaz de duplicar o DNA em tubo de ensaio. Esta enzima, chamada DNA polimerase, adiciona as bases nitrogenadas de uma fita (usando os precursores desoxi-adenosinatrifosfato, ou dATP, e as trs outras, dTTP, dCTP e dGTP) a partir da informao contida na outra. A enzima "l" a fita molde e faz a fita complementar. Mas ela s realiza este trabalho num sentido quimicamente determinado: como ela faz ligaes fosfodiester 3-5, cria uma nova fita que se estende da extremidade 5-fosfato para a extremidade 3-OH. Uma anlise da representao plana da dupla fita de DNA, mostrada na figura a seguir, esclarece esta direcionalidade da sntese de DNA. Como foi dito acima, as fitas de DNA so antiparalelas: significa dizer que elas "correm" em direes opostas e so replicadas tambm em direes opostas. Ao se entrelaarem, as duas fitas formam duas fendas, mais ou menos como um parafuso que tivesse dois fios ao invs de um. atravs destas fendas que a maior parte das protenas que interagem com o DNA "lem" as sequncias de bases que esto voltadas "para dentro". Mais adiante veremos como vital para todo o controle e fluxo da informao gentica a interao precisa entre protenas diversas e sequncias determinadas do DNA. H pelo menos trs modelos de DNA que so frequentemente citados nos livros-texto: os modelos A, B e Z. O DNA B de longe o mais frequente, mas o DNA Z tambm encontrado na clula. Admite-se que o DNA Z "silencioso", isto , no pode ser transcrito. A transio B-Z seria, assim, um recurso para silenciar grandes blocos de genes. A forma Z tambm a nica que imunognica, isto , quando um paciente tem anticorpos contra DNA, contra esta forma que eles so produzidos.

Figura 5: Os trs modelos mais citados de DNA: A, B e Z. Nesta figura est bem visvel a fenda maior entre a volta verde de cima e a vermelha de baixo e a menor, entre a vermelha de baixo e a verde da base, no modelo B. Tambm fica claro que os dois modelos A e B so hlices dextrgiras, enquanto o Z levgiro. Tambm d para perceber que o DNA Z no tem duas fendas ntidas, mas uma escancarada e outra muito discreta. Por fim, devemos nos lembrar que o DNA pode assumir a forma circular ou se organizar em cromossomos lineares. A Natureza aparentemente comeou a "experimentar" com genomas circulares de DNA fita dupla. S mais tarde, quando a informao gentica necessria para perpetuar a espcie comeou a se tornar demasiado grande, que a soluo de mltiplos cromossomos lineares teve que ser adotada. A replicao do DNA Todos aprendemos na escola (e algumas vezes tambm na Universidade) que a replicao do DNA comea de uma das extremidade. A forquilha de replicao vai se abrindo medida em que, na frente, as duas fitas antigas se desenovelam, enquanto que, mais embaixo, duas novas fitas vo sendo sintetizadas e, por sua vez, se enovelam nas fitas antigas; formam-se com isto duas novas cadeias duplas de DNA, cada uma contendo uma fita nova e uma fita velha. A replicao dita, por isso, semi-conservativa. Sem negar o valor didtico desta representao preciso que se tenha claro em mente que isto no ocorre jamais. A replicao, mesmo de um genoma linear curto como o de um vrus, costuma se iniciar de um ponto interno no genoma. O DNA circular das bactrias tambm se replica a partir de um nico ponto (e, necessariamente, interno). Genomas maiores tm mltiplas origens de replicao. Para cada lado da origem de replicao a replicao avana, de tal forma que duas "forquilhas" acabam se encontrando. H diversas outras imprecises a cerca da replicao do DNA, que tm consequncias graves na compreenso de muitas das tcnicas em gentica molecular. Procuraremos a seguir sanar algumas delas, antes de passar transcrio, isto , sntese de RNA a partir de DNA. Como foi dito acima, a DNA polimerase s sintetiza uma nova fita de DNA no sentido 5-3. A consequncia que, mais uma vez, a imagem da forquilha de replicao comentada no incio do texto est errada. Se, de um lado, a fita nova pode ser feita de forma contnua, de fora para dentro (da extremidade aberta para o fundo da forquilha), do outro lado a sntese tem que ser feita de dentro para fora! Por isso a fita feita desta forma chamada fita descontnua. Ela formada inicialmente por fragmentos de DNA, conhecidos como fragmentos de Okazaki. Cada vez que um trecho suficientemente longo de DNA fita simples est disponvel, inicia-se a sntese de um novo fragmento de Okazaki, de dentro para fora da forquilha. Aps sua sntese

uma enzima liga o fragmento recm sintetizado ao fragmento sintetizado anteriormente. Desta forma engenhosa a sntese das novas fitas de DNA sempre feita no sentido 5-3. Mas ainda esta imagem imprecisa: falta um aspecto fundamental da replicao do DNA, que consequncia outra vez da forma com que a DNA polimerase atua. A DNA pol no consegue estender uma nova fita de DNA se no houver um pequeno trecho de DNA ou RNA pareado na fita molde acima (ou 5) do segmento que ser sintetizado. A figura abaixo representa a sntese de um trecho de uma nova fita pela DNA pol a partir de um "primer" (pronuncia-se "primer") ou iniciador.

Figura 6: Representao esquemtica do incio da sntese de uma fita nova de DNA. A DNA polimerase apoia-se no segmento de DNA pareado fita molde e, adicionando nucleotdeos na direo 5-3, estende a nova fita. Como ocorre na natureza, durante a replicao do DNA? Quem o primer? Para orientar nossa discusso, imaginemos que a replicao comece realmente da extremidade da fita dupla, como nas figuras usuais que aprendemos na graduao. Para que a sntese das fitas novas progrida necessria a adio de dois primers: um na extremidade da fita molde que servir para dirigir a sntese da fita contnua, e outro mais para o interior da forquilha de replicao, pareado com a fita que servir de molde para a sntese da fita descontnua. Na verdade, para cada fragmento de Okazaki a ser gerado ser necessria a adio de um primer. E, assim como o DNA, o primer tambm tem um sentido 5-3 bem definido. Quem sintetiza o primer? Na natureza o primer feito de RNA e adicionado pela enzima primase, que trabalha junto com a DNA polimerase e com diversas outras enzimas no processo de replicao do DNA. A figura 6a abaixo mostra as vrias etapas da sntese de duas novas fitas de DNA a partir da fita dupla original, no modelo em que a replicao comearia na extremidade (errneo: isso nunca acontece; mas serve para exemplificar as questes a que nos referimos acima).

Figura 6a: (Parte I) No modelo acima, em que a forquilha de replicao inicia-se na extremidade do DNA, h inicialmente a adio de um primer na extremidade da fita molde da esquerda (3). Assim que a forquilha de replicao se abre o suficiente, pela ao da girase e da helicase e pelo progresso da replicao da fita contnua, um primer interno colocado e comea a sntese da fita descontnuo, pelo primeiro fragmento de Okasaki. A fita contnua e os fragmentos de Okasaki so, na Escherichia coli, sintetizadas pela DNApol III. Os trechos fita simples devem ser protegidos de quebras mecnicas e da ao de DNAses pelas protenas ligadores de fita simples (SSB). (Parte II) Quando a forquilha de replicao avana mais, outro fragmento de DNA adicionado. (Parte III). Terminada a sntese do segundo fragmento, resta uma ponte fosfodister a ser completada na fita simples recm-sintetizada, mas que no pode ser feita porque a enzima ligase no une RNA (a extremidade 5-P do primer do 1o. fragmento de Okazaki) a DNA (extremidade 3-OH do fragmento de Okazaki novo recm sintetizado). Para que a ligase possa unir dois fragmentos de Okasaki consecutivos indispensvel que a DNApol I retire o primer de RNA e ressintetize o espao com DNA A consequncia final deste mecanismo de adio de primers antes da extenso das fitas novas que haver trechos de RNA entre longos segmentos de DNA na fita descontnua. E mesmo na fita contnua haver pelo menos um primer de RNA seguido de toda a fita feita com DNA. Ser esta a situao final do DNA fita dupla replicado? evidente que no. Heterohbridos RNADNA no so estveis. Eles tm que ser retirados do DNA maduro. Para isto entra em ao a atividade corretora da enzima DNA polimerase I (at agora vnhamos falando de uma DNA pol sem citar sua denominao completa, que DNA pol III). A DNA pol I reconhece defeitos diversos no DNA, inclusive a presena de RNA, mesmo que pareado ao DNA (neste caso a base nitrogenada Timina substituda pela Uracila). Atravs de uma atividade exonucleotdica 5-3, ela retira o primer. Ao mesmo tempo, empregando a hidroxila livre da extremidade 3 do fragmento de Okazaki j sintetizado e situado 5 do stio reparado, outra cpia da mesma molcula ressintetiza o espao deixado, desta vez com DNA. Por fim a enzima ligase completa a ligao entre os fragmentos de Okazaki. A figura abaixo mostra um modelo de replicao mais completo do que os habitualmente representados nos livros. preciso entender aqui que

a forquilha no existe de fato, mas sim no contexto de uma replicao bidirecional, em que duas forquilhas, apontando em sentidos opostos, se abrem e permitem a replicao do DNA.

Figura 7: Representao da forquilha de replicao, onde esto mostradas as principais enzimas e cofatores que formam o complexo de replicao (replicossomo): DNApol III (duas molculas), RNA primase e helicase. A helicase uma topoisomerase, responsvel pela abertura da forquilha. As duas DNA pol III mostradas trabalham de fato juntas, na mesma direo; para isto a fita de DNA que replicada descontinuamente forma uma ala e a DNA pol III nesta fita periodicamente "larga" a fita e retoma o servio num ponto mais interno. (figura extrada do livro The Cell: A molecular Approach, de J. Cooper, Sinauer Assoc. Co., disponvel on-line no Bookshelf do NCBI) Agora sim, estamos com a imagem completa! No, leitor paciente. H ainda diversas imprecises do modelo que, para nossa sorte, no interferem negativamente em nosso estudo das modernas tcnicas da gentica molecular. Por isso as comentaremos apenas brevemente. Ora, a primase no adiciona primers no incio dos cromossomos lineares. E ento, como se replicam as pontas dos cromossomos? Sabemos que cromossomos tem muitas origens de replicao, mas o problema da ponta sempre persiste. Se no possvel adicionar um primer, ento as pontas dos cromossomos vo sendo encurtadas, porque no seria possvel replic-las. Isto de fato acontece: na fita descontnua, sintetizada a partir do molde de DNA fita simples parental, um primer adicionado um pouco antes do final do molde (pela DNA primase), aps a sntese do fragmento de Okazaki correspondente, o primer retirado, sobrando um pequeno trecho a ser recomposto. Se isto no ocorrer, e de fato no ocorre, a fita simples de DNA ser eliminada e o DNA ficar mais curto um pouco. Ao longo de mltiplas replicaes a tendncia seria desaparecer o cromossomo! Os eucariotos (que tm cromossomos lineares) possuem uma enzima, chamada telomerase, que adiciona uma seqncia de bases definida, repetindo muitas vezes esta operao, cada vez que detecta um encurtamento significativo da extremidade de um cromossomo. Neste processo a integridade do cromossomo garantida. Por isso tambm as extremidades de todos os cromossomos de uma mesma espcie eucariota so iguais e formadas pelos telmeros.

Figura 8: Replicao telomrica: a figura identifica as reaes envolvidas na formao de sequncias ricas em G, que formam as extremidades dos cromossomas (telmeros). A fita incompleta sempre a descontnua, recm sintetizada e iniciada num primer de RNA, j retirado na figura. Como indicado, a telomerase um complexo RNA-protena que tm um molde de RNA para a sntese de uma sequncia de DNA rica em G. Estas repeties tm a sequncia GGGTGG em Tetrahymena (um protozorio ciliado), GGGTTA em humanos e G1-3A em Saccharomyces. A telomerase apenas alonga a fita contnua, pela adio de um nmero variado de telmeros. A fita descontnua ento parcialmente completada pela DNA polimerase a, que tem a primase como uma de suas subunidades (figura baseada no livro Molecular Biology of the Cell , Alberts e cols., Garland Publ, tambm disponvel no Bookshelf do NCBI). Outro ponto que geralmente no mencionado nos modelos de replicao, e que tem uma importncia relativa na compreenso de certas limitaes das tcnicas de gentica molecular, a atividade revisora da DNA polimerase III bacteriana (e das DNA pol em geral, sejam elas eucariotas ou procariotas). O que e para que serve esta atividade? Na natureza existem formas alternativas das quatro bases nitrogenadas que formam o DNA, chamadas formas tautomricas. A frequncia com que estas bases ocorre baixa, porm muitas ordens de grandeza acima da frequncia de erros admissveis no DNA (lembre-se que a adio de uma base errada na sequncia de um gene uma mutao, que pode ter consequncias importantes para o portador do gene mutante). Cada vez que uma dessas bases tautomricas empregada, provoca um erro de pareamento. Se no for retirada antes da prxima replicao, uma mutao ser introduzida no DNA. Por isso, as DNA pol (I,II e III, em Escherichia coli e muitos outros procariotos, a e b em eucariotos) tm a capacidade de rever, imediatamente aps a adio, se o pareamento da base adicionada com a base da fita molde foi correto. Qualquer erro de pareamento refletido pela alterao na estrutura da dupla hlice. Esta alterao deve fluir por um canal inico da prpria DNA pol. Se a hlice estiver alterada a DNA pol pra, volta na direo 3-5 despolimerizando a cadeia recm sintetizada e, aps algumas dezenas ou at centenas de bases, recomea o trabalho. Parece um processo pouco econmico, mas lembre-se que a integridade da informao gentica est em jogo e, portanto, a conservao da espcie. H ainda na replicao do DNA um grupo de enzimas responsveis pelo desenovelamento e separao das hlices do DNA, assim como pela separao das cadeias duplas formadas na

replicao do DNA circular. Estas enzimas, coletivamente chamadas topoisomerases, so vitais para a replicao do DNA na natureza, mas no tem maior relevncia para a tecnologia baseada na manipulao in vitro do DNA. Embora o enfoque deste texto seja em mecanismos procariotos, devemos lembrar que nos eucariotos o mecanismo de replicao essencialmente o mesmo. A fita contnua replicada pela DNA polimerase d (delta) e a descontnua pela DNA pol e (epslon). H, ao contrrio dos DNAs procariotos, vrias origens de replicao no DNA eucarioto, que so ativadas simultaneamente. Estrutura e organizao do gene Inicialmente convm estabelecer o que entendemos por gene. Numa concepo simplista podemos admitir que um gene o segmento de DNA que codifica uma certa protena. Embora esta definiao possa ser til e vlida, ela encontra dificuldades de aplicao quando o segmento de DNA contm introns. Por outro lado, convm em muitos casos considerar as regies controladoras da expresso do gene como partes integrantes dele. Assim, a definio molecular de gene deve compreender um segmento de DNA bem maior do que o mnimo necessrio para codificar os aminocidos que fazem parte da sequncia polipeptdica. Vamos comear o caminho na direo da definio molecular de um gene pela anlise da estrutura tpica de um gene procarioto. Embora em muitos casos vrios genes estejam sob o controle de um nico sistema, formando o chamado operon, vamos aqui considerar que um nico gene est em jogo. A figura abaixo mostra um gene tpico de um procarioto.

Figura 1: Estrutura tpica de um gene procarioto. RBS = stio ligador de ribossomo; ATG = cdon de iniciao da sntese protica; Cds ou ORF = quadro aberto de leitura; stop = qualquer um dos trs cdons de finalizao da sntese protica; terminador = regio terminadora da transcrio O trecho compreendido entre o cdon de iniciao da sntese proteca (usualmente ATG ou TTG) e um dos trs cdons para terminao da sntese protica (designados aqui por stop) determina a sequncia de aminocidos do polipeptdeo final, produto do gene. Este trecho frequentemente designado como quadro aberto de leitura (ORF = open reading frame) ou sequncia codificadora (Cds = coding sequence). Antes dele (diz-se 5' dele) esto o promotor (onde vai se ligar a RNA polimerase) e o stio ligador de ribossomo (RBS = ribosome binding site ou rrs = ribosome recognition site), uma sequncia que, quando transcrita para o mRNA, ir permitir o pareamento deste com um trecho complementar do RNA 16 S da sub-unidade menor do ribossoma. Aps a ORF (3' dela, como se diz no jargo de biologia molecular), h o sinal de parada da transcrio, que formado por uma sequncia didica acompanhada de um poliT (na fita 5'-3', que sempre a de cima, salvo quando especificado na figura). A transcrio

da regio do terminador provoca a formao de um grampo no RNA mensageiro nascente, seguido de um poli-U, que interrompe a sntese de RNA. Para maior detalhe (no necessrio para as aulas da disciplina oferecida ao curso de Medicina), consultar a aula 3 do website BiolMol. A transcrio do DNA, que comea numa base dentro da regio promotora e termina no grampo de terminao, gera o mRNA. A anlise da figura a seguir mostra que ele tem um segmento antes do cdon de iniciao (AUG), que no ser traduzido. Este trecho de mRNA designado 5'- UTR (regio 5' no traduzida; UTR = untranslated region) e pode ter dezenas de bases na maioria das bactrias. Da mesma forma, aps o cdon de terminao da traduo, h um trecho de mRNA no traduzido, designado como regio 3'- UTR. Este segmento pode ter tambm vrias dezenas de bases. A funo das regies UTR nas bactrias nem sempre clara. No caso da 5'-UTR, ela contm o stio ligador de ribossoma, sem o qual nenhuma sntese de protena possvel.

Figura 2: mRNA transcrito do gene. Observe que a regio 5'-UTR contm o RBS, enquanto a 3'UTR tem o grampo de terminao. Nos eucariotos os genes costumam ter, cada um, sua regio controladora. H poucos exemplos de transcritos de RNA com vrios genes, que so entretanto comuns nas bactrias. A estrutura geral do gene acompanha, portanto, a figura acima, mas h vrias particularidades, tanto na organizao das regies controladores e codificantes, como no processo de transcrio e processamento do RNA at chegar ao mRNA maduro. Vamos observar primeiro a estrutura geral de um gene eucarioto, como representado na figura abaixo.

Figura 3: Diagrama de um gene hipottico eucarioto. Alm das regies, stios e caractersticas j descritas para o gene procarioto, h ainda sinais (S) entre o promotor e o cdon de inciao (pequenas sequncias que determinam o destino do mRNA, sua durao e outros parmetros importantes na fisiologia da clula) e uma diviso da ORF em regies codificantes (formadas por exons) e regies intercalares (formadas por introns).

O promotor, como nos procariotos, pode conter uma sequncia de 6 a 8 bases, rica em A e T, conhecida como caixa TATA. Esta sequncia varia um pouco de posio, mas costuma estar cerca de 25 bases do incio da transcrio do RNA (que determina a base +1). A caixa CAT est mais acima (5') e tem uma posio menos conservada. Eventualmente, no existe. Para uma viso detalhada da estrutura do promotor bacteriano, veja a aula 3 da pgina BiolMol (no indispensvel para a disciplina do curso de Medicina, mas sugerimos a leitura). No item 4 desta aula voltaremos a discutir este ponto. Observe que o cdon de iniciao da sntese protica est quase no meio do primeiro exon. Esta posio muito varivel e o cdon pode at mesmo estar no 2o. ou no 3o. exon. Todas as bases antes dele vo formar a regio 5' no traduzida (fora aquelas que forem retiradas porque so introns - no caso de cdon de iniciao no 2o. exon, por exemplo - ou por algum tipo de trimagem ps-transcricional). Portanto, quando dizemos que o exon tem uma sequncia codificante, podemos estar sendo pouco precisos. O exon 1 do exemplo da globina s tem parte dele devotada codificao da protena, sendo o segmento inicial conservado no mRNA, mas no traduzido. Seria mais correto dizer que os exons so as sequncias que permanecem no RNA aps a retirada dos introns. Entretanto, ainda esta definio pode ainda ser confusa porque, devido ao splicing alternativa, ora um certo exon permanece na sequncia final do RNA, ora retirado, dependendo do tecido, do desenvolvimento do organismo, de seu sexo e de muitos outros fatores. Assim, preciso estar alerta sobre esta dificuldade conceitual, que de fato no tem soluo. Fluxo da informao gentica: transcrio e traduo O DNA o depsito de toda a informao gentica estvel nos procariotos e eucariotos. Nos genomas dos seres vivos, sejam eles organizados na forma circular (comum aos procariotos) ou linear (como nos eucariotos, formando cromossomos), toda a informao gentica necessria ao organismo para enfrentar uma gama imensa de condies ambientais distintas est estocada no DNA. Se pensarmos nos metazorios, todo o programa para a formao e desenvolvimento do embrio, com as complexas relaes espaciais e temporais entre as clulas formadoras de um indivduo, tudo isto est "escrito" no DNA. Mas, a qualquer momento, uma clula emprega apenas uma frao consideravelmente reduzida de toda esta informao gentica. A forma com que esta informao selecionada ser discutida no prximo item. Procuraremos aqui focalizar nossa ateno na produo dos intermedirios da informao gnica, as molculas de RNA, e no produto final da expresso de um gene, a protena. As molculas de RNA existentes na clulas so todas sintetizadas a partir da transcrio de trechos do DNA (genmico, mitocondrial ou de cloroplasto) e tm uma estrutura geral mostrada na figura a seguir. Devemos ter em mente que, mais uma vez, o pareamento de bases determinante na sntese da nova fita de RNA: a adenina do DNA pareia com uma uracila no RNA, a timina com a adenina e a guanina e a citosina com a citosina e a guanina, como na fita dupla de DNA.

Modelo plano da molcula de RNA. H, como no DNA, a tendncia ao pareamento entre as bases, o que gera grampos na estrutura do RNA. Assim, na natureza, os RNAs apresentam-se muito dobrados e com muitos trechos em fita dupla.

Podemos agrupar a maior parte dos RNAs em trs grandes grupos: a) os RNA mensageiros ou mRNAs, que sero lidos pelos ribossomos e que trazem, assim a informao gentica para a sntese de protenas; b) os RNA ribossomais ou rRNA, que, junto com mais de 3 dezenas de diferentes protenas, formam os ribossomos. Cada ribossomo composto de duas subunidades diferentes. Na menor h um rRNA e na maior dois. Estas sub-unidades esto separadas no citossol e s se unem para a sntese protica, como veremos mais adiante; c) os RNA transportadores, ou tRNAs, que so "carregados" com aminocidos de uma forma extraordinariamente precisa pela enzima aminoacil-tRNA sintase. Os tRNAs tm a funo de trazer ao ribossomo o aminocido requerido pelo cdon apresentado pelo mRNA na cavidade A da sub-unidade maior do ribossomo. Veremos este mecanismo com mais detalhe no subitem dedicado sntese proteica. III.a. A transcrio Qual a diferena fundamental entre a transcrio e a traduo? Uma analogia pode nos esclarecer isto. Imagine a palavra PTERIGON. O que poderia significar isto? Os caracteres so obviamente escritos num alfabeto que no o nosso. Contudo, e usando regras muito simples, podemos transcrever a palavra para nosso alfabeto. Basta lembrar que a primeira letra a letra grega maiscula pi, que equivale a um p, a quarta letra um r maisculo, equivalente a um r, e assim por diante. A palavra escrita no alfabeto cirlico aparece como PTRIGON em nosso alfabeto. Muito bem, e da? O que significa afinal Ptrigon? Para compreendermos o significado da palavra, mesmo aps a transcrio, precisamos de um mecanismo muito mais sofisticado: a traduo. O significado aproximadamente asa. Da mesma forma, o processo de transcrio se limita a reproduzir em RNA o que est escrito em DNA, o que no apresenta

maiores dificuldades: as bases A, T, G e C da fita molde de DNA comandam o pareamento de U, A, C e G na fita recm sintetizada de RNA. A enzima que sintetiza RNA a RNA polimerase. Nos procariotos parece haver apenas uma RNA pol, mas nos eucariotos elas so distintas, especializadas na sntese de cada um dos grupos de RNAs. Focalizemos nossa ateno no modelo procarioto, pois at o momento as tcnicas da engenharia gentica que empregam a RNA pol baseiam-se mais neste grupo de organismos. A RNA polimerase precisa iniciar a sntese de um novo RNA precisamente em um determinado local. Analogamente, se pedssemos que o leitor transcrevesse com letra de mo o segundo pargrafo do captulo II de um certo livro, o leitor deveria identificar o captulo e saber como se caracteriza um pargrafo para iniciar seu trabalho. A nvel molecular este processo feito pela identificao pela RNA pol de uma sequncia de bases do DNA conhecida como promotor. A RNA pol no precisa "abrir" o DNA para ler as sequncias de bases. Ela procura a sequncia caracterstica do promotor deslizando sobre o DNA e procurando a sequncia atravs da fenda maior da dupla hlice. Seria como se procurssemos identificar um grupo de amigos olhandoos pelas costas ou pelo lado. Afinal, no to difcil, principalmente se pensarmos que s h 4 "amigos": A, T, G e C. A figura a seguir mostra as diferenas entre "perfis" ou "lados" dos pareamentos AT e GC.

Como os pares de bases no DNA podem ser reconhecidos pelos seus perfis, sem necessidade de se abrir a dupla hlice. Na figura esto mostrados 2 pares vistos num sentido ao longo da molcula de DNA. No outro sentido as imagens so especulares para os pares CG e TA. Para o reconhecimento do promotor a RNA polimerase utiliza a sub-unidade sigma (s). A enzima formada de 6 sub-unidades: 2 sub-unidades a, uma b e uma b, uma w e a subunidade s. A sub-unidade s no se liga fortemente s demais, que formam um ncleo enzimaticamente ativo a2bbw. Assim que a RNA pol se liga ao promotor, a sub-unidade s se desliga do ncleo enzimtico, que prossegue na sntese do RNA at alcanar um terminador (ver adiante). Mas afinal, como este promotor?

Como quase tudo na natureza, o promotor no nico. Existe, sim, um consenso em torno de sua sequncia. Se tomarmos a primeira base transcrita em RNA como a base +1, a sequncia de consenso de um promotor da bactria Escherichia coli (o fusquinha da gentica de microrganismos) ser como mostrado na figura a seguir. A reduo da afinidade e, portanto, da frequncia com que um promotor ligado e o gene transcrito pela RNApol, est diretamente associada homologia com a sequncia de consenso. atravs da variao das sequncias nas duas caixas (conhecidas como caixa TATA, ou caixa de Pribnow, e caixa -35) que modulada a transcrio relativa dos genes constitutivos (aqueles que so expressos o tempo todo durante a vida da clula). Um gene cujo produto deva ser abundante tem um promotor com sequncia mais prxima ao consenso, enquanto que um gene cujo produto deva ser raro na clula tem, em geral, um promotor com as sequncias das duas caixas bastante divergentes do consenso. Alteraes fora das caixas so menos importantes, desde que no diminuam a distncia entre elas.

Diagrama representativo de um promotor genrico de E. coli. As caixas -35 e -10 (tambm chamada caixa de Pribnow ou caixa TATA) so muito conservadas entre distintos promotores. Pequenas variaes nestas sequncias podem reduzir drasticamente a afinidade do fator sigma da RNA pol pelo promotor. A base +1 , por conveno, aquela onde se inicia a transcrio. A RNA pol, uma vez acoplada ao promotor, ocupa cerca de 5 voltas do DNA. Para reforar a idia do que seja o consenso de uma sequncia, imagine a palavra PRESIDENTE. Escrita desta forma consensual (ou seja, aceita como correta por todos os alfabetizados da lngua portuguesa), seria sempre associada ao conceito Presidente. Entretanto, se trocssemos alguma letra, por exemplo, o S por Z, a grafia errnea PREZIDENTE no faria com que o sentido se perdesse, ao menos na maior parte dos casos (um purista poderia argumentar que o redator no queria dizer Presidente). Se alterssemos a grafia de forma mais drstica, por exemplo, para PRESIDEMTI, poderamos, ao menos em alguns casos, reconhecer a idia presidente na palavra. Podemos afirmar que as alteraes discutidas enfraquecem (ou corrompem) progressivamente o contedo informacional da palavra. Entretanto, basta uma pequena mudana (do S para V), e a grafia PREVIDENTE perderia completamente su associao com o conceito Presidente. Da mesma forma, no caso dos promotores bacterianos, a troca de algumas bases nas caixas de consenso pode enfraquecer o promotor, fazendo com que a afinidade do fator s por ele seja consideravelmente reduzida. Tambm no caso dos promotores, a troca de certas bases por outras elimina completamente a funo promotora da estrutura. Assim, algumas das bases so 100% conservadas, dentro das duas caixas de consenso. Embora se tenha mais liberdade em alterar a sequncia da regio promotora fora das caixas de consenso, no podemos retirar nem acrescentar bases entre as caixas, porque a distncia

entre elas (aproximadamente duas voltas de DNA ou 20 pares de bases) deve ser mantida. Chegamos, ento, a um importante conceito na biologia molecular: distncia tambm informao. O fator s deve reconhecer as duas caixas de consenso (primeiro a TATA e depois a -35) e para tal elas devem estar a uma determinada distncia entre si. Uma reduo desta distncia (ou um aumento) seria equivalente a um alargamento ou estreitamento de um par de trilhos de trem: os vages no poderiam mais caminhar sobre eles, porque a distncia entre as rodas (os stios de reconhecimento das caixas de consenso no fator s) fixa, determinada pela estrutura do eixo de rodas (ou da molcula, no caso do s). Este tipo de arranjo particular da estrutura do promotor permite que, com apenas um par de 6 bases (cada caixa consenso tem em geral uma dzia de bases) um promotor seja determinado com imensa preciso. O que queremos dizer com isto? Podemos formular a questo de outra forma: qual a probabilidade de uma sequncia de 6 bases ocorrer ao acaso no DNA? Para cada base a probabilidade de ser um T, digamos, 1/4, pois podemos ter T, A, G ou C. O mesmo se aplica para as demais bases da sequncia, portanto, a probabilidade de se ter a sequncia TAATTA, por exemplo, ao acaso, 1/4x1/4x1/4x1/4x1/4x1/4= (1/4)6 ou, aproximadamente, 1/4000. No uma probabilidade muito pequena, considerando que h de 2 a 10 milhes de bases num genoma procarioto. Mas, se considerarmos que h uma segunda caixa, a probabilidade conjunta das duas terem as sequncias esperadas (1/4)6x(1/4)6 = (1/4)12 ou, aproximadamente, 1/16 milhes. Neste caso, o encontro de uma tal sequncia no pode ser fortuito! Alm disso, a distncia entre elas deve ser de aproximadamente 20 bases, e a caixa TATA deve estar abaixo (3') da caixa -35. Estas duas outras restries fazem com que um par de caixas com estas caractersticas seja, fatalmente, um promotor. Finalmente, podemos agora claramente perceber que a Natureza desenvolveu um sistema extremamente preciso para determinar o incio da transcrio, dando-lhe, contudo, flexibilidade para criar promotores fracos (para genes cuja expresso no deva ser muito grande) e promotores fortes (para genes cujo produto seja necessrio em grandes quantidades). A Natureza tambm usa o recurso de troca de fatores s para orquestrar o silenciamento e a ativao de grupos de genes. Um exemplo disso a troca do fator s70, que a sub-unidade normalmente empregada pela E. coli a 37oC, pelo fator s28, aps um choque trmico (elevao da temperatura de cultivo para 42oC ou mais). Quando a bactria submetida a um choque trmico, a partir de um promotor reconhecido pelo fator sigma normal (o s70 ), o mRNA para uma nova protena, o fator s28, sintetizado. medida em que aumenta a concentrao deste novo fator no citosol bacteriano, ele vai substituindo o velho sigma, pois tem maior afinidade pelo ncleo enzimtico da RNA polimerase. Em pouco tempo todas as RNA polimerases tm este novo sigma associado a elas e s reconhecem promotores de choque trmico, que comandam a sntese de mRNAs para as cahamadas HSPs ou protenas de choque trmico. O promotor de choque trmico tambm tem duas caixas de consenso, mas as sequncias so um pouco diferentes das de um promotor normal, e mais distantes entre si. A substituio por competio do fator s normal por um fator s viral uma das estratgias adotadas por vrus bacterianos para controlar a maquinria biossinttica da clula hospedeira.

A substituio sequencial de fatores s por microrganismos que formam cistos ou esporos tambm uma forma elegante de orquestrar a ativao sequencial de muitos genes. Uma vez iniciada a transcrio, o fator sigma se separa das demais subunidades, que seguem na tarefa de polimerizar o novo RNA, at que alcancem um trecho no DNA que sinaliza o fim da transcrio. Como se d esta sinalizao? Em princpio somos tentados a imaginar um sistema semelhante ao do promotor: a polimerase reconheceria uma regio terminadora e se desacoplaria do DNA. Entretanto, no isto que ocorre: de fato, h uma regio terminadora, mas a RNA polimerase a transcreve em RNA e este transcrito que, formando uma estrutura muito especial chamada grampo de terminao, sinaliza RNA pol que ela deve parar a sntese de RNA. A anlise de muitas dezenas de regies terminadoras mostrou que sua sequncia apresenta caractersticas comuns, que podem ser resumidas da seguinte forma: na fita de DNA que est servindo de molde para a sntese do RNA surge uma sequncia com cerca de 8 bases que, aps um espaador de tamanho varivel (4 a 15 bases, em geral), seguida de outra sequncia complementar a ela, porm em sentido contrrio; logo aps esta regio simtrica h uma sequncia longa de Timinas (um poliT), na fita 5-3. Quando a polimerase transcreve esta regio, o RNA formado vai tender a parear as duas regies homlogas, restando uma cauda poliU. Esta estrutura, conhecida como grampo de terminao, sinaliza para a polimerase que ela deve terminar a sntese de RNA.

Sinais de incio e trmino da sntese de RNA pela RNA polimerase bacteriana. O sinal de incio o promotor, reconhecido pelo fator sigma. O sinal de trmino reconhecido a posteriori (isto , pela estrutura formada no RNA), e tem, no DNA, uma simetria didica, seguida de um poli-T.

Atravs destes dois sistemas a bactria determina onde comea e onde termina a sntese de um RNA, da mesma forma que sabemos onde se inicia e onde termina um pargrafo num texto qualquer. O que determina que pargrafo deve ser lido, e quantas vezes deveremos repetir a leitura assunto do tem sobre controle da expresso gnica. Nos eucariotos os promotores so muitas vezes bem mais complexos do que esboado aqui para E. coli. comum que somente a caixa TATA seja identificada. Sequncias auxiliares, que comandam a expresso, podem estar prximas posio +1, mas tambm podem estar distantes centenas ou mesmo milhares de pares de bases. Estas sequncias, conhecidas como "enhancers" ou estimuladores, so raramente encontrados em procariotos. O controle da transcrio em eucariotos um assunto ainda em franco desenvolvimento, mas j est claro que h enormes diferenas nos sistemas de controle. Mesmo em procariotos pode haver um sistema semelhante ao ativador, como mostrado na figura abaixo, mas muito menos comum que nos eucariotos.

(A) Ativao gnica distncia: NtrC uma protena reguladora de gene bacteriana e atua como um enhancer. A ativao requer mudana conformacional do DNA e a hidrlise de ATP. Embora rara em procariotos, esta forma de ativao a regra em eucariotos. (B) Agrupamento dos fatores de transcrio (TF) gerais necessrios ao incio da transcrio de um gene eucarioto pela RNA polimerase II. III.b A traduo Afinal, qual o destino dos RNAs na bactria? A verdade que a vida mdia de um mRNA bacteriano muito curta, raramente ultrapassando 60 segundos. Por que? Temos que ter em mente que a vida" de uma E. coli dura meia hora. Neste intervalo ela passa por profundas transformaes metablicas. Por isso, um mRNA s necessrio por breves instantes, sendo em seguida descartado. Em eucariotos, contudo, os mRNA podem ter vida mdia muito mais longa. Os demais RNAs tambm tem uma vida mdia curta, porm bem maior que a dos mRNA pois so necessrios de uma forma mais homognea ao longo do ciclo de vida da bactria. O

turn over (substituio de uma molcula por outra mais nova) um fenmeno geral e est relacionado com a instabilidade termodinmica de qualquer estrutura a nvel molecular. No caso dos mRNA de procariotos, a sua degradao controlada por um processo engenhoso. A transcrio e a traduo esto de tal forma acopladas que, imediatamente aps a sntese de um pequeno trecho de mRNA, os ribossomos j se ligam a este RNA nascente, protegendo-o da degradao pelas RNases bacterianas. O acoplamento da transcrio com a traduo uma caracterstica dos procariotos. Nos eucariotos o transcrito primrio do DNA que dar origem a um mRNA feito no ncleo, enquanto o mRNA e traduzido no citoplasma (recentemente um grupo de pesquisadores mostrou que pode haver traduo no ncleo! veja Iborra et al., Science 293:1139, 2001). A figura a seguir mostra o acoplamento da transcrio e da traduo.

Representao esquemtica do acoplamento entre a transcrio e a traduo em procariotos. O processo de traduo se inicia pela ligao da sub-unidade menor do ribossoma a um stio (sequncia) especfica no mRNA chamado RBS (ribosome binding site). Esta ligao mediada, provavelmente, pelo pareamento de uma sequncia do rRNA 16 S (que faz parte da composio da sub-unidade leve) com a sequncia de Shine-Delgarno (ou RBS). sub-unidade menor acopla-se, ento, o primeiro tRNA (sempre para formil-metionina, em E. coli), e o conjunto desliza pelo mRNA at encontrar o cdon AUG (identificado pelo anticdon correspondente no tRNA). Mais uma vez, necessrio um ajuste preciso da posio de incio da leitura do mRNA pelo ribossoma. Para cada mRNA existem potencialmente trs diferentes quadros de leitura (j que as bases so lidas em trincas), porm s um quadro de leitura correto. Pode parecer estranho que uma sub-unidade aberta (sem o acoplamento prvio da outra), junto com um tRNA para formil-metionina, seja necessria para encontrar o cdon de incio da sntese proteica. Mas, se ponderarmos sobre a questo, veremos que o tRNA sozinho no poderia se ligar ao cdon de iniciao, pois ele apenas reconhece um cdon AUG (ou GUG) e desta forma se ligaria a qualquer uma destas trincas, em qualquer quadro de leitura, ao longo do mRNA. A sub-unidade leve, por sua vez, no tem como reconhecer o cdon AUG, mas "sabe" onde a sequncia RBS e determina, assim, que a primeira trinca AUG abaixo de seu

stio de ligao ser o incio da sntese protica. Ento, fica claro que a associao das duas molculas, tRNA e sub-unidade leve do ribossoma, imprescindvel. Ao conjunto sub-unidade menor/ tRNA, j na posio exata para incio da sntese proteica, ligase, ento, a sub-unidade maior, completando o ribossoma. O ribossoma tem formada, assim, uma cavidade P ( esquerda, no desenho), onde est o tRNA com a formil-metionina, e uma cavidade A, ainda vazia, a sua direita, aguardando a chegada do prximo tRNA transportando o aminocido correspondente ao cdon apresentado no fundo da cavidade. Quando isto acontece uma reao qumica (ligao peptdica) ocorre entre o primeiro aminocido e o segundo, transferindo desta forma o primeiro para se ligar ao segundo, que permanece pelo seu lado ligado ao seu tRNA. O primeiro tRNA, agora ocupando a cavidade P do ribossomo, est descarregado. O ribossomo ento desloca-se no mesmo sentido que j vinha fazendo, descartando assim o tRNA vazio (provisoriamente alojado numa cavidade E, que significa exit), posicionando o segundo tRNA com os dois aminocidos a ele aderidos na cavidade P e liberando a cavidade A para receber um novo tRNA carregado. O processo se repete at que um sinal de terminao seja encontrado. Neste caso o ribossoma espera no um tRNA mas uma protena conhecida como fator de terminao, que se liga no stio A ao cdon de terminao, desestabiliza o ribossomo e interrompe irreversivelmente a sntese. H vrios fatores proteicos chamados fatores de iniciao e fatores de alongamento que colaboram neste processo. Como as tcnicas em gentica molecular raramente lanam mo da sntese proteica in vitro, no nos deteremos mais neste assunto. O leitor convidado a consultar os livros-texto sugeridos ou qualquer outro bom livro que trate do assunto a nvel molecular (Bioqumica, Lehninger; p. ex.). A figura a seguir ilustra o mecanismo de sntese proteica em procariotos.

Neste modelo do processo de traduo h um stio E ( empty = vazio), onde se aloja o tRNA descarregado antes de sair do ribossomo.Esto representados os diversos fatores que participam do processo de traduo, alm do ribossoma e dos tRNAs. Para uma descrio do processo, cf. texto acima.

Novamente, em eucariotos a complexidade do processo de transcrio/ traduo consideravelmente maior (para uma abordagem da traduo em eucariotos, escrita para pgina, clique aqui).. Isto se d por duas razes: primeiro, os genes eucariotos costumam ser interrompidos por sequncias que no codificam aminocidos. Estas sequncias, chamadas introns, e as sequncias que sero empregadas pelo ribossoma (ou para formar tRNA ou rRNA) so transcritas para um longo RNA, chamado transcrito primrio, ou ainda RNA heterogneo nuclear. Deste transcrito primrio tm que ser retirados os introns, o que feito por um processo enzimtico chamado splicing (l-se splicin). Alm disso o pr-mRNA ainda sofre outras alteraes, como a adio de uma cauda poliA na extremidade 3 e de um cap" 7metil-guanosina na extremidade 5 antes de se tornar um mRNA e poder passar ao citoplasma, onde ser traduzido.

O splicing de RNA catalizado pelo spliceossomo, formado pelas snRNP (pequenas ribonucleoproteinas nucleares) U1, U2, U5 e U4/U6, alm de outros componentes, no representados na figura. Na primeira etapa do slicing o nucleotdeo ramificado A, prximo ao stio de splicing 3, ataca o stio 5 de splicing e corta o RNA. A extremidade 5 resultante fica ligada covalentemente ao A. Na segunda etapa, a extremidade 3 do exon da esquerda, deixada livre na etapa anterior, ataca o stio de splicing 3 do intron, clivando o lariat (lao) e unindo os dois exons. O mecanismo de splicing mostrado acima essencialmente igual para todos os mRNAs eucariotos que contenham um intron. O splicing de tRNAs e de rRNAs pode ser feito sem a participao do spliceossomo. De fato, o prprio RNA que se auto processa, numa reao conhecida como self splicing. Esta atividade enzimtica do RNA contraria a antiga assertiva da bioqumica que diz toda enzima uma protena. Em concluso para esta aula: devido a estas etapas intermedirias no processamento do RNA, desde hnRNA (ou transcrito primrio) at mRNA, possvel observar-se em eucariotos sistemas de controle da expresso gnica muito diversos do que se v em procariotos.

Processamento do RNA - transcrito primrio do DNA - para gerao do mRNA No genoma humano os introns iniciam sempre com GU e terminam em AG. H um nmero maior de bases relativamente conservadas nas duas extremidades e elas participam no reconhecimento do intron pelo spliceossomo ou encadeassomo, complexo enzimtico responsvel pela retirada dos introns e emenda dos exons adjacentes (mais adiante vamos ver que os exons devem ser sinalizados para o sistema). A figura abaixo mostra esquematicamente a retirada os introns, assim como duas outras modificaes importantes do transcrito primrio de RNA: o capeamento e o caudeamento. No capeamento, uma base diferente das demais que compem o RNA, a 7-metil-guanosina, adicionada na extremidade 5' do mRNA, com sua hidroxila da posio 3' voltada para fora do RNA. Na outra extremidade, a partir de um sinal de poli-adenilao (uma sequncia no mRNA), uma enzima especfica cliva o RNA, descarta a poro final e adiciona extremidade 3' um nmero varivel de adeninas (de 15 a 300). Com isto, o trecho que vai deste sinal at o fim do mRNA fica perdido. este fenmeno dificulta imensamente o estudo do mecanismo de terminao da transcrio em eucariotos, que ainda no bem compreendido.

Figura 4: Diagrama do processamento do transcrito primrio at o mRNA maduro. Os introns formam laos (denominados lariats) na presena do splicesossomo (1), sendo retirados. Ao mesmo tempo, a parte final (3') do RNA clivada (2) e uma cauda poli-A adicionada. Por fim, uma resduo de 7-metil-guanosina adicionado extremidade 5' do RNA, criando o bon, ou cap (3). O mRNA pronto passa pelo poro nuclear para o citoplasma, onde ser traduzido. Por este poro passam tambm as duas sub-unidades do ribossomo (separadamente). Dependendo dos sinais que o mRNA tiver nas regies 5'-UTR e 3'-UTR, ele poder ser exportado para uma organela (mitocndria ou cloroplasto), transportado para determinadas regies da clula (botes sinpticos, por exemplo) ou ainda formar parte do pool de mRNAs no traduzidos. As duas regies UTR tm, na verdade, um importante papel na regulao ps-transcricional da expresso gnica, mas este assunto no ser desenvolvido aqui. basta no momento sabermos que muitos eucariotos empregam este mecanismo com frequncia e, em alguns casos, quase exclusivamente (como o caso da Leishmania e do Trypanosoma).

Diversidade da estrutura do gene Embora o diagrama apresentado para a estrutura de um gene eucarioto seja correto, os genes podem diferir muito em nmero de exons e no seu tamanho final. Deve-se ter em mente inicialmente, que o tamanho mdio de uma protena humana de 450 aminocidos. Protenas muito pequenas costumam conter apenas os domnios funcionais indispensveis para sua funo. Seus genes so, tambm, geralmente pequenos. o caso de todas as protenas mostradas no quadro dos genes com menos de 10 kb. Observe tambm que no quadro h o gene para um tRNA. O conceito de gene que codifica um RNA, e no uma protena, mais uma concesso ao nome "gene", que est se tornando um conceito cada vez mais amplo e, lamentavelmente, cada vez mais vago. Ainda com a ateno sobre o quadro dos genes pequenos, fica claro que, medida que os introns aparecem nas suas sequncias, eles aumentam de tamanho. Assim, a globina e a molcula de HLA Classe I no so maiores que o interferon a, mas seus genes so 2 e 4 vezes maiores, respectivamente. Se nos movermos para os quadros seguintes, vamos verificar um aumento de tamanho de genes de 1 e 2 ordens de grandeza, sem que as protenas que eles codifiquem sejam significativamente maiores que aquelas do quadro 1: 95% das protenas humanas tm entre 150 e 800 aminoccidos, e aquelas mostradas nos trs quadros da figura acima, exceto pela apolipoprotena (mais de 4000 aa) e pela distrofina (427 kD, pouco mais de 4000 aa e um mRNA de aprox. 17.000 bases) , no so maiores que isto. A concluso a que somos forados : os introns so em geral muito maiores que os exons. Isto pode ser comprovado pela porcentagem relativa de introns nos genes dos quadros. No caso extremo do gene da distrofina, com cerca de 80 exons espalhados por quase 2,5 milhes de pares de bases, das quais perto de 16.000 apenas codificam aminocidos, os introns so verdadeiramente imensos. Neste caso, e em boa parte dos demais genes, os exons ficam imersos num conjunto de grandes introns. Por isso a Natureza desenvolveu um sofisticado sistema de reconhecimento de exons no processo de splicing. Embora seja comum lermos em livros texto que o spliceossomo reconhece sequncias no incio e no fim dos introns, o que tambm foi dito no item anterior nesta aula, isto apenas parte do sistema de reconhecimento da regio a ser encadeada. indispensvel que as fronteiras entre exons e introns seja bem delimitadas e que haja mesmo uma sinalizao para a presena do exon, para que ele no fique "perdido" num "mar" de introns. A figura abaixo mostra o atual estado de conhecimento deste sofisticado mecanismo.

Figura 6: Reconhecimento de exons no processo de splicing. Os stios aceptores de splicing GU e AG so reconhecidos pela maquinaria de splicing com base na sua proximidade com os

exons. Os exons contm sequncias chamadas ativadores exnicos de splicing (ESE), que so stios de ligao para as protenas SR. Quando elas se ligam a estes stios no RNA, recrutam as snRNP U1 (pequenas ribonucleoprotenas nucleares) para o stio aceptor de splicing 5', localizado mais abaixo do SR, e recrutam o fator de splicing U2AF, tanto a sub-unidade de 65 kD como a de 35 kD, para as repeties de pirimidina YYYY e para o dinucleotdeo AG do stio aceptor de splicing 3', respectivamente. Assim, as protenas SR recrutam fatores de splicing para formar um complexo de reconhecimento atravs do exon (cross exon). As protenas SR tambm funcionam no reconhecimento atravs do intros (cross intron), facilitando as interaes entre a snRNP U1, ligada ao GU, e a snRNP U2, ligada sequncia de ramificao. Splicing alternativo O splicing alternativo tem aparecido nos ltimos anos como o mecanismo que pode explicar a enorme diferena entre o tamanho modesto do conjunto de genes humano e a elevada complexidade do proteoma. Pelo menos um tero, e provavelmente a maioria, dos genes humanos so alternativamente encadeados, e alguns genes podem gerar milhares de isoformas de protenas por eventos complexos de splicing alternativo. A anlise do transcriptoma (conjunto de mRNAs do ser vivo ou da clula em estudo) depender do desenvolvimento de novas tecnologias para atacar a complexidade criada pelo splicing alternativo. Na pgina satlite disponibilizada aqui vamos rever apenas as vrias possibilidades de splicing alternativo e examinar alguns exemplos elucidativos. Formas de cortar e emendar, e que sequncias podem estar envolvidas no processo A unio de exons, sejam eles codificantes de aminocidos ou regies controladoras (aqui, mais uma vez, fica claro que exon no um trecho de informao gentica que ser convertido em protena, mas apenas aquilo que vai permanecer no mRNA maduro), pode ser feita de forma alternativa pela clula, dependendo de um conjunto grande de fatores: sexo do organismo, estado de desenvolvimento, tecido, ambiente, etc. Adicionalmente, h muitas formas de recombinar os exons, desde que mantida a ordem em que aparecem na sequncia de DNA. A figura abaixo vai guiar a discusso sobre o tema.

Figura 1: Variedade de eventos bsicos de splicing alternativo. Em amarelo esto os exons que sempre permanecem na sequncia final do mRNA; em laranja os exons que podem ser retirados (e, neste caso, so considerados introns pela maquinaria de splicing) ou no; e em linha preta os introns. Os padres de splicing esto indicados pelas linhas tracejadas. Um dos mecanismos alternativos possveis a exciso de um exon interno sequncia do gene, como mostrado em (a). Neste caso, ele se comporta como um intron, e a protena resultante ser mais curta. Outra forma comum a presena de stios 5' (mostrado em b) ou 3' (mostrado em c) alternativos de splicing, que levam incluso ou no de um exon. Empregando diferentes stios 5' aceptores de splicing possvel tambm trocar o promotor de um gene (d). Analogamente, empregando stios alternativos 3'de splicing podemos mudar o stio de poliadenilao do mensageiro final (e). Exons internos (chamdos cassetes) podem ser includos ou no na sequncia final do mRNA, independente dos demais exons (f). Alternativamente, exons mutuamente excludentes podem permutar de lugar na forma madura mo mRNA (g) Abaixo esto 3 exemplos de gerao de diversidade de mRNA a partir do mesmo conjunto de genes.

Figura 2: Gerao de diversidade de transcritos a partir de combinaes de blocos de encadeamento em unidades de transcrio complexos (combinatorial output) O gene WT1 (Wilms tumor 1) (a) gera at 24 isoformas pelo splicing alternativo do exon cassete 5, pelo uso de stios aceptores 5' alternativos no exon 9, pelo uso de 3 cdons de iniciao alternativos no exon 1 (2 AUG e um CUG) e ainda pela edio de uma uridina para citosina (um evento raro em eucariotos superiores) no exon 6. O gene CD44 (b) contm 21 exon, incluindo um conjunto central de exons variantes, mostrados em laranja e numerados de v1 a v10. Para simplificar a imagem, apenas os splicings que incluem ou excluem os exons variantes esto indicados. Exon v9a (em amarelo) contm um cdon de terminao da traduo e o produto gnico feito quando a sequncia final do mensageiro o contm uma forma solvel do CD44 (normalmente uma protena de membrana), porque no tem o domnio transmembrana codificado pelo exon 18. Os exons 5 e

v4 so alternativamente encadeados atravs de stios internos 5' ou 3' aceptores, respectivamente (caixas em roxo). J o splicing aletrnativo dos exons 19 e 20 d origem a diferentes caudas proticas citoplasmticas na estrutura final do CD44. Todas as combinaes possveis gerariam 1024 isoformas! Adicionalmente, as isoformas tambm podem ser diferencialmente glicosiladas, aumentando ainda mais a diversidade final de produtos gnicos. O gene Dscam de Drosophila (o gene ortlogo ao Down's syndrome cell adhesion molecule) contm 4 conjuntos de exons mutuamente excludentes. Duas verses do exon 17 codificam domnios transmembrana alternativos, enquanto os exons 4, 6 e 9, que codificam os domnios Ig-like 2,3 e 7, so representados por conjuntos de 12, 48 e 33 variantes, respectivamente. Os mRNA finais s vo conter um exon variante de cada um dos 4 conjunto de exons, o que pode gerar at 38.016 isoformas!!! Por simplicidade, apenas uma das formas possveis de splicing est mostrada. No h ainda uma explicao satisfatria de como a Natureza escolhe entre esta enorme variedade de formas finais de mRNA aparentemente disponveis. Promotores e ativadores Na figura acima um outro aspecto importante da estrutura geral de um gene eucarioto est representado: a regio promotora. Observe que ela difere entre os 3 genes apresentados: os dois primeiros so genes controlados durante a vida da clula a presentam ao menos uma caixa TATA. As regies, ou caixas, TATA e CAT, so stios ligadores da RNA polimerase 2 eucariota (que transcreve mRNAs), e so controladas por um complexo sistema de fatores de transcrio e regies ativadoras (enhancers) da expresso gnica. J o terceiro gene constitutivamente expresso (no controlado) e tem apenas regies ricas em G e C, chamadas caixas GC. Um promotor eucarioto tpico est mostrado abaixo (para um gene do vrus do herpes simplex, o que pode parecer estranho: mas lembre-se que os genes do vrus tm que ser transcritos e traduzidos pela maquinaria da clula hospedeira, no caso um eucarioto). As regies controladoras podem ocupar milhares de bases, pois os ativadores e outras sequncias controladores podem estar muito distantes do stio de iniciao da sntese de RNA.

Figura 8: Um promotor eucarioto tpico, neste caso o promotor do gene da timidina quinase do virus do herpes simplex. Ele contm 3 sequncias acima da caixa TATA que so necessrias para uma transcrio eficiente: a caixa CAT (ou CCAAT) e duas caixas GC, com a sequncia de consenso GGGCGG. Observe a semelhana estrutural entre este promotor e o promotor bacteriano, apresentado na aula 3 da pgina Biolmol. As duas caixas TATA e CAT, correspondem s caixas TATA e TTGACA do procarioto. No caso deste promotor viral, h tambm duas sequncias ricas em G e C, com o consenso GGGCGG, que reforam a funo promotora deste stio.

Figura 9: O promotor do virus SV40 (simian virus 40, de uma leucemia de macacos) para os genes de expresso precoce contm uma caixa TATA e seis caixas GC arranjadas em trs conjuntos de sequncias repetidas. Adicionalmente, a transcrio necessita ainda, para ser eficiente, de um enhancer acima da regio promotora, e que consiste em duas repeties de 72 pb cada. O mecanismo pelo qual um ativador auxilia na transcrio parece ser dependente de um dobramento do DNA e da aproximao da sequncia do promotor com a caixa TATA. Por isso os atenuadores podem ser muito distantes do incio do stio de transcrio (por exemplo, 50 kb) e podem estar orientados no mesmo sentido da transcrio ou, muitas vezes, em sentido oposto. A figura abaixo mostra esquematicamente este processo.

Figura 10. Loop de DNA. Os fatores de transcrio ligados a ativadores distantes so capazes de interagir com fatores de transcrio mais gerais que esto ligados ao promotor, porque o segmento de DNA entre os dois stios pode formar uma ala (loop). Assim, no parece haver diferena fundamental entre a ao de fatores de transcrio ligados logo acima do promotor ou a ativadores distantes. Genes cpia nica, famlias e superfamlias de genes. Nos genomas eucariotos em geral os genes tm mais de uma cpia, mesmo considerando apenas o complemento haplide. As duplicaes de genes ocorrem por vrios mecanismos possveis e a seleo natural aos poucos vai fazendo com que estas cpias progressivamente se diferenciem entre si. Muitos genes que hoje tm funes distintas provavelmente um dia surgiram por duplicao. Genes de igual funo e com similaridade de sequncia num mesmo organismo so chamados parlogos, reservando-se o nome ortlogo para o gene com a mesma funo e similar a outro de outra espcie de organismo. Nos dois casos, desde que a funo biolgica dos dois genes seja a mesma (ou prxima), eles so chamados de homlogos. Assim, muitos genes no genoma humano pertencem a famlias, reconhecidos pela similaridade da sequncia de nucleotdeos ou, no mais das vezes, de aminocidos. Os genes cpia nica so raros. Um exemplo de famlia gnica a famlia das globinas, mostrada na figura abaixo.

Figura 11: Famlia das globinas, distribuda em dois cromossomos. Alm dos genes funcionais para a-globina e b-globina, os cromossomos 11 e 16 mostram genes no funcionais, conhecidos como pseudogenes. Os pseudogenes com introns foram gerados possivelmente por duplicao gnica e posterior mutao, eliminado o cdon de iniciao ou algum elemento regulador importante, ou ainda criando um cdon de terminao precoce. Quando os pseudogenes no tm introns eles so chamados pseudogenes processados, e podem ter sido originados de retrotransposio a partir de mensageiros do prprio organismo, A comparao das sequncias das diversas cpias permite inferir que, para os genes da globina, deve ter havido um primeiro evento de duplicao h quase 500 milhes de anos. Portanto, um fenmeno muito antigo (lembre-se que a Exploso Cambriana aconteceu a 580 milhes de anos). Os genes de um mesmo grupo, por exemplo, no cromossoma 16, so mais semelhantes entre si do que em relao aos membros do grupo no cromossoma 11. Cada gene expresso numa diferente fase da vida do indivduo. Quatro so exclusivamente fetais. dois exclusivamente embrinicos, dois exclusivamente expressos no indivduo adulto e dois expressos desde o feto at o adulto (veja figura abaixo) interessante notar que a estrutura de introns e exons dos genes da globina est preservada para todas as cpias funcionais. Entretanto, observa-se, como era de se esperar pela presso da seleo natural, muito mais conservao entre sequncias de exons do que de introns ente os mesmos genes. Sntese protica ou Traduo Os procariotos e eucariotos usam diferentes estratgias para especificar o stio de incio da sntese protica num mRNA. Nas bactrias, como comentado anteriormente nesta aula, uma sequncia conservada de 6 nucleotdeos, conhecida como sequncia de Shine Delgarno, ou stio ligador de ribossomo (RBS), ou stio de reconhecimento de ribossomo (rrs), sempre encontrada umas poucas bases acima (5') do cdon de iniciao. Esta sequncia pode parear com algumas bases do rRNA 16S da sub-unidade menor do ribossomo procarioto. A interao entre os dois RNAs fundamental para a eficincia do incio da traduo e ainda oferece uma oportunidade para regular a traduo, pro exemplo, atravs de protenas que se ligam ao RBS, bloqueando-o. Os mRNAs eucariotos, entretanto, no tm a sequncia de Shine Delgarno, nem nada semelhante. Ao contrrio, a deciso pelo uso de um determinado codon AUG fica dependente

de sua proximidade com o cap da extremidade 5' do mRNA. Os nucleotdeos prximos ao AUG funcional tambm tm influncia e uma sequncia de consenso em mamferos j foi identificada (sequncia Kozak - criando um ambinete 5'-ACCAUGG-3' para o cdon de iniciao; a base A inicial desta sequncia parece ser muito importante para o incio da sntese protica). Se o ribossomo no identificar o primeiro AUG na sequncia, ele poder seguir at o segundo ou o terceiro. Isto produz protenas diferentes a partir de um nico transcrito. em geral com o mesmo quadro de leitura (ver mais adiante o significado desta expresso), mas sem os primeiros aminocidos. Apenas em alguns casos especficos (mRNA virais sem cap ou, muito mais raramente, mRNAs do prprio organismo) a traduo comea mais internamente no mRNA, num mecanismo semelhante ao procarioto. O stio de reconhecimento chama-se IRES (para internal ribosome entry site). O ribossomo se liga a e desliza at o AUG mais prximo, quando se inicia a sntese protica (veja figura abaixo). Os detalhes deste mecanismo no so conhecidos.

Figura 1: A sntese de protena nos eucariotos poda se iniciar na extremidade 5' do mRNA (em geral) ou em stios de acesso interno para o ribossoma (IRES = internal ribosome entry sites)(muito raramente). No primeiro caso o complexo de pre-iniciao 43 S (formado pela sub-unidade leve do ribossoma e vrios fatores de iniciao) liga-se ao cap 5'(m7G) e ento desliza pelo mRNA at que encontre um cdon AUG aceitvel, geralmente cerca de 100 bases mais abaixo (3'). No segundo caso, o complexo se liga a um IRES, muito mais abaixo da extremidade 5', e desliza pelo mRNA at encontrar um AUG apropriado. A iniciao da traduo mais comum est representada pela figura a seguir. Os fatores de iniciao eucariotos eIF-1, eIF-1A e eIF-3 ligam-se sub-unidade ribossomal 40S e o eIF-2 (em complexo com o GTP) se associa ao metionil tRNA iniciador. O mRNA reconhecido e levado at o ribossoma pelo grupo de fatores eIF-4, O cap 5' reconhecido pelo eIF-4E. Outro fator, eIF-4G,liga-se tanto a eIF-4E quanto a uma protena associada com a cauda poli-A na extremidade 3' do mRNA ( a protena PABP). Assim, os fatores de iniciao eucariotos reconhecem tanto as extremidades 5' como as 3 'do mRNA, o que justifica o efeito estimulatrio da poli-adenilao na transcrio. Aps outras interaes entre os fatores de iniciao, a subunidade 40S ribossomal, em associao com o metionil tRNA e vrios eIFs, percorre o mRNA em busca do cdon AUGde iniciao. Quando ele alcanado, o eIF-5 provoca a hidrlise do GTP ligado ao eIF-2. Os eIFs so ento liberados e a sub-unidade 60S subunit pode se ligar 40 S para formar o complexo 80S inicial da traduo eucariota.

Figura 2: Iniciao da traduo em eucariotos (ver texto acima para detalhamento) O mecanismo de alongamento da cadeia polipeptdica semelhante ao dos procariotos. O ribossomo tem trs cavidades para ligao do tRNA, designadas P (peptidil), A (aminoacil) e E (exit). O metionil-tRNA fica ligado cavidade P quando o ribossomo se fecha. Assim, o prximo aminoacil-tRNA vai parear ao segundo cdon da sequncia do mRNA entrando na cavidade A. Os aminoacil-tRNA so acompanhados por um fator de alongamento (EF-Tu em procariotos e eEF-1a em eucariotos), e traz consigo o GTP. Quando o tRNA certo encontra o cdon no mRNA, o GTP hidrolisado e o fator de alongamento liberado. Uma vez que o eEF liberado, uma ligao peptdica feita entre os dois tRNAs, catalizada pela sub-unidade maior do ribossoma. O reesultado a transferncia da metionina (primeiro aa incorpordo) para o aminoacil-tRNA na cavidade A, ficando a cavidade P com o tRNA descarregado. Em seguida h uma translocao na qual o ribossomo move-se 3 bases mais para adiante (3') na sequncia (a determinao de quantas bases o ribossomo ir andar feita pelo anticdon do tRNA na cavidade aminoacil). Este movimento desloca o tRNA vazio para a cavidade E e o tRNA transportando os 2 primeiros aminocidos da cadeia poli-peptdica para a cavidade P. O stio A, uma vez preenchido, vai provocar a sada do tRNA descarregado da

cavidade E. O processo se repete at que um cdon de terminao seja apresentado na cavidade A. O processo descrito est representado na figura a seguir.

Figura 3: estgio de alongamento da cadeia polipeptdica.O procsso, ilustrado para a sntese em procariotos, muito semelhante nos eucariotos. O alongamento da cadeia continua at que um cdon de terminao seja apresentado na cavidade A. No h tRNAs com anticodons complementares aos cdons de terminao. Estes so reconhecidos por fatores de terminao proticos Nos eucariotos um nico fator de terminao reconhece todos os cdons de parada (nos procariotos so dois fatores). Outros fatores esto tambm envolvidos. Aps a interao deles, a fita de mRNA se solta do ribossomo e as duas sub-unidades se separam. Esta etapa est mostrada na figura abaixo.

O Cdigo Gentico As regras pelas quais uma sequncia de nucleotdeo traduzida na sequncia de aminocidos de uma protena, o chamado Cdigo Gentico, comearam a ser decifradas por Nirenberg, no incio da dcada de 60. Trincas de bases formam os cdons, que so reconhecidos pela ala de anticdons da molcula adaptadora conhecida como aminoacil-tRNA. Esta molcula transporta o aminocido para os ribossomos. Como h 4 nucleotdeos, que podem ser repetidos no cdon, h 64 possibilidades de cdon, para 20 aminocidos. Os aminocidos de uso mais frequente tm vrios cdons. esta redundncia faz com que o cdigo gentico seja degenerado. O cdigo altamente conservado entre as espcies, com pequenas excees, mais notveis nas organelas de origem simbitica, como a mitocndria e o cloroplasto. A figura abaixo resume o cdigo gentico.

Figura 5: O Cdigo Gentico. Cada triplete de bases traduzido para um diferente aminocido, de acordo com as regras apresentadas na tabela. Em princpio, toda sequncia de DNA poderia ser lida nos dois sentidos (em fitas diferentes, pois apenas a fita 3'-5' pode servir de molde para a sntese do RNA) e em trs quadros de leitura diferentes, isto , iniciando de uma base qualquer e contando de trs em trs, ou da base seguinte ou ainda da seguinte a ela. Entretanto, via de regra (exceto em vrus), apenas um destes quadros verdadeiro. Para ilustrar este ponto suponha a sequncia abaixo, que deve ser lida de 3 em 3 letras para fazer sentido. TTHAHCAHFTARTHTHEFATCATATETHERATHHRTAEHT Se comearmos da primeira letra teremos TTH AHC AHF TAR THT HEF ATC ATA TET HER ATH HRT AEH T, que no faz sentido em nenhum trecho. Se iniciarmos na segunda letra teremos T THA HCA HFT ART HTH EFA TCA TAT ETH ERA THH RTA EHT, que tambm no faz sentido. Se, entretanto, iniciarmos da terceira base, teremos TT HAH CAH FTA RTH THE FAT CAT ATE THE RAT HHR TAE HT, que faz sentido num trecho especfico. este extamente o caso de um gene lido no quadro de leitura correto. Antes da frase em negrito teramos a regio 5'no traduzida e depois dele a 3' no traduzida. Como no h nenhum tipo de pontuao no DNA, o posicionamento exato do ribossomo, como visto acima, crtico para o sucesso da traduo. Se o cdon AUG falso for usado para iniciar a sntese, uma protena ser ainda assim produzida, mas sem qualquer sentido biolgico. geralmente logo aparece um sinal de terminao da traduo nos quadros de leitura errneos e por isso as protenas abortivas criadas nestes casos costumam ser pequenas. Embora o cdigo gentico seja universal, os diferentes organismos tm preferncias muito distintas pelos cdons redundantes. Assim, um cdon muito usado num mamfero pode ser o mais raramente empregado numa arqueobactria, por exemplo, Este fenmeno conhecido como cdon bias e atrapalha algumas vezes as tentativas de se fazer expressar um gene de um organismo em outro.

Uma viso geral da organizao do genoma humano O genoma humano de foto compreende dois genomas: o nuclear, que responde por 99,995% das sequncias de bases, e o mitocondrial. O reduzido genoma mitocondrial mostra que houve, durante o processo de simbiose e integrao clula, uma transferncia progressiva de genes da mitocndria para o genoma do eucarioto. Agora os poucos genes mitocondriais restantes so transcritos e traduzidos pelos ribossomos mitocondriais. A maior parte das protenas que a mitocndria necessita so produzidas no citoplasma da clula e exportadas para a mitocndria. Para dirigir nossa discusso sobre a organizao do genoma vamos tomar por base o diagrama abaixo.

Figura 14: Organizao do genoma humano. A informao gentica est essencialmente concentrada no genoma nuclear. O nmero de genes para o genoma mitocondrial conhecido, mas para o genoma nuclear apenas estimado. Genes so considerados aqui os segmentos de DNA que so transcritos para dar origem a uma protena ou RNA funcional. Sequncias relacionadas a genes so as regies controladoras 5' e 3' do gene, algumas vezes a vrias kbases de distncia do incio da transcrio ou de seu trmino. DNA codificador apenas aquele que traduzido. Por fragmentos de genes entende-se trechos do DNA que contm restos de genes deixados no genoma ao longo da evoluo. As sequncias no traduzidas, grupadas com os introns, so as regies 3'-UTR e 5'-UTR. Repeties so ditas em tandem quando o final de um motivo seguido imediatamente pelo incio de um motivo idntico, sendo este arranjo repetido muitas vezes (como nos vages de um trem). Repeties agrupadas tm entre si DNA no repetitivo, mas esto fisicamente prximas no genoma.

O genoma mitocondrial O genoma mitocondrial composto de um pequeno DNA circular fita dupla (16,6 kb), densamente povoado de genes. Num pequeno trecho este DNA aparece como fita tripla, pois uma parte de uma das fitas replicada 2 vezes durante a duplicao do genoma. 28 genes so codificados por uma das fitas (dita pesada, e rica em guaninas) e 9 pela outra fita (dita leve). Do total de genes 24 especificam RNAs funcionais: 22 tRNAs mitocondriais e 2 rRNAs mitocondriais. Os 13 genes restantes codificam polipeptdeos que so produzidos pela prpria mitocndria, atravs de seus ribossomas. O cdigo gentico da mitocndria (assim como o dos cloroplastos) difere levemente do cdigo empregado pelos genes nucleares. O genoma nuclear O genoma nuclear humano est dividido entre 24 diferentes tipos de molculas de DNA lineares fita dupla, que formam, junto com as histonas e outras molculas, os cromossomos. Dois destes cromossomos determinam o sexo na espcie e so denominados X e Y. A composio dos cromossomos e sua estrutura geral sero tema de outra aula. Os cromossomos humanos so molculas muito grandes, variando de 50 Mb a 250 Mb, com mdia de 130 Mb, sendo assim cada um deles em mdia 10.000 maiores que o genoma mitocondrial. Para fins de comparao podemos citar que o genoma de uma bactria pode variar de 2,5 Mb a 10 Mb. O genoma de um protozorio costuma ter entre 15 e 50 Mb. Mas o tamanho do cromossomo no guarda uma relao bvia com a complexidade do organismo, tanto por causa das repeties de DNA e regies no codificantes diversas, comuns nos genomas de eucariotos, como pela ploidia (nmero de cpias dos cromossomos no genoma). Nas preparaes citogenticas de cromossomos metafsicos uma banda pode ter perto de 6 Mb de DNA. A proporo de bases no genoma humano de 43% GC (lembre-se que o nmero de bases A deve ser igual ao de T, e de G igual ao de C num DNA fita dupla, mas no precisa haver correlao clara entre o nmero de bases A e G, por exemplo. H organismos mais ricos em G e C, outros muito mais ricos em A e T, e que geralmente so filogeneticamente prximos). Um importante aspecto do estudo da genmica a distribuio do dinucleotdeo CpG (com esta sigla designamos o dinucleotdeo 5'-CG-3', que indica cytosine-phosphate-guanine). Pelas frequncia de G e C no genoma esperava-se uma frequncia do dinucleotdeo em torno de 0,0441. Entretanto, a frequncia observada muito menor. Ocorre que os eucariotos metilam o DNA (para identificar a fita antiga da nova, na replicao e para regular a expresso gnica), e em geral o fazem no dinucleotdeo CpG. Assim, ele se transforma e mCpG. Mas o dinucleotdeo metilado mCpG converte-se ao longo de um tempo evolutivo considervel, em TpG. Por isso a queda da proporo esperada de CpG. Contudo, em vrios trechos do DNA, eles so frequentes. So as chamadas ilhas CpG ou ilhas CG, e tm um importante papel no rearranjo da estrutura da cromatina e no controle de grandes blocos de genes. Por causa dos longos trechos repetidos, frequentes no DNA humano (e de outros eucariotos), a composio mdia de bases tambm pode variar bastante de trecho para trecho do genoma. Nas extremidades, por exemplo, os telmeros adicionados pela telomerase tm uma composio

muito particular, com 50% GC. As regies com muitas repeties tm uma composio relativa de bases suficientemente distinta das reges no repetidas para terem uma densidade de flutuao distinta delas num gradiente de sacarose. Assim por ultracentrifugao de pedaos de DNA possvel separar regies repetidas do restante do DNA. A banda formada, chamada banda satlite, acabou denominando estar regies. Assim, as sequncias satlite ou DNAs satlite nada mais so do que sequncias com muitas repeties de bases, A densidade de distribuio dos genes nos cromossomos muitssimo varivel. As regies telomricas (extremidades dos cromossomos) so deprovidas de genes, assim como vrias outras regies especializadas dos cromossomos, como os centrmeros e grandes regies do cromossomo Y. Por outro lado, as regies sub-telomricas costumam ser ricas em genes. Uma visita ao cromossomo 1, facilitada nesta pgina (ver prximo item) mostra claramente este ponto. O nmero real de gene do genoma humano no conhecido ainda, apesar da sequncia de todo o genoma estar essencialmente completa. A causa deste desconhecimento est na base de nossa compreenso da estrutura de um gene humano. de fato, para a maior parte das sequncias que parecem ser genes, no temos a idia de qual seja a funo. Assim, pode acontecer que estejamos identificando como gene algo que no , em muitos casos. Por outro lado, como no conhecemos com clarez as estruturas de todas as regies promotoras, tambm no temos como afirmar que um determinado segmento de DNA ser transcrito algum dia. Pelas estimativas obtidas por outros sistemas de avaliao de genes (anlise de genes expressos por microarray e pela construo e sequenciamento de bibliotecas de cDNA, alm do uso do sistema ORESTES, desenvolvido pelos pesquisadore do Instituo Ludwig para a Pesquisa sobre o Cancer,de So Paulo), provavelmente no temos mais que 50.000 genes. A densidade de genes seria, assim, perto de um gene a cada 15 kb, se eles fossem homogeneamente distribudos pelos cromossomos, o que definitivamente no o caso. Por isso, h reas onde os genes esto densamente agrupados, e outras relativamente vazias. Aqui se encerra provisoriamente esta aula (mas no esqueam que o item 8 faz parte integrante desta aula!). O final dela (que incluir uma discusso sobre as famlias gnicas e as classes de DNA repetitivo) e a aula seguinte (Ferramentas da Gentica Molecular Humana (Cap. 4 do Thompson & Thompson) sero cobrados na prova do dia 22 de maio. O controle da expresso gnica Como dissemos anteriormente, as necessidades de um microrganismo como a bactria Escherichia coli so muito variadas e mudam constantemente. Para cada situao determinada a bactria precisa lanar mo de uma bateria de enzimas e protenas, que no estavam disponveis momentos antes e que provavelmente no sero mais necessrias minutos depois. Como consegue o organismo ligar e desligar genes, que comandaro a sntese de mRNAs, que daro origem por fim s protenas necessrias? A este processo chamamos controle da expresso gnica. O operon lac

H muitos diferentes mecanismos de controle da expresso gnica, mesmo se considerarmos apenas a bactria E. coli. Por isso procuraremos nos concentrar na anlise de um deles, que tem muita aplicao em engenharia gentica. Este mecanismo foi elucidado pelos franceses Franois Jacob e Jacques Monod, que receberam por isso o Prmio Nobel em Medicina, em 1965, juntamente com Andre Lwoff (as Palestras Nobel esto disponveis no site de downloads). Eles estudaram os genes que codificam as enzimas responsveis pela degradao da lactose em E. coli. O modelo que discutimos a seguir j incorpora as modificaes subseqentes, fruto das contribuies de grupos de pesquisa no mundo todo, e exemplifica de forma didtica um mecanismo que comum a muitos outros microrganismos e observado na regulao de muitos genes. Atravs de experimentos em gentica clssica (empregando mutantes e plasmdeos que transportavam genes e stios reguladores para a bactria hospedeira, criando assim diplides parciais) Jacob e Monod criaram um modelo no qual o stio promotor, associado a um outro stio chamado operador, controlava a expresso de todos os genes imediatamente abaixo, isto , 3, do promotor. A este conjunto chamaram operon. Como os genes que estudavam eram os responsveis pela sntese das protenas que degradavam lactose, chamaram a este arranjo de genes operon lac. O diagrama bsico do operon lac est representado nas figuras a seguir.

Figura 1: Distribuio dos genes e mdulos de controle do operon lac. O gene i, para o repressor lac, expresso constitutivamente, est situado prximo ao conjunto dos genes induzveis lacZ, lacY e lacA, responsveis pela sntese das protenas b-galactosidase, permease e transacetilase. O promotor plac controlado pelo operador olac, onde se ligam duas molculas do repressor. O stio operador uma regio do DNA logo abaixo do stio promotor. Na verdade, os dois stios esto parcialmente embricados (superpostos), pois o promotor se estende da base -45 at a base +5, enquanto o stio operador vai da base -8 at a +12. Desta forma, se tivermos uma protena ligada ao stio operador, ela vai impedir que este seja ligado pela RNApol. Uma analogia razovel seria comparar o promotor com uma bota, em cujo bico est o stio operador. Quando o bico da bota est ocupado com uma pedra, no se pode calar a bota. Analogamente, quando o operador est ocupado pelo represssor lac (produto do gene i, que se liga ao operador na forma de um dmero), a RNA polimerase no pode se ligar ao promotor. O repressor lac, por sua vez, o produto de um gene que est prximo ao operon, porm no faz parte integral dele (na verdade, este gene poderia estar muito distante no genoma de E. coli). Na ausncia de lactose, as poucas molculas de repressor presentes no citosol da

bactria (menos de 10 por clula!) so suficientes para silenciar a expresso do operon, ligando-se ao stio operador. Todos estes eventos esto representados na figura 2a, a seguir.

Figura 2a: Esquema representativo do controle da transcrio dos genes para as enzimas responsveis pelo uso da lactose em E. coli. O repressor, produto do gene i, liga-se ao operador (em verdade, duas molculas), impedindo a ligao da RNApol ao stio promotor Plac e bloqueando a transcrio. O repressor est representado por elipses vermelhas. Na presena de lactose, contudo, o repressor inativado pela ligao de um produto do metabolismo da lactose, a alolactose. Inicia-se, ento, a transcrio dos genes lacZ, lacY e lacA, formando-se um mRNA policistrnico. Este mRNA imediatamente traduzido para formar trs enzimas da via de degradao da lactose: a b-galactosidase (b-gal), a permease e a transacetilase. A b-gal degrada a lactose a galactose e glicose e a permease aumenta muitas vezes a permeabilidade da clula lactose. Com isto a lactose do meio de cultura rapidamente assimilada e utilizada pela clula. Quando a concentrao de lactose reduz-se muito, at as molculas que esto ligadas ao repressor acabaro sendo clivadas pela b-gal. A consequncia disto a ligao dos repressores, agora ativos, ao stio operador, provocando a parada da transcrio dos genes lacZ, lacY e lacA. Estes eventos esto representados na figura 2b a seguir.

Figura 2a: Esquema representativo do controle da transcrio dos genes para as enzimas responsveis pelo uso da lactose em E. coli. A lactose no citosol bacteriano (rigorosamente, a alolactose, produto obtido pela transformao da lactose no interior da bactria) liga-se ao repressor, inativando-o e liberando o promotor para ser ligado pela RNApol. O processo de

transcrio estar liberado at que a concentrao citoslica de lactose seja insuficiente para garantir a inativao das molculas do repressor. Os produtos dos genes lacZ, lacY e lacA, bgalactosidase, permease transacetilase, respectivamente, esto representados por elipses azuis, em trs tonalidades. O repressor est representado por elipses vermelhas. Este o exemplo clssico de um operon que funciona por represso. H muitos outros semelhantes, que controlam em geral a sntese de enzimas responsveis pela degradao de um determinado produto nem sempre disponvel no ambiente. H tambm genes operons que esto sempre ligados e que devem ser silenciados em determinadas situaes. So em geral os genes para biossntese de algum produto que a bactria pode obter do ambiente. Somente quando falta este produto no meio de cultura que a bactria ativa a transcrio dos genes que iro produzir as enzimas necessrias biossntese do produto em falta. Um ponto que fica obscuro na explicao acima : como a lactose entrou na clula, se a permease no estava presente na membrana para transport-la do exterior para o citosol? A razo a seguinte: h sempre um pouco de permease na membrana, porque o operon "vaza", isto , um pouco dos trs produtos gnicos sempre produzido. E vaza porque os repressores se desligam por breve momento do operador, j que a ligao de molculas uma s outras por foras fracas no eterna. No instante em que o operador estiver livre uma RNA polimerase pode transcrever o operon, o que de fato acontece. O vazamento observado em todos os genes e operons bacterianos e, em grau muito menor, na maioria dos genes dos demais organismos. Pode parecer um gasto de energia desnecessrio, mas o vazamento inevitvel. Por outro lado, sem ele a maior parte dos operons no funcionaria, porque no teria como ser disparado. Alm destes dois sistemas h ainda outros, bastante mais complexos, que modulam de forma fina a expresso de genes nos procariotos. H mesmo operons que so controlados por represso e ativao simultaneamente. Vale ressaltar que o prprio operon lac tem uma particularidade, descoberta muitos anos depois de sua elucidao por Jacob e Monod: o controle da sua expresso exercido por uma protena chamada CAP (catabolite gene activator protein), uma protena dimrica como o repressor lac, com aprox. 45.000 Da. A protena CAP no tem qualquer influncia na expresso do operon enquanto no estiver ligada ao AMP cclico. Entretanto, uma vez ligada, ela se associa a um stio acima (5) do promotor, o que permite uma ligao muito mais rpida e efetiva da RNApol ao stio promotor. Na analogia da bota que fizemos acima, o complexo CAP-cAMP funcionaria como uma caladeira: na ausncia de pedra na ponta da bota (repressor) a caladeira (CAP-cAMP) facilitaria muito a entrada do p (RNApol) na bota (promotor). Este curioso mecanismo de controle positivo do operon lac tambm foi observado em diversos outros operons bacterianos. Qual seu objetivo, afinal? A explicao simples: quando a bactria no tem glicose para degradar, ela passa por um processo de fome celular, com conseqente aumento dos nveis de cAMP celulares. Este cAMP se liga protena CAP, permitindo uma expresso aumentada de todos os operons que so responsveis pela degradao de acares e outros produtos energticos. A figura a seguir ilustra e comenta o fenmeno da "induo" da expresso pelo consumo da glicose. P.: Quando se adicional lactose ao meio de cultura da bactria E. coli, h um aumento da produo de b-galactosidase, mas de apenas 10X. Somente depois de alguns minutos que a

produo de b-gal dispara para 100.000 X o valor final. Como se explica isso, que est representado no grfico abaixo? R: O fenmeno pode ser explicado pela converso do promotor lac de fraco em forte. Na natureza, o promotor deste operon em E. coli fraco, isto , mesmo quando liberado, ele no ser sempre reconhecido pela RNApol. Consequentemente, a expresso dos genes do operon vai ser discreta. Assim que adicionamos lactose ao meio de cultura (que tinha uma pequena frao de glicose, sem que os experimentadores se dessem conta disso), o promotor liberado, pois os repressores que estavam ligados ao operador so retirados. Mas sendo o promotor fraco, o aumento de expresso de apenas 10X. Aps um intervalo de tempo (Dt) a glicose residual presente no meio de cultura degradada, o que faz com que a concentrao do cAMP da clula comece a aumentar (indicando a fome celular). O cAMP se liga a uma protena citoslica denominada CAP, e o complexo CAP-cAMP vai ligar-se ao DNA bacteriano um pouco acima do promotor lac (em torno da posio -45). Assim que isso ocorre, o promotor converte-se de fraco em forte, obrigando a toda RNApol que passar por ele a transcrever uma fita de RNA. O resultado a produo explosiva de b-galactosidase, que vai ser usada para degradar e aproveitar rapidamente a lactose do meio, "matando a fome" da bactria. Enfim, o grfico demonstra a converso de um promotor fraco num promotor forte e a predileo da E. coli pela glicose como fonte de energia.

Figura 4: Controle do operon lac pela protena CAP Que importncia tem o operon lac na gentica molecular? Muitos dos vetores de expresso, sejam eles fagos ou plasmdeos, empregados em engenharia gentica, tm o gene clonado sob o controle de um promotor/operador lac. Este sistema propicia o controle da expresso do gene clonado atravs da adio de um anlogo da lactose, o IPTG (isopropiltiogalactosdeo). Este produto muitas vezes mais efetivo que a lactose na induo da expresso do operon lac, alm de no ser degradado. Veremos mais adiante como podemos tirar vantagem destas construes artificiais de genes para a produo de protenas recombinantes.

O operon triptofano (operon tryp) A biossntese de aminocidos um processo muito caro em termos energticos. Por isso, quando h, por exemplo, triptofano disponvel no meio de cultura, a Escherichia coli imediatamente cessa de produzir as enzimas necessrias biossntese do aminocido. O processo alcanado pela ativao de um repressor solvel que, na ausncia de triptofano, inativo. A ativao feita, compreensivelmente, pelo prprio triptofano que assim, estando presente, bloqueia sua prpria sntese endgena. A figura abaixo representa este processo. Quando a concentrao de triptofano diminui muito, o complexo repressor-triptofano se desfaz e o operon ativado. A figura mostra de forma esquemtica que o operon tem uma regio que antecede os genes da via biossinttica propriamente ditos, trypE, trypD, trypC, trypB e trypA. Esta sequncia conhecida como sequncia lder e tem um papel fundamental no processo que ser discutido mais adiante, chamado atenuao. Observe que cada gene inicia com um cdon ATG e termina com um cdon TGA (ou qualquer dos outros dois cdons de parada).

Figura 5: Esquema representativo do controle da transcrio dos genes para as enzimas responsveis pela sntese de triptofano na E. coli, no nvel de represso do operador. O repressor inativo logo aps sua sntese e necessita do triptofano para ativar-se. Quando isto ocorre, ele se liga ao operador , impedindo a ligao da RNApol ao stio promotor Ptryp e bloqueando a transcrio. O processo de transcrio de novo liberado quando a concentrao citoslica de triptofano insuficiente para garantir a ativao das molculas do repressor. Pela primeira vez ao longo deste texto enfatizamos a presena de uma sequncia que antecede a regio a ser traduzida, representada na figura pela sigla SD. a sequncia de ShineDelgarno, ou stio ligador de ribossomos (RBS) da E. coli. Os demais procariotos tm estruturas

muito semelhantes e os eucariotos no so muito diferentes neste aspecto. A sub-unidade leve do ribossomo, ainda antes de agregar-se sub-unidade pesada, associa-se ao mRNA atravs desta sequncia e desliza no sentido 3 at alcanar o primeiro cdon AUG. De acordo com o conhecimento atual o tRNA para formil-metionina (nos procariotos) tambm se liga sub-unidade leve associada ao mRNA, ainda no RBS, e ele que determina a parada do complexo "sub-unidade leve-tRNA" no primeiro cdon AUG (que o anti-cdon do tRNA para metionina reconhece). frente de todo gene ou regio que ser traduzida (como a parte da sequncia lder do operon triptofano, da qual falaremos em breve, que d origem a um peptdeo lder) deve haver fatalmente um RBS, como mostrado na figura acima e nas demais abaixo, neste sub-item, sem o que no haver sntese protica. A existncia de um RBS entre genes de um mRNA policistrnico a forma pela qual a natureza garante a traduo do gene aps a liberao das duas sub-unidades do ribossomo quando termina a traduo do gene anterior. Uma vez liberado o operador, h a transcrio imediata do DNA. O RNA produzido inicia-se pelas 4 sequncias representadas em vermelho, que tm uma particularidade interessante: podem parear duas a duas, 1 com 2, 2 com 3 ou 3 com 4, formando sempre grampos. Apenas o grampo 3-4 um grampo de terminao, pois seguido de um poli-U. Por outro lado, apenas a primeira sequncia possui cdons para triptofano (dois seguidos, neste caso). Para que existe esta sequncia-lder frente dos genes da via biossinttica? Como veremos a seguir, ela serve para interromper precocemente a sntese de RNA caso ainda haja algum triptofano no citosol bacteriano, insuficiente para ativar o repressor mas suficiente para garantir a produo de protenas. O que a bactria mede com este sistema? A concentrao de tRNA carregado com triptofano, que exatamente o "precursor" deste amonocido necessrio cadeia polipeptdoca nascente. A figura a seguir mostra a situao em que a quantidade de triptofano na clula to reduzida que no h tRNA carregado com triptofano disponvel para a sntese protica.

Figura 6:Esquema representativo do controle da transcrio dos genes para as enzimas responsveis pela sntese de triptofano na E. coli, no nvel de atenuao. A parada dos ribossomos sobre a regio 1 (I) permite o pareamento das regies 2 e 3 (II) que, distantes do poli-U que sucede a regio 4, no configuram um grampo de terminao. A transcrio progride (III), dando ao final a sntese das 5 enzimas que formam a via biossinttica do triptofano. A sntese do mRNA inicia-se assim que o operador liberado.O ribossomo se liga sequncia de Shine Delargno acima (5) da regio 1 e desliza at encontrar o primeiro AUG. Ao entrar na regio 1 o ribossoma vai encontrar dois cdons para triptofano. Na situao prevista nesta figura no h tRNA carregado com triptofano. A sntese protica pra. A sntese de RNA continua, pois independente destes fatores, transcrevendo as regies 2 e 3, que pareiam entre si, j que a regio 1 est protegida contra pareamentos pelos ribossomos que a esto cobrindo. Em seguida a RNApol transcreve a regio 4 e a sequncia poli-A, dando origem a uma sequncia poli-U. Este poli-U est muito distante do grampo 2-3 formado anteriormente e no configura um grampo de terminao. A sntese de RNA, portanto, avana pela regio dos genes da biossntese do triptofano e termina por permitir a sntese das 5 enzimas da via biossinttica. Todo este processo faz sentido nesta situao, pois no h definitivamente triptofano suficiente para garantir a sntese das protenas pela bactria. Ao contrrio, quando h ainda um pouco de triptofano, insuficiente para ativar o repressor mas suficiente para garantir a sntese protica, o pareamento das sequncias que compes a sequncia-lder muda. A figura seguinte representa esta nova situao.

Figura 7: Esquema representativo do controle da transcrio dos genes para as enzimas responsveis pela sntese de triptofano na E. coli, no nvel de atenuao. A cobetura das regies 1 e 2 pelos ribossomos, na presena de tRNA carregado com triptofano no citosol bacteriano, permite o pareamento das regies 3 e 4 que, prximas do poli-U que sucede a regio 4, configuram agora um grampo de terminao. A transcrio encerrada precocemente, no dando origem sntese das 5 enzimas que formam a via biossinttica do triptofano.

Nesta nova situao a quantidade de triptofano muito pequena, porm suficiente para garantir a presena de tRNAs carregados com triptofano no citosol. Com isto, os ribossomos no param sobre a regio 1 e progridem para a regio 2, quando a RNA polimerase est transcrevendo a regio 3. Antes que toda a traduo da regio 2 seja, feita a RNApol j transcreveu a regio 4 e formou o poli-U, o que d origem ao grampo de terminao mostrado na figura acima. ativado. bom relembrar que as regies 1 e 2 no podem parear pois esto recobertas e protegidas pelos ribossomos engajados na sntese do peptdeo lder. Quando este fenmeno acontece, a sntese de RNA encerrada antes da transcrio dos genes da via biossinttica, e nenhuma enzima da via ser produzida. De fato, a atenuao da transcrio economiza energia da bactria, que no precisa sintetizar enzimas para a produo de um aminocio que ela ainda dispe, embora em pequena quantidade. O mesmo mecanismo descrito para o triptofano empregado em outras vias biossntticas de aminocidos. A razo parece ser o alto custo energtico destas vias. A Natureza criou com este sistema uma forma de discriminar entre pouco e insuficiente, contornando a forma tosca com que o sistema repressor/operador controla a expresso gnica (lembre-se de que o repressor se desliga ocasionalmente do operador, dando origem ao vazamento, que importante para a expresso gnica, particularmente ao disparo de certos operons, como o lac). possvel que se um sistema de represso simples como o das bactrias fosse "regulado" para no ser aberto ou fechado seno em circunstncias extremas, ele jamais funcionaria, ficando sempre fechado ou sempre aberto, conforme o caso.

Interferncia de RNA O processo de interferncia de RNA, que leva clivagem de um mRNA especfico ou ao bloqueio da sntese de protenas a partir deste mRNA, pode comear a) pela injeo de um RNA fita dupla (dsRNA, do ingls double strand RNA) b)pela sntese de um RNA que forme um longo grampo (a partir da transcrio de um trecho de DNA genmico ou de um transgene, engenheirado para isso e inserido no genoma do organismo), ou c) pela sntese de um RNA de interferncia, que ser clivado pela enzima Drosha no ncleo, gerando um grampo que ser, no citoplasma, clivado de nvo pela enzima Dicer. Na figura ao lado est mostrado como o transcrito primrio de um gene para miRNA (microRNA) presente no ncleo de uma clula clivado pela enzima Drosha e o grampo gerado (que tem duas bases sobrando na extremidade 3, formando o chamado 3-overhang) exportado do ncleo para o citoplasma.

interessante notar que o gene para o miRNA (que no est mostrado, mas evidentemente faz parte do genoma) no leva produo de nenhuma protena. Por isso, ele no tem a configurao tpica de um gene, com um quadro aberto de leitura (se no tiver introns) ou com exons e introns. Ele tambm pode ser bem pequeno. Por isso, muitos destes genes passaram despercebidos por todas as buscas de genes feitas na maioria dos genomas. Eles s comearam a ser descobertos depois da demonstrao, por Fire e Mello, do princpio da interferncia de RNA e, sobretudo, depois que se mostrou que este era um sistema de controle de expresso gnica encontrado em muitos organismos. Com isso, o nmero de novos genes nos genomas j sequenciados tem crescido. E o conceito de gene como um segmento de genoma que codifica uma protena tem que ser definitivamente revisto e ampliado para conter estes genes, que codificam apenas pequenos

RNAs que modularo a expresso gnica, atravs da clivagem do mRNA contra o qual so dirigidos. Quando se gera um RNA fita dupla no citoplasma (por qualquer um dos 3 caminhos citados acima), as enzimas Dicer (picotador, em ingls) vo cort-lo em pelo menos um fragmento de 21 pb, de novo com um overhang 3de 2 bases em cada fita (a figura sugere isso), Diferentes grupos de seres vivos tm diferentes Dicer. Os mamferos parecem s ter uma enzima Dicer, a drosfila tem duas (veja mais embaixo a terceira figura). Os pequenos fragmentos de dsRNA so ento carregados num complexo enzimtico formado pela enzima Argonauta e algumas outras enzimas, como uma helicase e uma enzima com domnio ligador de dsRNA, chamada R2D2. Um das subunidades leva embora uma das fitas de RNA e a outra (em geral a complementar ao mRNA alvo da futura clivagem) fica. H um mecanismo de instabilidade da regio 5 do dsRNA que favorece a permanncia da fita complementar no complexo, isto ainda est sendo mais investigado. Na figura ao ldo, a fita complementar est representada em vermelho, ligada protena Argonauta. Esta ligao muito forte.

Quando se gera um RNA fita dupla no citoplasma (por qualquer um dos 3 caminhos citados acima), as enzimas Dicer (picotador, em ingls) vo cort-lo em pelo menos um fragmento de 21 pb, de novo com um overhang 3de 2 bases em cada fita (a figura sugere isso), Diferentes grupos de seres vivos tm diferentes Dicer. Os mamferos parecem s ter uma enzima Dicer, a drosfila tem duas (veja mais embaixo a terceira figura). Os pequenos fragmentos de dsRNA so ento carregados num complexo enzimtico formado pela enzima Argonauta e algumas

outras enzimas, como uma helicase e uma enzima com domnio ligador de dsRNA, chamada R2D2. Um das subunidades leva embora uma das fitas de RNA e a outra (em geral a complementar ao mRNA alvo da futura clivagem) fica. H um mecanismo de instabilidade da regio 5 do dsRNA que favorece a permanncia da fita complementar no complexo, isto ainda est sendo mais investigado. Na figura ao ldo, a fita complementar est representada em vermelho, ligada protena Argonauta. Esta ligao muito forte. O passo seguinte do caminho para a interferncia o pareamento entre o RNA fita simples contido no Argonauta e o mRNA alvo, A probabilidade de um pareamento errneo muito remota, j que preciso que haja o pareamento exato de pelo menos 19 das bases. Assim que o pareamento for feito, duas coisas podem ocorrer: a) se o mRNA no estiver sendo traduzido, ele ser clivado (lado esquerdo da parte de baixo da figura ao lado). b) se o mRNA estiver sendo traduzido, o Argonauta se liga a ele e leva a um bloqueio da traduo. Em ambos os casos no vai haver mais a sntese de protenas a partir do mRNA. Este exatamente o objetivo da interferncia de RNA. H alguns outros passos que no esto mostrados na figura ao lado, mas aparecem na animao da Nature. Um dos mais importantes o destino dos dois fragmentos de RNA gerados pela clivagem. O fragmento terminal (3) ser imediatamente degradado pelas RNAses 5-3 da clula. O fragmento da direita (5) tambm pode ser degradado pelas RNAses, mas por aquelas que agem no sentido 3-5. O outro destino mais curioso: ele pode ser transformado em fita dupla pela RNApolimerase RNA dependente! Agora, um longo dsRNA vai estar disponvel outra vez para a enzima Dicer. Cada novo pedao gerado pode servir para carregar outro Argonauta ou ainda, quando espontaneamente se separam as duas fitas, a complementar ao mRNA pode parear com ele e servir de "primer" para a mesma RNApolimerase, embora ela no precise sempre de primer. Estes eventos esto mostrados na animao. Fica bvio, pelas descries acima, que o processo de interferncia de acentua medida que vai acontecendo, porque novos fragmentos ativadores da interferncia vo sendo gerados, como numa reao em cadeia, at que o ltimo mRNA seja degradado. Em muitos organismos, a interferncia se espalha de uma clula para a outra, tomando o organismo todo, rovavelmente pela passagem de pequenos dsRNA pelas membranas. Os dsRNA so muito mais resistentes s RNAses em geral do que os RNAs fita simples e por isso tm mais chance de transitar entre clulas sem serem degradados. Terceira figura ( esquerda): diferentes vias e diferentes Dicer em drosfila, verme (C. elegans) e mamferos.

Na sala de aula no dia 9 de setembro de 2009 comentamos que, nos mamferos, no havia evidncia de existncia de uma RNA polimerase RNA dependente e que, portanto, a via de degradao do fragmento de mRNA do lado esquerdo da clivagem (o fragmento 5) era a mais provvel neste grupo de organismos. Pois na ltima edio da Nature (NATURE| Vol 461| 10 September 2009), disponvel um dia depois da aula, Maida e cols. mostram que a sub-unidade cataltica da telomerase, denominada TERT, e que era conhecida por sintetizar DNA a partir do RNA molde da telomerase, pode, quando associada a outra protena (RMRP), ter uma clara ao de RNApolimerase RNA dirigida (RdRP), agindo na gerao de dsRNA e ativando sistema de interferncia de RNA!!!! H um grande nmero de aplicaes potenciais do mecanismo de iRNA, tanto para pesquisa como em produtos e servios. Um dos mais interessantes a gerao de plantas transgnicas resistentes a vrus, porque se pode restrinir a replicao viral nestas plantas sem produzir uma nica protena nova, apenas um dsRNA dirigido contra um mRNA importante do vrus.

You might also like