You are on page 1of 56

Informacin en los seres vivos

El fenotipo se correlaciona con el genotipo Dogma central: ADN - ARN - protenas - rasgos Estable y transmisible
Puede ser copiada y diseminada

Capacidad de modificacin
Mutacin Recombinacin Sexo (intercambio de material gentico)

Del genotipo al fenotipo

Material gentico (ADN) Genes

Protenas Estructura molecular

Funcin

Rasgos

Bacterias Animales
Plantas Hongos

Almacenamiento de la informacin gentica: estructura del ADN

Estructura del genoma de los organismos procariotas


Contienen un nico cromosoma de estructura circular Bsicamente ADN desnudo Mayora de la secuencia de ADN compuesta por genes

E. coli- 4.6 Mb ~87% --- 4288 genes

Estructura del genoma de los organismos eucariotas


Material gentico almacenado en el ncleo Organizado de forma compleja en varios cromosomas de estructura linear ADN asociados a protenas (histonas y no histonas): fibras de cromatina

En los eucariotas la informacin gentica se reparte en un n variable de cromosomas

Complejidad del genoma eucariota


Parte del genoma de los organismos eucariotas no codifica para protenas:
ADN altamente repetitivo, centrmeros, ADN satlite, telmeros (5% del genoma humano) ADN moderadamente repetitivo, SINEs, LINEs, ARNr y VNTRs (30% del genoma humano)

Los organismos eucariotas contienen secuencia no codificante (no traducida a protena) incluso dentro de la secuencia gnica

Replicacin del ADN

El ADN se replica en direccin 5 3


OH Extremo 3

Extremo 5 P

P O

O P T A

P O

OH
P P P C G P

O OH
C P

Extremo 5

Replicacin del ADN

Video replicacin del ADN http://www.youtube.com/watch?v=zmu9O PuXj-k&feature=related

El ADN contiene la informacin para producir las protenas de un organismo

Naturaleza qumica de las protenas


La unidad bsica de la protena es el aminocido, existen 20 aminocidos distintos Los aminocidos estn unidos covalentemente mediante enlaces formando cadenas (polipptidos)

Protenas
Las protenas son la clase ms verstil de macromolculas en la clula Existen 20 amino cidos diferentes que forman parte de las protenas Gran variedad de caractersticas qumicas Pueden sufrir muchas modificaciones bioqumicas que alteran o regulan su funcin Llevan a cabo la mayora de las funciones celulares

Niveles de organizacin de las protenas

Flujo de la informacin gentica para generar protenas


ADN Cdigo de 4 letras Largas molculas con miles de genes Protena Cdigo de 20 letras Molculas de tamao discreto

(RT)

TRANSCRIPCIN

TRADUCCIN

Estructura los genes eucariotas

Transcrito

El splicing tiene lugar en el spliceosome

http://www.youtube.com/watch?v=FVuAwB Gw_pQ

Transcripcin
Proceso complejo que implica varios pasos La ARN polimerasa sintetiza un molcula de ARN monocatenario usando como molde la secuencia de una de las cadenas de ADN

El inicio de la transcripcin est regulado por factores de


transcripcin que reconocen secuencias normalmente situadas justo antes del punto de inicio de la transcripcin (extremo 5) Existen secuencias que indican el final de la transcripcin, al ARN recin sintetizado se le aade una secuencia de adeninas, la

denominada cola poli A

(RT)

TRANSCRIPCIN

TRADUCCIN

Video sntesis de protenas http://www.youtube.com/watch?v=FNqmh 4PoMPQ

Flujo de informacin, de la secuencia genca a la protena

Regulacin del flujo de la informacin gentica

ADN

Pre-ARNm
Splicing

ARNm
Traduccin

Protena

Protena activa

Transcripcin

Modificaciones post-traduccionales

Cromatina ADN-B ADN-Z

Estabilidad

Nivel principal de regulacin

Splicing alternativo

Transcripcinal

Post-transcripcin

Post-Traduccional

Splicing alternativo
Hace referencia a variaciones en la forma de combinar exones que generan diversas formas de una protena El splicing alternativo de pre-ARNm es un importante mecanismo de regulacin de la expresin de genes en eucariotas superiores. Regulacin cualitativa Explica por ejemplo la existencia de aproximadamente 1.000.000 de anticuerpos diferentes en humanos a pesar de que el genoma humano contiene nicamente unos 30.000 genes

Splicing alternativo

Fig 24.4 Alternate splicing of transcripts from the rat troponin T gene.

Result in slightly different action of muscle

Genes expressed that lead to female development

Genes expressed that lead to male development

Fig 24.5 Alternate splicing of transcripts from the Sex-lethal gene in male and female Drosophila.

Bioinformtica
Las nuevas tecnologas de secuenciacin permiten secuenciar el genoma completo de un organismo Se est generando una enorme cantidad de datos Cmo analizar todos estos datos?
Bioinformtica
Fusin de las ciencias de la computacin con la ciencia genmica Desarrollo de nuevas herramientas para analizar datos

Contig 190 25703 - 32806 atgctctttaccatgcaattcaccactcgatccaccgtggcctcgcccgagcagcagcaccaacaccaacagcgcagtatctcgtactcggatatcgaacttggtcttgagcgcatcagctctcgcgacagcaatggcag ctccaactttacgcacagagcctatcctccaccgctatctcagcaatatgacgacacatccaccaactcctttcattcatcgcagccagacatcacagcctcttcttcaactttgtcgtctcgcctcgtgagcgccaactactcc cgtcctcggttcgagcatgcgcacactcaaccacccacacccgaccaagaccgctccagctccggctccggctccggctccggctctcgctcctactttcccgccaactcgcattccgactctttgcccggtcccagcact catagcatcagcccttcctttgacgaggacgaactccgtcagatcatgtcgcacattccagctaaccaagccacgtccagctcggatggcgatgtaggcaaggccgtccagtctgccaaccatcaggacatcagtccgt tcctcttccagagcgagaacgcagctcccttttcctcctcccactccaaccgtaccagtgtcaatccatccgcagcctcgaccgccagcccgtcgacttcggcggcaaccaggacacgtccgcgcgggggcaccaacg cctcgcagtacaacaccctagacactagcttcggtagcatcgatcggcctggcctttcttcttcccgctctcagtattcattgcgcccacagaccccaccctcggcgtccacttccactagcactctcaacggctccaaggac acgcacgcttctgccgtcaagaagacgcgcaatccgttcggctttctcaaaaagaagtcctcggcccactcaaatgcttcctcgaatcaccccacgcgccacgacatcggctcggtctcttcgctctcgtcgcgctacggt cccaacgcggcggccaacgtcaatccgatgcgcccacctgcctggctcgataatcactgcacacttgccaactccaactcgccttcttcggcttcgctgcgctctcactaccaccagcctcctgcctcttcgaatccccctc cttggcagaaccccctcgtgtctcgtgcagactcgactccttccgccatgagtctcgaagatgaggtcgaggctgagcatcatctcaagaaggaccctcgcaagcgcatcaaaggcgttcgccatcaccttgcaaagac caccaagcccggcgaggacgccgactcggcacgcgaccctgcctttgcagcccagagccagtccatcgaacaagaggtcgaactctcgttggacatgaactttgaccagctcgatgactttgtcgacaccaacgcag cgcgccagcggctccagggctcgatcactgagtctgccagtccttccgagcatcgctcaccaaacggaagcgaagccggcgtgtatcgctcgccatccccttcccagactcccattgccgaacgccagacttcggtca cttctaccgtcgaatctccctcgcacgcctcggaagcctcgctcgcaccctcgggctctctgcgaaccccgagtcgcactactgcgtctacctctacctcgtccgcttccaccgtactcagcgaccgtcttccttcgcaggtca acatgcttcctcgcaatagcgtccccaggctcagcctagccgagatgcaaaactaccagtcgctccgtaaactctcgaacaacctcatcgacatgtcccagacgcaaaacccttccgctatgggcgcatcctaccgccg cggatccatcgcagccgcccaagcacctgtcgacgcgcctcagctaggtgtcgctcctcgtactgactctgagctctccgatcgcaaggacagcgtagtctctacccacagcatgcgctccaaccatagcggcatctcg cccaagacctcatacgccaacctgcccagtgtcattcaggagcgtcagaagccggctactgcacttccctccgccgcgaattggacatcatccatcaccagagacaaaacggccaatggacatgctgaccacgccta ccaatttccgcccgcaactgagtatcagtccaacttgctgctcagcgtgcgcaagtcgagtgccagctcggggcaggagcctagctccagctggatggctcccgacagttgggccgtacaaccggacaagatgcgcg actatcttcgcgacgataatgtcggcgaggaggaagacgacgacgacgaccagcaccaagccagagccgctttggccaccgatggcaagaggcgcggttccagctccggtatcagctcgacgcatgcatcgagc atgttccgcacctcatccaccgaccctttcaagaagactgcctcgcttgctggctcacgtcgcggcacggacgactcggtcgatccgctcaccgctttgcctccattgccaggctccaagtcggtggacgaggcagcagc caacaaggtcgatgtactccagcagaccaataatctcgctcaatcggctctggtgcaacagcagtctcaatcccagaaccaccaccagcccagccccaacgtccgtcccacctcgagaggcggtgctggtgcccaca tgtttgcctccgccggcgcttccgctgcagcagctgctgcgggcaagcttggtttacatcgtccatctaaacatcgtatgaacgcgcgacccaataccgcaggctccgttggtgcgacccgaccttccaccaccacgctcg gctcgaccctctcggcagaggacgacacaagcatcaacggctccatccgacgcgacggccatccgctcaagcgctccgcaactgccaacacgaacaacgccacgggaactttgcctcgcaaccacttcatccgcg tctacaagacggacggcacctttgcaacgctctcgtgctcactcgtctcgacggcaaacgaagtacagacaatcctcgcgcgcaagagcctcaccaccgaatcggccgcatacaggctttttgtgcgggacaagggct ccgagagaccgctggggatctcggacaagccttctcagctccagcgtcgtcgtctcattcaggcaggctacaccgagaacgatggcttggaagatatgggcagagacgatttgtcatacctgcttcgcttcgtctttcgccc cgacagtgttcccaccttcgactcggaatccatcggccacagcgagcacacattccagcatctcgatctgcacagccgcaatctcgaaatggtgcccatctttctgtataagcatgccgactggattgttagcctcgatctgt caggcaatcccatgtctgatcttccgctcgactttgtacagctctgttcaagcctgcgaactctgcgactctcaaacttggcgctcaagcgcatcccgcaaagtgtccggcacagcgaaaccttgacgcacctcgacgtatc caacaatcgaattgtcgagctcgcgcatgtcagtctcgatcttattccggagctcatgtcgctcaaggtgcaaaacaatcgtctctttgacttgccctcatacttttccagcatcagcacgctgaggaacctcaacatctctaac aaccgctttgaagaattccccaaggtcatctgcgacgtcccttcgctggtcgatcttgatgtgtcattcaattcgatcactgaattgcccgccgaaatcgccaacctcatcaacttagagcgcttcatcctagccggcaacga gctggaaaagctgccggacagcatgagcgagctcgtcagcttgcgcaccatcgacctgcgtcgtaacaaggtgcaggacgtttcgtcgctgcttggtcttccacgccttcaaaacatccaggccgagagcaacaacat caagtcgtttgaagctacactgggtccgcaactcactcaggtcgagctcggtcgcaacccactcagcaaggtgcgcatcgctgctctcaccacgtgcgatctcacctcgctcgacctgtcgtcgaccaacatgacgcgg ctcgaggaaggtctcttcccgcagctgcctgcgctcgtcaagctgacgctcgatggcaatcagctcgttgtgctgcccgacacgctcggagacttgaagcgactcgagatgctatcatgcagcaacaatctgcttgctacc ctccccgagtcgatcggtgatctcaaggcgctcaaggagctgcttgtgcacaacaacaacctcaaaacgcttccacagaccttgtggctctgcgagagcctcgcacacatcaatctcagctccaacttgctcgaatcgttc ccagcagtgcctgacattcgcaccgatgcttccgttggagatgcggctgcagctgccggcacttcggccgttatcgctgcacgaaagggatctacaagctcgtcgctgacgcacaggtctaacactggtggcgccaatg ggaacatcaatctctctacgccctccgaggtctttgtggcgccgctctcgctcagcctgcagaagctgcgtctgggagacaatcgtctaggcgatgacgttttcagtgtcctgtccgagctcacctcgctcgaggtgctcaac ctcagcttcaacgagatctttgagattcccgattttagtctccagacgctcaccaagctgcgtgagctatacatcagtggtaatcagcttagcacgattccttccgacgatcttgtggtgctacaagagctgcgcatcctccacc tcaactgcaacaagctcactactctccccaccgaacttggcaagctcaagaagctcgccaacctggatgtcggtaataacgtgctcaagtacaacattgccaattggcattacgactggaactggaacatgaacccgg agctacgctacctcaacctttccggcaacacgcgtctcgagatcaagaccaagctgagcgatatgggcttcacgcgcaagtccaacatctcggacttcagccgcttaaccagcttgcgcatgctgggtctcatggatgtc acaatgccattgcattcaaatgccacgccggatgagtcggacaaccgccgtgtgcgaacctcgctctcgcaggtcaacggaatggcttacggaatcgccgacgcactcggcaagcacgacaacttgagcgtcatcga tcttgtgattccaacattccgtaaggacgaaggagagtgcatttttggtctatttgacggtaggggccacggtgcacatgttggcagccgtatcgcgcatcacctggccgaatggagtggacatcgtctatcgtgggagttcc agaagcaccagaatgaaatgaccgccgaacctgtttcggttccggatgcgctgcgccgcgccttcctacgcctgcagaaggactacgccgacgcgctcatcaacgatggcagccgcaagctctctgaagcacacgc agaggcggctgcggatgtgacgcgaagctctgcgcctgcgattgcggccgcctccaacaagcatgactggcgcgccggcgcttccgcgattttagcgtacgtggtcgaccacacgctctacattgctaatgcgggtgat gctctggcggtcatgtcgcgcaacggtggcacagcacatctgatcagtaacaagcacgagccgtttgaccgtgccgagatcgagaggattcgatcggcggaaggatgggtctcgctgcgtggctatgtcaacgacatg ctcgatgtctcgcgttcgtttggctacttccatctgttcccgattgtcaatgctgcacctgcggtgacgacggtgcagttgactgactcggatgaatttgtgattatcgccaaccgcacgctgtggcagtatgtgtcgtaccagac cgcggtcgacattgcacgtacacagcgaaacgatcctatgattgcagcgcagaagctgcgagattttgccatcagctacggtgccgaggagagcatcatggtcatggtgatctcggtgggtgatttgttctatcgttcagat cagcgtaacggcggtggactcaactttgcgtcgtacaagaacagcgacgccatccaaaaggcaggacgtcgattccgcgaggagctgcctggcgatcgcacgctggcgagactggaccgtgaagtggcacctccc atcggacaggtggcgctggtgtttacggatatcaagaactcgacgtcgctgtgggagaccaacaatggcatgcagacggcgatgcgattgcacaactacctgttgcgacgacagttgcgcactattgggggttatgagg tcaagacggaaggcgatgcatttatggtttcattcccctcggtcagtgcagctctgctgtggtgttttacagtacagcaacagctgctgcaagaggactggccgcgcgagatcttggacagcgaggacggcaaggaggtg tacgatcagtcgggcgaactcattcatcgaggtctgtcggtgcgcatgggcattcactggggacggccagtgtgtgaggcggatccgatcacgagacgaatggactactttggaccgatggtgaaccgtgctgctcgaat cagcggtgcagccgatggcggtcagatcttggcgagcaaggacgtaatcaaggagctgcagggcctattgggtacgtttgacgagtcgtcgacagccggaggtgcgggcggagaaggtgaaaatctagagaagac cgaggaggagctagacgaggatgcgttccgactgctcaacccgaacgtcagccgcgatgtggtgctgctacgtaggatgggttttggtctatcgcagctgggagagcgcagactcaagggtttggagacgcccgagat gctgtggcttgtctatccgaagcagttagcaggacgtctggagcaggccaagaccgacgatgcacctgacgcacccacggcgcaagtgtatgagccgacagtgcagctgctagatatcgaggatgtaaagcaagtg ggcatgctctgcttgcgactcgagtatctgtccaactctacggtctgtcctggcatctttgctgccaaggatgaagcggatcgatcgcaaccttcgacgcctctggacgataacggacggaatccgatcgacggccacgga acggcggtgcccctgctgtcacaccaggcgcgacgcaaaggggttgaggcgatgttgacgatgcatcccgagctgctcatctacagcatccgagacgatgcgacggatgaagagttggcgggcatcttggatcagct gacgacgcggatccagaacgccgtgtcttcgctcatgctgaatatgttgcgggacaagacggccaacggtaccaaggaacttggcgtggatcctggggtgctcgagttgttgatgggcttgctttcacagccgcctccgc gagcgtcaacgtcggcgttgagtttgcccagcccacggacgagccctcgcaacaggctgttggagctggttccctag ......

Terminologa
Genoma: conjunto de ADN de un organismo Transcriptoma: poblacin total de ARNm en una condicin determinada Proteoma: poblacin total de protenas en una condicin determinada Interactoma: descripcin de todas las interacciones que tienen lugar entre molculas Metaboloma: descripcin de todos los reactivos/productos/enzimas implicados en metabolismo ORFeoma/predictoma: descripcin de todas las protenas potenciales codificadas por el genoma. Genoma anotado Secretoma: descripcin de todas las protenas secretadas codificadas por el genoma

Fig 21.17 Annotated, sequence-based map of an 8-mb segment of DNA at the tip of human chromosome 1.

2003 John Wiley and Sons Publishers

Fig 15.18 A single gene may produce a family of closely related polypeptides by using alternate pathways of exon splicing.

Genomas bacterianos
Un gran nmero de genomas bacterianos secuenciados
Mycoplasma genitalium 580,070 bases Mycobacterium tuberculosis- 4.4 Mb E. coli- 4.6 Mb
~87% --- 4288 genes
~30% bien caracterizado ~38% funcin desconocida Espacio promedio entre genes 118 bp

0.7% elementos repetitivos no codificantes ~11% elementos reguladores o de funcin desconocida

Genoma de levadura
Sacchromyces cerevisae
16 cromosomas 12 Mb 5885 genes codificantes de protenas (1 gene/~2100 bp) 140 genes ARNr 275 genes ARNt 40 genes ARNsn Principal diferencia con procariotas
Redundancia gentica
Mltiples copias de genes y secuencias no codificantes til para estudair evolucin de secuencias

Genoma de C. elegans
Primer organismo multicelular secuenciado 97 Mb Relativamente poca cantidad de ADN repetitivo 19,099 genes (1 gene/~5100 bp)
Mismo # de protenas que llevan a cabo funciones bsicas de la clula Muchos genes especficios de organismo multicelulares Sealizacin intercelular 43% similitud con protenas humanas

Genoma de Drosophila melanogaster


180 Mb
~30% heterocromatina centromrica 97% de eucromatina secuenciada 13.601 genes # de genes de copia nica similar al de C. elegans Contiene ~180 genes similares a 290 human genes humanos implicados en enfermedades
Drosophila un buen modelo para estudiar enfermedades

Genoma de Arabidopsis thaliana


125 Mb baja cantidad de elementos repetitivos ~26,000 genes
70% se encuentran duplicados o forman parte de familias de genes ~15,000 genes claramente diferenciados

Proyecto Genoma Humano


2.95 Gb de 3.2 Gb es eucromatina
>90% de eucromatina secuenciada ~1% de secuencias codifican protenas

Se predicen entre 30.000 y 35,000 genes # poco elevado:


Levaduras - 6,000 genes Drosophila - 13,000 genes C. elegans - 19,000 genes A. thaliana - 26,000 genes

Genes en genoma humano


Exones 1.1 % Intrones ~24% Regiones intergnicas 74% Tamao promedio de genes ~7 kb Nmero promedio de intrones - 10 Solo 94 de 1.278 familias de protenas son especficas de vertebrados
Genes implicados en procesos bioqumicos bsicos parece que evolucionaron solo una vez y se han mantenido de bacterias a levaduras y a mamferos

Genoma humano
60% de protenas predecidas son similares a otras secuencias Principales diferencias con gusanos/moscas
Complejidad de las protenasComplexity of proteins
Ms dominios/protena y nuevas combinaciones de dominios Aparicin de nuevas funciones en dominios ya existentes

2003 John Wiley and Sons Publishers

Fig 21.19 Pie chart showing homology of predicted human proteins to proteins of other species for those where homologues were detected by computer searches of the public databases.

2003 John Wiley and Sons Publishers

Fig 21.18 Functional classification of the 26,383 genes predicted by Celera Genomics first draft of the sequence of the human genome.

You might also like