Professional Documents
Culture Documents
265
9.2 GENES PROTEINCODING
Durante muchos aos, los genetistas moleculares crean que el final- importante
de funcionamiento
393
39
10
6.0
236
3076
C3 del complemento
1641
41
29
8.6
122
900
apolipoprotena B
4563
45
29
31
487
1103
La fenilalanina hidroxilasa
452
90
26
3
96
3500
Factor VIII
2351
186
26
3
375
7100
huntingtina
3144
189
67
8.0
201
2361
llegar a ser muy grande. exones internos tienden a ser bastante uniforme en
tamao, pero el exn terminal o algunos exones cerca del extremo 3 pueden ser
muchos kilobases de largo;
por ejemplo, el exn 26 del APOB gen es de 7,5 kb de longitud. Tenga en cuenta
el extraordinariamente alto contenido de exn y comparativamente pequeos
tamaos de intrones en los genes
codificacin de colgeno tipo VII y titina. Adems de SRY , otros genes que
codifican protenas de un solo exn en el genoma nuclear incluyen retrogenes
(vase
Tabla 9.8) y los genes que codifican otras protenas SOX, interferones, histonas,
muchos receptores acoplados a la protena G, protenas de choque trmico,
muchos ribonucleasas,
y varios receptores de neurotransmisores y receptores de hormonas.
Genes que codifican protenas
pgina 12
267
TABLA GENOMA HUMANO Y ESTADSTICA 9.5 de genes humanos
TAMAO DE COMPONENTES GENOMA
genoma mitocondrial
16.6 kb
genoma nuclear
3.1 Gb
un
componente euchromatic
2,9 Gb (93%)
Altamente conservadas fraction150 Mb (5%)
sequences35 ADN codificante de la protena Mb (1,1%)
Otros DNA115 altamente conservada Mb (3,9%)
DNA160 segmentally duplicado Mb (5,5%)
DNA1.6 altamente repetitivo Gb (50%)
heterocromatina constitutiva 200 Mb (7%; Tabla 9.3)
repeats1.4 basado en transposn Gb (45%, Tabla 9.12)
ADN por cromosoma
48 MB-249 Mb (Tabla 9.3)
el nmero de genes
genoma nuclear
> 26.000
genoma mitocondrial
37
genes que codifican protenas 20,000-21,000
genes de ARN
> 6000 (Figura exacta no se conoce)
Pseudogenes relacionados con genes que codifican protenas
> 12.000
la densidad de genes
genoma nuclear
> 1 por 120 kb (pero considerable incertidumbre)
genoma mitocondrial
1 por 0,45 kb
LONGITUD DE LOS GENES PROTEINCODING
Longitud promedio
53.6 kb
Pequesimo
unos pocos cientos de pares de bases de largo (varios ejemplos)
ms grande
2.4 Mb (distrofina)
NMERO DE GENES exn en PROTEINCODING
Promedio del nmero de exones en un gen
segundo
9.8
C4B
G8 C2 C9a
G7a
G3a
K18L
G3 G1
G7 G8
G2
G6
G5
G4
C4A
ZB
XA
YA ZA
G11
G10
HOM
Hsp70
G11a
G7B
G5b CKIIB
G7c
BAT5
G7d
RD
bf
G9 2
1C7
B144
LTB
TNF
LTA
NB6
1kBL
BAT1
MICB
PERB6
PERB10
MICA
NOB1
NOB2
P5-6
DHFRPs
17
NOB3
alianzas de inversin pblicoprivada
(UN)
(SEGUNDO)
0
900 kb
exn 27b
exn 28
27b intrn
OGMP
EVI2B
EVI2A
2.2 kb
10 kb
4 kb
cadena con sentido
de NF1 gen
cadena antisentido
de NF1 gen
5
3
3
5
pgina 15
269
Las diferentes clases de las familias de genes humanos pueden ser reconocidos de
acuerdo con la
grado de similitud de secuencia y la similitud estructural de sus productos
proteicos.
Si dos genes diferentes hacen productos de protenas muy similares, que son ms
propensos a
se origin por una duplicacin de genes evolutivamente muy reciente, muy
probablemente
algn tipo de evento tndem duplicacin de genes, y tienden a agruparse
juntos en un lugar especfico subchromosomal. Si hacen protenas que son
ms alejadas en secuencia, que muy probablemente surgieron por una ms
antigua
2
un
1
q
y
x1
y
a2
y
a1
hGH-N CS-L
CS-A
hGH-V CS-B
ALBA
AFP
ALF
GC / PAD
gen expresado
expresado, pero en estado desconocido
pseudogen
Figura 9.8 Ejemplosdehumanoagrupados
familias de genes. Los genes en un grupo son a menudo
estrechamente relacionados en secuencia y son tpicamente
transcrito a partir de la misma cadena. Gene
grupos a menudo contienen una mezcla de expresado
genes y pseudogenes no funcionales. los
el estado funcional de la q-globina y CS-L
genes es incierto. Las escalas superior
(globina y la hormona del crecimiento clusters) y
la parte inferior (cluster albmina) estn en kilobases.
Genes que codifican protenas
pgina 16
271
Dos ejemplos importantes de superfamilias de genes son la Ig (inmunoglobulina)
y GPCR (receptor acoplado a protena G) Superfamilias. Los miembros de la
super-Ig
familia todos tienen dominios globulares se asemejan a los encontrados en las
inmunoglobulinas,
y adems de inmunoglobulinas que incluyen una variedad de superficie de la
clula proprotenas solubles y protenas implicadas en el reconocimiento, unin, o ceso de
adhesin
eses de clulas (vase la Figura 4.22 para ver algunos ejemplos). La superfamilia
GPCR es muy
con al menos 799 miembros de larga duracin en grandes nicas, distribuidos en
todo el
Genoma humano. Todas las protenas GPCR tienen una estructura comn de siete
a-hlice
segmentos transmembrana, pero por lo general tienen una baja secuencia (menos
de 40%)
similitud entre s. Ellos median la sealizacin celular inducida por ligando a
travs de interaccin
cin con las protenas G intracelulares, y la mayor parte del trabajo como
receptores de rodopsina.
la duplicacin de genes que dan lugar a las familias multignicas tambin
crear pseudogenes y fragmentos de genes
Las familias de genes con frecuencia tienen copias de genes defectuosos, adems
de funcional
genes. Una copia del gen defectuoso que contiene por lo menos varios exones de
una funcin
gen cional se conoce como un pseudogen ( Box9,2 ). Otras copias del gen
defectuoso puede
tener partes solamente limitadas de la secuencia del gen, a veces un solo exn, y
tambin lo son
a veces descrito como fragmentos de genes .
familias de genes agrupados a menudo tienen copias de genes defectuosos que
han surgido por
duplicacin en tndem. Estos son ejemplos de pseudogenes no procesados
. Proceso de copiar
se puede ver que se han realizado a nivel de ADN genmico, porque no
pseudogenes procesados contienen homlogos de ambos exones e intrones y
a veces tambin de regiones promotoras aguas arriba. Sin embargo, incluso si la
copia tiene
secuencias que corresponden a la longitud completa del gen funcional, ms cerca
de examen
nacin identificar los codones de terminacin inapropiadas en los exones,
empalme aberrante
uniones, y as sucesivamente. Ejemplos clsicos de pseudogenes no procesados
se encuentran
en la A-globina y grupos de genes b-globina (vase la Figura 9.8). A veces, ms
pequea
copias de genes truncados y copias fragmento de gen tambin son evidentes, ya
que en la clase I
Familia de genes HLA ( Figura9.10 ).
Unas pocas familias de genes que se distribuyen en diferentes localizaciones
cromosmicas
Tambin puede tener copias de pseudogenes no procesados de un gen funcional
nica.
Ciertos tipos de regiones, en particular subchromosomal pericentromeric y
subteloregiones Meric, son relativamente inestables. Son propensos a la recombinacin
eventos que pueden dar lugar a segmentos de genes duplicados (que contiene
tanto exones y
GG
TPGR
SBADO
MUERTO
NUEVA HAMPSHIRE
2
22-42
6-94
23-41
19-29
17-29
17-23
19-51
115-192
20-25
repeticin WD
GH
WD
n = 4-14
ncleo
Figura 9.9 Algunasfamiliasdegenescodifican
protenas funcionalmente relacionadas con corta
motivos conservados de aminocidos. (A) MUERTO
motivos cuadro de la familia. Esta familia de genes codifica
productos implicados en los procesos celulares
que implica la alteracin de ARN secundaria
estructura, tal como la iniciacin de traduccin y
empalme. Ocho amino muy altamente conservada
motivos de cido son evidentes, incluyendo el DEAD
caja (Asp-Glu-Ala-Asp). Los nmeros se refieren a
con frecuencia se encuentran rangos de tamao para intervenir
secuencias de aminocidos; X representa cualquier
aminocidos. repetir motivos familiares (B) de WD.
Esta familia de genes codifica productos que
estn involucrados en una variedad de regulador
funciones, como la regulacin de la divisin celular,
la transcripcin, la sealizacin transmembrana,
y la modificacin del ARNm. Los productos gnicos
se caracterizan por 4-16 tndem WD
repite que contienen cada uno una secuencia central de
de longitud fija a partir de una GH (Gly-His)
elementos. Muy de vez en cuando, una copia del gen procesada puede retener
alguna
funcin (un retrogene ; vase la Tabla 9.7). Sin embargo, debido a que carecen
secuencias importantes que se necesitan para la expresin, el gen ms procesado
copias degenerar en pseudogenes procesados (a veces llamados
pseudogenes retrotransposed ; Figura 1B).
La prevalencia y la funcionalidad de pseudogenes
genomas eucariotas tienen tpicamente muchos pseudogenes. Un largo
de pie justificacin de su abundancia es que la duplicacin de genes es
evolutivamente ventajosa. Las nuevas variantes de genes funcionales pueden ser
creados por la duplicacin de genes y pseudogenes durante mucho tiempo han
sido vistos
como sin xito subproductos de los mecanismos de duplicacin. A pesar de que
algunos genomas procariotas parecen tener muchos pseudogenes,
pseudogenes son generalmente raros en procariotas porque sus genomas
generalmente estn diseados para ser compacto.
La gran mayora de lo que son reconocidos convencionalmente como
pseudogenes humanos son copias de genes codificadores de protenas,
simplemente
porque es relativamente fcil de identificar ellos (mediante la bsqueda de
frameshifting, las mutaciones del sitio de empalme, y as sucesivamente). Hay
mas que
8000 diferentes copias de pseudogenes procesados de codificacin de protenas
genes en el genoma humano, adems de ms de 4000 nonprocessed
pseudogenes (ver la base de datos en el pseudogen
http://www.pseudogene.org). Slo alrededor del 10% de la 21000 humana
genes que codifican protenas tienen al menos un pseudogen procesado, pero
genes altamente expresados tienden a tener mltiples pseudogenes procesados.
Por ejemplo, la protena ribosomal citoplsmica contiene 95 funcional
genes que codifican 79 protenas diferentes (16 genes se duplican) y
2090 pseudogenes procesados.
pseudogenes ARN son a menudo difciles de identificar como pseudogenes
(No hay un marco de lectura de inspeccionar, y los genes de ARN a menudo
carecen de
intrones). Sin embargo, las copias de pseudogenes de muchos ARNs pequeos
son
comn (vase la tabla siguiente), sobre todo si son transcritos por la ARN
polimerasa III (genes transcritos por la ARN polimerasa III tienen a menudo
promotores internos).
Como se describe en la Seccin 12.4, la repeticin Alu, el ms
abundantes secuencia en el genoma humano, parece haberse originado
mutacional
flexibilidad
transcripcin
y el procesamiento
marcha atrs
transcriptasa
mutacin
cromosmico
integracin
ARNm
ADNc
promotor
inactivando
mutacin
no inactivante
mutacin
Figura 1 Orgenesdenonprocessedyprocesado
pseudogenes. (A) La copia de ADN genmico
secuencia que contiene el gen A puede producir duplicado
copias de las necesidades de presin de seleccin Fuerte gen A.
para ser aplicado a una de las copias para mantener
la funcin de genes (flecha en negrita), pero la otra copia
se puede permitir que mutar (flecha discontinua). Si se
recoge inactivacin de las mutaciones (crculos rojos), una
puede surgir pseudogen nonprocessed (YA).
(B) Un procesado pseudogene surge despus celular
transcriptasas inversas convertir una transcripcin de un gen
en un ADNc que luego es capaz de integrarse de nuevo en
el genoma (vase la figura 9.12 para ms detalles). La falta
secuencias de importantes tales como un promotor generalmente
resulta en una copia del gen inactivo.
ARN de la familia
Nmero de
genes humanos
Cantidad de trastornos
pseudogenes
U6 snRNA
49 800
U7 snRNA
1
85
Y ARN
41000
Recuadro 9.2 Los orgenes, la prevalencia y la funcionalidad de pseudogenes
pgina 19
273
transcripciones tales como ARNm para hacer cDNA que luego pueden integrar en
cromosoma
ADN Somal ( Figura9.12 ). Pseudogenes procesados son comunes en
intercaladas
familias de genes (vase la Tabla 9.5).
pseudogenes procesados carecen de una secuencia promotora y por lo general no
son
expresado. A veces, sin embargo, los ADNc copia integra en un cromosoma
sitio de ADN que sucede, por casualidad, ser adyacente a un promotor que puede
conducir
expresin de la copia del gen procesado. La presin de seleccin puede garantizar
que la
de copias de genes procesado contina haciendo un producto gnico funcional,
en cuyo caso
que se describe como un retrogene . Una variedad de retrogenes intronless se
sabe que tienen
Prueba especfica de patrones de expresin y son homlogos tpicamente
autosmicos de una
-intrn que contiene el gen ligado al cromosoma X ( Tabla9.8 ).
Una razn fundamental para retrogenes puede ser un requisito fundamental para
superar la
la falta de expresin de ciertas secuencias ligadas al cromosoma X en los
testculos durante la meiosis masculina.
Durante la meiosis masculina, los cromosomas X e Y se convierten en pares
heterosexuales
la cromatina, la formacin de la altamente condensada y transcripcionalmente
inactiva cuerpo XY .
retrogenes autosmicos pueden proporcionar la sntesis continua de clulas de
testculos de cerTain productos de importancia crucial que ya no son sintetizadas por los genes en
el
muy condensada cuerpo XY.
L
TM CY
un
1
un
2
L una
1
un
2
un
3
TM CY
CY
un
2
un
3
TM CY
un
2
un
2
un
3
TM CY
un
3
un
3
3 UTR
3 UTR
3 UTR
3 UTR
3 UTR
2.2 Mb
segundo
do
mi
UN
GRAMO
F
Y
1
2
3
4
5
67
Y
Y
Y
(UN)
(SEGUNDO)
NF1
17q11.2
10b
(UN)
(SEGUNDO)
13
27b
2q12-q13
15p11.2 (2 copias)
14p11 <> q11
22p11 <> q11
18p11.2
21p11 <> q11
dispersa NF1
pseudogenes
PKD1
16p13.3
Y PKD1
gene
racimo
16p13.11
Y1
Y2
Y3
Y4
Y5
Y6
Figura 9.11 Dispersindenonprocessed
NF1 y PKD1 pseudogenes como consecuencia
de pericentromeric o subtelomrico
inestabilidad. (A) El NF1 neurofibromatosis
transcriptasa
5
AAAA A
norte
3
AAAAAN
norte
AAAAAN
norte
AAAAAN
norte
ARNm
3
TTTT T
norte
5 ADNc
TTTTT TTTT
P
3
5
TTTTTN
norte
5
3
3
5
TTTTTN
norte
5
3
TTTT T
norte
AAAA A
3
5
TTTTTN
norte
AAAAAN
norte
TTTTTN
norte
5
3
Figura 9.12 pseudogenesprocesados
y retrogenes se originan por la inversa
transcripcin a partir de transcritos de ARN.
(A) En este ejemplo, un gen que codifica la protena
con tres exones (E1-E3) se transcribe a partir
un promotor aguas arriba (P), y son intrones
extirpados de la transcripcin para producir un ARNm.
El ARNm se puede convertir entonces naturalmente
en un ADNc de una sola cadena antisentido por
utilizando la funcin de la transcriptasa inversa celular
(Proporcionado por LINE-1 repite). (B) Integracin
del ADNc se prev en escalonada
descansos (indicadas por las flechas rizado) en A-rica
secuencias, pero podran ser asistidos por el
LINE-1 endonucleasa. Si la secuencia A-rica
se incluye en un voladizo 5 , se podra formar
un hbrido con el extremo distal de la poli (T)
del ADNc, facilitando segunda hebra
sntesis. Debido a las pausas escalonadas
durante la integracin, la secuencia insertada
ser flanqueado por repeticiones directas cortas
(Secuencias en caja).
TABLA 9.8 EJEMPLOS DE HUMANO intronless retrogenes Y SUS
PADRES homlogos INTRON CONTAINING
retrogene
Intrn que contiene homlogo
Producto
GK2 en 4q13
GK1 en Xp21
glicerol quinasa
PDHA2 en 4q22
PDHA1 en Xp22
piruvato deshidrogenasa
PGK2 en 6p12
PGK en Xq13
fosfoglicerato quinasa
TAF1L en 9p13
TAF1 en Xq13
caja TATA de unin al factor protena asociada, 250 kD
MYCL1 en 1p34
MYCL2 en Xq22
homlogo de oncogn v-Myc
GLUD1 en 10q23
GLUD2 en Xq25
glutamato deshidrogenasa
RBMXL en 9p13
RBMX en Xq26
ARN-protena de unin importante en el desarrollo del cerebro
pgina 21
275
Sabemos desde hace muchas dcadas que diversas clases ncRNA ubicuas son
esencial para la funcin celular. Hasta hace poco, sin embargo, hemos sido en
gran parte acosbrado a pensar en NcRNA como no mucho ms que una serie de accesorios que
son
necesaria para procesar los genes para producir protenas. ARN de transferencia
son necesarios en el muy
el final de la va, que sirve para decodificar los codones en el ARNm y
proporcionar amino
cidos en el orden en que son necesarias para su insercin en cadenas de
polipptido en crecimiento.
ARN ribosomal son componentes esenciales de los ribosomas, el complejo
ribosoma
fbricas de nucleoprotena de la sntesis de protenas.
Se conocen otros ncRNAs ubicuos para funcionar ms arriba en la va de
garantizar el trabajo de los precursores de ARNm, ARNr, ARNt y. Varios
ARN pequeos son componentes de ribonucleoprotenas complejos involucrados
en diferentes
reacciones de procesamiento, incluyendo corte y empalme, la escisin de rRNA y
tRNA precursores,
y las modificaciones de base que son necesarios para la maduracin del
ARN. Normalmente, estos
ARN funcionan como gua RNAs , por apareamiento de bases con secuencias
complementarias en el
ARN precursor.
Tambin hemos sido siempre consciente de algunas ncRNAs que tienen otras
funciones, tales
como ARN implicados en la inactivacin del cromosoma X y la impresin, y el
componente ARN de
organizacin fueron:
gen 3
adelante
hebra
transcripciones
marcha atrs
hebra
transcripciones
anotado exones
novedosas alquitranes
5
(UN)
(SEGUNDO)
3
3
5
5
3
3
5
ARNs cortos
ARNs cortos
ARNs cortos
antisentido
ncRNA
antisentido
ncRNA
ARNs cortos
ARNsno
ncRNA
miARN
que codifica la protena RNA
Figura 1 difuminacindeloslmitesdegenesaniveldetranscripcin. Enel
pasado,loscuatrogenes
en la parte superior sera de esperar que se comporten como unidades discretas
que no se solapan de transcripcin.
Como se muestra mediante anlisis recientes, la realidad es ms complicada. Una
variedad de transcripciones menudo
enlaces exones en los genes vecinos. Las transcripciones incluyen
frecuentemente secuencias de
regiones transcripcionalmente activas antes insospechados (TAR). [De Gerstein
MB, Bruce C,
Rozowsky JS et al. (2007) Genome Res. 17, 669-681. Con el permiso de Cold
Spring Harbor
Laboratory Press.]
Figura 2 Ampliatranscripcional
la complejidad de los genes humanos. (A) Human
genes se transcriben con frecuencia en tanto
hebras, como se muestra en este gen hipottico
racimo. (B) Un solo gen puede tener mltiples
sitios de inicio transcripcional (flechas en ngulo recto)
as como muchos de codificacin entrelazada y
transcripciones no codificantes. Los exones se muestran como
cajas azules. ARNs cortos conocidos como pequea
ARN nucleolar (snoRNAs) y microRNAs
(MiRNAs) pueden ser transformados a base de intrnica
secuencias y nuevas especies de ARN cortas
que se agrupan alrededor principio y al final
de genes se han descubierto recientemente (ver
el texto). [De Gingeras TR (2007) Genome
Res. 17, 682-690. Con el permiso de fro
Spring Harbor Laboratory Press.]
CAJA 9.4 REVISIN DEL CONCEPTO DE UN GEN EN LA ERA
POST GENOME
pgina 23
277
La figura 9.13 daunaperspectivamodernasobreladiversidadfuncionalde
ARN. En
esta seccin se consideran las funciones de genes y las organizaciones de los
diferentes
clases de ARN humano ( Tabla9.9 ). Numerosas bases de datos se han
desarrollado
recientemente para documentar datos sobre ncRNAs ( Tabla9.10 ).
Ms de 1000 genes humanos codifican un rRNA o tRNA, la mayora
dentro de grandes grupos de genes
los genes del RNA ribosomal
Adems de las dos molculas de ARNr mitocondrial (12S y 16S rRNA), hay
cuatro tipos de citoplsmico rRNA, tres asociados con el gran ribosoma subunidad (28S, 5.8S y 5S rRNAs) y otro con la subunidad pequea del ribosoma
(18S
rRNA). Los genes 5S rRNA se producen en pequeos grupos de genes, siendo la
ms grande de un clster
piRNA
endo-siRNA
RNasa
MRP
empalme
RNasa P
de pre-tRNA
scaRNA
de snRNA
ARNsno
de rRNA
RNasa MRP
U1 snRNA
U2 snRNA
basado en RNAi
silenciamiento gnico
miARN
ARNs largos como
trans -actuando
reguladores
AIRE CALIENTE
ARN largos en
cis -antisense
regulacin
TSIX
especfico
empalme
regulador
HBII-52
ARNsno
AIRE
endo-siRNA
epigentica
gene
regulacin
XIST
H19
HBII-85
ARNsno
ARN SRA1
ARN 7SK
de pre-rRNA
Figura 9.13 LadiversidadfuncionaldeARN. VariosARNubicuosfuncionar
ensusactividadesdelimpiezaenlasclulasyenlasntesisdeprotenas
y exportacin de protenas a partir de clulas (usando 7SL ARN, el componente
ARN de la partcula de reconocimiento de seal). ARN implicados en el ARN
la maduracin incluyen spliceosomal pequeos ARN nucleares (snARN),
pequeos RNAs nucleolar (snoRNAs), pequeos RNAs cuerpo Cajal (scaRNAs),
y dos ribonucleasas de ARN. la sntesis de ADN de los telmeros se lleva a cabo
por una ribonucleoprotena que consiste de TERC (el ARN de telomerasa
componente) y una transcriptasa inversa (vase la Figura 2.13). La familia Y
RNA estn implicadas en la replicacin del ADN cromosmico, y RNasa
MRP tiene un papel crucial en la iniciacin de la replicacin del ADNmt, as
como en la escisin de precursores de pre-rRNA en el nucleolo. Diversas clases
de
ARN tienen una funcin reguladora en la expresin gnica. Aunque algunos
tienen funciones accesorias generales en la transcripcin, reguladora
ARN a menudo se componen en su expresin a determinados tipos de clulas y /
o etapas de desarrollo. Tres clases de pequeos ARN uso de ARN
de interferencia (RNAi), los caminos para actuar como reguladores: Piwi ARNprotena interaccin (piRNAs) regulan la actividad de los transposones en
Las clulas de la lnea germinal; microARN (miARN) regulan la expresin de los
genes diana; y corto de interferencia ARN endgenos (endo-siRNAs)
actuar como reguladores de genes y tambin regular algunos tipos de
transposn. Algunos miembros de la familia, tales como ARNsno HBII-85,
ARNsno
estn implicados en la regulacin epigentica de los genes. Un gran nmero de
ARNs largos estn involucrados en la regulacin de varios genes, a menudo en el
nivel de la transcripcin. Algunos se sabe que estn implicados en la regulacin
epigentica de los genes en la impronta, X-inactivacin, y as
sucesivamente. ARN
familias se muestran en tipo negro; ARNs individuales se muestran en rojo.
genes de ARN
pgina 24
subfamilia
No. de
diferente
tipos
Funcin
organizacin de genes, la biognesis, etc.
ribosomal
RNA (rRNA),
120-5000
nucletidos
12S rRNA, 16S rRNA
1 de cada
componentes de los ribosomas mitocondriales
escindido a partir de transcritos producidos multignicas
por H hebra de ADN mitocondrial (Figura 9.3)
5S rRNA, 5.8S rRNA,
18S rRNA, 28S rRNA
1 de cada
componentes de los ribosomas citoplasmticos
5S rRNA es codificada por mltiples genes en
varios grupos de genes; 5.8S, 18S, y 28S
rRNA se escinden de transcripciones multignicas
(Figura 1.22); los multigenic 5.8S-18S-28S
unidades de transcripcin se repiten en tndem en
cada uno de 13p, 14p, 15p, 21p, 22p y (= ADNr
clusters)
Transferir
RNA (tRNA),
70-80
nucletidos
familia mitocondrial
22
decodificar ARNm mitocondrial para hacer 13
protenas en los ribosomas mitocondriales
los genes de una sola copia. tRNAs se escinden de
transcripciones de ADNmt multignica (Figura 9.3)
familia citoplasmtica
49
mRNA decodificacin producido por genes nucleares
(Figura 9.13)
700 genes y pseudogenes de ARNt dispersado
retculo endoplsmico
tres genes estrechamente relacionados agrupados en
14q22
TERC (telomerasa
componente ARN)
1
componente de la telomerasa, la
ribonucleoprotena que sintetiza
ADN telomrico, utilizando TERC como plantilla
(Figura 2.13)
gen de una sola copia en 3q26
ARN bveda
3
componentes de la bveda RNP citoplasmticos
que se han pensado para funcionar en
resistencia a las drogas
VAULTRC1, VAULTRC2 , y VAULTRC3 son
agrupada en 5q31 y compartir secuencia de 84%
identidad
Y ARN
4
componentes de la 60 kD Ro
ribonucleoprotena, un objetivo importante de
respuestas autoinmunes humorales
RNY1, RNY3, RNY4 , y RNY5 se agrupan en
7q36
pgina 25
279
Transferir genes de ARN
Las 22 ARNt mitocondriales diferentes son hechas por 22 genes de ARNt en el
ADNmt. los
listas de bases de datos genmica tRNA ms de 500 genes de ARNt humanos que
hacen que un cytoplasARNt micrfono con una especificidad definida anticodn. Los genes se pueden
clasificar en 49
familias sobre la base de la especificidad anticodn ( Recuadro9.5 ). Slo hay
una correlacin aproximada
relacin de nmero de genes tRNA humana con la frecuencia de
aminocidos. Por ejemplo,
30 genes de ARNt especifican el aminocido cistena comparativamente raros
(que
cuentas para el 2,25% de todos los aminocidos en las protenas humanas), pero
slo 21 genes de ARNt
especificar la prolina ms abundante (que tiene una frecuencia de 6,10%).
Aunque los genes de ARNt parecen estar dispersos por todo el genoma humano,
ms de la mitad de los genes de ARNt humanos (273 de 516) residen en cada
cromosoma
un 6 (con muchas agrupadas en una regin de 4 Mb en 6P2) o el cromosoma 1.
En Adems
cin, 18 de la 30 Cys tRNAs se encuentran en un tramo de 0,5 Mb del
cromosoma 7.
CUADRO 9.10 PRINCIPALES no codificante ARN BASES DE DATOS
Base de datos
Descripcin
URL
NONCODE
base de datos integrada de todos los ncRNAs excepto ARNr y ARNt
http://www.noncode.org
base de datos de ARN no codificante
secuencias y funciones de las transcripciones no codificantes
http://biobases.ibch.poznan.pl/ncRNA/
RNAdb
base de datos completa de ARN no codificante de mamferos
http://research.imb.uq.edu.au/rnadb/
Rfam
familias de ARN no codificante y la secuencia de alineaciones
http://rfam.sanger.ac.uk/
Anticode
base de datos de transcripciones antisentido naturales
http://www.anticode.org
sno / scaRNAbase
nucleolar RNAs pequeos y pequeos RNAs de cuerpo especfico Cajal
http://gene.fudan.sh.cn/snoRNAbase.nsf
ARNsno-LBME-db
snoRNAs humanos integrales
http://www-snorna.biotoul.fr/
Base de datos genmica tRNA
secuencias completas de ARNt
http://lowelab.ucsc.edu/GtRNAdb/
Recopilacin de las secuencias de ARNt
y las secuencias de genes de ARNt
tal y como su nombre indica
http://www.tRNA.uni-bayreuth.de
miRBase
y secuencias de genes miARN genes diana
http://microrna.sanger.ac.uk/
piRNAbank
secuencias conocidas empricamente y otra informacin relacionada
en piRNAs reportados en diversos organismos, incluyendo humanos,
ratn, rata, y Drosophila
http://pirnabank.ibab.ac.in/
TABLA 9.9 cont. clases principales de ARN no codificante HUMANO
clase de ARN
o subclase
evolutivo/
funcional
subfamilia
No. de
diferente
tipos
Funcin
organizacin de genes, la biognesis, etc.
MicroARN
(MiARN),
22 nucletidos
> 70 familias de
miRNAs relacionados
1000
varias funciones importantes en el gen
Reglamento, en particular en el desarrollo,
e implicado en algunos cnceres
vase la figura 9.17 para ejemplos de genoma
organizacin, y la Figura 9.16 para la forma en que son
sintetizado
Po de unin a ARN
(PiRNA), 24-31
nucletidos
89 persona
racimos
> 15.000
menudo derivado de repeticiones; expresada
slo en las clulas de la lnea germinal, donde
limitar el exceso de actividad transposn
UAA 7
UUG
CAA 7
Phe
Leu
UCU
11 AGA
UCC
GGA UCA
UGA 5
UCG
CGA 4
Ser
UAU
AUA 1
UAC
GUA 14
UAA
UUA UAG
CUA Tyr
detener
detener
UG
ACA UGC
ACG 30
UGA
UCA - (3)
UGG
CCA 9
Cys
detener
Trp
CUU
AAG 12
CUC
GAG CUA
UAG 3
CUG
CAG 10
Leu
CCU
AGG 10
CCC
GGG CCA
UGG 7
CCG
CGG 4
Pro
CAU
a AUG CAC
GUG 11
CAA
UUG 11
CAG
CUG 20
Su
gln
UGE
ACG 7
CGC
GCG CGA
UCG 6
CGG
CCG 4
Arg
AUU
AAU 14
AUC
GAU 3
AUA
UAU 5
AGOSTO
CAU 20
Ile
Reuni
ACU
AGU 10
ACC
GGU ACA
UG 6
ACG
UGE 6
Thr
AAU
AUU 2
AAC
GUU 32
AAA
UUU 16
AAG
CUU 17
Asn
Lys
AGU
ACU AGC
GCU 8
AGA
UCU 6
AGG
CCU 5
Ser
Arg
GUU
AAC 11
GUC
GAC GUA
UAC 5
GUG
CAC 16
Val
GCU
AGC 29
GCC
GGC GCA
UGC 9
GCG
CGC 5
Ala
GAU
ABC GAC
GUC 19
GAA
NVND 13
MORDAZA
13 CUC
spid
Glu
GGU
ACC GGC
15 GCC
GGA
UCC 9
GGG
CCC 7
Gly
Figura 1 Msde500diferentehumana
ARNt citoplasmticos decodificar los 61
los codones que especifican el 20 estndar
aminocidos. Las relaciones entre
los 64 codones posibles (posicionado prximo
a los aminocidos de la izquierda de los cuatro
principales columnas) y la correspondiente
anticodones (a la derecha de los cuatro
columnas) se muestran. El nmero al lado de
cada anticodn es el nmero de diferentes
ARNt humanos que se documentan en el
Genmica tRNA base de datos (ver Tabla 9.9)
como en libros que anticodn. Tenga en cuenta que 12
de los 61 anticodones capaces de reconocer
los codones que especifican el 20 estndar
281
ARNsn molculas se unen diversas protenas y funcionan como
ribonucleoprotenas
(SnRNPs).
Posteriormente, varios snARNs, entre ellos algunos de los primeros en
clasificarse,
se encontr que estar involucrados en el procesamiento post-transcripcional de
precursores rRNA
en el nuclolo; Por lo tanto, se re-clasificados como pequeos ARN nucleolar
( SnoRNAs ), por ejemplo U3 y U8 snoRNAs. Ms recientemente, miembros de
la
las clases se ha basado en la clasificacin estructural y funcional.
Un tercer grupo de pequeos RNAs han sido identificados pero que se asemejan
a snoRNAs
se limitan a los rganos Cajal (tambin llamados cuerpos en espiral ), estructura
nuclear discreta
turas en el ncleo que estn estrechamente relacionados con la maduracin de
snRNPs.
Se han llamado ARN pequeos de cuerpo Cajal ( scaRNAs ). Cientos de su
mayora
genes humanos dispersos se dedican a hacer snRNA y ARNsno, y hay
muchos cientos de pseudogenes asociados.
UUUUU
(SEGUNDO)
El sitio de LSM
3 madre
casquillo MPG
Figura 9.14 EstructurasdetipoSmysnARNsspliceosomaldetipoLSM.
De tipo Sm (A) snARNs contienen tres elementos de reconocimiento
importantes: una
5 -trimethylguanosine (TMG) gorra, un sitio de unin a protenas Sm (Sm
sitio), y
una estructura de tallo-bucle 3 . Se requieren el sitio Sm y los 3 elementos
madre
para el reconocimiento por el complejo de la supervivencia de las neuronas
motoras (SMN) para el montaje
en ribonucleoprotenas bsicas estables (RNPs). El consenso sitio Sm dirige el
montaje de un anillo de las siete protenas Sm bsicos (vase el cuadro 9.10). El
TMG tope
y se requieren las protenas del ncleo Sm reunidos para el reconocimiento por el
nucleares
maquinaria de importacin. (B) de tipo snARNs Lsm contienen un 5
-monomethylphosphate
guanosina (MPG) gorra y un vstago 3 , y terminan en un tramo de uridina
residuos (el sitio LSM) que est obligado por las siete protenas del ncleo LSM.
genes de ARN
pgina 28
OH
P
gorra
la casilla D
la casilla D
5
5
5
3
3
3
casilla C
casilla C
Nueva York
Nueva York
Anann
H cuadro
ACANNN
OH
cuadro de ACA
Figura 9.15 Estructurayfuncinde
snoRNAs. (A) / D cuadro snoRNAs gua C
- 2 O modificaciones metilacin. La caja
C y D y motivos a 5 , 3 -terminal
STEM formada por el apareamiento de bases intrastrand
(Que se muestra como una serie de roja horizontal corta
lneas) constituyen un motivo estructural al retorcimiento su vez
que est especficamente reconocido por la
15,5 kD snoRNP. El C y D cajas
representar interna, con frecuencia imperfecta
copias de las cajas C y D. C / caja de D
snoRNAs y sus ARN de substrato forman una
10 a 21 pb de doble hlice en la que el objetivo
residuo a ser metilado (que se muestra aqu por
la letra m en un crculo) se coloca exactamente
cinco nucletidos aguas arriba de la D o D
caja. R representa la purina. (B) la casilla H / ACA
snoRNAs guiar la conversin de uridines
a Pseudouridine. Estos ARN se pliegan en una
horquilla-bisagra-horquilla-cola estructura. Uno
o ambas de las horquillas contiene una interna
283
15. algunas funciones no estndar se conocen ni esperan para algunos genes
snoRNA
que no tienen secuencias complementarias a las secuencias de rRNA. Por
ejemplo, el
HBII-52 snoRNA tiene una secuencia de 18 nucletidos que es perfectamente
complementaria
a una secuencia dentro de la HTR2C gen (serotonina 2c receptor) en XP24, y
regula splicing alternativo de este gen. Los vecinos HBII-85 snoRNAs
recientemente han sido implicados en la patognesis del sndrome de PraderWilli
(OMIM 176270).
genes de ARN pequeo cuerpo Cajal
Los scaRNAs asemejan snoRNAs y realizan una funcin similar en la
maduracin del ARN,
pero sus objetivos son snARNs spliceosomal y realizan modifica- especfica del
sitio
cationes de precursores snRNA spliceosomal en los rganos de Cajal del ncleo.
Hay por lo menos 25 genes humanos, cada especificacin de un tipo de
scaRNA. Me gusta
snoRNA genes, los genes scaRNA se encuentran normalmente dentro de los
intrones de los genes
transcrito por la ARN polimerasa II.
Cerca de 1000 microARN humanos diferentes regulan conjuntos complejos
de los genes diana por emparejamiento de bases a las transcripciones de
ARN
Adems de ARNt, hemos conocido desde hace algn tiempo acerca de una
variedad de otros mo-
RNA pin que se escinde inicialmente a partir del transcrito primario por una
RNasa nuclear
III (conocido como Rnasen o Drosha) para hacer un corto de doble cadena premiARN
que es transportado fuera del ncleo ( Figura9.16 ). A citoplsmica RNasa III
llamado
Dicer corta el pre-miARN para generar un dplex miARN con voladizo
3 dinucletidos.
Un complejo de silenciamiento inducido por ARN especfico (RISC) que
contiene el endoriboArgonaute nucleasa se une el dplex miARN y acta con el fin de desenrollar el
double de cadena miARN. La protena Argonaute entonces degrada uno de los ARN
hebras (la hebra de pasajeros ) para dejar el miARN maduro de una sola cadena
(conocida
como la hebra gua ) unido a Argonaute. Los asociados miRNP maduros con
ARN
transcripciones que tienen secuencias complementarias a la hebra gua. La Unin
de miARN para orientar la transcripcin normalmente implica un nmero
significativo de errores de base
partidos. Como resultado, un miARN tpico puede silenciar la expresin de
cientos de
genes diana en la misma forma que una transcripcin de protena especfica de
tejido
factor puede afectar a la expresin de mltiples genes diana al mismo tiempo ver
la seccin de los objetivos de la base de datos miRBase aparece en la Tabla 9.9.
Para identificar ms genes miARN, nuevos programas de bioinformtica
computacionales
weredeveloped para detectar secuencias del genoma. Bymid-2009, ms de 700
humana
los genes miARN haban sido identificados y validados experimentalmente, pero
comparativa
genmica anlisis indican que el nmero de tales genes es probable que aumente.
Algunos de los genes miARN tienen sus propios promotores individuales; otros
son parte de
genes de ARN
pgina 30
inducir la metilacin del ADN. Como resultado, la expresin gnica puede ser
silenciado durante largos perodos para limitar, por ejemplo, las actividades
de transposones.
Aunque las clulas de mamferos tienen vas de interferencia de ARN,
la presencia de ARN de doble cadena activa una respuesta de interfern
que hace que no especfica de silenciamiento gnico y la muerte celular. Esto es
descrito en el captulo 12 cuando consideramos el uso de ARN de interferencia
como una herramienta experimental para producir el silenciamiento especfico de
preseleccionados genes diana. En tales casos, artificialmente sintetizado corto
ARN de doble cadena se utiliza para desencadenar gnica basada en RNAi
silenciamiento.
Figura 1 RNAdeinterferencia. Largasdedoblecadena(ds)ARNseescinde
porcitoplasmtica
dicer para dar siRNA. ARNsi dplex estn obligados por complejos Argonaute
que desenrollan la
dplex y degradar una hebra para dar un complejo activado con una sola hebra de
ARN. Por
apareamiento de bases con secuencias de ARN complementarias, el siRNA gua
complejos Argonaute
para reconocer secuencias diana. Activado RISC complejos escindir cualquier
cadena de ARN que es
complementaria a su lmite siRNA. El ARN escindido se degrada
rpidamente. Activado
RITS complejos utilizan su siRNA para unirse a cualquier ARN complementaria
recientemente sintetizada
y luego atraer protenas, tales como histonas methyltransferases (HMT) y algunas
veces DNA
metiltransferasas (Dnmt), que pueden modificar la cromatina para reprimir la
transcripcin.
CAJA 9.6 ARN de interferencia COMO MECANISMO DE DEFENSA
CELULAR
ARN largo ds
jugador
siRNA
gorra
poli (A)
gorra
poli (A)
gorra
poli (A)
ADN
ARN degradado
activada RISC
Hace + Otros
protenas RISC
RITS activados
Hace + Otros
protenas RITS
DNMT
HMT
metilacin de las histonas
la metilacin del ADN
la transcripcin reprimidos
pgina 31
285
ARN pol II
compleja RNASEN
complejo Dicer
compleja ARGONAUTE
gorra
poli (A)
pri-miARN
pre-miARN
pre-miARN
dplex miARN
miARN
ncleo
MIR
(UN)
citoplasma
un grupo miARN y se escinde de un multi-miARN transcripcin comn
unidad ( Figura9.17A ). Otra clase de genes miARN formar parte de un
compuesto
unidad de transcripcin que se dedica a hacer otros productos, adems de
miARN, o bien otro tipo de NcRNA (Figura 9.17B) o una protena (Figura
9.17C).
Muchos miles de diferentes piRNAs y siRNAs endgenos
suprimir la transposicin y regular la expresin gnica
El descubrimiento de miRNAs fue inesperado, pero ms tarde se hizo evidente
que los miRNAs
do
un
gramo
un
u
do
u
pri-miARN
u caaguaa ccaggauaggcu gu
GCA guucauu gguucuaucc ggua
gramo
California
gramo
gramo
u
do
do
do
un
u
do
u
pre-miARN
u ccaggauaggcu caaguaa
uucaaguaauccaggauaggcu
5
3
3
5
GCA guucauu gguucuaucc
u
do
u
dplex miARN
miARN
compleja RNASEN
complejo Dicer
compleja ARGONAUTE
genes de ARN
Figura 9.16 miARNhumanosntesis. (A)Esquemageneral.Eltranscrito
primario,primiARN,tieneunatapa5
(metro
7
GpppG) y una cola 3 poli (A). precursores miARN tienen un prominente
estructura de doble cadena de ARN (ARN
horquilla), y el procesamiento se produce a travs de las acciones de una serie de
complejos de ribonucleasa. En el ncleo,
Rnasen, el homlogo humano de Drosha, escinde el pri-miARN para liberar el
ARN de horquilla (pre-miARN); esta
a continuacin, se exporta al citoplasma, donde se escinde por la enzima Dicer
para producir un dplex miARN.
El ARN dplex est unido por un complejo Argonaute y la hlice se desenrolla,
con lo cual una hebra (el
de pasajeros ) es degradada por la ribonucleasa Argonaute, dejando el miARN
maduro (la hebra gua ) unido
a Argonaute. MIR, genes miARN. (B) Un ejemplo concreto: la sntesis de miR26A1 humano. repeticiones invertidas
(Muestran como secuencias resaltados overlined por flechas largas) en el primiARN se someten emparejamiento de bases para formar
una horquilla, por lo general con unos pocos desajustes. Las secuencias que van a
formar la hebra gua madura se muestran en la
rojo; las de la hebra de pasajeros aparecen en azul. La escisin por tanto la
Drosha y Dicer humana (verde
flechas) es normalmente asimtrica, dejando un dplex de ARN con
sobresaliendo por 3 dinucletidos.
pgina 32
poli (A)
miR-192-1-171819a2019b
gorra
poli (A)
miR-198 en FSTL1 ARNm 3 UTR
miR-106b9325 en MCM7 pre-ARNm intrn
(DO)
gorra
poli (A)
miR-15a16-1 en dLEU2 NcRNA intrn
gorra
poli (A)
horquilla de ARN
exonic
ARN codificante
exonic
ARN no codificante
ARN intrnica
Figura 9.17 Laestructuraprimariadelserhumano
miRNAs. (A) Ejemplos de transcripciones que se
utilizado exclusivamente para hacer miRNAs: miR-21
se produce a partir de una sola horquilla dentro de una
dedicado RNA transcrito primario;
una nica transcripcin multignica con seis
horquillas que finalmente se escinde para
dar seis miRNAs, a saber, el miR-17, miR-18,
miR-19a, y as sucesivamente. (B, C) Ejemplos de
miRNAs que son co-transcritos con un gen
codificacin o bien (B) un largo ARN no codificante
(NcRNA) o (C) un polipptido. En cada parte,
el ejemplo superior muestra miRNAs individuales
situado dentro de (B) un exn de un ncRNA
(MiR-155) y (C) en el 3 no traducida
regin (UTR) dentro de un exn terminal de una
ARNm (miR-198). Los ejemplos inferiores muestran
miRNAs mltiples ubicados dentro intrnica
secuencias de (B) un NcRNA (miR-15a y
miR-16-1) y (C) un pre-mRNA (miR-106b,
miR-93 y miR-25). Gorra, m
7
G (5 ) ppp (5 )
287
Ms de 3000 genes humanos sintetizan una amplia variedad de
medianas a grandes ARN regulador
Muchos miles de diferente largo ncRNAs, a menudo muchos kilobases de
longitud, son
Tambin cree que tienen un papel regulador en las clulas animales. Incluyen
antisentido transcripts que por lo general no se someten a corte y empalme y que pueden regular
la superposicin
transcripciones sentido, adems de una amplia variedad de largos ncRNAs
mRNA similar a que se someten
nivelacin, corte y empalme y poliadenilacin, pero no parecen codificar
cualquier considerable
polipptido, aunque algunos contienen ncRNAs internos tales como snoRNAs y
piRNAs. Las funciones de la gran mayora de la ARNm como ncRNAs son
desconocido. Algunos, sin embargo, son conocidos por ser especfica de tejido y
que participan en el gen
regulacin. Recientemente, en un esfuerzo sistemtico para identificar ncRNAs
largos, 3300 diferente
ncRNAs largos humanos fueron identificados como la asociacin con la
cromatina modificacin
complejos, lo que afecta la expresin gnica.
Algunos ncRNAs largo de ARNm-como que estn implicados en la regulacin
epigentica tienen
sido ampliamente estudiado. El XIST gen codifica una larga NcRNA que regula
inactivacin del cromosoma X, el proceso bywhich uno de los dos cromosomas
X
se selecciona al azar para ser condensado en mamferos hembras, con grandes
regiones
convertirse en transcripcionalmente inactiva. Muchos otros ncRNAs largos,
como el H19
ARN, estn implicados en la represin de la transcripcin de cualquiera de los
paterno o
alelo materno de muchas regiones autosmicos ( imprinting ). Estos ARNmcomo
ncRNAs son a menudo regulado por los genes que producen lo que puede ser
muy largo anti-
Algunos de los ARN funcionales, tales como XIST y aire, que no han sido tan
bien
conservado durante la evolucin. Las secuencias funcionales de mayor evolucin
en el
genoma humano incluye componentes de ncRNAs largos primates especficos
que son
fuertemente expresado en el cerebro. Consideramos las implicaciones evolutivas
de tales
genes en el captulo 10.
**
**
**
yA
yA
UN
yA
5
horquilla
UN
+
jugador
21-nucletido
siRNA
RISC
mRNA divisin
duplicacin
y
inversin
duplicacin
retrotransposicin
ARN
ARNm
transcrito antisentido
5
5
ncleo
citoplasma
Figura 9.19 Lospseudogenespuedenregular
la expresin de su gen de la matriz
por vas de siRNA endgenos.
1 exn
regulador antisentido de XIST
H19
2.3 kb
11p15
5 exones que abarcan 2,67 kb
involucrado en la impronta en el 11p15 clster impresa
asociado con el sndrome de Beckwith-Wiedemann
KCNQTOT1 (= LIT1)
59.5 kb
11p15
1 exn
regulador de antisentido en el clster impreso en 11p15
PEG3
1,8 kb
un
19q13
nmero variable de exones, pero
hasta 9 exones que abarcan 25 kb
maternalmente impreso y se sabe que la funcin de tumor
supresin por p53 activacin
AIRE CALIENTE
2.2 kb
12q13
6 exones que abarca 6,3 kb
trans gen regulador-actuando; aunque parte de una
regin reguladora en el HOX-C clster en 12q13, HOTAIR
RNA reprime la transcripcin de una regin 40 kb en el
HOX-D grupo en el cromosoma 2q31
un
isoformas mayores.
pgina 35
289
9.4 de ADN altamente repetitivas: HETEROCROMATINA
Y repite transposn
Los genes contienen algunas secuencias repetitivas de ADN, incluyendo el ADN
de codificacin repetitiva.
Sin embargo, la mayora de las secuencias de ADN altamente repetitivas se
producen genes externos.
Algunas de las secuencias estn presentes en ciertas regiones subchromosomal
como gran
segundo
a menudo cientos de
kilobases
asociado con la heterocromatina
un (ADN alfoide)
171 pb
heterocromatina centromrica de todos los cromosomas
b ( Sau familia 3A)
68 pb
en particular, la heterocromatina centromrica de 1, 9, 13, 14, 15,
21, 22, e Y
satlite 1
25-48 pb (rica en AT)
heterocromatina centromrica de la mayora de los cromosomas y
otras regiones heterocromatnicas
satlite 2
formas divergentes de
ATTCC / GGAAT
la mayora de, posiblemente todos, cromosomas
satlite 3
ATTCC / GGAAT
13p, 14p, 15p, 21p, 22p, y heterocromatina en 1q, 9Q,
y Yq12
DYZ19
125 kb bp400 en Yq11
DYZ2
Rica en AT
Yq12; mayor periodicidad de 2470 pb
ADN minisatlite
0,1-20 kb
en o cerca de los telmeros de todos los cromosomas
minisatlite telomrica
TTAGGG
todos los telmeros
minisatlites hipervariables
9-64 pb
todos los cromosomas, asociados a la eucromatina, sobre todo en
regiones sub-telomricas
ADN microsatlite
<100 pb
menudo 1-4 pb
repetir, pero slo una pequea minora de repeticiones de transposones son una
transposicin de forma activa.
Segn el mtodo de la transposicin, las repeticiones pueden ser organizados en
dos
grupos:
Los retrotransposones (tambin abreviado como retroposones ). Aqu la copia
nismo
meca- se asemeja a la forma en que procesan pseudogenes y retrogenes son
generado (vase la figura 9.12): transcriptasa inversa convierte un transcrito de
ARN
del retrotransposn en un ADNc copia que luego se integra en el genoma
ADN en una ubicacin diferente. Tres clases principales de mamferos utilizan
transposn
este mecanismo de copiar y pegar: elementos nucleares largos perodos de
actividad (lneas),
elementos cortos intercalados nucleares (Sines), y elementos similares a
retrovirus
que contiene repeticiones terminales largas.
transposones de ADN . Los miembros de esta cuarta clase de transposn migran
directamente
sin ninguna copia de la secuencia; la secuencia se escinde y luego reinsertado en otro lugar en el genoma (un mecanismo de cortar y pegar).
Los elementos transponibles que se incorporen las independiente se describen
como
autnoma ; aquellos que no pueden se conocen como no autnoma ( Figura
9.20 ). De
las cuatro clases de elemento de transposicin, lneas y Sines
predominan; nosotros
describirlos con ms detalle a continuacin. Las otras dos clases se describen
brevemente
aqu.
pgina 37
291
transposones LTR humanos
transposones LTR incluyen elemento autnomo y no autnomo similar a
retrovirus
mentos que estn flanqueadas por repeticiones terminales largas (LTR) que
contienen necesario
elementos reguladores de la transcripcin. secuencias retrovirales
endgenas contienen gag
60.000
retrovirus (transposones LTR)
familias HERV
MaLR240,000
285.000
autnomo
no autnoma
ORF1 ORF2 ( pol )
(UN)
norte
(UN)
norte
P
P
6-8 kb
100-400 pb
6-11 kb
1,5-3 kb
80 bp-3 kb
2-3 kb
LTR
LTR
LTR
LTR
gag pol (env)
(mordaza)
transposasa
Figura 9.20 transposnmamferos
familias. Slo una pequea proporcin de
miembros de cualquiera de transposn se ilustra
familias pueden ser capaces de transposicin;
muchos han perdido esa capacidad despus de
la adquisicin de mutaciones que inactivan, y muchos
son copias truncadas cortos. Las subclases de
las cuatro familias principales se enumeran, junto con
los tamaos en pares de bases. ORF, el marco de lectura abierto.
[Adaptado de Genoma Humano Internacional
Consorcio de Secuenciacin (2001) Naturaleza 409,
860-921. Con el permiso de Macmillan
Publishers Ltd.]
ADN altamente repetitivo: la heterocromatina como transposn REPEATS
pgina 38
TTTTTT
UN
segundo
monmero izquierda
elemento de repeticin (B) Alu
5 UTR
3 UTR
ORF1
ORF2
(A) elemento LINE-1 repeticin
monmero derecha
32 pb
p40
endonucleasa
marcha atrs
transcriptasa
Pensilvania
Figura 9.21 ElLINE1humanayAlu
repetir elementos. (A) El 6,1 kb LINE-1
elemento tiene dos marcos de lectura abiertos: ORF1,
un marco de lectura abierto de 1 kb, codifica p40,
una protena de unin al ARN que tiene una nucleico
actividad chaperona de cidos; el 4 kb ORF2
especifica una protena con tanto endonucleasa
y revertir las actividades de la transcriptasa. UN
promotor interno bidireccional se encuentra dentro de
la regin no traducida 5 (UTR). En el
otro extremo, hay una A
norte
/T
norte
secuencia, a menudo
descrito como el 3 poli (A) de la cola (pA). los
LINE-1 endonucleasa corta una hebra de un
Dplex de ADN, preferiblemente dentro de la secuencia
TTTTA, y los usos de la transcriptasa inversa
la largada 3 finales -OH en ADNc de primera
sntesis. Nuevos sitios de insercin estn flanqueadas
por una duplicacin pequeo sitio de destino de
2-20 pb (que flanquean puntas de flecha negras).
(B) Un dmero Alu. Los dos monmeros tienen
293
que contiene slo una de las dos repeticiones en tndem, y varias versiones
truncadas
de dmeros y monmeros tambin son comunes, dando un promedio de todo el
genoma
230 pb.
Mientras que SINE como el MIR (mamferos de toda la repeticin intercalados)
familias
mentiras se encuentran en una amplia gama de mamferos, la familia Alu es de
comparativamente
origen evolutivo reciente y se encuentra solamente en primates. Sin embargo,
sub-Alu
familias de diferentes edades evolutivas pueden ser identificados. En el pasado 5
millones o
por lo aos desde la divergencia de los seres humanos y los simios africanos, slo
alrededor de 5000 cobre
IES de la repeticin Alu han sido objeto de transposicin; la mayora de las
secuencias Alu mviles
son miembros de las subfamilias Y y S.
Al igual que otros mamferos Sines, repeticiones Alu se origin a partir de copias
de ADNc
pequeos ARN transcritos por la ARN polimerasa III. Genes transcritos por la
ARN
polimerasa III tienen a menudo promotores internos, y as copias de ADNc de
transcripciones
llevar con ellos sus propias secuencias promotoras. Tanto la repeticin Alu y,
indetemente, la repeticin del ratn B1 se origin a partir de copias de ADNc de ARN
7SL, la
genoma tiene algunas similitudes con los genomas de procariotas compactas, las
genoma nuclear humano es mucho ms complejo en su organizacin, con
solamente
1,1% de las protenas del genoma de codificacin y 95% que comprende
nonconserved, y
a menudo altamente repetitivo, secuencias de ADN.
La secuenciacin del genoma humano ha revelado que, contrariamente a lo
esperado,
hay relativamente pocos genes codificadores de protenas, aproximadamente
20,000-21,000 de acuerdo
ing con las estimaciones ms recientes. Estos genes varan ampliamente en
tamao e interna
organizacin, con los exones de codificacin a menudo separadas por grandes
intrones, que a menudo
contener secuencias de DNA altamente repetitivas. La distribucin de genes a
travs de la
genoma es desigual, con algunos genes relacionados funcionalmente y
estructuralmente encontrados
en grupos, lo que sugiere que surgieron por la duplicacin de genes individuales
o mayor
segmentos de ADN. Los pseudogenes se pueden formar cuando se duplica un gen
y
a continuacin, una del par acumula mutaciones deletreas, impidiendo su
expresin
sin. Surgen otras pseudogenes cuando un transcrito de ARN se transcribi de
forma inversa y
el ADNc se vuelve a insertar en el genoma.
La mayor sorpresa de la era post-genoma es el nmero y la variedad de la no
ARN codificantes de protenas transcritas del genoma humano. Al menos 85% de
la
genoma euchromatic ahora se sabe que se transcribe. El ncRNAs familiarizado
sabe que tienen un papel en la sntesis de protenas se han sumado otros que
tienen
funciones en la regulacin de genes, incluyendo varias clases prolficos de ARN
regulador diminutos
y miles de diferentes ncRNAs largos. Nuestra visin tradicional del genoma es
siendo revisada radicalmente.