You are on page 1of 38

Anlisis comparativo del transcriptoma de

Escherichia coli y Schizosacchromyces pombe en


dos escenarios metablicos
Autor: Joivier Vichi Lozada, Lic. Microbiologa

Tutor: Dr. Armando Hernndez Mendoza Departamento de Bioqumica-Biologa


Molecular, Centro de Investigacin en Dinmica Celular-UAEM, ahm@uaem.mx

CIDC, Universidad Autnoma del Estado de Morelos IBT_UNAM


Junio_2015

Introduccin

T
F
T
G

ncRN
A

Introduccin
Procariontes

Eucariontes

Hiptesis Realidad

Introduccin
Modelo celular

Escherichia coli
(Procarionte)

Schizosaccharomyces
pombe (Eucarionte)

RNAseq

Bases de
datos
Biolgicos

Nuevas
hiptes
is

Deteccin de genes diferencialmente expresados en


dos condiciones (RNA-seq)
Anlisis de enriquecimiento de genes (GSEA)
Redes de interaccin biolgicas (Bases de Datos:
Regulon DB, Ecocyc, Pombase)
Integracin de datos (Analoga de circuitos regulatorios)

Objetivos
Caracterizar la expresin de mRNAs y sncRNAs de E. coli y S. pombe a partir de
datos de RNA-seq obtenidos en dos condiciones de estudios; crecimiento en
glucosa y crecimiento en glicerol/acetato.
Objetivos especficos
Determinar el conjunto de genes expresados de forma diferencial en E. coli y S. pombe
a partir de datos de RNA-seq obtenidos del crecimiento en glucosa y glicerol/acetato en
medio YE.
Describir la abundancia de transcritos de tipo de sRNAs en E. coli y S. pombe en
condiciones similares de crecimiento.
Inferir analogas en circuitos de regulacin mediadas por sRNAs sobre genes ortlogos
(rutas metablicas o procesos celulares) en los dos organismos.

Diseo
Experimental
Crecimiento
microbiano

Obtencin de Transcriptomas

Anlisis computacional
Y validacin

* Tres rplicas biolgicas por tratamiento

Anlisis Computacional

Anlisis Bioinformtico

1) Anlisis de calidad de
las lecturas
FastQC

2) Alineamiento de secuencias
Bowtie2 / Tophat--> files SAM/BAM

Anlisis de calidad
Q > 34 !!!
Sobrerepresentacin con secuencias
de adaptadores* y ribosomales

Anlisis de los datos de RNA-seq para


las libreras E. coli K-12

samtools sort test.bam test_sorted


# Ordenamiento de las lecturas (sorting )
>samtools rmdup -s test_sorted.bam
test_sortedwodup.bam
# Eliminacin de duplicados pticos
>samtools view -h -F 4 -b test_sorted_wodup.bam >
test_sorted_wodup.mapped.bam
#Eliminacin
>samtools

de lecturas no mapeadas .

index

test_sorted.bam

test_sorted.bai

# Creacin de ndice de ordenamiento


Figura . Caractersticas de las libreras de secuenciacin segn las muestras biolgicas. Library Size
(Conjunto total de lecturas obtenidas), Aligned Reads (Secuencias alineadas al genoma de Escherichia coli
K12), Duplicate ( Nmero de lecturas duplicadas), Ribosamal rRNA(Nmero lecturas que alinean a los genes
ribosomales), Mapped reads (Conjunto de lecturas restantes despus de la elminacin de duplicados de PCR y
artefactos), Mapped to *.ffn (lecturas alineadas a trasncritos anotados), Diferencia (Subconjuntpo de lecturas
generado a partir de la diferencia entre Mapped Reads y Mapped to *.ffn).

Figura . Distribucin de las lecturas de acuerdo a los archivos fastas con las caractersticas de las regiones gnicas anotadas. A Anlisis Global de lecturas en regiones anotadas, utilizando como archivo con extensin .ffn (fasta
feature nucleotides). B Anlisis Global de lecturas en regiones anotadas, utilizando como archivo con extensin .frn (fasta RNA nucleotide).

Similitud entre las muestras


Raw Reads

TMM Normalization

Correlacin entre muestras biolgicas

Eliminacin de variacin no deseada (RUVSeq)

Deteccin de la expresin
diferencial de genes

genes DE (PValue < 0.05): 639


Abs(logFC) >1 && FDR <0.05 : 282
FDR <0.01 && abs (logFC )> 2 :79

logFC

b1264|trpE|
b1886|tar|
b1263|trpD|
b2242|glpB|
b2169|fruB|
b1888|cheA|
b2168|fruK|
b1885|tap|
b2870|ygeW|
b2014|plaP|
b0612|citT|
b1924|fliD|
b3161|mtr|
b2872|ygeY|
b1262|trpC|
b2241|glpA|
b3426|glpD|
b1261|trpB|
b4467|glcF|
b3366|nirD|
b2871|ygeX|
b1702|ppsA|
b2243|glpC|
b2240|glpT|
b1887|cheW|
b1889|motB|
b1260|trpA|
b4468|glcE|
b3365|nirB|
b2167|fruA|
b1189|dadA|

logCPM

LR

PValue

FDR

-4.304774533

9.408531607

115.8710837

5.07219E-27

2.33575E-23

-2.925666748

8.488416304

109.178583

1.48304E-25

3.4147E-22

-3.75703837

9.616499998

104.5451999

1.53648E-24

2.3585E-21

-3.203563689

8.055121677

102.5100502

4.29185E-24

4.94099E-21

3.106164205

9.008816089

101.4804242

7.21732E-24

6.64715E-21

-2.729410282

8.651541516

96.0851024

1.1005E-22

8.44632E-20

2.845625126

8.720455742

93.33173013

4.42245E-22

2.90934E-19

-2.471353257

8.408470555

77.19873316

1.54593E-18

8.89874E-16

-3.561484088

7.638422964

76.61612675

2.07637E-18

1.06241E-15

-2.320664866

7.860382022

75.11594263

4.43868E-18

1.98076E-15

-2.710584911

8.286106708

74.98982861

4.73145E-18

1.98076E-15

-2.450035837

8.025305019

74.81100458

5.18002E-18

1.98783E-15

-2.620156059

9.142777801

74.33706336

6.58554E-18

2.3328E-15

-3.538116805

8.045670793

73.04734773

1.26577E-17

4.05106E-15

-2.743599829

9.480865997

72.96519579

1.31956E-17

4.05106E-15

-2.806297686

8.821792511

72.82993306

1.41317E-17

4.06729E-15

-2.387232314

9.107739656

69.11908008

9.26943E-17

2.51092E-14

-2.563950958

9.319305037

66.72219761

3.12595E-16

7.99723E-14

-2.25432959

8.277264934

63.50825874

1.59696E-15

3.87052E-13

3.535049192

7.234103583

63.12213226

1.94279E-15

4.47327E-13

-2.640708881

7.745024555

62.52375253

2.6325E-15

5.77271E-13

-2.492467424

9.806184304

61.51649821

4.39049E-15

9.19009E-13

-3.313120966

7.824319801

60.78438477

6.36811E-15

1.27501E-12

-3.035567954

7.920056499

60.17637907

8.67268E-15

1.66407E-12

-2.708987307

7.122584119

58.23208756

2.32948E-14

4.29091E-12

-2.638584712

7.431215756

58.06389048

2.53741E-14

4.46966E-12

-2.352083135

8.706840491

58.00039936

2.62065E-14

4.46966E-12

-3.748328382

7.890987958

56.40498981

5.89805E-14

9.70019E-12

3.224582995

10.06350474

55.35716962

1.00503E-13

1.59591E-11

2.109359235

9.37555171

55.18891347

1.09485E-13

1.68059E-11

-2.000697587

8.908996253

52.30544823

4.75055E-13

7.05686E-11

fliA

foraging behavior

Criterio : P-Value

Criterio :FDR

Shen-Orr et. al., 2002

Zaslaver et. al 2006

Kaplan et. al., 2008

Alon, 2007

Zaslaver et. al., 2009

Hart et. al., 2013

Prximos resultados

Asociacin de valores de expresin de :

Unidades transcripcionales
TFs (203)
sRNAs (102)

Establecer correlacin entre interacciones de:

TFs-TU
sRNAs-TUs(TG)

(Kaplan et al. 2008)

Resultados de S. pombe
Replicates

Date
(cDNA)

Personal

Date
(RNA-eq)

Place

Spo

Glucose

14_Nov

8_Ene

UUAB

Spo

Glucose

14_Nov

8_Ene

UUAB

Spo

Glucose

19_Nov

12_Mar

INMEGEN

Spo

Glycerol

19_Nov

12_Mar

INMEGEN

Spo

Glycerol

19_Nov

12_Mar

INMEGEN

Spo

Glycerol

19_Nov

17_Mar

LANGEBIO

Glycerol/Acetate Treatment

Glucose Treatment

Organism Treatment

Resultados de S. pombe
Treatment

Replicates

Library size

Alignment

%_Align

Duplicate

%_Duplicate

*.gtf

Glucose

22,161,836

21,497,523

(97.0024%)

21267185

(95.9631%)

266903

Glucose

15,117,450

12,187,611

(80.6195%)

9746598

(64.4725%)

2841958

Glucose

8,233,805

7,388,841

(89.7379%)

7175834

(87.1509%)

253031

Glycerol

15,024,183

14,081,823

(93.7277%)

13616630

(90.6314%)

554923

Glycerol

15,088,187

13,818,408

(91.5843%)

13371132

(88.6199%)

540828

Glycerol

17,536,997

16,001,532

(91.2444%)

15515978

(88.4757%)

565013

Region

Gene

MTR

SPMTR.0
3.1
SPMTR.0
1.1
SPMTR.0
4.1

MTR
MTR

Gluc_1

Gluc_2

Gluc_3

Glyc_1

Glyc_2

Glyc_3

81

17

207

13

16

15

Correlacin y similitud
entre las muestras

Genes diferencialmente
Expresados (edgeR)
ncRNA 458
Abs(FC) > 1
179 (Glycerol/Acetato)
97 (Glucose)

Solamente ORF (Protenas)


DE -> 579
151 (Glucose)
478 (Gycerol/Acetate)

Comparacin de condiciones
YE (Glucosa 3%)
YE (Glucosa 0.1% / Glicerol 3%)
Diseo Experimental
RNA-seq
Chip-seq (atf1)
TSS
Objetivo : Detectar genes relacionados con atf1

Glucose growth

Glycerol/ Acetate growth

Bsqueda y comportamiento
de genes endgenos

E. coli K-12

gen frr

gen idnT
S. pombe
atb2 (tubulina)

Western blott vs. Ago-1

Protein ladder
kDa

100
70
55
35
25
15
10

Conclusiones Parciales
Los resultados mostraron que aproximadamente un 16% de los genes d
Escherichia coli K-12 se expresan
diferencialmente entre las dos
condiciones de estudios (glucosa vs glicerol/acetato).
La normalizacin por el mtodo de RUVg incremento la similitud entre
rplicas de un mismo tratamiento en los datos obtenidos.

Escherichia coli
(Medio R2A)

T1

T2

Kit Mirvana

RNA total de E. coli , gel de


agarosa al 1%. Izquerda a
derecha:(1) Cultivo en YEGlicerol, (2) Cultivo YEGlucosa. Pellet de 20 ml
de cultivo en cada caso.

RNA total de E. coli a


partir de cultivo
de
glucosa, gel de agarosa al
1%. Izquerda a derecha:(1)
Pellet de 5 ml de, (2) Pellet
de 10 ml de cultivo; (3)
Pellet de 20 ml de cultivo.

Kit Mirvana

RNA total de E. coli a partir


de cultivo de glucosa. PAGE
10% y 8M de Urea. Izquerda
a derecha:(1) Pellet de 5 ml;
(2) Pellet de 10 ml de cultivo;
(3) Pellet de 15 ml de cultivo,
(4) Pellet de 20 ml.

You might also like