You are on page 1of 59

CREANDO UN PROGRAMA

DE MEDICINA GUIADA POR


LA PRECISIÓN DE LOS
DATOS INFORMATICOS
John Quackenbush
Dana-Farber Cancer Institute
Harvard School of Public Health
Antecedentes y Descubrimientos
• Profesor de Bioestadística y Biología
Computacional, Dana-Farber Cancer Institute
• Profesor de Biología Computacional y
Bioinformática, Harvard School of Public Health
• Muchos otros títulos académicos
• Miembro de varios Comités de Consulta
• Co-Founder de GenoSpace, una Compañía de
Software Médico con Precisión Genómica
Toda revolución en la ciencia — desde el
modelo Copernicano heliocéntrico hasta
la aparición de la estadística y la
mecánica cuántica, desde la teoría de
Darwin sobre la evolución y la selección
natural a la teoría del gene — todo ha
sido impulsado por una única cosa: el
acceso a los datos.

–John Quackenbush
Biología Molecular en 7 Palabras
Gen Proteína
ARN

Plegamiento
Regulación

Función Estructura
6

Desarrollo Completo del Genoma Humano


Anunciado en el 26 de Junio del 2000
El Proyecto Genoma ha generado una
“lista de partes” para la célula humana
Los diferentes tipos de células expresan diferentes
conjuntos de genes

Neuronas

Células Tiroideas

Células Pulmonares

Músculo Cardíaco

Células Pancreáticas

Células Renales

Músculo del Esqueleto

Célula de la Piel
Aplicaciones al Cáncer:
Un Estudio de Caso
El Problema
Tumores histológicamente idénticos tienen respuestas y
resultados muy diferentes a los tratamientos

La división en estadíos clínicos se puede utilizar para


predecir la sobrevida, pero las predicciones,
particularmente para los tumores en estadíos medios, no
son precisas.

Nuestra intuición nos dice que los resultados diferentes se


deben correlacionar con los diferentes eventos
moleculares.

La pregunta que surge es si podemos utilizar las


tecnologías inspiradas en el genoma para clasificar los
cánceres humanos de una manera clínicamente útil.
Una Revisión del Microarray

Microarrays miden con qué intensidad se expresa cada gene en la célula

La hipótesis es que diferentes células expresan genes únicos de manera


diferente
Primera Aplicación

Genes identificados que diferencian


la ALL (Leucemia Linfocítica Aguda)
de la AML (Leucemia Mieloide
Aguda)

Se desarrolló un clasificador de
votación ponderado para predecir
el tipo en base a la expresión

Science 1999;286:531-7
Aplicación al Cáncer de Mamas (I)

Se identificó una “característica


genética intrínseca” y subclases
moleculares de cáncer en base a la
expresión y a la célula de origen

Nature 2000;406:747-52;
ver también Perou et al., PNAS 1999;96:9212-7
Aplicación al Cáncer de Mamas (II)

Se identificaron “70 genes


característicos” que se
correlacionan con la
metástasis y la sobrevida
global.

Nature 2002;415:530-6.
Aplicación al Cáncer de Mamas (III)

Se define un “ensayo o
array” de “21 genes
característicos” y un
puntaje o score de
recurrencia con el uso de
qRT-PCR

El score o puntaje se
correlaciona con el riesgo
de metástasis

Nace el Oncotipo Dx

NEJM 2004; 351:2817-26.


Aplicación a Estudios Clínicos (II)
El Mammaprint y el Oncotipo Dx son los primeros ejemplos de
diagnóstico basado en array.

Estos estudios se están utilizando hoy en conjunto con los criterios


de diagnóstico estandard para ayudar a orientar el tratamiento.

Todavía hay preguntas sin respuesta con respecto a la aplicación de


los mismos en el manejo del paciente, particularmente con respecto
a cual es la mejor manera de integrar los resultados de las ‘ómicas
con las correlaciones clínicas tradicionales y los resultados.

Los tratamientos nuevos tales como el Herceptin que apunta al


receptor Her2 están mejorando la sobrevida cuando se los utiliza
para la clase de paciente para quien el tratamiento es apropiado.

Ha llegado la era de la genómica.


Prevalencia Estimada de Cáncer en US
2010 y 2020
# Personas (miles) %
Tipo de Cáncer 2010 2020 cambio
Mama 3461 4538 31

Próstata 2311 3265 41


Colorectal 1216 1517 25
Melanoma 1225 1714 40
Linfoma 639 812 27
Utero 588 672 15
Vejiga 514 629 22
Pulmón 374 457 22
Rinón 308 426 38
Leucemia 263 240 29
Todos 13,772 18,071 32
From: A.B. Mariotto et al. (2011) J. Nat. Cancer Inst. 103, 117
Gasto Nacional Estimado en Atención del Cáncer
2010 – 2020 para EEUU

$124 billones
y
proyectado en
aumento hasta
$207 billones
(66% aumento)
para el 2020

Ini. = dentro de 1 año de Dx; Con = continuando; Ultimo = último año


Fuente: A. B. Mariotto et al. (2011) J. Nat. Cancer Inst. 103, 117
Progresión de la Enfermedad
y Atención de Precisión
Nacimiento Tratamiento Muerte
Calidad de Vida
Historia Natural de la Enfermedad Atención Clínica

Environment
Resultados
+ Lifestyle
Opciones de
Tratamiento

Estadíos de la
Enfermedad
Estratificación
Del Paciente

Detección
Temprana
Riesgo
Genético
Biomarcadores
Pacientes de Cáncer Tienen Dos Genomas
Somatico
En el cáncer; puede haber mutaciones
no en la línea de germinación

Herencia X
En toda célula;
Pasan a los hijos;
Genes pueden Activo Inactivo
comunicar riesgo
de cáncer
BRAF Inhibidores Reducen Metastatic Melanoma

McDermott U et al. N Engl J Med 2011;364:340-350.

BRAF Inhibidor Prolonga la Vida en Pacientes con Metastatic Melanoma

Pero SOLO en pacientes cuyo tumor tiene la mutación BRAF


Biomarcadores, Subtipo de la Enfermedad
y Terapia Adecuada

Her-2+ EML4-ALK K-ras BRAF-V600 CFTR-G551


(Herceptin) (Xalkori) (Erbitux) (Zelboraf) (Kalydeco)
(Perjeta) (Vectibix)

Diagnóstico: la correcta Rx para la Enfermedad Correcta (Subtipo)


Transformando la visión en realidad
Asegurar el acceso a muestras y consentimiento racional

Desarrollar una plataforma tecnológica

Lograr que la integración de la información sea una


misión central

Realizar investigación como componente vital

Presentar los datos y la información a la comunidad local

Facilitar la investigación mas allá de la personal

Involucrar a los socios corporativos

Comunicar la misión a la comunidad.


Asegurar el Acceso a las
Muestras
Acceso, Investigación, Seguridad
• Los pacientes quieren ser parte del proceso de curación
de su enfermedad.

• Pero debemos proteger la confidencialidad del paciente.

• Los datos de la secuencia genómica presentan desafíos


porque cada genoma es único y tiene identidad propia.

• Nuestra habilidad para generar datos ha desafiado


nuestra comprensión de cómo proteger esos datos mejor
manteniendo al mismo tiempo su utilidad.
Desarrollar una Plataforma
Tecnológica
2010: Permitiendo una Nueva Era en
el Análisis Genómico

Illumina HiSeq

100Gb (~30X genome


coverage)

150bp reads

<$5,000 per genome


Tome la integración de la
información como una misión
central
CONFIDENTIAL
Gestione la investigación
como un componente vital
2004 Muertes Estimadas por Cáncer
en los Estados Unidos *
Pulmón & Bronquios 32% Hombres Mujeres 25% Pulmón y Bronquios
290,890 272,810
Próstata 10% 15% Mama
Colon & recto 10% 10% Colon & recto
Pancreas 5% 6% Ovario
Leucemia 5% 6% Pancreas
Linfoma de Hodgkin 4% 4% Leucemia
3% Linfoma de Hodgkin
Esófago 4%
Hígado & Vías 3% Cuello Uterino
intrahepáticas 3% 2% Múltiple mieloma
2% Cerebro/ONS
Vejiga Urinaria 3%
24% Todos los otros
Riñón 3%
Todos los otros 21%
ONS=Other nervous system.
Source: American Cancer Society, 2004.
Subtipo Angiogénico
Supervivencia y Validación

1090 serios 1606 tumores de


tumores,alto grado ovario publicados
ultimo estadio
Presentar datos e información
a la comunidad local
Portal de Investigación de LGRC
LGRC Catálogo

PAGE DETAILS

Search
-Facets
-Search within results
-Keyword prompts
-Search history

Table:
-Paged results
-Sortable columns

Actions:
-Go to Gene detail
page
-Add genes to ‘gene
set’
LGRC Detalle del Gene
Portal de Investigación de LGRC
LGRC Selector de Cohorte
Portal de Investigación de LGRC
LGRC Análisis Basado en Cohorte
Involucrar a los socios
corporativos
Necesitamos encontrar mejores
herramientas
• Recibimos $1M Oracle Comminment para crear nuestro archivo
de datos integrados, tanto clínicos como de investigación

• Nos hemos asociado con IDBS para crear portales de datos

• Estamos trabajando con Illumina en una variedad de proyectos

• Hemos tenido asociaciones con compañías informáticas


buscando asociar el perfil de datos genómicos a una droga,
protocolo, e información del paciente.

• Tenemos una asociación con Roche, Genomatix, NEB, y otros


interesados en ingresar en el espacio genómico personal
Permitir la investigación mas
allá de la propia
John Quackenbush, Director
Yaoyu Wang, Director Asociado
CCCB
Modelo de Consultoría Colaborativa
1. Reunión inicial para comprender el alcance y los objetivos del
Consultoría proyecto
2. Desarrollo de un plan de análisis y un estimado tiempo/costo
Secuenciamiento
Infraestructura

3. Durante la ejecución del proyecto se intercambian datos y


de IT

resultados a través de un portal de colaboración seguro


protegido por contraseña
4. Disponible como servicio ad-hoc, o acuerdos a mayor escala
Comunicar la misión a la
comunidad.
The LGRC
Tendencias Impulsadas por
Grandes Cantidades de Datos
The Cloud

Image from https://www.data-hive.com/academy/primer.php


El iPhone (y otros teléfonos inteligentes)

Images from http://www.apple.com/iphone-5c/


Nuevas Fuentes de Salud y Datos Médicos

Investigación de Social Media HClínica de Pacientes Genómica


Drogas

Resultados de Datos de Quejas Monitoreo en el Mobile Apps


Estudios Hogar
El Cuerpo como una Fuente de Datos

• Se estima que para el 2015, un


hospital promedio generará
665TB de datos anualmente.

• Los archivos de Imágenes


Médicas están aumentando
entre 20-40% anualmente.

• Hoy, 80% de los datos están


desestructurados tal como las
imágenes, videos, y notas.

Graphic from NetApp


http://ihealthtran.com/wordpress/2013/03/infographic-friday-the-body-as-a-source-of-big-data/
Los Costos para Generar Datos Han Colapsado
Qué pasa con el costo del análisis?

Genome Med. 2010 Nov 26;2(11):84. doi: 10.1186/gm205.


Ecoverse de la Medicina de Previsión
$105
Clinical
Cost of Analysis

Medicine

$104

$103
Clinical
Clinical Medicine
Medicine

$102
100 101 102 103 104
Number of Genes
La Medicina de Precisión Demanda Simplicidad
Springfield Diagnostic Labs
<johnq@jimmy.harvard.edu>

Agradecimientos
Array Software Hit Team Center for Cancer Students and Postdocs
Eleanor Howe Computational Biology Martin Aryee
John Quackenbush Dustin Holloway Kimberly Glass
Dan Schlauch Lan Hui Marieke Kuijjer
Lev Kuznetsov Kaveh Maghsoudi
Gene Expression Team Yaoyu Wang Jess Mar
Fieda Abderazzaq John Quackenbush Megha Padi
Stefan Bentink http://cccb.dfci.harvard.edu John Platig
Aedin Culhane Alejandro Qiuiroz
Benjamin Haibe-Kains J. Fah Sathirapongsasuti
Jessica Mar
Systems Support
Melissa Merritt
Stas Alekseev, Sys Admin
Megha Padi
Renee Rubio Administrative Support
Julianna Coraccio
University of Queensland
Christine Wells
Lizzy Mason

http://compbio.dfci.harvard.edu

You might also like