You are on page 1of 71

Estadstica

Antonio Carvajal-Salazar, MD.


Surgery and Global Health

School of Public Health University of New york at Albany

Estadstica: Generalidades
Poblacin: conjunto de todos los individuos (inaccesible) que tienen en comn alguna caracterstica observable y del que se pretende obtener una serie de conclusiones. Muestra: conjunto menor de individuos (accesible y limitado) sobre el que se realiza el estudio con la idea de obtener conclusiones generalizables a la poblacin. Individuo: componentes de la poblacin y de la muestra. Al nmero de estos se le llama tamao muestral (n)

Variables
VARIABLE Cualitativa SUBTIPO Nominal dicotmica
Nominal no dicotmica Ordinal Cuantitativa Discreta Continua

EJEMPLO Sexo
Raza Nivel socieconmico N de episodios/semana Uricemia

Escalas de Medicin
Nivel nominal
Clases o categoras en las que se est o no incluido

Nivel ordinal
Se ordenan de forma determinada (menor-mayor) ei. Intensidad de dolor

Nivel de intervalo
Orden numrico; la diferencia entre valores sucesivos es siempre la misma (ei. Temperatura)

Nivel de razn
Como la anterior, pero incluye el cero absoluto (ei. Glucemia, talla)

ESTADSTICA DESCRIPTIVA

Representacin Grfica
Variables cualitativas
Diagrama de rectngulos Diagrama sectorial (pastel)
Rectngulos
5 4 3 2 1 0 L M M J V S D 3.2 8.2 1.4

Sectorial
1.2

Variables cuantitativas discretas (frecuencia relativa y/o los porcentajes)


Diagrama de barras
Barras
a-l m-p q-s t-z 0 2 4 6

Variables cuantitativas continuas


Histogramas Polgonos de frecuencias
5 4 3

2
1 0

SNTESIS DE DATOS

Medidas de localizacin o tendencia central


Media aritmtica
Medida de centralizacin ms comn.

Media geomtrica
Datos con marcada asimetra positiva.

Mediana
Es el valor numrico que divide al conjunto de datos ordenados en dos partes iguales.

Moda
Es el valor ms corriente, que se presenta con mayor frecuencia.

Parmetros de posicin: cuartiles, deciles, percentiles.


Q2=D5=Pc50= mediana. El 50% de las observaciones sern inferiores al segundo cuartil, quinto decil o percentil 50

Media vs. Mediana


Media Utiliza todos los datos. Mediana No se ve alterada si una observacin es extrema o contiene errores grandes de medida o de transcripcin.

Preferible si los datos son homogneos.

Medidas de Dispersin o Variabilidad

Indican si los valores de la variable estn muy dispersos o se concentran alrededor de la medida de centralizacin.

Rango o Recorrido
Diferencia entre el valor mnimo y mximo observado en la serie.

R= Mx. Min.

Desviacin Media
Es la media de las desviaciones con respecto a la media aritmtica.

DM=

|Xi-| n

Varianza
Media del cuadrado de las desviaciones de los elementos respecto a la media aritmtica.

S2=

(Xi-)2 n

Desviacin Tpica o Estndar


Raz cuadrada positiva de la varianza. Es la medida de dispersin ms usada.

S=

S =
2

(Xi-)2 n

Medidas de Dispersin para datos Asimtricos


Rango intercuartlico
La diferencia entre el Pc57 y el Pc25.

Coeficiente de variacin
Para comparar variabilidad o dispersin relativa de variables que estn expresadas en las mismas o diferentes unidades.
C.V. = S x 100 X

Formas de Medida

Medida de Centralizacin
Distribucin homognea Distribucin asimtrica Media Mediana

Medida de Dispersin
Desviacin tpica o estndar Rango intercuartlico Rango

PROBABILIDAD

Probabilidad
Supongamos una poblacin finita con N elementos, k de los cuales tienen la caracterstica A. Llamaremos probabilidad de la caracterstica A en la poblacin a:
P(A)= k/N

P(A) =

Nmero de veces que ocurre A Nmero de veces que puede ocurrir A

Propiedades
P es un valor entre 0 y 1.
0 P(A) 1

Llamaremos suceso seguro E, al que siempre ocurre.


P(E)=1

Si es el suceso complementario de A, que ocurre siempre que no lo hace A, entonces:


P()= 1-P(A)

Dos sucesos son mutuamente excluyentes cuando no pueden suceder a la vez.


P(AB)= P(A y B) =0

Son independientes cuando la probabilidad de aparicin de uno de ellos no depende, ni se modifica por la aparicin del otro.
P(A B)= P(A y B) = P(A) x P(B)

Probabilidad Condicionada
La probabilidad de A condicionada a la ocurrencia de B; se define considerando nicamente aquellos que presentaron B.

P(A) x P(B/A) P(A/B) = P(AB) = P(B) P(B)

Regla de Multiplicacin
Es la probabilidad de que suceda A y B.
P(AB) = P(A/B) x P(B)

Si dos sucesos son independientes.


P(AB) = P(A) x P(B)

Regla de Suma
Nos indica la probabilidad de que suceda A o de que suceda B.
P(A U B) = P(A) + P(B) P(AB)

Excluyentes (o bien se da A o bien se da B).


P(A U B) = P(A) + P(B)

Regla de multiplicacin A B

Regla de la Suma A U B (A B)

AB (A y B)

DISTRIBUCIONES DE PROBABILIDAD

Qu es?
Instrumento conceptual que permitir la generalizacin como modelo de la poblacin, es decir, una representacin simblica de su comportamiento.
Distribucin Binomial Distribucin de Poisson Distribucin Normal o de Gauss

Distribucin Binomial
Es una ley terica de aplicacin siempre que se conozca la probabilidad de aparicin de un fenmeno biolgico. El resultado es siempre dicotmico (ei. xito o fracaso) Se aplica a variables discretas.

Distribucin de Poisson
Ley adecuada para los sucesos raros o extremadamente improbables. p<0.1 y n x p <5

p= fenmeno n= nmero de pruebas

Distribucin Normal o de Gauss


Seguida por una inmensa cantidad de variables, cuyas medidas se agrupan alrededor de un valor central y que presentan una frecuencia cada vez menor a medida que se alejan de dicho valor medio. Es simtrica alrededor de la media. Por tanto, media, mediana y moda coinciden.

Grfica de distribucin normal

CONTRASTE DE HIPTESIS

Hiptesis
Hiptesis nula (H0): excluyente de la hiptesis alternativa. Hiptesis alternativa (H1): aquella que se quiere demostrar.

Previamente el ensayo de una hiptesis, se fija probabilidad mxima de que los resultados diferentes observados entre los dos grupos pueda ser debidos simplemente al azar (H0 cierta), que suele ser por convenio del 5%.

Se calcula cul es la probabilidad de que las diferencias que nosotros hemos observado pueda ser explicadas por azar.

Esta probabilidad es el valor de la p o grado de significacin estadstica.

Por qu todos quieren p<0.05?


P<0.05 Diferencias reales. Poca probabilidad de que se deban al azar. Resultado estadsticamente significativo. Se rechaza H1.

Epidemiologa

Medidas de Frecuencia Medidas de Impacto

MEDIDAS DE LA ENFERMEDAD

Medidas Bsicas
Nmero. Valor absoluto. Razn. Cociente en el que el numerador no est incluido en el denominador. Valores entre 0- .
1

x/y

Proporcin. Cociente en el que el numerador est incluido en el denominador. Valores entre 0-1.
Tasa. Mide la ocurrencia de un suceso durante un perodo de tiempo en una poblacin determinada. Tiene dimensin temporal.

x/x+y

a/persona x tiempo

Medidas de Frecuencia
Prevalencia. No hace distincin entre casos antiguos o nuevos.
Pv= N de casos de enfermedad Poblacin en ese momento

Incidencia acumulada. Probabilidad de que un individuo desarrolle la enfermedad en ese periodo de tiempo.
IA= N de casos nuevos en un perodo de tiempo Poblacin en riesgo al inicio de ese perdodo

Densidad de incidencia. Casos nuevos en un tiempo.


DI = N de casos nuevos Persona x tiempo

Prevalencia

Significado Proporcin de individuos enfermos en una poblacin en un momento concreto. Riesgo individual de enfermar. Velocidad con que determinada enfermedad aparece en una poblacin.

Incidencia acumulada Densidad de Incidencia

Riesgo Relativo
Medida de asociacin en los estudios de cohortes Mide la fuerza de asociacin entre el factor de riesgo y la enfermedad Su significado depende del valor que tome:
RR>1 Factor de Riesgo RR=1 Indiferente. La incidencia es igual en expuestos y no expuestos RR<1 Factor de Proteccin
RR = Incidencia en expuestos__ Incidencia en no expuestos

FR No FR Total

Enfermos a c a+c
Incidencia en expuestos Incidencia en no expuestos

Sanos b d b+d
Ie = a/a+b Io = c/c+d

Total a+b c+d a+b+c+d

RR = Ie = a/a+b Io = c/c+d

Odds Ratio
Razn de Desventaja Bsica en estudios caso-control Es necesario que la enfermedad tenga una incidencia baja, inferior al 10%
Casos expuestos Casos no expuestos Controles expuestos Controles no expuestos

OR=

Odds de exposicin en los casos Odds de exposicin en los controles

Medidas de Impacto
Diferencia de incidencias o riesgo atribuible (RA)
Representa el descenso en el nmero de vasos nuevos entre los expuestos si se evitara el FR.

RA = Ie - Io

Fraccin atribuible en expuestos o fraccin etiolgica del riesgo (FAE)


La proporcin de la enfermedad que se debe a la exposicin.

RA = Ie - Io Ie

ESTUDIO DE UN TEST: PARMETROS DE USO

Resultado de la prueba diagnstica que evaluamos


Enfermos Sanos

Positivo
Negativo

VP a FN c Total de enfermos a+c

PF Total positivos b a+b VN Total negativos d c+d Total de Sanos Total de b+d individuos a+b+c+d

Sensibilidad
Probabilidad de que un individuo enfermo tenga un test (+). Indica la proporcin del total de enfermos que el test es capaz de detectar.
Individuos enfermos con test + Todos los enfermos VP VP + FN

S=

Especificidad
Probabilidad de que un individuo sano tenga un test (-). La proporcin de individuos sanos confirmados como tales por el resultado negativo del test.
E= Individuos sanos con test Todos los enfermos = VN VN + FP

Tasa de Falsos Negativos


Probabilidad de que un individuo estando enfermo sea clasificado como sano.
Individuos enfermos con test FN VP + FN

TFN=

Todos los enfermos

= 1-S

Tasa de Falsos Positivos


Probabilidad de que un individuo sano se le clasifique como enfermo.
Individuos sanos con test + FP VN + FP

TFP=

Todos los enfermos

= 1-E

Valor Predictivo Positivo


Proporcin de verdaderos positivos entre aquellos que han sido identificados como positivos en una prueba de test.
VP VP + FP

VPP=

Valor Predictivo Negativo


Proporcin de verdaderos negativos entre aquellos que han sido identificados como negativos en una prueba de test.
VN VN + FN

VPN=

Valor global (eficiencia) del test


Indica la proporcin de resultados vlidos entre el conjunto de resultados.

VG=

VP + VN VP + VN + FP + FN

Conceptos
Sensibilidad + Tasa de falsos negativos = 100% Especificidad + Tasa de falsos positivos = 100%

El punto de corte escogido determinar la especificidad y sensibilidad de una prueba.

Ei. Glucemia
La sensibilidad y especificidad son valores interdependientes, de forma que si aumenta la sensibilidad disminuye la especificidad, y viceversa.

S
70 140 mg/dL

Aceptabilidad de Mtodo Diagnstico


Si lo que interesa es detectar el mayor nmero posible de enfermos, se debe usar un test con alta sensibilidad. (ei. VDRL y RPR)

Si lo que quieres es asegurar el diagnstico, debes usar un test cuya especificidad sea mxima. (ei. FTA-ABS y MHA-TP)

ESTUDIOS EPIDEMIOLGICOS

Descriptivos
Series de casos clnicos Estudios ecolgicos (transversales o longitudinales) Estudios transversales o de prevalencia (duracin mnima, bajo costo, ei. Enfermedades crnicas)

Analticos
Intentan establecer relacin de causalidad entre factor de riesgo y enfermedad.
Experimentales
Clnico aleatorio (ofrece mejor evidencia de causa-efecto y al eficacia de una actuacin) De campo Comunitario de intervencin Antes-despus Controlados no-aleatorios

Observacionales
De cohortes
Grupo de expuestos a factor de riesgo vs. No expuestos, se estudia incidencia de ambos No es bueno para enfermedades raras

Cohortes histricas (retrospectivos) Caso-control


Grupo de enfermos vs. No enfermos, se estudia la exposicin a distintos factores de riesgo

FIABILIDAD Y VALIDEZ DE ESTUDIOS EPIDEMIOLGICOS

Tipos de error
Aleatorio
Se pueden minimizar aumentando el tamao de la muestra.

Sistemtico o sesgo
Sesgo de seleccin (Fallo en el diseo o ejecucin del estudio)
Sesgo de autoseleccin o del voluntario Sesgo diagnstico o Berkson: muestra hospitalaria con factor de riesgo relacionado con el padecimiento. Sesgo del obrero sano: ausentismo compromete la validez de la muestra. Falacia de Neyman: seleccionar casos prevalentes en lugar de los incidentes

Sesgo de informacin
Error en la medicin de alguna variable clave del estudio.

Factor de confusin (confounding)


Variable extraa al estudio que modifica los resultados que se obtienen.

Validez
El estudio mide lo que realmente se propone medir. Es la ausencia de error sistemtico.
Validez interna. Validez del resultado para los pacientes del estudio. Validez externa. Los resultados del estudio son aplicables a otros individuos distintos a los del estudio.

Fiabilidad
Es el grado de reproductibilidad de un estudio. Es la ausencia del error aleatorio.
Fiabilidad (precisin) + Validez +

Criterios de exclusin

Alguna contraindicacin, condiciones que pueden afectar a la variable resultado o alguna caracterstica que le haga complicado se ser estudiado.

Anlisis de Resultado
Recomendaciones.
1. 2. 3. 4. 5. 6. Prdidas de sujetos en el ensayo clnico antes de la aleatorizacin afectan la capacidad de generalizacin de resultados. Prdidas de sujetos post-aleatorizacin afectan la validez interna. Comparaciones mltiples aumentan la posibilidad de resultados falsamente positivos. El anlisis de subgrupos puede ocasionar problemas si no se ha contemplado desde el principio. Anlisis por protocolo. Incluye slo a aquellos que han cumplido los requisitos del protocolo y/o han finalizado el estudio.. Anlisis por intencin de tratar. Incluye a todos los que han sido seleccionados y en el grupo en el que lo fueron.

Niveles de calidad de evidencia cientfica


Calidad de la evidencia cientfica Buena Tipo de diseo Metaanlisis de EC: controlados y aleatorios EC controlado y aleatorio de muestra grande EC controlado y aleatorio de muestra pequea Regular EC controlado no aleatorizado con controles concurrentes EC controlado no aleatorizado con controles histricos Estudio de cohortes prospectivos

Estudio de cohortes restrospectivos


Mala Estudios de casos y controles Series clnicas, estudios transversales y ecolgicos Comits de expertos

El meta-anlisis de evidencia cientfica (EC) controlados y aleatorizados es el estudio ms riguroso y que aporta mayor evidencia causal.

xito!

Luck is only important in so far as getting the chance to sell yourself at the right moment. After that, you've got to have talent and know how to use it. -Frank Sinatra

Contact
Antonio Carvajal, MD.
Surgery in Global Health Fundacin Carvajal-Klein E-mail: antonio.carvajal@fundacioncarvajal.com.mx