You are on page 1of 41

Bioestadstica Aplicada I

NMRCD Programa GEIS


UPCH FASPA
ABE Per

Sexta clase:

Mtodos paramtricos y no
paramtricos

Medias, varianza y correlacin

Pruebas para variables continuas

Bioestadstica

Porqu usamos pruebas no


paramtricas?:
Porque no siempre se cumplen todos los
supuestos requeridos por las pruebas de
hiptesis tradicionales (paramtricas):
Distribucin normal
Tamao de muestra grande
Varianzas iguales (?)
Si la distribucion de la poblacion es sesgada
(Por lo que la media no es buen indicador de
tendencia central)
Bioestadstica

Cmo se aplican estas pruebas:

Aplicar una transformacin a los datos originales,


convertindolos en rangos, valores positivo o
negativo, etc.

Con los datos transformados, calcular un


estadstico en base a los datos (a veces tambin
se calcula su promedio y error estndar)

Con el estadstico y los parmetros calculados,


realizar una prueba de hiptesis de acuerdo a
una cierta distribucin paramtrica (Normal, Jicuadrado, Binomial, etc.)
Bioestadstica

Transformaciones de datos

Si los datos tienen una distribucin


sesgada, en ocasiones pueden
transformarse para eliminar los sesgos

En algunos casos se puede emplear un


test paramtrico despus de la
transformacin
Bioestadstica

Ejemplo:
Si trabajamos con parasitemia, con
frecuencia tendremos que aplicar una
transformacin

Log

Bioestadstica

Comando gladder:

Bioestadstica

Anlisis con variables numricas:


Anlisis

Paramtrico

No paramtrico

Describir un grupo

, 2

Mediana, rango
intercuartil

Comparar un grupo T Student de una


a un valor
muestra

Prueba Wilcoxon

Comparar medias
en 2 grupos

T Student de dos
muestras

Mann-Whitney

Comparar medias
en 2 grupos
apareados

T Student
apareada

Prueba Wilcoxon

Comparar medias
en 3 o mas grupos

ANOVA

Kruskal-Wallis

Correlacin entre
dos variables

Pearson (lineal)

Spearman
(monotnica)

Bioestadstica

Comparacin de una muestra


contra una constante

Se piensa que la edad de inicio del consumo


de cigarrillos es la adolescencia

Puntualmente se plantea que el consumo se


inicia a los 15 aos

Si la distribucin es sesgada o la muestra es


pequea, una prueba paramtrica sobre la
media puede ser poco relevante
Bioestadstica

.05

Fraction
.1

.15

.2

histogram p59, fraction

20
40
qu edad tena ud. cuando fum cigarrillos por primera vez?

Bioestadstica

60

Prueba T Student de una muestra

Bioestadstica

Aunque no es necesario,
hagamos la prueba no
paramtrica:

Bioestadstica

Prueba signrank (Wilcoxon):

Ho: Mediana de la diferencia = 0


p59 15 = 0

p59 = 0

Asume una distribucin uniforme


alrededor de cero

Compara puntajes esperados con


observados
Bioestadstica

Comparacin entre dos muestras


independientes

Se piensa que la edad de inicio del consumo de


cigarrillos vara entre varones y mujeres

Si la distribucin es sesgada, una prueba


paramtrica sobre la media puede ser poco
relevante

Si los tamaos de muestra son pequeos (n <


30), el TLC no se cumplir y la prueba T podra
llevar a conclusiones errneas
Bioestadstica

Prueba T Student (paramtrica):


Ho: varones = mujeres

Bioestadstica

Ha: varones mujeres

Igualdad de varianzas:

La prueba T de Student de grupos


independientes difiere si las varianzas
difieren entre los grupos, debiendo
agregarse la opcin unequal

Para evaluar si las varianzas son


comparables o no se utiliza el comando
sdtest
Bioestadstica

Prueba de Varianzas (sdtest)


Ho: 2varones = 2mujeres

Bioestadstica

Ha: 2varones 2mujeres

T Student con varianzas


diferentes:

Bioestadstica

Prueba de Mann-Whitney:

Equivalente no paramtrico a una prueba de


hiptesis de promedios para dos muestras

Determina si una variable tiene valores mas


altos en una poblacin que en otra. NO
COMPARA LOS PROMEDIOS!!!

Util si el tamao de muestra es pequeo o la


distribucin es demasiado sesgada
Bioestadstica

qu edad tena ud. cuando fum cigarrillos por primera vez?


0
20
40
60

Qu son los puntajes correlativos?

.5

Varones

Bioestadstica

1.5
inf_sexo

Mujeres

2.5

Prueba de Mann-Whitney:
Ho: Fumarvarones = Fumarmujeres

Bioestadstica

Ha: Fumarvarones Fumarmujeres

Interpretacin

Se estn comparando valores o la


distribucin, no los promedios

Si en un grupo los puntajes observados


son mayores a los esperados, ese
grupo tiene mayores valores

Bioestadstica

Comparacin de dos grupos


apareados

Es una sola muestra, en verdad, en la que se


han medido dos valores

Se puede calcular la diferencia entre los


valores y sera una prueba de una sola
muestra

Qu comienza primero, alcohol o tabaco?

Prueba no paramtrica til si es muestra


pequea o distribucin muy sesgada
Bioestadstica

Prueba T Student apareada:


Ho: fumar = tomar

Bioestadstica

Ha: fumar tomar

Prueba signrank (Wilcoxon):

Bioestadstica

Anlisis de Varianza:
Prueba paramtrica para determinar si hay
diferencias en el promedio de una variable
cuantitativa (inicio fumar) entre tres o ms
poblaciones (estratos sociales). Supuestos:

Distribucin normal en todas las poblaciones (no


es necesario si el tamao de muestra es grande)

Varianzas comparables entre poblaciones

Observaciones (muestras) independientes


Bioestadstica

Comparacin de Varianzas:

Se usa en el ANOVA para determinar si hay


diferencias entre promedios de varias
muestras

Tambin se usa ANOVA en el anlisis de


regresin, siendo un caso particular del
ANOVA

Utiliza la prueba estadstica F


Bioestadstica

Las hiptesis:

Hiptesis nula, Ho:


X-inicioAlto = X-inicioMedio = X-inicioBajo

Hiptesis alternativa, Ha:


Existen diferencias en la edad de inicio
de fumar promedios de al menos dos
estratos sociales
Bioestadstica

Bioestadstica

Prueba de Kruskal-Wallis:

Extensin de la prueba de Mann-Whitney a


mas de dos poblaciones

Equivalente no paramtrico del anlisis de


varianza

TAMPOCO COMPARA PROMEDIOS:


determina si una poblacin tiene valores
diferentes (mas altos o mas bajos) que las
otras poblaciones
Bioestadstica

qu edad tena ud. cuando fum cigarrillos por prim era vez ?
0
20
40
60

Los puntajes correlativos:

.5
1

Bioestadstica
1.5
2
estrato social
2.5
3
3.5

En Stata:

Bioestadstica

Determinando pares diferentes:

Bioestadstica

Correlacin r de Pearson

Mide el grado de asociacin lineal entre dos


variables numricas

-1 <= r <= 1, r = 0 indica independencia

Se calcula en stata con el comando pwcorr

Requiere muestras grandes, distribuciones


cruzadas no sesgadas
Bioestadstica

Las hiptesis:

Hiptesis nula (Ho):


rfumar - tomar = 0

Hiptesis alternativa (Ha):


rfumar - tomar 0

Bioestadstica

20

p59b

40

60

scatter p59 p89

10

Bioestadstica

20

p89b

30

40

50

Resultados:

Bioestadstica

Correlacin de puntajes
(Spearman):

Equivalente no paramtrico a la prueba de


correlacin lineal de Pearson. Se aplica cuando
la correlacin no es lineal, la muestra es pequea
o existen valores muy extremos

Determina si dos variables cuantitativa u


cualitativa-ordinal estn correlacionadas positiva
(una crece y la otra tambin) o negativamente
(una crece y la otra disminuye)

Al igual que las pruebas de Mann-Whitney y


Kruskal-Wallis, tambin utiliza datos por rangos
Bioestadstica

Las hiptesis:

Hiptesis nula, Ho:


-puntajesfumar - tomar = 0

Hiptesis alternativa, Ha:


- puntajesfumar - tomar 0

Bioestadstica

Resultados:

Bioestadstica

Que debemos llevar a casa hoy:

Alternativas disponibles cuando no se


cumplen las condiciones para usar
pruebas parmetricas

Como aplicar e interpretar las pruebas de


Wilcoxon, Mann-Whitney, Kruskal-Wallis y
Spearman

Limitaciones de las pruebas no


paramtricas
Bioestadstica

You might also like