Professional Documents
Culture Documents
=
=
1
( )
1
1
2
2
=
n
X X
S
n
i
i
p
\
|
=
=
n
N
n
X
X
n
i
i
o
, ~
1
(
+ e
n
X
n
X C I
o o
96 . 1 , 96 . 1 : %) 95 .( .
) ( ~ p Bernoulli Y
i
= =
= =
p Y P
p Y P
i
i
1 ) 0 (
) 1 (
( )
|
|
.
|
\
|
~ = =
=
n
p p
p N
n
Y
Y p
n
i
i
1
,
1
( ) ( )
(
e
n
p p
p
n
p p
p p C I
1
96 . 1 ,
1
96 . 1 : %) 95 .( .
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 48 de 73
Para obtener intervalos de confianza en Deducer debemos seleccionar el men Analysis
One Sample Test y seleccionar el Test One-sample t-test.
Observacin: Para obtener el intervalo de confianza de una proporcin debemos
instalar el paquete DeducerExtras.
Ejercicio
Calcular pos intervalos de confianza para las proporciones de las variables indicadoras de
cada uno de los factores de riesgo.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 49 de 73
6.4 Pruebas de hiptesis
Un segundo bloque de instrumentos para la inferencia estadstica son las pruebas de
hiptesis. Estas evalan la evidencia de una afirmacin sobre la poblacin.
En estadstica una afirmacin sobre la poblacin se plantea en forma de hiptesis de
trabajo. Las dos hiptesis complementarias se llaman:
Hiptesis nula (H
0
)
Hiptesis alternativa o de investigacin (H
1
)
La hiptesis nula corresponde a la hiptesis que creemos cierta por defecto y la alternativa
corresponde a la hiptesis que se desea probar.
Las hiptesis hacen siempre referencia a los parmetros de la poblacin.
Una prueba de hiptesis es un procedimiento que especifica:
1. Para que valores muestrales la decisin ser no rechazar la hiptesis nula.
2. Para que valores muestrales la hiptesis nula ser rechazada a favor de la alternativa.
P-valor: probabilidad que, bajo H
0
, el estadstico de contraste tome un valor al menos tan
alejado como el realmente obtenido.
Cuanto ms pequeo sea el p-valor mayor es la evidencia en contra de H
0
.
Se rechazar la hiptesis nula si el p-valor es menor que el nivel de significacin
adoptado (en general 0,05).
En un contraste de hiptesis, debemos rechazar o no la hiptesis nula a favor de la
alternativa.
Deseamos que nuestra decisin sea correcta, pero a veces no lo ser. Hay dos tipos de
decisiones incorrectas:
Rechazar H
0
cuando de hecho es cierta: error de tipo I
NO rechazar H
0
cuando realmente es cierta H
1
: error de tipo II
Observacin: el error de tipo I = nivel de significacin =
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 50 de 73
En siguiente cuadro resume los tipos de errores que se pueden cometer en un contraste de
hiptesis:
El error de Tipo I es ms grave que el error de Tipo II.
Resumiendo, el esquema a seguir es:
Para llevar a cabo un contraste de hiptesis para la media debemos volver al men anterior
y definir como valor de prueba el valor que deseamos contrastar (botn de opciones del t-
test, ).
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 51 de 73
6.5 Relacin entre IC y Test de hiptesis
Cuando en una prueba estadstica se pretende comparar dos medias, el IC proporciona
informacin paralela a la proporcionada por el test de hiptesis correspondiente.
Es necesario que el nivel de confianza sea 1-, siendo el nivel de significacin del test
aplicado.
o Si el IC no contiene el 0, se rechaza H
0
: Diferencia=0.
o Si el IC no contiene el valor 2, se rechaza H
0
: Diferencia=2.
NOTA: Esta similitud es aplicable para pruebas T, o basadas en la distribucin
Normal.
6.6 Pruebas de normalidad
Para llevar a cabo un contraste de normalidad debemos seleccionar la prueba de Shapiro-
Wilk en el men de One Sample Test.
El contraste de hiptesis que realiza esta prueba es el siguiente:
H
0
: la distribucin es Normal
H
1
: la distribucin NO es Normal
En este ejemplo hemos obtenido un nivel de significacin (p-valor) de 0,001. Si fijamos el
lmite en 0,05 rechazaramos la H
0
(no podramos considerar que la distribucin de la
variable los es Normal).
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 52 de 73
La sumisin de los investigadores al p-valor
La utilizacin sistemtica del p-valor puede llevar a resultados engaosos.
EJEMPLO: Se quiere analizar la estancia en das de los turistas en Catalunya. En concreto
se desea comparar las estancias de los europeos y los procedentes de pases asiticos. Un
contraste en trminos de las diferencias se plantea como:
H
0
: d = 0 (no hay diferencia)
H
1
: d 0
El p-valor del test estadstico resulta ser p=0,02, con lo que se concluye que hay
diferencias. Es suficiente?
Necesitamos medir el tamao del efecto realizando un intervalo de confianza para la
diferencia ya que podra ser, por ejemplo, que la diferencia se situara en el intervalo (0,5 - 1)
o bien en el intervalo (10 - 15).
QUE ES UNA DIFERENCIA ESTADSTICAMENTE SIGNIFICATIVA?
(en un contraste de diferencias)
Si se obtiene un p-valor <0,05 al realizar el contraste, la diferencia es
estadsticamente significativa.
Si se obtiene un p-valor <0,05 al realizar el contraste, la diferencia no tiene porque
ser significativa.
Si en un contraste se obtiene por ejemplo un p-valor=0,03 y en otro se obtiene un
p-valor=0,42, no tiene por qu haber mayores diferencias entre grupos en el primer
caso que en el segundo.
Las diferencias pueden ser estadsticamente significativas, pero NO
estadsticamente muy significativas, ligeramente significativas o
prcticamente significativas.
Recordar que una diferencia estadsticamente significativa implica simplemente
que la diferencia no es nula.
Para que una diferencia sea significativa, sta debe ser relevante.
En los resultados de un contraste SIEMPRE hay que presentar el p-valor y el
Intervalo de Confianza de la diferencia para valorar su relevancia.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 53 de 73
7 INFERENCIA PARA DOS POBLACIONES
7.1 Introduccin
La Inferencia Estadstica para dos poblaciones pretende generalizar los resultados y
comparar los datos de una o diversas variables respuesta medidas en dos muestras, sin
tener en cuenta otras variables (factores de riesgo).
Dos muestras independientes son aquellas para las cuales no existe ningn vnculo entre
ellas. Provienen de poblaciones independientes.
Dos muestras relacionadas son aquellas que se refieren a la misma poblacin y han
medido la misma variable respuesta.
PLANTEAMIENTO DEL PROBLEMA
En primer lugar el investigador debe identificar la naturaleza de las variables que desea
estudiar. Es decir:
Variable Respuesta: Distribucin (continua, ordinal, categrica).
Variable Explicativa: Nmero de grupos o niveles.
As cmo la idoneidad del tipo de prueba: Homogeneidad Basal, Grupos bien
balanceados.
EJEMPLO:
Se ha realizado un estudio incluyendo a 100 pacientes que han tenido una accidente
cerebrovascular. Se asigna de forma aleatoria a los pacientes, a cada uno de los dos
tratamientos. Se desea comparar la estancia de los pacientes en el hospital.
Se ha recogido la siguiente informacin:
Grupo de tratamiento, sexo, edad, das de estancia en el hospital, peso inicial y final,
diabetes, hipertensin, fibrilacin arterial, antecedente cardiovascular, fuma, presin
sistlica elevada, hbitos de viaje, hbitos de cocina y realiza tareas domsticas.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 54 de 73
7.2 Comparar medias
7.2.1 Muestras independientes
Para comparar una variable respuesta entre dos muestras independientes cuando dicha
variable sigue una distribucin normal se utiliza la prueba T de Student (T-Test) para
muestras independientes.
La hiptesis que contrasta es:
H
0
:
1
=
2
las medias son iguales
H
1
:
1
2
las medias son diferentes
EJEMPLO (continuacin): Deseamos estudiar hay diferencias entre la estancia media de
los hombres y de las mujeres.
En primer lugar debemos contrastar si podemos asumir que la distribucin de la variable
estancia es Normal (para cada grupo).
Para llevar a cabo estos contrates debemos ir al men Analysis One Sample Test y
seleccionar la prueba de Normalidad. En el recuadro Subset indicaremos el grupo para el
cual queremos realizar el contraste y repetiremos el anlisis para el resto de grupos.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 55 de 73
Gender==male
Gender==female
No rechazamos la hiptesis nula (p-valor > 0,05) por lo tanto podemos aceptar que la
variable los sigue una distribucin normal en cada uno de los grupos.
EJEMPLO (continuacin):
La hiptesis que deseamos contrastar es:
H
0
:
H
=
M
La estancia en el hospital es igual
H
1
:
H
M
La estancia en el hospital es diferente
Para llevar a cabo dicha prueba seleccionamos la prueba T-Test del cuadro de dilogo
anterior y obtenemos el siguiente resultado:
NOTA: La prueba realizada considera que las varianzas son distintas en los dos grupos.
En caso que querer realizar el test asumiendo que estas son iguales se puede seleccionar la
opcin Equal variance dentro de la pestaa de opciones del T-Test.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 56 de 73
7.2.2 Prueba de igualdad de varianzas
Para determinar si las varianzas son iguales podemos realizar el siguiente contraste de
hiptesis:
H
0
:
1
=
2
Las variancias son iguales
H
1
:
1
2
Las variancias no son iguales
EJEMPLO (continuacin):
Para llevar a cabo este contrate debemos ir al men Extras k-sample variance test y
seleccionar la prueba de Levene.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 57 de 73
En caso de no tener el men Extras instalado este debe cargarse desde el men Packages
and Data Package Manager y seleccionar el paquete DeducerExtras.
7.2.3 Inferencia no paramtrica
A la prctica, muchas veces no podemos aceptar la hiptesis de normalidad en los datos.
En estas situaciones se puede hacer uso de mtodos no paramtricos que no suponen
ninguna hiptesis sobre la distribucin de los datos.
Para comparar una variable respuesta entre dos muestras independientes cuando dicha
variable es continua (no-normal) o bien ordinal se utiliza la prueba de suma de rangos
Wilcoxon (tambin llamada prueba U de Mann-Whitney o prueba de Mann-Whitney-
Wilcoxon).
La hiptesis que contrastan es:
H
0
: La mediana del grupo 1 es igual a la mediana del grupo 2.
H
1
: La mediana del grupo 1 NO es igual a la mediana del grupo 2.
Este test se encuentra en el mismo men Analysis Two Sample Test seleccionando la
opcin Wilcoxon.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 58 de 73
7.2.4 Muestras relacionadas
Para comparar una variable respuesta entre dos muestras relacionadas cuando dicha
variable sigue una distribucin normal se utiliza la prueba T de Student (T-Test) para
muestras relacionadas.
La hiptesis que contrasta es:
H
0
:
1
=
2
las medias son iguales
H
1
:
1
2
las medias son diferentes
EJEMPLO (continuacin): A los pacientes del estudio anterior se les ha pesado antes y
despus de salir del hospital. Deseamos contrastar si hay diferencias entre el peso inicial y el
peso final. La hiptesis que deseamos contrastar es:
H
0
:
1
=
2
los pesos son iguales
H
1
:
1
2
los pesos son distintos
Para llevar a cabo dicha prueba con Deducer seleccionamos el men Analysis Paired
Test:
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 59 de 73
Para realizar una prueba no paramtrica deberamos seleccionar la opcin Wilcoxon
Signed Rank.
7.3 Variables categricas
Para comparar una variable respuesta entre dos muestras independientes cuando dicha
variable es categrica se utilizan las pruebas
2
, prueba exacta de Fisher o prueba de
Razn de verosimilitud (Likelihood Ratio Test).
La hiptesis que contrastan es:
H
0
: La variable respuesta es independiente de la variable explicativa (Los grupos de
tratamiento son homogneos).
H
1
: La variable respuesta NO es independiente de la variable explicativa (Los
grupos de tratamiento no son homogneos).
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 60 de 73
EJEMPLO (continuacin): Deseamos estudiar si la distribucin de los factores de riesgo
es homognea en hombres y mujeres.
La hiptesis que deseamos contrastar es:
H
0
: La distribucin de los factores de riesgo es homognea en hombres y mujeres.
H
1
: La distribucin de los factores de riesgo NO es homognea en hombres y
mujeres.
Para llevar a cabo dicha prueba con Deducer seleccionamos Analysis Contingency
Tables. En el botn Statistics seleccionamos las opciones Chi-cuadrado y Likelihood:
Y obtenemos el siguiente resultado:
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 61 de 73
8 INFERENCIA PARA K POBLACIONES
8.1 Introduccin
La Inferencia Estadstica para k poblaciones generalizar los mtodos estadsticos vistos en
el apartado anterior.
Se dispone de una variable Respuesta (continua, categrica, ordinal) y una variable
Explicativa que define k grupos o categoras.
8.2 Comparar medias
8.2.1 Muestras independientes: prueba ANOVA
El anlisis de la varianza (ANOVA: Analysis of Variance) es un procedimiento estadstico
que tiene como objetivo descomponer la variabilidad observada en un ensayo experimental
en funcin de los posibles factores que han podido influir en el resultado.
Esta tcnica se utiliza en las situaciones en las que se desea analizar una variable continua
medida bajo ciertas condiciones experimentales identificadas por uno o ms factores
cualitativos. Cada factor identifica 2 o ms situaciones experimentales complementarias, y
por lo tanto distingue grupos o niveles.
Cuando hay un nico factor estudiado, el anlisis recibe el nombre de ANOVA de un
factor.
La prueba ANOVA de un factor generaliza la prueba T para dos muestras independientes.
La hiptesis que contrasta es:
H
0
:
1
=
2
= =
k
las medias son iguales
H
1
: Al menos una de las medias no es igual al resto
La prueba ANOVA se sustenta en los supuestos de normalidad, homocedasticidad,
independencia y aleatoriedad.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 62 de 73
EJEMPLO (continuacin): Deseamos estudiar si existen diferencias entre la estancia
media segn el grupo de edad al cual pertenecen.
Como en el caso de comparar dos medias, en primer lugar debemos contrastar si podemos
asumir que la distribucin de la variable estancia es Normal dentro de cada grupo de edad.
Para ello, seleccionamos la preuba de normalidad de Shapiro-Wilk en el men Analysis
One Sample Test. En el recuadro Subset indicaremos el grupo para el cual queremos
realizar el contraste y repetiremos el anlisis para el resto de grupos.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 63 de 73
age_cat == <70
age_cat == 70-74
age_cat == 75+
Se rechaza la hiptesis de normalidad para uno de los grupos de edad (age_cat = 70-74,
p_valor < 0,05).
Todo y rechazar normalidad se ha de tener en cuenta la robustez del procedimiento
ANOVA frete al incumplimiento de sus supuestos de trabajo.
La prueba ANOVA es suficientemente robusta ante la falta de normalidad en alguno de los
grupos a comparar y ante la falta de homogeneidad de variancias, siempre y cuando se
disponga de un tamao de muestra suficientemente grande (ms de 30 individuos por
grupo).
EJEMPLO (continuacin):
La hiptesis que deseamos contrastar es la prueba ANOVA es:
H
0
:
<70
=
70-74
=
75+
La estancia en el hospital es igual en los tres grupos de edad
H
1
: Al menos una de las medias no es igual al resto .
Para llevar a cabo dicha prueba seleccionamos la prueba K-Sample Test del men
Analysis.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 64 de 73
Dado el p_valor obtenido, se rechaza la hiptesis nula. Existen diferencias en las estancias
medias de los diferentes grupos de edad.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 65 de 73
NOTA: La prueba realizada considera que las varianzas son iguales en todos los
grupos. En caso que querer realizar el test asumiendo que son diferentes se ha de
seleccionar la opcin One-Way ANOVA(Welch).
Se observa que la conclusin de la prueba no ha variado. No obstante, es obvio que se debe
validar la hiptesis de homogeneidad de varianzas a priori.
8.2.2 Prueba de homogeneidad de varianzas
Para determinar si las varianzas son iguales podemos realizar el siguiente contraste de
hiptesis:
H
0
: Las variancias son iguales en todos los grupos
H
1
: Al menos un grupo presenta una variabilidad diferente al resto
En este caso utilizaremos la misma prueba que se ha visto para el caso de dos variancias la
prueba de Levene: men Extras k-sample variance test.
EJEMPLO (continuacin):
Veamos para el ejemplo anterior si exista homogeneidad de variancias:
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 66 de 73
Se observa que efectivamente no se rechaza la igualdad de variancias (p_valor > 0,05).
Luego, existe homoscedasticidad en los grupos.
8.2.3 Comparaciones mltiples 2 a 2
Hemos visto que el procedimiento ANOVA permite determinar si existen diferencias entre
ms de dos grupos pero no informa sobre qu grupo o grupos son los que difieren. Por
ello, tras la realizacin de la prueba ANOVA es interesante realizar las llamadas
comparaciones mltiples a posteriori o 2 a 2.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 67 de 73
Las comparaciones mltiples consisten en contrastar simultneamente todas las parejas dos
a dos que se puedan dar.
Las hiptesis que se contrastan son:
H
0
:
1
=
2
las medias son iguales
H
1
:
1
=
2
las medias no son iguales
H
0
:
1
=
3
las medias son iguales
H
1
:
1
=
3
las medias no son iguales
H
0
:
1
=
k
las medias son iguales
H
1
:
1
=
k
las medias no son iguales
.
.
.
H
0
:
k-1
=
k
las medias son iguales
H
1
:
k-1
=
k
las medias no son iguales
La realizacin de todas las comparaciones 2 a 2 conduce habitualmente a un elevado
nmero de comparaciones. Dichas comparaciones no son independientes las unas de las
otras y ello es necesario aplicar correcciones por multiplicidad de contrastes para
garantizar que el nivel de significacin conjunto no sea superior al 5%:
Los contrastes mltiples se encuentran dentro del men K-Sample Test en la pestaa
Pairwise.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 68 de 73
Las comparaciones mltiples indican que las diferencias entre los grupos de edad
detectados en la prueba ANOVA anterior se dan entre el grupo de <70 y el grupo de
+75.
Finalmente, la pestaa Plots del men K-Sample Test permite obtener un grfico de cajas
para visualizar las diferencias existentes entre los grupos:
8.2.4 Inferencia no paramtrica: Prueba de Kruskal-Wallis
A la prctica, muchas veces no podemos aceptar la hiptesis de normalidad en los datos,
como por ejemplo nos ha sucedido en el ejemplo anterior. En estas situaciones se puede
hacer uso de mtodos no paramtricos que no suponen ninguna hiptesis sobre la
distribucin de los datos.
Para comparar una variable respuesta entre k muestras independientes cuando dicha
variable es continua (no-normal) o bien ordinal se utiliza la prueba de Kruskal-Wallis.
La hiptesis que contrastan es:
H
0
: La mediana de todos los grupos es igual
H
1
: Al menos una de las medianas no es igual al resto
Este test se encuentra en el mismo men Analysis K- Sample Test seleccionando la
opcin Kruskal-Wallis:
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 69 de 73
Dado el p_valor obtenido, se rechaza la hiptesis nula. Existen diferencias entre las
medianas de los tiempos de estancia en el hospital de los diferentes grupos de edad.
8.2.5 Muestras relacionadas
Para comparar una variable respuesta entre ms de dos muestras relacionadas se utiliza la
prueba de Friedman alternativa no paramtrica a la prueba ANOVA de medidas repetidas.
La hiptesis que contrasta es:
H
0
: Los rangos esperados en todas las muestras son iguales entre s
H
1
: Existe por lo menos una muestra con rango diferente al resto
Para llevar a cabo dicha prueba con Deducer seleccionamos el men Analysis Extras
Ranking analysis:
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 70 de 73
8.3 Variables categricas
Para comparar una variable respuesta categrica entre dos o ms muestras independientes
se utilizan las pruebas vistas en la seccin 7.3:
2
, prueba exacta de Fisher o prueba de
Razn de verosimilitud (Likelihood Ratio Test).
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 71 de 73
9 RESUMEN METODOLGICO
Los datos (variables) son caractersticas observables de los individuos de una poblacin.
Pueden ser:
CUALITATIVAS o CATEGRICAS: etiquetas (numrica o no) que representan
el grupo o categora a la cual pertenece un individuo.
CUANTITATIVAS: valores numricos para los que tiene sentido realizar
aritmtica.
En estadstica, las variables tambin las clasificamos en funcin del papel que tienen dentro
del anlisis de un determinado proyecto:
Variable Respuesta: variable que queremos explicar en el anlisis.
Variables Explicativas: variables que explican la variable respuesta.
Cmo determinar qu prueba es la idnea?
Variable respuesta categrica y variable explicativa categrica:
o En general, prueba
2
o Si el nmero de casillas de la tabla de contingencia con frecuencia esperada <5
es superior al 25 %:
Si la tabla es 2x2: Test Exacto de Fisher
Si la tabla no es 2x2: Prueba de Razn de verosimilitud
Variable respuesta continua y variable explicativa categrica (2 grupos):
o Si la distribucin de la respuesta en cada grupo es Normal: T-Test.
o Si la distribucin de la respuesta en cada grupo es Normal y no hay
homogeneidad de varianzas: T-Test con la correccin de Welch.
o Si la distribucin no es normal pero es continua y simtrica: Prueba U de
Mann-Whitney.
Variable respuesta continua y variable explicativa categrica (k grupos):
o Si la distribucin de la respuesta en cada grupo es Normal: ANOVA.
o Si la distribucin de la respuesta en cada grupo es Normal y no hay homogeneidad
de varianzas: ANOVA con la correccin de Welch.
o Si la distribucin no es normal pero es continua y simtrica: Prueba de Kruskal-
Wallis.
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 72 de 73
Cmo determinar si las pruebas T-Test o ANOVA son correctas?
Normalidad de la variable respuesta en cada grupo:
o Estudio grfico
o Prueba de Shapiro-Wilk
Homogeneidad de varianzas:
o Estudio grfico
o Prueba de Levene
Manual de Introduccin a Deducer
_______________________________________________________________
______________________________________________________________________
Servei dEstadstica Aplicada, Universitat Autnoma de Barcelona Pgina 73 de 73
10 BIBLIOGRAFA
Fellows I (2012). Deducer: An R Graphical User Interface (GUI) for Everyone. Version
2012-01-05, URL www.Deducer.org/manual.html
Wickham H (2009). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag, New
York.
En la siguiente pgina web se puede encontrar ayuda sobre ejemplos de cdigo en R para
usuarios de R que se pueden implementar en Deducer.
www.statmethods.net