Professional Documents
Culture Documents
Contrastes de Hipótesis
Nivel de significación
Significación
2
Elementos de una Prueba de Hipótesis
No se si los fumadores
pesarán como el resto…
unos 70Kg (hipótesis
nula)...
¡Gran
diferencia!
Muestra Rechazo la
aleatoria de hipótesis
fumadores
X 85 kg
4
¿Qué es una hipótesis?
Creo que el porcentaje
de enfermos será el 5%
Una creencia sobre la
población, principalmente sus
parámetros:
Media
Varianza
Proporción/Tasa
70 75
6
Decidir si los fumadores pesan más: Tamaño muestral
7
Decidir si los fumadores pesan más: Tipos de error
Tomemos la decisión basándonos
en muestras de tamaño 4...
Error de tipo II
Error de tipo I
8
Tipos de error al contrastar hipótesis
Realidad
H0 cierta H0 Falsa
No Rechazo H0 Error de tipo II
Correcto
Probabilidad β
9
Identificación de hipótesis
Hipótesis nula Ho Hip. Alternativa H1
La que contrastamos Niega a H0 (y creemos que es ‘mejor’).
H 0 : p 50 % , ,
, ,
H1 : p 50 %
10
¿Quién es H0?
H 0 : p 50 %
11
¿Quién es H0?
Solución:
H 0 : 20
12
Razonamiento básico
Si supongo que H0 es cierta...
¿qué hace un
científico cuando su
teoría no coincide
con sus
predicciones?
70
X 85
13
Razonamiento básico
Si supongo que H0 es cierta...
70
X 85
14
Razonamiento básico
Si supongo que H0 es cierta...
• No hay evidencia contra H0
¿Si una teoría hace
predicciones con •No se rechaza H0
éxito, queda
probado que es •El experimento no es concluyente
cierta?
•El contraste no es significativo
70
X 72
15
Región crítica y nivel de significación
Región crítica Nivel de significación: a
Valores ‘improbables’ si... Número pequeño: 1% , 5%
Es conocida antes de realizar el Fijado de antemano por el
experimento: resultados investigador
experimentales que refutarían H0 Es la probabilidad de rechazar H0
cuando es cierta
a=5%
No rechazo H0
H0: =70
16
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa
Unilateral Unilateral
a
H0: =70
Bioestadística. U. Málaga. Tema 7: Contrastes de hipótesis 18
Significación: p
No se rechaza
H0: =70
a
H0: =70
X 72 19
Significación: p
Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del
estadístico obtenido de la muestra.
Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0.
Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.
p es conocido después de realizar el experimento aleatorio
El contraste es no significativo cuando p>a
P a
No se rechaza
H0: =70
P a
20
X 72
Significación : p
X 85
21
Significación : p
El contraste es estadísticamente significativo cuando p< a
Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.
a P
X 85
22
Resumen: a, p y criterio de rechazo
Sobre a Sobre p
Es número pequeño, Es conocido tras
preelegido al diseñar el realizar el experimento
experimento
Estadísticos de contrastea
Edad del
encuestado
U de Mann-Whitney 259753,500
W de Wilcoxon 462319,500
Z -2,317
Sig. asintót. (bilateral) ,021
a. Variable de agrupación: Sexo del encuestado
26
Riesgos al contrastar hipótesis
Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal
27
Tipos de error al tomar una decisión
Realidad
Inocente Culpable
Inocente
vere OK Error
dicto
Menos grave
Culpable
Error OK
Muy grave
28
Tipos de error al contrastar hipótesis
Realidad
H0 cierta H0 Falsa
No Rechazo H0 Error de tipo II
Correcto
El tratamiento no El tratamiento si tiene efecto
tiene efecto y así se pero no lo percibimos.
decide.
Probabilidad β
Probabilidad α
29
No se puede tener todo
Recordar lo que
pasaba con
b sensiblidad y
especificidad
a
30
Conclusiones
Las hipótesis no se plantean después de observar los datos.
Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I
No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo
II
31
Problema
Un nuevo dispositivo de filtrado se instala en una
planta química. Antes y después de su instalación
una m.a. respectiva arrojó la siguiente información
del porcentaje de impurezas:
Antes Después
y1 12,5 y 2 10,2
S1 101,17 S 2 94,73
2 2
n1 8 n2 9
Si 1 2
y1 y 2 1 2
2 2
t t n1 n2 2
n1 n2
SP
n1n2
Bajo H0 t0
y1 y 2
12,5 10,2
2,3
0,48
n1 n2 17 9,9 0,49
SP SP
n1n2 72
SP
n1 1S1 n2 1S 2
2 2
7 101,17 8 94,73 1466,03
97,73
n1 n2 2 15 15
Nivel de significancia a=0,05 t0,975(15)gl = 2,131
Región crítica C = ] - ; -2,131 ] [ 2,131 ; [
t0 CC Se acepta H0
Es decir, el dispositivo nuevo no reduce
significativamente el porcentaje de impurezas.
H0 : 1 2 v/s H1 : 1 2
2
S1 101,17
Bajo H0 : F0 2
S2 94,73
1,068 Fn1 1,n2 1
{
Como por ejemplo:
- Edad
{
Cuantitativas - Peso
- Altura
Tipos de
variables
{
Como por ejemplo:
- Color de pelo
Cualitativas
- Color de ojos
- Sexo
Vamos a estudiar las posibles relaciones entre dos
variables cualitativas.
Mediante la herramienta:
TABLA DE CONTINGENCIA
EJEMPLO. Si queremos estudiar la relación entre el color
de ojos y el color del pelo.
La variable X: Color de ojos La variable Y: Color de pelo
x1: ojos claros y1: pelo claro
x2: ojos oscuros y2: pelo oscuro
¿Cómo construir una tabla de contingencia?
EJEMPLO:
¿Cuántos sujetos hay con problemas neuronales “Bajos” y el
tratamiento “Nuevo”?
¿Cómo se obtiene?
Sumando la fila para la distribución marginal de X
Sumando la columna para la distribución marginal de Y
EJEMPLO
Ejemplo:
DEPENDENCIA
Por lo tanto:
Eij = (NAi*NBj)/N.
Oij E ij
se calcula con la siguiente fórmula:
2
r c
2
i 1 j 1 E ij
r = número de categorías de la variable en las filas
c = número de categorías de la variable en las columnas
Oij = número observado en entrada ij
Eij = número esperado en la entrada ij
Este estadístico Chi-cuadrado tiene (r-1)*(c-1) grados de
libertad.
PRUEBA CHI CUADRADO
Rechace H 0 si
2 2
obs c
No rechace H 0 si
2 2
obs c
Limitaciones
EJEMPLO
TAMAÑO DE
FAMILIA
DEPENDENCIA DEL
COLEGIO 2Y3 4Y5 más de 5 Total
PARTICULAR
PAGADO 25 37 8 70
PARTICULAR
SUBVENCIONADO 10 62 53 125
MUNICIPAL
5 41 59 105
Total 40 140 120 300
PRUEBA CHI CUADRADO
Ejemplo
Nuestra tarea es determinar si el tamaño de la familia afecta
la decisión del tipo de colegio.
B1 Familia de 2 a 3 miembros
B2 Familia de 4 a 5 miembros
B3 Familia de más de 5 miembros
E12 = ( N
70
A1 * NB2 ) /
140 N300 = 32.67
E13 = ( N
70
A1 * NB3 ) /
120 N300 = 28
E21 = ( N
125A2 * NB1 ) /
40 N300 = 16.67
E22 = ( N
125 * N
A2 140 B2 ) / N300 = 58.33
E23 = ( N
125 * N
A2 120 B3 ) / N300 = 50
E31 = ( N
105 * N 14
B1 ) / N300 =
40
A3
49
E32 = ( N
105 * N
A3
140 ) /
B2 N300 =
42
E33 = ( N
105 * N
A3
120 ) /
B3 N300 =
PRUEBA CHI CUADRADO
Ejemplo
La fórmula de cálculo del estadístico viene dada por
3 3 Oij E ij 2
(25 9.33)
2
(37 32.67)
2
2
i 1 j 1 E ij
9.33 32.67
(828)
2 2 2 2
(10 16.67)
(62 58.33)
(53 50)
28 16.67 58.33 50
(514)
2 2 2
(41 49)
(59 42) 58.21
14 49 42
PRUEBA CHI CUADRADO
Ejemplo
El valor crítico desde una tabla Chi-cuadrado con 4 grados de
libertad y un margen de error del 5% es 9,488