Pruebas de Hipótesis PDF

Magíster en Educación
Contrastes de Hipótesis
Alvaro Cortínez Pontoni. Universidad de Tarapacá 1

Objetivos
 Conocer el proceso para contrastar hipótesis y su

relación con el método científico.
 Diferenciar entre hipótesis nula y alternativa
 Nivel de significación
 Significación
 Toma de decisiones, tipos de error y cuantificación del

error.
2
Elementos de una Prueba de Hipótesis
1.- Hipótesis Nula (H0), Hipótesis

Alternativa.
2.- Estadística de Prueba (Discrepancia).
3.- Región de Rechazo (Región Crítica).
4.- Regla de Decisión.
Contrastando una hipótesis Son demasiados...
No se si los fumadores
pesarán como el resto…
unos 70Kg (hipótesis
nula)...
¡Gran
diferencia!
Muestra Rechazo la
aleatoria de hipótesis
fumadores
X  85 kg
4
¿Qué es una hipótesis?
Creo que el porcentaje
de enfermos será el 5%
 Una creencia sobre la
población, principalmente sus
parámetros:
 Media
 Varianza
 Proporción/Tasa
 OJO: Si queremos contrastarla,

debe establecerse antes del
análisis.
5
Introducción breve: ¿Los fumadores pesan más?
En la población de no fumadores, el peso
medio es 70 kg.
¿Cómo podríamos ‘demostrar’ si

los fumadores pesan más…
... unos 5 kg más?
70 75
Veamos qué puede ocurrir si

tomamos muestras de tamaño 4 y
calculamos el peso medio… para cada caso.
6
Decidir si los fumadores pesan más: Tamaño muestral
¿Qué puede ocurrir si tomamos

muestras de tamaño 30 y 70 75
calculamos el peso medio?
7
Decidir si los fumadores pesan más: Tipos de error
Tomemos la decisión basándonos
en muestras de tamaño 4...
Puedo cometer 2 tipos de error.
Error de tipo II
Se acepta que Se acepta

no hay que sí hay
70 75
diferencias diferencias
Error de tipo I
8
Tipos de error al contrastar hipótesis
Realidad
H0 cierta H0 Falsa
No Rechazo H0 Error de tipo II
Correcto
Probabilidad β
Rechazo H0 Error de Correcto

Acepto H1
tipo I
Probabilidad α
9
Identificación de hipótesis
 Hipótesis nula Ho  Hip. Alternativa H1
 La que contrastamos  Niega a H0 (y creemos que es ‘mejor’).
 Los datos pueden refutarla

 Los datos pueden mostrar evidencia a
favor
 No debería ser rechazada sin una  No debería ser aceptada sin una gran
buena razón. evidencia a favor.
H 0 : p  50 % , , 
  , , 
 H1 : p  50 %
10
¿Quién es H0?
 Problema: ¿Hombres y mujeres conducen igual

de bien (o de mal)?¿Hay relación entre la forma
de conducir y el sexo?
 Solución:
 Traducir a lenguaje estadístico: p  50 %

 Establecer su opuesto:
p  50 %
 Seleccionar la hipótesis nula
H 0 : p  50 %
11
¿Quién es H0?
 Problema: ¿Una persona recibe en promedio 20

mensajes de Whatsapp por minuto?
 Solución:
 Traducir a lenguaje estadístico:   20

 Establecer su opuesto:   20
 Seleccionar la hipótesis nula
H 0 :   20
12
Razonamiento básico
Si supongo que H0 es cierta...
¿qué hace un
científico cuando su
teoría no coincide
con sus
predicciones?
  70
X  85
... el resultado del experimento sería improbable.

Sin embargo ocurrió.
13
Rechazo que H0 sea

cierta.
  70
X  85
... el resultado del experimento sería improbable.

Sin embargo ocurrió.
14
• No hay evidencia contra H0
¿Si una teoría hace
predicciones con •No se rechaza H0
éxito, queda
probado que es •El experimento no es concluyente
cierta?
•El contraste no es significativo
  70
X  72
... el resultado del experimento es coherente.
15
Región crítica y nivel de significación
Región crítica Nivel de significación: a
 Valores ‘improbables’ si...  Número pequeño: 1% , 5%
 Es conocida antes de realizar el  Fijado de antemano por el
experimento: resultados investigador
experimentales que refutarían H0  Es la probabilidad de rechazar H0
cuando es cierta
a=5%
Reg. Crit. Reg. Crit.
No rechazo H0
H0: =70
16
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa
Bilateral H1: 70
Unilateral Unilateral
H1: <70 H1: >70

17
Significación: p
a
H0: =70
Bioestadística. U. Málaga. Tema 7: Contrastes de hipótesis 18
Significación: p
No se rechaza
H0: =70
a
H0: =70
X  72 19
Significación: p
Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del
estadístico obtenido de la muestra.
Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0.
Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.
p es conocido después de realizar el experimento aleatorio
El contraste es no significativo cuando p>a
P a
No se rechaza
H0: =70
P a
20
X  72
Significación : p
Se rechaza H0: =70
Se acepta H1: >70

a
X  85
21
Significación : p
El contraste es estadísticamente significativo cuando p< a
Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.
a P
Se rechaza H0: =40
Se acepta H1: >40

a P
X  85
22
Resumen: a, p y criterio de rechazo
 Sobre a  Sobre p
 Es número pequeño,  Es conocido tras
preelegido al diseñar el realizar el experimento
experimento
 Conocido a sabemos  Conocido p sabemos

todo sobre la región todo sobre el resultado
crítica del experimento
 Sobre el criterio de rechazo

 Contraste significativo = p menor que a
23
Resumen: a, p y criterio de rechazo
Estadísticos de contrastea
Edad del
encuestado
U de Mann-Whitney 259753,500
W de Wilcoxon 462319,500
Z -2,317
Sig. asintót. (bilateral) ,021
a. Variable de agrupación: Sexo del encuestado
 Sobre el criterio de rechazo

 Contraste significativo = p menor que a
24
Ejemplo
 Problema: ¿Está sesgada la moneda?
H 0 : prob cruz  50%


 H1 : prob cruz  50%
Experimento: Lanzar la moneda repetidamente:
P=50% P=25% P=12,5% P=6,25% P=3% P=1,5%

25
Riesgos al tomar decisiones
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito
Los datos pueden refutarla
La que se acepta si las pruebas

 H0: Hipótesis nula no indican lo contrario
 Es inocente
Rechazarla por error tiene graves
consecuencias
 H1: Hipótesis alternativa

 Es culpable No debería ser aceptada sin una gran
evidencia a favor.
Rechazarla por error tiene

consecuencias consideradas menos
graves que la anterior
26
Riesgos al contrastar hipótesis
Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal
 H0: Hipótesis nula No especulativa

 (Ej.1) Es inocente
 (Ej.2) El nuevo tratamiento no tiene
efecto
 (Ej.3) No hay nada que destacar
 H1: Hipótesis alternativa Especulativa

 (Ej.1) Es culpable
 (Ej.2) El nuevo tratamiento es útil
 (Ej. 3) Hay una situación anormal
27
Tipos de error al tomar una decisión
Realidad
Inocente Culpable
Inocente
vere OK Error
dicto
Menos grave
Culpable
Error OK
Muy grave
28
Tipos de error al contrastar hipótesis
Realidad
H0 cierta H0 Falsa
No Rechazo H0 Error de tipo II
Correcto
El tratamiento no El tratamiento si tiene efecto
tiene efecto y así se pero no lo percibimos.
decide.
Probabilidad β
Rechazo H0 Error de Correcto

Acepto H1
tipo I El tratamiento tiene efecto y
El tratamiento no el experimento lo confirma.
tiene efecto pero se
decide que sí.
Probabilidad α
29
No se puede tener todo
Recordar lo que
pasaba con
b sensiblidad y
especificidad
a
 Para un tamaño muestral fijo, no se pueden reducir a la

vez ambos tipos de error.
 Para reducir b, hay que aumentar el tamaño muestral.
30
Conclusiones
 Las hipótesis no se plantean después de observar los datos.
 En ciencia, las hipótesis nula y alternativa no tienen el mismo papel:
 H0 : Hipótesis científicamente más simple.

 H1 : El peso de la prueba recae en ella.
 α debe ser pequeño
 Rechazar una hipótesis consiste en observar si p<α
 Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I
 No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo
II
 Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de

equivocarnos.
31
Problema
Un nuevo dispositivo de filtrado se instala en una
planta química. Antes y después de su instalación
una m.a. respectiva arrojó la siguiente información
del porcentaje de impurezas:
Antes Después
y1  12,5 y 2  10,2
S1  101,17 S 2  94,73
2 2
n1  8 n2  9
¿ El dispositivo de filtrado ha reducido el porcentaje

de impurezas significativamente ?
Desarrollo
H 0 : 1   2 v/ s H1 : 1   2
Si  1   2
 y1  y 2   1   2 

2 2
t t n1  n2  2
n1  n2
SP
n1n2
Bajo H0 t0 
 y1  y 2 
12,5  10,2

2,3
 0,48
n1  n2 17 9,9  0,49
SP SP
n1n2 72
SP 
n1  1S1  n2  1S 2
2 2

7 101,17  8  94,73 1466,03
  97,73
n1  n2  2 15 15
Nivel de significancia a=0,05 t0,975(15)gl = 2,131
Región crítica C = ] - ; -2,131 ]  [ 2,131 ;  [
t0  CC  Se acepta H0
Es decir, el dispositivo nuevo no reduce
significativamente el porcentaje de impurezas.
H0 : 1   2 v/s H1 :  1   2
2
S1 101,17
Bajo H0 : F0  2 
S2 94,73
 1,068  Fn1 1,n2 1
a  0,05 F0,025( 7 ,8 )  0,204 F0,975( 7 ,8)  4,53

Región crítica C = ] 0 ; 0,204 ]  [ 4,53 ;  [
F0  CC  Se acepta H0 : 12 = 22
TABLAS DE CONTINGENCIA
EJEMPLO: al estudiar el estado físico de una persona, se
realizan preguntas como altura, peso, si realiza ejercicio, etc.
Se realizan por la sencilla razón de que en ocasiones las

variables están interrelacionadas entre sí.
En el EJEMPLO, una persona alta es razonable suponer que

tiene mayor peso, dos variables comúnmente relacionadas.
RECORDEMOS
{
Como por ejemplo:
- Edad
{
Cuantitativas - Peso
- Altura
Tipos de
variables
{
Como por ejemplo:
- Color de pelo
Cualitativas
- Color de ojos
- Sexo
Vamos a estudiar las posibles relaciones entre dos
variables cualitativas.
 Mediante la herramienta:
TABLA DE CONTINGENCIA
EJEMPLO. Si queremos estudiar la relación entre el color
de ojos y el color del pelo.
 
La variable X: Color de ojos La variable Y: Color de pelo
x1: ojos claros y1: pelo claro
x2: ojos oscuros y2: pelo oscuro
¿Cómo construir una tabla de contingencia?
EJEMPLO. En un hospital psiquiátrico se hace un estudio en el

que participan 30 pacientes con dos tipos de problemas
neuronales (altos y bajos), queremos comparar un fármaco nuevo
con otro antiguo. ¿Cómo podemos representar esta situación?
¿Cómo podemos ver si el tratamiento nuevo es preferible al
anterior?
Variable X: Tipo de tratamiento

x1: antiguo
x2: nuevo
Variable Y: Problemas neuronales
y1: altos
y2: bajos
Los pacientes nos dijeron el tipo de problema y que fármaco
tomaban
Sujeto1 (alto, antiguo), Sujeto2 (alto, antiguo),

Sujeto3 (bajo, antiguo), Sujeto4 (alto, nuevo), Sujeto5
(alto, nuevo)…
Contamos cuantos hay del mismo tipo, es decir:
a = Problemas altos y tratamiento antiguo = 10

b = Problemas bajos y tratamiento antiguo = 4
c = Problemas altos y tratamiento nuevo = 5
d = Problemas bajos y tratamiento nuevo = 11
TABLA DE CONTINGENCIA
Tratamiento (X) Problemas neuronales (Y)
Altos (y1) Bajos (y2)
Antiguo (x1) a = 10 b=4
Nuevo (x2) c=5 d = 11
Estos 4 valores calculados llamaremos frecuencias absolutas

dobles (f), que nos dicen el número de sujetos que hay, con
valores específicos de las variables
Antiguo (x1) 10 (f11) 4 (f12)
Nuevo (x2) 5 (f21) 11 (f22)
EJEMPLO:
¿Cuántos sujetos hay con problemas neuronales “Bajos” y el
tratamiento “Nuevo”?
Seguimos la columna problemas neuronales “Bajos” y el

tratamiento “Nuevo”, y obtenemos:
f22 = 11
FRECUENCIAS RELATIVAS DOBLES
Obtenemos otra tabla como la anterior donde en cada celda

dividimos por el número de sujetos
En el EJEMPLO anterior recordemos que había 30 pacientes, por

tanto la tabla queda:

Antiguo (x1) 10/30 = 0,333 4/30 = 0,133
Nuevo (x2) 5/30 = 0,167 11/30 = 0,367
¿Para que sirven las frecuencias relativas dobles?
Tratamiento Problemas neuronales

Altos Bajos
Antiguo 0,333 (h11) 0,133 (h12)
Nuevo 0,167 (h21) 0,367 (h22)
Si estos valores los multiplicamos por 100 nos da el
porcentaje de sujetos correspondiente a esa celda
EJEMPLO: ¿Qué porcentaje de sujetos hay con

problemas “Altos” y tratamiento “Nuevo”?
0,167 x 100 = 16,7% es el porcentaje

FRECUENCIAS MARGINALES Y
DISTRIBUCIÓN MARGINAL
En la tabla de las frecuencias absolutas dobles anterior,

añadimos una columna a la derecha y una fila debajo, que
llamaremos “TOTAL”, en ambos casos.
La columna del TOTAL llamaremos distribución marginal de X

Cada valor llamaremos frecuencia marginal de X
La fila del TOTAL llamaremos distribución marginal de Y
Cada valor llamaremos frecuencia marginal de Y
¿Cómo se obtiene?
Sumando la fila para la distribución marginal de X
Sumando la columna para la distribución marginal de Y
EJEMPLO
Tratamiento Problemas neuronales TOTAL

Altos Bajos
Antiguo 10 4 10+4 = 14
(f1.)
Nuevo 5 11 5+11= 16
(f2.)
TOTAL 10+5 = 15 4+11 = 15 30 (n)
(f.1) (f.2)
El valor n, se obtiene sumando cualquier distribución marginal,

representa el número total de sujetos, que como recordamos
son 30 pacientes.
FRECUENCIAS CONDICIONALES Y
DISTRIBUCIÓN CONDICIONAL
Vamos a conocer estos términos con nuestro ejemplo
Se trabaja con la tabla de frecuencias absolutas, es decir:
Tratamiento Problemas neuronales TOTAL

Altos Bajos
Antiguo 10 (f11) 4 (f12) 14 (f1.)
Nuevo 5 (f21) 11 (f22) 16 (f2.)
TOTAL 15 (f.1) 15 (f.2) 30 (n)
Podemos obtener la distribución de X condicionada por
y1 ó y2
Podemos obtener la distribución de Y condicionada por
x1 ó x2
Calculemos una distribución de Y condicionada por X, esto

implica calcular:
La frecuencia condicional de y1 condicionada por x2
La frecuencia condicional de y2 condicionada por x2
Los datos que nos interesan son:
Tratamiento Problemas neuronales (Y) TOTAL

Nuevo (x2) 5 11 16
Las frecuencias condicionales son:

Nuevo (x2) 5/16=0,3125 11/16=0,6875 1
(h(y1/x2)) (h(y2/x2))
La interpretación

Nuevo (x2) 5/16=0,3125 11/16=0,6875 1
(h(y1/x2)) (h(y2/x2))
- El 31,25% de los pacientes con el tratamiento nuevo,

tienen problemas neuronales altos
- El 68,75% de los pacientes con el tratamiento nuevo,
tienen problemas neuronales bajos
ALGUNAS
REPRESENTACIONES
GRÁFICAS
Diagrama de barras
adosadas
Diagrama de barras apilado
Gráfico tridimensional
PRUEBA CHI CUADRADO
Ejemplo:
 La siguiente tabla de contingencia muestra la tabulación

cruzada de la variable Cantidad de libros en Biblioteca
(dividido en tres categorías, menos de 2000; entre 2000 y
4000 y más de 4000) y la dependencia del colegio (dividida
en tres categorías, Municipal, Particular Subvencionado y
Particular Pagado).
PRUEBA CHI CUADRADO
Tablas de Contingencia y Medidas de Asociación
DEPENDENCIA
CANTIDAD PARTICULAR PARTICULAR MUNICIPAL

LIBROS PAGADO SUBVENCIONADO Total
Menos de 2000 45 95 62 202
2000 - 4000 65 80 100 245
más de 4000 90 62 89 241

Total 200 237 251 688
PRUEBA CHI CUADRADO

 Las entradas de la tabla representan el número de colegios
en la muestra con cada combinación de cantidad de libros en
la biblioteca y dependencia del colegio. Por ejemplo, 45
colegios particulares pagados tienen menos de 2000 libros.
 El test Chi-cuadrado de Pearson se basa en encontrar cual
hubiera sido el valor de cada entrada si las variables fueran
independientes. Es decir el valor esperado de cada celda de
la tabla si las variables cantidad de libros en la biblioteca y
dependencia del colegio son independientes.
PRUEBA CHI CUADRADO

 Si cantidad de libros en la biblioteca y dependencia del
colegio son independientes, la probabilidad del evento
conjunto "A1: tener menos de 2000 libros" y "B1:
dependencia particular pagada" es el producto de esas dos
probabilidades:
 Pr(A1 y B1) = Pr(A1)*Pr(B1)
 Pr(A1) = A1/A = 202/688,

 Pr(B1) = B1/B = 200/688
 Donde A y B son las frecuencias totales de los eventos.
PRUEBA CHI CUADRADO
 Por lo tanto:
 Pr(A1 y B1) = Pr(A1)*Pr(B1) = 202*200/(688*688) = 0.0854
 El número esperado en la entrada A1B1 es entonces:
 N* Pr(A1 y B1) = 688*0.0854 = 58,72

PRUEBA CHI CUADRADO

 En general la fórmula del valor esperado es:
 Eij = (NAi*NBj)/N.
 Eij = número esperado

 NAi= número de elementos en la categoría Ai
 NBi= número de elementos en la categoría Bi
 Para A1B1 el número esperado es:

 E11 = (202*200)/688 = 58,72
PRUEBA CHI CUADRADO

 Este proceso se debe repetir para cada una de las entradas
de la tabla. Una vez hecho esto el estadístico Chi-cuadrado
Oij  E ij 
se calcula con la siguiente fórmula:
2

r c

2

i 1 j 1 E ij
 r = número de categorías de la variable en las filas
 c = número de categorías de la variable en las columnas
 Oij = número observado en entrada ij
 Eij = número esperado en la entrada ij
 Este estadístico Chi-cuadrado tiene (r-1)*(c-1) grados de
libertad.
PRUEBA CHI CUADRADO

 En nuestro ejemplo hay (3-1)*(3-1) = 4 grados de libertad.
Realizando todos los cálculos con la tabla del ejemplo, el
estadístico da 27,389.
 Se debe comparar este número con el valor crítico de la
distribución Chi-cuadrado con 4 grados de libertad a un nivel
de significación estadística del 5%
PRUEBA CHI CUADRADO
 El valor crítico de la distribución Chi-cuadrado con 4 grados

de libertad a un nivel de significación estadística del 5% el
valor crítico correspondiente es 9,48.
Rechace H 0 si  
2 2
obs c
No rechace H 0 si  
2 2
obs c
Como 27,389 > 9,48 se rechaza la hipótesis nula. Es

decir, las variables no son independientes.
PRUEBA CHI CUADRADO
Limitaciones
La muestra de tamaño n debe ser suficientemente grande,

de modo que ninguna de las frecuencias esperadas Eij sea
menor que 1 y no más del 20 % de los mismos sea menor
que 5.
PRUEBA CHI CUADRADO
Ejemplo
 Considere un estudio sobre consumo que esta interesado en

investigar las preferencias de las familias por diferentes Tipos
de colegios.
 A priori, uno pensaría que sería más probable que familias

más numerosas eligieran colegios municipales o
subvencionados y que familias con menos miembros optaran
por colegio particulares pagados.
PRUEBA CHI CUADRADO
Ejemplo
 Supongamos que para investigar esta relación, el
investigador toma una muestra aleatoria de tamaño n=300 de
todas aquellas familias que matricularon a sus hijos en las
escuelas de una región.
 La siguiente tabla provee la clasificación de los 300 datos:

PRUEBA CHI CUADRADO
EJEMPLO
TAMAÑO DE
FAMILIA
DEPENDENCIA DEL
COLEGIO 2Y3 4Y5 más de 5 Total
PARTICULAR
PAGADO 25 37 8 70
PARTICULAR
SUBVENCIONADO 10 62 53 125
MUNICIPAL
5 41 59 105
Total 40 140 120 300
PRUEBA CHI CUADRADO
Ejemplo
 Nuestra tarea es determinar si el tamaño de la familia afecta
la decisión del tipo de colegio.
 La hipótesis nula es que las variables son independientes

(esto es, no hay relación entre tamaño familiar y la elección
del colegio); la hipótesis alternativa es que las variables no
son independientes.
PRUEBA CHI CUADRADO
Ejemplo
 Trabajemos con un nivel de confianza del 95% y calculemos
el estadístico de Pearson.
 Para esto asignemos las siguientes letras a los eventos de la

tabla:
 A1 Dependencia particular pagada
 A2 Dependencia particular subvencionada
 A3 Dependencia municipal
PRUEBA CHI CUADRADO
Ejemplo
 B1 Familia de 2 a 3 miembros
 B2 Familia de 4 a 5 miembros
 B3 Familia de más de 5 miembros
 Sabemos que el número esperado de observaciones que se

esperarían en la celda (Ai, Bj) si las variables fueran
independientes esta definido por:
 Eij = (NAi*NBj)/N, por lo tanto:

PRUEBA CHI CUADRADO
Ejemplo
 E11 = ( NA1 * NB1 ) / N =
 E12 = ( NA1 * NB2 ) / N =
 E13 = ( NA1 * NB3 ) / N =
 E21 = ( NA2 * NB1 ) / N =
 E22 = ( NA2 * NB2 ) / N =
 E23 = ( NA2 * NB3 ) / N =
 E31 = ( NA3 * NB1 ) / N =
 E32 = ( NA3 * NB2 ) / N =
 E33 = ( NA3 * NB3 ) / N =
PRUEBA CHI CUADRADO
Ejemplo
 E11 = ( N
70
A1 * NB1 ) /
40 N300 = 9.33
 E12 = ( N
70
A1 * NB2 ) /
140 N300 = 32.67
 E13 = ( N
70
A1 * NB3 ) /
120 N300 = 28
 E21 = ( N
125A2 * NB1 ) /
40 N300 = 16.67
 E22 = ( N
125 * N
A2 140 B2 ) / N300 = 58.33
 E23 = ( N
125 * N
A2 120 B3 ) / N300 = 50
 E31 = ( N
105 * N 14
B1 ) / N300 =
40
A3
49
 E32 = ( N
105 * N
A3
140 ) /
B2 N300 =
42
 E33 = ( N
105 * N
A3
120 ) /
B3 N300 =
PRUEBA CHI CUADRADO
Ejemplo
 La fórmula de cálculo del estadístico viene dada por

3 3 Oij  E ij  2
(25 9.33)
2
(37 32.67)
2

2
   
i 1 j 1 E ij
9.33 32.67
(828)   
2 2 2 2

(10 16.67) 
(62 58.33) 
(53 50) 
28 16.67 58.33 50
(514)  
2 2 2

(41 49) 
(59 42)  58.21
14 49 42
PRUEBA CHI CUADRADO
Ejemplo
 El valor crítico desde una tabla Chi-cuadrado con 4 grados de
libertad y un margen de error del 5% es 9,488
 Como el valor del estadístico de Pearson 58.21 es mayor al

valor crítico de la tabla se rechaza la hipótesis nula.
 Por lo tanto, podemos afirmar que no existe independencia

entre el tamaño de la familia y la elección del tipo de colegio.

Pruebas de Hipótesis PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Pruebas de Hipótesis PDF

Uploaded by

Copyright:

Available Formats

Magíster en Educación

Alvaro Cortínez Pontoni. Universidad de Tarapacá 1

 Conocer el proceso para contrastar hipótesis y su

 Diferenciar entre hipótesis nula y alternativa

 Toma de decisiones, tipos de error y cuantificación del

1.- Hipótesis Nula (H0), Hipótesis

 OJO: Si queremos contrastarla,

¿Cómo podríamos ‘demostrar’ si

Veamos qué puede ocurrir si

¿Qué puede ocurrir si tomamos

Puedo cometer 2 tipos de error.

Se acepta que Se acepta

Rechazo H0 Error de Correcto

 Los datos pueden refutarla

 Problema: ¿Hombres y mujeres conducen igual

 Traducir a lenguaje estadístico: p  50 %

 Problema: ¿Una persona recibe en promedio 20

 Traducir a lenguaje estadístico:   20

... el resultado del experimento sería improbable.

Rechazo que H0 sea

... el resultado del experimento sería improbable.

... el resultado del experimento es coherente.

Reg. Crit. Reg. Crit.

Bilateral H1: 70

H1: <70 H1: >70

Se rechaza H0: =70

Se acepta H1: >70

Se rechaza H0: =40

Se acepta H1: >40

 Conocido a sabemos  Conocido p sabemos

 Sobre el criterio de rechazo

 Sobre el criterio de rechazo

H 0 : prob cruz  50%

Experimento: Lanzar la moneda repetidamente:

P=50% P=25% P=12,5% P=6,25% P=3% P=1,5%

Los datos pueden refutarla

La que se acepta si las pruebas

 H1: Hipótesis alternativa

Rechazarla por error tiene

 H0: Hipótesis nula No especulativa

 H1: Hipótesis alternativa Especulativa

Rechazo H0 Error de Correcto

 Para un tamaño muestral fijo, no se pueden reducir a la

 Para reducir b, hay que aumentar el tamaño muestral.

 En ciencia, las hipótesis nula y alternativa no tienen el mismo papel:

 H0 : Hipótesis científicamente más simple.

 α debe ser pequeño

 Rechazar una hipótesis consiste en observar si p<α

 Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de

¿ El dispositivo de filtrado ha reducido el porcentaje

a  0,05 F0,025( 7 ,8 )  0,204 F0,975( 7 ,8)  4,53

Se realizan por la sencilla razón de que en ocasiones las

En el EJEMPLO, una persona alta es razonable suponer que

EJEMPLO. En un hospital psiquiátrico se hace un estudio en el

Variable X: Tipo de tratamiento

Sujeto1 (alto, antiguo), Sujeto2 (alto, antiguo),

Contamos cuantos hay del mismo tipo, es decir:

a = Problemas altos y tratamiento antiguo = 10

Tratamiento (X) Problemas neuronales (Y)

Altos (y1) Bajos (y2)

Antiguo (x1) a = 10 b=4

Nuevo (x2) c=5 d = 11

Estos 4 valores calculados llamaremos frecuencias absolutas

 Pr(A1 y B1) = Pr(A1)Pr(B1) = 202200/(688*688) = 0.0854