Professional Documents
Culture Documents
INFERENCIA ESTADÍSTICA
INTRODUCCIÓN.
El empleo de encuestas es uno de los métodos de investigación más utilizados en
la actualidad. La realidad, en continuo cambio y con muchísimas opciones diferentes, es
muy difícil de abarcar en su totalidad. Por este motivo se hace necesario seleccionar una
parte lo más pequeña posible, pero representativa del total, en la que sea posible medir
las características deseadas. Esta necesidad ha obligado a crear un instrumento
matemático que llamamos muestreo.
Las muestras que se elijan para hacer un estudio deben ser lo más pequeñas
posible por exigencias de tiempo y coste. Además, el aumento del número de datos no
siempre acarrea una mayor certeza, ya que más importante que escoger muchos datos es
que los datos estén bien seleccionados, con el fin de que sean representativos de la
población que se desea estudiar. Se verá como el azar juega un papel importante en la
elección de la muestra para que ésta sea representativa.
POBLACIÓN Y MUESTRA.
Definición.
POBLACIÓN.
Se llama población o universo a cualquier conjunto, colectivo o
colección finita o infinita de individuos o elementos.
Ejemplo:
Si pasamos un test a todos los alumnos españoles de una determinada edad, los
resultados obtenidos constituyen una población de medidas de la capacidad a la que se
derige el test.
Definición.
CENSO.
Se da el nombre de censo a la enumeración y anotación de ciertas
características de todos los elementos de una población.
Ejemplo:
El profesor-tutor de un grupo de un instituto realiza un listado de los alumnos/as
de su tutoría, en la incluye, nombre y apellidos, nombre de los padres, domicilio,
teléfono, número de hermanos y asignaturas pendientes del curso anterior. Este sería un
ejemplo de censo de la población formada por el alumnado del grupo en cuestión.
Ejemplo:
- Si consideramos el número de hermanos que tienen los alumnos/as de un
curso de un instituto determinado, estaríamos hablando de una población
finita. Habría tantos valores como alumnos/as haya en dicho curso.
- Si obtenemos una serie de medidas del tiempo que tarda un alumno en
resolver una división de dos cifras, estas medidas pueden consideradas parte
de un conjunto mucho mayor, de tamaño indefinidamente grande,
constituido por todas las medidas que obtendríamos si repitiésemos la
experiencia una y otra vez.
- Supongamos que se lanza un dado en reiteradas ocasiones, y anotamos el
valor de la cara superior. Tal experiencia puede ser repetidamente hasta el
infinito, por lo que cualquier conjunto de resultados podría ser considerado
una parte extraída de una población indefinidamente grande.
En definitiva, con frecuencia, las poblaciones en Estadística suelen ser
consideradas infinitas.
Definición.
MUESTRA.
Se define muestra como una parte o subconjunto de una población,
debidamente elegida, que se somete a observación científica en representación
de la misma, con el propósito de obtener resultados válidos para el total de la
población.
Por otro lado, el uso del muestreo presenta limitaciones, entre estas destacamos:
a) El riesgo que supone la toma de una muestra que pueda no ser representativa.
b) Cuando es necesaria información de todos los elementos de la población.
c) Cuando no se domina bien la técnica de muestreo.
d) Cuando la población esté formada por un número muy pequeño de
elementos, ya que una ligera equivocación en la toma de la muestra puede
originar grandes errores.
Definición.
PARÁMETRO.
Se denomina parámetro a todo valor que sirva para describir un
conjunto de datos.
Ejemplo:
Supongamos que tenemos la estatura, medida en centímetros, de un grupo de
diez jóvenes: {170, 172, 180, 175, 178, 194, 178, 165, 170, 178}. La estatura media es
de 176 centímetros y la desviación típica es (aproximadamente) de 7.5 centímetros. La
media y la desviación típica son valores que describen al conjunto de estaturas, y serían
ejemplos de parámetros.
Definición.
Ejemplo:
A partir del valor alcanzado por la media en una muestra podríamos intentar
estimar el valor de la media de en la población. Así, si los diez jóvenes del ejemplo
anterior son alumnos/as elegidos al azar de una escuela de baloncesto, intentaríamos
deducir la estatura media de los integrantes de dicha escuela, tomando como referencia
los 176 centímetros obtenidos.
TIPOS DE MUESTREO.
Definición.
MUESTREO.
Se llama muestreo al procedimiento mediante el cual elegimos a las
unidades estadísticas que forman la muestra, dentro del conjunto que constituye
la población.
Definiciones.
FACTOR DE ELEVACIÓN.
Se denomina factor o coeficiente de elevación al cociente entre el
N
tamaño de la población y el tamaño de la muestra, . Representa el número de
n
elementos que hay en la población por cada elemento de la muestra.
FRACCIÓN DE MUESTREO.
Se denomina fracción de muestreo al cociente entre el tamaño de la
n
muestra y el tamaño de la población, . Si se multiplica por 100, representa el
N
porcentaje de la población que representa la muestra.
A) MUESTREOS PROBABILÍSTICOS.
Ejemplo:
En el muestreo aleatorio sin reposición, el número de muestras de tamaño n que
N
se pueden formar es: , y, por tanto, la probabilidad de elegir una muestra
n
determinada es: p
1
N n! · n! .
N N!
n
En efecto:
N 1
casos favorables n 1 N 1! · N n! · n! n
p .
casos posibles N N n! · n 1! · N! N
n
Las tablas de números aleatorios son tablas de números colocados de tal forma
que no exista ninguna relación entre ellos sea cual sea el sentido en que los leamos. Al
final de los contenidos teóricos de este tema aparece una tabla de números aleatorios.
Ejemplo:
Si en una población de 834 individuos deseamos extraer una muestra de 42,
asignaríamos un número a cada uno de los 834 elementos de la población. Para
determinar los 42 elementos de la muestra, marcaríamos un número en la tabla de
números aleatorios al azar y a partir de éste leeríamos en dicha tabla números de tres
dígitos en cualquier dirección, desestimando los que superen 834.
N
a) Calculamos el coeficiente de elevación, k .
n
b) Elegimos aleatoriamente un número m comprendido entre 1 y k.
c) Determinamos la muestra sumándole repetidamente k al número, m,
elegido.
m, m k , m 2k , m 3k , ........, m n 1k
Ejemplo:
Supongamos que queremos hacer una investigación en un instituto de 720
alumnos y alumnas, de los que queremos tomar una muestra de 80 individuos. En
primer lugar, ordenar todos los alumnos y alumnas alfabéticamente sería un buen
criterio de ordenación. Sin embargo, disponer los alumnos situando una tras otra las
listas de los alumnos/as de cada clase, en las que estos aparezcan por orden de
calificaciones, podría llevar a que se seleccionaran sistemáticamente los alumnos/as con
calificaciones altas y no los de las calificaciones bajas, o viceversa.
Una vez ordenados adecuadamente, calculamos el coeficiente o factor de
720
elevación 9 . Elegimos aleatoriamente un número entre 1 y 9 (tabla de números
80
aleatorios, calculadora, .....). Si el número obtenido fuese 6, los individuos
seleccionados serían:
{6, 15 (= 6+9), 24 (= 6+2 · 9), 33 (=6+3 · 9), ........, 717 (=6+79 · 9)}
n1 n n n n
2 3 .......... .. k
N1 N 2 N 3 Nk N
Ejemplo:
Se desea extraer una muestra de 60 alumnos y alumnas de un centro escolar en el
que hay 500 matriculados, de los que 300 son niños y 200 son niñas, para estimar la
estatura media.
Si se utiliza un muestreo estratificado de afijación igual deberíamos
seleccionar 30 niños y 30 niñas.
Si se utiliza un muestreo estratificado de asignación proporcional deberíamos
escoger 36 niños y 24 niñas.
Si conocemos la variabilidad de la característica considerada, y sabemos que
la varianza en el caso de los alumnos es de 15 cm y en las alumnas 5 cm, la
proporción de alumnos a alumnas sería de 3 : 1, y usando un muestreo
estratificado de asignación óptima, los tamaños de las submuestras deberían
ser de 45 niños y 15 niñas.
Ejemplo:
Si queremos hacer un estudio sobre la influencia de un determinado pienso en el
engorde de cerdos criados en granjas, podemos seleccionar aleatoriamente las granjas y
luego dentro de ellas estudiar los pesos de los cerdos, bien de todos los cerdos de cada
granja o de una muestra representativa de la población de cerdos de la misma.
Ejemplo:
En el ejemplo anterior referido al estudio sobre la influencia de un determinado
pienso en el engorde de cerdos, supongamos que el estudio se realiza a nivel de toda
España. Entonces, en una primera etapa, podríamos seleccionar de forma aleatoria una
serie de provincias; en segundo lugar, en cada una de las provincias seleccionar también
aleatoriamente algunas comarcas (bien delimitadas); posteriormente, dentro de cada
comarca elegir al azar un grupo de granjas; y finalmente, en cada una de ellas estudiar
todos los cerdos o una muestra de ellos elegida adecuadamente.
B) MUESTREOS NO PROBABILÍSTICOS.
Ejemplo:
Se pretende hacer una encuesta en un instituto, entre los alumnos de 4º de
E.S.O., para saber la modalidad de Bachillerato que seguirán los que continúen
estudiando. El Jefe de Estudios pregunta a unos cuantos alumnos de cada grupo de 4º de
E.S.O., con el único criterio de que piensa que esos seguirán estudiando.
Este tipo de muestreo carece, pues, de una base teórica satisfactoria a pesar de lo
cual su uso está bastante generalizado, especialmente el llamado muestreo por cuotas.
Ejemplo:
El agente visitador o entrevistador recoge información de personas o familias en
número proporcional al de las que cumplen determinadas condiciones en la población, y
puede elegirlas a su arbitrio dentro de grupos establecidos por sexo, edad o ciertos
niveles socioeconómicos. Así, se podría fijar que el 15 % de la muestra ha de constar de
mujeres que tengan menos de 40 años, sean de clase media y habiten en determinado
barrio, y esta sería la única condición para seleccionar este 15 % de la muestra.
Ejemplo:
Para estimar el problema de absentismo escolar, un investigador puede
seleccionar los alumnos de un centro situado en una zona de trabajadores agrícolas
temporeros que han de desplazarse en determinadas épocas del año, los alumnos de un
centro situado en una barriada marginal de una gran ciudad y los de un centro
residencial, dado que por su conocimiento teórico del problema sabe que éstos
representan los diferentes tipos de comportamientos en relación con la asistencia a
clase.
Ejemplo:
Estas muestras se emplean a menudo en la vida corriente, por ejemplo, en el
comercio cuando se supone que un trozo de tela o un sorbo de vino, representa bien a
los artículos completos. Por otra parte, influye en la adopción de este procedimiento en
estas cuestiones de la realidad cotidiana el hecho de que, en caso de equivocación, las
consecuencias no serían demasiado graves.
INFERENCIA ESTADÍSTICA.
Definición.
Ejemplo:
Para ilustrar este concepto, construiremos la distribución muestral del estadístico
media, X , cuando extraemos muestras aleatorias de tamaño 2 en una población
constituida por los valores {1, 2, 3}. La muestra estará formada por los valores de las
dos variables aleatorias: x1 (resultado de la primera selección) y x2 (resultado de la
segunda elección). A su vez, la media muestral X es también una variable aleatoria,
puesto que se obtiene por combinación lineal de las dos variables aleatorias x1 y x2 .
x1 1 1 2 2 2 1 2 3 3 1
x2 2 3 1 3 2 3 1 1 3 1
x 1.5 2 1.5 2.5 2 2 1.5 2 3 1
x1 1 2 3 3 2 1 1 3 3 1
x2 2 3 3 2 1 2 2 2 1 3
x 1.5 2.5 3 2.5 1.5 1.5 1.5 2.5 2 2
x ni fi
1 1 0.05
1.5 7 0.35
2 6 0.30
2.5 4 0.20
3 2 0.10
x1 1 1 1 2 2 2 3 3 3
x2 1 2 3 1 2 3 1 2 3
x 1 1.5 2 1.5 2 2.5 2 2.5 3
x ni fi
1 1 1/9 = 0.11
1.5 7 2/9 = 0.22
2 6 3/9 = 0.33
2.5 4 2/9 = 0.22
3 2 1/9 = 0.11
Distribución de la población.
1.045825033 2 1.479019945
0.853912565 3 1.479019948
0.739509972 4 1.479019944
y ”
X X n
Tras la lectura del teorema central del límite, cabe preguntarse: ¿qué entendemos
por un n sufucientemente grande?.
Definición.
X
N n
·
X n N 1
X
X n
Pero por el teorema del límite central sabemos que la distribución muestral de
las medias se acerca a la distribución normal cuando aumenta el tamaño de la muestra.
X
Z
X
n
s s
n 1 n
X n n 1
Observación importante:
Ejemplos:
- Consideremos la población P = {5, 7, 9}. Supongamos que formamos todas
las posible muestras de tamaño 2 extraíbles de esta población, sin reposición:
{5 , 7}, {5 , 9}, {7 , 5}, {7 , 9}, {9 , 5}, {9 , 7}.
En cada una estas medias calculamos la correspondiente media:
{5 , 7} 6, {5 , 9} 7, {7 , 5} 6,
{7 , 9} 8, {9 , 5} 7, {9 , 7} 8.
La distribución de medias muestrales es:
X 6 7 8 Total
Ni 2 2 2 6
Definición.
p
p
pq
p n
p
p
pq N n
·
p n N 1
Ejemplo:
- Consideramos la población P = {1, 2, 3}. La proporción de cifras pares es
1 2
p y de cifras impares es q . Las muestras con reemplazamiento de tamaño 2 y
3 3
sus correspondientes proporciones p’ de cifras pares son:
Muestra 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3
p’ 0 0.5 0 0.5 1 0.5 0 0.5 0
ESTIMACIÓN DE PARÁMETROS.
ERROR MUESTRAL.
Siempre que tomamos una muestra en representación de toda la población se
comete un error. Normalmente existe una diferencia entre los valores obtenidos a partir
de la muestra y los correspondientes a la población. Pero cuando hablamos del error
muestral no nos referimos al error real que hemos obtenido nosotros, sino a un error
determinado estadísticamente, válido para todas las posibles muestras del mismo
tamaño.
Definición.
ERROR MUESTRAL.
Se define el error muestral o error de muestreo como la desviación
típica de la distribución muestral de las medias o de las proporciones.
p·q
,
X n p n
N n p· q N n
· , ·
X n N 1 p n N 1
La distribución muestral de las medias sigue una ley normal N ,
n
y su representación gráfica es la curva de Gauss. Estadísticamente nunca se puede
abarcar toda el área comprendida entre la curva de Gauss y el eje OX, por ser éste una
asíntota de la curva, siendo preciso fijar el área se pretende abarcar. Esta área, (1-),
recibe el nombre de nivel de confianza porque representa el área que contendrá,
probablemente, el valor de la media poblacional . Se expresa en tanto por ciento.
Definición.
NIVEL DE CONFIANZA.
Se denomina nivel de confianza o coeficiente de confianza a la
probabilidad de que el estimador por intervalo cubra el verdadero valor del
parámetro que se pretende estimar. Se expresa por 1 - .
Definición.
NIVEL DE SIGNIFICACIÓN.
Se denomina nivel de significación o nivel de riesgo a la diferencia
entre la certeza y el nivel de confianza deseado. Por tanto, se expresa por .
Definición.
p x d 1
De lo anterior se deduce:
p d x d 1
O lo que es lo mismo:
p x d x d 1
Si:
d X entonces
p x X x X 0.6826
d 2 X entonces p x 2 X x 2 X 0.9544
d 3 X entonces px 3 X
x 3 X 0.9973
Es decir:
d X para un nivel de confianza del 68.26 %.
d 2 X para un nivel de confianza del 95.44 %.
d 3 X para un nivel de confianza del 99.73 %.
En general:
p x k X x k X 1
Para una variable tipificada, el valor de k se obtiene así:
De donde:
pZ k 1
2
cuyo valor lo podemos obtener en la tabla N(0 , 1) para una valor dado .
f p· q f p · q
p k p k 1
n n n n
TAMAÑO DE LA MUESTRA.
p· q k 2 · p ·q
d k · k· n
p n d2
p· q N n k 2 · N · p· q
d k · k· · n
p n N 1 N 1·d 2 k 2· p · q
N n N · k 2· 2
d k · k· · n
X n N 1 d 2·N 1 k 2· 2
p(a b) 1
Sea X una variable aleatoria con distribución N (, ) y x1, x2, ......, xn, una
muestra aleatoria de tamaño n. La distribución muestral de las medias X sigue una ley
X
normal N , y la variable tipificada Z es una distribución N(0,1).
n
n
Recordemos que si la población no es normal basta con tomar una muestra
suficientemente grande.
Gráficamente:
p z Z z 1
2 2
Sustituyendo:
X
p z z 1
2 2
n
o bien:
X
p z z 1
2 2
n
de donde:
p X z · X z · 1
n n
2 2
x z · , xz ·
n n
2 2
s s
x z · , xz ·
n n
2 2
Observaciones.
N n N n
x z · · , xz · ·
n N 1 n N 1
2 2
Para estimar la proporción “p” de elementos que posee una característica de una
f
población, lo hacemos mediante una muestra de tamaño n en donde p' es la
n
proporción de elementos que poseen la característica determinada y q’ = 1 - p’ la
proporción de elementos que no la poseen.
p' p
p z z 1
pq
2 n 2
o lo que es igual:
p p'
p z z 1
pq
2 n 2
de donde:
pq pq
p p' z · p p' z · 1
n n
2 2
p ·q
El error máximo admisible d z · , tiene el grave inconveniente de
n
2
que está dado en función de p. Por tanto, una vez extraída la muestra y obtenida la
proporción muestral p’, debemos estimar los valores de p y q, mediante: p = p’ y q = q’.
Ejemplos:
- Supongamos que deseamos valorar el grado medio de conocimientos en
historia de una población de varios miles de estudiantes. Sabemos que la
desviación típica poblacional es de 2.3 puntos. Nos proponemos estimar la
media poblacional, , pasando una prueba a 100 alumnos, con un nivel de
confianza del 95 %. Calculamos la media en la muestra, resultando ser de
6.32. Para hacer esta estimación vamos a construir el intervalo de confianza
de con un nivel de confianza del 95 %.
El intervalo de confianza para la media en poblaciones infinitas o finitas con
reemplazamiento, caso que suponemos (de varios miles), es:
x z · , xz ·
n n
2 2
En nuestro ejemplo:
0.05
Como: p Z z 1 1 0.975, tenemos z 1.96 , y así:
2
2 2 2
2.3 2.3
6.32 1.96 · , 6.32 1.96·
100 100
De donde, operando, tenemos el intervalo de confianza buscado:
5.87 , 6.77
- Para estimar la media de los resultados que obtendrían al resolver un cierto
test los alumnos de 4 % de E.S.O. de toda una comunidad autónoma, se les
pasa dicho test a 400 de ellos escogidos al azar. Los resultados obtenidos en
dicha muestra dan una media de 3.25 con una desviación típica de 1.12. A
partir de ellos, pretendemos estimar el valor de la media de la población con
un nivel de confianza del 95 %. En este caso se procedería como en el caso
anterior, sólo que deberemos utilizar el valor de desviación típica muestral en
lugar de la poblacional, cosa que se puede hacer ya que el tamaño de la
muestra es superior a 30. En definitiva, el intervalo de confianza para la
media poblacional sería:
s s
x z · , xz ·
n n
2 2
1.12 1.12
3.25 1.96 · , 3.25 1.96 ·
400 400
Y así el intervalo buscado es: 3.14 , 3.36
- De la duración de un proceso sabemos que la desviación típica poblacional
es 0.5 segundos. ¿Cuál es el número mínimo de medidas que hay que realizar
para que, con un nivel de confianza del 99 %, el error de estimación no
exceda de 0. 1 segundos?.
Al nivel de confianza del 99 % ( = 0.01), p Z z 1 , corresponde
2
2
un z 2.575 .
2
Obtenemos el tamaño n de la muestra a partir de la relación: z · d,
2 n
z ·
2
2 2.575 · 0.5
2
CONTRASTE DE HIPÓTESIS.
Definición.
TEST ESTADÍSTICO.
Un test estadístico es un procedimiento para, a partir de una muestra
aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar
una hipótesis previamente emitida sobre el valor de un parámetro desconocido
de esa población.
HIPÓTESIS ESTADÍSTICAS.
Puesto que cada una de estas hipótesis afirma lo contrario que la otra es
incompatible que ambas sean ciertas. Por tanto, si llegamos a la conclusión de que la
hipótesis nula no se cumple, podemos afirmar que se cumple la hipótesis alternativa y
viceversa.
H 0 : 0
H1 : 0
p x z · x z · 1
n n
2 2
p z · x z · 1
n n
2 2
z z
2 2
HIPÓTESIS:
H 0 : 0
H1 : 0
Región de aceptación:
0 z · , 0 z ·
n
2 n 2
x 0 z · o x 0 z ·
2 n 2 n
Observación.
Cuando la desviación típica poblacional no sea conocida, y la muestra sea
suficientemente grande podremos utilizar la desviación típica de la muestra o, en su
caso, la indique la hipótesis.
Ejemplo:
Se cree que el cociente intelectual medio de los estudiantes de una universidad
es 113, con una desviación típica de 7. Para contrastar la hipótesis, se extrae una
muestra de 180 estudiantes y se obtiene en estos estudiantes un cociente intelectual
medio de 115. ¿Podemos aceptar la hipótesis con un nivel de significación del 5 %?.
Hipótesis nula, H 0 : 113.
Hipótesis alternativa, H1 : 113 .
z
HIPÓTESIS:
H 0 : 0
H1 : 0
Región de aceptación:
, 0 z ·
n
Región de rechazo:
0 z · ,
n
Observación.
Es importante hacer notar que al quedar la región crítica en una sola cola,
determinamos z , con la condición pZ z 1 .
-z
HIPÓTESIS:
H 0 : 0
H1 : 0
Región de aceptación:
0 z · ,
n
Región de rechazo:
, 0 z ·
n
Ejemplo:
El peso de los pollos de una granja es una distribución normal de media 2.6 kg y
desviación típica 0.5. Se experimenta un nuevo tipo de alimentación con 50 crías.
Cuando se hacen adultos se les pesa y se obtiene una media de 2.78 kg. Vamos a
contrastar la hipótesis de que el peso medio de la población no aumenta con un nivel de
significación del 1 %.
Hipótesis nula: H 0 : 2.6
Hipótesis alternativa: H 1 : 2.6
Como el nivel de confianza es del 99 %, pZ z 0.99 , de donde se obtiene
0.5
que z 2.33. Y, por tanto, la región de aceptación es: , 2.6 2.33 · , o sea,
50
, 2.76 . Ahora comprobamos que el valor obtenido mediante la muestra queda en
la región crítica, fuera de la región de aceptación, y por esto, rechazamos la hipótesis
nula y aceptamos la alternativa con un nivel de significación del 1 %. Es decir,
aceptamos que la población aumentará de peso con la nueva alimentación utilizada en la
granja.
CONTRASTE BILATERAL.
HIPÓTESIS:
H 0 : p p0
H 1 : p p0
Región de aceptación:
p q p q
p z · 0 0 , p z · 0 0
0 n 0 n
2 2
p q p q
p' p z · 0 0 o p' p z · 0 0
0 n 0 n
2 2
Ejemplo:
Un dentista afirma que el 40 % de los niños de diez años presentan indicios de
caries dental. Tomada una muestra de 100 niños, se observó que 30 presentaban indicios
de caries. Utilizando la aproximación normal queremos comprobar, con un nivel de
significación del 5 %, si el resultado proporcionado por la muestra permite rechazar la
hipótesis del dentista.
Hipótesis nula: H 0 : p 0.4
Hipótesis alternativa: H 1 : p 0.4
Un nivel de significación del 5 % determina que z 1.96 , y tenemos la
2
siguiente región de aceptación:
p q p q
p z · 0 0 , p z · 0 0
0 n 0 n
2 2
0.4 1.96 · 0.4 · 0.6 , 0.4 1.96 · 0.4 · 0.6
100 100
0.304 , 0.496
Es decir, si la hipótesis nula fuese cierta, con un nivel de significación del 5 %,
la proporción de niños con indicios de caries en esa población estaría comprendida entre
el 30.4 % y el 49.6 %. Comprobamos que la proporción obtenida en la muestra queda en
la región crítica, y por esto, rechazamos la hipótesis nula y aceptamos la alternativa con
ese nivel de significación. Es decir, rechazamos la hipótesis del dentista, y aceptamos
que el porcentaje de niños con indicios de caries es distinto del 40 %.
HIPÓTESIS:
H 0 : p p0
H 1 : p p0
Región de aceptación:
p ·q
0 , p z · 0 0
0 n
Región crítica:
p q
p z · 0 0 , 1
0 n
Ejemplo:
Según la ley electoral de cierto país, para obtener representación parlamentaria,
un partido político ha de conseguir más del 5 % de los votos. Poco antes de celebrarse
las elecciones, una encuesta realizada sobre 1000 ciudadanos elegidos al azar revela que
sólo 65 de ellos votarán al partido V. ¿Puede estimarse, con un nivel de significación
del 1 %, que V no tendrá representación parlamentaria?. ¿Y con un nivel de
significación del 5 %?
Hipótesis nula: H 0 : p 0.05
Hipótesis alternativa: H1 : p 0.05
Un nivel de significación del 5 % determina que z 2.33 , ( pZ z 0.99 ),
y tenemos la siguiente región de aceptación:
p ·q
0 , p z · 0 0
0 n
0.05 · 0.95
0 , 0.05 2.33 ·
1000
0 , 0.066
Es decir, si la hipótesis nula fuese cierta, con un nivel de significación del 1 %,
la proporción de votantes de V sería inferior al 6.6 %. Comprobamos que la proporción
65
obtenida en la muestra 0.065 , es de un 6.5 % y queda en la región de
1000
aceptación, y por esto, aceptamos la hipótesis nula, y rechazamos la hipótesis
alternativa, con ese nivel de significación. Es decir, aceptamos que el partido tendrá
menos del 5 % de los votos y por tanto no tendrá representación parlamentaria. Si el test
lo hiciésemos con un nivel de significación del 5 %, la región de aceptación sería
0 , 0.061 y rechazaríamos la hipótesis nula. Y, por tanto, con ese nivel de
significación diríamos que si tendría representación parlamentaria el partido V.
HIPÓTESIS:
H 0 : p p0
H 1 : p p0
Región de aceptación:
p ·q
p z · 0 0 , 1
0 n
Región crítica:
p q
0 , p z · 0 0
0 n
Ejemplo:
En las últimas votaciones, hace un año, el 53 % de los votantes de un pueblo
estaban a favor del alcalde. Se acaba de realizar una encuesta a 360 personas elegidas al
azar y 176 de ellas estaban a favor del alcalde. ¿Se puede afirmar con un nivel de
confianza del 90 % que el alcalde no pierde popularidad?
Test de hipótesis para la proporción (unilateral izquierdo).
Hipótesis nula: H 0 : p 0.53
Hipótesis alternativa: H1 : p 0.53
Es decir, la hipótesis nula mantiene que la proporción de votos favorable al
alcalde es la misma de las pasadas elecciones o ha aumentado.
Un nivel de confianza del 90 %, nos da un z 1.28 ( z 1.2817 ,
interpolando).
Región de aceptación:
p z · p0 · q0 , 1
0 n
0.53 1.28 · 0.53 · 0.47 , 1
360
0.496 , 1
Consideramos ahora los resultados de la muestra: un 48.9 % estuvieron a favor
176
del alcalde 0.489 , y como este resultado cae fuera de la región de aceptación
360
rechazamos la hipótesis nula, y aceptamos que el alcalde ha perdido popularidad. No
podemos considerar que el alcaldde no la haya perdido.
Ejemplo:
Las estaturas de las alumnas de COU eran, en 1990, de media 167 cm y
desviación típica 7 cm. Emitimos la hipótesis de que las actuales alumnas de 2º de
Bachillerato tienen la misma media. Vamos a contrastar la hipótesis mediante una
muestra de tamaño 60 y con un nivel de significación del 0.1.
Hipótesis nula: H 0 : 167
Hipótesis alternativa: H1 : 167
La región de aceptación sería: 165.51 , 168.49
Si al extraer la muestra obtenemos una media de 168.72 cm, rechazamos la
hipótesis nula. Pero podemos estar equivocados. Es decir, podemos cometer un error de
tipo I.
Si al extraer la muestra obtenemos una media de 168.12 cm, aceptamos la
hipótesis nula. Si estuviéramos equivocados se cometería un error de tipo II.
n pequeño
n grande