You are on page 1of 18

Pruebas de dos medias, dos proporciones y

muestras emparejadas

REMIX desde Collaborative Statistics http://cnx.org/content/m18944/latest/. Recurso en
electrnico. http://cnx.org/content/col10522/1.40/pdf

En muchas ocasiones lo que se comparan son dos grupos. Por ejemplo los:
Investigadores estudian los efectos de los frmacos tpicamente en dos grupos, uno de
ellos el que recibe el medicamento y el otro un placebo para comparar.
Otros investigadores pueden estar comparando programas de dieta o de ejercicios en dos
grupos
Los candidatos pueden estar comparando las diferencias entre dos distritos.
Se trata del comportamiento de la misma variable en dos poblaciones con propsitos de
comparacin.
Utilizaremos los procedimientos anteriores para la prueba de hiptesis de las medias y
proporciones de una poblacin, expandiendo las posibilidades a las comparaciones de medias y de
proporciones.
Las comparaciones se clasifican en:
1. Grupos independientes (dos muestras tomadas de manera separada, dos poblaciones)
a. Prueba de dos medias de poblacin
i. Desviacin estndar de la poblacin desconocida
ii. Desviacin estndar de la poblacin conocida
b. Prueba de dos proporciones de poblacin
2. Grupos dependientes. (en la misma poblacin)
a. Prueba de una media de poblacin

1. a. i Comparacin de dos medias de poblacin con
desviaciones estndar de la poblacin desconocidas.

2. Las dos muestras son aleatorias de dos poblaciones distintas
3. Las dos poblaciones se distribuyen normalmente con media y desviacin estndar de la
poblacin desconocida o al menos el tamao de la muestra debe ser mayor de 30.

La diferencia entre dos muestras depende de la media de ambas muestras y de sus desviaciones
estndar. Para poder calcular la variacin se utiliza la diferencia de sus medias muestrales y para
estandarizar la diferencia se divide por el error estndar de las dos muestras.

La diferencia de Medias muestrales

2 1
X X

La desviacin estndar de la diferencia de medias es igual a:


2
2
2
1
2
1
) ( ) (
n
S
n
S
+

2
2
2
1
2
1
2 1 2 1
) ( ) (
) ( ) (
n
S
n
S
X X
t
s difmuestra
+

=



Grados de libertad.

( ) ( )
2
2
2
2
2
2
1
2
1
1
2
2
2
2
1
2
1
1
1
1
1
) ( ) (
(

+
(

+
=
n
S
n n
S
n
n
S
n
S
gl



Grupos Independientes.
Desviacin estndar desconocidas de la poblacin.


1. a. ii Comparacin de dos medias de poblacin con
desviaciones estndar de la poblacin conocidas.

Las dos muestras son aleatorias de dos poblaciones distintas
Las dos poblaciones se distribuyen normalmente con media y desviacin estndar de la
poblacin conocida o los tamaos de la muestra debe ser mayor de 30.

La diferencia de Medias muestrales

2 1
X X

La desviacin estndar de la diferencia de medias es igual a:


2
2
2
1
2
1
) ( ) (
n n

+

2
2
2
1
2
1
2 1 2 1
) ( ) (
) ( ) (
n n
X X
Z
s difmuestra


+

=




Grupos Independientes.
Desviacin estndar de las poblaciones conocidas

1. b. i Comparacin de dos proporciones

Las dos muestras son aleatorias de dos poblaciones distintas

La diferencia de Medias muestrales

2 1
p p




La desviacin estndar de la diferencia de proporciones es igual a:






El valor estandarizado de la diferencia de proporciones






Grupos Independientes.
2 1
2 1
n n
X X
c
+
+
=
|
|

\
|
+
2 1
1 1
) 1 (
n n
c c

|
|

\
|
+

=
2 1
2 1 2 1
1 1
) 1 (
) ( ) (
n n
p p
Z
c c
iones difproporc


2.a. i Comparacin de dos medias dependientes (misma
poblacin) Emparejadas

Las dos muestras son aleatorias de la misma poblacin



Se utiliza muestras aleatorias y los valores se extraen del mismo par de personas u objetos, las
diferencias se calculan a partir de las muestras emparejadas.


La diferencia de Medias muestrales

diferencia X


diferencia


La desviacin estndar de la diferencia de proporciones es igual a:






El valor estandarizado de la media muestral de la diferencia







Grupos dependientes.

n
S
S
diferencia
X diferencia
=
n
S
X
t
diferencia
diferencia
diferencia
diferencia

=
Ejemplo de 1.a.i

El promedio de tiempo que juegan nios y nias en diferentes deportes por da es como se
muestra en la tabla.


Tamao de muestra Promedio en Horas Desviacin estndar
Nias 9 2 0.86
Nios 16 3.2 1

Hay una diferencia entre los tiempos promedio que juegan los nios y las nias. Haga la prueba de
hiptesis con un 5% de nivel de significancia.

Ejemplo de 1.a.ii


Se estudia el tiempo promedio que duran los pisos de dos ceras que se estn comparando. Se
muestrean 20 pisos con cada una de las ceras. Las dos poblaciones tienen una distribucin
normal. Los resultados se encuentran los tenemos en la siguiente tabla.

El promedio de tiempo que juegan nios y nias en diferentes deportes por da es como se
muestra en la tabla.


Tamao de muestra Promedio en meses
que dura la cera
Desviacin estndar
de la poblacin
Cera 1 20 3 0.33
Cera 2 20 2.9 0.36

Indican los datos que la cera 1 es ms efectiva que la cera 2. Haga la prueba de hiptesis con un
5% de nivel de significancia.

Ejemplo de 1.b.i

Se prueban dos tipos de medicamentos para determinar si hay diferencia en las reacciones de los
pacientes adultos que lo toman. 20 pacientes de los 200 adultos seleccionados aleatoriamente
resultaron con reacciones despus de haberles proporcionado el medicamento A. 12 de otros 200
adultos seleccionados aleatoriamente resultaron con reacciones despus de haber tomado el
medicamento B. Hay diferencia entre los dos medicamentos con una prueba del 1% de
significancia.

Tamao de muestra Nmero de pacientes
con reaccin despus
de 30 minutos
Medicamento A 200 20
Medicamento B 200 12





Ejemplo de 2.a.i

Se hace un estudio para investigar la efectividad del hipnotismo en la reduccin del dolor. Los
siguientes resultados de su sensibilidad al dolor entre sujetos seleccionados aleatoriamente se
pueden ver en la siguiente tabla. Cada uno de los valores de antes est emparejado con el
despus del mismo individuo. Las diferencias siguen una distribucin normal


Individuo A B C D E F G H
Antes 6.6 6.5 9.0 10.3 11.3 8.1 6.3 11.6
Despus 6.8 2.4 7.4 8.5 8.1 6.1 3.4 2.0

Son en promedio menor las sensibilidades al dolor menores despus del tratamiento de hipnosis.
Realiza la prueba al nivel del 5% de significancia



1.a.i Ejercicio y procedimiento (hoja de trabajo). Diferencia de
medias con desviacin de poblacin desconocida.

1. Establecer dos hiptesis contradictorias

Qu es lo que se quiere probar?
________________________________________________

H
0
: _____________________________________ Ho:
2 1
____ _____
Ha: _____________________________________ Ha:
2 1
____ _____


2. Recopilar las datos de las muestras (en algunos problemas ya son dados los datos o
los valores para los estadstico.

=
=
=
=
=
=
2
1
2
1
2
1
S
S
X
X
n
n


3. Calcular

Nueva variable, la diferencia de las medias

=
nios nias
X X



Desviacin estndar de las dos muestras

= +
2
2
2
1
2
1
) ( ) (
n
S
n
S


Grados de libertad
( ) ( )
2
2
2
2
2
2
1
2
1
1
2
2
2
2
1
2
1
1
1
1
1
) ( ) (
(

+
(

+
=
n
S
n n
S
n
n
S
n
S
gl
4. Determinar la distribucin para llevar a cabo la prueba de hiptesis
T de Student con Grados de libertad:____

5. Analizar los datos de la muestra para llevar a cabo los clculos que permitirn
rechazar o no la hiptesis nula.
Con el nivel de significancia encontrar los valores crticos de Z o de t segn
corresponda (TABLAS)



05 . =


a. Con el nivel de significancia calcularlos valores de Z o de t segn
corresponda de la muestra

2
2
2
1
2
1
2 1 2 1
) ( ) (
) ( ) (
n
S
n
S
X X
t
s difmuestra
+

=



6. Tomar una decisin y escribirla en forma significativa y en lenguaje natural,
ubicando el valor de la muestra en la zona de aceptacin o de rechazo.
7. Calcular el valor de la probabilidad para el valor Z o t de la muestra.

http://www.stat.tamu.edu/~west/applets/tdemo.html


pvalue
pvalue
<
>


Si >p-value rechazar H
0
.

Por los resultados de la muestra hay suficiente evidencia
para concluir que es incorrecta la hiptesis nula y que la alternativa podra ser la
correcta.
Si <p-value aceptar H
0
.

Por los resultados de la muestra hay suficiente evidencia
para concluir que es correcta la hiptesis nula y que la alternativa podra sera la
incorrecta.

1.a. ii Ejercicio y procedimiento (hoja de trabajo). Diferencia
de medias con desviacin de poblacin conocida

1. Establecer dos hiptesis contradictorias

Qu es lo que se quiere probar?
________________________________________________

H
0
: _____________________________________ Ho:
2 1
____ _____
Ha: _____________________________________ Ha:
2 1
____ _____

2. Recopilar las datos de las muestras (en algunos problemas ya son dados los datos o
los valores para los estadstico.

=
=
=
=
=
=
2
1
2
1
2
1

X
X
n
n


3. Calcular

Nueva variable, la diferencia de las medias

=
nios nias
X X



Desviacin estndar de las dos muestras

= +
2
2
2
1
2
1
) ( ) (
n n





4. Determinar la distribucin para llevar a cabo la prueba de hiptesis
Normal


5. Analizar los datos de la muestra para llevar a cabo los clculos que permitirn
rechazar o no la hiptesis nula.
Con el nivel de significancia encontrar los valores crticos de Z





05 . =


b. Con el nivel de significancia calcularlos valores de Z o de t segn
corresponda de la muestra


2
2
2
1
2
1
2 1 2 1
) ( ) (
) ( ) (
n n
X X
Z
s difmuestra


+

=



6. Tomar una decisin y escribirla en forma significativa y en lenguaje natural,
ubicando el valor de la muestra en la zona de aceptacin o de rechazo.
7. Calcular el valor de la probabilidad para el valor Z



pvalue
pvalue
<
>


Si >p-value rechazar H
0
.

Por los resultados de la muestra hay suficiente evidencia
para concluir que es incorrecta la hiptesis nula y que la alternativa podra ser la
correcta.
Si <p-value aceptar H
0
.

Por los resultados de la muestra hay suficiente evidencia
para concluir que es correcta la hiptesis nula y que la alternativa podra sera la
incorrecta.

1.b. i Ejercicio y procedimiento (hoja de trabajo). Diferencia de
proporciones

1. Establecer dos hiptesis contradictorias

Qu es lo que se quiere probar?
________________________________________________

H
0
: _____________________________________ Ho:
2 1
____ _____
Ha: _____________________________________ Ha:
2 1
____ _____


2. Recopilar las datos de las muestras (en algunos problemas ya son dados los datos o
los valores para los estadstico.

=
=
=
=
=
=
2
1
2
1
2
1
p
p
X
X
n
n


3. Calcular

Nueva variable, la proporcin en conjunto (de las dos muestras al mismo tiempo)

2 1
2 1
n n
X X
c
+
+
=


Desviacin estndar de la proporcin

|
|

\
|
+
2 1
1 1
) 1 (
n n
c c




4. Determinar la distribucin para llevar a cabo la prueba de hiptesis
Normal


5. Analizar los datos de la muestra para llevar a cabo los clculos que permitirn
rechazar o no la hiptesis nula.
Con el nivel de significancia encontrar los valores crticos de Z



05 . =



c. Con el nivel de significancia calcularlos valores de Z o de t segn
corresponda de la muestra



|
|

\
|
+

=
2 1
2 1 2 1
1 1
) 1 (
) ( ) (
n n
p p
Z
c c
iones difproporc






6. Tomar una decisin y escribirla en forma significativa y en lenguaje natural,
ubicando el valor de la muestra en la zona de aceptacin o de rechazo.
7. Calcular el valor de la probabilidad para el valor Z o t de la muestra.



pvalue
pvalue
<
>


Si >p-value rechazar H
0
.

Por los resultados de la muestra hay suficiente evidencia
para concluir que es incorrecta la hiptesis nula y que la alternativa podra ser la
correcta.
Si <p-value aceptar H
0
.

Por los resultados de la muestra hay suficiente evidencia
para concluir que es correcta la hiptesis nula y que la alternativa podra sera la
incorrecta.

2.a.i Ejercicio y procedimiento (hoja de trabajo). Diferencia de
medias en muestras emparejadas.

1. Establecer dos hiptesis contradictorias

Qu es lo que se quiere probar?
________________________________________________

H
0
: _____________________________________ Ho:
diferencia
____ _____
Ha: _____________________________________ Ha:
diferencia
____ _____


2. Recopilar las datos de las muestras (en algunos problemas ya son dados los datos o
los valores para los estadstico.

diferencia
diferencia
diferencia
S
X
n

=
=


3. Calcular
La desviacin estndar de la diferencia de proporciones es igual a:







Grados de libertad
1. Determinar la distribucin para llevar a cabo la prueba de hiptesis
T de Student con Grados de libertad:____

2. Analizar los datos de la muestra para llevar a cabo los clculos que permitirn
rechazar o no la hiptesis nula.
Con el nivel de significancia encontrar los valores crticos de t segn corresponda
(TABLAS)

1 =
= =
n gl
n
S
S
diferencia
X diferencia


05 . =


d. Con el nivel de significancia calcularlos valores de Z o de t segn
corresponda de la muestra





3. Tomar una decisin y escribirla en forma significativa y en lenguaje natural,
ubicando el valor de la muestra en la zona de aceptacin o de rechazo.
4. Calcular el valor de la probabilidad para el valor Z o t de la muestra.

http://www.stat.tamu.edu/~west/applets/tdemo.html


pvalue
pvalue
<
>


Si >p-value rechazar H
0
.

Por los resultados de la muestra hay suficiente evidencia
para concluir que es incorrecta la hiptesis nula y que la alternativa podra ser la
correcta.
Si <p-value aceptar H
0
.

Por los resultados de la muestra hay suficiente evidencia
para concluir que es correcta la hiptesis nula y que la alternativa podra sera la
incorrecta.

n
S
X
t
diferencia
diferencia
diferencia
diferencia

=
Identificacin del tipo de hiptesis.

A. De una media con desviacin o varianza conocida de la poblacin y
tamao mayor de 30 (1Z)
B. De una media con desviacin o varianza desconocida de la poblacin,
se conoce la de la muestra y el tamao de la muestra es mayor de 30
(1Z)
C. De una media con desviacin o varianza conocida y tamao de muestra
menor de 30 (1t)
D. De una proporcin (1p)
E. Entre las medias de grupos independientes con desviacin o varianza
conocida de la poblacin (2t)
F. Entre medias de grupos independientes con desviacin o varianza
desconocida de la poblacin, (se conoce la de las muestras) (2t)
G. Entre dos proporciones (2p)
H. Entre medias de grupos dependientes (es el mismo individuo o
elemento) (t-t)


Caso Prueba:
Se prueba una dieta de caloras con 49 personas y una
dieta lquida con 36 personas diferentes. La desviacin
estndar de las poblaciones son 2 y 3 libras
respectivamente. El inters consiste en probar si la dieta
lquida consigue una prdida promedio mayor de peso
que la dieta de caloras

Se prueba una nueva barra de chocolate en consumidores
adulto y nios, el inters se encuentra en encontrar si la
proporcin de los nios a los que les gusta es mayor que la
proporcin de los adultos a los que les gusta

El nmero promedio de cursos de ingls que se toman en
un perodo de dos aos por hombres y mujeres de un
colegio se cree que es el mismo. Se lleva a cabo un
experimento y se recuperan los datos par 9 hombres y 1 6
mujeres

Una liga de ftbol reporta que el nmero promedio de
touchdowns por juego es de 5. Se hace un estudio para

determinar si el promedio de touchdowns por juego ha
disminuido
Se ha hecho un estudio para determinar si a los
estudiantes en la universidad del estado de California les
lleva ms tiempo graduarse que a los que estudian en
universidades privadas. Se encuestan a 100 estudiantes de
los dos tipos de universidad. Desde aos atrs se sabe que
la desviacin estndar es de 1.588 11 aos y de 1 ao
respectivamente

De acuerdo con el centro de crisis YWCA, el 75% de las
personas sabe de antemano reconocer sus ataques. Se
realiza un estudio para verificar este dato.

De acuerdo a un estudio reciente en la industria las
incapacidades por maternidad son de 6 semanas.

Un estudio reciente muestra que se ha incrementado el
uso de drogas y de alcohol entre los estudiantes locales de
bachillerato comparados con el porcentaje nacional.
Suponga que se entrevistan 100 alumnos locales y 100
alumnos nacionales para conocer si la proporcin del uso
de drogas y alcohol es mayor local que nacionalmente

Se aplica el TOEFEL a 12 estudiantes, antes y despus de
un curso de preparacin. El inters es saber si el
promedio de calificacin se incrementa.

Investigadores de la Universidad de Michigan reportan en
la revista Nacional del Instituto de Cancerologa, que dejar
el cigarro es especialmente benfico para aquellas
personas mayores de 49 aos. En la Sociedad Americana
del cncer estudian que el riesgo de morir por cncer es
prcticamente igual para aqullos que nunca han fumado.



Ejercicios varios
1. Un profesor de matemticas est interesado en saber si una clase sobre tcnicas de
estudio incrementa la puntuacin de un ejercicio de lectura.
La puntuacin antes y despus de las tcnicas de estudio se muestra en la siguiente tabla.
Puntuacin Alumno1 Alumno2 Alumno3 Alumno4
Antes de la clase 205 241 338 368
Despus de la
clase
295 252 330 360

Realiza una prueba de hiptesis para conocer si aument la puntuacin gracias a la clase que
tomaron con un nivel de significancia del 5%

2. Se prueba una dieta de caloras con 49 personas y una dieta lquida con 36 personas
diferentes. El inters consiste en probar si la dieta lquida consigue una prdida promedio
mayor de peso que la dieta de caloras.
La dieta de las caloras tiene un promedio de prdida de 42 libras con una desviacin estndar de
12 libras. La dieta lquida pierde en promedio 45 libras con una desviacin estndar de 14 libras.


3. El nmero promedio de cursos de ingls que se toman en un perodo de dos aos por
hombres y mujeres de un colegio se cree que es el mismo. Se lleva a cabo un experimento
y se recuperan los datos par 9 hombres y 16 mujeres. Los hombres toman en promedio
tres cursos de ingls con una desviacin estndar de 0.8. Las mujeres toman en promedio
4 cursos en ingls con una desviacin estndar de 1.0. Son las medias estadsticamente
iguales.


4. Se ha hecho un estudio para determinar si a los estudiantes en la universidad del estado
de California les lleva ms tiempo graduarse que a los que estudian en universidades
privadas. Se encuestan a 100 estudiantes de los dos tipos de universidad. Desde aos
atrs se sabe que la desviacin estndar es de 1.588 11 aos y de 1 ao
respectivamente. Se reportaron los siguientes datos. A los estudiantes de la universidad
del estado de California les toma en promedio terminar en 4.5 aos con una desviacin
estndar de 0.8. A los estudiantes de las universidades privadas les toma en promedio
terminar en 4.1 aos con una desviacin estndar de 0.3


5. Se aplica el TOEFEL a 12 estudiantes, antes y despus de un curso de preparacin. El
inters es saber si el promedio de calificacin se incrementa una vez que se toma el
curso.
Los datos que se obtienen son los siguientes.


Puntos antes del curso Puntos despus del
1200 1300
960 920
1010 1100
840 880
1100 1070
1250 1320
860 860
1330 1370
790 770
990 1040
1110 1200
740 850


6. Un estudio reciente muestra que se ha incrementado el uso de drogas y de alcohol entre
los estudiantes locales de bachillerato comparados con el porcentaje nacional. Suponga
que se entrevistan 100 alumnos locales y 100 alumnos nacionales para conocer si la
proporcin del uso de drogas y alcohol es mayor local que nacionalmente. En los datos
locales 65 estudiantes reportan haber usado drogas o alcohol el pasado mes, mientras que
60 estudiantes nacionales las usaron en ese mismo mes.

7. Una de las preguntas en un estudio de satisfaccin marital en parejas en las que trabajan
ambos deca Estoy satisfecha con la forma en las que dividimos las responsabilidades del
cuidado de los nios. Las calificaciones eran desde 1 (totalmente de acuerdo) hasta 5
(totalmente en desacuerdo). A continuacin se presentan las respuestas de hombres y
mujeres. Haz una prueba de hiptesis para ver si la diferencia entre lo que opinan los
hombres y las mujeres es negativa. Lo que significara que los hombres son ms felices
que las mujeres.

Mujeres 2 2 3 3 4 2 1 1 2 4
Hombres 2 2 1 3 2 1 1 1 2 4

You might also like