You are on page 1of 6

R PRACTICA

IV

Intervalos de confianza y contrastes de hip


otesis

n IV.1
Seccio

Intervalo de confianza de la media.


44.

Cargar (abrir) el conjunto de Datos Pulso.rda. Se pide:


a) Calcular el intervalo de confianza para el peso medio de todos los individuos con = 0.05.
b)

Calcular el intervalo de confianza para el peso medio de las mujeres con = 0.05.

c) Estudios recientes afirman que la altura media de las mujeres de esta poblacion es = 167
cm. A la vista de estos datos, podemos aceptar dicha hipotesis?
p-valor
d)

Calcular el intervalo de confianza para el Pulso1 medio de las mujeres que no fuman.
intervalo

e)

Calcular el intervalo de confianza para la media del incremento del pulso (Pulso2-Pulso1) para
los individuos que corrieron.
intervalo

45.

Se espera que la resistencia en kg/cm2 de cierto material suministrado por un proveedor se distribuya
normalmente, con media 220 y desviacion tpica 7.75. Se toma una muestra de 9 elementos y se
obtiene: 203, 229, 215, 220, 223, 233, 208, 228, 209. Se pide:
a) Contrastar la hipotesis = 220 y cualquiera.
b)

Contrastar la hipotesis = 7.75 y cualquiera.


20

p-valor
p-valor

IV.2. INTERVALOS DE CONFIANZAS Y CONTRASTE PARA PROPORCIONES.

46.

El pH del suelo es una variable importante cuando se dise


nan estructuras que estaran en contacto
con el terreno. El propietario de un solar posible lugar de construccion afirma que el pH del suelo es
6.5. Se han tomado 9 muestras del suelo del terreno, obteniendose los resultados que se recogen en
el archivo de datos pH.txt. Suponiendo que la variable pH sigue una distribucion normal, responde
las siguientes cuestiones: Se pide:
a) Hallar un intervalo de confianza para el pH medio con un nivel de significacion del 10 %.

b)

Se acepta como verdadera afirmacion del propietario del solar con un riesgo de = 0.05 ?

n IV.2
Seccio

Intervalos de confianzas y contraste para proporciones.


IV.2.1. Significado del intervalo de confianza para p
Es p = 0.5 la probabilidad de obtener cara al lanzar una moneda?.
Lanzamos la moneda 20 veces, y estimamos p con la proporcion pb =pest de caras obtenidas
(Simulando con R)
n=20; p = .5;pest = rbinom(1,n,p)/n
Realizamos el lanzamiento de las 20 monedas m = 50 veces
n=20; p = .5;m=50;pest = rbinom(m,n,p)/n
Fijamos el nivel de confianza 1 = 0.90 y calculamos los intervalos
r
pb(1 pb)
pb z1/2
n

alpha = 0.10;zstar = qnorm(1-alpha/2);SE = sqrt(pest*(1-pest)/n)

Representamos los m = 50 intervalos


matplot(rbind(pest - zstar*SE, pest + zstar*SE),rbind(1:m,1:m),type=l,lty=1)
Marcamos la lnea para p = 0.5.
abline(v=p)
47.

Cargar (abrir) el conjunto de Datos Pulso.rda. Se pide:


a) Calcular el estimador puntual de la proporcion p de individuos que fuman.
b)

Calcular el intervalo de confianza para la proporcion pF de individuos que fuman con = 0.05.

c)

Calcular el intervalo de confianza para la proporcion pF |M de mujeres fumadoras con = 0.05.

Universidad de Cantabria. Alberto Luce


no y Fco. Javier Glez Ortiz

21


CAPITULO IV. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPOTESIS

Figura IV.1: 50 intervalos de confianza dellanzamiento de 20 monedas


d)

Calcular el intervalo de confianza para la proporcion pp2>100|C de individuos con el Pulso2


superando las 100 pulsaciones de entre los que corrieron, con = 0.05.
intervalo

e)

Calcular el intervalo de confianza para la proporcion p de individuos con altura superior a 180
y peso superior a 85 kg con = 0.05.

Universidad de Cantabria. Alberto Luce


no y Fco. Javier Glez Ortiz

22

IV.3. INTERVALO DE CONFIANZA Y CONTRASTES PARA LA


DIFERENCIA DE DOS MEDIAS O DOS PROPORCIONES.
intervalo
48.

Calcular un intervalo de confianza para la proporcion de piezas conformes p producidas en una


fabrica, usando un nivel de confianza de 0,95. Supongamos que disponemos de una muestra en la
que se han observado 79 piezas conformes de un total de 80 piezas analizadas. En primer lugar,
vemos que x = 79, n = 80 y = 0.05.
(Comprobar que la solucion aportada por R, coincide con la formula (7.7) p. 316 del libro de texto
de A.Luce
no- Fco J.Glez Ortiz)

49.

Cierta medicina, en tabletas, ha sido comprobada eficaz en el alivio de una alergia en mas del 60 % de
los pacientes. El fabricante ha desarrollado una version soluble del producto y desear comprobar si la
medicina en esta forma es igual de eficaz. Se toma una muestra de 40 personas que tienen la alergia,
el nuevo producto alivio a 32 de ellos. Hay suficiente evidencia para sugerir que la introduccion
de la version soluble ha alterado la eficacia de la medicina? Realiza el contraste relevante usando
= 0.01 ? Encuentra el nivel critico (p-valor).
n IV.3
Seccio

Intervalo de confianza y contrastes para la


diferencia de dos medias o dos proporciones.
50.

Una empresa tiene en su poder dos dispositivos para mejorar la eficiencia de los sistemas de calefaccion en los hogares; uno de ellos funciona con energa electrica (sistema 1) y el otro con energa
termica (sistema 2). Se quiere estudiar si ambos dispositivos son igualmente efectivos, para lo cual
se compara el consumo de energa en 90 hogares que tienen uno u otro sistema; los datos del estudio
se recogen en el archivo energa.rda. Suponiendo que se ha llevado a cabo un test de igualdad de
varianzas en el cual no se han encontrado evidencias que hagan pensar que dichas varianzas son
distintas y para un nivel de confianza del 95 %, responde a las siguientes cuestiones:
a) Intervalo de confianza para la diferencia de medias.

51.

b)

Valor del estadstico t de contraste.

c)

Valor del p-valor.

d)

Contrastar la igualdad de la variabilidad (varianzas) de ambos sistemas.

Supongamos que en 8 fabricas similares se ha medido el n


umero de horastrabajador que se ha
perdido durante un a
no. Posteriormente se ha implantado un programa de seguridad en todas estas
fabricas y se ha vuelto a medir en cada una de ellas el n
umero de horastrabajador perdidas durante
otro a
no. A partir de estos datos puede obtenerse un intervalo de confianza al nivel de confianza
0,95 para la diferencia entre el n
umero medio de horas perdidas antes y despues de implantar el
programa de seguridad.

Universidad de Cantabria. Alberto Luce


no y Fco. Javier Glez Ortiz

23


CAPITULO IV. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPOTESIS

fabrica
1
2
3
4
5
6
7
8

N
umero de
horastrabajador
antes
despues
88.80
76.29
67.71
51.74
80.67
60.65
84.79
72.08
81.58
66.60
72.21
53.71
89.50
75.61
82.18
67.13

intervalo
52.

p-valor

Cargar (abrir) el conjunto de Datos Pulso.rda. Se pide:


a) Determinar si hay diferencia significativa entre la proporcion de hombres y mujeres que fuman
con un nivel de significacion = 0.05.
b)

p-valor

Calcular un intervalo de confianza para la diferencia de medias del pulso1 y del pulso2 para la
poblacion de los que corrieron.

c) Calcular un intervalo de confianza para la diferencia de medias del pulso1 entre hombres que
fuman y no fuman.
d)

Contrastar si hay diferencia significativa en el incremento del pulso (increpulso) para hombres
y mujeres que se sometieron a la prueba de correr.
p-valor

53.

La cantidad de defectos de un lote de n1 = 100 unidades del proveedor A es 8, mientras que en un


lote de n2 = 150 unidades de B la cantidad de defectos es 15. Estudiar si hay evidencia suficiente
de diferencias entre los proveedores al nivel 0.95.
intervalo

Universidad de Cantabria. Alberto Luce


no y Fco. Javier Glez Ortiz

p-valor

24

IV.4. CONTRASTE DE VARIANZAS.

n IV.4
Seccio

Contraste de varianzas.
54.

Se han hecho cuatro determinaciones qumicas en dos laboratorios A y B con los resultados A :
26, 24, 28, 27; B : 20, 34, 23, 22. Se pide:
a) Comparar las varianzas de las dos muestras con nivel de significacion 5 %, y determinar el
p-valor.

55.

El fichero parqueeolico.dat, contiene datos de la velocidad del viento, registrados durante 730 horas de
forma simultanea, en dos localizaciones alternativas (Parque1 y Parque2). Se tratara de establecer
la localizacion mas aconsejable para la instalacion de un parque de produccion de energa eolica.
a) Importar el fichero de datos a R teniendo en cuenta que el caracter decimal del fichero es una
coma.
b)

La estructura de losdatos es de dos columnas. Resulta mas manejable si es transformada en


dos variables, una continua que contenga las mediciones de viento y otra factor que indique la
localizacion. Esto se realiza desde el men
u
Datos -> Conjunto de datos activo-> Apilar variables del conjunto de datos activo
... En la ventana de dialogo se pide el nombre de la nueva base de datos que llamaremos eolico2,
el nombre de la variable apilada, velocidad, y el nombre de la nueva variable factor, parque,
cuyas clases se han denominado Parque1 y Parque2.

c)

Compara graficamente la velocidad de los 2 parques.

d)

Contrastar la igualdad de la variabilidad (varianzas) de ambos parques.

e)

Contrastar la igualdad de la velocidad media del viento en ambos parques.

Soluciones
44.
45.
46.
47.
48.
50.
52.
53.

a) 63.67-68.13 b) 54.12-58.29 c) p-valor = 0.4273 d ) 70.36-78.83 e) 13.74-24.08


a) p-valor =0.5265 b) p-valor =0.06416552
a) 6.114-6.663 b) p-valor = 0.4732
a) 0.304 b) 0.2197-0.405 c) 0.1206-0.3902 d ) 0.186-0.480 e) 0.017-0.1065
(0.9325373 0.9977900
a) -1.450; 0.9796 b) t = -0.3848 c) p-valor = 0.7013 d ) p-valor = 0.5578
a) p-valor = 0.3152 b) 11.42-26.407 c) -2.645663 ; 8.770663 d ) p-valor = 0.0003391
confidence interval: (0.0916; 0.0516)
p-valor = 0.592

Universidad de Cantabria. Alberto Luce


no y Fco. Javier Glez Ortiz

25

You might also like