You are on page 1of 68

Universidad Polit

ecnica de Cartagena
Dpto. Matem
atica Aplicada y Estadstica
M
etodos estadsticos de la ingeniera, Estadstica
Problemas de examenes:

Metodos estadsticos de la ingeniera


Ingeniera Tecnica Industrial,
todas especialidades
Estadstica
Ingeniera Tecnica Telecomunicaciones,
Telematica
Problemas de examenes

Estadstica descriptiva

Universidad Polit
ecnica de Cartagena
Dpto. Matem
atica Aplicada y Estadstica
M
etodos estadsticos de la ingeniera, Estadstica
Problemas de examenes: Estadstica descriptiva

Problema 1
I.1 Un ingeniero estudia la relacion entre dos variables X e Y . Dispone de los valores de Y
para 15 valores de X, y sabe que la media y la varianza de los valores de X valen x = 20,
s2x = 4. Decide ajustar una recta de regresion y encuentra la ecuacion siguiente:
y = 32 x
1. Cual es el signo de la correlacion entre X e Y ? Justifica tu respuesta.
2. Calcular la covarianza de X e Y.
3. Cuanto vale y?
I.2 La siguiente tabla muestra la puntuacion de los 20 equipos de segunda division B (despues
de 25 partidos jugados). Construir un diagrama de caja y bigotes para las puntuaciones
de los equipos y comentar sus aspectos mas relevantes:
16 23 24 24 27 28 28 29 30 31
31 34 39 40 42 43 45 45 48 49

Problema 2
I.1 El Instituto Nacional de Estadstica proporciona los datos siguientes sobre el crecimiento
vegetativo, es decir la diferencia entre el n
umero de nacimientos y defunciones, en las
comunidades autonomas:
Comunidad
crecimiento
Galicia
-9865
Castilla y Leon
-8825
Asturias
-5915
Aragon
-3853
Pas Vasco
-2040
Cantabria
-1332
Cast.-La Mancha
-837
Extremadura
-553
La Rioja
-384
Navarra
136

Comunidad
Ceuta
Valencia
Melilla
Catalu
na
Baleares
Murcia
Canarias
Madrid
Andaluca

1. Calcular la mediana y los cuartiles de estos datos.

crecimiento
455
543
599
779
1230
3730
5668
11152
15489

Estadstica descriptiva
2. Realizar el diagrama de cajas y bigotes para estos datos. Para que sirve este
diagrama? Hay datos atpicos? Que representan estos u
ltimos?

I.2 Se ha comprobado que las aleaciones amorfas tienen una excelente resistencia a la corrosion.
En un estudio se recocieron cinco especmenes de la aleacion a 7000 cada uno durante un
intervalo de tiempo distinto (x, en minutos). Despuees se midio el potencial de pasivacion
(y, en mV)- una medida de resistividad de la aleacion cristalizada- para cada especimen.
Los datos experimentales son los siguientes:
x 10
20
45
90
120
y -408 -400 -392 -379 -385
1. Suponiendo que la mejor forma de describir la relacion entre las variables es lineal,
ajustar una recta de regresion a los datos. Calcular r2 e interpretar el resultado.
2. Cual es el potencial de pasivacion cuando el tiempo de recocido es de 30 minutos?

Problema 3
1. Con el fin de determinar la profundidad de un lago subterraneo, se midio el contenido
de oxgeno, en miligramos/litro, a distintas profundidades, en metros, obteniendose los
siguientes resultados:
profundidad ( m ) 15 20 30 40 50 60 70
oxgeno ( mg/l )
6.5 5.6 5.4 6.0 4.6 1.4 0.1
Se pide:
(a) Ajustar una recta a los datos obtenidos por el metodo de los mnimos cuadrados.
(b) Estudiar la bondad del ajuste.
(c) A que profundidad es previsible que nos encontremos si el contenido en oxgeno
medido es de 3.2 mg/l?.

Problema 4
I.1 En la direccion http://dataservice.eea.eu.int/dataservice/, se pueden encontrar los datos
de emision de CO2 por fuentes fosiles para los distintos paises europeos entre los a
nos
1985 y 1997. Se indican a continuacion los datos de emision total de este contaminante
para Espa
na entre los a
nos 1990 y 1997.
A
no (X)
90
91
92
93
94
95
96
97
Emision total (Y ) 203.8 215.5 225.1 211.5 222.8 237.5 226.6 242.8
( Megatoneladas)
Se pueden utilizar las cantidades numericas siguientes:
X
X
X
X
X
xi = 748;
x2i = 69980;
yi = 1785.6;
yi2 = 399722;
xi yi = 167142
1. Realizar el ajuste lineal de la emision total en funcion del a
no. Calcular el valor de
R2 y comentar la bondad del ajuste.

Estadstica descriptiva

2. Seg
un nuestro modelo, se esta produciendo un aumento o un descenso de la emision
de CO2?
3. Seg
un nuestro modelo, cual sera la cantidad de CO2 emitida en 1998 por Espa
na?
I.2 A continuacion se presentan los diagramas de caja-bigotes para la emision total de cuatro paises de la Union europea entre 1990 y 1997. ( ES=Espa
na, FR=Francia,
GB=Gran Breta
na, y IT=Italia).

1. Como se construye un diagrama de caja-bigotes?


2. Como clasificara estos cuatro paises en cuanto a contaminacion por CO2?
3. Cual es el pas que presenta mayor dispersion entre sus datos de contaminacion?
Que quiere decir?
4. Si se realiza un ajuste lineal de la emision de CO2 en funcion del a
no para cada uno
de los paises, obtenemos las rectas siguientes:
Espa
na
Emision= 196.4 + 4.48 a
no
Francia
Emision= 403.2 0.51 a
no
Gran Breta
na Emision= 1126.2 6.15 a
no
Italia
Emision= 192.9 + 2.143 a
no
Que paises han ido reduciendo sus emisiones entre 1990 y 1997? Que paises las
han incrementado? Cual es el pas que mas ha reducido sus emisiones de CO2?
Cual es el pas que mas las han incrementado?

Problema 5

Estadstica descriptiva

I.1 En la siguiente tabla estan representados los datos referidos al alquiler pagado mensualmente por 45 familias que habitan pisos de alquiler en una determinada ciudad:
Alquiler en miles de ptas. N
umero de familias
(0 15]
5
(15 30]
12
(30 60]
16
(60 90]
10
(90 120]
2
Se pide:
1. Representar graficamente la variable mediante un histograma. Cuales son las caractersticas de dicho histograma? Que medidas de centralizacion y dispersion son
mas adecuadas para resumir los datos? Razonar la respuesta.
2. Calcular el alquiler medio pagado por las familias analizadas. En que intervalo se
sit
ua la mediana? Cual es el intervalo modal?
3. Cual es la proporcion de familias que pagan un alquiler menor o igual a sesenta mil
ptas.?
I.2. Los siguientes datos se refieren al crecimiento de una colonia de bacterias en un medio de
cultivo:
x 3
y 115000

6
147000

9
12
15
239000 356000 579000

18
864000

siendo x los das desde la inoculacion e y el n


umero de bacterias.
1. Representar y en funcion de x para verificar que es razonable ajustar una curva
exponencial.
2. Ajustar una curva exponencial a los datos.
3. Estimar, usando el modelo ajustado en el apartado anterior, el n
umero de bacterias
al termino de 20 das.

Problema 6
I.1- Seg
un el principio de la termodinamica, la presion P y el volumen V de una determinada
masa de gas estan relacionados por la siguiente formula :
PV = C
donde y C son dos constantes. Supongamos que disponemos de n mediciones de la
presion y del volumen, (p1 , v1 ), . . . , (pn , vn ) cual es la manera de obtener valores de las
dos constantes y C? (pensar en una transformacion de los datos).

Estadstica descriptiva

I.2- La comision de comercio federal americana midio el n


umero de miligramos de tar (X) y
monoxido de carbono (C0) (Y ) por cigarrillo en las distintas marcas comerciales disponibles.
Se tomo una muestra de 12 marcas, obteniendo para cada una:
X
Y

9
6

4 14 12
6 14 12

10
12

5 3
7 4

17 6
18 8

7 8
8 13

15
13

a) Calcula el porcentaje de marcas con un nivel de C0 inferior a 8. Calcula los cuartiles


de la distribucion de X.
b) Ajusta una recta de regresion de Y sobre X y discute la bondad del ajuste.
P
P
P
P 2
P 2
(Ayuda:
x = 110;
y = 121;
xy = 1294
x = 1234;
y = 1411)
I.3- Se realizaron investigaciones con el fin de estudiar la relacion entre la elevacion de la
temperatura de las celdas solares en Co por encima de la temperatura ambiente (y) y
la cantidad de aislamiento en megawatts por centimetro cuadrado (x), obteniendose los
siguientes datos:
x
y

9
25

25 20 12
70 50 30

15
45

22
60

14
28

16 24 25
50 68 68

15
20

12
21

10
20

1. Se quiere desarrollar un modelo que explique la evolucion de y en funcion de la


variable x. LLevar a cabo el ajuste correspondiente y comentar su bondad.
2. Para un aislamiento de 62 que temperatura cabe esperar?

Problema 7
I.1.- Describir las caractersticas globales del histograma siguiente. En tu opinion, para ese
conjunto de datos, cuales son las medidas de centralizacion y de dispersion mas representativas? Justifica tu respuesta.

Estadstica descriptiva

I.2- Una fabrica de refrescos ha tomado aleatoriamente 6 semanas del a


no observando la Temperatura media correspondiente a cada una de ellas, y la Cantidad de refrescos pedidos
durante cada una de estas semanas. Los datos obtenidos son los siguientes:
Temperatura media (o C )
28 12 30 24 5 15
Cantidad de refrescos pedidos (miles de litros) 65 19 75 67 11 24
(a) Calcular la media y la varianza de cada variable.
(b) Realizar un ajuste por mnimos cuadrados de la Cantidad de refrescos pedidos respecto de la Temperatura media. Comentar la bondad del ajuste.
(c) Si el modelo lineal es correcto, cual sera la cantidad de refrescos pedidos para una
semana donde la temperatura media sea igual a 20o C?

Problema 8
I.2.- En un estudio sobre la rapidez de combustion del grafito artificial en un flujo de aire
h
umedo, se llevo a cabo un experimento para investigar la difusividad del Oxgeno a
traves de una mezcla de vapor de agua. Para ello se prepararon muestras de Nitrogeno y
Oxgeno con una fraccion molar de agua de 0.017 a 9 temperaturas distintas, midiendose
la difusividad del Oxgeno en cada una, obteniendose:
T emperatura
1
1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8
Dif usividadO2 1.69 1.99 2.31 2.65 3.01 3.39 3.79 4.21 4.64
(a) Realice el diagrama de dispersion correspondiente. Es posible el ajuste de un modelo de regresion lineal simple, que relacione la difusividad del O2 en funcion de la
temperatura? Como debe salir el coeficiente de correlacion? (positivo, negativo,
cerca de 0?).
(b) En caso afirmativo, obtener la correspondiente recta de regresion utilizando la tecnica
de los mnimos cuadrados.
(c) Hallar el coeficiente de determinacion r2 e interpretar su valor.
(d) Cual sera la prediccion sobre la difusividad del O2 , para una temperatura de 3o a
partir del modelo construido?.

Problema 9
I.3 La tabla siguiente representa los datos correspondientes a 9 pruebas donde se ha estudiado
el volumen de desgaste de una pieza (Y ) dependiendo de la viscosidad del aceite (X)
X(aceite) 1.6 9.4 15.5 20.0 22.0 35.5 43.0 40.5 33.0
Y (desg.) 240 181 193 155 172 110 113 75
94
(a) Construye un grafico de dispersion ( es decir nube de puntos) de los datos. Parece
plausible el uso de un modelo de regresion lineal simple? Como debe salir el coeficiente de correlacion?.

Estadstica descriptiva

(b) Ajusta una recta de regresion utilizando la tecnica de los mnimos cuadrados. Comentar la bondad del ajuste.
(c) Cual sera la prediccion sobre el desgaste para una viscosidad de 45?. Obtener el
valor ajustado de y para x = 22 y calcular el residuo correspondiente.

Problema 10
I.3.- Con el fin de estudiar la relacion existente entre la densidad de tr
af ico, representada en
n
umero de automoviles por kilometro, y la velocidad a la que se circula en una determinada avenida de una ciudad, el ayuntamiento decide tomar una muestra durante un
mes seleccionando aleatoriamente 10 das laborables del mismo. Los resultados que se
obtuvieron vienen reflejados en la siguiente tabla:
Densidad de tr
af ico 69
V elocidad
25.4

56
32.5

62
28.6

119
11.3

84
21.3

74
22.1

73
22.3

90
38
18.56 37.2

22
44.6

(a) Calcular la media y varianza asociada a cada una de las variables.


(b) Calcular la covarianza existente entre ambas variables as como el coeficiente de correlacion.
(c) Realizar un ajuste por mnimos cuadrados de la Densidad de tr
af ico respeto a la
V elocidad.
(d) Deducir, suponiendo que la relacion proporcionada por las rectas de regresion es
valida,
(d.1) A que velocidad se estima que se circulara, si la densidad de trafico es de 85
autom
oviles/km?.
(d.2) Si se desea regular la velocidad modificando los semaforos que dan acceso a la
avenida, calcular a partir de la recta de regresion correspondiente, cual debe de
ser la densidad de trafico para que la velocidad sea de 30 Km/h.

Problema 11
1. Una empresa encarga a su departamento de recursos humanos un estudio con el fin de
determinar si existe relacion entre el tiempo que llevan en la empresa sus empleados y el
absentismo laboral (faltas al trabajo). Con el fin de realizar dicho estudio se seleccionan
al azar 10 empleados obteniendose los siguientes resultados:
Antig
uedad en la empresa
Das perdidos (a
no)

25
1

13 19 12 6 33
6 6 9 12 4

4 40
4 2

16
5

20
3

(a) Puede afirmarse que los empleados de mayor antig


uedad faltan con mas frecuencia
al trabajo?. Razona tu respuesta utilizando el coeficiente de correlacion.
(b) Que podemos afirmar de un empleado con una antig
uedad de 15 a
nos?

Estadstica descriptiva

Problema 12
1. En un lago, se ha medido, para diversos valores de la profundidad, el contenido en oxgeno,
en miligramos/litro, obteniendose los siguientes datos .
P rof undidad
Contenido. O

15 20 30
6.5 5.6 5.4

40
6.0

50
4.6

60
1.4

70
0.1

(a) Calcular la media y la varianza asociada a cada variable.


(b) Calcular la covarianza de las dos variables as como el coeficiente de correlacion.
Interpretar los resultados obtenidos.
(c) Realizar el ajuste de mnimos cuadrados del contenido respecto de la Profundidad as
como el ajuste de la profundidad respecto del contenido. Si la relacion proporcionada
por las rectas de regresion es valida, cual sera el valor del contenido de oxgeno a
una profundidad de 45m.

Problema 13
I.3.- Con el fin de determinar si existe relacion entre la cantidad de polmeros de latex incluida
durante el proceso de mezclado de cemento Portland y su resistencia adhesiva a tension,
una empresa encargada de realizar certificaciones de obras toma una muestra de tama
no
10, obteniendo los siguientes resultados:
P olmeros latex (mgr/kg) 13.5 11.0 13.0 11.2 12.0 13.2 12.0 13.5 11.2 13.0
Resistencia (kgf /cm2 )
17.5 16.6 17.2 16.6 17.0 17.3 16.9 17.3 16.8 17.1
(a) Calcular la media y varianza asociada a cada una de las variables.
(b) Calcular la covarianza existente entre ambas variables as como el coeficiente de correlacion.
(c) Realizar un ajuste por mnimos cuadrados de la resistencia respeto a la cantidad de
polmeros a
nadida en la mezcla.
(d) Deducir, suponiendo que la relacion proporcionada por las rectas de regresion es
valida,
(d.1) El valor estimado para la resistencia si la cantidad de polmero agregado es de
11.5mgr/kg.
(d.2) Si un determinado constructor desea que la argamasa tenga una resistencia de
16.5kgf /cm2 , calcular a partir de la recta de regresion correspondiente, cual
debe de ser la cantidad de polmero de latex que se debe a
nadir.

Problema 14

Estadstica descriptiva

1. Se quiere estudiar la relacion entre la proliferacion de una cierta especie de planta silvestre
y la cantidad de lluvia cada. Para ello, se define en varias comunidades autonomas un
coto de prueba de 1 hectarea y se realiza el recuento de ejemplares en el coto. En la
tabla siguiente se han recogido los resultados obtenidos junto con la precipitacion acuosa
registrada ese a
no.
Comunidad
Madrid Extremadura Andaluca Castilla-Leon Murcia
Precipitacion (mm) 429.8
628.6
224.7
484.9
320.5
No de ejemplares:
1250
1702
720
1301
830
(a) Calcular, para esos datos, la media, la varianza as como el coeficiente de variacion
asociada a cada variable.
(b) Calcular la covarianza existente entre ambas variables as como el coeficiente de
correlacion. Interpretar los resultados obtenidos.
(c) Realizar un ajuste por mnimos cuadrados del n
umero de ejemplares respecto a la
precipitacion, y de la precipitacion respecto al n
umero de ejemplares. Comentar la
calidad del ajuste. Si las relaciones proporcionadas por las rectas de regresion son
validas, que n
umero de ejemplares se asociara a una precipitacion de 500mm?

Problema 15
1. Con el fin de estudiar la relacion existente entre la fuerza de torsion aplicada a un tipo
de acero (en miles de libras) y su alargamiento medido en milesimas de pulgadas, se
seleccionaron aleatoriamente 6 probetas de prueba de longitud dada y se sometieron a
distintas cargas. Los resultados que se obtuvieron vienen reflejados en la siguiente tabla:
Torsion aplicada 1 2 3
Alargamiento
14 33 40

4
63

5
76

6
85

(a) A la vista de los resultados, resulta evidente que una mayor Fuerza de Torsion
produce un mayor alargamiento de la probeta. Desde un punto de vista estadstico,
en que se traduce esta informacion?
(b) Realizar un ajuste por mnimos cuadrados que nos permita predecir el alargamiento
de la probeta para distintas Fuerzas de Torsion aplicables.
(c) Deducir, a partir del ajuste que nos proporciona el criterio de mnimos correspondiente, el alargamiento que debe producirse al aplicar una fuerza de torsion de 3500
libras. Podramos predecir el alargamiento si aplicamos 10000 libras?. Razona tu
respuesta.

Problema 16
1. Con el fin de estudiar la congestion de trafico que se produce en una determinada va, se
decide tomar una muestra seleccionando 10 das laborables en una determinada hora y se
anotan tanto el n
umero de vehculos que se encuentran en la va en ese momento como
la velocidad promedio de los vehculos que se encuentran en ese momento en la va. Los
resultados que se obtuvieron vienen reflejados en la siguiente tabla:
Num vehculos
69
56
Velocidad (km/h) 25.4 32.5

62
26.8

119 84
74
11.3 21.3 22.1

73
22.3

90
18.6

38
22
37.2 44.6

10

Estadstica descriptiva
(a) Deducir, en funcion de los valores que se presentan, el signo de la covarianza entre
estas caractersticas.Como podemos interpretar esta informacion?
(b) Si llamamos X=N
um. de vehculos y Y=Velocidad promedio, sabiendo que:
P
P 2
P
P 2
P
xi = 687
xi = 53791
yi = 262.1
yi = 7705.7
xi yi = 15700
realizar un ajuste por mnimos cuadrados de la Velocidad promedio en funcion del
N
umero de vehculos y comentar la bondad del ajuste.
(c) Deducir, a partir del ajuste que nos proporciona el criterio de mnimos correspondiente:
i. Cual sera la velocidad promedio estimada si nos encontramos con 80 vehculos
en la avenida?
ii. Si deseamos regular la velocidad promedio modificando la secuencia de los
semaforos, cuantos vehculos deben encontrarse en la avenida para que la velocidad promedio sea de 30 km/h.?

Problema 17
1. Con el fin de analizar el tiempo de respuesta de una base de datos de consulta se tomaron
15 datos correspondientes a 3 semanas consecutivas obteniendose los siguientes resultados:
Lun Mart Mi
erc Juev Viern
Semana 1 4.32
7.14
9.21
9.71
15.39
Semana 2
5.2
8.37
9.34 10.46
18.9
Semana 3 6.39
8.97
9.51 10.53
21.25
(a) Calcular la media, mediana, cuartiles y desviacion tpica correspondiente a estos
datos.
(b) En funcion de los valores observados, entre que valores podemos decir que se encuentran los datos no atpicos?, existen datos que puedan considerarse atpicos?
(c) Que medida de dispersion utilizaras? Razona tu respuesta.
(d) Con el fin de determinar la relacion entre el tiempo de respuesta de la base
de datos y el n
umero de usuarios se midieron simultaneamente a la obtencion
del tiempo de respuesta, el n
umero de usuarios activos en ese instante, obteniendose
un conjunto de 15 datos cuyo valor medio era 30.73 y cuya varianza era 79.40. El
estudio concluyo con la siguiente relacion lineal entre ambas caractersticas:
T iempo = 0.51 U suarios 5.42
i. Determinar el coeficiente de determinacion asociado al ajuste.
ii. Determinar el n
umero de usuarios activos, si el tiempo de respuesta de servidor
es de 32.

Problema 18

Estadstica descriptiva

11

I.1 Sea x1 , x2 , ......, xn una realizacion muestral de una M.A.S. de tama


no n. Justifica como
queda afectada la media y la varianza muestral en los siguientes casos:
(a) A todas las observaciones se les suma una constante k.
(b) Todas las observaciones se multiplican por una constante k.

Problema 19
1. Despues de la jornada 22 en la liga 02/03, los puntos de la clasificacion quedan como
sigue:
Puntos 44 42 42 39 36 36 32 29 28 28 27 27 27 27 27 26 26 22 22 15
(a) Calcular la mediana y los dos cuartiles asociados a este conjunto de datos.
(b) Realizar un diagrama de caja-bigotes de los datos. Aparecen datos atpicos?
(c) Como interpreta el hecho de que el primer cuartil esta muy proximo a la mediana?
Quien va a ganar la liga?
2. Un ingeniero estudia la relacion entre una variable Y y otra variable X. Para ello dispone
de los valores de Y para 15 valores de X y sabe que la varianza de X vale 3.4. Decide
ajustar una recta de regresion y encuentra la ecuacion siguiente:
y = 2.3x + 5.
(a) Cual es el signo de la correlacion entre X e Y ? Justifica tu respuesta.
(b) Cuanto vale la covarianza de X y de Y ?
(c) Si x = 5.3, cuanto vale y?
(d) Que medida debe el ingeniero calcular para cuantificar la bondad del ajuste? Cuando
se considera que el ajuste es bueno?

Problema 20
Se mide el tiempo que tienen que esperar los usuarios para que llegue el ascensor B en la
planta baja del hospital de Marina. Despues de varios das de recogida de datos, los resultados
obtenidos (en segundos) se presentan en la tabla siguiente:
Tiempos de espera No de usuarios
[0, 125]
66
[125, 250]
21
[250, 375]
10
[375, 500]
3
I.1

1. De cuantos datos disponemos? Representar graficamente la variable mediante un


histograma.

12

Estadstica descriptiva
2. De los modelos de variables aleatorias vistos en clase, escoge uno que pueda describir aproximadamente la distribucion de los valores de esta tabla. Justificar la
respuesta.
3. Utilizando las marcas de clases (es decir el punto medio de cada intervalo en la tabla
de frecuencias) calcula la media y la varianza del conjunto de datos.

Problema 21
I.1 Para tener una buena imagen de la pantalla del ordenador es necesario que la tension de la
rejilla metalica situada detras de la pantalla no sea ni demasiado alta ni demasiado baja.
Por este motivo, durante la produccion el fabricante controla la tension de dicha rejilla.
Los siguientes resultados corresponden a estas mediciones sobre 20 rejillas:
M ediciones de la tensi
on N o de rejillas
257 X < 277
2
277 X < 297
7
297 X < 317
5
317 X < 337
3
337 X < 357
2
357 X < 377
1
Se pide:
I.1

1. Representar graficamente la variable mediante un histograma. Comentar las caractersticas mas relevantes de dicho histograma. Que medidas de centralizacion y
dispersion son mas adecuadas para resumir los datos? Razonar la respuesta.
2. Calcular la tension media de las rejillas analizadas. En que intervalo se sit
ua la
mediana? Cual es el intervalo modal?
3. Para que una rejilla sea apta para su ensamblaje en la pantalla de un ordenador su
tension media debe de situarse en el intervalo [306,328]. Debe el fabricante iniciar
una investigacion del proceso productivo? Razonar la respuesta.

I.2 Con el fin de determinar la relacion existente entre la resistencia de una determinada pieza
de plastico y uno de sus componentes (componente A) se fabrican 10 piezas de prueba,
cada una con una concentracion distinta y se obtienen los siguientes resultados:
P ieza
1
2
3
4
5
6
7
8
9
10
X (% A)
1.5 1.2 1.1 1.0 4.5 5.2 8.7
9.0
9.2
9.5
Y (Rotura) 3.04 2.96 2.66 3.17 9.82 9.68 17.71 18.18 18.32 19.30
donde la variable rotura indica la fuerza empleada a traccion en el instante de su rotura.
A partir de los datos anteriores se obtienen las siguientes cantidades:
X
X
X
X
X
xi = 50.9;
x2i = 384.77;
yi = 104.84;
yi2 = 1577.53;
xi yi = 778.33
1. Realizar un ajuste lineal de la rotura en funcion del contenido en el componente A.
Calcular el valor de r2 y comentar la bondad del ajuste.

Estadstica descriptiva

13

2. Seg
un nuestro modelo, cual sera la resistencia para un 3% de contenido de componente A?
3. Un determinado comprador nos pide que le fabriquemos piezas con un 6% de componente A y nos exige que tengan una resistencia de 10 Nwt a traccion. Podemos
afirmar que somos capaces de cumplir las especificaciones? Razonar la respuesta.

Problema 22
I.1 Que densidad de siembra de maz debe utilizar un agricultor para obtener el maximo
rendimiento? Si crecen pocas plantas obtendra un rendimiento bajo. Por otro lado,
si hay demasiadas plantas, estas competiran entre s por el agua y los nutrientes, y
en consecuencia el rendimiento bajara. Para averiguar cual es la mejor densidad de
siembra, se planta maz con distintas densidades de siembra en 32 parcelas de identicas
caractersticas y se obtienen los siguientes datos:
Y
X
1
2
3
4

[130, 218)

[218, 306)

[306, 394)

3
2
0
0

3
5
7
5

0
0
4
3

X: No de plantas por hectarea (104 ), Y : Rendimiento (Tm. por Ha.).


1. Cual es el n
umero de plantas por hectarea mas habitual? Y el n
umero medio de
plantas por Ha.?
2. Obtener el rendimiento medio por Ha.. Determinar el porcentaje de parcelas cuyo
rendimiento es mayor o igual que el rendimiento medio.
3. Calcular el porcentaje de parcelas, en las que se plantaron mas de 20000 plantas,
cuyo rendimiento por Ha es mayor a 262 Tm/Ha.
4. Con el fin de determinar la relacion entre la rentabilidad por Ha. y el n
umero de
plantas de maz plantadas por Ha., un ingeniero agronomo analiza los anteriores
datos y decide ajustar el siguiente modelo lineal entre las caractersticas X e Y :
Y = 186.56 + 33.2X

con r2 = 0.83

4.1. Cual es el signo del coeficiente de correlacion entre X e Y ? Razona tu respuesta.


4.2. Para una densidad de siembra de 35000 plantas por Ha., cual sera la rentabilidad por Ha. estimada con el modelo? Es fiable esta estimacion? Razona tu
respuesta.
5. Cual sera tu conclusion sobre la densidad de siembra para obtener el maximo
rendimiento?

Problema 23

14

Estadstica descriptiva

I.1 Los datos que a continuacion se detallan corresponden a la produccion (en miles de toneladas)
de hortalizas y frutales en Espa
na durante una campa
na agrcola:
Hortalizas
Esparrago
Guisantes verdes
Habas verdes
Ajos
Judas verdes
Alcachofa
Fresa y Freson
Col repollo
Coliflor

103 T m.
62.8
63.2
69.5
160
261.3
283.7
317.3
332.8
353

Hortalizas 103 T m.
Sanda
815.9
Pimiento
882.8
Cebolla
981.2
Melon
993.1
Lechuga
1041.8
Tomate
3560.4

Frutales
Avellana
Cereza
Ciruela
Albaricoque
Almendra
Platano
Pera
Manzana
Melocoton

103 T m.
16.2
54.4
136.1
149.8
202.6
385.2
599.8
719
896.8

El diagrama de caja y bigotes realizado con Statistix es el siguiente:


1. Colocar en cada lnea del grafico su valor numerico.
2. Comentar las caractersticas mas relevantes del grafico. En ambos diagramas las
cajas aparecen divididas en dos partes desiguales, como interpretas esta situacion?
3. Existen datos atpicos en algunas de las producciones? Que representan?
I.2 En una determinada region se sabe que las precipitaciones cadas dependen de la cantidad
de vegetacion en la zona. Se dispone de los siguientes datos:
X
Y

50 100
20 70

150
100

200 300
150 200

X: n
umero de arboles por Ha., Y : n
umero de litros cados por m2 .
1. Realizar un ajuste por mnimos cuadrados del volumen de agua cada por m2 en
funcion del n
umero de arboles por Ha. Calcular una medida de la bondad del ajuste
realizado.
2. Utilizando la recta ajustada en el apartado anterior, predecir el volumen de agua
cado cuando el n
umero de arboles por Ha. en la zona es 175. Es fiable esta
prediccion? Razona tu respuesta.

Problema 24
I.1 La edad de un arbol se estudia atendiendo al n
umero de anillos en la seccion transversal del
tronco. Con el fin de analizar la edad de los arboles de un determinado bosque, mediante
un proceso de simulacion por ordenador se determina el n
umero aproximado de anillos
en la seccion transversal del tronco seg
un el diametro de este. Para una muestra de 40
arboles se obtienen los siguientes resultados:
No de anillos
No de arboles

(0,10]
3

(10,20]
10

(20,30]
18

(30,40]
8

(40,50]
1

Estadstica descriptiva

15

1. Calcular la media y la desviacion tpica correspondiente al n


umero de anillos en la
seccion transversal del tronco. Que tipo de informacion proporcionan acerca del
conjunto de datos?
2. Representar graficamente la variable mediante un histograma. De los modelos de
variables aleatorias que hemos visto, escoge uno que pueda describir aproximadamente el n
umero de anillos en la seccion transversal de un arbol. Razona tu respuesta.
3. Un arbol se considera anciano si el n
umero de anillos en su seccion transversal es
superior a 30. Determinar la proporcion de arboles no ancianos obtenidos en la
muestra.
4. El estudio concluyo con la siguiente relacion entre la edad, en a
nos, de un
arbol
y el n
umero de anillos en la secci
on transversal de su tronco:
Edad = 0.51 N o de anillos + 5.8
(a) Determinar razonadamente el signo de la covarianza entre la edad de un arbol
y el n
umero de anillos de su tronco. Podras dar un valor numerico para ella?
(b) Determinar la edad aproximada para un arbol que se le han contado 24 anillos
en su tronco?

Problema 25
I.2 Se quiere estudiar la relacion entre la rentabilidad del trigo respecto del nivel de nitrogeno
(N). Para ello, se planto trigo en 7 parcelas de tierra de identicas caractersticas y se
les suministraron diferentes niveles de nitrogeno. Los resultados aparecen en la tabla
siguiente:
Unidades (N/acre) (x)
40
60
80 100 120 140 160
Rentabilidad (Tm/acre) (y) 15.9 18.8 21.6 25.2 28.7 30.4 30.7
Se pueden utilizar las cantidades numericas siguientes:
P
P
P 2
P 2
P
xi = 700
yi = 171.3
xi = 81200
yi = 4398.2
xi yi = 18624
1. Ajustar una recta para predecir la rentabilidad del trigo en funcion del nivel de
nitrogeno. Calcular r2 e interpretar su valor.
2. Estimar, utilizando el modelo ajustado en el apartado anterior, la rentabilidad del
trigo cuando el nivel de nitrogeno es de 60 unidades. Es fiable esta prediccion?
Razona tu respuesta.

Problema 26
I.1 Describir las caractersticas globales del siguiente histograma. Indicar de manera razonada
cuales seran las medidas de centralizacion y dispersion mas adecuadas para resumir dicho
conjunto de datos:

16

Estadstica descriptiva

I.2 En julio, las cepas producen racimos de peque


nas bayas, y se quiere utilizar un recuento
de esos racimos para predecir la cantidad de uva que se recogera. En la tabla siguiente
aparece, para varios a
nos, la cosecha de uva en toneladas por acre y la cantidad de racimos
contabilizados en julio:
A
no
1976 1977 1978 1979 1980 1981 1982
No racimos (x) 116
80
125 116 117
93
107
Produccion (y) 4.9
3.9
4.8
4.6
4.7
4.1
4.4
Se pueden utilizar las cantidades numericas siguientes:
P
P
P 2
P 2
P
xi = 754
yi = 31.4
xi = 82724
yi = 141.68
xi yi = 3416
1. Se quiere desarrollar un modelo que explique la produccion de uva respecto del
n
umero de racimos contabilizados en julio. Llevar a cabo el ajuste correspondiente
y comentar su bondad.
2. Si en julio se contabilizaron 122 racimos, cual sera el ingreso esperado de la produccion de uva si en dicho a
no el precio de venta del kilo de la uva es de 1.40 euros?

Problema 27
I.1 Una empresa vitivincola desea realizar un estudio sobre la influencia de las campa
nas
publicitarias en sus cifras de ventas. Para ello dispone del gasto destinado a publicidad y
sus ventas en los u
ltimos cinco a
nos.
OS GAST OS EN P U BLICIDAD() V EN T AS()
AN
1996
2.5
200
1997
2.8
221
1998
2.9
230
1999
3.1
239
2000
3.5
248
() Los gastos en publicidad y las ventas vienen en millones de pesetas.
Se pide:
1. Se quiere desarrollar un modelo que explique la evolucion de las ventas en funcion
de los gastos en publicidad. Llevar a cabo el ajuste correspondiente y comentar su
bondad.
2. Predecir las ventas para este a
no 2001, si se tiene previsto invertir en publicidad 4
millones de pesetas.
I.2 Se ha aplicado un test sobre capacitacion laboral a 90 empleados de una industria, obteniendose
los siguientes resultados:
P U N T U ACION ES N o de EM P LEADOS
[38, 44)
7
[44, 50)
8
[50, 56)
15
[56, 62)
27
[62, 68)
18
[68, 74)
9
[74, 80]
6

Estadstica descriptiva

17

Se pide:
1. Representar graficamente la variable mediante un histograma. Comentar las caractersticas
mas relevantes de dicho histograma. Que medidas de centralizacion y dispersion son mas
adecuadas para resumir los datos? Razona tu respuesta.
2. Calcular la puntuacion media obtenida en el test. En que intervalo se sit
ua la mediana?
Cual es el intervalo modal?
3. Que proporcion de empleados tiene una puntuacion mayor o igual a 62?

Problema 28
I.1 Una empresa productora de ctricos constata que las producciones de dos fincas son de
calidad distinta aunque utilizan la misma especie de arboles. Despues de notar que los
dos tipos de suelo son distintos (la finca A esta constituida de suelo fino y homogeneo
mientras que la finca B tiene una mezcla de suelo fino y suelo mas grueso) decide hacer
mediciones de la densidad del suelo en las dos fincas:
FINCA A
FINCA B
85.9 88.2 90.4 91.1 92.7 92.8
86.8 87.5 90.3 91.4 92.4 92.6
93.8 94.1 94.3 96.5 98.5 103.8
93.5 93.9 94.8 94.9 95.0 97.5
1. Realiza en un mismo grafico un diagrama de caja y bigotes de la densidad de la finca
A y la finca B. Comentar las caractersticas mas relevantes.
2. Te parece que la densidad se distribuye sensiblemente de la misma manera para las
dos fincas?
I.2 Una empresa de productos lacteos quiere estudiar la relacion entre el contenido en materia
grasa de la leche de vaca y la cantidad de lluvia caida (a mayor precipitacion acuosa
mejor sera el forraje para la alimentacion del ganado). Los siguientes datos se refieren al
porcentaje de contenido en grasa junto con la precipitacion acuosa registrada durante el
primer semestre del a
no:
contenido de grasa %
precipitacion (l/m2 )

4.2
524

4.13
502

4.14 4.08 3.98 3.92


464 484 310 320

1. Realizar el diagrama de dispersion correspondiente. Cual es el tipo de relacion entre


las dos variables? Se trata de una relacion positiva o negativa?
2. Realizar un ajuste por mnimos cuadrados del contenido de materia grasa respecto
de la precipitacion. Hallar el coeficiente de correlacion e interpretar su valor.
3. Estimar, usando el modelo ajustado en el apartado anterior, el contenido de materia
grasa para un mes con una precipitacion de 450 l/m2 .

Problema 29
La mejora de la tecnologa (mecanizacion, fertilizantes, nuevas variedades de plantones, etc,)
ha dado lugar que la productividad (P ) y el tiempo (t) esten relacionados por la formula P =
et donde y son dos constantes. Supongamos que tenemos n datos de la productividad
y el tiempo, que transformacion de los datos nos lleva a obtener las constantes y ? Realiza
dicha transformacion y propon las formulas para obtener las citadas constantes. (1 pto)

18

Estadstica descriptiva

Probabilidad

19

Universidad Polit
ecnica de Cartagena
Dpto. Matem
atica Aplicada y Estadstica
M
etodos estadsticos de la ingeniera, Estadstica
Problemas de examenes: Probabilidad

Problema 1
La elaboracion de un determinado tipo de piezas puede realizarse con dos maquinas, siendo
la produccion de piezas diaria de ambas maquinas la misma. Las proporciones de piezas defectuosas fabricadas por las dos maquinas M1 y M2 son 0.04 y 0.01, respectivamente.
a) Si se selecciona al azar una pieza de la produccion total y resulta detectuosa Cual es la
probabilidad de que provenga de M2 ?
b) Si se toman independientemente dos piezas al azar y resultan aceptables Cual es la
probabilidad de que ambas piezas provengan de M1 ?
Nota: Indicar claramente los sucesos que intervienen as como las probabilidades asociadas.

Problema 2
Una empresa fabrica chips con un porcentaje de defectuosos del 5%, poniendolos a la venta
en paquetes de 5 unidades. Una empresa ilegal vende imitaciones indistinguibles del mismo chip
con un porcentaje de defectuosos del 50% y los comercializa en el mismo envase de 5 unidades.
a) Cual es la probabilidad de que un paquete legal contenga exactamente dos chips defectuosos? Y si el paquete es ilegal?

Teniendo en cuenta que el 10% de los paquetes vendidos en el mercado son ilegales, responder
a las siguientes cuestiones:
b) Si adquirimos un paquete de chips, cual es la probabilidad de que contenga exactamente
dos chips defectuosos?
c) Cual es la probabilidad de que un paquete que contiene dos defectuosos sea ilegal?
Nota: Indicar claramente los sucesos que intervienen as como las probabilidades asociadas.

Problema 3
Una avioneta cayo en una region que se puede clasificar como: el 50% de monta
na, el 30%
de prado y el 20% de mar. Dependiendo de donde haya cado, su localizacion para el equipo
de rescate es mas o menos facil, de forma que la probabilidad de que no se localice si ha cado
en la zona de monta
na es de 0.3 y si ha cado en los prados de 0.2, pero si ha cado en el mar
la probabilidad de no localizarla es de 0.9.

20

Probabilidad

Como el piloto no llevaba equipo para sobrevivir en la monta


na, inicialmente el rescate se hizo
en esta zona y no se encontro. Cual es la probabilidad de que realmente la avioneta haya
cado en la monta
na?
Al no encontrarla en las monta
nas, se continuo buscando en las otras dos zonas y tampoco se
encontro. Cual es la probabilidad de que realmente la avioneta haya cado en la monta
na?
Comparar este valor con el del apartado anterior. Por que no son los mismos?

Problema 4
II.1 En la construccion de unas determinadas obras pueden aparecer anomalas debidas a dos
causas que son independientes: fallos de cimentacion y mala calidad de los materiales.
La primera ocurre con probabilidad del 4% y la segunda con probabilidad del 3%.
1. Calcular la probabilidad de que en una determinada obra no aparezca ninguna
anomala.
2. Calcular la probabilidad de que aparezcan fallos de cimentacion y no mala calidad
de los materiales.
3. Si se detecta la presencia de anomalas, la construccion puede verse afectada con un
desplome en un plazo de tiempo determinado con las siguientes probabilidades:
0.1, cuando no aparece ninguna de las anomalas.
0.8, cuando aparece alguna de las anomalas.
Interpretar esta informacion adicional en terminos de sucesos y probabilidades. Calcular la probabilidad de que el edificio se desplome. Si el edificio se ha desplomado,
cual es la probabilidad de que se haya producido alguna de las anomalas?.
4. Una determinada empresa realiza 5 obras cada a
no. Cual es la probabilidad de que
en 5 a
nos al menos tres obras sufran anomalas?
5. Y la de que en 20 a
nos mas del 90% de las obras realizadas no tengan anomalas?

Problema 5
1. En la produccion de un artculo se aplica soldadura y para eso se usan tres diferentes
robots. La probabilidad de que la soldadura sea defectuosa vara para cada uno de los
robots, as como la proporcion de artculos que cada uno procesa, de acuerdo a la siguiente
tabla:
robot % art. procesados Probabilidad soldadura defectuosa
A
18 %
0.002
B
42 %
0.005
C
40 %
0.001
(a) Definir de manara adecuada los sucesos que intervienen as como las probabilidades
asociadas a cada uno de ellos.
(b) Determinar cual es la proporcion global de defectos producida por las tres maquinas.

Probabilidad

21

(c) Si tomamos un artculo al azar y resulta con soldadura defectuosa, determinar la


probabilidad de que haya sido soldado por el robot C.

Problema 6
Una empresa consta de tres factoras dedicadas a la elaboracion de ladrillos para la construccion, produccion que se reparte de la siguiente manera: la factora A elabora un 25% y la
B un 40%. Ademas, la factora A elabora un 5% de ladrillos defectuosos, la B un 2% y la C un
3%.
a) Indicar el experimento aleatorio y los sucesos que intervienen, as como las probabilidades
asociadas a dichos sucesos.
b) Si seleccionamos un ladrillo elaborado en la factora C, cual es la probabilidad de que sea
defectuoso?
c) Si seleccionamos un ladrillo de la produccion total, cual es la probabilidad de que sea
defectuoso?
d) Si el ladrillo seleccionado de la produccion total resulta defectuoso, cual es la probabilidad
de que no se fabricara en C?

Problema 7
II.1 Sean dos sucesos A y B que cumplen P(B|A) = 0.3, P(B|AC ) = 0.7, y P(B) = 0.6. Indicar
si es verdadera o falsa cada una de las afirmaciones siguientes, razonando la respuesta,
a) A y B son independientes.
b) P(A) = 0.25.
c) A y AC son independientes
d) A y B son incompatibles.
II.2 Una empresa de materiales de construccion esta probando un nuevo pavimento. Para ello,
instala muestras del material en tres zonas donde las condiciones climaticas son diferentes,
repartidas de la siguiente forma: 45% en la zona A, 30% en la zona B y 25% en la zona
C.
Con una lluvia abundante el pavimento se derrumba totalmente. La probabilidad de que
haya tormenta en la zona A es P[|X| < 2], siendo X una variable aleatoria con distribucion
normal de media = 1 y varianza 2 = 4), en la zona B es P[Y 6], donde Y tiene una
distribucion binomial de parametros n = 8 y p = 0.8 y en la zona C es P[U = 3], con U
una variable con distribucion de Poisson de parametro = 1.
1. Calcular la probabilidad de que el pavimento se derrumbe en cada una de las zonas
donde se instalaron muestras de material.
2. Si el pavimento no sufre ning
un derrumbamiento, cual es la probabilidad de que se
haya construido en la zona A?
3. Cual es la probabilidad de que no se produzca derrumbamiento si el pavimento no
se construyo en la zona B?

Problema 8

22

Probabilidad

II.1- Cierto artculo se manufactura en tres fabricas, digamos 1, 2 y 3. Se sabe que la primera
produce el doble de artculos que la segunda y que esta y la tercera producen el mismo
n
umero de artculos (durante el periodo de produccion especificado). Se sabe tambien
que el 2% de artculos producidos por las dos primeras es defectuosos, mientras que el
4% de los manufacturados por la tercera es defectuoso. Todos los artculos producidos se
colocan en una fila y se escoge uno al azar.
a) Traducir los datos del enunciado, introduciendo los sucesos convenientes
b)Cual es la probabilidad de que este artculo sea defectuoso?

Problema 9
I.2- Sean A, B y C tres sucesos, tales que P (A) = 0.2, P (B) = 0.8 y P (A|B) = 0.5. Entre
las siguientes afirmaciones, indica cuales son corresctas.(puede haber m
as de una
respuesta correcta). Razona tu respuesta.
T
T
T
S
a) P (A SB) = 0.4
b) P (A B) = 0.16
c) P (A B) = 0.1
d) P (A B) = 0.6
e) P (A B) = 1
II.2- En un laboratorio, se dise
na un test para detectar la presencia de una bacteria en el agua.
Para probar el test, se considera un gran n
umero de probetas con agua que pueden, o no,
contener la bacteria. La probabilidad de que una probeta escogida al azar contenga la
bacteria es de 0.2. Por otra parte, si una probeta contiene la bacteria, el test da positivo
en el 90% de los casos. En cambio, si una probeta no contiene la bacteria, el test da
positivo en el 5% de los casos.
(a) Traducir los datos del enunciado, introduciendo los sucesos convenientes.
(b) Al escoger al azar una probeta, cual es la probabilidad de que de positivo en el test?
(c) Si una probeta ha dado positivo en el test, cual es la probabilidad de que contenga
la bacteria?
(d) Entre las probetas que han dado negativo en el test, cual es la proporcion de
probetas que contienen la bacteria?

Problema 10
II.1- Sean A y B dos sucesos cualesquiera tales que
1
1
2
p(A) = , p(B) = , p(A/B) + p(B/A) =
3
5
3
Calcular:
(a) p(A B)
(b) p(A B)
(c) p(AC B C ), siendo AC el conjunto complementario de A.

Probabilidad

23

II.2- Las mujeres de una universidad constituyen el 60% de los estudiantes de primer curso, el
40% de los de segundo y el 40% de los de tercero. Los estudiantes de dicha universidad
son en un 40% de primero, en un 30% de segundo y en un 30% de tercero.
(a) Introducir los sucesos convenientes y traducir los datos del enunciado.
(b) Si se escoge un estudiante de dicha universidad al azar, hallar la probabilidad de que
sea mujer.
(c) Si el estudiante escogido es mujer Cual es la probabilidad de que sea de segundo
curso?

Problema 11
I.2.- El 10% de los chips informaticos vendidos en el mercado son producidos por una empresa
pirata. Para un chip pirata la probabilidad de que sea defectuosos es del 50% mientras
que si el chip no es pirata la probabilidad de que sea defectuoso desciende al 5%.
(a) Definir los sucesos convenientes, junto con sus probabilidades.
(b) Determinar el porcentaje total de chips defectuosos que salen al mercado.
(c) Compras un chip y resulta ser defectuoso. Calcular la probabilidad de que proceda
de la empresa pirata.

Problema 12
1. Un avion realiza diariamente el mismo servicio. En un a
no hubo 50 das con niebla y
315 das sin niebla. Consideramos el experimento aleatoria se escoge un da al azar en
el a
no. Se ha comprobado que si el da es con niebla, la probabilidad de que ocurra un
accidente ese da es de 0.04 mientras que si el da es sin niebla, la probabilidad de un
accidente es de 0.003. Calcular la probabilidad de que:
(a) al escoger al azar un da en el a
no, haya ocurrido un accidente.
(b) Si un da ha ocurrido un accidente, el da haya sido sin niebla.

Problema 13
I.2.- Una pieza producida en una empresa puede tener dos tipos de defectos. El 8% de la
produccion presenta el defecto de tipo A, el 5% de la produccion presenta el defecto de
tipo B, y se supone que no hay piezas que tengan los dos tipos de defectos. Despues de
ser producida cada pieza es sometida de manera automatica a un test de ruptura, con las
siguientes posibilidades: Si la pieza tiene el defecto de tipo A, tiene una probabilidad de
0.9 de romperse. Si la pieza tiene el defecto de tipo B, tiene una probabilidad de 0.95 de
romperse. Finalmente, si la pieza no tiene ning
un tipo de defecto, tiene una probabilidad
de 0.01 de romperse.
(a) Si el experimento aleatorio consiste en escoger al azar un pieza de la produccion,
traducir los datos del enunciado, despues de haber introducido los sucesos convenientes.

24

Probabilidad
(b) Cual es la probabilidad de que una pieza escogida al azar en la produccion se vaya
a romper durante el test?
(c) Si una pieza escogida al azar se ha roto durante el test, cual es la probabilidad de
que no fuese defectuosa?

Problema 14
1. En una empresa conservera, se dispone de dos maquinas que envasan en botes el mismo
producto. La maquina A es la mas antigua, y produce el 30% de la produccion total,
mientras que la maquina B, de adquisicion mas reciente, produce el 70% de la produccion
total. Si un bote ha sido producido por A, la probabilidad de que sea defectuoso es de
0.08, mientras que, si ha sido producido por B, la probabilidad de que sea defectuoso es
de 0.04.
(a) Si el experimento aleatorio consiste en escoger un bote al azar de la produccion,
traducir los datos del enunciado, introduciendo los sucesos convenientes.
(b) Cual es la probabilidad de que, al escoger un bote al azar, sea defectuoso?
(c) Cual es la probabilidad de que, si un bote escogido al azar es defectuoso, haya sido
producido por la maquina A?

Problema 15
1. En una determinada ciudad se pueden sintonizar de manera gratuita 4 canales de TV, el
Canal 1, Canal 2, Canal 3 y Canal 5 (el Canal 4 es de pago). Seg
un un estudio realizado,
la probabilidad de que a las 22:00 la programacion emitida merezca la pena es del 025,
030, 015 y 010 para cada uno de los canales respectivamente. Supongamos que a las
22:00 encendemos un televisor de esa ciudad y se sintoniza un canal de manera aleatoria.
Se pide:
(a) Definir de manera adecuada los sucesos que intervienen as como sus probabilidades
asociadas.
(b) Determinar la probabilidad de que merezca la pena el programa obtenido al encender un televisor de esa ciudad a las 22:00 y sintonizar un canal de manera aleatoria.
(c) Supongamos que la programacion obtenida no merece la pena, determinar la probabilidad de que estemos sintonizando el Canal 5.

Problema 16
1. Un determinado prefabricado de hormigon puede presentar dos tipos de defectos de manera independiente, que lo hacen inutilizable. El primero de ellos es no cumplir con la
norma en lo referente a las dimensiones del objeto y otro no cumplir la norma en relacion
a la resistencia del mismo, pudiendo presentarse ambos defectos en una misma pieza. Se
sabe que el 10% de los prefabricados tienen unas dimensiones incorrectas, mientras que
solo el 5% no cumple las exigencias en cuanto a resistencia. A partir de esta informacion,
determinar:
(a) El porcentaje de prefabricados que son correctos, es decir, no presentan defecto
alguno.

Probabilidad

25

(b) El porcentaje de prefabricados que tendran que ser eliminados por presentar alg
un
tipo de defecto.
(c) Determinar, dentro del conjunto de las piezas defectuosas, el porcentaje de piezas
que cumplen la norma de resistencia.

Problema 17
1. Con el fin de verificar un determinado procedimiento no destructivo para testar la calidad de una componente electronica se probo con 50 piezas correctas y 50 defectuosas
obteniendose los siguientes resultados:
P ieza
Defectuosa

Correcta
1

Incorrecta
48

No Defectuosa

49

Test
(a) Calcular el error asociado al test, esto es, calcular la probabilidad de que el test de
negativo sabiendo que la pieza es correcta y la probabilidad de que el test de positivo
sobre una pieza defectuosa.
(b) Sabiendo que el porcentaje de piezas defectuosas del proceso de fabricacion es del
5% determinar la probabilidad de que realmente sea defectuosa una pieza que dio
defectuosa al aplicar el test.

Problema 18
I.2 Una multinacional realiza operaciones comerciales en tres mercados A, B y C. El 20% de
las operaciones de la multinacional corresponden al mercado A y en los mercados B y C
realiza exactamente el mismo n
umero de operaciones. El porcentaje de operaciones en
los que se producen retrasos en el pago es del 10%, 15% y 5% en los mercados A, B y C,
respectivamente. Se pide:
(a) Describir los sucesos correspondientes y sus probabilidades asociadas.
(b) En que porcentaje de operaciones de la multinacional no se producen retrasos en el
pago?.
(c) Que porcentaje de las operaciones en las que se ha retrasado el pago han sido
realizadas en el mercado B?.
(d) Elegida una operacion al azar, que probabilidad hay de que no tenga retraso en el
pago y corresponda al mercado A o C?
(e) Entre las operaciones que no han sufrido retraso en el pago, cual es el porcentaje
de las que corresponden a los mercados A o C?

Problema 19
Una empresa fabrica bombillas en tres factoras A, B y C. En A se producen el 20% del
total de bombillas, en B el 40% y en C el resto. El 2% de las bombillas fabricadas en A son
defectuosas, mientras que el porcentaje de defectuosas en B y C es del 3% y 4%, respectivamente.

26

Probabilidad

I.1 Se decide escoger al azar una bombilla de la produccion total:


1. Despues de introducir los sucesos convenientes, traducir los datos del enunciado.
2. Calcular la probabilidad de que la bombilla seleccionada sea defectuosa.
3. Si se sabe que la bombilla seleccionada funciona correctamente, determinar donde
es mas probable que se fabricara y con que probabilidad.
I.2 Ahora se decide elegir una factora al azar entre las tres, y una vez escogida la factora,
escoger al azar una bombilla entre su produccion.
1. Reasignar las probabilidades a los sucesos introducidos anteriormente teniendo en
cuenta esta nueva situacion.
2. Calcular la probabilidad de que la bombilla seleccionada no sea defectuosa.
3. Si la bombilla seleccionada es defectuosa, cual es la probabilidad de que se fabricara
en B?
4. Que diferencia esencial existe entre las dos situaciones descritas en I.1 y en I.2
respectivamente?

Problema 20
1. Un metodo empleado para distinguir entre rocas granticas y basalticas consiste en examinar desde el aire una porcion del espectro infrarrojo de la energa solar reflejada por
la roca. Los resultados de estas observaciones los podemos catalogar en tres clases que
denotaremos por C1 , C2 C3 . El grado de deteccion del procedimiento viene reflejado en
la siguiente tabla:
Observaci
on C1
C2
C3
Granito
60% 25% 15%
Basalto
20% 50% 45%
es decir, la probabilidad de que la superficie sea grantica cuando se recibe la se
nal C1 es
de 0.6, etc. Entonces, sabiendo que en una determinada region se han detectado se
nales
C1 en el 45% de las pruebas, C2 en el 20% y C3 en el resto:
(a) Definir de manera adecuada los sucesos que intervienen as como las probabilidades
asociadas a cada uno de ellos.
(b) Determinar la proporcion de granito y basalto de la zona.
(c) Si la piedra observada no es basaltica ni grantica, determinar la probabilidad de
que la se
nal recibida sea C1 .

Problema 21
1. El 15% de los tomates recolectados en cierta region presenta en la piel una sustancia
toxica A, el 10% la sustancia toxica B y el 2% las sustancias toxicas A y B. Se selecciona
una muestra al azar.
(a) Calcular la probabilidad de que la muestra presente la sustancia toxica A si presenta
la sustancia toxica B.

Probabilidad

27

(b) Calcular la probabilidad de que la muestra presente la sustancia toxica A si no


presenta la sustancia toxica B.
(c) Se sabe que el 20% de las muestras presentan en su piel una sustancia C, incompatible
con B y el 5% de las muestras las sustancias A y C. Calcular la probabilidad de que
la muestra presente la sustancia B o C si presenta la sustancia A.

Problema 22
1. Un proceso de fabricacion puede estar ajustado o desajustado. Cuando esta ajustado
produce un 1% de piezas defectuosas y cuando esta desajustado un 10%. La probabilidad
de desajuste es 0.3.
(a) Traducir los datos del enunciado indicando claramente el experimento aleatorio, los
sucesos que intervienen y sus probabilidades asociadas.
(b) Se toma una pieza de la produccion total y resulta ser aceptable. Calcular la probabilidad de que el proceso este desajustado.
(c) Se toman 5 piezas de manera indepedientes y todas son buenas. Calcular la probabilidad de que el proceso este desajustado.

Problema 23
IV Sabeis que hay dos ascensores (A y B) en cada ala del hospital de Marina, supongamos
que, al llamar un usuario en la planta baja a los dos ascensores de manera simultanea, la
probabilidad de que llegue primero el ascensor A es de 0.75. Ademas la probabilidad de
que el ascensor se quede bloqueado, con el usuario dentro, es de 0.005 para el ascensor A,
y de 0.01 para el ascensor B,
1. Cual es la probabilidad de que el usuario que ha llamado a los dos ascensores desde
la planta baja se quede bloqueado?
2. Si un usuario se ha quedado bloqueado, cual es la probabilidad de que sea en el
ascensor A?

Problema 24
I.2 Una cooperativa contrata a 3 ingenieros agronomos, A, B y C, para realizar diferentes
trabajos. El 25% de los trabajos son realizados por el ingeniero A, el 35% por el ingeniero
B y el resto por el ingeniero C. La probabilidad de que el trabajo se entregue en la fecha
impuesta por la cooperativa es de 0.97 si lo ha realizado A, de 0.89 si lo ha realizado B
y de 0.92 si lo ha realizado C. Si el experimento aleatorio consiste en seleccionar al azar
uno de los trabajos contratados, se pide:
1. Si se sabe que el trabajo seleccionado ha sido presentado en la fecha convenida, cual
de los tres ingenieros es mas probable que haya sido contratado para realizar dicho
trabajo?
2. Calcular la probabilidad de que el trabajo no se entregue en la fecha impuesta por
la cooperativa y no haya sido realizado por el ingeniero C.

28

Probabilidad

Problema 25
II.1 En una granja avcola se utilizan 2 tipos de pienso, A y B, para alimentar a las aves. El
25% de las aves son alimentadas exclusivamente con el pienso A, el 35% son alimentadas
exclusivamente con el pienso B y el resto de las aves son alimentadas con una mezcla
de ambos tipos de pienso. Se sabe que la probabilidad de que el engorde de las aves
sea superior a 1 Kg. cuando se utiliza solamente el tipo A es de 0.86, cuando se utiliza
solamente el pienso B es de 0.58 y cuando se utilizan ambos tipos de pienso es del 0.92.
Se decide escoger al azar una de las aves de la granja:
1. Despues de introducir los sucesos convenientes, traducir los datos del enunciado.
2. Determinar la probabilidad de que el engorde del ave sea superior a 1 Kg.
3. Si se comprueba que el engorde del ave ha superado 1 Kg., determinar que tipo de
alimentacion es mas probable que haya seguido y con que probabilidad.

Problema 26
II.1 Dos cazadores A y B disparan a la misma pieza. La precision de ambos no es la misma,
pues la probabilidad de que A acierte es 9/10 y la de B es 7/10. Sabiendo que ambos
disparan a la pieza una u
nica vez, hallar la probabilidad de que:
1. el cazador A no acierte.
2. ambos alcancen la pieza.
3. exactamente uno de ellos alcance la pieza.
4. ninguno de ellos alcance la pieza.

Problema 27
Un dado tiene dos caras con el n
umero UNO, dos caras con el n
umero TRES, una cara
con el n
umero DOS y una cara con el n
umero CUATRO. Consideremos el siguiente juego: un
jugador lanza el dado, si sale un n
umero PAR, el jugador recibe tantas pesetas como puntos
indica el resultado; si sale un n
umero IMPAR, el jugador paga tantas pesetas como puntos
indica el dado. Calcular:
(a) El rango y la funcion puntual de probabilidad de la ganancia obtenida en cada lanzamiento.
(b) Que ganancia espera obtener el jugador en cada lanzamiento?
(c) La desviacion tpica de la ganancia obtenida.

Variables Aleatorias.

29

Universidad Polit
ecnica de Cartagena
Dpto. Matem
atica Aplicada y Estadstica
M
etodos estadsticos de la ingeniera, Estadstica
Problemas de examenes: Variables Aleatorias.

Problema 1
Consideremos una variable aleatoria bidimensional (X, Y ) con funcion de densidad conjunta:

si 1 x 1 y si 0 < y < 1
k x (1 y 2 )
f(X,Y ) (x, y) =
0
en otro caso.
a) Determinar el valor de la constante k para que f(X,Y ) (x, y) sea una funcion de densidad.
b) Calcular la funcion de densidad marginal de X y de Y. Son X e Y independientes?
c) Calcular la siguiente probabilidad condicionada Pr(0 < Y < 1|X 0.8).

Problema 2
II.3. La longitud, en metros, de los radios que fabrica una maquina es una variable aleatoria
X cuya funcion de densidad viene dada por
(
1/3 si 1/2 x < 2
f (x) = kx si 2 x 6
0
resto
Se pide:
1. Obtener el valor de la constante k.
2. Calcular la longitud media de los radios que fabrica dicha maquina.
3. Cual es la probabilidad de que los radios midan menos de 3 metros?

Problema 3
II.2- Consideramos un dado de tal manera que, con el experimento aleatorio tirar el dado,
la funcion puntual de probabilidad de la variable aleatoria X = n
umero obtenido, es
1
(x 3)2 , para x = 1, 2, 3, 4, 5, 6
38
y 0 en otro caso.

fX (x) = k

a) Calcular el valor de k.
b) Esta el dado trucado?
c) Represente graficamente fX . Si tienes que apostar por un n
umero, cual elegiras?
d) Se propone el juego siguiente: se apuesta 500 pts, se tira el dado y si sale par, se recupera la apuesta mas 100 pts, mientras que si sale impar, se pierde la cantidad apostada.
Merece la pena jugar?

30

Variables Aleatorias.

Problema 4
II.1- Con objeto de establecer un plan de produccion, una empresa ha estimado que la demanda
semanal es una variable aleatoria X cuya funcion de densidad viene dada por:

k(4x 2x2 ) si 0 x 2
f (x) =
0
en otro caso
donde x viene expresada en millones de unidades. Calcular:
(a) El valor de la constante k.
(b) La demanda esperada en una semana.
(c) El coste de producir x millones de unidades viene dada por C = 5X + 40 unidades
monetarias, cual sera el coste semanal esperado?
(d) La probabilidad de que la demanda semanal supere el millon y medio de unidades.

Problema 5
II.2.- La distribucion de estudiantes de secundaria en una comunidad autonoma es la siguiente:
sexo \ estudios Opcion B Opcion C Opcion A Opcion D
alumnos
12%
8%
21%
9%
alumnas
19%
9%
15%
7%
(a) Cual es la proporcion de alumnas entre los estudiantes de secundaria?
(b) Se escoge al azar un estudiante de secundaria en la comunidad y resulta ser alumna,
Cual es la probabilidad de que estudie la opcion C?.
(c) Introducimos las variables : X = sexo e Y = opcion escogida. Determinar las
distribuciones marginales de X y de Y. Son independientes las dos variables ?.

Problema 6
II.1.- La funcion de densidad de una variable aleatoria X, viene dada por la siguiente expresion:
(
kx 0 < x < 6
fx (x) =
0 en caso contrario
(a) Para que valor de k es fx (x) una funcion de densidad?. Hallar E[X]
(b) Calcular la funcion de densidad de la v. a. Y = 1/X,as como E[Y ].
II.2.- Sea (X, Y ) una variable aleatoria bidimensional discreta, cuya funcion puntual de probabilidad conjunta, viene dada por la tabla siguiente:

Y = 1
Y =0
Y =1

X = 1 X = 0 X = 1
1/8
1/8
1/8
1/8
0
1/8
1/8
1/8
1/8

Variables Aleatorias.

31

(a) Hallar las funciones puntuales de probabilidad marginal de X y de Y.


(b) Calcular el coeficiente de correlacion lineal entre X e Y. Se puede afirmar que son
independientes?. Justifica la respuesta.
(c) Determinar P (Y > 1/X > 1).

Problema 7
1. Una determinada empresa qumica esta interesada en comprar un dispositivo que mida
la concentracion de sosa en el producto y su PH. Los errores asociados a las mediciones
de dicho dispositivo pueden ser consideradas como dos variables aleatorias X e Y (X
=Error al medir la concentracion de sosa e Y =Error en la determinacion del PH)
cuya distribucion conjunta viene dada por:

si y [1, 1]

k[1 + xy(x2 y 2 )]
si x [1, 1]
f (x, y) =

0
en caso contrario
(a)
(b)
(c)
(d)

Calcular el valor de la constante k.


Calcular las distribuciones marginales de ambas variables.
Se pueden considerar independientes ambas variables?
Sabiendo que en un determinado producto el error que se comete al medir la concentracion de sosa es inferior a 0.5, calcular la probabilidad de que el error cometido
al medir su PH sea inferior a 0.5 (0.5).

Problema 8
II.2.- La funcion puntual de probabilidad de una variable aleatoria bidimensional discreta
(X, Y ) viene dado por:
Y
2
3
X
1
1/9
0
2
0
6/9
3
2/9
0
Obtener:
(a) Las funciones puntuales de probabilidad marginal de la X y la Y .
(b) Pr(X = 1/X + Y 4) y Pr(Y > 2/X > 1).
(c) E(X) y V ar(X).

Problema 9
1. Sea X una variable aleatoria continua con funcion de distribucion:

1 ex
si x > 0
F (x) =
0
si x 0

32

Variables Aleatorias.
(a) Calcular, la funcion de densidad asociada a dicha variable, su media y Pr(X > 2).
(b) Consideremos una nueva variable aleatoria Y de manera que la funcion de densidad
conjunta de ambas variables es:

y e(x+y)
si x > 0, y > 0
fX,Y (x, y) =
0
en otro caso.
Indicar de forma razonada si se puede considerar que ambas variables son independientes. En cualquier caso, calcular Pr(Y < 1|X > 2).

Problema 10
I.1.- Supongase que X e Y son variables aleatorias para las que:
E(X 2 ) = 5

V ar(X) = 4

V ar(X + Y ) = 10

Cov(X, Y ) = 2

(a) Calcular E(X) y V ar(Y ).


(b) Sea Z = 5X 3. Calcular E(Z) y V ar(Z).

Problema 11
1. La resistencia de un tornillo en gr/mm2 es una variable aleatoria con densidad:

1 kx 0 x 2
f (x) =
0
en otro caso
(a) Determinar el valor de la constante k as como la resistencia esperada.
(b) Calcular y representar su funcion de distribucion.
(c) Determinar la probabilidad de que un tornillo aguante mas de 1.5 gr/mm2 si para
1.0 gr/mm2 a
un resiste.

Problema 12
II.2 El porcentaje de contaminante presente en una muestra de aire es una variable aleatoria
con funcion de densidad dada por

f (x) =

a + bx2 0 < x < 1


0
en otro caso

1. Si E(X) = 3/5. Calcular el valor de a y b para que f sea funcion de densidad.


2. Calcular la probabilidad de que el porcentaje de contaminante en una muestra de
aire sea superior a 0.6.

Problema 13

Variables Aleatorias.

33

La resistencia de ciertos componentes electricos tiene una distribucion de probabilidad desconocida de media 200 Ohmios y desviacion tpica 1 Ohmio. Un tipo de circuitos esta formado
por tres de estos componentes independientes, de manera que la resistencia del circuito viene
dada por la suma de las resistencias de los componentes.
a) Cual sera la media y desviacion tpica de la resistencia del circuito?
b) Se consideran validos aquellos circuitos cuya resistencia se encuentre en el intervalo (590,610).
Que porcentaje maximo de circuitos defectuosos se fabrica?

Problema 14
La funcion de densidad de la variable aleatoria bidimensional (X, Y ) viene dada por:

kxy si 0 < x < y < 1
f (x, y) =
0 resto
a) Calcular el valor de k.
b) Calcular la probabilidad P (X < 0.5| Y = 0.5).
c) Son independientes X e Y ? Razona tu respuesta.

Problema 15
II.2 El tiempo de espera, en horas, entre corredores sucesivos detectados por un radar es una
variable aleatoria con funcion de distribucion:

F (x) =

0
x0
x/8
1e
x>0

1. Calcular la probabilidad de esperar menos de 12 minutos entre corredores sucesivos.


2. Calcular la funcion de densidad.
3. Un canal de television local se conecta en directo cada vez que un corredor pasa por
el puesto de control. Si el tiempo entre corredores sucesivos se rellena con publicidad
y supone una ganancia para el canal de 100000 ptas el minuto. Cual es la ganancia
que espera el canal entre las llegadas de dos corredores sucesivos?

Problema 16
II.1 Consideremos un dado que tiene dos caras con el n
umero uno, dos caras con el n
umero
dos y dos caras con el n
umero tres, de manera que, con el experimento aleatorio tirar
el dado, la funcion puntual de probabilidad de la variable aleatoria X =N
umero
obtenido, es

k 81 (x 1)2 , para x = 1, 2, 3
fX (x) =
0,
resto
1. Calcular el valor de k.

34

Variables Aleatorias.
2. Esta el dado trucado?
3. Si tienes que apostar por un n
umero, cual elegiras?
4. Se propone el juego siguiente: se apuesta 3 euros, se tira el dado y si sale impar,
se recupera la apuesta mas 2 euros, mientras que si sale par, se pierde la cantidad
apostada. Merece la pena jugar?

Problema 17
II.2 El rendimiento de un sistema informatico es una variable aleatoria X con funcion de
densidad
( 2
ax + b si 0 < x < 2
f (x) =
0
resto
1. Calcular el valor de las constantes a y b para que f (x) sea verdaderamente una
1
funcion de densidad sabiendo que la P r(1/2 < X < 1) = .
24
2. Calcular el rendimiento esperado del sistema informatico.

Problema 18
II.2 Sea X una variable aleatoria cuya funcion de densidad viene dada por X

kx +
si 0 < x < 2
6
f (x) =

0
resto
Se pide:
1. El valor de la constante k para que f (x) sea una funcion de densidad.
2. La funcion de distribucion de la variable aleatoria X.
3. El valor esperado de la variable aleatoria X.

Problema 19
II.2 La produccion de trigo por parte de una determinada region es una variable aleatoria X
cuya funcion de densidad viene dada por
(
k(x + 3)(2 x) si 0 < x < 2
f (x) =
0
resto
donde x se expresa en miles de toneladas. Se pide:
1. El valor de la constante k.
2. La probabilidad de que la produccion de trigo sea mayor de mil toneladas.
3. Si el beneficio B por cada mil toneladas producidas se obtiene como funcion de la
cantidad producida: B = 1000 + 5000X, cual sera el beneficio esperado?

Algunos modelos discretos y continuos.

35

Universidad Polit
ecnica de Cartagena
Dpto. Matem
atica Aplicada y Estadstica
M
etodos estadsticos de la ingeniera, Estadstica
Problemas de examenes: Algunos modelos discretos y continuos.

Problema 1
II.3 Despues de ser producida una se
nal s, con distribucion normal de media 12 y desviacion
tpica 0.5, entra en un dispositivo que la transforma en una se
nal saliente con solo tres
estados: 1, 0, y 1. La se
nal saliente sout toma el valor 1 si la se
nal entrante es menor
que 11.5, toma el valor 0 si la se
nal entrante esta comprendida entre 11.5 y 12.5, y toma
el valor 1 si la se
nal entrante es mayor que 12.5.
(a) Calcular la funcion puntual de probabilidad de la variable sout y su funcion de distribucion acumulada.
(b) Si se observan 1124 valores de la variable sout , cual es la probabilidad de que haya
mas de 800 ceros?
(c) Cual es en promedio el n
umero de valores no nulos en 1124 valores de sout ?

Problema 2
Una maquina consta de 3 componentes y el tiempo de vida de cada componente sigue una
distribucion exponencial de media 500 horas. La maquina funciona solo si funcionan sus 3 componentes (sistema en serie) y se supone que las componentes funcionan independientemente.
La poltica de mantenimiento consiste en sustituir todos los componentes simultaneamente cada
700 horas.
a) Cual es la probabilidad de que la maquina se avere en el intervalo comprendido entre dos
renovaciones?
b) Si han transcurrido 500 horas desde la u
ltima sustitucion de todos los componentes y la
maquina sigue funcionando, cual es la probabilidad de que la maquina se avere antes
de la siguiente renovacion?
La maquina de la que hablamos, fabrica piezas cuyas longitudes se distribuyen seg
un una
Normal de media 32 y desviacion tpica 0.3 milmetros, considerandose aceptables aquellas cuya
medida se encuentra dentro del intervalo (31.1, 32.6).
c) Cuantas unidades hay que inspeccionar por termino medio hasta encontrar 5 defectuosas?
d) Calcular la probabilidad de que un lote de 500 piezas contenga mas de 15 defectuosas.

36

Algunos modelos discretos y continuos.

Problema 3
1. La operatividad (en das) de un determinado tipo de explosivos tiene la siguiente funcion
de densidad:

0.3 e k si x > 0
f (x) =

0
en caso contrario
(a) Calcular el valor de k para que f (x) sea funcion de densidad.
(b) Calcular la probabilidad de que un explosivo deje de ser operativo antes de una
semana.
2. La capacidad de unos determinados envases sigue una distribucion Normal de media 100
cl y desviacion tpica 0.4 cl. Seg
un una norma de calidad, se consideran aceptables todas
aquellos envases cuya capacidad este comprendida dentro del intervalo (99, 101).
(a) Determinar el porcentaje de envases que cumplen la norma.
(b) Supongamos que los envases se empaquetan en lotes de 12 unidades, y un lote se
rechaza si contiene mas de 2 envases defectuosos. Determinar la proporcion de lotes
que se rechazaran.
(c) Un comprador decide comprar los envases a granel en cajas de 1000 unidades, pero no
aceptara aquellas cajas con mas de 50 envases defectuosos. Obtener la probabilidad
de que el comprador acepte una determinada caja.

Problema 4
El tiempo de operatividad (en das) de un determinado tipo de explosivos tiene la siguiente
funcion de densidad:
x

f (x) = 3 k e 7 si x > 0
a) Definir la variable aleatoria en estudio. Por la forma de su funcion de densidad, que
modelo de distribucion sigue?
b) Calcular el valor de k para que f (x) sea funcion de densidad.
c) Determinar la funcion de distribucion de la variable en estudio.
d) Calcular la probabilidad de que un explosivo deje de ser operativo antes de una semana.
e) Si han transcurrido 5 das desde su elaboracion y el explosivo esta operativo, cual es la
probabilidad de que el explosivo llegue operativo al da 12?

La empresa encargada de fabricar dichos explosivos tiene una produccion mensual de 1000
unidades, proporcionando un 5% de explosivos defectuosos.
f ) Cual es el n
umero medio de explosivos defectuosos fabricados en un mes?

Algunos modelos discretos y continuos.

37

g) Determinar la probabilidad de que en un mes se fabriquen mas de 30 unidades defectuosas.

Problema 5
III.1 La resistencia de ciertos componenetes electricos fabricados en un proceso es una v.a.
que sigue una distribucion Normal de media 36 ohmios y varianza 0.64 ohmios2 . Dicho
componente es defectuoso para montarlo en cualquier sistema cuando su resistencia es
menor de 35 ohmios. Se pide:
(a) Proporcion de componentes defectuosos.
(b) Se toma una muestra aleatoria de 400 de dichos componentes, probabilidad de que
hayan al menos 350 componentes no defectuosos?
(c) Un sistema acopla 2 componentes en serie, calcular la probabilidad de que el sistema
funcione. Y si se acoplan en paralelo?

Problema 6
III.1- Una empresa dispone de una envasadora automatica para su producto estrella : el zumo
de tomate. En la etiqueta del bote, el volumen especificado es 375ml. Si X denota el
volumen real de zumo contenido de un bote escogido al azar, lo deseable es (escoger de
manera razonada la opcion correcta)
2
a) X = 375, y X
lo mas grande posible
2
b) X = 375, y X
lo mas peque
no posible.
2
c)X = 375, y X negativo.
2
d) Da igual el valor de X
, lo importante es X = 375

III.2- En la elaboracion de un determinado medicamento en forma de comprimido intervienen


1 producto qumico cuya cantidad sigue aproximadamente una distribucion Normal de
media 3 grs. de desviacion tpica 0.05 grs.
(a) Calcular la probabilidad de que un comprimido pese mas de 3.025 grs.
(b) Un comprimido se considera defectuoso cuando su peso difiere de la media en mas
de 0.075 grs. Calcular la proporcion de comprimidos defectuosos que se fabrican.
(c) Estos comprimidos se envasan en cajas de 10 unidades. Si un envase contiene 2 o
mas comprimidos defectuosos se elimina del mercado. Determinar el porcentaje de
cajas que se retiran del mercado.
(d) Una farmacia hace un pedido de 100 cajas de dicho medicamento. Calcular la probabilidad de que en el pedido haya mas de 40 cajas no aptas para la venta.

Problema 7
III.- Estamos considerando interruptores electricos fabricados por dos marcas A y B.

38

Algunos modelos discretos y continuos.


(a) El tiempo de vida de un interruptor electrico de la marca A sigue una distribucion
exponencial de vida media 2 a
nos. Calcular la probabilidad de que falle a lo largo
del primer a
no.
(b) La probabilidad de que falle durante el primer a
no un interruptor de la marca B
es 0.25. Si se instalan 10 interruptores de esta marca en diferentes sistemas (no
conectados), calcula la probabilidad de que a lo sumo 2 de ellos fallen a lo largo el
primer a
no.
(c) Si instalamos ahora 100 interruptores de la marca B en diferentes sistemas (no conectados), calcula la probabilidad de que a lo sumo 30 de ellos fallen durante el primer
a
no.

Problema 8
III.1.- Una maquina A fabrica teclas cuadradas estandar de teclados de PCs, siguiendo la longitud de los lados una distribucion con media 12.5 mm y desviacion tpica 0.0025 mm.
Si alguna de las piezas difiere en mas de 0.005 mm de la media es rechazada, ya que
provocara un fallo en la cadena de montaje del teclado.
(a) Cual es, como maximo, el porcentaje de piezas defectuosas que fabrica la maquina
A.?
(b) Suponemos ahora que la distribucion de la longitud de los lados sigue una distribucion normal, hallar la probabilidad de que elegida una tecla al azar, fabricada
por la maquina A, esta sea defectuosa.
En la empresa, hay otra maquina B que tambien fabrica teclas similares, pero para esta
maquina, la proporcion de teclas defectuosas es igual a 1%. Cada maquina produce la
mitad de la produccion total.
(c) Cual es la probabilidad de que, escogiendo una tecla al azar entre la produccion,
resulte defectuosa?
(d) Se elige una tecla de cualquiera de las dos maquinas y resulta ser defectuosa Que
probabilidad tiene de haber sido producida por la maquina A?.
(e) Se sabe que los teclados contienen 100 de estas piezas que se escogen al azar entre
la produccion total. Son rechazados cuando alguna tecla es defectuosa, que
probabilidad tiene un teclado de ser rechazado?.

Problema 9
II.1.- La resistencia de ciertos componentes electronicos tienen una distribucion de probabilidad
desconocida, con = 200 y = 2 .Por motivos tecnicos se consideran validos solo
aquellos circuitos cuya resistencia se encuentre en el intervalo [195, 205] .
(a) Que porcentaje maximo de componentes defectuosos se fabrica?.
(b) Si suponemos ahora que la resistencia de dichos componentes sigue una distribucion
N ormal de media 200 y desviacion tpica 2 , determinar el porcentaje de componentes defectuosos que se fabrica. Comparar el resultado obtenido con el del
apartado (a).

Algunos modelos discretos y continuos.

39

(c) Un determinado tipo de circuitos contiene 2000 de dichos componentes. Determinar


la probabilidad de que haya mas de 30 defectuosos.

Problema 10
1. Una pieza esta formada por la union de cuatro partes cilndricas Las longitudes de cada
una de las partes se denotan por L1 , L2 , L3 , L4 . Suponemos que cada una de las variables
L1 , L2 , L3 , L4 sigue una distribucion normal de misma media 100mm y misma desviacion
tpica 1. Suponemos ademas que las cuatro variables son independientes. La pieza es
rechazada, si su longitud total difiere en mas de 4 mm de la media. Sabiendo que la
union de las cuatro partes que componen dichas piezas no admite superposiciones:
(a) Definir la variable aleatoria adecuada, as como su distribucion de probabilidad y
determinar el porcentaje de piezas que sera aceptado.
(b) Si las piezas se empaquetan en lotes de 100 u. Queremos garantizar al cliente que el
90% de los lotes no contiene mas de m piezas defectuosas. Determinar dicho n
umero
m. (Definir previamente la v.a. adecuada y su distribucion).

Problema 11
1. El contenido en calcio de la leche de un tetrabrik escogido al azar entre la produccion de
una empresa lactea sigue una distribucion desconocida de media = 1200mg y desviacion
tpica = 50mg.
Se considera que el tetrabrik cumple con las especificaciones del producto si su contenido
en calcio esta comprendido entre 1075mg y 1325mg.
(a) dar una cota para el porcentaje de tetrabriks en la produccion de la empresa que no
cumplen con las especificaciones.
Se supone ahora que la distribuci
on del contenido en calcio sigue una distribuci
on Normal de media = 1200 y desviaci
on tpica = 50mg.
b) Calcular el porcentage de tetrabriks en la produccion que no cumplen con las especificaciones.
c) Un supermercado compro 2000 tetrabriks a la empresa, cual es la probabilidad de
que haya mas de 30 tetrabriks en el lote que no cumplen con las especificaciones?

Problema 12
II.1.- La cantidad de almendra que contiene una nueva barra de helado se distribuye seg
un una
normal de media 60gr. y de desviacion tpica 2gr.. Se pide:
(a) Las barras de helado se ponen a la venta cuando su cantidad de almendra no difiere
en mas de 4 gr. de la cantidad media. Que porcentaje de ellas se ponen a la venta?

40

Algunos modelos discretos y continuos.


(b) Obtener la cantidad x para la cual el 33% de las barras tienen una cantidad de
almendra superior al valor x.
(c) Si las barras de helado se meten en cajas de 150 unidades, Cual es la probabilidad
de que en una caja contenga por lo menos 140 barras aptas para la venta?
(d) Encontrar una cota para la proporcion de defectuosos en el caso de que no conociesemos
la distribucion de probabilidad que sigue la cantidad de almendra por barra.

Problema 13
1. En una estacion agronomica se ha obtenido un tipo de semilla de maz de calidad extra
que germina en el 98% de los casos. Sabiendo que las semillas se distribuyen en bolsas,
(a) Defina la posible variable aleatoria asociada al estudio e indique su distribucion.
(b) Si las bolsas contienen 10 granos y cierta empresa las somete a un control de calidad,
en el que son desechadas si presentan mas de dos granos que no germinan. Defina
la variable de interes, y indique la probabilidad de que al escoger una bolsa al azar
no supere dicho control de calidad.
(c) Si las semillas se distribuyen en bolsas de 500 granos y se garantiza al cliente la
germinacion de un 96% de las semillas como mnimo. Cual es la probabilidad de
que una bolsa no cumpla la garanta?.
(d) Si en una caja introducimos 5000 granos. Cual es la probabilidad de que germinen
exactamente 4905 granos?.

Problema 14
1. La dimension de ciertas piezas sigue una distribucion normal de media 150 y desviacion
tpica 0.4. Sabiendo que se consideran aceptables todas aquellas piezas cuya longitud se
encuentre dentro del intervalo (1492 , 1504). Determinar:
(a) El porcentaje de piezas defectuosas.
(b) Supongamos que se empaquetan en paquetes de 12 unidades, y un lote se rechaza si
contiene mas de 3 defectuosas. Determinar la proporcion de lotes que se rechazaran.
(c) Un determinado comprador decide comprarlas a granel en cajas de 360 unidades,
pero no aceptara aquellas cajas con mas de 90 defectuosas. Que probabilidad
tenemos de que nos acepte las cajas?. Comentar los resultados obtenidos en los dos
u
ltimos apartados.

Problema 15
1. Una determinada empresa dedicada a la fabricacion de cemento-cola ha adquirido una
maquina de envasado. Seg
un los datos que le suministra el fabricante de la envasadora,
la cantidad que proporciona por bolsa es una variable aleatoria normal cuyo promedio
es de 2000 gramos y su desviacion tpica es de 50 gr. Por otro lado, el fabricante de las
bolsas en las que se que se empaqueta el producto le garantiza que el peso de las bolsas se
distribuye seg
un un modelo Normal de media 50 gr. y desviacion tpica de 5 gr. Sabiendo
que un saco de cemento-cola se considera defectuoso si su peso final es inferior a 1950 gr.,

Algunos modelos discretos y continuos.

41

(a) Determinar la proporcion de sacos defectuosos que producira con esta envasadora.
(b) Si los sacos se almacenan en pales de 500 unidades, determinar la probabilidad de
que un pale contenga mas de 20 sacos defectuosos. Cual es el n
umero de sacos
defectuosos esperado en cada pale?.
(c) Determinar un intervalo que contenga el 95% de los valores del la variable peso del
pale.

Problema 16
El valor de una determinada a se
nal s producida por un aparato sufre peque
nas perturbaciones que consideramos aleatorias.
II.1 (a) Que queremos decir con la expresion las perturbaciones son aleatorias? Introduce
la variable aleatoria conveniente.
(b) Decidimos modelizar la distribucion de los valores de la se
nal por una distribucion
Normal. Cual es, en tu opinion, el procedimiento que nos ha llevado a escoger este
modelo de distribucion para nuestra variable aleatoria? Que representan la media
y la desviacion tpica de esta variable aleatoria?
(c) Supongamos que la distribucion de los valores de s se puede aproximar por una distribucion normal con media 12 y desviacion tpica igual a 0.5. Cual es la proporcion
de los valores de la se
nal que estan comprendidos entre 11.75 y 12.25? y mayores
de 13? y mayores de 11?
(d) Entre los valores de la se
nal que son mayores que 12.5, cual es la proporcion de
valores que son mayores que 13?

Problema 17
II.1 El tiempo de vida (en horas) de un componente electronico viene determinado por la
siguiente funcion de densidad:

1
2ke 5 x si x > 0
f (x) =

0 resto
1. Calcular k y la funcion de distribucion acumulada asociada.
2. Que porcentaje de componentes de este tipo duran entre 2 y 10 horas?. Y mas
de un da?. Determinar la probabilidad de que un componente dure exactamente 1
hora.
3. Si se consideran 40 componentes del tipo anterior, obtener razonadamente la probabilidad de que la vida media de los 40 componentes este comprendida entre 2 y 10
horas.
4. El consumo electrico de cada componente es de 0.2 euros por hora de funcionamiento.
Un determinado sistema trabaja cada da con 40 componentes simultaneamente, sin
que exista reposicion tras el fallo. Si nos proponen una tarifa plana para el consumo
electrico de 50 euros al da, aceptara la oferta?

42

Algunos modelos discretos y continuos.

Problema 18
1. El tiempo de duracion de un ensamble mecanico en una prueba de vibracion sigue una
distribucion exponencial de media 400 horas. Entonces:
(a) Determinar la probabilidad de que el ensamble falle durante la prueba antes de 100
horas. Cual es la probabilidad de se produzca el fallo despues de 500 horas?.
(b) Si el ensamble se ha probado durante 400 horas sin fallo, determinar la probabilidad
de que falle antes de las 500 horas.
(c) Si durante el ensayo se han probado 10 ensambles de manera independiente, determinar la probabilidad de que falle al menos uno de ellos antes de 500 horas. Cual
sera la probabilidad de que fallasen todos transcurridas 800 horas?.
2. El diametro del punto producido por una impresora sigue una distribucion normal de
media 2 milipulgadas y desviacion tpica de 0.4 milipulgadas.
(a) Determinar entre que valores se encontraran el 95% de los diametros de los puntos
que produce la impresora. Podemos acotar dicha probabilidad, utilizando alguna
desigualdad, si no suponemos que su distribucion es normal?. Razona tu respuesta
(b) Determinar la probabilidad de que el diametro del punto este entre 1.4 y 2.6 milipulgadas.
(c) Si deseamos que el 95% de los puntos tengan un diametro comprendido entre 1.4
y 2.6 milipulgadas, determinar la desviacion tpica a la que deberamos ajustar la
impresora.

Problema 19
Se esta probando un nuevo conservante en un determinado producto alimenticio que se
comercializa por piezas. En el 75% de los casos se consiguio aumentar su duracion, en el 20%
no vario y en el 5% restante su duracion disminuyo.
1. Si se utiliza el nuevo conservante en 12 piezas, calcular la probabilidad de que i) 7 de ellos
tengan una duracion superior a la usual, ii) al menos 3 mejoren , iii) como maximo 3 de
las piezas tengan una duracion inferior a la usual .
2. Si se utiliza en 150 unidades, calcular la probabilidad de que mejoren su duracion i) entre
el 70 y el 75% de las piezas, ii) mas del 80%.
Se esta probando un nuevo pienso con determinados animales. En el 70% de los casos los
animales mejoran en peso, en el 20% no varan de peso y en el 10% pierden peso.
1. Si se administra el nuevo pienso a 10 animales, calcular las probabiliades de que i) 7
mejoren en peso, ii) al menos 3 mejoren en peso, iii) 4 sigan igual, iv) como maximo 3
pierdan peso.
2. Si se administra a 100 animales, calcular las probabilidades de que mejoren en peso i)
entre el 60 y el 65% de los animales, ii) mas del 80%.

Algunos modelos discretos y continuos.

43

Problema 20
1. En un proceso de fabricacion se elaboran dispositivos electronicos cuyos tiempos de vida
vienen determinados por una exponencial de media 1 hora. Los dispositivos se inspeccionan antes de ser exportados, considerandose defectuosos aquellos cuyo tiempo de vida
no supere los 12 minutos. Para ello, el responsable de control de calidad pone en funcionamiento cada uno de los dispositivos fabricados durante 12 minutos.
(a) Que porcentaje de dispositivos defectuosos se elaboran diariamente?
(b) Si un usuario adquiere un dispositivo que ha superado el control de calidad, cual
es la probabilidad de que falle antes de 12 minutos?
(c) Los dispositivos se comercializan en cajas de 300 unidades. Determinar la probabilidad de que en una caja se encuentren mas de 20 dispositivos con tiempo de vida
inferior a 12 minutos.

Problema 21
II Consideramos el experimento aleatorio: escogemos al azar un usuario del ascensor B y la
variable aleatoria T = Tiempo de espera en segundos. Decidimos que vamos a modelizar
la distribucion de los valores de T por una exponencial de parametro .
1. Basandonos en los valores del apartado I.1, cual debera ser aproximadamente el
valor de para que nuestro modelo ajuste satisfactoriamente los datos observados?
2. Suponiendo que T sigue una distribucion exponencial de parametro 0.008, calcula
las siguientes probabilidades: P(T 125), P(125 < T 250), P(250 < T 375)
y P(375 < T 500). Compara los resultados obtenidos con la tabla de frecuencias
de los datos observados. Confirman la adecuacion de nuestro modelo teorico a los
datos observados?
3. Suponiendo que T sigue una distribucion exponencial de parametro 0.008, calcula
la probabilidad de que un usuario tenga que esperar mas de 2 minutos. Si sabemos
que un usuario ya ha esperado 1 minuto, cual es la probabilidad de que espere otros
dos minutos mas?
III Los usuarios que tienen que esperar mas de 4 minutos renuncian a coger el ascensor y deciden subir andando. Si en una semana se suelen presentar unos 1000 usuarios para coger
el ascensor B, y suponiendo que el tiempo de espera en segundos sigue una distribucion
exponencial de parametro 0.008,
1. en promedio que n
umero deciden coger las escaleras despues de haber esperado
cuatro minutos?
2. Cual es la probabilidad de que, en una semana, mas de 100 usuarios renuncien a
coger el ascensor por haberse agotado su paciencia?

44

Algunos modelos discretos y continuos.

Problema 22
II.1 El 10% de las personas de una determinada poblacion padece glaucoma. Para personas
que padecen glaucoma, la medida de presion ocular X sigue una distribucion normal con
media 25 y varianza 1. Para personas que no tienen glaucoma la presion X se distribuye
normalmente con media 20 y varianza 1.
1. Si se selecciona una persona al azar Cual es la probabilidad de que al medir su
presion ocular se obtenga un valor mayor que 20?
2. Cual es la probabilidad de que esa persona padezca glaucoma?
3. Se realiza un estudio sobre la salud ocular de 100 individuos seleccionados al azar.
Cual es la probabilidad de que el n
umero de personas con glaucoma no exceda de
15?

Problema 23
En un gran almacen, el n
umero de clientes que llegan a una caja cada 15 minutos puede
modelarse como un proceso de Poisson de media 2.
a) Que distribucion sigue el n
umero de clientes que llegan a una caja cada hora? Justifica
tu respuesta.
b) Calcular la probabilidad de que, en una hora, lleguen al menos 8 clientes a una caja
determinada.
c) Calcular la probabilidad de que un individuo, situado en la cola de una caja, tenga que
esperar mas de 3 minutos hasta dejar de ser el u
ltimo.
d) Si el local mantiene abiertas sus 50 cajas durante una hora, determinar la probabilidad de
que al menos 10 de estas cajas reciban 8 clientes o mas.

Problema 24
La funcion de densidad de una variable aleatoria X viene dada por:
x
si 0 x 4
8
f (x) =

0 resto
Se generan secuencialmente valores de esta variable. Cuantos valores de X habra que generar
por termino medio hasta obtener un valor mayor que 3?

Problema 25
II.1 Los socios de una cooperativa agrcola cultivan naranjas. De las campa
nas anteriores, se
sabe que el 5% de las naranjas que llegan a la cooperativa no se puede utilizar para la
exportacion ya que su diametro es peque
no.

Algunos modelos discretos y continuos.

45

1. Calcular la probabilidad de encontrar 5 naranjas no destinadas a la exportacion


cuando inspeccionamos una muestra de 20 naranjas.
2. Hallar la probabilidad de que en 250 naranjas se encuentren entre 227 y 240 naranjas
que se pueden utilizar para la exportacion.
II.2 El tiempo de vida (en horas) de un componente electronico es una variable aleatoria X
con funcion de densidad
(
4ke0.2x
si x > 0
f (x) =
0
en el resto
1. Calcular el valor de la constante k y la funcion de distribucion asociada.
2. Que porcentaje de componentes de este tipo duran entre 2 y 8 horas? Determinar
la probabilidad de que un componente dure exactamente 1 hora.
3. Si se consideran de manera independiente 36 componentes del tipo anterior, obtener
razonadamente la probabilidad de que la vida media de los 36 componentes este
comprendida entre 2 y 8 horas.

Problema 26
II.1 Una determinada empresa dedicada a la fabricacion de abono ha adquirido una maquina
de envasado. Seg
un los datos que le suministra el fabricante de la envasadora, la cantidad
que proporciona por bolsa es una variable aleatoria normal cuyo promedio es de 2000 grs.
y su desviacion tpica es de 50 grs.. Por otro lado, el fabricante de las bolsas en las que
se empaqueta el producto le garantiza que el peso de las bolsas se distribuye seg
un un
modelo normal de media 50 grs. y de desviacion tpica 5 grs.. Sabiendo que un saco de
abono se considera defectuoso si su peso final es inferior a 1950 grs..
1. Si P denota la variable aleatoria peso final del saco de abono, traducir los datos del
enunciado sobre la distribucion de P .
2. Determinar la proporcion de sacos defectuosos que se producen.
3. Si los sacos se almacenan en pales de 500 unidades, determinar la probabilidad de
que un pale contenga mas de 20 sacos defectuosos. Cual es el n
umero de sacos
defectuosos esperado en cada pale?
II.2 El n
umero de visitas realizadas en un da entre semana en una determinada pagina web
se decide modelizar por una variable de Poisson de media 8. Se pide:
1. Cual es la probabilidad de que en un da se reciban mas de 4 visitas? Y entre 7 y
10 visitas (ambos incluidos)?
2. Cual es la probabilidad de que al escoger al azar una semana laboral (de lunes a
viernes), haya 3 das con mas de 4 visitas?

Problema 27

46

Algunos modelos discretos y continuos.

II.2 Un sistema esta formado por dos componentes independientes, A y B. El tiempo de vida de
la componente A, en miles de horas, es una variable aleatoria con funcion de distribucion
dada por:

5t
1

e
si t > 0
FA (t) =
0
resto
y el tiempo de vida de la componente B, es una variable aleatoria exponencial de media
6000 horas. Se pide:
1. La probabilidad de que la componente A funcione al menos 2000 horas. Idem para
la componente B.
2. Un sistema de este tipo se considera apto cuando al menos una de las dos componentes funciona por lo menos 2000 horas. Determinar la probabilidad de que el
sistema sea apto.
3. Estos sistemas se empaquetan en lotes de 1000 unidades. Determinar la probabilidad
de que al menos el 90% de ellos sean aptos.

Problema 28
II.2 La contaminacion de las plantas de una determinada zona de un ro puede ser debida
exclusivamente a dos causas independientes: la sal o el plomo. Se considera que una
planta esta contaminada de sal si su nivel de sales es superior a 7 y se sabe que el nivel de
sales en las plantas de la zona se distribuye seg
un una Exponencial de media 4 unidades.
La probabilidad de que una planta este contaminada de plomo es del 4%.
1. Si el experimento aleatorio consiste en elegir una planta de dicha zona al azar, interpretar los datos que se aportan en terminos de sucesos y probabilidades. Calcular
la probabilidad de que la planta este contaminada.
2. Calcular la probabilidad de que la planta este contaminada por plomo pero no por
sales.
3. Las plantas de la zona terminan secandose en un determinado lapso de tiempo con
las siguientes probabilidades:
0.09 cuando no estan contaminadas, y
0.8 cuando presentan alguno de los dos posibles contaminantes.
Interpretar esta nueva informacion en terminos de sucesos y probabilidades. Calcular
la probablidad de que una planta elegida al azar se seque. Si la planta se ha secado,
cual es la probabilidad de que haya sido por un nivel alto de contaminacion?
4. Si el investigador selecciona al azar una muestra formada por 8 plantas, cual es la
probabilidad de que al menos 2 de ellas se sequen? Y la que en una muestra de 100
el 75% de ellas no se sequen?
II.3 X es una variable aleatoria que sigue una distribucion normal de media = 4 y varianza
2 . Sabiendo que el 99.7% de los valores de X se encuentran entre 3.25 y 4.75, calcular
la varianza de X.

Problema 29

Algunos modelos discretos y continuos.

47

II.1 La memoria RAM para un ordenador se puede recibir de dos fabricantes A y B con igual
probabilidad. Si la memoria proviene del fabricante A, la probabilidad de que falle antes
del tiempo especificado por la garanta es P r(X 1) donde la variable X sigue una ley
exponencial de parametro = 0.2; si la memoria proviene del fabricante B, la probabilidad
de que falle antes del tiempo especificado por la garanta es P r(|Y | < 2) donde Y tiene
una distribucion normal de media = 4 y varianza 2 = 4.
1. Si el experimento aleatorio consiste en probar una memoria RAM hasta que falla,
traducir los datos del enunciado, introduciendo los sucesos convenientes.
2. Cual es la probabilidad de que una memoria RAM falle antes del tiempo especificado
por la garanta?
3. Si se ha observado que la memoria RAM ha fallado, cual es la probabilidad de que
proceda del fabricante A?
4. Si se tienen 100 memorias RAM, cual es la probabilidad de que al menos el 90% de
ellas duren mas que el tiempo especificado por la garanta?
II.3 El n
umero de partculas que emite una fuente radiactiva en un determinado periodo de
tiempo puede modelizarse por una distribucion de Poisson de media 2 partculas. Calcular:
1. Probabilidad de que se emitan mas de tres partculas en dicho periodo de tiempo
2. Si se observan 25 periodos de tiempos similares, cual es la probabilidad de que en
los 25 periodos se emitan mas de 3 partculas?

Problema 30
III.3 La duracion, en horas, de cierto componente electrico sigue una distribucion exponencial
de media y desviacion tpica igual a 80 horas.
1. Determinar la probabilidad de que la duracion de un componente difiera de su media
a lo sumo en dos desviaciones tpicas.
2. Se considera que un componente electrico es defectuoso si su duracion es superior a
160 horas. Se pide:
(a) Proporcion de componentes defectuosos que se producen.
(b) Si se toman 500 componentes electricos al azar, cual es la probabilidad de que
hayan exactamente 50 componentes defectuosos?

Problema 31
II.3 El n
umero de erratas por pagina en un libro de texto sigue una distribucion de Poisson
con una media de 0.2 errores.
1. Calcular la probabilidad de que en una pagina haya al menos una errata.

48

Algunos modelos discretos y continuos.


2. Si un libro se considera defectuoso para ponerlo a la venta cuando hay tres o mas
errores en 10 paginas del libro, cual es el porcentaje de libros defectuosos que se
ponen a la venta?
3. Si se examina un lote de 100 libros. Calcular la probabilidad de que el n
umero de
libros defectuosos sea inferior a 25.

Problema 32
El montaje de un eje se realiza a base de unir (sin superposiciones) dos piezas I y II.
La longitud de la pieza I sigue una distribucion normal de media 54 decmetros (dm.) y de
desviacion tpica 4 dm. La longitud de la pieza II sigue una distribucion normal de media
13 dm. y de desviacion tpica 3 dm. Supongamos que las dos piezas son variables aleatorias
independientes. El eje es correcto si su longitud total esta entre 55 y 78 decmetros.
(a) Cual es el porcentaje de ejes defectuosos que se fabrican?
(b) Si empaquetamos las piezas en lotes de 5 ejes, y se acepta un lote si no contiene mas de
un eje defectuoso, cual es la probabilidad de rechazar un lote?
(c) Si tomamos 1000 ejes al azar, cual es la probabilidad de que a lo sumo haya 35 ejes
defectuosos?

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

49

Universidad Polit
ecnica de Cartagena
Dpto. Matem
atica Aplicada y Estadstica
M
etodos estadsticos de la ingeniera, Estadstica
Problemas de examenes: Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

Problema 1
III.1 Hemos planteado un contraste de hipotesis bilateral sobre la media de una poblacion.
Despues de extraer una muestra de la poblacion, y calcular el estadstico adecuado resulta
que rechazamos H0 al nivel de 95% de confianza, pero que, si fijamos la confianza en 98%
no podemos rechazar H0 .
1. Cual sera nuestra decision con 90% de confianza?
2. Entre las opciones siguientes, indicar las correctas razonando la respuesta:
a) El p-valor es mayor que 0.1
b) El p-mayor es menor que 0.05.
c)El p-valor es menor que 0.02
d) El p-valor esta comprendido entre 0.02 y 0.1.
III.2 En la direccion http://dataservice.eea.eu.int/dataservice/, se pueden encontrar los datos
de emision de CO2 por fuentes fosiles para los distintos paises europeos entre los a
nos 1985
y 1997. Se indican a continuacion la diferencia D entre la emision de este contaminante
por Espa
na y la media europea de emision entre los a
nos 1990 y 1997.
A
no (X)
1990 1991 1992 1993 1994 1995 1996 1997
D
-2.1 7.89 20.33 10.27 22.98 33.41 16.66 38.91
( Megatoneladas)
Suponiendo que la variable D sigue una distribucion aproximadamente normal, se pide:
1. Construir detalladamente el intervalo de confianza al 95% de confianza para el promedio
de la variable D.
2. Plantear y llevar a cabo el contraste para contestar a la pregunta: Se puede afirmar que,
en estas condiciones, Espa
na contamina significativamente mas que la media de los pases
europeos?

Problema 2
1. Con el fin de determinar la temperatura de deflexion bajo carga de un tipo de tuberas de
PVC, se realizo un experimento consistente en tomar 12 de ellas anotando la temperatura
de deflexion observada (en 0 F). Los resultados fueron los siguientes:
Temp. Deflexion 206 188

205

187

194 193

207

185

189 213 192

210

Suponiendo que la temperatura de deflexion de las tuberas es una variable aleatoria


Normal:

50

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.


(a) Construir de manera detallada un intervalo de confianza al 95% para la temperatura
de deflexion promedio.
(b) Si en la estimacion anterior queremos cometer un error inferior a 2 0 F, determinar
el tama
no de la muestra mnimo necesario para garantizar este objetivo.
(c) Podemos afirmar que la temperatura media de deflexion de las tuberas es superior
a 196 o F?. Plantear un contraste para este estudio y tomar una decision en base a
los datos muestrales al 95% de confianza.
(d) Suponiendo que la varianza poblacional de la variable en estudio es conocida y
vale 100, determinar el p-valor del contraste anterior y discutir la conclusion que se
obtiene para los niveles de confianza 90%, 95% y 99%.

Problema 3
Una empresa dedicada a la fabricacion de material de construccion esta interesada en estudiar la conductividad termica de un tipo de ladrillos. Para ello, selecciono una muestra de 36
unidades de manera aleatoria, obteniendo una conductividad media de 0.343 y una desviacion
tpica muestral de 0.01. Suponiendo que los datos proceden de una distribucion Normal, responder a las siguientes cuestiones:
a) Construir, detalladamente, un intervalo de confianza al 95% para la conductividad media
de dicho tipo de ladrillos.
b) Que interpretacion tiene un intervalo de confianza al 95%?
c) Expresar el intervalo de confianza obtenido en el apartado (a) en la forma (valor estimado Error)
Son suficientes 36 ladrillos para cometer un error inferior a 0.01 en la estimacion de la
conductividad media?.
d) Un competidor afirma que la conductividad termica de esos ladrillos es superior a 0.340.
Plantear un contraste que nos permitira contestar a la afirmacion realizada anteriormente
y tomar una decision en base a los datos muestrales al 95% de confianza.
e) Determinar una cota inferior y una cota superior para el p-valor del contraste anterior y
discutir la conclusion que se obtiene para los niveles de confianza 90%, 95% y 99%.

Problema 4
III.1 Se desea construir un intervalo de confianza para la media poblacional de una distribucion
normal con desviacion tpica conocida. Se fija un margen de error maximo permitido
y se busca el tama
no muestral necesario para garantizar este margen de error con una
confianza de 95%. Para cada una de las afirmaciones siguientes, indicar cual es verdadera
o falsa, razonando la respuesta,
a) El tama
no muestral necesario aumentara si disminuye .
b) El tama
no muestral necesario disminuira si se fija una confianza de 99%
c) Si el margen de error permitido aumenta, el tama
no muestral necesario disminuye.
III.2. Una maquina de refrescos en un restaurante de carnes asadas se ajusta de modo que la
cantidad de bebida que sirva este distribuida de forma aproximadamente normal con una
media de 200 mililitros y una desviacion tpica de 15 mililitros.

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

51

1. La maquina se verifica diariamente con una muestra de nueve bebidas. Con el


calculo del contenido promedio, construir una grafica de control para este problema.
Cuando diremos que la maquina no opera de modo correcto?
2. Un da se obtiene que x = 211ml, admitiendo que = 15ml, construir un procedimiento de contraste para contrastar la hipotesis de que es efectivamente 200. (con
un nivel de significacion 5%)
3. Calcular la potencia de dicho contraste para una alternativa de = 215.

Problema 5
IV.1- Se quiere contrastar acerca de una poblacion normal la hipotesis nula siguiente : H0 :
= 120 frente a una alternativa bilateral. Antes de dise
nar el experimento, el ingeniero
decide evaluar la potencia del test planeado contra la hipotesis alternativa H1 : = 130.
a) Por que es importante conocer un valor aproximado de la potencia de un test antes
de realizarlo?
b) Para un valor de de 0.05, el ingeniero encuentra una potencia del 50%. Entre las
afirmaciones siguientes indica cuales son las correctas:
1)
2)
3)
4)

Aumentara
Aumentara
Aumentara
Aumentara

esta potencia si aumenta la desviacion tpica.


esta potencia si disminuye el n
umero de observaciones.
la potencia si se escoge H1 : = 140.
la potencia si se escoge = 0.1

IV.2- El peso medio de un ni


no nacido en USA es 3315 gramos. Sea X el peso al nacer de
un ni
no nacido en Espa
na. Suponiendo que X sigue una distribucion normal, queremos
contrastar la hipotesis de H0 : X = 3315, frente a la alternativa X < 3315 usando una
muestra de n = 30 ni
nos.
a) Construye la region crtica para un nivel de significacion = 0.05
b) Si se observa una media muestral para n = 30 ni
nos de 3189 y una desviacion tpica
muestral de 488 Que concluyes?
c) Con los datos del apartado anterior, construye detalladamente el intervalo de confianza
al 95% para X.

Problema 6
IV.1 Se realiza una medicion de una se
nal en un laboratorio, sabiendo que la desviacion tpica
de las medidas es = 10. El operador repite la medicion 5 veces y proporciona como
valor de la se
nal la media x de sus 5 mediciones.
(a) Cual es la desviacion tpica de los resultados proporcionados?
(b) En que sentido es mejor repetir varias veces la medicion y proporcionar la media
de los valores obtenidos, y no solo realizar una u
nica medicion?

52

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

IV.2- Si se plantea una hipotesis nula acerca de una poblacion y sabemos que es rechazada a
un nivel de confianza del 95%. Entre las afirmaciones siguientes indica cuales son las
correctas:
a) Siempre sera rechazada al 99% de confianza.
b) Puede no ser rechazada al 99% de confianza.
c) Tambien sera rechazada al 90% de confianza
d) Nunca sera rechazada al 90% de confianza.
IV.3- Dos disciplinas de cola para servicio de CPU han sido propuestas por dos dise
nadores de
sistemas operativos. Para compararlas se instalaron en dos maquinas test iguales y se
midieron los tiempos de espera en cada una de ellas de 8 tareas aleatoriamente elegidas:
A
B

2.41 6.50 3.29 1.22 2.59 2.81 5.35 1.78


2.30 5.86 3.71 1.10 2.34 2.24 5.00 1.95

(a) Realizar, en una misma grafica, los diagramas de caja-bigotes de cada una de las
variables. Que informacion se puede deducir de esta grafica para comparar las dos
disciplinas de cola?
(b) Suponiendo que la distribucion que sigue cada variable se puede aproximar por una
Normal, calcular el intervalo de confianza para la diferencia entre el tiempo promedio
de espera con la disciplina A y el tiempo promedio de espera con la disciplina B.
Comparar los resultados obtenidos con el apartado anterior.

Problema 7
IV.1- Se realiza una encuesta para conocer la proporcion de espa
noles que piensan que su
seleccion va a ganar la Eurocopa. Para ello, se escoge una muestra, y el resultado es
(antes del partido contra Noruega) 60% mas o menos 3 puntos, con un nivel de confianza
de 95%. Por que no se puede afirmar sin mas que la proporcion de espa
noles que piensan
que su seleccion va a ganar la Eurocopa es de 60%? Explica lo que significa con un
nivel de confianza de 95%.
IV.2- Se esta investigando el tiempo de secado de una pintura tapaporos. Por estudios anteriores, se sabe que la distribucion de los tiempos de secado es aproximadamente normal
con una desviacion tpica de 8mn. Se dise
na un experimento en el que se mide el tiempo
de secado para 10 cuadrados pintados, y se encuentra una media de 121minutos (mn).
(a) Construir detalladamente un intervalo de confianza al 95% de confianza para el
tiempo promedio de secado de la pintura.
(b) Se puede afirmar al 95% de confianza que el tiempo promedio de secado es mayor
de 115mn? Calcular el p-valor asociado a la prueba.
(c) Cuantos cuadrados pintados deberan probarse en el experimento si queremos asegurarnos que, con una confianza de 95%, el margen de error cometido no sera mayor
que 4mn?
(d) Planeamos contrastar, con 95% de confianza y una muestra de 10 cuadrados pintados,
la hipotesis de que el tiempo promedio de secado es igual a 115mn. Cual es la
potencia del test contra la alternativa = 120 ? Te parece suficiente? Como se
podra mejorar?

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

53

Problema 8
IV.1.- Un estudiante lee un artculo donde se afirma que un intervalo de confianza al 95% para
la altura media de los espa
noles mayores de 18 a
nos es [1.66, 1.72]. Se le pregunta por el
significado de esta afirmacion y contesta que quiere decir que el 95% de los espa
noles tiene
una altura comprendida entre estos dos n
umeros. Crees que su respuesta es correcta?
Razonalo.
IV.2.- Para calibrar un instrumento de medicion, se mide repetidas veces un patron cuyo peso
sabemos igual a 10 gramos. Los valores medidos siguen una distribucion normal de media
desconocida. En cambio, por estudios anteriores sabemos que podemos considerar la
desviacion tpica igual a 0.0002 gramos.
(a) Que representa la media poblacional de los valores medidos? Que valdra esta si
el instrumento de medicion fuera perfecto?
(b) Se mide el patron cinco veces. La media de las cinco mediciones es igual a 10.0023
gramos. Construir de manera detallada un intervalo de confianza para la media
poblacional al 98% de confianza.
(c) Cuantas mediciones debemos realizar para conseguir con la media muestral un
margen de error de 0.0001 con 98% de confianza?
(d) Queremos determinar si nuestro aparato de medicion sobrevalora o infravalora el
peso real. Plantea el contraste de hipotesis correspondiente y llevalo a cabo con los
datos del apartado (b).

Problema 9
IV.1.- Que es un estimador puntual de un parametro? Que propiedades tiene un buen estimador? Dar ejemplos.
IV.2.- Para comparar dos programas de digitalizacion de letra impresa, se sometio cada uno a
50 pruebas. El primero cometio 4 fallos y el segundo 6 fallos.
(a) Definir la(s) poblacion(es), y los parametros de interes.
(b) A partir de los datos suministrados por las muestras, puede afirmarse que el primero
es significativamente mas fiable que el segundo?. Realizar el contraste para dos
niveles de significacion distintos. Comentar los resultados obtenidos.
(c) Construir detalladamente, con los datos anteriores, el intervalo de confianza correspondiente.
(d) Determinar el tama
no mnimo requerido de la muestra, correspondiente a cada uno
de los programas, si se quiere que el error para ambas estimaciones no exceda de
0.05, con una probabilidad de 0.95.

54

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

Problema 10
III.1.- Se analizan dos catalizadores para determinar la forma en que afectan el rendimiento de
un proceso qumico. El catalizador 1 es el que se viene empleando en la fabrica y se
quiere averiguar si se puede sustituir por el catalizador 2, mas barato, pero que, seg
un el
fabricante, no provoca un descenso del rendimiento. Se llevan a cabo 8 reacciones para
cada uno de los catalizadores obteniendo, para el catalizador 1 x1 = 92.25, y S12 = 5.69
mientras que para el catalizador 2 : x2 = 92.73, y S22 = 8.90. Se suponen normales las
variables de interes.
(a) Definir la(s) poblacion(es), la(s) variable(s), los parametros de interes.
(b) Podemos suponer, a partir de los datos que las varianzas de las dos variables son
iguales?
(c) Basandose en los datos obtenidos, es cierto que no se puede afirmar que el rendimiento
medio del catalizador 2 es menor que el rendimiento medio del catalizador 1? Es
aconsejable realizar el cambio de catalizador?

Problema 11
III.2.- Una determinada empresa de material fungible puede adquirir los cartuchos de toner
de impresora de dos proveedores distintos. Con el fin de determinar a que proveedor
comprar se toma una muestra de tama
no 12 de cada uno de los proveedores obteniendo
los siguientes resultados (n
umero de hojas impresas):
P roveedor A
P roveedor B

Media muestral
5459
5162

Cuasivarianza muestral
33703
199928

Si suponemos que las poblaciones son normales con varianzas iguales:


(a) Construir un intervalo de confianza para la diferencia entre el n
umero medio de hojas
que imprime el cartucho de cada proveedor. (tomar = 0.05).
(b) Razonar que tipo de contraste se debe de realizar con el fin de decidir a que proveedor
comprar y realizar dicho contraste. (tomar = 0.05).
(c) Si se desea construir un intervalo de confianza para la duracion media del P roveedor
B, calcular cual debe de ser el tama
no de la muestra con el fin de que el error que
se comete sea inferior a 100 hojas. (tomar = 0.05)

Problema 12
1. Teora.
(a) Definir lo que se entiende por estimador de un parametro poblacional.
(b) Que es un estimador insesgado? Pon un ejemplo.
(c) Que estimador utilizamos para la varianza poblacional? Argumenta tu respuesta.

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

55

2. En una planta piloto de produccion de arroz, se estudia la influencia de la temperatura


sobre la proporcion de granos que germinan.
(a) Se colocan 5000 granos en las condiciones de germinacion, con una temperatura de
20o C y se observa que germinan 2326 granos. Construir un intervalo de confianza
al nivel de 95% para la proporcion de granos que germinan si estan sometidos a una
temperatura de 20o C.
(b) Se apartan ahora otros 5000 granos sometiendolos a una temperatura de 30o C y se
observa que germinan 2402 granos. Razona que tipo de contraste se debe realizar
para determinar si la proporcion de granos que germinan es mayor con una temperatura de 30o que con una temperatura de 20o . Realiza este contraste al nivel de
90%, 95% y 99% Cual es tu conclusion?

Problema 13
1. En una finca, en el momento de la maturacion, se quiere estudiar la cantidad media de
uva por pie de vi
na. Si se supone normal la v.a de interes ,
(a) Definir la variable y la poblacion sujetas a estudio.
(b) Se quiere construir un intervalo de confianza al 95% para la cantidad media de uva
por cepa, cual es el tama
no muestral necesario para que el error cometido sea menor
que 0.5 kg? (en un estudio realizado en una situacion parecida en a
nos anteriores,
se estimo la varianza poblacional a 2kg ).
(c) Se toma una muestra de 30 cepas, y se obtiene, para esa muestra, una cantidad
media de uva por cepa de 4.7kg con una cuasidesviacion tpica de 1.4kg. Construir
un intervalo de confianza al nivel de 95% para la cantidad media de uva por cepa en
la finca.
(d) El empresario quiere determinar si la cantidad media de uva producida por cepa en
la finca es mayor que 4kg. Razonar el tipo de contraste adecuado para ese proposito
y realizarlo. (Tomar = 0.05)

Problema 14
III.2.- Un taller acaba de recibir una maquina nueva y busca ajustarla correctamente.
Seg
un el tecnico vendedor de la maquina, la maquina esta ajustada para que no produzca
mas de 4% de piezas defectuosas.
(a) El taller decide tomar una muestra y estimar la proporcion de defectuosos producidos por la maquina considerando que la proporcion de defectuosos indicada por el
fabricante es correcta. Si quiere cometer un error en la estimacion de la proporcion
menor de 0.05, cual es el tama
no de la muestra que debe tomar? (tomar = 0.05).
(b) Al tomar una muestra de 50 piezas producidas, encuentra 4 defectuosas, hallar el
intervalo de confianza al nivel de 95% para la proporcion poblacional de defectuosos.
(c) La empresa no puede permitirse un nivel de defectuosos mayor de 5%. Razonar
que tipo de contraste se debe de realizar con el fin de determinar si la maquina se
encuentra mal ajustada, y realizar dicho contraste. (tomar = 0.05).

56

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

Problema 15
1. Para ensayar los efectos de un nuevo fertilizante sobre la produccion de trigo, una parcela
de terreno se dividio en 175 cuadrados de areas iguales, todas ellas tenan identicas caractersticas de suelo, exposicion a la luz del sol, etc. El nuevo fertilizante se aplico a 75
de estos cuadrados y el antiguo a los restantes. El n
umero medio de fanegas de trigo
cosechadas por cuadrado en los que se utilizo el fertilizante nuevo fue de 12,30 con una
cuasidesviacion tpica de 1,20 fanegas. La media y cuasidesviacion tpica correspondiente
a los otros cuadrados fueron 11,90 y 0,90 respectivamente. Suponga que las poblaciones
son normales con igual varianza. Se pide:
(a) Defina las variables y las poblaciones que se estan sometiendo a estudio. Indique la
informacion suministrada por las muestras, as como los parametros de interes.
(b) Despues de haber planteado las hipotesis adecuadas, indicado el error de tipo I y
determinado la region de rechazo, determine si se puede afirmar al 99% de confianza
que el nuevo fertilizante mejora la produccion de trigo. Y al 95%? Razonese. Indique si existe alg
un nivel de confianza que nos lleve a decir que no existen diferencias
significativas entre el fertilizante nuevo y el tradicional.

Problema 16
1. Para determinar el contenido exacto de carbonato de calcio de una caliza, se realizan, en
las mismas condiciones, 5 mediciones y se obtiene los resultados siguientes:
49.56%, 49.82%, 49.30%, 50.16%, 50.06%
Se supone que el valor medido se puede expresar como [CaC03 ]pob + , donde [CaC03 ]pob
representa el valor exacto (no observable) y el error que se comete durante la medicion.
Suponiendo que sigue una distribucion normal de media 0 y de varianza desconocida
2.
(a) Determinar la distribucion del valor medido del contenido de carbonato de calcio.
En particular, podras dar una estimacion de su promedio?
(b) Construir un intervalo de confianza al nivel de 90% para el contenido exacto promedio
de carbonato de calcio de la caliza.
(c) Si se desea cometer como maximo un error de 0.2 con una confianza del 95%, cuantas
mediciones mas deberamos realizar?.

Problema 17
1. Con el fin de determinar si existen diferencias entre dos proveedores de una determinada
materia prima se tomaron sendas muestras (120 para uno de los proveedores y 80 para
otro) y se sometieron a cambios extremos de temperatura. La siguiente tabla muestra el
resultado del experimento:
Deformados
Intactos

Proveedor A
41
79

Proveedor B
27
53

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

57

(a) Obtener de manera teorica el procedimiento estadstico completo que nos proporciona respuesta a la siguiente pregunta: Podemos establecer que el comportamiento
de los materiales suministrados por ambos proveedores funcionan de igual manera
cuando son sometidos a cambios extremos de temperatura?.
(b) Dar respuesta a la cuestion anterior y determinar el p-valor correspondiente.

Problema 18
II.2 Queremos ahora medir la se
nal s con un aparato de medicion. Sea X la variable aleatoria valor proporcionado por el aparato al realizar una medicion y la variable error
cometido por el aparato al realizar una medicion. Consideramos que sigue una distribucion normal con media 0 y desviacion tpica 0.4 independiente de s.
(a) Cual es la relacion entre s, X y ?
(b) Cual es la media y la desviacion tpica de X? Cual es la distribucion de los valores
de X?
(c) Se planifica realizar varias mediciones y proporcionar su media para aproximar la
se
nal. Cuantas mediciones habra que realizar para que nos aseguremos con una
probabilidad mayor o igual a 0.95 que el valor proporcionado no se alejara en mas
de 0.1 unidades de la se
nal promedio?

Problema 19
III Con el fin de determinar la velocidad de transmision en dos servidores de la universidad,
decidimos descargar un fichero de 2Mb de cada uno de ellos y anotar el tiempo necesario
para la descarga. Los resultados(en seg.) que se obtuvieron vienen dados en la siguiente
tabla:
Serv. 1
Serv. 2

5.89 4.60
4.06 4.2

5.42
4.92

5.38
3.82

6.07 7.4 3.88


4.57 4.11 443

5.03
5.11

5.27
5.02 3.25 5.822 5.053

Si suponemos que la variable Tiempo de descarga de ficheros de 2 Mg sigue una distribucion normal:
(a) Determinar un intervalo de confianza para el tiempo promedio de descarga de cada
uno de los servidores. En funcion de los resultados obtenidos, podemos pensar que
la velocidad promedio es la misma desde ambos servidores?. Razona tu respuesta
(b) Plantear un contrate para la hipotesis anterior, determinando el estadstico del contraste, su distribucion asociada as como la region crtica para un valor generico.
(c) Realizar el contraste a partir de los valores propuestos en la tabla y decidir en funcion
del p-valor obtenido.

58

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.


(d) Suponiendo que la varianza asociada a la variable Tiempo de descarga del servidor
2 es 0.62 , determinar que tama
no de la muestra sera necesario utilizar para estimar
el tiempo promedio de descarga real desde este servidor con un error menor que 0.2
seg (tomar =0.05)
(e) En ning
un caso la universidad aceptara que el tiempo de descarga de uno de estos
ficheros fuese superior a 6.3 segundos. Sabiendo que la varianza asociada a la variable
Tiempo de descarga del servidor 1 es conocida (=1),podemos afirmar que este
servidor cumple este requisito?. (tomar =0.05)
(f) Determinar la potencia del contraste anterior si el tiempo promedio real de dicho
servidor para este tipo de ficheros fuese de 5.8 seg.

Problema 20
En un laboratorio se investiga el contenido (en %) en fibras de un determinado alimento.
La distribucion de los valores obtenidos se puede considerar normal.
III.1 Por un estudio preliminar, se considera que la desviacion tpica de los valores obtenidos
se puede fijar en 1.2%.
1. Introducir la variable aleatoria, la poblacion y el parametro de interes. Traducir los
datos del enunciado en cuanto a la distribucion de la variable.
2. En estas condiciones, cuantas mediciones habra que repetir para conseguir, con
una confianza del 95%, un margen de error de 1% a la hora de realizar un intervalo
de confianza para el contenido real en fibras del alimento?
3. Por otra parte se quiere probar, con un nivel de confianza del 95%, si el contenido
en fibras es mayor de 12%. Plantea las hipotesis nula y alternativa adecuadas.
Queremos ser capaces con una probabilidad mayor o igual a 0.8 de detectar cuando
el contenido es en realidad igual a 13, sera suficiente con realizar 10 mediciones? Si
no fuera suficiente, que sugieres que hagamos?
III.2 Despues de planificar el experimento se decide que se van a tomar 10 mediciones. Un
operario lleva a cabo estas 10 mediciones y encuentra que su media es igual a 12.35 y su
desviacion tpica 1.3.
1. Decidimos NO utilizar el valor de que se tena en el apartado anterior sino utilizar
la desviacion tpica calculada a partir de los datos. Construir de manera detallada
el intervalo de confianza para el contenido real en fibras basandose en los datos
obtenidos.
2. Llevar a cabo el contraste para probar si el contenido real es significativamente mayor
de 13.
3. Proporciona una cota superior para el p-valor asociado al contraste anterior. Intenta
dar una cota inferior tambien.
III.3 Otro operario realiza otro da 5 mediciones mas con el misma alimento y encuentra para
estas 5 mediciones una media igual a 12.5 y una desvacion tpica igual a 1.5. Llevar a
cabo el contraste para probar si el operario influye en el resultado de la determinacion
del contenido en fibras.

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

59

Problema 21
1. Un estudio demostro que los tiempos de vida de cierta clase de bateras de automovil se
distribuye normalmente. Con el fin de estudiar su duracion, se considero una muestra
formada por 10 bateras, obteniendose las siguientes duraciones observadas:
1456, 1478, 1467, 1350, 1460, 1376, 1410, 1330, 1421, 1423
(a) Obtener una estimacion puntual y un intervalo de confianza al nivel de confianza del
90% para la media de la poblacion.
(b) Cual es el efecto de un incremento del tama
no muestral sobre el intervalo de
confianza? Y del nivel de confianza?
(c) Determinar el tama
no muestral necesario para reducir a la mitad el error de muestreo
del intervalo de confianza obtenido en el apartado anterior. Razona tu respuesta.
(d) El fabricante afirma que su duracion en promedio es superior a 1450 horas. Con
los datos que tenemos, podemos probar dicha afirmacion?. Responder de manera
razonada a la cuestion anterior indicando el procedimiento estadstico utilizado.
(e) Determinar el p-valor asociado al contraste que se puede plantear para dar respuesta
a la pregunta anterior.

Problema 22
1. Se realizan mediciones de la concentracion en g/l de un determinado compuesto en una
solucion. Denotamos por X la variable Valor obtenido en una medicion realizada al
azar.
(a) Por que es X una variable aleatoria? Que es mejor, que la varianza de X sea
grande o peque
na?
Suponemos a partir de ahora que se puede modelizar la distribucion de X por una distribucion Normal con media desconocida, y con varianza 4.2.
(b) En que unidades se expresan la media y la varianza de X?
Se realizan 8 mediciones de la concentracion de un determinado compuesto obteniendose
los siguientes datos:
5.3, 4.2, 7.2, 6.3, 5.5, 6.5, 4.8, 5.1
(c) Construir detalladamente un intervalo de confianza al 95% para el centro de la
distribucion de X. Que interpretacion tiene un intervalo de confianza?
(d) Se puede afirmar que el valor de la concentracion es menor que 6? Llevar a cabo el
contraste de forma detallada.
(e) Calcular el p-valor del contraste anterior.
(f) Calcular la potencia del test contra la alternativa = 5. Que representa la potencia? Se trata de un valor suficiente?

60

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

Problema 23
V Para el problema de los ascensores del Hospital de Marina, la media muestral y la desviacion
tpica muestral calculadas a partir de los datos originales son t = 125.6 segundos y st = 112
segundos. Utilizando los datos recogidos como muestra, queremos hacer inferencia sobre
el tiempo promedio de espera de un usuario, si nos limitamos a considerar el ascensor B.
1. Por la forma del histograma sabemos que la distribucion de los valores de T sigue
mas bien una distribucion exponencial. Cual es la hipotesis sobre la distribucion
de los valores de la variable de interes en la poblacion que se ha hecho en clase
para obtener los intervalos de confianza y los contrastes para la media poblacional?
Por que podemos seguir utilizando estos mismos intervalos y contrastes aunque la
distribucion de T sea exponencial?
2. Construir detalladamente el intervalo de confianza al 98 % de confianza para la
media poblacional del tiempo de espera para el ascensor B, para un usuario.
3. Llevar a cabo el contraste para decidir si el tiempo promedio de espera para el ascensor B es significativamente mayor al 95% de confianza que 1 minuto y 45 segundos.
4. Cual sera nuestra decision si trabajamos al 90% de confianza? y al 99% de
confianza?
5. Dar una cota inferior y una cota superior para el p-valor asociado al contraste del
apartado anterior.

Problema 24
III.1 Se plantea un contraste de hipotesis bilateral para la media de una poblacion normal
con varianza conocida. Despues de extraer una muestra de la poblacion y calcular el
estadstico adecuado, resulta que se rechaza H0 al 90% de confianza y que no podemos
rechazar la hipotesis nula al 98% de confianza.
1. Con la informacion disponible, se puede tomar alguna decision al 95% de confianza?
Razonar la respuesta.
2. Indicar si las siguientes afirmaciones son verdaderas o falsas, razonando la respuesta.
2.1. p valor 0.05.
2.2. p valor < 0.02.
2.3. 0.02 < p valor 0.1.
III.2 Una empresa de construccion esta interesada en investigar si sus empleados cumplen
el horario de descanso vespertino convenido, que es de 20 minutos. Para ello realiza
un seguimiento a 50 empleados seleccionados aleatoriamente observando el tiempo en
minutos que tardan los empleados en reincorporarse a su puesto de trabajo. Los datos
obtenidos son los siguientes:
x = 20.483

s2 = 9.546

1. Existe alguna razon para creer a un nivel de significacion del 5% que los empleados
tardan por termino medio mas del descanso permitido?

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

61

2. Construir un intervalo de confianza para el tiempo medio de descanso vespertino al


nivel de confianza del 98%. Que factores influyen en la amplitud de un intervalo de
confianza? En que se traduce un aumento o una reduccion de la amplitud de un
intervalo de confianza?
3. Calcular el tama
no muestral necesario para reducir a la mitad el margen de error del
intervalo de confianza obtenido en el apartado anterior si se supone que la desviacion
tpica poblacional es de 9.

Problema 25
a) Una empresa lleva trabajando con el mismo sistema de produccion durante varios a
nos y
se sabe que su rendimiento diario sigue una distribucion normal de varianza 4. El gerente
de la empresa desea estudiar si el rendimiento promedio de su sistema ha disminuido con
respecto al valor inicial que era de 80. Para ello, anota el rendimiento que proporciona
su sistema durante 16 das, obteniendo un rendimiento medio de 79.3.
a1) Realizar detalladamente un contraste para el estudio anterior. Determinar el
p-valor del contraste y discutir la conclusion que se obtiene en funcion del p-valor.
a2) Si el rendimiento medio autentico fuera de 79, te parece adecuado el test anterior
para detectar esta alternativa con una confianza del 95%? En caso negativo indicar
que haras para mejorarlo.
a3) Cuantos das debera durar el estudio para poder detectar la alternativa del apartado
anterior en un 90% de los casos?
b) Una multinacional ofrece al gerente de la empresa dos nuevos sistemas de produccion. En
un estudio realizado, se obtuvo que el rendimiento medio
del Sistema I durante 32 das
fue de 82.3 con una cuasi-desviacion tpica muestral de 8, mientras que el rendimiento
medio del Sistema II durante 25 das fue de 81 con una cuasi-desviacion tpica muestral
de 2. Se supone que los rendimientos de ambos sistemas son Normales.
b1) Construir, detalladamente, un intervalo de confianza al 95% para el rendimiento
promedio del Sistema II. Que interpretacion tiene el intervalo obtenido? Cuantos
das debera durar el estudio para cometer un error inferior a 0.5 en la estimacion
del rendimiento medio?.
b2) Se puede afirmar que los rendimientos medios de los dos nuevos sistemas son
iguales? Discutir en funcion del p-valor.

Problema 26
Para comparar la eficiencia de dos compiladores de Pascal, se seleccionaron al azar 10
programas y se ejecutaron con cada uno de los compiladores. Los tiempos de ejecucion, en
segundos, vienen dados en la siguiente tabla:
Programa
1
2
3
4
5
6
7
8
9
10 x
s
Compilador I 4.2 4.7 4.6 3.8 2.7 3.6 4.2 4.5 3.9 4.1 4.03 0.58
Compilador II 4.3 3.9 3.3 3.5 2.7 3.1 3.3 4.7 4.2 3.7 3.67 0.61
a) Que distribucion sigue el tiempo empleado por cada compilador? Seg
un los datos proporcionados, se trata de muestras procedentes de variables independientes?.

62

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

b) Construir detalladamente un intervalo de confianza al 98% para el tiempo medio de


ejecucion del compilador I.
c) Contrastar al 95% de confianza la hipotesis de que los tiempos de ejecucion de ambos compiladores son iguales, respondiendo a su vez a las siguientes cuestiones: Que distribucion
sigue el estadstico del contraste? Por que?
d) Se desea estudiar si el contraste anterior permite detectar de forma aceptable el caso de
que el tiempo promedio de ejecucion del Compilador I supere al del Compilador II en
0.05 segundos. Resolver este apartado suponiendo que la distribucion de los tiempos de
ejecucion son Normales y que la desviacion tpica de la diferencia de tiempos de ejecucion
es conocida e igual a 0.2.

Problema 27
En un laboratorio se realizan mediciones de la cantidad (en partes por millon, ppm.) de impurezas que hay en el aire lquido. La distribucion de los valores obtenidos es aproximadamente
normal de media desconocida.
III.1 Por un estudio preliminar, la desviacion tpica de los valores obtenidos puede fijarse en
0.07 ppm.
1. Introducir la variable aleatoria y el parametro de interes. Traducir los datos del
enunciado en cuanto a la distribucion de la variable aleatoria.
2. Se decide tomar 6 mediciones y obtenemos una media muestral de 1.05 ppm. Construir de manera detallada un intervalo de confianza para la media poblacional al
95% de confianza. Interpretar el resultado obtenido.
3. Calcular el tama
no muestral para conseguir, con una confianza del 95%, reducir a
la mitad el margen de error del intervalo obtenido en el apartado anterior. Cual es
el efecto de un incremento del tama
no muestral sobre el intervalo de confianza? Y
del nivel de confianza?
III.2 Supongamos que el investigador responsable del experimento desconfa del estudio preliminar por lo que decide no utilizar que se tena en el apartado anterior, sino estimarla a
partir de los datos muestrales. Cual sera el estimador puntual de 2 ? Si en estas nuevas
condiciones queremos construir un intervalo de confianza para la media poblacional cual
sera la diferencia con el obtenido en (2) del apartado anterior?

Problema 28
III.1 Cuando una maquina esta bien ajustada, produce piezas un 1% de piezas defectuosas.
Para controlar que la maquina sigue bien ajustada, se escogen al azar cada da 100 piezas
de la produccion y se someten a un test. Cual es la probabilidad de que, la proporcion
muestral no se aleje en mas de 0.03 unidades de la proporcion de defectuosos que se
produce cuando la maquina esta bien ajustada?

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

63

III.2 Se desea construir un intervalo de confianza a nivel 100(1 )% para la media de una
poblacion normal con la desviacion tpica conocida. Indicar razonadamente la veracidad
o falsedad de las afirmaciones siguientes:
1. Cuanto menor sea la desviacion tpica poblacional, mejor sera la precision de la
estimacion obtenida con el intervalo de confianza.
2. Si quiero una mayor precision, bastara con imponer una mayor confianza al realizar
el intervalo de confianza.
III.3 Un fabricante de equipo deportivo ha desarrollado un nuevo sedal sintetico para pesca y
afirma que tiene una resistencia media a la rotura mayor o igual a 15 kgs. La empresa
que los comercializa desconfa de tal afirmacion y decide poner a prueba dichos sedales.
Para ello selecciono de manera aleatoria 36 de dichos sedales y obtuvo una resistencia
promedio a la rotura de 14.6 kgs. Suponiendo que la resistencia a la rotura de los nuevos
sedales presenta una desviacion tpica de = 2 kgs.:
1. Esta justificada la desconfianza de la empresa? Plantear y llevar a cabo el contraste
adecuado para responder a la anterior pregunta. Calcular el p valor de la prueba.
2. Calcular el tama
no muestral necesario al 98% de confianza si queremos estimar la
resistencia promedio a la rotura del nuevo hilo sedal con un error inferior a 0.5 kgs.

Problema 29
III.1 Para calibrar un aparato de medicion se mide repetidas veces un patron cuyo peso no se
conoce. Se supone que el error que se comete en cada medicion sigue una distribucion
normal de media 0 y desviacion tpica 2 gramos.
1. Cual es la distribucion del valor proporcionado por el aparato?
2. Si se decide utilizar como peso del patron el valor proporcionado por 10 mediciones,
cual sera la desviacion tpica del valor proporcionado?
3. Si la media muestral de 10 mediciones es igual a 5.37 gramos, construir un intervalo
al 98% de confianza para el peso exacto del patron. Interpretacion de dicho intervalo.
4. Calcular el tama
no muestral para garantizar con una probabilidad del 98% que
el error que cometemos al estimar el peso real del patron con el promedio de las
mediciones sea inferior a 1 gramo.
III.2 Para la media de una poblacion con varianza conocida, planteamos el contraste
H 0 : = 0
H1 : > 0
Despues de extraer una muestra de la poblacion y calcular el estadstico adecuado, resulta que rechazamos H0 al 95% de confianza y que no podemos rechazar H0 al 99% de
confianza.
1. Cual es la decision al 90% de confianza? Y al 98% de confianza? Razona tu
respuesta.

64

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.


2. Entonces el p valor de la prueba sera:
(a) p valor 0.05
(b) p valor < 0.01
(c) 0.01 < p valor 0.1
Para cada una de las afirmaciones anteriores, indicar razonadamente su veracidad o
falsedad.

Problema 30
III.1 Se desea construir un intervalo de confianza para la media poblacional de una distribucion
normal con conocida. Se fija un margen de error maximo permitido y se busca el tama
no
muestral necesario para garantizar este margen de error con una confianza del 95%. Para
cada una de las afirmaciones siguientes, indicar razonadamente su veracidad o falsedad:
1. Si disminuye , el tama
no muestral necesario aumentara.
2. El tama
no muestral necesario aumentara si se fija una confianza del 99%.
3. Si el margen de eror permtido lo disminuimos en la mitad, el tama
no muestral
necesario aumentara.
III.2 Una central lechera compra leche a varios provedores. La central sospecha que algunos
ganaderos a
naden agua a la leche para aumentar sus beneficios. El exceso de agua se puede
detectar midiendo el punto de congelacion de la leche. La temperatura de congelacion
de la leche natural vara normalmente con una media de = 0.545o C y una desviacion
tpica = 0.008o C. La adicion de agua aumenta la temperatura de congelacion y la
acerca a 0o C, el punto de congelacion del agua. El director del laboratorio de la central
lechera determina la temperatura de congelacion de cinco lotes consecutivos de leche
procedentes de un mismo provedor y encuentra una media muestral de -0.535o C. Estos
resultados constituyen una buena evidencia de que el provedor esta a
nadiendo agua a la
leche? Plantear el contraste de hipotesis adecuado y llevarlo a cabo de manera detallada
(debera aparecer el estadstico de la prueba, su distribucion de probabilidad y donde se
sit
ua la region crtica o de rechazo), dar el p-valor asociado a la prueba y redactar las
conclusiones que obtengas.

Problema 31
III.1 Para calibrar un nuevo aparato de medicion, se mide repetidas veces un patron cuyo
peso sabemos que es igual a 15 grs. En condiciones optimas de funcionamiento, el aparato
comete un error aleatorio que sigue una distribucion normal con desviacion tpica igual a
2 gr.
1. Cual es la distribucion del valor proporcionado por el aparato?
2. Si se decide utilizar como medida el valor proporcionado por 10 mediciones, cual
sera la desviacion tpica del valor proporcionado?
3. Calcular el tama
no muestral para garantizar con una probabilidad del 98% que el
error que cometemos con el promedio de las mediciones sea inferior a 0.95 grs..

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.

65

III.2 El Gobierno ha otorgado fondos al departamento de agricultura de la UPCT para probar


la capacidad de rendimiento de una nueva variedad de trigo. La nueva variedad se ha
plantado en 40 parcelas de igual superficie y el rendimiento medio ha sido 46.5 kg. por
parcela. Por estudios anteriores podemos suponer que la poblacion de interes tiene una
desviacion tpica de = 15 kg.. Se pide:
1. Construir de manera detallada un intervalo de confianza al 95% para el rendimiento
promedio por parcela de la nueva variedad de trigo. Interpretacion de dicho intervalo
de confianza.
2. Podemos afirmar al 95% de confianza que el rendimiento promedio por parcela de
la nueva variedad de trigo es superior a 44 kg.? Plantea el contraste de hipotesis
adecuado para ponder justificar tu respuesta.
3. Determinar el p valor de la prueba.
4. Al desconocer la distribucion de la variable de este problema, los procedimientos
estadsticos utilizados en (1), (2) y (3) son validos bajo ciertos supuesto. Que
supuestos son?

Problema 32
III.2 Un agronomo examina el contenido de celulosa de una determinada variedad de alfalfa.
Supongamos que el contenido de celulosa de la poblacion tiene una desviacion tpica
= 12 mg/g . Una muestra de 32 cortes de alfalfa tiene un contenido medio de celulosa
x = 145 mg/g. Se pide:
1. Definir la variable y la poblacion sujetas a estudio.
2. Dar un intervalo de confianza al 95% para el contenido medio de celulosa de la
poblacion.
3. Un estudio afirma que el contenido medio de celulosa en la poblacion es =
140 mg/g, pero el agronomo cree que la media es mayor que ese valor. Realizar
el contraste adecuado para ver si los datos muestrales corroboran dicha impresion.
(Tomar = 0.05 y = 0.01)
4. Al desconocer la distribucion de la variable de este problema, los procedimientos
estadsticos utilizados en (2) y (3) son validos bajo ciertos supuesto. Que supuestos
son?

Problema 33
III.1 Para calibrar un instrumento de medicion se mide repetidamente un patron cuyo peso
sabemos que es igual a 20 gramos (grs.). Se supone que el error que se comete en cada
medicion sigue una distribucion normal con desviacion tpica = 2 grs.. Se pide:
1. La distribucion de probabilidad del valor proporcionado por el aparato.
2. Se mide el patron 5 veces y se obtiene que la media muestral de las cinco mediciones
es 21.3 grs.. Construir un intervalo de confianza al 98% para la media poblacional.
Interpretar dicho intervalo de confianza al 98% para la media poblacional.

66

Inferencia: Intervalos de confianza y Contrastes de Hipotesis.


3. Cuantas veces habra que repetir la medicion para conseguir con la media muestral
un error maximo de 1 gr. con una confianza del 98%?

III.2 En una determinada explotacion agraria dedicada al cultivo de uva se utiliza un sistema
de riego por goteo tradicional. El ingeniero encargado de la explotacion estudia introducir el sistema de riego por goteo u
ltimo que acaba de salir al mercado para mejorar
la productividad media establecida actualmente en 4.7 Kgs. de uva por cepa. Se estima
que el cambio sera rentable si consigue elevar dicho n
umero por encima de los 6 Kgs. de
uva por cepa. Realizada una prueba con el nuevo sistema de riego por goteo, aplicado a
35 cepas, se obtuvo una produccion media de 6.7 Kgs. y no se observo ning
un cambio
apreciable en la dispersion que estaba establecida en = 2 Kgs. de uva por cepa. Si se
supone normal la variable aleatoria de interes con desviacion tpica = 2 Kgs.. Se pide:
1. Definir la variable y la poblacion sujetas a estudio.
2. Realizar el contraste adecuado para contestar a la pregunta siguiente: Se debe
efectuar el cambio de sistema de riego por goteo? (tomar = 0.05 y = 0.01)
3. Calcula la potencia de dicho contraste para una alternativa de = 7 Kgs.. Interpretar el concepto de potencia de un test. (tomar = 0.05).

Problema 34
I.1 Se realiza una encuesta para conocer la proporcion de votantes de un determinado condado
que prefieren el candidato A. Para ello, se escoge una muestra de 1200 votantes, y el
resultado es 53%. El sondeo anuncia un margen de error de 3 puntos para un nivel de
confianza del 95%. Explicar por que no se puede afirmar sin mas que el 53% de todos los
votantes de dicho condado prefieren al candidato A. Explicar que quiere decir un nivel de
confianza del 95%.
I.2 Se estudia el rendimiento de un proceso qumico. De la experiencia previa con este proceso,
se sabe que la distribucion del rendimiento es aproximadamente normal con una desviacion
tpica del 3%. En los 12 das anteriores de operacion de la planta, se ha observado un
rendimiento promedio del 91.6%
(a) Construir de manera detallada un intervalo de confianza al 95% para el rendimiento
promedio del proceso. Interpretacion de dicho intervalo al 95% de confianza.
(b) Se puede afirmar al 95% de confianza que el rendimiento promedio es mayor del 90%?
Calcular el p-valor de la prueba. Cual es la decision apropiada si = 0.01?
(c) Cual es la potencia de la prueba cuando la verdadera media es = 93%? Interpreta el
concepto de potencia de una prueba.

You might also like