You are on page 1of 398

IINF, ITIG/S

Mt. Estad. de la Ing. / Estadstica


Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/14
TEMA 1 ESTADSTICA DESCRIPTIVA Y
ANLISIS DE DATOS UNIDIMENSIONAL
1.1. Objeto de la Estadstica Descriptiva.
Conceptos Generales
Cuando se analiza un fenmeno aleatorio, ya sea de ingeniera o de otra
rama del conocimiento humano, aparecen resultados del mismo que han de ser
tratados de forma conveniente para conocer mejor los propios resultados
obtenidos y el fenmeno en cuestin. Para ello ser necesario emplear los
resultados de la Estadstica Descriptiva, cuya definicin se presenta a
continuacin.

DEFINICION.- (ESTADISTICA DESCRIPTIVA)
Se entiende por Estadstica Descriptiva el conjunto de
conceptos y tcnicas de la Estadstica que proporcionan una
descripcin numrica, ordenada y simplificada, a veces con la ayuda
de representaciones grficas, de la informacin obtenida en la
observacin y recogida de datos de un fenmeno aleatorio. Adems,
proporciona la base necesaria para construir los modelos
matemticos tericos de los fenmenos aleatorios.

En la observacin y recogida de datos de un fenmeno aleatorio
subyacen los siguientes conceptos.
Poblacin Estadstica es cualquier conjunto de personas, animales,
objetos o acontecimientos sometido a estudio estadstico y que debe estar
perfectamente definido, tanto en el tiempo como en el espacio.
Unidad Estadstica es cada uno de los elementos que componen una
poblacin estadstica. Puede ser descrito por uno o varios caracteres,
dependiendo de cual sea el objeto del estudio estadstico.
Cualquier carcter o caracterstica que se vaya a analizar en las
unidades estadsticas presentar 2 ms niveles exhaustivos e incompatibles.
Adems, los caracteres se clasifican en cualitativos y cuantitativos, siendo
denominados, tambin, los primeros atributos y los ltimos variables
estadsticas. Los niveles de un atributo o carcter cualitativo se llaman
modalidades, mientras que los de uno cuantitativo se denominan valores
diferentes en observacin.
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/14
Los caracteres cuantitativos se clasifican en discretos, si hay una
cantidad finita o infinita numerable de valores de la variable, y continuos, si la
variable puede tomar cualquier valor de un intervalo.
Cuando de cada unidad estadstica se analice un nico carcter, los
datos obtenidos sern de tipo unidimensional; mientras que si se analizan
varios caracteres se obtendrn datos de tipo multidimensional (bidimensional si
se analizan dos caracteres, etc.).
Muestra es cualquier subconjunto observado de una poblacin
estadstica, cuyo nmero de elementos se llama tamao de la muestra.
Censo es la observacin de todos los elementos de una poblacin
estadstica.

EJEMPLO 1.1.- (APLICACION DE LOS CONCEPTOS ANTERIORES)
En la poblacin estadstica de vehculos fbricados en una determinada
factora durante un da, se puede analizar el carcter cualitativo color, que
presentar varias modalidades, as como los caracteres cuantitativos o
variables: n de defectos en las pruebas finales a realizar en los vehculos
antes de enviarlos al mercado (discreto) y consumo de combustible en una
prueba simulada de circulacin urbana (continuo).
En la poblacin estadstica de estudiantes de la E.T.S. Ingeniera (ICAI)
matriculados en el curso 09-10 se puede analizar el carcter cualitativo
sexo, que presenta dos modalidades, o titulacin cursada; as como los
caracteres cuantitativos edad (discreto) y estatura (continuo).
EJERCICIO 1.1.-
a) Se quiere realizar un estudio estadstico sobre los clientes de unos
grandes almacenes. Aplicar los conceptos anteriores en este contexto. (Ayuda:
consultar en el libro de Sarabia y Mat (1993), el problema 2.7., pgina 177).
b) Se quiere realizar un estudio estadstico sobre la contratacin/consumo
de electricidad y gas en las viviendas. Aplicar los conceptos anteriores en este
contexto. (Ayuda: consultar el recibo de la luz y el del gas de una vivienda).
c) Se quiere realizar un estudio estadstico sobre la contratacin/consumo
de telfono mvil en las personas y de Internet en las viviendas. Aplicar los
conceptos anteriores en este contexto.







IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/14
1.1.1. Organizacin de un Conjunto de Datos en una Tabla
de Frecuencias

SITUACION REAL.-
Se ha recogido un conjunto de datos sobre un carcter de las unidades de
un colectivo. Por ejemplo, modelo de vehculo utilizado por los directivos de las
multinacionales instaladas en Espaa el ao pasado, causa que ha provocado
la interrupcin del suministro de energa elctrica en una red, salarios de un
grupo de trabajadores, nmero de horas que han estado 1000 vehculos en un
aparcamiento, nmero de televisores vendidos cada da en una tienda a lo
largo de un ao, duracin de una serie de bombillas, consumo de electricidad
en una vivienda durante un ao, rendimiento de una mquina elctrica, etc. Es
necesario digerir y procesar esa informacin de manera que podamos extraer
conclusiones sobre el comportamiento de dicho colectivo y, a veces,
compararlo con el de otro colectivo con respecto a la misma variable.
EJEMPLO 1.2.-
Una compaa elctrica ha realizado una investigacin estadstica en
relacin a las causas que han provocado la interrupcin del suministro de
energa elctrica en la red que abastece y se han obtenido los siguientes datos
NA, NA, AT, AT, NA, FF, NA, OC, FF, FF,
NA, NA, AT, NA, NA, NA, AT, AT, AT, AT,
OC, AE, AT, AT, AT, AT, AT, AT, NA, NA,
donde las abreviaturas utilizadas en las causas significan:
FF: fallo elemento
AT: atmosfricas
AE: agentes externos
FM: falsas maniobras
AP: mala actuacin de protecciones
OC: otras causas
NA: no aclaradas
Sin organizar este conjunto de datos no podemos responder de manera
directa e inmediata a preguntas del tipo:
Ms de la mitad de las interrupciones se debieron a causas atmosfricas?
El porcentaje de interrupciones no aclaradas es superior al debido a causas
atmosfricas?
Se puede observar que la muestra o poblacin est formada por N = 30
interrupciones de suministro de energa elctrica y que de cada unidad
estadstica se estudia un carcter cualitativo o atributo, X, que es la causa que
ha provocado la interrupcin del suministro de energa elctrica.
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/14
EJEMPLO 1.3.-
Se ha realizado una investigacin estadstica sobre los salarios en el
Departamento de Personal de una fbrica y se han obtenido los siguientes
datos, en decenas de euros, correspondientes al salario semanal de cada
trabajador por todos los conceptos
19 30 24 23 24 21 20 25 26 20
21 29 28 30 19 27 29 22 25 28
20 27 26 21 30 28 27 26 19 27
25 23 22 29 21 26 24 28 30 25
25 24 26 23 29 27 28 25 27 26
22 26 27 29 28 23 22 24 26 23
Sin organizar dicho conjunto de datos no podemos responder a preguntas
del tipo:
Cuntos trabajadores ganan a la semana 250 ?
La mitad de los trabajadores de esta empresa gana a la semana como
mximo 250 ?
Qu porcentaje de trabajadores en esta empresa tiene un salario semanal
superior a 260 ?
Se observa que la poblacin est formada por N = 60 empleados de una
fbrica y que de cada unidad estadstica se estudia un carcter cuantitativo
discreto (variable discreta) X, que es el salario semanal total, expresado en
miles de pesetas
FORMALIZACION TEORICA DE UNA TABLA DE
FRECUENCIAS.-
Representemos por
N
x x ,...,
1
los datos recogidos, bien sea de un atributo
o de una variable cuantitativa discreta, y por
k
x x ,...,
1
a las modalidades o
valores diferentes observados para dichos datos. En el ejemplo 1.3, N = 60 y k
= 12. Y en el ejemplo 1.1?
Designemos por n
i
al nmero de veces que aparece el dato
i
x , lo que se
denomina frecuencia absoluta de la modalidad o valor
i
x , siendo i = 1, ..., k.
Designemos por
i
f a la proporcin de veces que aparece la modalidad o
el valor diferente
i
x , entre los N datos, lo que se llama frecuencia relativa de
la modalidad o valor
i
x . Es decir,
N
n
f
i
i
= con i = 1, ..., k.
Para la interpretacin suele darse el valor de
i
f en porcentaje.
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/14
Se llama tabla de frecuencias o distribucin de frecuencias a una
tabla con tres filas donde la primera contiene las modalidades o valores
diferentes en observacin, la segunda las frecuencias absolutas y la tercera la
frecuencia relativa de dichos valores. Su estructura ser, por tanto, la siguiente:

i
x
k
x x .... ..........
1

i
n
k
n n ..... ..........
1

i
f
k
f f ..... ..........
1


PASOS PARA ORGANIZAR UN CONJUNTO DE DATOS DE UN ATRIBUTO
O DE UNA VARIABLE DISCRETA
1) Ordenarlos (de menor a mayor en el caso de una variable discreta y por un
criterio para un atributo).
2) Observar aquellos datos que son diferentes entre s y contar cuntos hay de
cada uno y lo que dicho nmero represente respecto del total.
3) Estructurar esa informacin en una tabla que sea fcil de asimilar.

EJEMPLO 1.3.- (Continuacin)

Construir e interpretar la tabla de frecuencias para dichos datos.
------------------------------------
La tabla de frecuencias resultante es

Variable x
i
190 200 210 220 230 240 250 260 270 280 290 300
Frec.Abs. n
i
3 3 4 4 5 5 6 8 7 6 5 4
Frec. Rel.
100 f
i %

5 5 6.7 6.7 8.3 8.3 10 13.3 11.7 10 8.3 6.7

La primera fila nos informa de los diferentes salarios que perciben los
trabajadores de esta empresa, la segunda proporciona el nmero de
trabajadores que percibe cada salario de los indicados en la primera fila, y la
tercera da el porcentaje de trabajadores que percibe cada salario de los
indicados en la primera fila.
Cmo se interpretara alguna de sus columnas?
EJERCICIO 1.2.-
Construir e interpretar la tabla de frecuencias para los datos del ejemplo
1.2.-
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/14
EJEMPLO 1.4.-
Los datos de la Tabla 1.1 son el resultado de la duracin de bombillas de
60 watios, expresados en nmero de horas que una bombilla ha lucido antes
de fundirse.
Se puede observar que la muestra est formada por N = 100 bombillas y
que de cada unidad estadstica se estudia un carcter cuantitativo continuo,
i.e., una variable continua, X, que es la duracin de una bombilla hasta que se
funde, expresada en horas.
Construir e interpretar la tabla de frecuencias.
------------------------------------
La construccin de la tabla de frecuencias requiere los siguientes pasos.
TABLA 1.1 DURACION DE BOMBILLAS EN HORAS

963.4 1132.5 1021.7 1087.3 950.1 910.0 1045.0 1114.1 1085.1 1002.4
1175.9 1052.1 976.1 1114.1 932.9 1060.1 1123.6 1130.0 951.9 1187.0
1074.7 1092.2 987.2 1089.5 810.1 1066.2 1121.8 1121.9 1001.2 1023.8
887.1 874.8 1108.4 1133.5 1042.1 900.0. 962.1 1058.4 956.5 909.2
1078.3 1001.7 1099.3 1072.8 1129.8 1142.2 939.0 1149.9 1089.3 1059.2
1065.4 1198.2 1075.6 866.0 995.3 1152.8 1092.7 1028.1 1033.2 1078.7
1124.8 1003.4 901.3 922.0 1129.8 1093.1 1132.7 822.9 949.9 1092.1
1083.8 1130.2 988.8 1121.8 1021.3 1049.9 1083.8 1114.4 1043.7 1066.3
882.6 1092.7 1074.1 1142.0 1102.1 1078.4 989.8 1166.2 1023.9 984.3
1055.5 1143.8 1109.8 822.5 970.0 1021.3 1021.0 1122.8 1056.2 1112.1

1.- Ordenacin, de menor a mayor, del conjunto de datos.

810.1 822.5 822.9 866.0 874.8 882.6 887.1 900.0 901.3 909.2
910.0 922.0 932.9 939.0 949.9 950.1 951.9 956.5 962.1 963.4
970.0 976.1 984.3 987.2 988.8 989.8 995.3 1001.2 1001.7 1002.4
1003.4 1021.0 1021.3 1021.3 1021.7 1023.8 1023.9 1028.1 1033.2 1042.1
1043.7 1045.0 1049.9 1052.1 1055.5 1056.2 1058.4 1059.2 1060.1 1065.4
1066.2 1066.3 1072.8 1074.1 1074.7 1075.6 1078.3 1078.4 1078.7 1083.8
1083.8 1085.1 1087.3 1089.3 1089.5 1092.1 1092.2 1092.7 1092.7 1093.1
1099.3 1102.1 1108.4 1109.8 1112.1 1114.1 1114.1 1114.4 1121.8 1121.8
1121.9 1122.8 1123.6 1124.8 1129.8 1129.8 1130.0 1130.2 1132.5 1132.7
1133.5 1142.0 1142.2 1143.8 1149.9 1152.8 1166.2 1175.9 1187.0 1198.2

Se tiene que
( )
1 . 810
1 mn
= x x horas
( )
2 . 1198
mx
=
N
x x horas



IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/14
2.- Primera determinacin del nmero de clases o intervalos en que
agrupar los datos.
Frmula de Sturgess: [ ] 7 100 log 3 . 3 1 = + = k
Frmula de la raz cuadrada: 10 100 = = k
Conclusin: Se debe elegir un nmero de intervalos entre 7 y 10, aunque
predomina el resultado de Sturgess.

3.- Primera determinacin de la amplitud o longitud de las clases o
intervalos en que agrupar los datos.

Caso k = 7: 443 . 55
7
1 . 388
7
1 . 810 2 . 1198
= =

= h
Caso k = 8: 5125 . 48
8
1 . 388
8
1 . 810 2 . 1198
= =

= h

Recomendacin: Elegir una amplitud simple de manejar y con
significado directo en el problema.

Conclusin: Se deben elegir 8 intervalos de amplitud 50 horas.

4.- Establecer el lmite inferior de la primera clase o intervalo. Conviene
que los lmites sean cmodos de manejar, por lo cual se elige como lmite
inferior 800 horas.
Delimitar si los intervalos son cerrados por la izquierda o por la derecha.
Por convenio se toman cerrados por la derecha.

5.- Clculo de la frecuencia en cada intervalo. Construccin de la tabla.

Intervalos
] (
a a
i i 1
,
Marcas
de
Clase x
i

Frec.
absoluta
n
i

Frec.
relativa
f
i

(800,850] 825 3 0.03
(850,900] 875 5 0.05
(900,950] 925 7 0.07
(950,1000] 975 12 0.12
(1000,1050] 1025 16 0.16
(1050,1100] 1075 28 0.28
(1100,1150] 1125 24 0.24
(1150,1200] 1175 5 0.05

Cmo se interpretara esta tabla?
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/14
Consideraciones al Agrupar un Conjunto de Datos por Intervalos
1) La tabla de frecuencias no puede presentar intervalos con frecuencia
nula, ya que supondra una ruptura artificial en la representacin de la
frecuencia, fruto de una inadecuada agrupacin por intervalos, que no se
correspondera con la manera en que se presenta la frecuencia de aparicin de
la variable estudiada.

2) Siempre que sea posible las clases deberan tener la misma longitud, a
fin de no enmascarar la realidad del fenmeno. No obstante, cuando se
manejan datos de una magnitud econmica este criterio no suele ser posible
cumplirlo y hay que plantear intervalos de longitud diferente.

3) El lmite inferior (resp. superior) del primer (resp. ltimo) intervalo debe
quedar a la izquierda (resp. derecha) del dato ms pequeo (resp. grande),
siempre que ste no se aleje excesivamente del resto, siendo conveniente que
la marca de clase del primer (resp. ltimo) intervalo sea un valor observado.

4) Cuando el dato ms pequeo (resp. grande) se encuentre muy alejado
del resto, se dir que se trata de una observacin anmala o extrema
(outlier). En este caso, se procedera con la agrupacin por intervalos
excluyendo las observaciones extremas, y se aadira a la tabla un intervalo
anterior al primero, indicado por ( ]
0
a , , y un intervalo posterior al ltimo,
indicado por ( ) + ,
k
a . Estos intervalos deben cerrarse, i.e., fijar un lmite
inferior (resp. superior) para que se pueda trabajar con sus marcas de clase;
recomendndose cerrar el primer (resp. ltimo) intervalo con un valor tal que la
marca de clase sea el dato ms pequeo (resp. grande) observado.

5) Se recomienda elegir los intervalos de forma que sus puntos medios
coincidan con datos observados de la realidad.

6) Los extremos de los intervalos se deben definir con precisin, i.e., los
intervalos han de ser no solapados, para asignar de manera automtica
cualquier observacin.






IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/14
7) La agrupacin por intervalos supone una prdida de informacin, al
prescindir de las observaciones individuales, aunque esta prdida es
pequea comparada con la ganancia en concisin y facilidad de
interpretacin de la tabla o distribucin de frecuencias.

Tabla de Frecuencias con Intervalos de Diferente
Longitud
Consideremos el fichero pisos.xls que se encuentra en el PR. Se
dispone de informacin de 73 pisos, siendo una de las variables precio. La
agrupacin de esos 73 datos en intervalos de la misma longitud 100.000
mediante STATGRAPHICS (Describe Numeric Data One Variable
Anlisis; Frequency Table- en Tabular Options-) y la seleccin en Pane
Options siguiente



proporciona la siguiente tabla de frecuencias.
-----------------------------------------------------------------------------------------------
Lower Upper Relative Cum. Cum. Rel.
Class Limit Limit Midpoint Frequency Freq. Freq. Freq.
------------------------------------------------------------------------------------------------
at or below 100000,0 0 0,0000 0 0,0000
1 100000,0 200000,0 150000,0 14 0,1944 14 0,1944
2 200000,0 300000,0 250000,0 24 0,3333 38 0,5278
3 300000,0 400000,0 350000,0 14 0,1944 52 0,7222
4 400000,0 500000,0 450000,0 9 0,1250 61 0,8472
5 500000,0 600000,0 550000,0 4 0,0556 65 0,9028
6 600000,0 700000,0 650000,0 3 0,0417 68 0,9444
7 700000,0 800000,0 750000,0 1 0,0139 69 0,9583
8 800000,0 900000,0 850000,0 2 0,0278 71 0,9861
above 900000,0 1 0,0139 72 1,0000
---------------------------------------------------------------------------------------------------
Mean = 347965,0 Standard deviation = 183867,0
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/14

Algunas consideraciones sobre esta tabla seran:
1. No permite un anlisis en intervalos de 50.000 hasta los 400.000 ,
por ejemplo.
2. La frecuencia se reparte de forma irregular a partir de los 700.000 .
Para evitar los problemas anteriores y ofrecer una mejor representacin
de la variable, procederemos a agrupar en intervalos de distinta longitud.
Consideraremos intervalos de 50.000 hasta los 400.000 , intervalos de
100.000 desde los 400.000 hasta los 600.000 y despus intervalos de
200.000 .
Dos preguntas que nos podemos hacer seran las siguientes.
A) Cul sera la tabla resultante manejando los datos originales?
B) Y aplicando el principio de distribucin uniforme de los datos
en cada intervalo?
La respuesta a la pregunta A) sera la tabla siguiente (en miles de )

Intervalos
] (
a a
i i 1
,
Marcas de
Clase x
i

Frec.
absoluta
n
i

Frec.
relativa
f
i

(0,100] 50 0 0
(100,150] 125 2 0,0278
(150,200] 175 12 0,1666
(200,250] 225 14 0,1944
(250,300] 275 10 0,1390
(300,350] 325 5 0,0695
(350,400] 375 9 0,125
(400,500] 450 9 0,125
(500,600] 550 4 0,0556
(600,800] 700 4 0,0556
(800,) 3 0,0417

La respuesta a la pregunta B) dara la tabla siguiente (en miles de )

Intervalos
] (
a a
i i 1
,
Marcas de
Clase x
i

Frec.
absoluta
n
i

Frec.
relativa
f
i

(0,100] 50 0 0
(100,150] 125 7 0,0972
(150,200] 175 7 0,0972
(200,250] 225 12 0,1666
(250,300] 275 12 0,1666
(300,350] 325 7 0,0972
(350,400] 375 7 0,0972
(400,500] 450 9 0,125
(500,600] 550 4 0,0556
(600,800] 700 4 0,0556
(800,) 3 0,0417
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
11/14
1.1.2. Tabla de Frecuencias Ascendente y Descendente
Dada una tabla de frecuencias de una variable discreta o de una continua
agrupada por intervalos, para responder a preguntas del tipo
La mitad de los trabajadores de esta empresa gana a la semana
como mximo 250 ?
necesitaramos ir sumando el nmero de trabajadores que a la semana ganan
190, 200, ..., hasta 250 y ver si se trata del 50 % de los trabajadores.
Parece, por tanto, interesante tener una tabla de frecuencias que nos
indique los diferentes salarios, el nmero de trabajadores que a la semana
percibe como mximo cada salario y dicho nmero en proporcin o porcentaje.
Esta tabla se llamar tabla de frecuencias (acumuladas) ascendente,
abreviadamente TFA.
Para responder a preguntas del tipo
Qu porcentaje de trabajadores en esta empresa tiene un salario
semanal superior a 260 ?
necesitaramos ir sumando el nmero de trabajadores que a la semana ganan
270, ..., hasta 300 y ver qu porcentaje de trabajadores resulta.
Parece, por tanto, interesante tener una tabla de frecuencias que nos
indique los diferentes salarios, el nmero de trabajadores que a la semana
percibe ms de lo indicado por cada salario y dicho nmero en proporcin o
porcentaje. Esta tabla se llamar tabla de frecuencias (acumuladas)
descendente, abreviadamente TFD.
FORMALIZACION TEORICA DE LAS TABLAS DE FRECUENCIAS
ACUMULADAS.-
Consideremos una tabla de frecuencias para datos de una variable
discreta o de una continua agrupada por intervalos
i
x
k
x x ....... ..........
1

i
n
k
n n ....... ..........
1

i
f
k
f f ....... ..........
1

que abreviadamente representaremos por { }
i i i
f n x , , . La tabla de frecuencias
ascendente se construye asignando a cada valor o intervalo la frecuencia del
mismo ms la frecuencia que tengan todos los anteriores. As, esta tabla se
representar por


= =
i
j
j
i
j
j i
f n x
1 1
, , . Por otra parte, la tabla de frecuencias
descendente se construye asignando a cada valor o intervalo la frecuencia del
mismo ms la frecuencia que tengan todos los posteriores. As, esta tabla se
representar por


= =
k
i j
j
k
i j
j i
f n x , , .
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
12/14
EJEMPLO 1.3.- (Continuacin)
Consideremos la tabla de frecuencias para dichos datos. Se pide:
a) Construir e interpretar la tabla de frecuencias ascendente.
b) Construir e interpretar la tabla de frecuencias descendente.
c) Cmo se construir la denominada tabla de frecuencias
complementaria de la ascendente?
------------------------------------
a) La tabla de frecuencias ascendente resultante es

Variable x
i
190 200 210 220 230 240 250 260 270 280 290 300
F.A.A.

=
i
j
j
n
1

3 6 10 14 19 24 30 38 45 51 56 60
F.R.A
% 100
1

=
i
j
j
f
5 10 16.7 23.3 31.7 40 50 63.3 75 85 93.3 100

b) La tabla de frecuencias descendente resultante es

Variable x
i
190 200 210 220 230 240 250 260 270 280 290 300
F.A.D.

=
k
i j
j
n
60 57 54 50 46 41 36 30 22 15 9 4
F.R.D % 100

=
k
i j
j
f
100 95 90 83.3 76.7 68.3 60 50 36.7 25 15 6.7

c) La tabla de frecuencias complementaria de la ascendente ser

Variable x
i
190 200 210 220 230 240 250 260 270 280 290 300
FACA

+ =
k
i j
j
n
1

57 54 50 46 41 36 30 22 15 9 4 0
FRCA
% 100
1

+ =
k
i j
j
f
95 90 83.3 76.7 68.3 60 50 36.7 25 15 6.7 0

EJEMPLO 1.4.- (Continuacin)
Consideremos la tabla de frecuencias para dichos datos. Se pide:
a) Construir e interpretar la tabla de frecuencias ascendente.
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
13/14
b) Idem la tabla de frecuencias descendente.
c) Cmo se construir la denominada tabla de frecuencias
complementaria de la ascendente? Qu nombre recibir?
------------------------------------
a) La tabla de frecuencias ascendente resultante es

Intervalos
] (
a a
i i 1
,
Marcas
de
clase x
i

F.A.A.
n
j
j
i
=

1

F.R.A.
f
j
j
i
=

1

(800,850] 825 3 0.03
(850,900] 875 8 0.08
(900,950] 925 15 0.15
(950,1000] 975 27 0.27
(1000,1050] 1025 43 0.43
(1050,1100] 1075 71 0.71
(1100,1150] 1125 95 0.95
(1150,1200] 1175 100 1.00

b) La tabla de frecuencias descendente resultante es

Intervalos
] (
a a
i i 1
,
Marcas
de
clase
x
i

F.A.D.
n
j
j i
k
=


F.R.D.
f
j
j i
k
=


(800,850] 825 100 1.00
(850,900] 875 97 0.97
(900,950] 925 92 0.92
(950,1000] 975 85 0.85
(1000,1050] 1025 73 0.73
(1050,1100] 1075 57 0.57
(1100,1150] 1125 29 0.29
(1150,1200] 1175 5 0.05
c) La tabla de frecuencias complementaria de la ascendente,
llamada para datos de fiabilidad tabla de frecuencias de supervivencia o de
fiabilidad, resulta ser


IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



1.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
14/14
Intervalos
] (
i i
a a ,
1

Marcas
de
clase
x
i

F.A.S.

+ =
k
i j
j
n
1

F.R.S.

+ =
k
i j
j
f
1

(0,800] 400 100 1.00
(800,850] 825 97 0.97
(850,900] 875 92 0.92
(900,950] 925 85 0.85
(950,1000] 975 73 0.73
(1000,1050] 1025 57 0.57
(1050,1100] 1075 29 0.29
(1100,1150] 1125 5 0.05
(1150,1200] 1175 0 0.00

Notas.- F.A.S. (resp. F.R.S.) denota frecuencia absoluta (resp. relativa) de
supervivencia. La F.R.S. asociada al intervalo ] (
i i
a a ,
1
se designa por
] ( ( )
i i N
a a R ,
1
y representa la proporcin de bombillas del total considerado que
lucen en el instante a
i
.
Obsrvese que
] ( ( ) ] ( ( )
i i N i i N
a a R a a R , ,
1 1 2

cuantifica la proporcin de bombillas del total considerado que fallan o dejan de
lucir a lo largo del intervalo ] (
i i
a a ,
1
.

EJERCICIO 1.3.-
Buscar un conjunto de datos de ingeniera informtica de tipo variable
discreta (como el Ejemplo 1.3) y otro de tipo variable continua (como el Ejemplo
1.4) Construir e interpretar todas las tablas de frecuencias anteriores para estos
ejemplos.
Ampliacin.- (Son apartados independientes)
1) Realizar el ejercicio anterior con MATLAB.
2) Realizar el ejercicio anterior con R.
3) Sacar conclusiones entre lo que ofrecen ambos sistemas para la
problemtica de las tablas de frecuencias.



IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




1.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/8
1.2. Las Representaciones Grficas de una
Tabla de Frecuencias
1.2.1. Caso de un Atributo
1.2.1.1 DIAGRAMA DE RECTNGULOS
Para proceder a su representacin se colocan, en primer lugar, las
modalidades por orden decreciente de la frecuencia, y a continuacin se
levantan rectngulos de altura proporcional a la frecuencia. En el grfico
siguiente tenemos un diagrama horizontal.
Procedencia del crudo
importado por Espaa en 1995
0 2000 4000 6000 8000 10000
Arabia Saud
Nigeria
Mxico
Libia
Irn
CEI
Reino Unido
miles Tm

Fuente: Anuario El Pas 1.996
Un diagrama vertical se muestra a continuacin.

IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




1.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/8
1.2.1.2 DIAGRAMA DE SECTORES
Consideramos un crculo cuya longitud de arco o ngulo equiparamos al
nmero de observaciones. As asignamos a cada modalidad un sector de
longitud de arco, ngulo rea proporcional a su frecuencia.
Gas natural importado
por Espaa en 1995
Argelia
Libia
Noruega
Australia
Emiratos
rabes

Fuente: Ministerio de Industria y Energa

A veces se emplea un semicrculo, como en el caso de la composicin
del hemiciclo espaol despus de cada convocatoria de elecciones generales.






IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




1.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/8
1.2.2. Caso de una Variable Discreta
1.2.2.1 DIAGRAMA DE BARRAS
Bajo un sistema cartesiano, en abscisas se toman los valores de la
variable, y sobre cada valor se levanta una barra de altura proporcional a la
frecuencia (absoluta o relativa). Tambin se puede construir de carcter
acumulado.
Ejercicio 1.2.1.- Construir un diagrama de barras para la tabla de
frecuencias siguiente correspondiente a las ventas diarias de un artculo a lo
largo de un ao. Construir el diagrama acumulado.

N ventas por da x
i
0 1 2 3 4 5 6
N de das n
i
24 57 75 53 33 7 4
Frec. Rel.100 f
i %
9.5 22.5 29.6 21 13 2.8 1.6
Ejercicio 1.2.2.- Recopilar informacin de peridicos o en la red sobre
grficos estadsticos. Buscar alguna noticia que incorpore distintos tipos de
grficos, incluido un grfico temporal de alguna magnitud, e identificar cada tipo
de grfico.

Cuando se quieren representar dos o ms variables sobre un diagrama se
puede hacer de varias formas, una bastante habitual es la agregada, como
muestra el grfico siguiente.


IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




1.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/8
1.2.3. Caso de una Variable Continua
1. HISTOGRAMA
Se considera un sistema cartesiano y sobre el eje horizontal se colocan
los diferentes intervalos de agrupacin de datos. A continuacin se levanta
sobre cada intervalo un rectngulo de rea proporcional a la frecuencia
observada en dicho intervalo. Si los intervalos tienen todos la misma longitud,
equivale a intervalos de altura proporcional a la frecuencia. Cuando sta sea
absoluta/relativa hablaremos de histograma de frecuencias absolutas/relativas,
notado abreviadamente HFA y HFR. En definitiva, es la misma representacin
ya que slo cambia la escala.
El histograma a veces se construye para que su rea sea la unidad.
Para ello podemos proceder reduciendo la escala de frecuencias a
h
f
r

(siendo h la amplitud de cada intervalo), o bien dibujar intervalos de amplitud la
unidad.

800 900 1000 1100 1200
DURACIONES
0
5
10
15
20
25
30
fre
cu
en
cia
HISTOGRAMA DE FRECUENCIAS
ABSOLUTAS

2. POLGONO DE FRECUENCIAS
A partir de un histograma sin acumular, si tomamos los puntos medios
de las bases superiores de los rectngulos, incluyendo un intervalo anterior al
primero y otro posterior al ltimo (quedando un rea cerrada), y los unimos con
segmentos rectilneos obtenemos el polgono de frecuencias
absolutas/relativas (abreviadamente notados por PFA y PFR). El rea
encerrada por el PFR es la unidad y la encerrada por el PFA es el nmero de
datos N.
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




1.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/8
Si tenemos intervalos de distinta longitud, el criterio es buscar rea
proporcional a la frecuencia.
Tanto el PFA como el PFR pueden a veces reflejar mejor el
comportamiento de los datos que el histograma.
7 7 0 8 7 0 9 7 0 1 0 7 0 1 1 7 0 1 2 7 0
D U R A C I O N E S
0
5
1 0
1 5
2 0
2 5
3 0
f r a
P O L G O N O D E F R E C U E N C I A S

3. FUNCIN DE DENSIDAD
La construccin de un histograma o un polgono tiene como objetivo
mostrar una representacin grfica de los datos que nos ayude a inferir
(vislumbrar, intuir, imaginar,...) la estructura de esa representacin si
tomramos un nmero muy grande de datos de la variable.
Es decir, si incrementamos el nmero de datos, aumentar el nmero de
intervalos, siendo la longitud de los mismos cada vez menor. El polgono de
frecuencias se ir suavizando. En el caso lmite de llegar a poder tomar todos
los datos de la poblacin, el polgono de datos tender a una funcin llamada
funcin de densidad. Esta funcin cumplir:
Continuidad.
No negativa.
1 ) ( =

+

dx x f
El rea ser el 100% de la poblacin o de la probabilidad (no de la
frecuencia), ya que la funcin describe el comportamiento de la poblacin y no
de una muestra.
El rea comprendida entre dos puntos a y b ser la proporcin de valores
de la variables que se encuentran en el intervalo [a, b], o bien la probabilidad
de que se tome un valor de ese intervalo.
Decimos que el histograma de frecuencias relativas y el polgono de
frecuencias relativas son estimadores de la funcin de densidad y para un
conjunto de datos concreto obtendremos estimaciones de la funcin de
densidad.

IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




1.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/8
FUNCIN DE DENSIDAD
0
5
10
15
20
25
30
800 825 875 925 975 1025 1075 1125 1175 1200
DURACIN
f
a

4. HISTOGRAMA DE FRECUENCIAS ACUMULADAS
Se construye levantando sobre cada intervalo un rectngulo de altura
proporcional a la frecuencia que se acumula en dicho intervalo, tanto en el caso
de intervalos de igual longitud como de longitudes diferentes.
800 900 1000 1100 1200
DURACION
0
20
40
60
80
100
fre
cu
en
cia
HISTOGRAMA DE FRECUENCIAS
ABSOLUTAS ACUMULADAS

5. POLIGONO DE FRECUENCIAS ACUMULADAS.
Se construye uniendo mediante segmentos rectilneos los vrtices
superiores derechos de los rectngulos del correspondiente histograma
acumulado, considerando un intervalo anterior al primero.
Al dibujar las rectas estamos suponiendo que en cada intervalo las
observaciones estn uniformemente distribuidas. Esta suposicin es exclusiva
del polgono y no del histograma. Este hecho nos permite, a partir del polgono,
ver el porcentaje de observaciones menores a cada valor, cosa que en el
histograma no podamos.
El PFRA es funcin de x, lo que notaremos por PFRA(x), y nos informa de
la proporcin de observaciones o datos inferiores o iguales a x. Por ejemplo, si
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




1.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/8
queremos calcular la proporcin de datos en el intervalo (a,b] ser el resultado
de la siguiente diferencia PFRA(b) - PFRA(a).
Matemticamente, PFRA(x) es una funcin definida a trozos con recorrido
[0,1].
8 0 0 9 0 0 1 0 0 0 1 1 0 0 1 2 0 0
D U R A C I O N E S
0
2 0
4 0
6 0
8 0
1 0 0
f r a a
P O L G O N O D E F R E C U E N C I A S
A C U M U L A D A
S

6. FUNCIN DE DISTRIBUCIN
Cuando incrementamos el nmero de datos, incrementamos el nmero de
intervalos, pero decrece la longitud de los mismos. El polgono se va a ir
suavizando convirtindose en una curva:
PFRA(x) F(x)
N
Su funcin lmite ser llamada funcin de distribucin y notada por F(x),
siendo habitualmente una funcin continua y derivable.

F(x) funcin que cuantifica para cada x la proporcin de valores de la
variable en la poblacin cuyo valor no supera a x, o probabilidad de que la
variable tome un valor menor o igual que x.
( ) x X P x F = ) (
Tambin podemos calcular la proporcin de valores que se encuentran en
un intervalo (a,b]: P(a < X b) = F(b) - F(a) proporcin de valores en la
poblacin superior a a e inferior o igual a b.
Es a su vez ( )

= < <
b
a
dx x f b X a P ) ( con f(x) la funcin de densidad.
La funcin de distribucin es la primitiva de la funcin de densidad. Por
tanto:
( ) ) ( ) ( ) ( a F b F dx x f b X a P
b
a
= = < <



IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




1.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/8
FUNCIN DE DISTRIBUCIN
0
20
40
60
80
100
120
8
0
0
8
2
5
8
7
5
9
2
5
9
7
5
1
0
2
5
1
0
7
5
1
1
2
5
1
1
7
5
1
2
0
0
DURACIN
f
a
a

Relaciones entre F(x) y f(x)
1)


=
x
dt t f x F ) ( ) (
2) x donde F(x) es derivable,
dx
x dF
x F x f
) (
) ( ' ) ( = =

Ejemplo.- Sea f(x) = 0,2 e
-0,2x
, , 0 x la funcin de densidad que describe la
distribucin de la duracin del envo de un mensaje electrnico a travs de una
red informtica, con x en segundos.

a) Determinar su funcin de distribucin.

<
= =
x
x
t
e
x F dt e x F
0 x si - 1
0 x si

2 , 0
2 , 0
, 0
) ( 2 , 0 ) (
b) Calcular la proporcin de mensajes cuyo envo dura ms de tres
segundos y no supera los cinco segundos.
( ) ( ) ( ) . 181 , 0 1 1 ) 3 ( ) 5 ( 5 3
3 2 , 0 5 2 , 0
= = = <

e e F F X P

c) Calcular la proporcin de mensajes enviados cuya duracin supera los 10
segundos:

( ) . 1353 , 0 ) 10 ( 1 10 = = > F X P

IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1,S2)/2009-2010




Epgrafe 1.3.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/10
1.3. Medidas Asociadas a una Distribucin de
Frecuencias Unidimensional
Una vez recogido un conjunto de datos, organizado en una tabla de
frecuencias y representado grficamente; procede resumir esa informacin a
travs de medidas que nos permitan conocer diferentes aspectos de la
distribucin de frecuencias como su comportamiento central, su variabilidad o
su situacin respecto a la simetra. En este epgrafe nos proponemos
precisamente desarrollar esas medidas.
1.3.1. Medidas de Tendencia Central
1.3.1.1. Media Aritmtica. Momentos Respecto al Origen
Media Aritmtica.-
Sea x
1
, , x
N
un conjunto de N datos, se llama media aritmtica,
notndose por x , a
N
x
N
x x
x
N
1 i
i
N 1

=
=
+ +
=
...


EJEMPLO 1.3.1.-

a) Supongamos que una persona ha gastado las siguientes cantidades,
en euros, en los ltimos 8 fines de semana 20, 40, 35, 25, 15, 35, 50, 30.
Cunto ha gastado en promedio cada fin de semana?

20 40 35 25 15 35 50 30 250
31.25 /finde
8 8
x
+ + + + + + +
= = =
b) Si ahora quiere planificar el gasto para el prximo trimestre de 12 fines
de semana, cunto debera considerar?

Suponiendo que la media representa bien el comportamiento del gasto en
cada fin de semana, deberamos multiplicar la media por 12. Es decir,

12 12 31.25 =375 Gasto total x = =

Sea {x
i
, n
i
, f
i
} una distribucin de frecuencias, se llama media aritmtica o
promedio, notndose por x ,a

=
=
= =
+ +
=
k
i
i i
k
i
i i
k k
x f
N
x n
N
x n x n
x
1
1 1 1
...

Esta es la frmula que se aplicar a datos de una variable discreta y
datos de una variable continua agrupados por intervalos.
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1,S2)/2009-2010




Epgrafe 1.3.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/10
EJERCICIO 1.3.2.-
Sean las tablas de frecuencias de los ejemplos del epgrafe 1.1. Es decir,
A)
Variable x
i
190 200 210 220 230 240 250 260 270 280 290 300
Frec.Abs. n
i
3 3 4 4 5 5 6 8 7 6 5 4
Frec. Rel.
100 f
i %

5 5 6.7 6.7 8.3 8.3 10 13.3 11.7 10 8.3 6.7
B)
Intervalos ] (
i i
a a ,
1
Marcas de
Clase x
i

Frec. Abs.
n
i

Frec.
relativa f
i

(800,850] 825 3 0.03
(850,900] 875 5 0.05
(900,950] 925 7 0.07
(950,1000] 975 12 0.12
(1000,1050] 1025 16 0.16
(1050,1100] 1075 28 0.28
(1100,1150] 1125 24 0.24
(1150,1200] 1175 5 0.05
C)
Intervalos
] (
a a
i i 1
,
Marcas
de
Clase x
i

Frec.
absoluta
n
i

Frec.
relativa
f
i

(0,100] 50 0 0
(100,150] 125 2 0,0278
(150,200] 175 12 0,1666
(200,250] 225 14 0,1944
(250,300] 275 10 0,1390
(300,350] 325 5 0,0695
(350,400] 375 9 0,125
(400,500] 450 9 0,125
(500,600] 550 4 0,0556
(600,800] 700 4 0,0556
(800,) 3 0,0417

Obtener e interpretar la media aritmtica en cada uno de esos casos.

La media verifica las siguientes propiedades.
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1,S2)/2009-2010




Epgrafe 1.3.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/10
PROPIEDAD 1.- Si {x
i
, n
i
, f
i
} es una distribucin de frecuencias, con media
x , entonces
0 ) ( bien o 0
) (
1
1
= =

=
=
k
i
i i
k
i
i i
x x f
N
x x n
.

Significa que: El promedio de diferencias a la media es nulo. La media
es el centro de gravedad de la distribucin de frecuencias cuyas masas de
frecuencia f
i
se sitan a unas distancias x
i
.

Sin embargo, el promedio de diferencias a otro valor diferente a la media
ser positivo si el valor es inferior a la media y negativo si el valor es superior a
la media.

EJEMPLO 1.3.3.-

Supongamos los datos de gasto anteriores 20, 40, 35, 25, 15, 35, 50, 30.
Qu signo y qu valor tendr el promedio de diferencias a 35?

Ser negativo y valdr 3.75 .

PROPIEDAD 2.- Sea {x
i
, n
i
, f
i
} una distribucin de frecuencias con media x .
Sea {y
i
, n
i
, f
i
} la distribucin de frecuencias que recoge un cambio lineal en la
distribucin original, i. e., y
i
= ax
i
+b. Entonces
b x a y + = .
PROPIEDAD 3.- Sean r muestras de una poblacin siendo
r
x x ,...,
1
las
respectivas medias aritmticas, con
r
N N ,...,
1
el nmero de observaciones en
las muestras respectivas. La media en el total de las r muestras se calcula por

=
=
=
r
i
i
r
i
i
i
T
N
x N
x
1
1

Las ventajas de la media como medida de tendencia central son:
Definicin objetiva.
Utilizacin de todas las observaciones.
Tiene un significado concreto y una interpretacin sencilla e inmediata.
Es fcil de calcular.
Se presta a manipulacin algebraica (ver la propiedad 2).
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1,S2)/2009-2010




Epgrafe 1.3.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/10
Tambin presenta un gran inconveniente y es que se ve afectada por las
fluctuaciones muestrales. Esto es, resulta muy sensible a las observaciones
anmalas o outliers. Para evitar esta influencia se pueden eliminar estas
observaciones extremas y trabajar con el resto de la muestra.
Otras Medidas de Tamao o Medias (A/I).-
Si los datos evolucionan en progresin geomtrica o se rigen por leyes de
crecimiento exponencial, se usarn la media geomtrica

N
n
k
n
k
x x G = ...
1
1
, x
i
> 0, i = 1, , k.
N
k
n
i
i
x G

=
1

Observamos que el logaritmo de la media geomtrica
N
x n
G
k
i
i i

=
1
log
log
es la media aritmtica de los logaritmos de los datos.

Ejemplo 1.3.4.- Los ingresos de una empresa durante los primeros cinco
aos han sido 5
1
, 40
1
, 300
1
, 2000
1
, obtener la media de ingresos.
x =586
1

1
4
104 2000 300 40 5 = = G
Una propiedad muy importante de la media geomtrica es G x .

Media armnica (H):
Se usa con datos de tipo cociente (metros/segundo, ptas/litro,) o
precios donde asociado a cada dato haya informacin del numerador
(velocidades-distancias, precios-dinero gastado).
k
k
k
k
i
i
i
x
n
x
n
n n
H
N
x
n
H
+ +
+ +
= =

=
...
... 1
1
1
1
1

Momentos Respecto al Origen de Orden r.-
Es un concepto que surge para extender el promedio de unos datos al
promedio de los cuadrados, los cubos, etc. Es decir, considerar

=
2
2
2 i i
i i
x f
N
x n
a

=
3
3
3 i i
i i
x f
N
x n
a
Sea {x
i
, n
i
, f
i
} una ditribucin de frecuencias, se llama momento respecto
al origen de orden r, con r N, y se nota por a
r
, al n real siguiente:
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1,S2)/2009-2010




Epgrafe 1.3.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/10

=
=
=

=
k
i
r
i i
k
i
r
i i
r
x f
N
x n
a
1
1

Media a
1
x
Varianza, de gran importancia en el anlisis de la variabilidad, se calcula
por s
2
= a
2
- a
1
2
.

EJERCICIO 1.3.5.-
Sean las tablas de frecuencias del Ejercicio 1.3.2. Calcular para cada una
de ellas
A) Momento respecto al origen de orden 2.
B) Varianza

Momentos respecto al origen de una distribucin
de probabilidad

Discreta: Se dispone de una funcin de masa de probabilidad (x
i
, p
i
). As

Media

=
=
k
i
i i
x p
1
Mom. Resp. Orig.

=
r
i i r
x p

Continua: Se dispone de una densidad f(x). As

Media

= dx x xf ) ( Mom. Resp. Orig ( )

=
R
r
r
dx x f x
Momento respecto al origen de orden 1:
1
=
Momento respecto al origen de orden 2:
2
; esencial en el clculo de la
Varianza:
2
=
2
-
1
2
.

Las medias y momentos no son necesariamente datos observables.
EJEMPLO 1.3.6.- (APLICACION DE LOS CONCEPTOS ANTERIORES)
Calcular la media y la varianza para la densidad de la duracin del envo
de un mensaje por correo electrnico, en segundos, segn la densidad
( )
x
e x f
2 , 0
2 , 0

= .
x
e x F
2 , 0
1 ) (

=


= = = =
0
2 , 0
0
1
5 2 , 0 ) ( dx e x dx x f x
x
seg
0 5 2 , 0 ) (
0
2 , 0 2
0
2
2

= = = dx e x dx x f x
x
seg
2

2
1 2
2
= = 25 seg
2
.
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1,S2)/2009-2010




Epgrafe 1.3.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/10
1.3.1.2. Mediana. Medidas de Posicin o Centiles.
Sea x
1
, , x
N
un conjunto de datos, los ordenamos de menor a mayor, lo
que ser notado por x
(1)
, , x
(N)
.
A. La mediana ser notada por Me, y deja el 50% de los datos a cada
lado.
Ejemplo:

Para los datos 5, 4, 6 4,5,6; M
e
= 5.
Si los datos son 4, 5, 6, 7 M
e
= 5.5

Por tanto, si N es impar:
|
|

\
|
+
(

=
1
2
N
x Me siendo [x] la parte entera de x. Es
decir, el dato que ocupa la posicin siguiente a la posicin correspondiente al
entero anterior a N/2.
Si N es par:
2
1
2 2
|

\
|
+ |

\
|
+
=
N N
x x
Me . Es decir, el promedio de los datos
que ocupan la posicin N/2 y la posicin siguiente.

EJERCICIO 1.3.7.-
Consideremos la fotocopia de prensa en el PR (Diario EL PAIS, 11-1-
2004) cuya tabla se muestra a continuacin. Analizar dicha informacin y
extraer conclusiones.



IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1,S2)/2009-2010




Epgrafe 1.3.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/10
EJEMPLO 1.3.8.- (APLICACION DE LOS CONCEPTOS ANTERIORES)
Para la distribucin de salarios, en euros, siguiente

Variable x
i
190 200 210 220 230 240 250 260 270 280 290 300
Frec.Abs. n
i
3 3 4 4 5 5 6 8 7 6 5 4
Frec. Rel.
100 f
i %

5 5 6.7 6.7 8.3 8.3 10 13.3 11.7 10 8.3 6.7

Se tiene que
N=60
(30) (31)
x x
250 260
Me 255
2 2
+
+
= = = .
La mitad de trabajadores perciben menos de 255 . La otra mitad percibe
ms de 255 .
EJERCICIO 1.3.9.- (APLICACION DE LOS CONCEPTOS ANTERIORES)
a) Calcular la mediana de los siguientes conjuntos de datos
a1) 25, 67, 32, 12, 34, 43, 38.
A2) 25, 67, 34, 12, 34, 43, 38. 93
Interpretar su valor considerando que se trata de las edades
de un grupo de personas.

B. Centil de orden k: valor no necesariamente observado, tal que el
100k% de las observaciones sean inferiores a l, con 0k1. En el caso de una
variable discreta; ordenamos los valores de menor a mayor y
[ ] ( )
( ) [ ] ( )


+

=
+
+
Z N k
x x
Z N k x
c
kN kN
kN
k
si
2
si
1
1

Vlido slo para datos sueltos o para una tabla de frecuencias de variable
discreta.

C. Cuartilas: Q
1
=C
0.25
; Q
2
=C
0.5
; Q
3
=C
0.75
cuatro zonas de igual frecuencia,
no de igual longitud. Ver fotocopia de prensa.
EJERCICIO 1.3.10.- (APLICACION DE LOS CONCEPTOS ANTERIORES)
Para la distribucin de salarios anterior comprobar que

C
0.25
= Q
1
= 230 .
C
0.75
= Q
3
= 275 .

D. Si dividimos en 10 partes iguales de frecuencia, tenemos los deciles:
D
1
=C
0.1
; ; D
9
=C
0.9
.
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1,S2)/2009-2010




Epgrafe 1.3.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/10
E. Si dividimos en 100 partes iguales de frecuencia la muestra, tenemos
los percentiles o centiles.
F. Clculo de los centiles en datos agrupados en intervalos
El centil de orden k acumula el 100k% de la frecuencia. Razonando
geomtricamente o con proporcionalidad, resulta que c
k
= b
i
+ z.
El intervalo b
i+1
- b
i
tiene frecuencia f
i

El intervalo (b
i
, c
k
) de longitud z tiene frecuencia
k -

=
1
1
i
j
i
f
Por tanto, resulta que

f
i
b
i+1
- b
i
( )
i
j
i i
f
f k
b b z
-
1 - i
1 j
1

=
+
=
k -

=
1
1
i
j
j
f z
En consecuencia, la frmula para obtener el centil de orden k ser
i
i
j
j
i i i
i
i
j
j
i i i k
n
n kN
b b b
f
f k
b b b c


=
+

=
+

+ =

+ =
1
1
1
1
1
1
) ( ) (
Nota.- Esta frmula nos dice que el centil de orden k se calcula como lmite
inferior del intervalo ms el producto entre la longitud del intervalo y la razn de
intervalo del frecuencia
centil del orden al llegar para frecuencia
.
EJERCICIO 1.3.11.-
Consideremos las tablas de frecuencias del ejercicio 1.3.2. Calcular e
interpretar las tres cuartilas.

Ventajas Mediana y Medidas de Posicin.-

1. Definicin objetiva.
2. Interpretacin y significado directo y sencillo.
3. Sencillez de clculo, aunque no tanto a nivel computacional.
4. Robustez. No influyen las observaciones extremas u outliers.

Tambin presenta los inconvenientes de que no utiliza todas las
observaciones, as como no presentar facilidad para la manipulacin
algebraica.


IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1,S2)/2009-2010




Epgrafe 1.3.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/10
1.3.1.3. Medidas de Frecuencia. La Moda
En el caso de una variable discreta la moda es el valor de mxima
frecuencia. Se designa por Mo.
En una distribucin de frecuencia agrupada por intervalos, denominamos
intervalo modal al intervalo de mayor frecuencia.
En una primera aproximacin, la Mo es el valor de la marca de clase de
dicho intervalo:
2
1
0
+
+
=
i i
b b
M , con (b
i
, b
i+1
] el intervalo modal.
De forma ms exacta logramos que las frecuencias de los intervalos
adyacentes influyan en su valor:
d
1
= frec. intervalo moda frec. intervalo anterior
d
2
= frec. intervalo moda frec. intervalo posterior
2 1
1
1
) (
d d
d
b b b Mo
i i i
+
+ =
+

La moda permite clasificar las distribuciones en unimodales, bimodales o
plurimodales dependiendo del nmero de valores de moda que haya.
1.3.1.4. Relacin entre Media, Mediana y Moda
1. Distribucin simtrica unimodal (acampanada o parablica): x =M
e
= M
o

2. Distribucin asimtrica unimodal: x M
e
M
o


Empricamente se ha comprobado que
Me x Mo x 3
en distribucin asimtrica a la derecha/izquierda.

Conociendo dos de estas medidas podemos conocer ms o menos donde
ir la tercera.

EJERCICIO 1.3.12.-
Consideremos las tablas de frecuencias del ejercicio 1.3.2.
A) Calcular e interpretar la moda.
B) Analizar si se cumple la relacin emprica entre las tres medidas de
tendencia central.
1.3.1.5. Medias recortadas * (Ampliacin)
Son medidas de tendencia central de tipo promedio que suponen un
compromiso entre la media y la mediana. La media recortada (trimmed mean)
se calcula eliminando un porcentaje especfico de las observaciones ms
pequeas y de las ms grandes y despus calculando el promedio de las
IINF, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1,S2)/2009-2010




Epgrafe 1.3.1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/10
observaciones restantes. Por ejemplo, una media recortada al 50 % se calcula
promediando los datos que quedan una vez se elimina el 25 % inferior y el 25
% superior.
La mediana es la media recortada al 100 % y la media aritmtica es la
media recortada al 0 %.
EJEMPLO 1.3.13.- (APLICACION DE LOS CONCEPTOS ANTERIORES)
Se dispone de los siguientes datos sobre tiempos de reparacin de 10
averas, en horas, de las mquinas de un departamento de una fbrica
5, 4, 1, 0.5, 17, 6, 4.5, 6.5, 2, 9
Calcular la media, mediana y media recortada al 20 y al 50 %. Decidir cual
debera ser la imputacin de costes por avera que debera manejar la
Direccin de este departamento.

Los datos ordenados son
0.5, 1, 2, 4, 4.5, 5, 6, 6.5, 9, 17
Se verifica que
horas
, .... .
x .
+ + + +
= = =
0 5 1 9 17 545
545
10 10

( ) ( )
horas
x x
.
Me .
+
+
= = =
5 6 45 5
475
2 2

horas
R,
....
x .
+ +
= = =
20
1 9 34
425
8 8

horas
R,
.... .
x .
+ +
= = =
50
2 65 28
467
6 6

Segn los resultados se concluye que imputar unos costes por avera
superiores a 5 horas estara inflando artificialmente los costes, ya que la
presencia de una reparacin extremadamente larga es posible quizs slo
como resultado de unos factores que habitualmente no estarn presentes.
Algunos valores que podran considerarse seran los de la mediana y las dos
medias recortadas. O bien, uno intermedio entre ellos. Por ejemplo, 4.5 horas.

EJERCICIO 1.3.14.-
Consideremos las tablas de frecuencias de los ejemplos del ejercicio
1.3.1. Calcular e interpretar la media recortada al 30 %.

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/14
1.3.2. Medidas de Variabilidad
Cualquier persona que lea la prensa o escuche las
noticias econmicas se habr encontrado con la palabra
volatilidad. Por ejemplo, la noticia de la siguiente pgina
web se titulaba Jazztel cotiza voltil tras recomendar vender
Merrill.
http://es.biz.yahoo.com/060919/192/525h6.html
Con ese titular se pretende mostrar al lector la enorme
variabilidad que presentaba la cotizacin de Jazztel.
Por el contrario, a fin de captar inversores la siguiente
web habla de un tipo de fondo con escasa volatilidad y
establece que el riesgo del fondo es muy bajo.
http://www.ibercaja.es/fondos/index.php?id=a213529e
e2bffcb2a13eb177832242523268836e1e864c1061b25223a
e7c8f30
Por tanto, en este caso bajo riesgo y escasa volatilidad
se asocian con una baja variabilidad.
En otro mbito, el de la metodologa SEIS SIGMA es
imprescindible cuantificar la variabilidad de los procesos
que queramos analizar y posteriormente mejorar.
Por tanto, una vez cuantificado el comportamiento
central de unos datos o distribucin de frecuencias, es
imprescindible conocer la variabilidad o dispersin que
muestran. Para ello se pueden plantear medidas que
recojan desviaciones a una medida de tendencia central,
que se estudiarn en los epgrafes 1.3.2.1 y 1.3.2.2, o bien
medidas que recojan la extensin de los datos o de una
parte de los mismos, epgrafe 1.3.2.3.
Los enfoques anteriores muestran la dispersin de una
forma absoluta. Por ello, en el epgrafe 1.3.2.4 se
analizarn medidas de dispersin relativas que permitan
establecer comparaciones de variabilidad.

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/14
1.3.2.1. Medidas de Desviaciones. Varianza y Desviacin Tpica
Supongamos que en un proceso de verificacin de un
software se ha medido el tiempo que se emplea en
arrancarlo, en minutos, obtenindose los siguientes datos:
2.1, 1.9, 1.9, 2.2 y 2.0.
Para medir la variabilidad que muestran esos datos
podemos analizar lo que vara cada dato respecto a la
media y luego promediar esos valores. Observemos que
con las diferencias se anulara el promedio anterior, pero no
as con las desviaciones o con las desviaciones cuadrticas.
La tabla siguiente muestra el proceso.
x
i
x x
i

( )
2
x x
i

2.1 0.08 64x10
-4
1.9 -0.12 144x10
-4
1.9 -0.12 144x10
-4
2.2 0.18 324x10
-4
2.0 -0.02 4x10
-4
1 10
5
1
. =

= i
i
x ( ) 0
5
1
=

= i
i
x x ( )
4
5
1
2
10 680

=
=

i
i
x x
Se observa que 02 2. = x minutos, mientras que la
medida de variabilidad que vamos buscando, que
notaremos por s
2
, ser:
( )
4
5
1
2
2
10 136
5
=
=

i
i
x x
s min
2
Para proporcionarla en la misma unidad que los datos,
se tomara la raz cuadrada, de manera que

( )
min 0.1166 min . = = =

=
=

2 4
5
1
2
10 66 11 10 136
5
i
i
x x
s .
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/14
Los desarrollos anteriores presentan un caso particular
de dos conceptos imprescindibles en la Estadstica y sus
aplicaciones: varianza y desviacin tpica, respectivamente.
DEFINICION.-
A) Sea x
1
, , x
N
un conjunto de N datos con media
aritmtica x . Se llama varianza (resp. desviacin tpica
o estndar) de esos datos, notndose por s
2
(resp. s), al
nmero
( )
N
x x
s
N
i
i
=

=
1
2
2
(resp.
( )
N
x x
s s
N
i
i
=

= + =
1
2
2
)
B) Sea {x
i
, n
i
, f
i
} una distribucin de frecuencias, con
media x . Se llama varianza (resp. desviacin tpica o
estndar) de la distribucin de frecuencias, notndose
por s
2
(resp. s), al nmero
( )
( )

=
=
=

=
k
i
i i
k
i
i i
x x f
N
x x n
s
1
2
1
2
2
(resp.
2
s s + = )
La definicin anterior no es el procedimiento que se
sigue para calcular en la prctica la varianza o desviacin
tpica. A esos efectos se emplea lo siguiente.
PROPIEDAD 1.- Sea un conjunto de datos organizado
en una distribucin de frecuencias {x
i
, n
i
, f
i
} con media x .
Entonces
2
1 1
2
2 1
2
2
|
|

\
|
= =

= =
=
k
i
i i
k
i
i i
k
i
i i
x f x f x
N
x n
s .
O bien,
2
1 2
2
a a s = .
Significa que: La varianza es diferencia entre la media de los cuadrados y
el cuadrado de la media aritmtica.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/14
EJEMPLO 1.3.15.- (APLICACION DE LOS CONCEPTOS ANTERIORES)
Consideremos los datos de gasto, en euros, en los ltimos 8 fines de
semana: 20, 40, 35, 25, 15, 35, 50, 30. Calcular la varianza y la desviacin
tpica, informando sobre su significado.
Sabemos que la media es 31.25 . Ahora calculamos la media de los
cuadrados
2 2 2 2 2 2 2 2
2
2
20 40 35 25 15 35 50 30 8700
1087.5 /finde
8 8
a
+ + + + + + +
= = =
La varianza se obtiene como la diferencia entre este valor y el cuadrado
de la media. Es decir,
2 2 2 2
2 1
1087.5 31.25 110.9375 s a a = = =
La desviacin tpica es la raz cuadrada de este valor
110.9375 10.53 s = + =
La varianza nos informa en promedio de la variacin cuadrtica de los
gastos respectos al gasto medio, viene en unidades al cuadrado y tiene mucho
inters analtico y estadstico. Mientras que la desviacin tpica es una medida
de lo que varan los gastos respecto al gasto medio, pero no es un promedio de
desviaciones de los gastos respecto al gasto medio. Tiene un gran inters
prctico al informarnos de la variabilidad en los datos en la misma unidad que
los datos.

EJERCICIO 1.3.16.-
Sean las tablas de frecuencias del ejercicio 1.3.2. Calcular la varianza y la
desviacin tpica.

PROPIEDAD 2.- Sea {x
i
, n
i
, f
i
} una distribucin de
frecuencias con media x . La varianza de esta distribucin
se puede interpretar como el momento de inercia del
conjunto de masas {n
1
, n
2
, ..., n
k
}, colocadas en los puntos
{x
1
, x
2
, ..., x
k
}, respecto al centro de gravedad de dicha
distribucin.
La propiedad siguiente nos dice que la varianza es una
medida de dispersin ptima, ya que nos proporciona el
mnimo de los promedios de los cuadrados de diferencias a
cualquier valor a. Es decir,

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/14
( )
i i
a
i
min f x a s =

2
2
, (se alcanza en a = x )
PROPIEDAD 3.- (TEOREMA DE STEINER) Sea {x
i
, n
i
, f
i
}
una distribucin de frecuencias con media x . Entonces
( ) ( )
( )
2
1
2
1
2
a x
N
x x n
N
a x n
k
i
i i
k
i
i i
+


= =
.
O bien, ( ) ( )

= =

k
i
i i
k
i
i i
x x f a x f
1
2
1
2
, a.
La ltima propiedad nos va a decir que El cambio de
origen no influye en la varianza, sin embargo un cambio de
escala s.
PROPIEDAD 4.- Sea {x
i
, n
i
, f
i
} una distribucin de
frecuencias con varianza
2
x
S . Sea {y
i
, n
i
, f
i
} una nueva
distribucin de frecuencias tal que y
i
= ax
i
+ b. Entonces
2 2 2
x y
S a S = . Adems, S
y
= aS
x
.


Las ventajas de la varianza son:

Definicin objetiva.
Utilizacin de todas las observaciones.
Tiene un significado concreto, aunque no muy tangible.
Es fcil de obtenerla computacionalmente.
Se presta a manipulacin algebraica (ver la propiedad
4).

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/14
Sin embargo, resulta sensible a las observaciones
anmalas o outliers. Aunque su mayor inconveniente es
que aparece en unidades al cuadrado.

1.3.2.2. Desigualdad de Chebyshev. Momentos Centrales
La importancia de media y desviacin tpica queda an
ms patente con el resultado conocido como desigualdad de
Chebyshev, ya que dicho resultado justifica que ambas
sean las medidas ms relevantes de tendencia central y
variabilidad.
DESIGUALDAD DE CHEBYSHEV.-
Sea {x
i
, n
i
, f
i
} una distribucin de frecuencias
cualquiera con media x y desviacin tpica s. Sea cualquier
nmero real k 1. Entonces se verifica que el intervalo
x ks recoge al menos o como mnimo el %
|
|

\
|

2
1
1 100
k

de los datos. Por tanto, el intervalo (-, x -ks][ x +ks, +)
concentrar a lo sumo el (100/k
2
)% de la frecuencia.
Las figuras siguientes muestran los casos k = 1 y 2.
_
x+s
_
x-s
s s
Al menos el 0%
de los datos estn aqu
de los datos estn aqu
s s
_
x-2s x+2s
_
s
s
Al menos el 75%
x
_
x
_

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/14
De lo anterior se deduce que a mayor desviacin tpica
ms extensin es necesaria para garantizar un porcentaje
mnimo. As, a menor desviacin tpica menos hay que
extenderse para recoger el mismo porcentaje.

Nota.- La Wikipedia dice al respecto lo siguiente. Para ilustrar
este resultado, supongamos que los artculos de Wikipedia tienen
una extensin media de 1000 caracteres y una desviacin tpica de
200 caracteres. De la desigualdad de Chebyshev se deduce que al
menos el 75% de los artculos tendrn una extensin comprendida
entre 600 y 1400 caracteres (k = 2).

Momentos Centrales o Respecto a la Media de
Orden r
La varianza
( )

=
2
2
2
) (
x x f
N
x x n
s
i i
i i

muestra un caso particular del concepto ms general
que es el promedio de potencias de diferencias a la media.
Dada una distribucin de frecuencias {x
i
, n
i
, f
i
} con
media x , se llama momento central o respecto a la media
de orden r, siendo m
r
su notacin, a
( )
N
x x n
m
r
i i
r


= , o bien ( )

=
r
i i r
x x f m

Los momentos centrales ms importantes son:
m
1
= 0, distribucin de frecuencias
m
2
= s
2
m
2
= a
2
- a
1
2

m
3
utilizado para definir la asimetra

Varianza muestral o Cuasi-varianza.- Notada por
s
1
2
y su valor es:
( )
2
1
2
2
1
1 1
s
N
N
N
x x n
s
k
i
i i


=

=

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/14
La desviacin tpica muestral es
2
1 1
s s + = . Si N es
grande no vara casi nada. Desde el punto de vista prctico
es mejor s
1
porque nos da una mejor estimacin de la
varianza en la poblacin. s
2
infraestima la varianza de la
poblacin.

x
2
1
s
2

s
2
(inferior a
2
)

1.3.2.3. Medidas de Recorridos
Plantean medir la variabilidad determinando la longitud
en que se sita un determinado porcentaje de las
observaciones.

DEFINICION.- Se llama recorrido a la extensin de
longitud donde se sita un conjunto de datos. Notado por
R, se obtiene como
R = x
(N)
- x
(1)

- Medida sencilla de obtener. Medida de variabilidad en
controles rpidos.
- La presencia de observaciones extremas distorsiona
mucho la medida.

Recorrido intercuartlico

R
I
= Q
3
- Q
1
, que mide la extensin del 50% central.
Aqu las observaciones extremas u outliers no influyen.

Recorrido interdeclico

R
I
= D
9
- D
1
mide la extensin del 80% central.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/14
1.3.2.4. Coeficiente de Variacin de Pearson. Tipificacin
Las anteriores medidas vienen en las mismas unidades
que los datos. Por ello cuando medimos la dispersin
contabilizamos:
1) La unidad de medida
2) La variabilidad de datos.
Para realizar comparaciones necesitamos medidas de
dispersin relativas.

Ejemplo.- Supongamos la fabricacin de tornillos de
tipo A y B y medimos el dimetro, obteniendo los
resultados siguientes. Dnde hay ms dispersin?
A x = 5 mm B x = 8 mm
s
A
= 1 mm s
B
= 1 mm

Dispersin: 1/5 = 20% 1/8 = 12,5%
En A hay mayor variabilidad que en B.

A. Coeficiente de variacin de Pearson.- En una
distribucin de frecuencias de media x , y desviacin tpica
s, es:
% 100 =
x
s
g ( x 0)
Sirve para medir la variabilidad relativa intrnseca una
vez eliminado el efecto de la unidad de medida. As,
menores valores de g, indican menor dispersin intrnseca.

Al realizar un cambio de escala no vara g. Al contrario,
un cambio de origen s afecta a g.

El coeficiente de variacin de Pearson sirve para definir
la representatividad de la media en una distribucin de
datos:
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/14
1. Si g < 100, x es representativa del conjunto de
datos.
2. Si g = 100, x tiene una representatividad dudosa o
al lmite para el conjunto de datos.
3. Si g > 100, x no es representativa del conjunto de
datos.

El coeficiente de variacin de Pearson g tambin sirve
para comparar la dispersin o variabilidad entre varios
conjuntos de datos.

EJERCICIO 1.3.17.-
Sean las tablas de frecuencias del ejercicio 1.3.2.
a) Calcular el coeficiente de variacin de Pearson en cada una de
ellas, interpretando su valor.
b) Razonar la representatividad de la media en cada distribucin.
c) Comparar la variabilidad de ambas distribuciones.
B. Tipificacin de una distribucin de frecuencias.-
Permite comparar valores concretos de dos
distribuciones diferentes. Es decir, permite pasar de una
distribucin de frecuencias {x
i
, n
i
, f
i
} de media x y
desviacin tpica s
x
a otra distribucin de frecuencias {z
i
, n
i
,
f
i
}, donde la puntuacin tipificada de x
i
es:
x
i
i
s
x x
z

= .

De manera que {z
i
, n
i
, f
i
}, distribucin tipificada, es una
distribucin de frecuencias adimensional.
Para pasar de una distribucin a otra:
x
i
x
i
S
x
x
S
z

+ =
1

Esta nueva distribucin se caracteriza por: z =0, s
z
=1.
Esto es cierto para toda distribucin tipificada.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
11/14
El ejemplo que se presenta a continuacin muestra el
uso para comparaciones PARTICULARES.

Ejemplo.- Dos grupos homogneos de alumnos A,B
con dos profesores distintos y diferentes mtodos de
evaluacin obtuvieron las siguientes distribuciones de notas
A x = 6.4 B x = 5.9
s
A
= 0,8 s
B
= 0.9

Comparar las notas de dos alumnos, uno del grupo A
que obtuvo 7.3 puntos y otro del grupo B que obtuvo 7
puntos:
z
A
= (7.3-6.4)/0.8 = 1.125
z
B
= (7-5.9)/0.9= 1.222

Luego el alumno del grupo B, aunque obtuvo peor nota que
el del grupo A, en relacin con su clase fue mejor que el del
otro grupo.
1.3.3. Medidas de Simetra
Los coeficientes de asimetra permiten caracterizar
hacia que lado de la curva, izquierda o derecha, se
encuentra la cola de la distribucin as como su magnitud.

A. Coeficientes de asimetra de Pearson.-

s
Mo x
v

=
1

s
Me x
v
) (
=
3
2

=
<
>
a 0
0
0
dim
,
2 1
c n simtri distribuci
zquierda ica a la i n asimtr distribuci
erecha ica a la d n asimtr distribuci
ensionales a
v v



IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
12/14
B. Coeficiente de asimetra de Fisher.-

3
3
1
s
m
g = , donde
( )
N
x x n
m
i i


=
3
3

Acta igual que v
1
, v
2
. Las figuras que se muestran a
continuacin presentan g >
1
0, la de la izquierda, y g <
1
0 la
de la derecha.

Histogram for horsepower
0 30 60 90 120 150 180
horsepower
0
10
20
30
40
50
60
f
r
e
q
u
e
n
c
y
Histogram for RAND1
RAND1
f
r
e
q
u
e
n
c
y
3,2 3,4 3,6 3,8 4 4,2
0
10
20
30
40
50

Figura 1.3.1. Distribuciones asimtricas a la derecha y a la izquierda,
respectivamente.


Se puede calcular en una distribucin de probabilidad:
3
3
1

=
donde:

) n des. f(x ontinua co ribucin c dx en dist f(x) ) (x


creta bucin dis en distri ) (x p
i i
3
3
3


Ejemplo.- La distribucin de duracin de llamadas telefnicas
en un tipo de telfonos, con x en minutos, es:
f(x) = 0,2 e
-0,2x
. Se verifica que = 5 min, de manera que
3 0,2
3
0
( 5) 0, 2 250
x
x e dx


= =

>0 distribucin asimtrica a la


derecha.
El coeficiente de asimetra vale 2. La distribucin es
marcadamente asimtrica a la derecha. Significa que un porcentaje
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
13/14
bastante inferior a la mitad de las llamadas tendrn una duracin
superior a la media (5 minutos).

EJERCICIO 1.3.18.-
Sean las tablas de frecuencias del ejercicio 1.3.2. Calcular e
interpretar los diferentes coeficientes de asimetra.
1.3.4. Medidas de Curtosis* (Ampliacin)
Las medidas de curtosis o apuntamiento se definen en las
distribuciones de tipo campana o campaniformes, es decir,
unimodales y simtricas o con ligera asimetra. Reconocen la mayor o
menor concentracin de frecuencia en torno a la media y en la zona
central, lo que provoca un mayor o menor apuntamiento de la
distribucin. Su medida se establece, generalmente, con referencia a
una distribucin tipo, la distribucin Normal o de Gauss
1
,
discutindose entonces si es ms o menos apuntada que sta. En
dicha distribucin normal se verifica que el momento de orden cuatro
con respecto a la media es igual a 3s
4
. Se define entonces el
siguiente coeficiente:
3
4
4
2
=
s
m
g
De forma que llamamos:
- distribucin platicrtica, g
2
< 0, menos apuntada que la
normal, por lo cual presentar ms valores extremos que
una ley normal cuya media y desviacin tpica sea la de los
datos
- distribucin mesocrtica, g
2
= 0, igual que la normal
- distribucin leptocrtica, g
2
> 0, ms apuntada que la
normal, por lo cual presentar menos valores extremos que
una ley normal cuya media y desviacin tpica sea la de los
datos.
El fenmeno fat tail, propio de muchas variables financieras,
aparece cuando se observan desviaciones respecto a las leyes de
probabilidad gaussianas, por un ensanchamiento de las colas en la
distribucin de las observaciones, como se muestra en la Figura 1.3.2
(la curva a trazo discontinuo tiene mayor peso en sus colas que la
normal). Por ello, las probabilidades de encontrarnos con valores
extremos son significativamente mayores.

1
Nota: La distribucin normal es un modelo continuo campaniforme, es decir, de forma de campana,
cuyo estudio se realizar en el tema 5.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.3.2 - 1.3.3 - 1.3.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
14/14



Figura 1.3.2. Comparacin de la curva normal con una curva con
efecto fat tail

Histogram for RAND3
RAND3
f
r
e
q
u
e
n
c
y
2 2,5 3 3,5 4 4,5 5
0
10
20
30
40

Figura 1.3.3. Distribucin leptocrtica



IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/10
1.4. El Anlisis Exploratorio de Datos

Es un conjunto de tcnicas sencillas para describir y
analizar un conjunto de datos en las etapas iniciales de los
anlisis estadsticos. Fueron propuestas por Tukey, en
1977, y desde entonces han alcanzado gran aceptacin
entre los usuarios de la estadstica aplicada, habindose
incorporado en la mayora de los paquetes de software
estadstico. El anlisis exploratorio de datos,
abreviadamente AED, o EDA en ingls, est caracterizado
por representaciones que revelan el comportamiento de los
datos y la estructura de los anlisis. A continuacin vamos
a desarrollar los grficos de cajas que son las herramientas
del AED de mayor inters prctico.
1.4.1. Grficos de Cajas
Los grficos de cajas se idearon para representar un
conjunto de datos grficamente sin mostrarlos con todo
detalle, a diferencia de lo que ocurre en el diagrama tallo-
hojas. Se trata de ver donde se sitan la mediana y la
cuartilas extremas, mostrar cmo se comporta la
variabilidad y extraer la relacin que tienen con ella las
colas de la distribucin. Estos grficos permiten conocer
visualmente la globalidad de un conjunto de datos
N
x x ,...,
1
; la cantidad de variabilidad que presentan, as
como analizar caractersticas de simetra y normalidad en la
poblacin de la que proceden los datos. Adems, permiten
detectar la presencia de observaciones extremas (outliers).
Construccin de un Grfico de Cajas sin Obs.
Extremas
A partir de un conjunto de datos
N
x x ,...,
1
; se
determina la mediana, Me, las cuartilas extremas,
3 1
Q Q y ,
y se construye una caja horizontal (o vertical) cuyos lados
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/10
corresponden a las cuartilas extremas situando dentro de
la misma un segmento que corresponde a la mediana; la
altura (o anchura) de la caja no tiene un significado
especial, aunque se suele representar proporcional a N .
Del lado izquierdo (resp. derecho) o inferior (resp. superior)
de dicha caja parte un segmento que se extiende hasta el
valor mnimo (resp. mximo) de los datos, en el supuesto
de que no existan observaciones extremas. La
representacin resultante se conoce como grfico de cajas
o grfico de caja y patillas (box-and-whisker plot) y, de
manera genrica, se presenta a continuacin.

Me Q
1
Q
3
( )
x
N ( )
x
1


A nivel aproximado y con un carcter meramente
orientativo, se puede decir que para que se pueda
considerar aceptable el hecho de que unos datos proceden
de una poblacin normal, a partir del grfico de cajas, ste
debe presentar un comportamiento aproximadamente
simtrico, con unas patillas de longitud similar y tal que
cada patilla tenga una longitud superior a la longitud de la
caja, siendo conveniente que dicha longitud sea del orden
del doble de la longitud de la caja. Todo esto es ms
apropiado cuanto mayor es el tamao de la muestra y es
mucho ms relativo cuando se manejan muestras de
carcter pequeo.
Ejemplo 1.4.1.- Construir e interpretar el grfico de cajas
para los datos del ejemplo 1.3.
Aplicando lo explicado anteriormente a dichos datos
resulta el siguiente grfico, donde los datos estn
expresados en decenas de euros.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/10
Se deduce que el 25 % inferior se sita sobre una
extensin de 40 , mientras que el 25 % superior se
encuentra dentro de 25 y el 50 % central de los salarios

se sita en 45 . Como adems la mediana est ms
prxima a la patilla de la derecha que a la de la izquierda, y
es superior a la media aritmtica, representada en el
grfico por una cruz, se trata de una distribucin
ligeramente asimtrica a la izquierda lo que indica una
mayor similitud entre los salarios semanales altos de esta
empresa que entre los bajos.

19 21 23 25 27 29 31
EJEM13.salarios
Grfico de Caja y Patillas datos de Salarios

No parece que se pueda considerar razonable la
normalidad, ya que las patillas son de longitud diferente y
la de la izquierda de longitud similar a la caja mientras que
la de la derecha es incluso claramente de longitud inferior.
No obstante, este mtodo no permite descartar de manera
rotunda el carcter normal. Para esto ltimo debera
aplicarse algn mtodo de contraste de bondad del ajuste
(inferencia estadstica).
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/10

Construccin de un Grfico de Cajas con
Observaciones Extremas
Uno de los criterios para considerar que un dato es una
observacin extrema (outlier) es que se aleje de la cuartila
ms prxima ms de una vez y media el recorrido
intercuartlico. Es decir,
( ) 1
x ser considerado observacin extrema cuando
( )
RI Q x < 5 . 1
1 1

( ) N
x ser considerado observacin extrema cuando
( )
RI Q x
N
+ > 5 . 1
3
.
En este caso, la representacin del segmento izquierdo
(resp. derecho) se extender desde la primera (resp.
tercera) cuartila hasta el valor correspondiente a
RI Q 5 . 1
1
(resp. RI Q + 5 . 1
3
) y la observacin extrema
en cuestin se representar sobre la escala correspondiente
como un punto aislado.
Cuando un dato se aleje de la cuartila ms prxima
ms de tres veces el recorrido intercuartlico, ser
considerado una observacin extremadamente
extrema, o superoutlier, representndose con un punto
especial y aplicndose las consideraciones anteriores.
Por lo que respecta al resto del grfico se mantienen las
caractersticas de construccin explicadas anteriormente.

Ejemplo 1.4.2.-
Los datos incluidos en el software STATGRAPHICS
dentro de la variable horsepower del fichero CARDATA
corresponden a valores de potencia, expresado en caballos
de vapor, de 150 coches fabricados en diferentes partes del
mundo. El grfico de cajas para dichos datos se presenta
en la siguiente figura.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/10
0 30 60 90 120
150
180
horsepower
Grafico de Cajas Datos
Potencia de Coches, en CV

De esta representacin se concluye:
El 25 % inferior de valores de potencia observado en los
coches analizados se sita a lo largo de unos 25 CV,
mientras que el 25 % superior se encuentra dentro de 60
CV y el 50 % central se localiza en unos 35 CV.
La potencia media de los coches analizados es alcanzada
o superada por menos de la mitad de los coches.
Distribucin de la potencia en los coches asimtrica a la
derecha, lo que significa que en el mercado hay muchos
coches con potencia baja (inferior a 90 CV) y sin grandes
diferencias entre ellos; mientras que la presencia de
coches con potencia alta es menor y extndindose a lo
largo de un intervalo mayor, lo que constata mayores
diferencias entre estos tipos de coches. Es decir, la
interpretacin de la representacin confirma lo que ocurre
en la realidad con la potencia de los vehculos que se
encuentran circulando.
Presencia de una observacin extrema, 165 CV, que
corresponde a un vehculo con una potencia muy superior
al resto, incluidos los de mayor potencia.
Ejercicio 1.4.3.- Los datos: 0.41, 0.79, 0.53, 0.23, 0.57,
0.23, 0.69, 0.73, 0.07, 0.1; corresponden a una generacin
de 10 nmeros aleatorios entre 0 y 1. Construir e
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/10
interpretar el grfico de cajas. Se puede considerar que
esos datos proceden de una ley normal?
Grficos de Cajas Mltiples
Representando grficos de cajas verticales (u
horizontales) unos al lado (o debajo) de otros se consigue
un grfico de cajas mltiple o grfico de caja y patillas
mltiple (multiple box-and-whisker plot). Su utilidad estriba
en que, adems de poder realizar un anlisis para cada
conjunto de datos por separado, se pueden realizar
comparaciones entre conjuntos de datos lo que permitir
analizar diferencias y similitudes entre los mismos, siempre
que tenga sentido compararlos. Por ejemplo, sera
interesante para comparar el comportamiento de las
ventas diarias que realizan varios dependientes de un
mismo departamento de unos grandes almacenes. O para
comparar materiales del mismo tipo suministrados por
diferentes proveedores, o para conocer el comportamiento
de un aparato segn el banco donde se ha realizado el
ensayo, etc.

Ejemplo 1.4.4.-
Los datos incluidos en el software STATGRAPHICS
dentro de la variable horsepower del fichero CARDATA
corresponden a valores de potencia, expresada en caballos
de vapor, de 150 coches fabricados en diferentes partes del
mundo. La variable que recoge los cdigos de procedencia
de los coches, dentro del fichero CARDATA es origin (1 =
U.S.A., 2 = EUROPA, 3 = JAPON). El grfico de cajas
mltiple para dichos datos se presenta en la siguiente
figura.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/10
U.S.A. EUROPA JAPON
origin
0
30
60
90
120
150
180
H
O
R
S
E
P
O
W
E
R
(CV.)
Grafico de Cajas Mltiple
Potencia de Coches, segn origen

De esta representacin se concluye:
La potencia de los coches americanos analizados presenta
una distribucin marcadamente asimtrica a la derecha,
lo que parece descartar normalidad para ese conjunto de
datos. La mitad de estos coches de mayor (resp. menor)
potencia presentan valores para sta aproximados desde
90 hasta 165 (resp. 63 hasta 90) CV, siendo la potencia
media superior a la mediana en aproximadamente 10 CV.
Presencia de tres observaciones extremas que
corresponden a vehculos con una potencia muy superior
al resto, incluidos los de mayor potencia.
La potencia de los coches europeos analizados presenta
una distribucin de tipo simtrico, con cierto carcter de
normalidad. La mitad de estos coches de mayor (resp.
menor) potencia presentan valores para sta
aproximados desde 75 hasta 130 (resp. 45 hasta 75) CV,
siendo la potencia media superior a la mediana en
aproximadamente 5 CV. Presencia de cuatro
observaciones extremas que corresponden a vehculos
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/10
con una potencia muy superior al resto, incluidos los de
mayor potencia.
La potencia de los coches japoneses analizados presenta
una distribucin marcadamente asimtrica a la derecha,
lo que parece descartar normalidad para ese conjunto de
datos. El segundo 25 % de valores de potencia observado
en los coches analizados se sita en apenas 5 CV,
mientras que el tercer 25 % superior se encuentra dentro
de unos 20 CV. Presencia de una observacin extrema
que corresponde a un vehculo con una potencia muy
superior al resto, incluidos los de mayor potencia.
Los coches americanos analizados parecen presentar
valores de potencia superior a los europeos y los
japoneses. En concreto, ms del 50 % de los vehculos
americanos analizados tienen potencias superiores a la
tercera cuartila de los europeos. Los coches americanos
de menor potencia presentan valores que en la mayora
de los casos son superiores a la primera cuartila de los
europeos y los japoneses.
1.4.2. Grficos de Cajas con Muescas
Al representar grficos de cajas mltiples y proceder a
comparar conjuntos de datos, se tiene la tentacin de
observar que hay conjuntos de datos que son
significativamente diferentes unos de otros o de algn
conjunto de referencia. El proceso de razonamiento
subyacente en esto es buscar cajas centrales que no se
solapen, pero desafortunadamente las cuartilas que
determinan la extensin de la caja son guas inapropiadas
para determinar la significacin. Una forma de hacer esto
es utilizar regiones de solapamiento a travs de intervalos
espaciados alrededor de la mediana de cada caja. En
concreto, se determinan los lmites de los intervalos
poniendo una muesca en la parte central de la caja. La
representacin resultante se denomina grfico de caja y
patillas con muescas (notched box-and-whisker plot).
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/10
Las muescas en estos grficos se colocan
simtricamente alrededor de la mediana observada,
determinndose los puntos donde finalizan las muescas por
la expresin
N
RI
Me 58 . 1
donde el factor 1.58 combina la contribucin de las tres
fuentes diferentes siguientes:
Relacin entre RI y desviacin tpica de la poblacin.
Variabilidad de la mediana muestral.
Lmites de confianza con un nivel de confianza del 95 %.
Las cajas con muescas que no se solapan estn
indicando que las poblaciones correspondientes a esos
grupos de datos son significativamente diferentes con
respecto a la caracterstica analizada, al 5 % de
significacin. Cuando las muescas de dos cajas se solapen
podremos decir que las poblaciones correspondientes a
esos grupos de datos no presentan diferencias significativas
con respecto a la caracterstica analizada, al 5 % de
significacin.
Para profundizar en las ideas de los intervalos de
confianza, ver pginas 242-243 del tomo I del libro Curso
General Sobre Statgraphics.

Ejemplo 1.4.5.-
Para la situacin del ejemplo 1.4.4 construir e
interpretar el grfico de cajas con muescas.
La representacin resultante, mediante el software
STATGRAPHICS, se presenta a continuacin.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





1.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/10
U.S.A. EUROPA JAPON
origin
0
30
60
90
120
150
180
H
O
R
S
E
P
O
W
E
R
(C.V.)
Grafico de Cajas con Muescas
de Potencia, segn origen



De esta representacin se concluye:
Lo expresado en el ejemplo anterior.
El rango de valores que con bastante seguridad, al 95 %
de confianza, contiene a la potencia mediana de los
coches americanos ser aproximadamente 5 90 CV,
mientras que en el caso de los europeos es 5 73 CV y
para los japoneses 6 68 CV, de forma aproximada en
ambos casos.
Los coches americanos son significativamente ms
potentes que los europeos y los japoneses, no
habindose encontrado diferencias significativas entre
estos ltimos, todo ello al 5 % de significacin.

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/12
MATERIAL COMPLEMENTARIO
TEMA 1

1.1.- En las siguientes preguntas hay cuatro posibles respuestas,
razonar aquella respuesta nica que se considere correcta.
1.- Un histograma de frecuencias relativas acumuladas de una
distribucin agrupada por intervalos
A) Consiste en levantar sobre cada intervalo un rectngulo de rea
proporcional a la frecuencia relativa acumulada en dicho intervalo.
B) Permite conocer la proporcin de datos en cada intervalo
considerado.
C) Se construye bajo el supuesto de distribucin uniforme de los datos
en cada intervalo.
D) Verifica al menos dos de las tres afirmaciones anteriores.
2.- En un conjunto de datos o tabla de frecuencias, la media
aritmtica
A) Carece de significado o interpretacin geomtrica.
B) Corresponde a un valor, necesariamente observado, que divide al
conjunto de datos en dos partes con el mismo nmero de datos o
igual frecuencia.
C) Corresponde a un valor que es el que ms veces ha sido observado.
D) No verifica ninguna de las tres afirmaciones anteriores.
3.- Sea un conjunto de datos o una distribucin de frecuencias.
Entonces
A) La media de los cuadrados de las observaciones es menor o igual que
el cuadrado de la media aritmtica de dicha distribucin.
B) La desviacin tpica es el promedio de las desviaciones respecto de la
media.
C) La varianza es la media de los cuadrados de las desviaciones respecto
de la media.
D) Se verifican al menos dos de las tres afirmaciones anteriores.
4.- Una distribucin unimodal es simtrica y su media aritmtica
es 18. Se sabe que la primera cuartila es doce. Cul es el valor de la
tercera cuartila?
A) 36.
B) 20.
C) 24.
D) Nos falta informacin para su clculo.

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/12
5.- Sea una distribucin de frecuencias cualquiera con media 1000 y
desviacin tpica 100. Se puede afirmar que en el intervalo [800, 1200]
A) Se encuentra un 50 % de los datos, ya que se corresponde con
el recorrido intercuartlico.
B) Se encuentra la totalidad de los datos.
C) Se encuentran al menos el 75 % de los datos.
D) Son ciertas al menos dos de las afirmaciones anteriores.
6.- El coeficiente de variacin de Pearson
A) Es una medida de dispersin adimensional, por lo cual permite
conocer la variabilidad intrnseca de un conjunto de datos.
B) Es invariante por cambios lineales.
C) Informa sobre la parte de la desviacin tpica que se explica
por la media aritmtica.
D) Verifica al menos dos de las tres afirmaciones anteriores.

7.- Dada la distribucin de frecuencias {x
i
, n
i
}, con media x y
desviacin tpica s , consideramos la nueva variable

s
x x
z
i
i

=
A) Su media es cero y se trata de una distribucin simtrica.
B) No puede calcularse el coeficiente de variacin de Pearson de Z.
C) Su desviacin tpica puede ser distinta de 1.
D) Ninguna de las afirmaciones anteriores es verdadera.
8.- El grfico de caja y patillas se puede utilizar para
A) Conocer las medidas de posicin fundamentales de un conjunto
de datos.
B) Analizar la normalidad en la procedencia de un conjunto de
datos.
C) Determinar la asimetra y las observaciones anmalas de la
distribucin.
D) Lo indicado en al menos dos de los tres apartados anteriores.
9.- Las medidas de variabilidad
( )
n
a x
s
n
i
i
n

=
1
2
2
y
( )
1
1
2
2
1

n
a x
s
n
i
i
n

verifican que:
A)
2
n
s alcanza su mximo cuando x a = , y por tanto es una medida de
dispersin ptima.
B) Cuando x a = ,
2
n
s infraestima la varianza poblacional
2
, por lo que
es recomendable utilizar
2
1 n
s en la prctica.
C) Cuando 0 = a , ambos estimadores son equivalentes.
D) Las tres afirmaciones anteriores son ciertas.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/12
1.2.- Los siguientes datos corresponden al nmero de partes presentados
durante un ao por 60 plizas de seguro de automviles con la cobertura de
todo riesgo.
2, 4, 5, 0, 0, 2, 1, 3, 3, 3, 4, 1, 1, 3, 2, 0, 2, 1, 1, 3, 0, 2, 0, 1, 1, 1, 2, 0,
4, 3, 2, 3, 3, 5, 1, 7, 1, 2, 2, 4, 0, 2, 1, 5, 6, 3, 2, 4, 2, 3, 6, 1, 2, 2, 0, 0,
3, 3, 2, 4.
Se pide:
a) Organizar este conjunto de datos en una tabla de frecuencias.
Interpretar dicha tabla. Representarla grficamente.
b) Construir e interpretar la tabla de frecuencias ascendente.
c) Construir e interpretar la tabla de frecuencias descendente.
d) Construir e interpretar la tabla de frecuencias complementaria
de la ascendente.
1.3.- Los siguientes datos corresponden a la memoria del disco duro, en
centenas de GigaBytes, de 25 ordenadores porttiles:

1.8 1.6 2.3 1.5 2.3 1.3 2.3 1.9 2.3 1.8 1.9
2.4 1.8 1.6 2.1 2.4 1.5 1.6 1.8 2.2 2.1 2.6
2.2 1.9 2.7

Se pide, tanto sin ayuda de ordenador como con ayuda de software,
lo siguiente.
a) Clasificar los datos en 5 clases.
b) Construir la tabla de frecuencias. Interpretarla.
c) Representar el histograma de frecuencias absolutas y el
polgono de frecuencias relativas. Interpretarlos.
d) Dibujar el histograma de frecuencias absolutas acumuladas y el
correspondiente polgono de frecuencias. Interpretarlos.
e) Calcular e interpretar las principales medidas de tendencia
central, tanto si los datos se consideran sin agrupar por
intervalos, como agrupndolos. Comentar las diferencias.
1.4.- Los siguientes datos corresponden a medidas de intensidad solar, en
watios/m
2
, a lo largo de diferentes das en una localidad del sur de Espaa:
562, 869, 708, 775, 775, 704, 809, 856, 655, 806, 878, 909, 918, 558,
768, 870, 918, 940, 946, 661, 820, 898, 935, 952, 957, 693, 835, 905,
939, 955, 960, 498, 653, 730, 753.
a) Organizar este conjunto de datos en una tabla de frecuencias
agrupadas por intervalos. Interpretar dicha tabla.
b) Construir e interpretar la tabla de frecuencias ascendente.
c) Construir e interpretar la tabla de frecuencias descendente.
d) Construir e interpretar la tabla de frecuencias complementaria
de la ascendente.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/12
1.5.- Se observa el tanto por ciento de memoria que ocupa una tarea en
ocho momentos en tres ordenadores distintos. Los resultados obtenidos
fueron:
Ordenador 1: 23; 25; 22; 22; 25; 20; 23; 24.
Ordenador 2: 14; 27; 25; 20; 20; 28; 20; 30.
Ordenador 3: 23; 22; 18; 19; 20; 24; 23; 35.
Se pide:
a) Calcular la media, la mediana y la moda de cada una de las
tres muestras. Interpretar los resultados.
b) Calcular la varianza, la desviacin tpica y el coeficiente de
variacin de las tres muestras. Interpretar los resultados.
1.6.- Una muestra de seis resistencias proporcion los siguientes datos, en
ohmios,
x
1
= 45, x
2
= 38, x
3
= 47, x
4
= 41, x
5
= 35 y x
6
= 43.
a) Calcular la media y la mediana, interpretndolas.
b) Calcular la varianza y desviacin tpica muestral por la frmula
de clculo.
c) Calcular la varianza y desviacin tpica muestral utilizando la
definicin.
d) Restar 35 a cada uno de los datos originales de resistencias y
calcular la nueva media, mediana, varianza y desviacin tpica
muestral. Comparar los resultados con los obtenidos en los
apartados a) y b).
e) Si los resultados fuesen 450, 380, 470, 410, 350 y 430 ohmios,
se podran utilizar los resultados de los apartados anteriores
de este problema para calcular la nueva media, mediana,
varianza y desviacin tpica muestral? Cmo?
1.7.- Consideremos los datos del problema 1.2. Se pide:
a) Calcular las diferentes medidas de tendencia central,
interpretando los resultados obtenidos.
b) Calcular las diferentes medidas de variabilidad, interpretando
los resultados obtenidos.
c) Calcular las diferentes medidas de asimetra, interpretando los
resultados obtenidos.
AMPLIACION.-
d) Calcular la media recortada al 30 %.
e) Calcular la medida de curtosis, interpretando el resultado
obtenido.
1.8.- La multinacional del software NETWORLD, en su intento de ofrecer el
mejor servicio a sus clientes, ha puesto en marcha el programa EASY
DOWNLOAD. Para proporcionar a sus futuros clientes la mxima
informacin sobre este software ha registrado los datos de 50 ficheros que
se han bajado de la red sobre la variable X: tiempo empleado, en horas, en
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/12
llevarse a cabo el proceso de bajada del fichero. Los datos obtenidos figuran
en la tabla siguiente.

Interv. (0.5,1.5] (1.5,2.5] (2.5,3.5] (3.5,4.5] (4.5,5.5] (5.5,6.5]
Frec.
Abs.
5 10 12 12 8 3

Se pide:
a) Construir e interpretar el histograma de frecuencias absolutas y
el polgono de frecuencias relativas acumuladas para los datos
de la variable X.
b) Obtener e interpretar la tabla de frecuencias de supervivencia.
c) Calcular las diferentes medidas de tendencia central,
interpretando los resultados obtenidos.
d) Calcular las diferentes medidas de variabilidad, interpretando
los resultados obtenidos.
e) Calcular las diferentes medidas de asimetra, interpretando los
resultados obtenidos.
f) La compaa telefnica factura la hora de conexin a la red a 2
. Cmo se veran afectados los resultados obtenidos en los
apartados anteriores?
1.8_BIS.- (Propuesto en prueba de clase)
En unos grandes almacenes los ingresos semanales del Departamento
A, en miles de euros, se presentan en la siguiente tabla.
X n semanas
(3, 4] 4
(4, 5] 6
(5, 6] 10
(6, 7] 12
(7, 8] 18
a) Calcular la media. Qu previsin o prediccin de ingresos
haramos para las prximas 8 semanas?
b) Calcular e interpretar la mediana.
c) Calcular de manera razonada la desviacin tpica.
d) Evaluar de manera razonada la representatividad de la media para
esa distribucin de frecuencias.
1.8_TRIS.- (Propuesto en prueba de clase)
El tiempo de espera en horas, en vuelos retrasados en un aeropuerto
peninsular durante el ltimo mes, viene reflejado en la siguiente tabla:



IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/12
X n vuelos
(0.5, 1.5] 15
(1.5, 2] 11
(2, 2.5] 10
(2.5, 3] 6
(3, 5] 3
a) Obtener las medidas de tendencia central e interpretarlas.
b) Sin realizar ningn clculo adicional, es una distribucin
simtrica?, explica su significado sobre la tabla anterior.
1.9.- La empresa de colonias FRAGRANCES Inc. ha recogido datos sobre las
ventas mensuales, en unidades de millar, de la nueva colonia para mujeres
llamada MANEATER
56.15; 54.50; 55.27; 52.54; 56.23; 55.97; 55.55; 54.32; 55.14;
54.28; 55.78; 55.65; 54.96; 55.06.
Se pide:
a) Hallar la moda y la mediana. Interpretar estas dos medidas.
b) Construir el grfico de cajas para estos datos. Interpretar dicho
grfico.
c) Si cada frasco de colonia se va a vender a un precio de 24 ,
calcular el valor medio de ingresos al mes junto con la
desviacin tpica en los ingresos.
1.10.- En un proceso de fabricacin se utiliza una mquina para cortar
planchas metlicas. Los siguientes datos corresponden a la duracin de
estas mquinas, en horas, hasta que se ha producido un fallo en las
mismas.
13.2, 67.8, 76.0, 59.0, 30.0, 26.7, 26.0, 68.0, 30.1, 76.3, 43.5.
Se pide:
a) Calcular e interpretar las medidas de tendencia central y de
variabilidad para este conjunto de datos.
b) Obtener el grfico de cajas para estos datos.

1.10_BIS.- En un proceso de fabricacin de placas se han obtenido los
siguientes datos del espesor de las mismas, en mm.
2.11, 2.43, 2.03, 1.56, 1.87, 1.98, 2.62, 2.04, 1.73
Se pide:
a) Construir e interpretar el grfico de cajas.
b) Determinar e interpretar el coeficiente de apuntamiento de Fisher.
Relacionar este anlisis con el anterior.
1.11.- En la ciudad de Falling Rock estn interesados en estimar la cantidad
de agua necesaria para los prximos diez aos. Por esta razn, se ha
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/12
encargado un estudio para conocer el consumo de agua actual en una
muestra de 15 familias. Los datos de consumo de agua, en miles de
galones, durante el ao pasado, son los siguientes:

11.2 21.5 16.4 19.7 14.6 16.9
32.2 18.2 13.1 23.8 18.3 15.5
18.8 22.7 14.0

Se pide:
a) Obtener e interpretar la cantidad media y la cantidad mediana
de agua que ha consumido una familia el ao pasado.
b) Obtener e interpretar las diferentes medidas de variabilidad
sobre la cantidad de agua que ha consumido una familia el ao
pasado.
c) Construir el grfico de caja y patillas para los datos anteriores.
Interpretar el grfico resultante.
d) Para los prximos diez aos se espera que 45.000 familias
vivan en Falling Rock. Cuntos galones de agua por ao sern
necesarios para abastecer a la poblacin, si se sabe que las
pautas de consumo de agua en las familias no se van a
modificar?
1.12.- En un estudio sobre el precio, en dlares, de la habitacin doble en
los hoteles de Boston, se ha obtenido la siguiente tabla de frecuencias,
correspondiente a una muestra.

Interv. (20,40] (40,60] (60,80] (80,100] (100,140] (140,180] (180,260]
Frec.
Abs.
2 8 18 11 6 4 1

Suponiendo que el cambio del dlar es 1 $ = 1.1 , se pide:

a) Construir el histograma y el polgono de frecuencias relativas
sin acumular asociados a esta tabla, para que el rea bajo los
mismos sea la unidad. Cuntos hoteles de Boston nos ofrecen
una habitacin doble por un precio entre 70.3 y 97.66 ?
b) Construir e interpretar la tabla de frecuencias acumuladas.
c) Calcular el precio medio, el precio mediano y el precio de moda
de una habitacin doble en Boston. Obtener la desviacin tpica
entre los precios de la habitacin doble en los hoteles de
Boston.
d) Qu tipo de distribucin siguen los precios en Boston? Por
qu?
e) Si el precio medio por habitacin doble en otra ciudad, que
figura en un ranking de las ciudades ms caras de U.S.A., es
de 64.31 , podemos decir categricamente cul de las dos
ciudades es ms cara en cuanto alojamiento? Si adems se
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/12
sabe que la desviacin tpica de los precios en dicha ciudad es
de 64.31 , en cul de las dos ciudades la oferta de hoteles es
ms variada en cuanto a precios?
1.13.- La empresa DULCESA ha cotizado en bolsa durante un ao a una
media diaria de 7,5 , con una desviacin tpica de 0,8 . El Banco Espaol
Internacional (BEI), durante el mismo periodo, lo ha hecho con una media
diaria de 10,25 y una desviacin tpica de 1,25 . Un inversor compr en
ese ao acciones de DULCESA a una cotizacin de 7,58 , as como del BEI
a 10,35 .
Se pide:
a) Utilizar una de esas empresas para explicar lo que es la
desviacin tpica de un conjunto de datos. Analizar en ese
ejemplo la importancia de la desviacin tpica y de la media,
segn la desigualdad de Chebyshev.
b) En qu empresa fue ms interesante invertir? Por qu?
c) Un agujero descubierto en la gestin del BEI ha hecho que la
cotizacin de sus acciones se reduzca en un 30 %, adems de
perder todas sus acciones 1 . Cul es la nueva cotizacin
media de las acciones del BEI? Cunto vale ahora la
desviacin tpica entre las cotizaciones diarias?
1 1. .1 14 4. .- - Una compaa de seguros de automviles paga por cada siniestro
en media 600 con una desviacin tpica de 200 . Suponiendo que no se
conoce la distribucin de frecuencias de estos pagos, se pide:
a) Obtener el intervalo centrado en la media que recoger al
menos las dos terceras partes de los pagos.
b) Determinar la proporcin mxima de pagos que quedarn fuera
del intervalo [300, 900].
c) Es posible que no haya ningn pago en el intervalo [380,
820]? Razonar la respuesta.
1 1. .1 15 5. .- - La ingeniera presenta con frecuencia la problemtica de definir
mtricas para los procesos en estudio. Un ejemplo reciente aplicado al
mbito de la usabilidad se puede consultar en
http://www.measuringusability.com/sauro-kindlund_paper.pdf

Tarea n Especificacin
(seg)
Media muestral
(seg)
Desviacin tpica
muestral (seg)
1 150 140 35
2 180 190 15
3 120 150 40
4 240 220 25
5 205 210 30
Nota.- La usabilidad es la caracterstica y medida que se considera para
identificar la facilidad de uso de un elemento. Por ejemplo, en ergonoma
(ciencia que estudia la forma de adecuar al hombre a su medio de trabajo
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/12
para mejorar la productividad y el rendimiento) es una caracterstica muy
importante, as como en desarrollos de hardware y de dispositivos para
personas con minusvalas.
En una fbrica se ha evaluado el tiempo correspondiente a cinco
tareas a travs de diferentes muestras. La tabla anterior muestra
informacin de las tareas y de las muestras.

Se pide lo siguiente.
a) Establecer de manera razonada una jerarqua entre las tareas de
menor a mayor variabilidad.
b) Establecer de manera razonada una jerarqua entre las tareas de
mejor a peor definicin de las especificaciones.
c) Proponer de manera razonada una jerarqua para los niveles de
calidad logrados en cada tarea. Ayuda.- Consultar el artculo
anterior.
1.16.- En un proceso de fabricacin de unas barras de acero se ha medido
la longitud de cinco barras cada hora sobre un total de tres turnos de
trabajo, obtenindose los datos que se presentan a continuacin,
expresados en mm.

Nm.
de
subgrup
Turno-
Hora
x
1


x
2


x
3


x
4


x
5


x


R


1 A-9 96.6 100.2 96.3 101.7 97.6
2 A-10 100.9 101.5 97.4 93.9 101.8
3 A-11 104.1 102.4 96.3 96.8 96.5
4 A-12 106.2 102.9 99.2 103.4 96.8
5 A-13 107.0 97.2 98.7 101.3 91.7
6 A-14 105.9 96.4 98.3 95.4 99.7
7 A-15 100.5 97.6 102.7 100.1 100.8
8 A-16 101.8 99.1 98.3 101.3 98.5
9 B-17 104.2 101.0 101.0 96.4 98.9
10 B-18 104.4 99.1 96.7 95.5 97.1
11 B-19 99.1 97.5 106.8 100.5 99.8
12 B-20 99.5 100.7 96.3 96.7 100.2
13 B-21 99.9 97.4 102.1 101.8 97.3
14 B-22 99.4 99.9 103.0 100.7 106.2
15 B-23 99.2 98.6 97.5 98.9 102.3
16 B-24 101.2 102.0 100.8 107.2 98.3
17 C-9 101.8 98.5 101.5 98.9 102.2
18 C-10 105.5 95.5 94.3 100.0 96.9
19 C-11 100.9 103.4 97.7 98.0 97.2
20 C-12 103.4 104.5 96.8 103.0 101.9
21 C-13 101.0 98.1 100.4 100.5 101.7
22 C-14 102.3 93.4 105.0 103.7 97.8
23 C-15 102.5 105.0 99.4 98.8 100.3
24 C-16 99.5 101.3 101.8 97.4 102.6
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/12
Estos datos suministrarn conocimientos tcnicos y estadsticos
importantes sobre el proceso desde el punto de vista del control.

Se pide:

a) Organizar este conjunto de 120 datos en una tabla de
frecuencias agrupadas por intervalos. Interpretar dicha tabla.
b) Construir e interpretar la tabla de frecuencias ascendente.
c) Representar el histograma y el polgono de frecuencias
relativas. Interpretar.
d) Dibujar el histograma de frecuencias absolutas acumuladas y el
correspondiente polgono de frecuencias. Interpretar.
e) Completar las dos ltimas columnas de la tabla anterior.
Repetir los apartados anteriores para los 24 datos de la
columna que recoge la media de cada grupo de 5 datos.
Extraer conclusiones.
f) Construir un grfico de cajas mltiple para los datos de la tabla
global por turno de trabajo. Extraer conclusiones.

1 1. .1 17 7. .- - A partir de los siguientes valores, obtenidos de una muestra
de datos,


a) Determinar qu diagrama de caja, de los cuatro expuestos, le
corresponde, indicando las razones de su aceptacin y las del
rechazo de los otros:

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
11/12
b) Si se sustituye el valor mximo por otro que sea 5 veces su valor,
responder, justificando la respuesta, qu ocurre con cada uno de
los siguientes parmetros, en cuanto a si mantiene su valor o,
por el contrario, aumenta:
Media, Mediana, Moda, Rango intercuartlico y Varianza.
1.18.- (Estadstica Descriptiva y Anlisis de Datos con
STATGRAPHICS) El fichero EXCEL Coches03, que se encuentra en el PORTAL
DE RECURSOS, contiene datos sobre 130 coches para algunas variables
como:
Potencia
Peso
Consumo
Aceleracin
Precio
Velocidad Mxima

Se pide:
a) Organizar los datos de consumo en una tabla de frecuencias
agrupadas por intervalos. Interpretar dicha tabla.
b) Organizar los datos de Revoluciones Mximas en una tabla de
frecuencias. Hay que agrupar por intervalos? Interpretar dicha
tabla.
c) Construir el histograma de frecuencias relativas asociado a la
variable de peso, interpretando su significado.
d) Construir el polgono de frecuencias acumuladas asociado a la
variable de potencia, interpretando su significado.
e) Para los datos de precio, calcular las principales medidas de
tendencia central, variabilidad y asimetra; interpretando los
resultados.
f) Construir e interpretar el grfico de cajas asociado a las variables
de consumo y precio.
g) Construir e interpretar el grfico de cajas mltiple para la variable
Velocidad Mxima, segn el tipo de vehculo.
1 1. .1 19 9. .- - En la web del departamento, en su apartado de material docente,
http://www.doi.icai.upco.es/MaterialDocente.htm, en la parte de
Estadstica, se encuentra el enunciado de un problema real y el fichero
correspondiente. Para las variables de inters (alguna puede ser necesario
construirla), se pide lo siguiente.
a) Construir e interpretar los polgonos de frecuencias e histogramas.
b) Obtener e interpretar las principales medidas estadsticas de
tendencia central, variabilidad, simetra y apuntamiento.
c) Construir e interpretar los grficos de cajas.

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Material Comp. Tema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
12/12
BIBLIOGRAFIA COMPLEMENTARIA
TEMA 1 (EST. DESC. - ANALISIS DE DATOS)

Berenson, M. L. and Levine, D. M. (1992). Basic Business Statistics,
Concepts and Applications. Fifth Edition. Prentice Hall. New Jersey.
Calot, G. (1988). Curso de Estadstica Descriptiva. 5 Edicin. Editorial
Paraninfo. Madrid.
Martnez, W. L. (2004). Exploratory Data Analysis with MATLAB.
Editorial Chapman & Hall.
Quesada, V.; Isidoro, A. y Lpez, L. A. (1982). Curso y Ejercicios de
Estadstica. Editorial Alhambra. Madrid.
Ratto, L (1990). El Anlisis ABC en la Empresa. La Ley de Pareto.
Ediciones Deusto. Bilbao.
Tomeo, V. y Ua, I. (1989). Diez Lecciones de Estadstica Descriptiva.
Editorial AC. Madrid.
Velleman, P. F. and Hoaglin, D.C. (1981). Applications, Basics, and
Computing of Exploratory Data Analysis. Duxbury Press. Boston,
Massachusetts.
AGRADECIMIENTO.-
El fichero del problema 1.18 ha sido facilitado por el grupo de alumnos de 1 de
Organizacin Industrial (curso 2003-2004): Csar Cmara, David Llamazares, Carlos
Fuertes y Diego Martn. A todos ellos se les agradece la creacin de este interesante fichero
a partir de la informacin proporcionada por una revista de automocin.
El problema 1.17 ha sido propuesto por la profesora Ainhoa Ercoreca.

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Solucin Material Comp. Tema 1 Carlos Mate
25 aos (1984-2009) de docencia en ICAI

1/2
SOLUCIONES A CUESTIONES Y ALGUNOS
PROBLEMAS DEL MATERIAL
COMPLEMENTARIO
TEMA 1
1.1.- 1.- B). 2.- D). 3.- C). 4.- C) 5.- C).
6.- A). 7.- B). 8.- D). 9.- B).
1.5.- a) 23 1 x =

, Me1 = 23, Mo1 = 22, 23 y 25.


23 2 x =

, Me2 = 22.5, Mo2 = 20.


23 3 x =

, Me3 = 22.5, Mo3 = 23.


b) s(ord.1) = 1.58, C.V.1 = 6.875 %.
s(ord. 2) = 5.025, C.V.2 = 21.85 %.
s(ord. 3) = 4.95, C.V.3 = 21.52 %.
1.6.- a) =

5 . 41 x , Me = 42 .
b)
2 2
1
87788 . 19 = s , = 4585 . 4
1
s .
c)
2 2
1
87788 . 19 = s , = 4585 . 4
1
s .
d) =

5 . 6 x , Me = 7 ,
2 2
1
87788 . 19 = s , 4585 . 4
1
= s .
e) S. Multiplicndolos por 10 excepto la varianza que se deber
multiplicar por 100.
1.7.- a) 26 . 2 =

x , Me = 2, Mo = 2, Q1 = 1, Q3 = 3,
b) 729 . 2
2
= s , s = 1.652, RI = 2, C.V.= 72.8 %.
c) 738 . 0
1
= g .
d)
R,
....
x ,
+ +
= =
30
112 4 3
2 14286
42


1.9.- b) 5 . 54
1
= Q , 205 . 55
2
= Q y 78 . 55
3
= Q . RI = 1.28.
( )
54 . 52
1
= x es la nica observacin extrema.
1.10.- a) 96 . 46 =

x horas, Me = 43.5 h, Q1 = 26.7 h, Q3= 68.0 h,


RI = 41.3 horas,
2
horas 77 . 481
2
= s , s = 21.95 horas,
C.V.= 46.74 %.
1.11.- a) 46 . 18 =

x miles de galones, Me = 18.2 miles de g.


IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Solucin Material Comp. Tema 1 Carlos Mate
25 aos (1984-2009) de docencia en ICAI

2/2
b) galones) de (miles 18 . 25
2 2
= s , s = 5.02 miles de g.,
c) Q1 = 14.6 miles de g., Q3 = 21.5 miles de g.,
RI = 6.9 miles de galones, Rango = 21 miles de g.
La representacin, realizada con SPSS, se muestra a continuacin.

15 N =
PROB113
40
30
20
10
0
7


d) Se esperan 830.700 miles de galones.
1.12.- a) El 19.3%.
c) $ 8 . 85 =

x , Me = 76.66 $, Mo = 71.76 $, s = 36.9 $.


d) Asimtrica a la derecha: 4 . 1
1
= g .
e) No se puede decir categricamente pues, en dlares, la media
de la otra ciudad es 82.3. En cuanto a la variacin
C.V.(Boston) = 43 %, C.V. (otra ciudad) = 100 %. Es ms
variada la segunda.
1.13.- a) Dulcesa: k = 2 --- (5,9,9,1) al menos el 75% de los das.
k=3 --- (5,1,9,9) al menos el 88,89% de los das.
BEI: k=2 --- (7,75,12,75) al menos el 75% de los das.
k=3 --- (6,5,14) al menos el 88,89% de los das.
b) Tipificando: Dulcesa = 0.1, BEI = 0.08; interesa en BEI porque
el precio relativo es ms bajo, aunque en mabas empresas el
inters es muy similar.
c) Nueva cotizacin media BEI = 6.175
Nueva desviacin tpica = 0.875
Nota sobre las interpretaciones.-
Para llegar a manejar con soltura las interpretaciones estadsticas se
pueden consultar los problemas resueltos que hay en los libros, bien sean
de texto o de apoyo, como un elemento adicional al necesario seguimiento
diario de la asignatura y la atencin en clase.

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.1 - 2.3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/9
TEMA 2 ESTADSTICA DESCRIPTIVA Y
ANLISIS DE DATOS BIDIMENSIONAL.
REGRESIN Y CORRELACIN
En el estudio de cualquier fenmeno, sea de ingeniera o no,
tenemos que distinguir y analizar los factores o variables que
intervienen en el mismo y lo determinan (anlisis multidimensional).
En general, nos interesar primero estudiar la relacin existente entre
slo dos aspectos (anlisis bidimensional).
Por ejemplo, al trabajar con motores elctricos de corriente
alterna, podemos estudiar varios aspectos como son el nmero de
polos, el peso, la potencia nominal, el par mximo, el rendimiento,
etc. Sin embargo, para un estudio concreto nos puede interesar la
relacin de la potencia nominal y el rendimiento de la mquina.
En el caso de analizar una red de 20 ordenadores con una nica
impresora, podemos estudiar varios aspectos durante un da como
son
el nmero de tareas procesadas,
el nmero de fallos del sistema,
la proporcin de tiempo que ha estado ocupada la
impresora,
la tasa de ocupacin de los ordenadores,
la cantidad de memoria RAM utilizada, etc.
Sin embargo, para un estudio concreto nos puede interesar
analizar con datos diarios la relacin entre
el nmero de fallos del sistema y
el nmero de tareas procesadas.
A esta intencin responde el anlisis de datos bidimensional, al
anlisis conjunto de dos variables estadsticas.
2.1. Representacin Simultnea de Dos o ms
Caractersticas Cualitativas*
Este epgrafe forma parte del programa de ampliacin y puede
consultarse en los libros de apoyo.
2.2. Representacin de una Variable Bidimensional
Cuantitativa
Para representar conjuntamente los datos de dos variables
cuantitativas destacan tres representaciones que pasamos a
comentar.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.1 - 2.3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/9
2.2.1 Tabla de Frecuencias Bidimensional
Un anlisis bidimensional cuantitativo se puede llevar a cabo
segn el tipo de informacin disponible.

Un conjunto de datos bidimensional (C.D.B.). Como, por ejemplo,
cuando de una serie de mquinas elctricas o de ordenadores
tomamos dos medidas como peso y potencia, o bien memoria
ROM y velocidad del procesador. Tambin se presentar esta
situacin en la calibracin de un aparato donde realizamos N
medidas, obteniendo en cada medida un par de valores, uno
patrn y otro del elemento a calibrar.
Una distribucin de frecuencias bidimensional (D.F.B.), o tabla de
frecuencias bidimensional, donde cada pareja de datos tiene una
frecuencia asociada. Este hecho aparece, por ejemplo, al tratar de
analizar la relacin que en las familias presentan las variables
nmero de hijos y nmero de coches.

Dentro de las ingenieras lo ms habitual es recoger datos de
dos variables X e Y en cada unidad estadstica, dando lugar a N
puntos o parejas (x
i
, y
i
). Estos datos se podrn representar (ver
Ejemplo 2-1) en una tabla como la siguiente.

x
i
y
i
x
1
y
1

x
N
y
N

Tabla 2-1
Ejemplo 2-1. (C.D.B.)
En un estudio de eficacia de un sistema operativo se est
tratando de ver la relacin entre el porcentaje de utilizacin de la
CPU, Y, y el nmero de programas que se encuentran en ejecucin,
X. Para ello se seleccionaron los siguientes datos:

X 1 2 3 4 5 6 7 8 9 10
Y 20 36 48 60 66 74 80 84 87 89

Generalizando, se puede introducir la idea de la frecuencia
para recoger el fenmeno de la repeticin de la ocurrencia de las
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.1 - 2.3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/9
parejas de datos de la variable estadstica bidimensional (X, Y). Ello
conduce a la tabla de frecuencias bidimensional que es una
estructura para representar la informacin anterior, donde los datos
se han organizado y clasificado, asignando a cada pareja una
frecuencia: {(x
i
,y
j
) con frecuencias n
ij
, f
ij
} (ver Ejemplo 2-2):
y
j
x
i
y
1
y
2
y
j
y
k

x
1
n
11
n
12
n
1j
n
1k
n
1
x
2
n
2

x
i
n
i1


n
ij
n
ik
n
i

x
h
n
h1
n
hk
n
h
n
1
n
2
n.
j
n
k
N
Tabla 2-2

y
j
x
i
y
1
y
2
y
j
y
k

x
1
f
11
f
12
f
1j
f
1k
f
1
x
2
f
2

x
i
f
i1
f
ij
f
ik
f
i

x
h
f
h1
f
hk
f
h
f
1
f
2
f.
j
f
k
1
Tabla 2-3
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.1 - 2.3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/9
Si dividimos los elementos de la tabla 2-2 entre N obtenemos la
tabla de frecuencias relativas bidimensional (Tabla 2-3).
Las tablas bidimensionales se caracterizan por las siguientes
relaciones.
-

=
=

k
j
ij
n
i
n
1
,
1
k
j
f f
i ij
=
=


, i= 1, , h. Frecuencias marginales
asociadas a los valores o intervalos de la variable X.
-

=
=

h
i
ij
n
j
n
1
,
1
h
i
f f
j ij
=
=


, j= 1, , k. Frecuencias marginales
asociadas a los valores o intervalos de la variable Y.
-
=

=
=

=
k
j
j
n
h
i
i
n N
1 1
; 1
1 1
h k
f f
i j
i j
= =

= =

- = =
j i
ij
n
i j
ij
n N ; 1 f f
ij ij
i j j i
= =
Ejemplo 2-2. (D.F.B.)
La cadena de talleres de reparacin de automviles PROAUTO
(profesionalidad para su automvil), en su intento de ofrecer el mejor
servicio a sus clientes, ha puesto en marcha el programa REVISIN Y
DIAGNSTICO TOTAL DE SU VEHCULO. Para proporcionar a sus
futuros clientes la mxima informacin sobre ese programa ha
registrado los datos de 50 vehculos a los que ha aplicado el
programa anterior sobre las variables X: miles de kilmetros de un
vehculo al iniciar el programa, e Y: tiempo empleado, en horas, en
las operaciones de revisin y diagnstico de un vehculo. Los datos
obtenidos figuran en la tabla siguiente.

X \ Y (0.5, 1.5] (1.5, 2.5] (2.5, 3.5] (3.5, 4.5] (4.5, 5.5] (5.5, 6.5]
(0, 20] 4 1 0 0 0 0
(20, 40] 1 5 1 0 0 0
(40, 60] 0 3 7 2 0 0
(60, 80] 0 1 2 5 2 0
(80, 100] 0 0 2 3 2 1
(100, 140] 0 0 0 1 3 1
(140, 200] 0 0 0 1 1 1
Cules son las frecuencias relativas marginales en X e Y?
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.1 - 2.3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/9
2.2.2 Diagrama de Dispersin
El diagrama de dispersin representa sobre un sistema
cartesiano un conjunto de datos bidimensionales. Esta grfica puede
sugerirnos, ver Figura, que entre las variables hay una ausencia de
cualquier relacin, presencia de relacin lineal, o bien una presencia
de otras relaciones distintas a la lineal (parablicas, etc.).


Figura 2.2-1 Diagrama de dispersin

Dos variables se pueden relacionar de forma directa o inversa:
- Relacin directa: si aumentamos una variable la otra incrementa
su valor. Ejemplo: un aumento de los salarios conlleva un
aumento del consumo. A mayor temperatura mayor consumo de
agua.
- Relacin inversa: si aumentamos una variable la otra disminuye.
Ejemplo: si aumentamos los precios de los productos disminuye el
consumo. A mayor nivel de formacin menor nivel de precariedad
en el trabajo. Ver el siguiente documento
http://www.siteal.iipe-
oei.org/modulos/DebatesV1/upload//deb_37/art_67/SITEAL%20Deba
te%202%20Kritz%20Art%C3%ADculo.pdf
Se han propuesto diversas modificaciones a los diagramas de
dispersin. Una de las ms interesantes es la supresin de algunos de
los puntos. Otra consiste en mostrar junto al diagrama de dispersin
yj
i x X
Y

IINF, ITIM, ITIE, ITIEI, ITIG/S


Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.1 - 2.3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/9
el grfico de cajas de cada una de las variables por separado. Por
ejemplo, la Figura 1.6.2 (generada con MINITAB) muestra la relacin
que se plantea en una reaccin qumica, entre la variable de entrada
(independiente) X1, temperatura, y la variable de rendimiento
(dependiente) Y1, porcentaje de material inicial no alterado.

153 158 163 168 173 178
0
10
20
30
40
50
x1
y
1

Figura 2.2-2 Diagrama de dispersin modificado
2.2.3 Histograma Tridimensional
Este epgrafe forma parte del programa de ampliacin y puede
consultarse en los libros de apoyo.
2.3. Distribuciones de Frecuencias Asociadas a una Tabla de
Frecuencias Bidimensional
2.3.1 Distribuciones Marginales
Las distribuciones marginales son distribuciones de
frecuencias en cada una de las variables sin tener en cuenta a las
otras. Son, por tanto, distribuciones unidimensionales a las que
podemos aplicar todas las medidas estudiadas en el tema 1.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.1 - 2.3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/9
Las distribuciones marginales se notarn:
Distribucin marginal de X: {(x
i
, n
i
, f
i
)} con f
i
= n
i
/N, i= 1,, h.
Aparecen en la primera y ltima columna de las tablas 2-2 y 2-3.
Se verificar que =

j
ij
f
i
f

Distribucin marginal de Y: {(y
j
, n
j
, f
j
)} con f
j
= n
j
/N, j= 1,, k.
Corresponde a la primera y ltima fila de las tablas 2-2 y 2-3. Se
verificar que =

i
ij
f
j
f
Ejemplo 2-2.
Se desea establecer los horarios del personal y tambin el
nmero de empleados requeridos en la empresa. Por ello, se nos pide
que estudiemos la distribucin del nmero de horas empleadas en la
revisin y puesta a punto, as como sus principales medidas de
tendencia central. Para conseguir la informacin solicitada deberemos
buscar la distribucin marginal de Y, que representa las horas
dedicadas a la revisin. Su obtencin consistir en sumar las
columnas, quedando:

y
j
(0.5, 1.5] (1.5, 2.5] (2.5, 3.5] (3.5, 4.5] (4.5, 5.5] (5.5, 6.5]
n
j
5 10 12 12 8 3
f
j
0.1 0.2 0.24 0.24 0.16 0.06

Clculo de la media:
j j
y f y 3, 34horas = =


En promedio, cada coche tarda en ser reparado 3h 20minutos, y
el tiempo total de reparacin de los 50 vehculos es de 167 horas.

Clculo de la moda:
horas
d d
d
b b b Mo
i i i
16 . 3
008 04 . 0
04 . 0
) 5 . 2 5 . 4 ( 5 . 2 ) (
2 1
1
1
=
+
+ =
+
+ =
+

El tiempo ms frecuente de reparacin de un vehculo es de 3 horas y
10 minutos.

Clculo de la mediana:
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.1 - 2.3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/9
horas c Me 33 . 3
24 . 0
3 . 0 5 . 0
5 . 2
5 . 0
=

+ = =
La mitad de los automviles han sido reparados en menos de 3horas
y 20minutos.
2.3.2 Distribuciones Condicionadas
Las distribuciones condicionadas surgen cuando se quiere
estudiar la distribucin de la frecuencia en una variable condicionado
a que la otra variable se ha manifestado en un determinado valor o
intervalo concreto. Las distribuciones condicionadas se notan as:
- Distribucin de Y condicionada a X = x
i
: Y/X = x
i
con {(y
j
, n
ij
, f
j/i
)}
- Distribucin de X condicionada a Y = y
j
: X/Y = y
j
con {(x
i
, n
ij
, f
i/j
)}
La distribucin de Y condicionada a X = x
i
( Y/X = x
i
) es una
distribucin de frecuencias unidimensional que toma los valores y
1
,
, y
k
con unas frecuencias absolutas: n
i1
, , n
ik
respecto de un total

=
=

k
j
ij
n
i
n
1
. De una manera anloga se plantear la distribucin de X
condicionada a Y = y
j
( X/Y = y
j
)
Al condicionar por un valor de X = x
i
pasamos a restringirnos a
una muestra de tamao

=
=

k
j
ij
n
i
n
1
. Entonces, la frecuencia absoluta
n
ij
de cada pareja (x
i
,y
j
) permitir considerar la frecuencia relativa
condicional
i j
f
/
(frecuencia relativa de aparicin del valor y
j
cuando
X ha tomado el valor x
i
) como

=
i
n
ij
n
i j
f
/
.
De esta forma, se deducen las siguientes frmulas que nos
relacionan frecuencias relativas condicionales con frecuencias
relativas conjuntas y marginales.

=
i
f
ij
f
N
i
n
N
ij
n
i
n
ij
n
i j
f
/
/
/
, j= 1,, k; dado i= 1,, h
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.1 - 2.3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/9
j
f
ij
f
j i
f

=
/
, i= 1,, h; dado j= 1,, k
As:
j i
f
j
f
i j
f
i
f
ij
f
/ /

= con i= 1,, h; j= 1,, k.


Esta conclusin nos permite reconstruir la tabla bidimensional
de frecuencias a partir de las frecuencias marginales y condicionadas.
Cuando suceda que
j
f
i j
f

=
/
, j i, ; se dir que las variables
estadsticas X e Y son independientes. Esto es, si al determinar la
frecuencia condicionada no interviene la variable condicionante.
De cada tabla de frecuencias bidimensional sacamos h + k + 2
distribuciones unidimensionales marginales y condicionadas.
Ejemplo 2-2.
Se sabe que una gran parte de los clientes del taller llegan con
coches de 40 a 60000 km., por lo que se quiere hacer un estudio ms
detallado de estos clientes mayoritarios para mejorar la atencin y el
servicio. Obtngase la distribucin correspondiente.
Se trata de determinar la TFR en la distribucin Y/X=(40,60].

y
j
(0.5, 1.5] (1.5, 2.5] (2.5, 3.5] (3.5, 4.5] (4.5, 5.5] (5.5, 6.5]
n
j/3
0 3 7 2 0 0
f
j/3
0 0.25 0.583 0.167 0 0



IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009





2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/8
2.4. Constantes de una Distribucin de Frecuencias
Bidimensional
Para poder cuantificar el grado de relacin que presentan dos
variables, as como para establecer una recta que permita predecir
una variable a partir de la otra, es necesario establecer medidas o
constantes tanto para un conjunto de datos bidimensional (C.D.B.)
como para una distribucin de frecuencias bidimensional (D.F.B.).
2.4.1 Momentos Respecto al Origen
La primera medida de relacin entre dos variables que podemos
pensar, es promediar su producto. As surge el llamado momento
respecto al origen de orden (1,1), cuya notacin es
1 1,
a y que se
determina por

1
1,1
N
i
x y
i i
a
N
=
=

para un C.D.B.

j
y
i
x
i j
ij
f
N
j
y
i
x
i j
ij
n
a =

=
1 , 1
para una D.F.B.
Ejercicio 2-1. (C.D.B.)
Con relacin a los datos del Ejemplo 2-1:

X 1 2 3 4 5 6 7 8 9 10
Y 20 36 48 60 66 74 80 84 87 89
Calcular el momento respecto al origen de orden (1,1), as como
la media de cada variable.
Ejercicio 2-2. (D.F.B.)
Con relacin al Ejemplo 2-2, calcular el momento respecto al
origen de orden (1,1), as como la media de cada variable.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009





2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/8
Si planteamos promediar productos de potencias de los valores
de cada variable surgir un concepto ms general que se define a
continuacin.
Sea una distribucin de frecuencias bidimensional
{(x
i
,y
j
),n
ij
,f
ij
}
N
. Sean r,s N*. Se llama momento respecto al origen
de orden (r,s), notndose por
s r
a
,
, al nmero siguiente
s
j
y
r
i
x
i j
ij
f
N
s
j
y
r
i
x
i j
ij
n
s r
a =

=
,

Dos casos particulares interesantes son cuando s = 0 y cuando
r = 0, destacando

2
2
2
2,0
n x
n x
ij i
i i
i j
i
a f x
i i
N N
i


= = =

y
2 2
2
0,2
n y n y
ij j j j
i j j
a f y
j j
N N
j

= = =


Es decir,
2,0
a (
0,2
a ) es el momento respecto al origen de orden 2
en la distribucin marginal de X (Y).

2.4.2 La Covarianza y sus Propiedades
Los momentos respecto al origen constituyen una primera
aproximacin a la relacin de los datos de una distribucin
bidimensional, pero que todava no permiten evaluar o cuantificar el
nivel de relacin. Por ejemplo, resultara interesante cuantificar de
alguna manera el hecho de que en las personas las medidas de peso
y estatura se encuentran relacionadas; ya que, por regla general, a
mayores (menores) valores de una medida le corresponden mayores
(menores) valores de la otra, lo que es un caso particular de relacin
directa. O bien, puede que nos interese cuantificar el hecho
econmico de que, por regla general, a mayor (menor) tasa de paro
de una regin, menor (mayor) demanda de vivienda nueva en dicha
regin; lo que es un ejemplo de relacin inversa.
Por tanto, consideraremos que estamos en presencia de dos
magnitudes, designadas por X e Y, de las que tenemos N datos
dispuestos en forma de pares de datos ( ) ( )
N N
y x y x , ,..., ,
1 1
. Para
establecer una medida de la relacin conjunta en cada par lo que se
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009





2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/8
hace es medir lo que se diferencia el valor de cada componente
respecto a su media y se toma como medida de variacin conjunta el
producto de esas dos diferencias. As, un par genrico ( )
i i
y x , tendra
cuantificada una variacin conjunta por el producto ( )( ) y y x x
i i
.
Slo nos queda ya tomar una medida que nos resuma esos N valores
de variacin conjunta, que ser el promedio. De esta manera, surge
una medida de la variacin conjunta de X e Y, o co-variacin de X
e Y que se llama covarianza, se designa por ( ) Y X Cov , y viene
definida por
( )
( )( )
N
y y x x
Y X Cov
N
i
i i

=

=
1
,
Obsrvese que si representamos los datos en un diagrama
cartesiano nos podramos encontrar con las situaciones que se
muestran en las Figuras 2-2 a 2-6.
A continuacin se comenta cada una de ellas.

X
Y

Cov(X,Y)>0
Figura 2-2
X
Y

Cov(X,Y)<0

Figura 2-3
X
Y

Cov(X,Y)=0
Figura 2-4
X
Y

Cov(X,Y)=0
Figura 2-5
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009





2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/8
Figura 2-2. Relacin de tipo directo. Ejemplo: kilmetros
recorridos por un coche en un viaje y consumo total de
combustible en ese viaje. Cov(X,Y) > 0.
Figura 2-3. Relacin de tipo inverso. Ejemplo: Precio de artculos-
demanda. Cov(X, Y) < 0.
Figura 2-4. Forma circular. Ejemplo: Resultados en los
lanzamientos de dos dados de diferente color. Se compensan los
productos. Cov(X, Y) 0.
Figura 2-5. Tipo parablico. Ejemplo: Ingresos- Precios de
artculos. Cov(X, Y) 0.
Para el clculo de la covarianza en un C.D.B. se suele utilizar lo
siguiente
( ) y x
N
y x
Y X Cov
N
i
i i
=

=1
,
Ejercicio 2-1.- (Continuacin)
Con relacin al Ejemplo 2-1, calcular la covarianza e interpretar
el resultado.

A veces se maneja el concepto de covarianza muestral para
indicar un cuasipromedio de las medidas de variacin conjunta, lo
que significa dividir la suma correspondiente entre 1 N . Si se
designa por ( ) Y X Cov
M
, , vendr definida por
( )
( )( )
1
,
1

=
N
y y x x
Y X Cov
N
i
i i
M
.
Algunas de las propiedades ms destacables de esta medida
bivariante se exponen a continuacin.
A) ( ) ( ) Y X acCov d cY b aX Cov
M M
, , = + + .
B)
2
) , (
x M
S X X Cov = .
C) ( )
y x M y x
S S Y X Cov S S , .
La propiedad B) nos permite identificar la varianza muestral de
una variable como la covarianza muestral que presenta esa variable
consigo misma. Es decir,
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009





2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/8
( )
2
2 1
1
N
i
i
x
x x
S
N
=



Ejemplo 2-3.-
Una empresa ha registrado los siguientes datos sobre las
variables X, gastos mensuales destinados a la promocin del
producto, en millones de pesetas; e Y, cantidad de unidades vendidas
al mes, en unidades de millar. Los datos se refieren a los ltimos diez
meses, siendo la ltima columna los del mes pasado.
i
x
17 20 22 25 18 15 12 17 25 22
i
y 52.54 54.50 55.27 56.15 56.23 55.97 55.55 54.32 55.14 54.28
Se trata de determinar la correlacin entre ambas variables y
comentar el valor obtenido, indicando el valor que resultara si se
manejasen los datos en euros y unidades de artculo.
El diagrama de dispersin se muestra en la Figura 2-6.











Figura 2-6

De esta grfica se concluye que ambas variables no estn
relacionadas, por lo que esperamos un valor para la covarianza
aproximadamente 0. Se verifica que
( ) 3265 . 0 995 . 54 3 . 19 73 . 1061 ,
1
= = =

=
y x
N
y x
Y X Cov
N
i
i i

mientras que
( ) ( ) 3628 . 0 3265 . 0
9
10
,
9
10
, = = = Y X Cov Y X Cov
M
.
GTOSPROM
26 24 22 20 18 16 14 12 10
V
T
A
S
57
56
55
54
53
52
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009





2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/8
Se trata de un valor que no podemos precisar si es alto o bajo ya
que se refiere a las unidades manejadas. Por ello, lo debemos
comparar con
8171 . 4 1281 . 1 2701 . 4 = =
y x
S S .
Entonces podemos concluir que la correlacin es inapreciable.

Si manejramos los datos en euros y unidades de artculo
deberamos considerar las variables Y X 1000 y
386 . 166
1
, de manera
que aplicaramos la propiedad 1.1 y resultara que
( ) 1805 . 2 ,
386 . 166
1000
1000 ,
386 . 166
1
= =

Y X Cov Y X Cov
M M
.

El hecho de depender la covarianza muestral de las unidades de
medida hizo que se propusiera otra medida para la correlacin de
carcter adimensional, conocida como coeficiente de correlacin lineal
de Pearson (CCLP), designado por la letra r y que viene definido como
( )
y x
M
S S
Y X Cov
r
,
=
Es inmediato comprobar que 1 1 r , de manera que su signo
nos indica el tipo de dependencia y su valor nos orienta sobre lo
acusado de la relacin lineal pero sin poderse cuantificar el grado de
relacin lineal.
Obsrvese que
( )( )
( ) ( )
1
2 2
1 1
N
i i
i
N N
i i
i i
x x y y
r
x x y y
=
= =

=



Ms detalles se encuentran en el epgrafe siguiente.
A continuacin se proporciona la definicin de covarianza en el
caso ms general de una D.F.B.
Sea una distribucin de frecuencias bidimensional
{(x
i
,y
j
),n
ij
,f
ij
}
N
. Sean r,s N*. Se llama covarianza o momento mixto
de esta distribucin, notndose por
1 , 1
m o Cov(X, Y), al nmero real
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009





2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/8
) )( (
) )( (
1 , 1
y
j
y x
i j
i
x
ij
f
N
i j
y
j
y x
i
x
ij
n
m =

=
Respecto al clculo, se utiliza el siguiente resultado


=
j
j
y
j
f
i
i
x
i
f
j
y
i j
i
x
ij
f m
1 , 1

que se expresa diciendo que la covarianza es diferencia entre la
media de los productos y el producto de las medias.
Ejercicio 2-2. (Continuacin)
Con relacin al Ejemplo 2-2, calcular la covarianza y la
covarianza muestral, interpretando el resultado.

Por ltimo, la covarianza es necesaria a la hora de obtener la
varianza de una suma o diferencia de variables.
La suma de variables es muy habitual en la prctica. Por
ejemplo, en cualquier fenmeno que se estudie en dos periodos del
da y se quiera conocer el comportamiento del fenmeno en todo el
da habr que hacer la suma de variables. O bien, si tenemos dos
zonas donde estamos vendiendo un producto.

Ejercicio 2-4.-
Una empresa ha registrado los siguientes datos sobre las
variables X, gastos mensuales destinados a la promocin de la
superconsola PG (Perfect Game), en millones de pesetas; e Y,
cantidad de unidades vendidas al mes, en unidades de millar.
Dispone de los datos de los ltimos diez meses, tanto en Europa (E)
i
x (E)
17 20 22 25 18 15 12 17 25 22
i
y (E) 52.54 54.50 55.27 56.15 56.23 55.97 55.55 54.32 55.14 54.28
como en USA (U)
i
x (U)
19 21 22 25 19 19 11 18 29 22
i
y (U) 51.54 54.0 55.03 55.35 55.56 56.37 55.02 53.12 56.17 53.82
Calcular la varianza de los gastos de promocin en el mundo, S,
comprobando que
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009





2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/8
V(S) = V(X(E) + X(U)) = V(X(E)) + V(X(U)) + 2Cov(X(E),X(U))
Calcular la varianza de la diferencia en los gastos de promocin
en USA con Europa, variable D, comprobando que
V(D) = V(X(U) - X(E)) = V(X(U)) + V(X(E)) - 2Cov(X(E),X(U))

El resultado general para una suma o diferencia de variables es
el siguiente
V(aX bY) = a
2
V(X) + b
2
V(Y) 2abCov(X,Y)

Puedes demostrarlo matemticamente?

Ejercicio 2-4.- (Continuacin)
Si la empresa vendiera en Europa, USA y Asia, habra que
plantear la varianzas de una suma de tres variables. Cul sera su
expresin?
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/17
2.5. Regresin Lineal Mnimo-Cuadrtica y Correlacin

En gran cantidad de estudios resulta fundamental comprender y
explicar relaciones entre variables, de modo que finalmente se pueda
determinar cmo una variable dependiente o de respuesta se
encuentra relacionada con un conjunto de variables explicativas o
independientes. La regresin lineal permite relacionar de forma lineal
una o ms variables dependientes con una o ms variables
independientes (explicativas). El aspecto de mayor inters reside en
la eleccin de aquellas variables que se incluirn en el modelo. Los
modelos de regresin permiten establecer relaciones estadsticas
aproximadas entre variables cuando dichas relaciones no se conocen
exactamente. En estos modelos la variable Y se considera como una
variable aleatoria que vara alrededor de un valor medio que depende
de los valores de las variables explicativas. Si slo hay una variable
explicativa se habla de regresin simple, mientras que si hay dos o
ms se habla de regresin mltiple.
Las metodologas de la regresin simple y la correlacin
servirn para analizar:
- la relacin existente entre la radiacin solar y la temperatura
registrada en una ciudad,
- la relacin entre un ndice burstil europeo (e.g. IBEX-35) y un
ndice burstil americano (e.g. Dow-Jones),
- la relacin entre las ventas de un producto y los gastos en
publicidad de dicho producto.
Una vez que es clara la necesidad de relacionar dos variables,
vamos a ver de qu manera se puede establecer linealmente dicha
relacin, a travs de las llamadas rectas de regresin. Despus
analizaremos diferentes aspectos de esa relacin lineal y mediremos
el grado en que se produce dicha relacin lineal.
Ejemplo 2.5.1.-
Una empresa ha obtenido datos sobre las variables X: gastos de
produccin anuales, en decenas de millar de , e Y: ingresos totales
anuales, en decenas de millar de ; segn se refleja en la siguiente
tabla:

x
i
1.9 2.2 2.9 3.6 3.8 4.6 5.5
y
i
5.5 7.4 9.8 11.6 11.6 12.2 11.2

El diagrama de dispersin resulta
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/17

1.9 2.9 3.9 4.9 5.9
EJEM23.x
5.5
7.5
9.5
11.5
13.5
EJEM23.y
Plot of EJEM23.y vs EJEM23.x

Figura 2-7

Parece que es posible establecer una relacin (regresin) lineal
entre las variables. (La presencia del ltimo dato y el hecho de que
aumentar los gastos de produccin a partir de un valor no va a tener
siempre una respuesta de los ingresos crecientes, hace pensar que
puede ser ms apropiado otro tipo de regresin, como la parablica).
Antes de entrar en el desarrollo consideremos lo siguiente.
Sea ( ) ( )
N N
y x y x , ,..., ,
1 1

un conjunto de datos bidimensional.
Para medir variacin en cada variable y relacin entre ambas
variables, se suelen utilizar las llamadas sumas de cuadrados y
sumas de productos cruzados, que responden a las siguientes
expresiones con la conveniente notacin.

=
=
N
yy
i
y
i
y S
1
) (
2

=
=
N
i
i xx
x x S
1
2
) (
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/17
=
=
N
i
i i xy
y y x x S
1
) )( (
2.5.1 Rectas de Regresin de Y sobre X y X sobre Y. Uso en la
Prediccin
Una vez garantizada la existencia de relacin lineal (las
variables estn correlacionadas) es necesario hallar la recta que nos
permita obtener, con el menor error posible, una prediccin para el
valor de Y (que designaremos por y) cuando la X toma el valor x.

A. RECTA DE REGRESIN DE Y SOBRE X.
El objetivo de la regresin lineal es ajustar una lnea recta a los
datos, = ax + b, que proporcione la mejor prediccin de y para
cualquier valor de x.

Figura 2-8

Es decir, para cada recta formamos la siguiente medida de
calidad del ajuste

= ax + b


Pend
Ordenada en
el origen
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/17
( ) ( )
N
i i
i
SCD( a,b ) y b ax
=
= +

2
1

Para obtener la recta de regresin mnimo-cuadrtica de Y sobre
X procedemos a minimizar esta suma de cuadrados de desviaciones,
como funcin de dos variables (a y b), lo que nos lleva al siguiente
sistema de ecuaciones:
( )
( )
SCD a b
a
SCD a b
b

0
0
,
,

La solucin del mismo, donde la pendiente se nota por b
1
y la
ordenada en el origen b
0
, ser

( )( )
( )
N
i i
i
N
i
i
x x y y
a b
x x
b b y b x
=
=

= =

= =

1
1
2
1
0 1


que nos permite afirmar que la recta de regresin mnimo-cuadrtica
de Y sobre X es:
( )( )
( )
( )
N
i i
i
N
i
i
x x y y
y y x x
x x
=
=

=

1
2
1

El coeficiente que figura a la derecha del signo igual se llama
coeficiente de regresin de Y sobre X, notndose por
yx
b . Se observa
que coincide con la pendiente de esta recta. Dividiendo numerador y
denominador de dicho coeficiente por N resulta que una expresin
alternativa para la recta de regresin de Y sobre X ser:
2
( , )
( )
M
x
Cov X Y
y y x x
S
=
Alternativamente,
( , )
( )
( )
Cov X Y
y y x x
V X
=
Propiedades:
La recta de regresin pasa necesariamente por ) , ( y x .
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/17
El signo de su pendiente lo marca la covarianza.
Coeficiente de regresin de Y/X:
2
( , ) ( , )
( )
M
yx
x
Cov X Y Cov X Y
b
S V X
= = ;
xx
xy
yx
S
S
b =

Ejemplo 2.5.1.- (Continuacin)
La recta de regresin de Y sobre X tiene por expresin
19839 4 x 62903 1 y . . + =
donde la pendiente significa que por cada decena de millar de
adicional invertido en la produccin de estos artculos, los ingresos
anuales aumentarn 16.290 . Mientras que sin invertir ningn
adicional se obtendrn unos ingresos de 41.983,9 .
La representacin de la recta de regresin sobre el diagrama de
dispersin resultante se muestra en la figura 6-2.
1 . 9 2 . 9 3 . 9 4 . 9 5 . 9
E J E M 2 3 . x
5 . 5
7 . 5
9 . 5
y
1 3 . 5
E J E M 2 3 . y
D ia g . D is p . - R e c t a d e R e g . d e Y s o b r e X

Figura 2-9

El hecho de que la diferencia entre cada valor observado de la
respuesta y el que proporciona la recta de regresin, llamado residuo
asociado a la observacin correspondiente, sea de una magnitud no
despreciable, nos vuelve a confirmar que la calidad del ajuste, sin ser
mala, es susceptible de ser mejorada.
EJERCICIO 2.5.2.-
Considerar los siguientes datos del Ejercicio 2-1.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/17
X 1 2 3 4 5 6 7 8 9 10
Y 20 36 48 60 66 74 80 84 87 89
Mostrar el diagrama de dispersin (Figura 2-10), valorando el
inters de ajustar una recta. Hallar la recta de regresin mnimo-
cuadrtica de Y sobre X, interpretando sus elementos.


B. RECTA DE REGRESIN DE X SOBRE Y
Cuando desde un punto de vista de relacin de causalidad tiene
sentido intercambiar los papeles entre Y y X (e.g. al estudiar en las
personas la relacin entre peso y estatura), entonces se puede
proceder de manera anloga a lo desarrollado para obtener la
llamada recta de regresin de X sobre Y, la cual nos proporcionar
para cada y la mejor prediccin lineal de la X en el sentido de los
mnimos cuadrados. Obviamente, esto no tiene sentido cuando la
variable X no pueda ser causa de la Y. Por ejemplo, si consideramos
las variables:
Y: demanda de refrescos en un quiosco de sierra, en nmero
de botes
X: temperatura en la zona, en C
slo tiene sentido relacionar Y con X.
Pasamos a desarrollar la recta de regresin de X sobre Y. Dado
un conjunto de datos bidimensional, ( ) ( )
N N
y x y x , ,..., ,
1 1
nos
planteamos ajustarlo con una recta x=cy + d. Para ello medimos el
ajuste de la recta a la nube de puntos por la suma de los cuadrados
de las desviaciones, y calculamos los valores de c y d que las
minimicen. Obtenemos los valores de los coeficientes:
2
) , (
0
y
S
Y X Cov
c =
y c x d
0 0
=
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/17
La recta que buscamos es x = c
0
y+ d
0
y se llama recta de
regresin mnimo cuadrtica de X sobre Y. Su expresin es:
( ) y y
S
Y X Cov
x x
y
=
2
) , (

El coeficiente de regresin de X sobre Y:

2
( , ) ( , )
( )
M
xy
y
Cov X Y Cov X Y
b
S V Y
= = ;
yy
xy
xy
S
S
b =
Los coeficientes de regresin tienen distintos significados
dependiendo de la recta:
- Recta de regresin Y/X,
yx
b es la pendiente de la recta.
- Recta de regresin X/Y, es
xy
b
1
la pendiente de la recta.
La figura 2-11 ayuda a entender lo anterior.
-
yy xx
xy
y x
S S
S
S S
Y X Cov
xy
b
yx
b

=
2
2 2
2
) , (

De entre las dos rectas de regresin posibles la que tiene ms
pendiente en valor absoluto es la de X sobre Y.
La mejor prediccin que se realiza de X sobre Y es mediante la
recta de regresin X/Y, y la mejor prediccin para Y a partir de X la
proporciona la recta de regresin Y/X. Cuanta ms relacin lineal
haya entre las variables, mayor proximidad de ambas rectas.

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/17

EJERCICIO 2.5.3.-
En un ajuste de regresin se han obtenido las rectas siguientes:
I. 0 1 2 = + + y x y II. 0 4 3 5 = + + y x .
Entonces
A) Identificar cual es la recta de regresin de Y sobre X y la
de X sobre Y
B) Calcular la media de cada variable.
C) Indicar cul sera el signo de la covarianza. Se podra
determinar exactamente el valor de la covarianza?
Predicciones, Residuos y Sumas de Cuadrados en Regresin Lineal
Si para cada N 1 i x
i
,..., , = ; la expresin para la prediccin (por
regresin lineal) en la variable Y se nota por
i
y

, determinndose por
X
Y

y
x
r<0
y/x
x/y

menos pendiente
ms pendiente
Figura 2-11
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/17
la expresin de la recta de regresin obtenida,
$
i i
y b b x = +
0 1
, el residuo
asociado al valor
i
x , que ser notado por
i
e , se calcula por
i i i
y y e

= .
La prediccin (tambin la interpolacin) slo tiene sentido en el
rango de valores X e Y, ya que slo es en estos rangos donde se han
tomado las medidas para la generacin de las rectas de regresin. La
extrapolacin o prediccin mucho ms all del rango de X e Y no
tiene sentido, pues no podemos aplicar las conclusiones alcanzadas
en la zona de estudio.
EJEMPLO 2.5.4.-
Con relacin al ejemplo 2.5.1, se verifica que
( ) 574189 9 19839 4 3 3 62903 1 3 3 x y
i i
. . . . .

= + = =
Es decir, la previsin de ingresos el prximo ao si destinamos
a gastos de produccin 33.000 , ser de algo ms de 95.000 .
No tiene sentido realizar una prediccin con la regresin lineal
si pensamos destinar 60.000 a gastos de produccin, ya que este
valor se encuentra fuera del rango de valores recogidos sobre la X.


EJERCICIO 2.5.5.-
Completar la siguiente tabla del Ejercicio 2-1.
i
x

1 2 3 4 5 6 7 8 9 10
i
y

20 36 48 60 66 74 80 84 87 89

i
y


i i i
y y e

=


Dibujar toda esa informacin.

Se demuestra que 0 e
N
1 i
i
=

=
(los residuos se compensan) y
n
i i
i
e y
=
=

1
0, mientras que

=
N
1 i
2
i
e , llamada suma de cuadrados del error o
residual y notada por SCE, es una cantidad no negativa que vara
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/17
entre 0 y ( )

N
1 i
2
i
y y , siendo esta ltima llamada suma de cuadrados
total y notada por SCTo. Adems, se considera la llamada suma de
cuadrados debida a la regresin lineal y notada por SCR, estando
definida por
( )

=
=
N
1 i
2
i
y y SCR



Se demuestra que SCTo = SCR + SCE. A partir de aqu se
obtiene una medida cuantitativa del grado de relacin lineal entre Y y
X, llamada coeficiente de determinacin, r cuadrado.

SCTo
SCR
r
2
=

Ejemplo 2.5.6.-
Con relacin al ejemplo 2.5.1, se verifica que
( )
( )
( )
dec. millar de
dec. millar de
dec. millar de
SCTo ,
SCR ,
SCE ,
=
=
=
2
2
2
38 38
26 325161
12 054839


Por tanto,
6859 0
38 38
325161 26
SCTo
SCR
r
2
.
.
.
= = = ,
lo que significa que introducir los gastos en produccin para explicar
mediante una regresin lineal las variaciones en los ingresos, supone
reducir la variabilidad de stos en un 68.59 %, quedando un 31.41 %
de variabilidad en los ingresos sin explicar por la regresin lineal.
Esta variabilidad, llamada residual, se debe a:
Relaciones entre Y y X diferentes a la lineal,
Relaciones entre Y y otras variables,
Mltiples causas aleatorias siempre presentes en un ajuste de
regresin y que no se pueden o no interesa modelar.

EJERCICIO 2.5.7.-
Calcular las sumas de cuadrados y r cuadrado, interpretando,
en la tabla del Ejercicio 2-1.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
11/17

2.5.2 Sumas de Cuadrados debida a la Regresin y al Error.
Descomposicin de la Suma de Cuadrados Total
Ahora nos proponemos cuantificar que parte de la variacin en
los datos de la variable respuesta se debe al ajuste y que parte al
error. Para ello empezamos por cuantificar la variacin total en la Y.
A. SUMA DE CUADRADOS TOTAL (SCTo).
Una primera aproximacin a la medida de variacin es calcular
las distancias de cada valor a su media, esto es: y
i
y .
Sea {(x
i
,y
i
)}
i=1,N ,
la variacin total de los datos de la respuesta
(Y) se obtiene mediante la Suma de Cuadrados Total, notada por
SCTo, siendo:
=
=
N
i
y
i
y SCTo
1
2
) (
Propiedades.-
- Si y
i
= a, 0 = SCTo i . Si la respuesta es constante la SCTo es
nula.
- A mayor dispersin de datos mayor SCTo.
-

2
( ) ;
1
y
SCTo SCTo
V Y S
N N
= =

,
YY
S SCTo = .

B. SUMA DE CUADRADOS DEBIDA A LA REGRESIN (SCR).
Si introducimos la posibilidad de relacin lineal de Y con X,
podremos obtener una representacin de la recta de regresin Y/X:
y=b
1
x+b
0
. Para la medicin de un valor x=x
i
, procederemos
calculando:
1 0
y b x b
i i
= + . Para cada una de estas predicciones
podremos medir la diferencia entre el valor de la prediccin
) (
i
y
y la
media de los valores ajustados ) (y .
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
12/17
Se llama Suma de Cuadrados debida a la Regresin lineal,
notndose por SCR, a una medida de las desviaciones de las
predicciones a su media:
=
=
N
i
y
i
y SCR
1
2
) (
Propiedades.-

i
y
i
y = , i=1,,N SCTo = SCR (Toda la variacin en la Y es
debida a la relacin lineal).
= = = 0 ) , ( 0 , Y X Cov SCR i y
i
y Ausencia total de relacin
lineal.

XX
XY
S
S
SCR
2
= .
C. SUMA DE CUADRADOS DEBIDA AL ERROR (SCE).
La Suma de Cuadrados debida al Error, tambin llamada
residual, marca la dispersin en las ordenadas alrededor de la recta
de regresin, es decir, la variacin en la respuesta alrededor de la
recta de regresin.
=
=
N
i
i
y
i
y SCE
1
2
) (
Propiedades.-
= = 0 , SCE i
i
y
i
y Relacin lineal perfecta.
= = SCTO SCE i y
i
y , Ausencia total de la relacin lineal.
Toda la variacin debida a la dispersin alrededor de la recta es
debida a la variacin total.



IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
13/17
D. RESIDUOS
Se llama RESIDUO asociado al valor y
i
, notndose por e
i
, a:

i
y
i
y
i
e = =
i
i
e SCE
2

Propiedades.- Sea un conjunto de datos bidimensional
{(x
i
,y
i
)}
i=1,N
y la recta de regresin mnimo cuadrtica de Y/X,
y=ax+b, con los residuos {e
i
}
i=1,N
, entonces:
1. =
i
i
e 0
2. =
i
i
x
i
e 0
E. DESCOMPOSICIN DE LA SCTo.
Sea {(x
i
,y
i
)}
i=1,N
un conjunto de datos bidimensional con las
sumas de cuadrados resultado de obtener la recta de regresin de Y
sobre X (SCTo, SCR y SCE). Se demuestra que se verifica la siguiente
relacin entre las distintas sumas de cuadrados:
SCTo = SCR + SCE
2.5.3 Coeficiente de Determinacin. Coeficiente de Correlacin
Lineal de Pearson. Propiedades.
Definicin.- Dado un conjunto de datos bidimensional
{(x
i
,y
i
)}
i=1,N
se llama coeficiente de determinacin lineal entre Y y X,
notndose por r
2
a:
SCTo
SCR
r =
2
SCTo
SCE SCTo
=
SCTo
SCE
= 1
Lo habitual es dar este coeficiente en porcentaje.

Ejemplo 2.5.8.-
La salida de ordenador en un ajuste de regresin lineal del
precio de un piso con la superficie del mismo es la siguiente.


IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
14/17
Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 1,50742E12 1 1,50742E12 118,18 0,0000
Residual 8,92874E11 70 1,27553E10
-----------------------------------------------------------------------------
Total (Corr.) 2,4003E12 71


Obtener e interpretar el coeficiente de determinacin.
Se verifica que
2
1.50742 12
0.628
2.4003 12
SCR E
r
SCTo E
= = = ,
lo que significa que introducir la superficie de un piso para explicar
mediante una regresin lineal las variaciones en los precios de los
pisos respecto al precio medio, supone reducir la variabilidad de stos
en un 62.8 %, quedando un 37.2 % de variabilidad en los precios sin
explicar por la regresin lineal con la superficie del piso.

Propiedades.-
Se verifica que 0 r
2
1
El coeficiente de determinacin mide el efecto que tiene la variable
explicativa a la hora de reducir las variaciones en la variable
respuesta, o proporcin en que se reduce la variabilidad de Y al
introducir la relacin lineal con la X.
r
2
=1 SCE = 0 SCTo=SCR. Toda la variacin que hay en datos
de la respuesta se debe a la relacin lineal Y/X Relacin lineal
perfecta.
r
2
=0 SCR = 0 SCE=SCTo No hay relacin lineal. Toda la
variacin de la respuesta es debida al error. Nada se debe a la
relacin lineal de Y/X.
Dado un conjunto de datos bidimensional {(x
i
,y
i
)}
i=1,N
se verifica
que:
2
2
, ,
2 2
( , )
M
Y X X Y
X Y
Cov X Y
b b r
S S
= =


IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
15/17
Como 0 r
2
1 y se trata de un producto, los dos coeficientes de
regresin tienen que tener un mismo signo y, adems, el producto
de ambos no puede superar la unidad.
El r
2
no cambia cuando a ambas variables se las somete a un
cambio lineal, tanto de escala como de origen.
2
,
2
, d cY b aX Y X
r r
+ +
=
Definicin.- Dado un conjunto de datos {(x
i
,y
i
)}
i=1,N
con
coeficiente de determinacin r
2
se llama COEFICIENTE DE
CORRELACIN LINEAL DE PEARSON (CCLP) notndose por r a
r =
2
r ,
determinndose el signo por el signo de la covarianza. As
2 2
) , (
Y X
YY XX
XY
S S
Y X Cov
r
S S
S
r

= =
Ejemplo 2.5.9.-
El clculo del CCLP para los datos del ejemplo anterior nos da

0.628 0.79246 r = =
Nos indica que hay una relacin lineal apreciable (un r de casi
0.8) entre precio y superficie de un piso.

La valoracin de un CCLP debe hacerse siempre con el
diagrama de dispersin correspondiente. Las figuras anteriores (2-12
a 2-15) representan cuatro situaciones donde las distribuciones de los
datos tienen siempre un valor del CCLP r = 0,7.
FIGURA 2-12: Hay un r = 0,7 porque la nube de puntos con el punto
extremo guarda una linealidad. No sera vlida la regresin lineal.
Habra que eliminar la observacin extrema y estudiar de nuevo la
distribucin de frecuencias.
FIGURA 2-13: Representa la situacin estndar, donde es viable la
realizacin de la recta de regresin.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
16/17
FIGURA 2-14: Se da un r = 0,7 porque las dos nubes de puntos de
forma global guardan una relacin lineal, pero separadamente
analizadas se descartara la relacin lineal.
FIGURA 2-15: Se debera usar la regresin lineal, previamente
eliminada la observacin extrema.


Figura 2-12 Figura 2-13
Figura 2-14 Figura 2-15

Las figuras anteriores representan cuatro situaciones donde las
distribuciones de los datos tienen siempre un valor del CCLP r = 0,7.



X
Y

Figura 2-9
X
Y





Figura 2-8












X
Y

y
x
Figura 2-7
X
Y





Figura 2-10









IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





2.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
17/17
Propiedades.-
1. Se verifica que 1 r +1.
2. Un valor negativo (resp. positivo) de r indica la presencia de
relacin lineal inversa (resp. directa) entre las variables,
siendo ms acusada esa relacin cuanto ms prximo se
encuentre el valor a 1 (resp. + 1), y menos acusada o ms
dbil dicha relacin lineal cuanto ms cerca se encuentre r
de 0.
3. Un valor r = 0 nos garantiza que entre las variables no hay
relacin lineal, aunque podra darse otro tipo de relacin.
4. Es una medida de relacin lineal cualitativa. Por ejemplo, un
valor r = 0.8 no significa el doble de relacin lineal que si
obtuviramos r = 0.4.
5. Debe ir siempre acompaado del diagrama de dispersin.
Ver las figuras adjuntadas.
6. A nivel orientativo, la presencia de cierta asociacin o
relacin lineal debe ser tenida en cuenta slo si 7 . 0 r .



IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/12
MATERIAL COMPLEMENTARIO
TEMA 2

2.1.- En las siguientes preguntas hay cuatro posibles respuestas,
razonar aquella respuesta nica que se considere correcta.
1.- Sea una distribucin bidimensional de frecuencias
( ) { }
x y f
i j ij
, , .
Si las variables X e Y son discretas y toman slo 5 y 3 valores
respectivamente
A) La distribucin marginal de X sirve para identificar la
frecuencia con que se presentan los 3 valores de Y al
margen, por eso se llama marginal, de X.
B) Podemos obtener tantas distribuciones condicionadas
como valores de X y de Y, es decir, 3 x 5= 15.
C) En ningn caso se puede obtener la frecuencia conjunta
ij
f a partir de las frecuencias marginales
i j
f y f

.
D) Las tres afirmaciones anteriores son falsas.
2.- Sea un conjunto de datos bidimensional ( ) ( )
N N
y x y x , ,..., ,
1 1
.
Entonces
A) Los momentos respecto al origen permiten identificar
tanto el comportamiento respecto al origen de los datos
xs como de los ys como de ambos conjuntamente.
B) La asociacin lineal entre los datos ys y xs se cuantifica
slo con la media de los productos.
C) Los momentos centrales o respecto a la media carecen de
utilidad para los datos bidimensionales.
D) Al menos dos de las afirmaciones anteriores son ciertas.
3.- Una distribucin bidimensional es tal que r = -0.9, s
X
2
4 = y
s
Y
2
16 = . Entonces
A) Las rectas de regresin estn perfectamente
determinadas.
B) El 90 % de la variabilidad de Y se explica por la relacin
lineal entre Y y X.
C) Cov(X,Y) = -7.2.
D) Al menos dos de las tres afirmaciones anteriores son
ciertas.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/12
4.- Una distribucin bidimensional de frecuencias
( ) { }
x y f
i j ij
, , tiene
por rectas de regresin: I. x y + = 0 3 2 9 0 . . y II. 2 7 8 4 0 . . x y + = .
Entonces
A) I es la recta de regresin de Y sobre X.
B) r = 0.81.
C) r = 0.9.
D) Las tres afirmaciones anteriores son falsas.
5.- Sea una distribucin bidimensional de frecuencias ( ) { }
ij j i
f y x , ,
cuyas rectas de regresin son
I. 0 1 2 = + + y x y II. 0 4 3 5 = + + y x . Entonces
A) I es la recta de regresin de Y sobre X.
B) r
2
0 83 = . .
C) r = 0.83.
D) Exactamente dos de las tres afirmaciones anteriores son
verdaderas.
6.- En un ajuste de regresin lineal simple por mnimos cuadrados
a un conjunto de datos ( ) ( )
N N
y x y x , ,..., ,
1 1

A) Si r = -1, las dos rectas de regresin coinciden y su
pendiente es negativa.
B) Si r = 0.8, podemos garantizar que para cualquier
subconjunto del conjunto de datos el coeficiente de
correlacin lineal de Pearson ser superior o igual a 0.8.
C) Si r = 0, hay ausencia de cualquier tipo de relacin entre
las variables Y y X.
D) Se satisfacen al menos dos de las tres afirmaciones
anteriores.
7.- Las variables X: n de alumnos matriculados en la Universidad
de Salamanca durante un ao e Y: n de visitantes del Museo del
Prado durante ese ao, analizadas conjuntamente dan un coeficiente
de determinacin r
2
0 87 = . . Entonces
A) Se puede asegurar que Y depende de X.
B) Ese valor de r
2
es un resultado puramente casual, pero su
valor elevado nos permite asegurar que existe relacin
lineal entre las variables.
C) No tiene sentido el estudio conjunto de esas variables.
D) Las afirmaciones A) y B) son verdaderas.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/12
2.2.- Se han medido los pesos y alturas de 6 personas, obtenindose
los siguientes resultados:
Pesos (kg) 65 60 65 63 68 68
Alturas
(cm)
170 150 168 170 175 180
Se pide:
a) Qu medidas estn ms dispersas, los pesos o las
alturas?
b) Calcular los momentos respecto al origen y centrales ms
importantes de esta distribucin bidimensional.
c) Dar una medida de la correlacin entre ambas variables.
2.3.- En un anlisis de un conjunto de datos bidimensional se sabe
que:
Recta de regresin de Y/X: y=1/2x+2
Recta de regresin de X/Y: x=2y-4
Por otra parte, 3 =
X
s . Se pide:
a) Estudiar si es posible determinar el centro de gravedad de
la nube de puntos.
b) Hallar el coeficiente de correlacin, la covarianza y
Y
s .
Dar una medida de la correlacin entre ambas variables.
c) Si la media de X es 2, determinar la media de Y y los
momentos no centrados de orden (0,2), (2,0) y (1,1).

2.4.- La multinacional COMPUEARTH (Computing Around The Earth) se
dedica a la instalacin y mantenimiento de redes informticas, entre otras
actividades.

N de aos antes
de abandonar
trabajo
(X)
N de trabajos desempeados
previamente (Y)
1 2 3 4
1 3 5 10 12
2 5 6 8 7
3 7 6 6 2
4 7 9 5 2
El Departamento de Recursos Humanos de esta multinacional
sospecha que los trabajadores que han desempeado previamente muchos
trabajos tienen mayor posibilidad de abandonar la empresa en un tiempo
relativamente rpido desde su incorporacin a la misma, que aquellos que
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/12
han desarrollado previamente pocos trabajos. Una muestra de 100
empleados que permanecieron en la empresa cuatro aos o menos, ha
proporcionado los resultados que se presentan en la tabla de la pgina
anterior.
Se pide:
a) Dibujar esta distribucin mediante un diagrama de barras.
b) Obtener e interpretar la distribucin de frecuencias marginal
para X. Calcular e interpretar su media y desviacin tpica.
c) Obtener e interpretar la distribucin de frecuencias marginal
para Y. Calcular e interpretar su media y desviacin tpica.
d) Para aquellos empleados que permanecen en esta
multinacional cuatro aos antes de cambiar de empleo, obtener
e interpretar la distribucin de frecuencias para el n de
trabajos desempeados previamente. Calcular e interpretar su
media y desviacin tpica.
e) Calcular e interpretar los momentos respecto al origen y
centrales ms importantes de esta distribucin de frecuencias
bidimensional.
f) Calcular las diferentes sumas de cuadrados en la regresin
lineal de Y sobre X. Qu valor y significado tiene en este caso
el coeficiente de determinacin?
2.4_BIS.- (Propuesto en intersemestral)
Omega Capital es una empresa de ingeniera financiera que
ltimamente ha contratado vari@s ingenier@s de ICAI. Ahora se est
planteando emprender una investigacin sobre la evolucin temporal de los
rendimientos de las 35 empresas que conforman el IBEX-35, para lo cual
uno de sus gestores jefe ha decido centrarse en el anlisis de 2 semanas.
La tabla siguiente recoge el nmero de empresas cuya cotizacin ha tenido
una variacin porcentual en la semana 1, X, y en la semana 2, Y, segn
indican los respectivos intervalos.
X \ Y (-10, -4] (-4,-2] (-2,-1] (-1,0] (0,1] (1,2] (2,4] (4, 10]
(-10, -4] 0 0 0 0 0 0 0 0
(-4,-2] 0 1 0 1 1 0 0 0
(-2,-1] 0 2 0 2 0 0 0 0
(-1,0] 2 3 2 0 1 0 0 0
(0,1] 1 2 5 1 0 0 0 0
(1,2] 1 2 2 0 0 0 0 0
(2,4] 0 1 0 1 0 2 0 0
(4, 10] 0 1 1 0 0 0 0 0

Se pide:
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/12
a) Representar en papel cuadriculado el histograma y el polgono de
frecuencias relativas de la variacin porcentual de las empresas en la
semana 2. Analizar ambas representaciones, indicando su utilidad.
b) Obtener la distribucin de frecuencias de la variacin porcentual en la
semana 2 para aquellas empresas que en la semana 1 tuvieron una
variacin porcentual en valor absoluto no superior al 1 %.
c) Calcular e interpretar el coeficiente de determinacin lineal entre
ambas semanas.
2.5.- Se han estudiado las calificaciones de cien alumnos en dos
asignaturas, Matemticas y Fsica, obtenindose los siguientes datos:
110 = x , 10 =
X
s
5 . 2 = y , 5 . 0 =
Y
s
Adems se sabe que el coeficiente de correlacin entre ambas
variables es 0,85.
Se pide:
a) Qu nota se puede predecir que tendr un alumno en la
asignatura de Fsica, cuya puntuacin en Matemticas ha
sido 125 puntos.
b) Se puede decir que aquellos alumnos que obtienen
mayor calificacin en Matemticas sean los mismos que
obtienen mayor calificacin en Fsica? Raznese la
respuesta.
c) Cunto valen los momentos no centrados (0,2) y (2,0)?
d) Cul es la ecuacin de la recta de regresin de X sobre
Y? Para qu servira?
2.6.- Una mquina taladra agujeros cuyo dimetro nominal es 36
mm, con una tolerancia de 0.5 mm.
De hecho, el dimetro aumenta con el tiempo, debido a un
desgaste en el mecanismo del taladro. Por tanto, es importante
determinar el instante de tiempo en el cual la produccin saldr del
intervalo de tolerancia de cara a prever la intervencin del
mantenimiento. Por esta razn, se han obtenido los siguientes datos
relativos a las variables:
X: tiempo, en horas, que lleva funcionando la mquina.
Y : dimetro del agujero, en mm.
X 0 2 4 6 8 12 16 20 24
Y 36 36.05 36.06 36.13 36.14 36.19 36.20 36.21 36.22
Se pide:
a) Representar grficamente esos puntos.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/12
b) Calcular el CCLP entre las variables X e Y.
c) Aunque el CCLP es elevado, la representacin grfica
parece sugerir que el desajuste del reglaje presenta dos
comportamientos: hacia las 6 horas de funcionamiento,
un desajuste del reglaje rpido, que se estabiliza a partir
de ese momento. Establecer un ajuste lineal a partir de
las 6 horas de funcionamiento, de cara a planificar las
operaciones de mantenimiento preventivo. Calcular el
nuevo coeficiente de correlacin lineal.
d) Predecir el instante de tiempo en el cual la produccin
saldr del intervalo de tolerancia. Determinar en qu
instante se debera proceder a un mantenimiento
preventivo en la mquina.
2.7.- En un estudio sobre octanaje de gasolinas, llevado a cabo por
R. D. Snee en 1981, se determin el octanaje de 10 mezclas por dos
mtodos 1 y 2, siendo el mtodo 1 mucho ms econmico que el 2.
Los datos de la tabla corresponden a las variables Y y X, que
cuantifican el octanaje de la mezcla por los mtodos 2 y 1,
respectivamente.
y
i
105 81.4 84.0 86.5 83.8 90.2 85.9 91.7 87.7 85.0
x
i
106.6 83.3 94.7 92.3 85.9 99.5 97.0 96.3 93.9 92.8
Se pide:
A) Obtener la recta de regresin de Y sobre X, calculando e
interpretando las diferentes sumas de cuadrados.
A) Valorar razonadamente la calidad del ajuste.
B) Qu mtodo presenta una mayor variacin? Cmo llevaras
a cabo un informe de comparacin entre ambos mtodos?
C) La informacin anterior se refiere a un estudio llevado a cabo
en la refinera A de la multinacional OILCO. De otro estudio
realizado en la refinera B, tambin con 10 mezclas, se sabe
que y = 1.09775x 16.7309, con SCTo = 344.745, SCR =
226.9 y SCE = 117.84. Qu estudio presenta unos resultados
ms precisos?
2.8.- La empresa PROVERTSA (Microprocesadores Vertiginosos S. A.)
ha llevado a cabo un estudio sobre uno de sus productos, el
microprocesador TITANIUM-21. Se ha obtenido informacin sobre dos
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/12
variables X y Y que representan la valoracin obtenida por ese
producto mediante un ndice tradicional de rendimiento que vara
entre 0 y 100, y un ndice subjetivo propuesto por los ingenieros del
laboratorio de ensayos de PROVERTSA, respectivamente. Dicha
informacin se muestra a continuacin.
y
i
75 56 67 64 43 60 77 55 55 63
x
i
48 36 42 42 21 40 50 37 34 35
Se pide:
A) Representar grficamente esta informacin. Extraer
conclusiones.
B) Apoyar las conclusiones anteriores con medidas estadsticas.
C) Obtener la recta de regresin de Y sobre X. Dar un significado a
la misma en el contexto del problema analizado.
D) Calcular e interpretar las diferentes sumas de cuadrados.
E) Qu valor asignaramos a la valoracin subjetiva de los
tcnicos del laboratorio en una prueba que ha dado para X un
valor de 30? Y si hubiera salido para X un valor de 70?
Contestar razonadamente.
2.8_BIS.- (Propuesto en intersemestral)
Una multinacional de la informtica asigna diferentes precios a
un equipo informtico en siete regiones diferentes del pas. En la
tabla adjunta se muestran el nmero de unidades vendidas y los
precios por unidad correspondientes, en euros.
Ventas 420 380 350 400 440 380 450
Precio
(euros)
550 600 650 600 50 650 45

a) Construya el diagrama de dispersin y obtenga una recta que
explique las ventas en funcin del precio, estudiando su bondad
y su capacidad explicativa. (4)
b) Obtenga e interprete las tres sumas de cuadrados y una medida
del error que se comete al sustituir los datos empricos por
dicho modelo. (3)
c) Construya el grfico de cajas para las ventas y analice la
informacin que proporciona. (3)

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/12
2.9.- Una empresa ha venido considerando durante una poca de
expansin que las variables
Y: ventas totales a lo largo de una semana, en miles de
X: gasto en publicidad durante una semana, en miles de
se relacionaban a travs de la ecuacin lineal
0 1
Y b b X = + .
Los datos disponibles de 36 semanas permiten conocer los
siguientes resultados:
n n n
i i i i
i 1 i 1 i 1
x y x y
7; 24; 168,009
n n n
= = =
= = =

.
n n
2 2
i i
i 1 i 1
x y
49,0036; 576,024456
n n
= =
= =

.
A) Determinar las rectas de regresin, interpretando el significado
prctico de sus coeficientes.
B) Valorar la calidad del ajuste razonadamente.
2.10.- La empresa ZOCOSA (Zocos S. A.) se dedica al negocio
de la compra-venta de productos. Dispone de informacin sobre las
variables X y Y que representan el precio de compra y de venta de un
producto, respectivamente, en , para el caso de 8 productos, segn
se muestra a continuacin.
y
i
175 105 115 130 180 125 130 125
x
i
120 80 90 95 140 100 110 90
Se pide:
A) Proporcionar a esta empresa un intervalo en el que se
encontrarn los beneficios de al menos el 75 % de las
operaciones que realice.
B) Calcular la media y varianza de los porcentajes de margen que
consigue en las operaciones que realiza.
C) Obtener la recta de regresin de Y sobre X. Dar un significado a
la misma en el contexto del problema analizado.
D) Calcular e interpretar las diferentes sumas de cuadrados.
E) Qu precio de venta se puede considerar para un producto que
se ha comprado a 150 ? Y para uno con un precio de 600?
Contestar razonadamente.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/12
2.11.- Para proteger una bobina contra las sobrecargas de
tensin se utiliza una resistencia no lineal cuya caracterstica, U, en
voltios, es de la forma
U k I
n
=
siendo I la intensidad de la corriente en miliamperios.
Se trata de buscar los valores de k y n que hay en una
resistencia no lineal de la cual se tienen los siguientes datos:

I 0.1 0.2 0.5 1 2 5 10
U 38.1 44.7 47.0 61.5 75.2 79.0 95.6

Se pide:
a) Representar esos puntos en un papel adecuado.
b) Llamando Y a ln U y X a ln I, obtener un ajuste lineal
entre Y y X.
c) Calcular el coeficiente de correlacin lineal de Pearson
entre las variables X e Y y razonar si est justificada la
hiptesis U k I
n
=
2.12.- La empresa de colonias FRAGRANCES Inc. ha decidido lanzar
al mercado europeo, durante la prxima campaa de Verano, la
nueva colonia para mujeres llamada MANEATER a un precio de 24
el frasco. Esta empresa sospecha que existe una relacin entre las
variables X, gastos mensuales destinados a la promocin de la nueva
colonia, en millones de pesetas; e Y, cantidad de unidades vendidas
al mes de la nueva colonia, en unidades de millar. Adems, piensa
que en esa relacin se verifican las caractersticas siguientes:
(1) La demanda mensual en un pas de frascos de esta nueva
colonia est afectada principalmente por los gastos
mensuales destinados a la promocin.
(2) La relacin entre ambas variables es lineal o parablica,
dentro del rango de niveles de inters para X en esta
empresa.
Los datos que se presentan a continuacin corresponden a un
pas con caractersticas similares a Espaa y son datos que se
encuentran dentro del rango de niveles de inters para X en esta
empresa.
X
i
17 15 25 10 18 15 20 25 17
Y
i
56.15 54.50 55.27 52.54 56.23 55.97 55.55 54.32 55.14
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/12

X
i
13 20 23 25 16
Y
i
54.28 55.78 55.65 54.96 55.06
Se pide:
a) Construir el grfico de cajas para los datos de cantidad de
unidades vendidas al mes de la nueva colonia. Interpretar
dicho grfico.
b) Qu se puede decir sobre el nmero de meses en que
esta empresa tendr unos ingresos entre 100 y 340
millones de pesetas. Por qu?
c) Representar la nube de puntos y razonar el tipo de
regresin adecuada.
d) Obtener la recta de regresin de Y sobre X. Calcular las
diferentes sumas de cuadrados, la varianza residual y el
coeficiente de determinacin lineal entre Y y X.
Interpretar los resultados.
e) Obtener la parbola de regresin mnimo-cuadrtica entre
Y y X. Calcular las diferentes sumas de cuadrados, la
varianza residual y el coeficiente de determinacin
parablica entre Y y X. Interpretar los resultados. Qu
tipo de regresin es la ms adecuada?
f) Esta empresa ha decidido destinar la cantidad de 19
millones de pesetas a gastos promocionales durante el
prximo mes en Espaa, qu prediccin de ventas de
frascos de esta colonia debera hacer esta empresa para
el prximo mes en Espaa?
2.12_BIS.- (Propuesto en final)
La cadena de supermercados de productos informticos
GIGACOMP quiere estudiar la relacin entre el precio de un producto
y las ventas del mismo. Se ha seleccionado una muestra de 9
supermercados de caractersticas similares y se han asignado al azar
entre los 9 supermercados tres niveles de precio (100, 120, 140
pesetas) a un determinado producto. El nmero de productos
vendidos (Y) y el precio en cada supermercado (X) se muestran en la
siguiente tabla.

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
11/12
X 100 100 100 120 120 120 140 140 140
Y 151 168 176 107 115 126 86 95 106

Se pide:
a) Representar la nube de puntos y razonar el tipo de
regresin adecuada.
b) Obtener la recta de regresin de Y sobre X. Calcular las
diferentes sumas de cuadrados y el coeficiente de
determinacin lineal entre Y y X. Interpretar los
resultados.
c) Obtener la parbola de regresin mnimo-cuadrtica entre
Y y X. Calcular las diferentes sumas de cuadrados y el
coeficiente de determinacin parablica entre Y y X.
Interpretar los resultados. Qu tipo de regresin es la
ms adecuada? Qu precio se fijara para el producto?
2.13.- La compaa area ESPAIRE, de reciente creacin al abrirse el
cielo espaol a la introduccin de nuevas lneas areas, sospecha que
existe una relacin entre las variables X, tiempo de un vuelo, en
horas; e Y, consumo de combustible (gasleo) para dicho vuelo, en
litros. Por esta razn, se han obtenido los siguientes datos, dentro del
rango de niveles de inters para X en esta compaa.
X
i
0.4 0.5 0.6 0.65 0.7 0.8 1 1.15 1.2
Y
i
1350 2220 2900 3150 3350 3550 3900 4330 4500

X
i
1.4 1.5 1.6 1.8 2.2 3
y
i
5050 5320 5650 6400 7500 1025
0
Se pide:
A) Mediante la representacin del diagrama de dispersin razonar
el inters de relacionar dichas variables.
B) Obtener la covarianza y el coeficiente de correlacin entre
ambas variables.
C) Obtener la covarianza y el coeficiente de correlacin entre
ambas variables para los vuelos cortos, menos de 1 hora de
tiempo de vuelo, y para los vuelos largos, al menos 1 hora de
tiempo de vuelo. Extraer conclusiones.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
12/12
2.14.- Para controlar la temperatura de un horno de metalurgia se
utiliza un dispositivo informtico formado por componentes
electrnicas cuya resistencia vara en funcin de la temperatura,
segn la ley

=
0
T
1
T
1
B
o T
e R R
donde T es la temperatura absoluta, en grados Kelvin, R
0
es la
resistencia a 0 C, en ohmios, T K
0
273 = y B es un coeficiente
especfico de cada dispositivo.
Para determinar los parmetros de un tipo concreto de estos
dispositivos, se realizan una serie de ensayos, obtenindose los
resultados que presenta la siguiente tabla
T (K) 700 780 940 1000 1200 1610
R () 8100 2440 900 510 360 300
Se pide:
a) Proponer una relacin de regresin entre la resistencia y
la temperatura. Convertir dicha relacin en una de
regresin lineal. Obtener la recta de regresin mnimo-
cuadrtica ajustada a los datos transformados. Valorar la
calidad del ajuste obtenido.
b) Qu se puede decir sobre la resistencia de estos
dispositivos cuando la temperatura sea de 1100 K?

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Solucin Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/3
SOLUCIONES A CUESTIONES Y
ALGUNOS PROBLEMAS DEL MATERIAL
COMPLEMENTARIO DEL TEMA 2

2.1.- 1.- D). 2.- A). 3.- C). 4.- D). 5.- B).
6.- A). 7.- C).

2.7.-
a) 3941 . 6 867302 . 0 + = x y , SCTo = 400.336 unid
2
,
SCR = 291.6339 unid
2
, SCE = 108.7021 unid
2
.
b) Se verifica que 7285 . 0
2
= r y r = +0.8535. Nos indican que
hay una relacin lineal acusada de tipo directo entre la
medicin del octanaje con el mtodo 2 y con el mtodo 1,
de manera que el 72.85 % de la variacin en los datos de
octanaje por el mtodo 2 se debe o explica por la relacin
lineal que tiene este mtodo de medicin con el 1. Por
tanto, el ajuste es bastante apreciable.
c) Calculando el coeficiente de variacin en cada variable
resulta que % 6077 . 6 =
X
g y % 18 . 7 =
Y
g . Por tanto, el
mtodo 2 presenta algo ms de variacin.
Para llevar a cabo un informe de comparacin entre
ambos mtodos construiramos grficos de cajas con
muescas que permiten comparar los datos de ambos
mtodos y decidir si se comportan de manera equivalente
para mediciones futuras.
d) En la refinera B hay menor variacin en los datos del
mtodo 2 respecto a su media. Se tiene que 6582 . 0
2
= B r
frente a 7285 . 0
2
= A r . Por tanto, en el estudio de la
refinera B la variacin debida a la relacin lineal es un
65.82 % de la variacin total, mientras que en la A es un
72.85 %. Esto significa que el estudio de la refinera A
presenta unos resultados ms precisos.

2.12.-
a) 5 . 54 Q
1
= , 205 . 55 Q
2
= y 78 . 55 Q
3
= . RI = 1.28.
( )
54 . 52 y
1
= es la nica observacin extrema.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Solucin Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/3
b) Que, gracias a la desigualdad de Chebyshev ( 32 k ), se puede
afirmar que prcticamente todos los meses esta empresa
tendr sus ingresos entre 100 y 340 millones de pesetas.
Afinando ms, se puede decir que en al menos 3 de cada 4
meses los tendr entre 212.88624 y 227.91376 millones de
pesetas.
d) 6609 . 53 x 0777893 . 0 y + = . SCTo = 12.3498, SCR = 1.75181
y SCE = 10.598. 75699 . 0 ) 1 ( ) (
2 2
= =
Y
S r Y VR . 1418 . 0
2
= r .
e) 068345 . 42 407025 . 1 035814 . 0
2
+ + = x x y . SCTo = 12.3498,
793929 . 9 SCR
P
= y 555871 . 2 SCE
P
= .
182562 . 0 ) 1 ( ) (
2 2
= =
Y P P
S r Y VR . 793043 . 0
2
= P r .

f) frascos de miles 873 . 55 y = .

2.13.-
A) La representacin, realizada con STATGRAPHICS bajo WINDOWS
(Plot-Scatterplots-X-Y PLot) se muestra a continuacin.
Plot of y vs x
0 0,5 1 1,5 2 2,5 3
x
0
2
4
6
8
10
12
(X 1000)
y

Se observa que resulta muy interesante relacionar ambas
variables ya que las variaciones de la Y se explican en su mayor parte
por las variaciones de la X, a travs de una funcin lineal o quizs de
una raz cuadrada o logartmica.

B y C) En la siguiente tabla se muestran los resultados para la
totalidad de los vuelos, los cortos y los largos.

Parte de la muestra Covarianza (hxl) CCL Pearson
Totalidad de los vuelos 1476,4176 0,99314
Vuelos cortos (<1 hora) 95,48676 0,9690
Vuelos largos (1 hora) 1094,963 0,9992

Se concluye que aunque la relacin lineal en la totalidad de la
muestra es muy acusada, cuando nos limitamos a los vuelos cortos
perdemos fuerza en la relacin, mientras que cuando vamos a los
largos la ganamos, lo cual indica que las predicciones de gasto de
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010




Solucin Material Comp. Tema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/3
combustible en un vuelo largo sern muy exactas segn una relacin
lineal.
2.14.-a)
b
T
a
T
e R
+
= , con a = B y
0
0
T
B
R ln b = .
Relacin de regresin lineal Y = aX + b, con Y = ln R
T
, X = 1/T.
Recta de regresin y = 4114x + 2.63339.
r = 0.946063 y r
2
= 89.5 %.
b) Para x
0
= 1/1100, y
0
= 6.37339. = 04 . 586 R

1100
.

Nota sobre las interpretaciones.-
Para llegar a manejar con soltura las interpretaciones estadsticas se
pueden consultar los problemas resueltos que hay en el libro de texto y los
libros de apoyo, como un elemento adicional al necesario seguimiento diario
de la asignatura y la atencin en clase.


IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.1 - 3.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/14


Ejercicio 3.4.-
Construir el diagrama de rbol asociado a un sistema formado
por dos componentes en serie o en paralelo para estudiar el
funcionamiento del sistema en relacin a las componentes. (Un
sistema en serie es aquel que funciona cuando lo hacen todas sus
componentes, mientras que un sistema en paralelo funciona cuando
lo hace al menos una de sus componentes).
La representacin en diagrama en rbol es muy til cuando el
experimento tiene lugar en una serie de etapas, ya que facilita el
clculo y nos permite ver el aspecto general del experimento. Si un
experimento se desarrolla en k etapas y en la 1 etapa hay n
1

resultados posibles, en la 2 etapa hay n
2
resultados posibles, y la k-
sima etapa tiene n
k
resultados posibles, ste experimento se podr
representar mediante un diagrama en rbol con n
1
n
k
ramas.
3.2. PROBABILIDAD
3.2.1. Introduccin
El objetivo de la probabilidad es cuantificar la incertidumbre con
la que aparecen los distintos sucesos de un fenmeno aleatorio. Para
su anlisis nos apoyamos en el concepto de frecuencia, de forma que
la probabilidad cumpla las mismas propiedades que sta.
Una de las numerosas aplicaciones de la probabilidad a la
ingeniera es la fiabilidad de sistemas. La fiabilidad de un sistema
(desde una simple resistencia o condensador hasta complejos
sistemas como una central nuclear o una red de ordenadores) la
mediremos como la probabilidad de que dicho sistema funcione
correctamente durante un perodo de tiempo determinado o tiempo
de misin.
Es de destacar, tambin, que en los sistemas electrnicos, de
comunicacin e informticos la transmisin de la informacin es un
fenmeno aleatorio y la probabilidad se encargar de medirnos la
incertidumbre con qu se pueden presentar los distintos sucesos a
considerar. Por ejemplo, la teora de la seal aleatoria, perteneciente
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.1 - 3.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/14
al mbito de la Electrnica, descansa en los fundamentos de la teora
de la Probabilidad.
3.2.2. Axiomas de la probabilidad. Consecuencias.
Consideremos un experimento aleatorio con espacio muestral
. En trminos generales, se define probabilidad de un suceso A
como la incertidumbre de que aparezca dicho suceso A o, lo que
es lo mismo, A P (). Es decir, se trata de la aplicacin
P:
A P(A)
Esta aplicacin permite asociar a cada suceso A un nmero real
P(A), siendo P(A) la incertidumbre con que ocurrir el suceso A en el
experimento aleatorio. Verifica los axiomas siguientes:
Ax.1.- A , P(A) 0
Ax.2.- P() =1
Ax.3.- A,B / A B = , P(A B) = P(A) + P(B)
Ax.3 generalizado.- A
1
, , A
n
/A
i
A
j
= , ( )

=
=
=
n
i
i
n
i
i
A P A P
1
1
U .
Observacin.
Los axiomas no determinan las probabilidades, stas se asignan
basndose en nuestro conocimiento del sistema bajo estudio a travs
de las probabilidades iniciales (ver apartado 2.2.4.). Sin embargo, los
axiomas permiten calcular las probabilidades de algunos sucesos a
partir de otras ya conocidas.
Consecuencias de los axiomas de la probabilidad:
1. P()=0.
2. P( A)= 1 - P(A).
3. Si A,B , A B (A implica B) P(A) P(B).
A implica B (notado A B) cuando A, B
4. P(A) 1, A .
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.1 - 3.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/14
La implicacin prctica de estas propiedades es que la
probabilidad es una medida asociada a los subconjuntos de un
espacio que al variar en [0,1] se expresa habitualmente en
porcentaje.
3.2.3. Propiedades
Las siguientes propiedades fundamentales de la
probabilidad se deducen de los axiomas y sus consecuencias.

Propiedad 1 (P1)
Sea un experimento aleatorio cualquiera con espacio muestral
y dos sucesos cualesquiera de este experimento A, B . Entonces
( ) ( ) ( ) ( ). B A P B P A P B A P + = (3.1)

Demostracin.-
Para poder aplicar el axioma 3 es necesario expresar la unin
de estos dos sucesos compatibles como unin de sucesos
incompatibles, lo que nos lleva a que
( ) ( ) ( ) A B B A B A B A =
Por tanto, segn el axioma 3 resulta que
( ) ( ) ( ) ( ) A B P B A P B A P B A P + + = (3.2)
Por otra parte, se tiene que
( ) ( ) B A B A A = y ( ) ( ) B A A B B =
es decir, se ha expresado cada uno de los sucesos A y B considerados
como unin de sucesos incompatibles, lo que permite utilizar de
nuevo el axioma 3 para obtener

( ) ( ) ( ) B A P B A P A P + = y ( ) ( ) ( ) B A P A B P B P + =

de donde se deduce que
( ) ( ) ( ) B A P A P B A P = (3.3)
( ) ( ) ( ) B A P B P A B P = (3.4)

Sustituyendo (2.3) y (2.4) en la expresin (2.2), resulta que
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.1 - 3.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/14
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) B A P B P A P B A P B P B A P B A P A P B A P + = + + =
, c.q.d.

Propiedad 2 (P2)
Sea un experimento aleatorio cualquiera con espacio muestral
. Sean tres sucesos cualesquiera de este experimento A, B, C ;
entonces
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) C B A P C B P C A P B A P C P B P A P C B A P + + + = (3.5)

Demostracin.-
Hacerla como ejercicio, aplicando la propiedad P1 a los sucesos
A B y C. Despus aplicar sucesivamente esa propiedad a la unin
de los pares de sucesos que resulten al aplicar la propiedad
distributiva de la interseccin respecto de la unin.

Propiedad 3 (P3)
Sea un experimento aleatorio cualquiera con espacio muestral
. Sean n sucesos cualesquiera de este experimento A A A
n 1 2
, , ... , ;
entonces
( )
n
n
n
i
P P P P P
i
A P
1
4 3 2 1
1
1 ...

=
+ + + =

U
(3.6)
donde
( )

=
=
n
i
i
A P P
1
1

( )

<
=
n i i
i i
A A P P
2 1
2 1
1
2

( )

< <
=
n i i i
i i i
A A A P P
3 2 1
3 2 1
1
3

..........................................
..........................................

=
=
I
n
i
i n
A P P
1

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.1 - 3.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/14
Demostracin.-
Por induccin. Hacerla como ejercicio de ampliacin.


Propiedad 4 (P4)
Sea un experimento aleatorio cualquiera con espacio muestral
. Sean dos sucesos cualesquiera de este experimento A, B ;
entonces
( ) ( ) ( ) B A P A P B A P = - (3.7)
Demostracin.-
Se trata de la frmula (3.3) que ha quedado demostrada en la
propiedad 1.





Propiedad 5 (P5)
Sea un experimento aleatorio cualquiera con espacio muestral
. Sean dos sucesos cualesquiera de este experimento A, B ;
entonces
( ) ( ) ( ) ( ) B A P B P A P B A P + = 2 (3.8)
Demostracin.-
Se trata de la frmula (3.3) y (3.4) que han quedado
demostradas en la demostracin de la propiedad 1.


EJEMPLO 3.1.-

Un fabricante de cables elctricos para ordenadores conoce de
informaciones anteriores sobre la produccin de estos cables que el
1.5 % de todos los cables fabricados son no conformes a
especificaciones de longitud, el 1.2 % son defectuosos en cuanto al
espesor y el 0.8 % son no conformes en ambas medidas. Sean los
sucesos
A: un cable seleccionado al azar es no conforme a
especificaciones por su longitud
B: un cable seleccionado al azar es no conforme a
especificaciones por su espesor
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.1 - 3.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
11/14
Expresar los siguientes sucesos en trminos de A y B,
calculando sus probabilidades.
a) Alguna de las medidas de longitud o espesor de un cable
son no conformes a especificaciones.
b) En un cable ninguna de las dos medidas consideradas se
encuentra fuera de las especificaciones.
c) En un cable la longitud es no conforme a especificaciones,
pero el espesor s.
d) Un cable es no conforme a especificaciones en cuanto a
longitud o a espesor, pero no en cuanto a ambas
medidas.

a) Se trata del suceso A B. Su probabilidad ser
( ) ( ) ( ) ( ) 019 . 0 008 . 0 012 . 0 015 . 0 = + = + = B A P B P A P B A P
lo que significa que el 1.9 % de los cables fabricados por esta
empresa son no conformes a especificaciones en alguna de las dos
medidas consideradas, longitud o espesor.
b) En este caso el suceso a considerar es A B . Su
probabilidad se determinar utilizando la consecuencia 2 de los
axiomas de la probabilidad y la segunda de las leyes de Morgan,
resultando que
( ) ( ) 981 . 0 019 . 0 1 1 = = = B A P B A P
lo que nos indica que hay una probabilidad de 0.981 de que en un
cable ninguna de las dos medidas consideradas se encuentra fuera de
las especificaciones.
c) Se trata del suceso A - B. Su probabilidad ser
( ) ( ) ( ) 007 . 0 008 . 0 015 . 0 = = = B A P A P B A P
lo que nos informa que en el 0.7 % de los cables fabricados por esta
empresa el espesor es conforme a especificaciones, pero la longitud
no.
d) Ahora el suceso a considerar es la diferencia simtrica
entre A y B, i.e. A B. Su probabilidad se determinar utilizando la
consecuencia 2 de los axiomas de la probabilidad y la segunda de las
leyes de Morgan, resultando que

( ) ( ) ( ) ( ) ( ) ( )
011 . 0
008 . 0 019 . 0 2
=
= = = + = B A P B A P B A P B P A P B A P

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.1 - 3.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
12/14
lo que nos indica que hay una probabilidad de 0.011 de que un cable
sea no conforme a especificaciones en cuanto a longitud o a espesor,
pero no en cuanto a ambas medidas.
3.2.4. Mtodos para Establecer las Probabilidades
Iniciales
En trminos generales, la teora matemtica de la probabilidad
pretende calcular nuevas probabilidades tomando unas probabilidades
iniciales dadas, sin interesarse por la forma en que fueron obtenidas
dichas probabilidades. Para llegar a tales probabilidades iniciales hay
tres mtodos o criterios que pasamos a analizar.

1) Mtodo de Laplace (basado en consideraciones
tericas y lgicas)
Se utiliza en aquellos casos en que es plausible admitir el
siguiente postulado.

Postulado de Indiferencia.-
Sea un experimento aleatorio cualquiera con espacio muestral
. Si se puede descomponer en n sucesos elementales
incompatibles dos a dos (
n
A A A ,..., ,
2 1
tales que
U
n
i
i
A
1 =
= y
A A i j
i j
= , ) y equiprobables, resultar que
( ) ( ) p n
i
A P
i
A P P
n
i
n
i
= =

= =

= = 1 1
1
U

de donde
( ) elemental suceso A
n
i
A P p
i
,
1
= = .
Entonces se verifica que para cualquier
U
k
i
i
A B B
1
/
=
= ; se
tiene que
( )

= =


en s elementale sucesos de n
B en s elementale sucesos de n
n
k
B P
que es la conocida regla que estableci el marqus de Laplace, en
1812, para afirmar que bajo el postulado de indiferencia, la
probabilidad de un suceso es el cociente entre casos favorables a
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.1 - 3.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
13/14
dicho suceso y casos posibles del experimento, considerados stos
como equiprobables e incompatibles dos a dos.
Por ejemplo, en el experimento aleatorio de lanzar un dado y
observar su resultado, resulta que

( )
2
1
6
3


= =

=
en s elementale sucesos de n
par a favorables s elementale sucesos de n
par P
mientras que
( )
3
1
6
2

3
3 = =

=
en s elementale sucesos de n
a favorables s elementale sucesos de n
P
&
&
.

2) Mtodo Frecuencial u Objetivista (basado en la
interpretacin frecuencial de la probabilidad)
Se toma como probabilidad de un suceso la frecuencia relativa
del mismo en una serie de experimentos suficientemente grandes. Es
decir, al ser
( )
( )
) (A fr
N
lim
N
A n
N
lim A P

=

=
resulta que
( ) ) (A fr A P ,
a partir de un n suficientemente grande de experiencias.

EJEMPLO 3.2.-
a) Al lanzar un dado, calcular experimentalmente la
probabilidad de que el resultado sea 6.
La siguiente tabla muestra una posible secuencia donde se
recoge el valor de frecuencia del 6 segn el nmero de lanzamientos
realizado.
N de
lanzam.
10 20 30 40 200 300 400 500 600
fr(6) .07 .15 .19 .12 .15 .15 .14 .16 .16

b) Una base de datos de clientes de unos grandes almacenes
permite construir un histograma para los datos de la cantidad
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.1 - 3.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
14/14
mensual de dinero que gastan con su tarjeta de cliente. A partir de
ah se puede proponer un modelo de probabilidad.
Este mtodo es el que habitualmente se utiliza en la prctica,
para lo cual los datos del fenmeno en estudio se intentan modelar
por alguno de los modelos de probabilidad (que se estudian en los
temas 3 y 4) y luego se garantiza dicho modelo mediante el
correspondiente contraste de ajuste (que se estudian en el tema 8).
Una vez est contrastado un modelo ya se pueden aplicar las
frmulas de probabilidad estudiadas hasta el momento o las que se
vern en los prximos epgrafes.

3) Mtodo Bayesiano o Subjetivista (basado en el
grado de certidumbre)
Se toma como probabilidad de un suceso una medida subjetiva
del grado de confianza en que se produzca el suceso en cuestin,
basada en la experiencia y cantidad de informacin. Se suele utilizar
cuando el experimento no puede repetirse o carece de sentido la
repeticin. Por ejemplo, las estimaciones de probabilidad aparecidas
en otoo de 2006 sobre el cambio climtico.
Cuando un experimento puede repetirse, suele combinarse el
mtodo frecuencial con el Bayesiano.
Se trata de un mtodo que habitualmente se utiliza en la
gestin del riesgo.

ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

1/11
TEMA 3
ELEMENTOS DE PROBABILIDAD
3.1. ESPACIOS MUESTRALES Y SUCESOS

3.1.1. El Espacio Muestral
En la prctica, para estudiar los fenmenos (informticos,
industriales, econmicos, climticos, biolgicos,...) procedemos
mediante experimentos (en laboratorio, simulacin por ordenador,)
o recogiendo datos sobre los mismos. Los experimentos se pueden
clasificar en deterministas o aleatorios. Por ejemplo, seran
fenmenos aleatorios los siguientes:
1. El lanzamiento de un dado corriente bien construido y
observar el resultado de la tirada.
2. El registrar el valor de cierre diario de un ndice burstil.
3. El medir el espesor de una plancha de producto que se
emplea en un proceso de fabricacin.
4. El contabilizar la energa consumida en un da en una
zona.
Como ejemplos de fenmenos deterministas tendramos:
1. El contabilizar el nmero de diputados que se eligen en
cada convocatoria electoral en Espaa para el Congreso
de los Diputados.
2. El registrar los meses que tiene cada ao. Tambin lo
sera el registrar los das que tiene Febrero en cada ao?
Entonces, qu aspectos caracterizan a unos y otros?
En el estudio de cualquier experimento aleatorio surgen los
siguientes elementos asociados a l:
1. , es un suceso elemental. Ej. El resultado de un
lanzamiento un dado es el nmero 5: {5}.
ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

2/11
2. , es el espacio muestral, que agrupa a todos los
resultados elementales del experimento aleatorio. Ej. Todos
los posibles resultados: ={1,2,3,4,5,6}
3. P (), partes de , que rene a todos los subconjuntos del
espacio muestral.
Ej. Todos los posibles subconjuntos de al realizar una
tirada con el dado:
P()={,{1},...,{6};{1,2},{1,3},,{5,6};...;{1,2,3,4,5},..,
{2,3,4,5,6};}.
En total 2
6
posibilidades. Por qu?
Cuando el fenmeno puede presentar como resultado cualquier
nmero real, entonces el espacio muestral es la recta real. Es decir,
= . Si hablamos de la cantidad de contaminante que se emitir a
la atmsfera durante un periodo de tiempo, tendramos un fenmeno
aleatorio cuyo espacio muestral seran los nmeros reales no
negativos. Es decir,
[ ) , = + 0 .
Ejercicio 3.1.-
Para los siguientes fenmenos razonar si se trata de fenmenos
aleatorios y en caso afirmativo indicar su espacio muestral.
1. Estado en que se encuentra una mquina al principio de
una jornada.
2. Nota media que alcanza un alumno de primer curso de la
ETS de Ingeniera (ICAI) en las calificaciones de las
asignaturas de dicho curso.
3. Nmero de vehculos que circulan por una carretera
durante un periodo de tiempo.

3.1.2. Sucesos. Operaciones Bsicas entre Sucesos
En trminos generales un suceso, designado por A, es cualquier
subconjunto A del espacio muestral . Si slo tiene un elemento se
dice que es un suceso simple; si tiene ms de uno se dice que es un
suceso compuesto.
ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

3/11
La estructura de P () agrupa a todos los posibles subconjuntos
de , y de l forman parte el propio , llamado suceso seguro, y el
suceso que no contiene ningn resultado elemental, al que
llamaremos suceso imposible y designaremos por .
Se pueden establecer relaciones entre los distintos sucesos de
(), definidas por las siguientes operaciones:
- La interseccin de dos sucesos A y B es otro suceso que acontece
cuando suceden simultneamente A y B, y se representa por A B.
Lo constituyen aquellos sucesos elementales que forman a la vez
parte de A y de B (Figura 3.1), y viene definido por
A B = { / (A) (B)}.
Si no hay sucesos con esta propiedad, A B = y se dice que
A y B son dos sucesos incompatibles (Figura 3.2).


A
A B
A
B B
AB
Figura 3.1 Figura 3.2
- La unin de dos sucesos A y B es un suceso que tiene lugar
cuando acontece al menos uno de esos sucesos. Se nota por A B
(Figura 3.3). Viene definido por:
A B = { / (A) v (B)}.
Cmo se notaran y definiran las operaciones de interseccin y
unin de n sucesos? Dnde interesara manejar estos conceptos?
- El contrario de un suceso A es un suceso que tiene lugar
cuando no ocurre A y se representa por A , de forma que en cualquier
realizacin del experimento sucede A o A , pero nunca los dos a la
vez (Figura 3.4). Es decir,
ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

4/11
A = { | A}.
Se verifica que
A A = ; A A = .


A
A A
A
B
Figura 3.3 Figura 3.4

A
A

B B
A - B A B

Figura 3.5 Figura 3.6
- La diferencia entre A y B es un suceso que acontece cuando
sucede A pero no B y se representar por A - B. Se puede expresar
tambin por A B (Figura 3.5). Viene definido por:
A - B = { / (A) (B)}.
- La diferencia simtrica entre A y B es el suceso que acontece
cuando ocurre uno de los sucesos A o B pero no los dos
simultneamente y se representa por A B (Figura 3.6). Viene
definido por:
A B = { / ( A B) ( A B)}.
Observacin.- A efectos de simplificacin en desarrollos
prcticos se utilizan las denominadas leyes de Morgan:
ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

5/11
B A B A
B A B A
A A
=
=
=
) 3
) 2
) 1

Cmo se expresaran las dos ltimas para n sucesos?
Ejercicio 3.2.-
Simplificar el siguiente suceso y expresar con palabras el suceso
correspondiente.
( )
( )
( )
A B C D A
3.1.3. Diagrama en rbol
Consiste en una representacin esquemtica de los posibles
resultados de un experimento aleatorio, cuando ste se desarrolla en
varias etapas. Se empieza representando por diferentes ramas los
posibles resultados de la primera etapa del experimento aleatorio. A
continuacin, del final de cada rama anterior saldrn nuevas ramas
conforme a los posibles resultados de la segunda etapa. El proceso se
repetir hasta que se terminen de mostrar todos los resultados de las
diferentes etapas del experimento.
Ejercicio 3.3.-
Representar en un diagrama en rbol el experimento aleatorio de
lanzar una moneda al aire 3 veces.
Los resultados que aparecen al final de cada una de las ramas
son sucesos elementales.
Ejercicio 3.4.-
Construir el diagrama de rbol asociado a un sistema formado
por dos componentes en serie o en paralelo para estudiar el
funcionamiento del sistema en relacin a las componentes. (Un
sistema en serie es aquel que funciona cuando lo hacen todas sus
componentes, mientras que un sistema en paralelo funciona cuando
lo hace al menos una de sus componentes).
La representacin en diagrama en rbol es muy til cuando el
experimento tiene lugar en una serie de etapas, ya que facilita el
ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

6/11
clculo y nos permite ver el aspecto general del experimento. Si un
experimento se desarrolla en k etapas y en la 1 etapa hay n
1

resultados posibles, en la 2 etapa hay n
2
resultados posibles, y la k-
sima etapa tiene n
k
resultados posibles, ste experimento se podr
representar mediante un diagrama en rbol con n
1
n
k
ramas.
3.2. PROBABILIDAD
3.2.1. Introduccin
El objetivo de la probabilidad es cuantificar la incertidumbre con
la que aparecen los distintos sucesos de un fenmeno aleatorio. Para
su anlisis nos apoyamos en el concepto de frecuencia, de forma que
la probabilidad cumpla las mismas propiedades que sta.
Una de las numerosas aplicaciones de la probabilidad a la
ingeniera es la fiabilidad de sistemas. La fiabilidad de un sistema
(desde una simple resistencia o condensador hasta complejos
sistemas como una central nuclear o una red de ordenadores) la
mediremos como la probabilidad de que dicho sistema funcione
correctamente durante un perodo de tiempo determinado o tiempo
de misin.
Es de destacar, tambin, que en los sistemas electrnicos, de
comunicacin e informticos la transmisin de la informacin es un
fenmeno aleatorio y la probabilidad se encargar de medirnos la
incertidumbre con qu se pueden presentar los distintos sucesos a
considerar. Por ejemplo, la teora de la seal aleatoria, perteneciente
al mbito de la Electrnica, descansa en los fundamentos de la teora
de la Probabilidad.
3.2.2. Axiomas de la probabilidad. Consecuencias.
Consideremos un experimento aleatorio con espacio muestral
. En trminos generales, se define probabilidad de un suceso A
como la incertidumbre de que aparezca dicho suceso A o, lo que
es lo mismo, A P (). Es decir, se trata de la aplicacin
P:
A P(A)
Esta aplicacin permite asociar a cada suceso A un nmero real
P(A), siendo P(A) la incertidumbre con que ocurrir el suceso A en el
experimento aleatorio. Verifica los axiomas siguientes:
ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

7/11
Ax.1.- A , P(A) 0
Ax.2.- P() =1
Ax.3.- A,B / A B = , P(A B) = P(A) + P(B)
Ax.3 generalizado.- A
1
, , A
n
/A
i
A
j
= , ( )

=
=
=
n
i
i
n
i
i
A P A P
1
1
.
Observacin.
Los axiomas no determinan las probabilidades, stas se asignan
basndose en nuestro conocimiento del sistema bajo estudio a travs
de las probabilidades iniciales (ver apartado 2.2.4.). Sin embargo, los
axiomas permiten calcular las probabilidades de algunos sucesos a
partir de otras ya conocidas.
Consecuencias de los axiomas de la probabilidad:
1. P()=0.
2. P( A)= 1 - P(A).
3. Si A,B , A B (A implica B) P(A) P(B).
A implica B (notado A B) cuando A, B
4. P(A) 1, A .
La implicacin prctica de estas propiedades es que la
probabilidad es una medida asociada a los subconjuntos de un
espacio que al variar en [0,1] se expresa habitualmente en
porcentaje.
3.2.3. Propiedades
Las siguientes propiedades fundamentales de la
probabilidad se deducen de los axiomas y sus consecuencias.

Propiedad 1 ( P1)
Sea un experimento aleatorio cualquiera con espacio muestral
y dos sucesos cualesquiera de este experimento A, B . Entonces
( ) ( ) ( ) ( ). B A P B P A P B A P + = (3.1)

ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

8/11
Demostracin.-
Para poder aplicar el axioma 3 es necesario expresar la unin
de estos dos sucesos compatibles como unin de sucesos
incompatibles, lo que nos lleva a que
( ) ( ) ( ) A B B A B A B A =
Por tanto, segn el axioma 3 resulta que
( ) ( ) ( ) ( ) A B P B A P B A P B A P + + = (3.2)
Por otra parte, se tiene que
( ) ( ) B A B A A = y ( ) ( ) B A A B B =
es decir, se ha expresado cada uno de los sucesos A y B considerados
como unin de sucesos incompatibles, lo que permite utilizar de
nuevo el axioma 3 para obtener

( ) ( ) ( ) B A P B A P A P + = y ( ) ( ) ( ) B A P A B P B P + =

de donde se deduce que
( ) ( ) ( ) B A P A P B A P = (3.3)
( ) ( ) ( ) B A P B P A B P = (3.4)

Sustituyendo (2.3) y (2.4) en la expresin (2.2), resulta que
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) B A P B P A P B A P B P B A P B A P A P B A P + = + + =
, c.q.d.

Propiedad 2 ( P2)
Sea un experimento aleatorio cualquiera con espacio muestral
. Sean tres sucesos cualesquiera de este experimento A, B, C ;
entonces
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) C B A P C B P C A P B A P C P B P A P C B A P + + + = (3.5)

Demostracin.-
Hacerla como ejercicio, aplicando la propiedad P1 a los sucesos
A B y C. Despus aplicar sucesivamente esa propiedad a la unin
de los pares de sucesos que resulten al aplicar la propiedad
distributiva de la interseccin respecto de la unin.
ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

9/11

Propiedad 3 ( P3)
Sea un experimento aleatorio cualquiera con espacio muestral
. Sean n sucesos cualesquiera de este experimento A A A
n 1 2
, ,..., ;
entonces
( )
n
n
n
i
P P P P P
i
A P
1
4 3 2 1
1
1 ...

=
+ + + =

(3.6)
donde
( )

=
=
n
i
i
A P P
1
1

( )

<
=
n i i
i i
A A P P
2 1
2 1
1
2

( )

< <
=
n i i i
i i i
A A A P P
3 2 1
3 2 1
1
3

..........................................
..........................................

=
=

n
i
i n
A P P
1

Demostracin.-
Por induccin. Hacerla como ejercicio de ampliacin.


Propiedad 4 ( P4)
Sea un experimento aleatorio cualquiera con espacio muestral
. Sean dos sucesos cualesquiera de este experimento A, B ;
entonces
( ) ( ) ( ) B A P A P B A P = - (3.7)
Demostracin.-
Se trata de la frmula (3.3) que ha quedado demostrada en la
propiedad 1.




ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

10/11

Propiedad 5 ( P5)
Sea un experimento aleatorio cualquiera con espacio muestral
. Sean dos sucesos cualesquiera de este experimento A, B ;
entonces
( ) ( ) ( ) ( ) B A P B P A P B A P + = 2 (3.8)
Demostracin.-
Se trata de la frmula (3.3) y (3.4) que han quedado
demostradas en la demostracin de la propiedad 1.


EJEMPLO 3.1.-

Un fabricante de cables elctricos para ordenadores conoce de
informaciones anteriores sobre la produccin de estos cables que el
1.5 % de todos los cables fabricados son no conformes a
especificaciones de longitud, el 1.2 % son defectuosos en cuanto al
espesor y el 0.8 % son no conformes en ambas medidas. Sean los
sucesos
A: un cable seleccionado al azar es no conforme a
especificaciones por su longitud
B: un cable seleccionado al azar es no conforme a
especificaciones por su espesor
Expresar los siguientes sucesos en trminos de A y B,
calculando sus probabilidades.
a) Alguna de las medidas de longitud o espesor de un cable
son no conformes a especificaciones.
b) En un cable ninguna de las dos medidas consideradas se
encuentra fuera de las especificaciones.
c) En un cable la longitud es no conforme a especificaciones,
pero el espesor s.
d) Un cable es no conforme a especificaciones en cuanto a
longitud o a espesor, pero no en cuanto a ambas
medidas.

a) Se trata del suceso A B. Su probabilidad ser
( ) ( ) ( ) ( ) 019 . 0 008 . 0 012 . 0 015 . 0 = + = + = B A P B P A P B A P
lo que significa que el 1.9 % de los cables fabricados por esta
empresa son no conformes a especificaciones en alguna de las dos
medidas consideradas, longitud o espesor.
ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008




3.1 - 3.2.3 Carlos Mat

11/11
b) En este caso el suceso a considerar es A B . Su
probabilidad se determinar utilizando la consecuencia 2 de los
axiomas de la probabilidad y la segunda de las leyes de Morgan,
resultando que
( ) ( ) 981 . 0 019 . 0 1 1 = = = B A P B A P
lo que nos indica que hay una probabilidad de 0.981 de que en un
cable ninguna de las dos medidas consideradas se encuentra fuera de
las especificaciones.
c) Se trata del suceso A - B. Su probabilidad ser
( ) ( ) ( ) 007 . 0 008 . 0 015 . 0 = = = B A P A P B A P
lo que nos informa que en el 0.7 % de los cables fabricados por esta
empresa el espesor es conforme a especificaciones, pero la longitud
no.
d) Ahora el suceso a considerar es la diferencia simtrica
entre A y B, i.e. A B. Su probabilidad se determinar utilizando la
consecuencia 2 de los axiomas de la probabilidad y la segunda de las
leyes de Morgan, resultando que

( ) ( ) ( ) ( ) ( ) ( )
011 . 0
008 . 0 019 . 0 2
=
= = = + = B A P B A P B A P B P A P B A P

lo que nos indica que hay una probabilidad de 0.011 de que un cable
sea no conforme a especificaciones en cuanto a longitud o a espesor,
pero no en cuanto a ambas medidas.

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

1/12
3.3. PROBABILIDAD CONDICIONADA

3.3.1. Introduccin
Los fenmenos aleatorios raramente se desarrollan en ausencia
de informacin sobre los mismos. Por ejemplo, en sistemas expertos
probabilsticos que manejan algunas empresas, si se quiere
cuantificar la probabilidad de que un internauta visite una web dicha
probabilidad ser diferente si la calculamos en ausencia de
informacin que si la calculamos condicionada por el historial de
visitas que haya realizado. En otro ejemplo, al estudiar el
comportamiento de temperaturas de un horno en un proceso de
fabricacin, la probabilidad ser diferente si la calculamos en
ausencia de informacin que si la calculamos condicionada por el
hecho de que se ha alcanzado ya un valor umbral de temperaturas en
el proceso.
Para establecer con precisin el concepto de probabilidad
condicionada vamos a analizar lo que ocurre con la frecuencia
condicionada en el siguiente ejemplo.
Sea un experimento aleatorio consistente en lanzar un dado 50
veces. Consideremos los siguientes subconjuntos A: resultados
mltiplos de 3 y B: resultados pares, de los cuales se tiene la
siguiente informacin en trminos de frecuencia absoluta
n
A
=10, n
B
= 20, n
{6}
= 8 con AB={6}, n
{3}
= 2.
Veamos la frecuencia con que han aparecido resultados
mltiplos de 3, de entre los lanzamientos con resultado par.
( ) 4 . 0
20
8
n
n
B / A f
B
B A
r
= = =

.
Sin embargo, tendramos
( )
) B ( f
) B A ( f
N
n
N
n
n
n
B / A f
r
r
B
B A
B
B A
r

= = =


IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

2/12
( )
) B ( f
) B A ( f
B / A f
r
r
r

= , B / 0 ) ( > B f
r
.
El comportamiento anterior de la frecuencia relativa
condicionada nos indica la manera de definir la probabilidad
condicionada.

3.3.2. Definicin de Probabilidad Condicionada.
Propiedades
Sea un espacio muestral , y un suceso B con P(B) > 0.
Entonces A se define la probabilidad condicionada de A por B,
notndose por P(A/B), al nmero real
) B ( P
) B A ( P
) B / A ( P

= con P(B) > 0.
Anlogamente,
) A ( P
) B A ( P
) A / B ( P

= con P(A) > 0.
En la probabilidad condicionada P(A/B) el suceso A se llama
suceso condicionado, B se llama suceso condicionante y
representa la probabilidad de que ocurra A sabiendo que ha ocurrido
el suceso B.
Ejemplo 3.3.1.-
La multinacional ELECTROWORLD fabrica placas de circuito
impreso para ordenadores. El Departamento de Calidad de la
empresa, en su ltimo informe, obtuvo los siguientes resultados:
A: placas no conformes a superficie y B: placas no conformes a
espesor.
P(A) = 0.015; P(B) = 0.012; P(AB) = 0.008
Se pide calcular las probabilidades condicionadas de A/B y B/A
e interpretarlas.
67 . 0
012 . 0
008 . 0
) B ( P
) B A ( P
) B / A ( P = =

=
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

3/12
El 67% de las placas no conformes en espesor tampoco lo son
en superficie.
53 . 0
015 . 0
008 . 0
) A / B ( P = =
El 53% de las placas no conformes en superficie tambin lo son
en espesor. Por tanto, es ms probable ser defectuosa en superficie
sabiendo que lo es en espesor, que ser defectuosa en espesor
sabiendo que es defectuosa en superficie.
Propiedades
Sea un experimento aleatorio cualquiera con espacio muestral
. Consideremos que ha ocurrido el suceso B, con lo cual nos
situamos en el experimento aleatorio condicionado por B. Sean tres
sucesos cualesquiera A, B, C . Entonces se cumple:
1. P(B/B) = 1.
2. P(/B) = 0.
3. P( A/B) = 1 - P(A/B).
4. P((AC)/B) = P(A/B) + P(C/B) - P((AC)/B).

3.3.3. Probabilidad de la Interseccin de Dos Sucesos
Sea un experimento aleatorio con espacio muestral y
sean A y B dos sucesos de . Entonces
P(AB) = P(A) P(B/A) = P(B) P(A/B).

3.4 INDEPENDENCIA

3.4.1. Sucesos Dependientes e Independientes
Sea un experimento aleatorio con espacio muestral . Sean A,B
dos sucesos / A,B .
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

4/12
Si P(A/B) = P(A) se dice que A es independiente de B (la
informacin de que se ha dado el suceso B no modifica la
probabilidad que tiene el suceso A de ocurrir sin conocer dicha
informacin). Entonces P(B/A) = P(B), con lo cual B es independiente
de A, y se dice que A y B son independientes.
Respectivamente, si P(A/B) P(A) se dice que A es
dependiente de B (la informacin de que ocurri el suceso B modifica
la probabilidad que tiene el suceso A de ocurrir sin conocer dicha
informacin). Entonces P(B/A) P(B), con lo cual B es dependiente
de A, y se dice que A y B son dependientes.

Ejemplo 3.4.1.-
Sea el experimento aleatorio de extraer al azar una carta de la
baraja espaola, de 40 cartas. Analizar la independencia de los
siguientes sucesos.
1) A: sacar copas y B: sacar figura.
25 . 0
40
10
) A ( P = = 25 . 0
12
3
) B / A ( P = =
El conocimiento de que ocurri B no influye en la probabilidad
de A. As, A y B son independientes. En trminos prcticos significa
que pasar una sea sobre el palo de una carta no influye sobre la
incertidumbre que hay en el hecho de que la carta sea una figura.
2) B: sacar figura y C: sacar rey.
3 . 0
3
1
12
4
) B / C ( P
)
= = = , 1 . 0
40
4
) C ( P = =
El saber que ha ocurrido el suceso B s influye en la probabilidad
de C, luego C es dependiente de B.
PROPIEDAD (Caracterizacin de la independencia)
Sea un experimento aleatorio con espacio muestral . Sean dos
sucesos A, B . Entonces
A y B independientes P(A B) = P(A) P(B) .
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

5/12
A y B dependientes P(A B) P(A) P(B).
La demostracin es inmediata y se deja como ejercicio.
TEOREMA
Sea un experimento aleatorio con espacio muestral . Sean dos
sucesos A, B . Entonces son equivalentes las siguientes
afirmaciones:
i) A y B son independientes.
ii) A y B son independientes.
iii) A y B son independientes.
iv) A y B son independientes.
Ejercicio 3.4.2.-
Durante su clase semanal de golf Alberto debe coger una bola
de una bolsa con 4 bolas: 3 rojas y 1 azul. Tambin debe coger un
palo de una bolsa con 3 palos idnticos, excepto en el color: 1
plateado y 2 amarillos. La eleccin de Alberto se puede mostrar en un
diagrama de reas como sigue.
Bola azul
(1/4)
Bola roja
(3/4)
Palo plateado
(1/3)
A B
Palo amarillo
(2/3)
C D
P(rectngulo con colores de la bandera espaola) = P(D)
=P(bola roja y palo amarillo)= P(bola roja) *P(palo amarillo) =
(3/4)*(2/3)=1/2
Se pregunta:
1. El rea del rectngulo grande representa la probabilidad
de eleccin con los colores de la bandera espaola.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

6/12
Encontrar las reas de los otros rectngulos y explicar lo
que significan.
2. Cul es la longitud y altura del cuadrado completo?
Cul es su rea? Por qu las reas necesariamente
tienen que tomar este valor?
3. Qu indica todo lo anterior sobre los sucesos que definen
una eleccin de colores de la bandera espaola?
Ejercicio 3.4.3.-
Demostrar alguna de las equivalencias en el teorema anterior.
Poner un ejemplo prctico de utilizacin de este teorema.

3.4.2. Conceptos de Independencia entre Ms de Dos
Sucesos
Sucesos independientes por parejas
Sea un experimento aleatorio con espacio muestral y tres
sucesos A, B, C . Se dice que A, B y C son independientes POR
PAREJAS o DOS A DOS cuando:
a) P(AB) = P(A) P(B) (A y B independientes)
b) P(AC) = P(A) P(C) (A y C independientes)
c) P(BC) = P(B) P(C) (B y C independientes)
Sucesos mutuamente independientes
Sea un experimento aleatorio con espacio muestral y tres
sucesos A, B, C . Se dice que A, B y C son mutuamente
independientes o completamente independientes o simplemente
independientes cuando:
a) A, B y C son independientes por parejas (3 condiciones).
b) P(ABC) = P(A) P(B) P(C) (1 condicin).
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

7/12
Conclusiones
Si A, B y C son "mutuamente" independientes AB y C son
independientes. No se verifica si son independientes por
parejas.
La independencia mtua implica independencia por parejas.
La independencia por PAREJAS NO IMPLICA independencia
MUTUA.
Ejercicio 3.4.3.- (Paradoja de Bernstein)
Consideremos el lanzamiento de dos monedas 1 y 2
perfectamente construidas. Sean los sucesos
A: el lanzamiento de la primera moneda resulta cruz
B: el lanzamiento de la segunda moneda resulta cruz
C: slo aparece una cruz en los dos lanzamientos
Verificar que los sucesos A, B y C son independientes por
parejas, pero no son mutuamente independientes.
3.4.3. Probabilidad de la Interseccin de Varios
Sucesos
Sea un experimento aleatorio cualquiera, con espacio muestral
. Sean tres sucesos cualesquiera A, B, C . Entonces se cumple:
P(ABC)=P(A)P(B/A)P(C/(AB)) con P(AB) > 0.

Por otra parte, para n sucesos tenemos

P(A
1
A
2
..A
n
) = P(A
1
)P(A
2
/A
1
)P(A
3
/(A
1
A
2
))..P(A
n
/(A
1
..A
n-1
)),
con tal que P(A
1
A
n-1
) > 0.

De manera que

=
= =

n
i
n
i
i
A P P
i
A
1 1
) (
I
, cualesquiera que sea n, si y slo si A
1
, ..., A
n
son
sucesos mutuamente independientes.

IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

8/12
3.5 TEOREMAS DE LA PROBABILIDAD
TOTAL Y DE BAYES
En el estudio de los fenmenos aleatorios es frecuente tener
informacin parcial que se puede agregar mediante el teorema de la
probabilidad total. Tambin es habitual que la informacin sobre el
fenmeno vaya cambiando. Es decir, que el ingeniero disponga de
informacin que le permita cambiar las probabilidades que vena
utilizando en ausencia de esa informacin. El teorema de Bayes es la
herramienta que permite cuantificar cmo se modifican las
probabilidades en un fenmeno aleatorio, cuando cambia la
informacin sobre el mismo.
El siguiente ejemplo nos introduce en los resultados generales
que luego se exponen.

Ejemplo 3.5.1.-
La empresa Kassan Cars fabrica coches de gama media, y en su
fbrica de Madrid tiene 3 lneas de produccin:
-1 produce un 4% defectuosos; fabricando un 30% del total.
-2 produce un 6% defectuosos; fabricando un 20% del total.
-3 produce un 1% defectuosos; fabricando un 50% del total.
Sean los sucesos A
i
: un vehculo ha sido fabricado en la lnea i-
sima de esta fbrica, para i = 1, 2, 3.
P(A
1
) = 0.3; P(A
2
) = 0.2; P(A
3
) = 0.5; de forma que {A
1
A
2
A
3
}
son una particin o clasificacin del espacio muestral .
Sea el suceso B: un automvil fabricado en la factora es
defectuoso.
P(B/A
1
) = 0,04 ; P(B/A
2
) = 0,06 ; P(B/A
3
) = 0,01 son
verosimilitudes (likelihood), al indicarnos lo verosmil que es la
ocurrencia del suceso B por cada una de las tres causas A
1
, A
2
, A
3
.
Las verosimilitudes no suman necesariamente 1.
a) Calcular la probabilidad de que un coche fabricado por
Kassan Cars sea defectuoso.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

9/12
P(B) = P(B) = P(B(A
1
A
2
A
3
)) =
P((BA
1
)(BA
2
)(BA
3
)) =

=

3
1
) (
i
B
i
A P
Teorema de la probabilidad total

P(B) = 2.9% = 0,029. Porcentaje total de coches defectuosos
fabricados en la factora. La probabilidad total se puede interpretar
como una media ponderada.
b) Sabiendo que un coche es defectuoso, calcular la lnea ms
probable donde se ha fabricado. Se entiende por
probabilidades a posteriori a P(A
i
/B), siendo las
probabilidades a priori P(A
i
).

=
3
1
) / ( ) (
) / ( ) (
) (
) (
) / (
j
j
A B P
j
A P
i
A B P
i
A P
B P
B
i
A P
B
i
A P

Teorema de Bayes
Cuantifica cmo se modifican las probabilidades a priori cuando
se dispone de informacin en el experimento. Tanto las
probabilidades a priori como a posteriori siempre suman 1.
P(A
1
/B) = P(A
2
/B) = 0.4138.
P(A
3
/B) = 0.1724.
Sabiendo que un coche es defectuoso, tiene un 41% de
probabilidad de pertenecer a la primera lnea, e idntica probabilidad
a la segunda, y a la tercera slo un 17%.

=
=
3
1
) / ( ) ( ) (
i
i
A B P
i
A P B P
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

10/12
Elementos Tericos
Sea un experimento aleatorio con espacio muestral . Sea
{A
1
,A
n
} una clasificacin o particin de (sucesos incompatibles
cuya unin es el espacio muestral) con sus probabilidades. Sea un
suceso B del cual se dispone de las probabilidades P(B/A
i
),
cuando i = 1,, n. Utilizando diagramas de Venn dicha situacin se
representa como se muestra a continuacin.
B
A
4
A
3
A
2
A
1
A
i
A
7
A
6
A
5

Entonces:
1.

=
=
n
j
j
A B P
j
A P B P
1
) / ( ) ( ) ( Teorema de Probabilidad Total
2.

=
n
j
j j
i i
i
A B P A P
A B P A P
B A P
1
) / ( ) (
) / ( ) (
) / ( Teorema de Bayes
3. Probabilidades a priori: P(A
i
), para i = 1, ..., n.
4. Probabilidades a posteriori: P(A
i
/B), para i = 1, ..., n.
5. Verosimilitudes: P(B/A
i
), para i = 1, ..., n.

En la web http://www.ugr.es/~jsalinas/bayes.htm se encuentra
automatizado el clculo. Tambin se puede consultar en
http://statpages.org/bayes.html
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

11/12

Observacines.-
1. El concepto de particin o clasificacin refleja formalmente el
hecho habitual en la realidad de clasificar o dividir los conjuntos
de objetos, personas, etc. por algn criterio como puede ser la
marca, el ao de fabricacin, la provincia de nacimiento, el
nivel de estudios alcanzado, etc.
2. Obsrvese que tanto el teorema de la probabilidad total como el
teorema de Bayes son un caso particular de un experimento

Ejercicio 3.5.2.-
Un estudio de los fallos catastrficos mensuales en los sistemas informticos
de una gran empresa multinacional proporcion la siguiente informacin.

Ao del modelo Proporcin de
ordenadores
Probabilidad de tener un
fallo catastrfico
2000 0,16 0,005
2001 0,18 0,002
2002 0,20 0,003
2003 0,46 0,004

a) Si nos informan que un ordenador tuvo un fallo catastrfico, Con qu
probabilidad se trata de uno de los que fueron comprados en el siglo XXI?
Responder razonadamente con ayuda de un diagrama en rbol.
b) Evaluar la probabilidad de que se produzca algn fallo catastrfico durante un
ao en esta empresa. Responder razonadamente.

El teorema de Bayes es la primera piedra sobre la que se ha
fundado un edificio estadstico de gran importancia que es la
Estadstica Bayesiana. Se trata de la parte de la Estadstica que
analiza los datos y las propiedades de las poblaciones de las que se
han obtenido dichos datos cuando se dispone de informacin previa,
llamada a priori, y la realidad nos proporciona informacin adicional
que nos lleva a resultados ms depurados que se denominan a
posteriori.
IINF, ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





3.3 - 3.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

12/12
Por otra parte, los dos resultados anteriores se pueden utilizar
en las llamadas redes Bayesianas.

Software disponible
MSBNx http://research.microsoft.com/adapt/MSBNx/
BNT http://bnt.sourceforge.net/
Lista comparativa de diferentes paquetes de software para redes
bayesianas http://bnt.sourceforge.net/bnsoft.html
Lista de Google sobre software para redes Bayesianas
http://directory.google.com/Top/Computers/Artificial_Intelligence/Bel
ief_Networks/Software/

Referencias
A Brief Introduction to Graphical Models and Bayesian Networks
http://www.cs.ubc.ca/~murphyk/Bayes/bnintro.html
Tutorial slides on graphical models and BNT




IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Combinatoria Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/6
COMBINATORIA
(MATERIAL DE ADAPTACION AL NIVEL REAL DEL ALUMNO)
Regla de la Multiplicacin
Si una operacin se puede describir como una secuencia de k etapas,
y si
el nmero de formas diferentes de completar la etapa 1 es n
1
,
para cada forma de completar la etapa 1 el nmero de formas
diferentes de completar la etapa 2 es n
2
,
para cada forma de completar la etapa 2 el nmero de formas
diferentes de completar la etapa 3 es n
3
,
y as sucesivamente, entonces el nmero total de formas de
completar la operacin es
n n n
k 1 2
...

Ejemplo:
Un fabricante de automviles proporciona los vehculos
equipados con opciones seleccionadas. Cada vehculo puede ser
solicitado
con o sin transmisin automtica
con o sin aire acondicionado
con una de las tres opciones de un sistema de msica estreo
con uno de los cuatro colores exteriores disponibles.
De la regla de la multiplicacin se deduce que el nmero de
vehculos con opciones diferentes que ofrece este fabricante es 2 x 2
x 3 x 4 = 48.
Otro clculo til es el nmero de ordenaciones de los elementos
de un conjunto. Consideremos un conjunto de elementos, como S =
{a, b, c}. Una permutacin de los elementos es una ordenacin de
los mismos. Por ejemplo, abc, acb, bac, bca, cab, y cba son todas las
permutaciones de los elementos de S.
El nmero de permutaciones (ordenaciones) de n elementos se
nota por n! y viene definido por
(C-1) ( ) ( ) 1 2 ... 2 n 1 - n n = n!

Esto se deduce de la regla de multiplicacin. Una permutacin se
puede construir seleccionando el elemento que se va a colocar en la
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Combinatoria Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/6
primera posicin de la ordenacin de entre n elementos, a
continuacin seleccionando el elemento que se va a colocar en la
segunda posicin de la ordenacin de entre los n - 1 elementos
restantes, despus seleccionando el elemento que se va a colocar en
la tercera posicin de la ordenacin de entre los n - 2 elementos
restantes, y as sucesivamente.
En algunas situaciones se est interesado en el nmero de
permutaciones de slo algunos elementos, r, del conjunto de n
elementos. En este caso cada permutacin recibe el nombre de
variacin de los n elementos tomando r.
El conjunto de permutaciones de un conjunto de r elementos
seleccionados de un conjunto de n elementos diferentes se llaman
variaciones de n elementos tomados de r en r y se notan por
V
n,r
, siendo calculadas por
(C-2) ( )
( )! r n
! n
) 1 r n ( ... 1 n n V
r , n

= + =

Ejemplo:

Una placa de circuito impreso tiene 8 localizaciones diferentes
donde se puede colocar una componente. Si se van a colocar 4
componentes diferentes sobre la placa, cuntos diseos diferentes
posibles existen?

Para cada diseo se selecciona un lugar de las 8 localizaciones
para la primera componente, un lugar de las 7 localizaciones
restantes para la segunda componente, un lugar de las 6
localizaciones restantes para la tercera componente, y un lugar de las
5 localizaciones restantes para la segunda componente. Por tanto,
V
8 4
8 7 6 5 1680
,
= = .
Es decir, existen 1680 diseos diferentes posibles.
A veces estamos interesados en contar el nmero de
ordenaciones de n objetos que no son todos diferentes.
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Combinatoria Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/6
El nmero de ordenaciones de n = n
1
+ n
2
+ ... + n
r
objetos entre
los que n
1
son de tipo 1, n
2
son de tipo 2, n
3
son de tipo 3, ..., y n
r

son de tipo r; viene definido por
(C-3)
n!
n n n
1
! !... !
2 r



Ejemplo.-
Un cdigo de barras se puede generar imprimiendo 4 lneas de
tamao grueso, 3 lneas de tamao medio y 2 lneas de tamao fino.
Si cada ordenacin de las nueve lneas representa un cdigo de
barras diferente, cuntos cdigos de barras diferentes se pueden
generar utilizando este esquema?

De la expresin (C-3) se deduce que se pueden generar
9!
4 2 ! ! ! 3
1260 =
cdigos de barras diferentes.

Otro problema combinatorio de inters es el nmero de
subconjuntos de r elementos que se pueden seleccionar de un
conjunto de n elementos. Aqu, el orden no es importante, ya que
cada subconjunto puede estar en el orden que se quiera y cuenta slo
como un subconjunto diferente de los otros. Cada subconjunto de r
elementos se puede indicar listando los elementos del conjunto y
marcando cada elemento con un * si se incluye en el subconjunto.
Por tanto, cada ordenacin de r * y n - r blancos diferentes indica
un subconjunto diferente. De la expresin (C-3) se deduce el
siguiente resultado.
El nmero de subconjuntos de r elementos que se pueden seleccionar
de un conjunto de n elementos se llaman combinaciones de n
elementos tomados de r en r y se notan por C
n r ,
, o

n
r
, siendo
calculadas por
(C-4)
( )! r n ! r
! n
n
r
= C
r n,

=


IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Combinatoria Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/6

Ejemplo.-

Una placa de circuito impreso tiene 8 localizaciones diferentes
donde se puede colocar una componente. Si se van a colocar 5
componentes idnticas sobre la placa, cuntos diseos diferentes se
pueden construir?

Cada diseo es un subconjunto de las 8 localizaciones que van a
contener componentes. De la ecuacin (C-4) se deduce que el
nmero de diseos posibles es

C =
5
8
8,5

=
8!
5 3
56
! !
.

EJERCICIOS DE COMBINATORIA

1. El pedido de un ordenador personal por parte de un cliente a un
distribuidor, puede especificar uno cualquiera de cinco tamaos de
memoria, uno cualquiera de tres tipos de monitores, uno cualquiera
de cuatro tamaos de disco duro, y puede a la vez incluir o no una
tableta digitalizadora. Cuntos ordenadores diferentes se pueden
solicitar a este distribuidor?

2. Para los nuevos diseos de tanques de tratamiento de aguas
residuales se han propuesto tres formas posibles, cuatro capacidades
posibles, tres localizaciones para las vlvulas de entrada, y cuatro
localizaciones para las vlvulas de salida. Cuntos diseos diferentes
de estos tanques son posibles?

3. Un proceso de fabricacin consta de 6 operaciones que se
pueden realizar en cualquier orden. Cuntas secuencias diferentes
de fabricacin se podran considerar para este proceso?

4. Un lote de 140 semiconductores se inspecciona eligiendo una
muestra de 5. Supongamos que 10 de los semiconductores no son
conformes a los requerimientos del cliente.
a) Cuntas muestras diferentes se pueden extraer?
b) Cuntas muestras contendrn exactamente un
semiconductor no conforme?
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Combinatoria Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/6
c) Cuntas muestras contendrn al menos un
semiconductor no conforme?

5. En la composicin de una placa de circuito impreso para un
producto electrnico, hay 12 lugares diferentes donde se pueden
ubicar los chips.
a) Si se deben colocar cinco tipos diferentes de chips sobre
la placa, cuntas composiciones diferentes son posibles?
b) Si los cinco chips que se van a colocar sobre la placa son
del mismo tipo, cuntas composiciones diferentes son
posibles?

6. Un byte es una secuencia de 8 bits y cada bit es un 0 un 1.
a) Cuntos bytes diferentes son posibles?
b) Si el primer bit de un byte es una verificacin de
paridad, esto es, el primer bit se determina de los
otros siete bits, cuntos bytes diferentes son
posibles?

7. A un consumidor se le presentan siete tipos de cerveza y se le
pide que las ordene segn su preferencia.
a) Cuntas ordenaciones diferentes puede realizar?
b) Si la eleccin se realiza al azar, cul es la
probabilidad de que el consumidor seleccione un
orden concreto?

8. El gerente de una empresa ha decidido que en el futuro
repartir el presupuesto de publicidad entre dos agencias. Para
contratar los servicios de publicidad puede optar entre 8 agencias.
Cuntas elecciones diferentes de las dos agencias puede realizar?


9. Una empresa dispone de nueve candidatos para cubrir dos
puestos, uno en el Departamento de Marketing y otro en el
Departamento de Relaciones con Clientes. Se supone que la seleccin
se realiza al azar.
a) De cuntas maneras diferentes se pueden
completar las vacantes?
b) En cuntas de las posibilidades de a) seras la
persona elegida para cubrir la vacante de
marketing?
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Combinatoria Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/6
c) En cuntas de las posibilidades de a) seras la
persona elegida para cubrir la vacante de relaciones
con clientes?
d) Utilizar los resultados de los apartados a) y b) para
obtener la probabilidad de que seas elegido para
cubrir la vacante de marketing. Indicar una manera
ms directa de encontrar esta probabilidad.
e) Utilizar los resultados de los apartados a), b) y c)
para obtener la probabilidad de que seas contratado
por esta empresa. Indicar una manera ms directa
de encontrar esta probabilidad.

SOLUCIONES A LOS EJERCICIOS DE COMBINATORIA
1.- 120.
2.- 144.
3.- 720.
4.-a) 8 416,965,52
5
140
=

.
b) 0 113,588,80
1
10
4
130
=

.
c) 2 130,721,75
5
130
5
140
=

.
5.- a) 95,040. b) 792.
6.- a) 256, b) 128.
7.- a) 5040, b) 1/5040 = 1.98*10
-4
.
8.- 28.
9.- a) 72, b) 8, c) 8, d) 8/72 = 1/9, e) 16/72 = 2/9.


IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

1/10
MATERIAL COMPLEMENTARIO
TEMA 3

3.1.- En las siguientes preguntas hay cuatro posibles
respuestas, razonar aquella respuesta nica que se considere
correcta.

1.- Si A y B son dos sucesos de un fenmeno aleatorio. Entonces
siempre se cumple:
A) P(AUB) P(A)+P(B).
B) P(AUB)P(A)+P(B).
C) P(AUB)=P(A)+P(B).
D) Ninguna de las respuestas anteriores es cierta.
2.- Sean A y B dos sucesos de un fenmeno aleatorio. Entonces
A) ( ) ( ) ( ) A P B P B A P = cuando A implica B.
B) P(A - B) = P(A) cuando A y B son compatibles.
C) ( ) ( ) ( ) B P A P B A P + = cuando A y B son compatibles.
D) Son ciertas al menos dos de las tres afirmaciones
anteriores.
3.- En qu condiciones podran dos sucesos incompatibles de
probabilidad no nula cada uno ser independientes?
A) Siempre.
B) Nunca.
C) Slo si uno de ellos es el suceso imposible.
D) En ninguna de las condiciones anteriores.
4.- Sean A y B dos sucesos que verifican que P[A]=0.6 y P[B]=0.8.
Entonces, se puede afirmar:
A) A y B son incompatibles.
B) A y B son compatibles y dependientes al contener B a A.
C) Si A y B son independientes, entonces P[AB]=0.92.
D) Si A est contenido en B (A implica B), P[A-B]=0.2



IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

2/10
5.- Dados dos sucesos A y B de un experimento aleatorio tales que
P(A)=1/4, P(B/A)=1/2 y P(A/B)=1/4, se verifica que
A) A es subconjunto de B.
B) A y B son incompatibles.
C) A y B son independientes.
D) Las tres afirmaciones anteriores son falsas.
6.- Sean A y C dos sucesos incompatibles. Entonces
A) ( ) ( ) ( )
P A C A C <1.
B)
( )
P A C = 1.
C) ( ) ( )
P A C P A C = .
D) Se verifican las tres afirmaciones anteriores.
7.- Sean A, B y C tres sucesos independientes por parejas.
Entonces
A) ( ) ( ) ( ) P A B C P A = .
B) ( ) ( ) ( ) P A B C P A P B P C P A P B P C = + ( ) ( ) ( ) ( ) ( ) .
C) ( ) ( ) ( ) ( ) P A C A B P C B = .
D) Ninguna de las afirmaciones anteriores es verdadera.
8.- Se verifica que
A) El teorema de la probabilidad total expresa la probabilidad
de ocurrencia de un suceso como suma de las
probabilidades de ocurrencia de dicho suceso
condicionando por las diferentes causas que puedan
provocarlo.
B) El teorema de Bayes cuantifica cmo se modifican las
probabilidades en un experimento, a medida que se tiene
ms informacin sobre dicho experimento.
C) Las probabilidades a posteriori pueden no sumar 1 ya que
dependen de la informacin del experimento.
D) Al menos dos de las tres afirmaciones anteriores son
ciertas.
3.2.- De una urna que contiene 3 bolas blancas y 2 bolas negras se
extraen, al azar y sin reemplazamiento, dos bolas. Se pide:
a) Construir el espacio muestral.
b) Probabilidad de cada uno de los sucesos elementales.
c) Probabilidad de que las dos bolas extradas sean del
mismo color.
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

3/10
3.3.- Se lanza tres veces una moneda. Se pide:
a) Construir el espacio muestral.
b) Expresar, mediante los sucesos elementales, los
siguientes sucesos:
A: "Los tres lanzamientos producen el mismo
resultado."
B: "El mismo resultado se obtiene exactamente en dos
lanzamientos."
C: "Al menos dos veces sale cara."
D: "Exactamente dos veces sale cara."
E: "Aparece cara en los dos primeros lanzamientos."
c) Calcular las probabilidades de los sucesos anteriores.
3.4.- Un nmero, del 1 al 10, es seleccionado al azar. Sean los
sucesos A: "El nmero elegido es par", B: "El nmero elegido es
primo" y C: "El nmero elegido es mltiplo de tres". Se pide:
i) Expresar los siguientes sucesos:
a) A B . b) A B . c) A B . d)
A B .
e) A C . f) A C . g) B C . h)
A C .
i) ( ) A B C .
ii) Calcular las probabilidades de los sucesos anteriores.
3.5.- De una urna que contiene 30 bolas numeradas del 1 al 30 se
extrae una bola al azar. Cul es la probabilidad de que la bola
extrada tenga un nmero que sea mltiplo de 3 o mltiplo de 7?
3.6.- La probabilidad de que un hombre de 20 aos viva 40 aos ms
es 0.76. La probabilidad de que una mujer de 20 aos viva 40 aos
ms es 0'82. Se casan dos jvenes de 20 aos. Cul es la
probabilidad de que, despus de que pasen 40 aos:
a) Ambos vivan.
b) No viva ninguno de los dos.
c) Slo viva el hombre.
d) Slo viva la mujer?
3.7.- Una urna contiene 8 bolas rojas, 3 blancas y 9 azules. Se
extraen 3 tres bolas al azar sin devolverlas a la urna. Determinar la
probabilidad de que las bolas extradas sean:
a) las tres rojas.
b) las tres blancas.
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

4/10
c) dos rojas y una blanca.
d) al menos una blanca.
e) cada una de un color.
f) roja, blanca y azul, por este orden.
3.8.- Sean los sucesos A: "Una familia tiene hijos de ambos sexos" y
B: "Una familia tiene a lo sumo un hijo varn". Se pide comprobar
que:
a) A y B son sucesos independientes, si se trata de una
familia con 3 hijos.
b) A y B son sucesos dependientes, si se trata de una familia
con 2 hijos.
3.9.- De una urna que contiene 3 bolas blancas y 5 negras se extraen
sucesivamente dos bolas. Cul es la probabilidad de que la primera
sea blanca y la segunda negra si:
a) no hay reemplazamiento, b) hay reemplazamiento?
3.10.- La empresa HOGARSA, de productos para el hogar, sabe que,
a pesar de costosas campaas publicitarias, con algunos productos
nuevos no se consiguen buenos resultados econmicos. Durante los
ltimos diez aos slo el 18 % de los productos nuevos han resultado
rentables. Adems, cuando dos productos se introducen durante el
mismo ao, slo el 5 % de las veces ambos productos resultan
rentables. Esta empresa se propone introducir dos nuevos productos,
A y B, el ao prximo.

Se pide:
a) Con qu probabilidad al menos uno de los dos productos
ser rentable?
b) Con qu probabilidad ninguno de los dos productos ser
rentable?
c) Con qu probabilidad el producto A o el B, pero no los
dos, ser rentable?
d) Con qu probabilidad el producto A habr sido rentable,
si sabemos ya que el producto B es rentable?
e) Se sabe que al menos uno de los productos ser rentable,
con qu probabilidad el producto A ser rentable?
f) Razonar si los sucesos "el producto A ser rentable" y "el
producto B ser rentable" son incompatibles y/o
independientes.

IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

5/10
3.11.- En unos grandes almacenes se sabe que el 30 % de las
personas que entran al establecimiento preguntan a los dependientes
sobre algn artculo y que el 20 % de las personas que entran
realizan alguna compra antes de marcharse. Adems, el 15 % de las
personas que acuden a este establecimiento preguntan a los
dependientes y compran antes de marcharse. Se pide:
a) Dibujar el diagrama de Venn con los sucesos anteriores.
Cul es la probabilidad de que una persona que ha entrado en el
establecimiento pregunte o compre? Y la de que ni pregunte ni
compre?
b) Son los sucesos "preguntar a un dependiente" y
"comprar algn artculo" incompatibles? E independientes?
Constituyen una particin del espacio muestral?
c) Qu porcentaje de personas se deciden a comprar
despus de preguntar a un dependiente? Qu se puede decir sobre
las dotes de venta de estos dependientes?
d) Si vemos pasar a una persona por caja, con qu
probabilidad habr preguntado a algn dependiente?
3.12.- La empresa de envo de paquetes PAQUETURG considera que
en cualquier envo se pueden producir los posibles errores siguientes
A: Se enva un paquete equivocado.
B: El paquete enviado se pierde en el trayecto.
C: El paquete enviado se daa en el trayecto.
Supongamos que el suceso A es independiente tanto de B como de C
y que los sucesos B y C son incompatibles. Adems se sabe de los
registros de la empresa sobre envos anteriores que P(A) = 0.02,
P(B) = 0.01 y que P(C) = 0.04.
Se pide:
a) Dibujar el diagrama de Venn con los sucesos anteriores y
razonar si los supuestos que se han hecho corresponden con la
realidad.
b) Encontrar el porcentaje de envos que realiza esta
empresa con algn error.
c) Calcular la probabilidad de que habindose daado un
paquete en el trayecto, dicho paquete correspondiera a un envo
equivocado.
3.13.- En un proceso de fabricacin intervienen 4 mquinas A, B, C y
D; que tienen las siguientes probabilidades de introducir cada una de
ellas algn defecto en el producto fabricado:
A: 3 %
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

6/10
B: 2 %
C: 1 %
D: 3 %
Las mquinas trabajan de forma independiente unas de otras.
Se pide:
a) Calcular la probabilidad de que un producto no presente
defectos.
b) Considerar los sucesos siguientes:
F: el producto presenta dos defectos introducidos uno por
cada una de las dos primeras mquinas
L: el producto presenta dos defectos introducidos uno por
cada una de las dos ltimas mquinas
Calcular las probabilidades de dichos sucesos.
c) Un producto ha resultado ser defectuoso, con qu
probabilidad la mquina D introdujo un defecto?
d) Un producto ha resultado ser defectuoso, con qu
probabilidad la mquina D introdujo un defecto y ste fue el nico
defecto?
e) Un producto ha resultado ser defectuoso, con qu
probabilidad presenta slo una deficiencia (introducida por cualquiera
de las 4 mquinas)?
3.14.- Dos jugadores de tenis F (Federer) y N (Nadal) van a disputar
un partido trascendental de un torneo del Grand Slam. El partido es
al mejor de dos sets (gana el primero que gane dos sets). Las
probabilidades que ha asignado el manager del jugador F a diferentes
sucesos del experimento aleatorio vienen dadas en la siguiente tabla.

Probabilidad
F gana el primer set 0.6
F gana el segundo set si gan el
primero
0.7
F gana el segundo set si perdi el
primero
0.3
F gana el partido en el tercer set 0.5

Se pide:
a) Dibujar el diagrama en rbol asociado a este experimento
aleatorio, notando convenientemente los sucesos y mostrando la
probabilidad de los mismos sobre el diagrama. Qu mtodo ha
utilizado el manager del jugador F para asignar las probabilidades
anteriores?
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

7/10
b) Con qu probabilidad ganar Roger (Federer) el partido?
c) Cul es la probabilidad de que el partido termine en el
segundo set?
d) Obtener la funcin de masa de probabilidad de la variable
aleatoria nmero de sets que se disputarn en el partido.
3.15.- Un psiclogo industrial sabe, por experiencias anteriores, que
el 90 % de las personas que inician un determinado entrenamiento
tcnico terminan con xito. La proporcin de personas en
entrenamiento con experiencia previa es del 10 %, entre las personas
que completaron con xito su entrenamiento, y del 25 % entre
aquellas que no terminaron con xito su entrenamiento. Se pide:
a) La probabilidad de que una persona con experiencia
anterior supere el entrenamiento con xito.
b) Podemos concluir que la experiencia previa influye en el
xito del entrenamiento?

3.16.- Las mquinas A, B y C producen respectivamente un 60 %, un
30 % y un 10 % del total de artculos de una fbrica. Los porcentajes
de desperfectos de produccin de estas mquinas son,
respectivamente: 2 %, 3 % y 4 %. Seleccionado un artculo al azar
result defectuoso. Hallar la probabilidad de que el artculo haya sido
producido por la mquina C.
3.16._BIS.- (Propuesto en intersemestral)

Una compaa de seguros clasifica a sus asegurados en tres grupos:
alto riesgo, riesgo medio y bajo riesgo. Estudios de la compaa
indican que la probabilidad de que una persona se vea envuelta en algn
accidente en el prximo ao es 0.3, 0.15 y 0.005, segn pertenezca a cada
uno de los tres grupos anteriores.
Actualmente en la compaa hay un 20% de asegurados que
pertenecen al grupo de alto riesgo, un 50% al de riesgo medio y un 30% al
de bajo riesgo.
a) Calcular la probabilidad de que un asegurado tenga un accidente
el prximo ao. (3)
b) De los asegurados que no han tenido ningn accidente en el
ltimo ao, qu porcentaje corresponde a cada grupo? (4)
c) Calcular la probabilidad de que al seleccionar 3 clientes al menos
uno no sea de alto riesgo. (3)

IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

8/10
3.17.- Un panel de control de calidad de unas placas de circuito impreso
proporciona los resultados que se muestran en la siguiente tabla.

Lnea de Calidad
fabricacin Aceptable Mejorable Inaceptable
1 200 15 5
2 180 5 15
3 220 20 10

d) Se selecciona al azar una placa que lleva la etiqueta lnea 3, con qu
probabilidad ser evaluada como mejorable? Razonar la respuesta.
e) Se seleccionan al azar dos placas, con qu probabilidad se fabricaron en
2 lneas distintas? Razonar la respuesta.
f) Las placas aceptables se envan a 2 clientes A y B, habindose
establecido que el 30 % de la produccin de la lnea 1 vaya al cliente A,
el 20 % de la produccin de la lnea 2 vaya al cliente B y que la
produccin de la lnea 3 vaya por partes iguales a ambos clientes. Qu
proporcin de las placas que recibe el cliente A son de la lnea 1?
Razonar la respuesta.
3.18.- Se consideran 3 urnas numeradas. La urna 1 contiene 3 bolas blancas y 3
rojas; la urna 2 contiene 4 bolas blancas y 2 rojas; la urna 3 contiene 2 bolas
blancas y 4 rojas. Se lanza un dado. Si sale un nmero impar se extrae una bola de
la urna 1, si sale 2 4 se extrae de la urna 2 y si sale 6 de la urna 3. Se pide la
probabilidad de extraer bola blanca.
3.19.- Se lanza un dado. Si sale mltiplo de 3 se deposita una bola amarilla en
una urna inicialmente vaca y opaca; si no es as se deposita una bola roja. El
experimento se repite 5 veces.
Una vez las cinco bolas en la urna se sacan dos bolas simultneamente que
resultan ser amarilla y roja. Cul es la composicin ms probable de la urna y con
qu probabilidad? Respndase razonadamente.
3.20.- Por los sntomas observados en un enfermo, y a la vista de la experiencia
acumulada en un gran nmero de casos similares, se deduce que ha podido
contraer la enfermedad A con probabilidad 1/3 o la enfermedad B con probabilidad
2/3. Para precisar el diagnstico se somete al enfermo a un anlisis clnico con 2
posibles resultados: positivo o negativo. Tambin, por experiencia, se sabe que el
anlisis es positivo con probabilidad 0.99, en los pacientes que tienen la
enfermedad A, y 0.06, en los que padecen la enfermedad B. Si al enfermo se le
hizo el anlisis y el resultado fue positivo, cul es la probabilidad de que tenga la
enfermedad A y cul la probabilidad de que padezca la enfermedad B?
3.21.- En un determinado pas con caractersticas socioeconmicas similares
a Espaa, y que ya ha pasado la fiebre de la TV DIGITAL, el 80 % de los televisores
se encuentran en poblacin urbana y el 20 % en poblacin rural. Un televidente
puede estar abonado a la plataforma A, o a la B o a ambas, siendo independientes
estos sucesos.
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

9/10
Por otra parte, se sabe que el 5 % de los televidentes urbanos contribuyen a
enriquecer a los magnates de la plataforma A y el 2 % a los de la B. Adems, el 1
% de la poblacin rural con TV est suscrito a la plataforma A y el 3 % a la
plataforma B.
Los datos anteriores hacen que se est interesado en:
a) Construir un diagrama en rbol para el experimento aleatorio de
seleccionar al azar un televidente, analizar su procedencia y suscripcin a la TV
DIGITAL, si se tiene previsto analizar el n de plataformas a las que est suscrito.
b) El porcentaje de la poblacin conectado a la TV DIGITAL.
c) Si en un concurso de promocin un televidente manifiesta estar suscrito a
la plataforma A pero no a la B, cul es la probabilidad de que resida en una
ciudad?
3.22.- En una lnea de transmisin de datos hay un emisor, un receptor y
dos puntos intermedios de comunicacin, B y C. El envo de datos se codifica en
sistema binario de modo que los posibles smbolos a enviar son 0 y 1. Si el
emisor enva un dgito, en el punto B se puede producir un error de transmisin de
forma que lo modifique con probabilidad 0.1. Anlogamente en C. Se supone que
ambos puntos funcionan de forma independiente.
A) Construir un diagrama en rbol para el experimento aleatorio de enviar
un dgito y observar cul es recibido, si se quiere estudiar la proporcin en que
resulta correcto.
B) Obtener la probabilidad de que la emisin de partida se reciba en destino
correctamente, y justificar que en su expresin no intervenga la probabilidad de
cul fuera el dgito enviado. Esto supone independencia entre los sucesos emisin
recibida correctamente y se enva un 0?
C) Suponiendo que en origen hay una proporcin p de 1, con qu
probabilidad se ha enviado un 1 si en destino se ha recibido un 1?
3.22._BIS.- (Propuesto en intersemestral)
La empresa ELECTRASA fabrica cables elctricos en tambores o
jumbos de 100 metros de longitud. La produccin de estos cables se
realiza mediante dos procesos A y B, los cuales incluyen su
empaquetado en cajas de 10 tambores. Despus de haberse
completado la elaboracin de un buen nmero de tambores, se
descubre que uno de los procesos, el A, que lleva a cabo el 40 % de
la produccin total, tiene un defecto que ha conducido a la
introduccin de fallos en el 3% de los tambores.
a) Se seleccionan al azar 3 tambores del proceso A, construir el
diagrama en rbol correspondiente para estudiar la posibilidad
de introduccin de fallos. Calcular la probabilidad de que
exactamente 2 tambores presenten fallo. (4)
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI

10/10
b) De una caja, se extrae un tambor al azar y se analiza. Si dicho
tambor no contiene ningn fallo, cul es la probabilidad de
que haya sido fabricado por el proceso defectuoso? Responder
razonadamente. (6)
3.23.- Una aseguradora nacional ofrece a sus 1.000 asegurados tres
tipos de plizas: Hogar, Automvil y Vida. La proporcin de
asegurados en el tramo de Hogar es de 0,3; en el de automviles es
0,5; y en el de vida 0,2. Adems, se sabe que la proporcin de
asegurados que tienen contratada una pliza de hogar
(respectivamente de vida), de entre todos los que tienen contratado
un seguro del automvil, es de 0,45 (respectivamente 0,25). Por otra
parte, se tiene constancia que es independiente la contratacin de un
seguro del tramo del hogar de uno del tramo de vida, tanto en el
total de clientes como entre los que han suscrito un seguro del
automvil.
Se pide:
a) Calcular la proporcin de clientes suscritos a alguna de las
modalidades de seguro. Son independientes estos sucesos?
Raznense las respuestas.
b) Si un asegurado no tiene contratado el seguro de hogar,
obtener la probabilidad de que tenga contratada alguna de las
otras dos modalidades. Raznese la respuesta.
OBSERVACIONES.-
Problemas recomendados como ejercicios directos de aplicacin de los
epgrafes del tema: 3.3-3.4-3.14 (epgrafes 3.1 y 3.2), 3.9-3.8-3.7-3.14 (epgrafe
3.3), 3.23 (epgrafes 3.2, 3.3, 3.4 y 3.5). Problemas recomendados como
globalizadores: 3.13, 3.21 y 3.22.

BIBLIOGRAFIA COMPLEMENTARIA ADICIONAL
TEMA 3 (PROBABILIDAD)
DeGroot, M. (1988). Probabilidad y Estadstica. Editorial Addison-Wesley
Iberoamericana. Delaware.
Montero, J.; Morales, D.; Pardo, L. y Quesada, V. (1988). Problemas y
Ejercicios de Clculo de Probabilidades. Editorial Daz de Santos. Madrid.


IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Solucin Material Comp. Tema 3 Carlos Mate
25 aos (1984-2009) de docencia en ICAI

1/2
SOLUCIONES A CUESTIONES Y PROBLEMAS
DEL MATERIAL COMPLEMENTARIO DEL TEMA 3

3.1.- 1.- B). 2.- A). 3.- B). 4.- C).
5.- C) 6.- B). 7.- D). 8.- B).


3.2.- b) P(b,b) = 03 P(b,n) = 03 P(n,b) = 03 P(n,n) = 01
c) 04

3.3.- c) P(A) = 025, P(B) = 075, P(C) = 05, P(D) = 0375 P(E) =
025

3.4.- ii) P(par y primo) = 01 P(par y no primo) = 04
P(par o primo) = 09
P(no par y no primo) = 01 P(par y mltip. de 3) = 01
P(par y no mlt. de 3) = 04, P(primo y mltiplo de 3) = 01
P(no par y mlt. de 3) = 02 P((par o primo) y no mlt.de 3) = 07

3.5.- 13/30 = 0.4333.

3.6.- a) 06232 b) 00432 c) 01368 d) 01968

3.7.- a) 004912 b) 8.77193*10
-4
. c) 00737 d) 04035 e)
018947
f) 0031579

3.8.- a) P(hijos ambos sexos y a lo sumo un varn) = 0375 = 05 *
075= =P(A)*P(B)
b) P(hijos ambos sexos y a lo sumo un varn) = 05*05 05
* 075= =P(A)*P(B)

3.9.- a) 0267857 b) 0234375

3.10.- a) 031 b) 069 c) 026 d) 02778 e) 058
f) Compatibles y dependientes

3.11.- a) P(pregunte o compre) = 035 P(ni pregunte ni
compre) = 065
IINF, ITIG/S, ITIM, ITIE, ITIEI
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Solucin Material Comp. Tema 3 Carlos Mate
25 aos (1984-2009) de docencia en ICAI

2/2
b) No son incompatibles, no son independientes y no son una
particin.
c) 50%
d) 075

3.12.- b) 69%, c) 002

3.14.- b) 057 c) 07 d) P(2) = 07 P(3) = 03

3.15.-a) 07826 b) S

3.16.- 016

3.18.- 052777

3.20.- P(A/+) = 089 P(B/+) = 011
3.21.- b) 006314 c) 095284
3.23.- a) 0.64625. No son independientes por parejas y tampoco
sern mutuamente independientes. b) 0.583.

Nota sobre las interpretaciones.-
Para llegar a manejar con soltura las interpretaciones probabilsticas
se pueden consultar los problemas resueltos que hay en los libros de apoyo,
como un elemento adicional al necesario seguimiento diario de la asignatura
y la atencin en clase.


IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/19
TEMA 4
MODELOS DE PROBABILIDAD
DISCRETOS
4.1. Concepto de Variable Aleatoria
El inters en la ingeniera o en otras ramas del conocimiento
humano suele aparecer en cantidades que no se pueden predecir con
certeza. Por ejemplo, nos puede interesar conocer o aprender sobre:

1. El n de artculos defectuosos que van a aparecer en un lote de
productos.
2. El consumo de energa elctrica de una casa durante un da, en
kwh.
3. El tiempo, en minutos, que estar sin servicio una red elctrica
ante un corte en el suministro de fluido elctrico por razones
meteorolgicas.
4. La cantidad de agua, en miles de m
3
, que recibir un embalse
durante un periodo de tiempo.
5. El tamao de un fichero informtico, en MB.
6. El nmero de cortes en el suministro de fluido elctrico en un
ao.
7. El n de desperfectos exteriores que presenta un artculo (en un
coche desperfectos de pintura en la chapa, en un ordenador
desperfectos en la carcasa-monitor).
8. El n de visitas a una pgina web durante un da.

Debido a que en todos los ejemplos anteriores estamos en
presencia de fenmenos aleatorios, cuando se repitan bajo las
mismas condiciones ser imposible predecir con certeza el resultado
que aparecer y nos encontraremos con varios resultados posibles en
el fenmeno.
Por tanto, la cantidad o magnitud analizada, que de una forma
genrica ser designada por X, es variable y el resultado que
presente X() depender de un fenmeno aleatorio, con lo cual ser
denominada variable aleatoria.
Las situaciones anteriores responden a fenmenos aleatorios que
se manifiestan en resultados numricos. En otras ocasiones, como en
el lanzamiento de una moneda dos veces, o al analizar para cada
punto de una red la posibilidad de que pueda fallar, el fenmeno
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/19
considerado se manifiesta de forma cualitativa pero nos puede
interesar estudiarlo numricamente analizando el nmero de caras o
el nmero de puntos de la red que pueden fallar. En este caso,
asociamos a cada resultado del experimento un nmero X() que,
tambin, es variable y que depende de un fenmeno aleatorio, con lo
cual estudiamos una variable aleatoria.
La definicin formal se presenta a continuacin.
DEFINICION.- (Variable Aleatoria)
Sea un fenmeno aleatorio con espacio muestral . Se llama
variable aleatoria (v.a.) en este experimento, notndose por X, a
cualquier asignacin de nmeros a los diferentes resultados del
fenmeno. Por tanto, una v.a. X es cualquier aplicacin
( )

X
: X
NOTA.- Cuando el experimento en s mismo es numrico, como
ocurre con los 8 ejemplos anteriores, el propio resultado que pueda
proporcionar el experimento es la variable aleatoria. Por tanto, la
aplicacin a considerar ser la aplicacin identidad con = y
= ) ( X .
Se llama realizacin de una v.a. X al valor concreto que toma
dicha variable ante una manifestacin del experimento en un suceso
concreto. Si este suceso es
0
la realizacin o dato del experimento
ser designado por
0
x , con lo cual
0 0
x ) ( X = .
EJERCICIO 4.1.-
Construir la v.a. del experimento aleatorio lanzar una moneda 3
veces que cuantifique el nmero de caras que aparecern en los
lanzamientos. Indicar una realizacin de la v.a. considerada.
DEFINICION.- (Tipos de Variables Aleatorias)
a) Se dice que una variable aleatoria es discreta cuando
puede tomar un nmero finito o infinito numerable de valores.
b) Se dice que una variable aleatoria es continua cuando
puede tomar cualquier valor de un intervalo.

Las variables correspondientes a los ejemplos 1, 6, 7 y 8 son
discretas; mientras que las de los ejemplos 2, 3, 4 y 5 son continuas.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/19
4.2. Distribucin de Probabilidad de una
Variable Aleatoria Discreta

Para estudiar mejor el fenmeno aleatorio y la variable X que se
est analizando se necesita conocer lo que se denomina la
distribucin de probabilidad de la v.a. X. Es decir, como su nombre
indica, se trata de proporcionar la manera en que se distribuye el 100
% de la probabilidad entre los diferentes valores que puede tomar la
variable.

DEFINICION.- (Funcin de Masa de Probabilidad de una
V. A. Discreta)
Se llama funcin de masa de probabilidad (fmp) de una
variable aleatoria discreta X a una expresin ( ) x p
X
definida para cada
x que tome la v.a. X, verificando
( ) x , 0 x p
X
.
( ) 1 x p
x
X
=

.

La fmp puede venir mediante: tabla, grfico o frmula; y se
referir a una v.a. con un nmero finito o infinito numerable de
valores.
La importancia de la fmp es que a partir de ella se puede
determinar la probabilidad que asigna la v.a. considerada a cada
conjunto.
EJERCICIO 4.2.-
Considerar el Ejercicio 4.1. Construir la fmp de la v.a. X
analizada y calcular
a) P(X = 1).
b) P(X > 1).
Funcin de Distribucin
Otra forma de conocer o indicar la distribucin de probabilidad de
una v.a. es mediante la denominada funcin de distribucin, que se
defini en el tema 1 y que es una funcin que refleja la probabilidad
en cada punto de una manera acumulada. Pasamos a estudiar dicha
funcin de una manera ms formal.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/19
DEFINICION.-
Sea una variable aleatoria discreta X. La funcin de distribucin
de esta v.a., notada por ( ) x F
X
, viene definida por
( ) ( ) x X P x F
X
= para cada x ,
indicndonos la probabilidad con que la v.a. X tomar valores no
superiores a x .

TEOREMA.- (Relacin entre func. de dist. y fmp)
Sea una variable aleatoria discreta X con funcin de distribucin
( ) x F
X
y fmp ( ) x p
X
. Entonces se verifica que
1. ( ) ( )

=
x x
i X
i
x p x F , para cada x .
2. ( ) ( ) ( )

= x F x F x p
X
, para cada x .
A continuacin se muestra la funcin de masa de probabilidad,
f(x), y la funcin de distribucin, F(x), de la v. a. X: resultado del
lanzamiento de un dado.

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/19
EJERCICIO 4.3.-
Construir la funcin de distribucin de la v.a. X del ejercicio 4.2.
Extraer conclusiones sobre la forma que presenta el grfico de la
funcin de distribucin de una v.a. discreta que toma los valores
k 2 1
x ,..., x , x , con
k 2 1
x ... x x < < < , con unas probabilidades
k 2 1
p ,..., p , p tal que 1 p
i
i
=

.

TEOREMA.- (Clculo de probabilidades con la funcin de
distribucin)
Sea una variable aleatoria discreta X con funcin de distribucin
( ) x F
X
y fmp ( ) x p
X
. Entonces se verifica que
1. [ ] ) a ( F ) b ( F b X a P = <
2. [ ] ) a ( F ) b ( F b X a P = < <


3. [ ] ) a ( F ) b ( F b X a P

=
4. [ ] ) a ( F ) b ( F b X a P

= <
con a, b nmeros reales cualesquiera tales que a < b.

EJERCICIO 4.4.-
Una fbrica tiene 5 mquinas. De informaciones anteriores se
sabe que el 20 % de los das se encuentra una averiada, el 15 % de
los das se averan dos, la mitad de los das estn funcionando todas,
el 8 % de los das se encuentran averiadas tres y uno de cada veinte
das estn averiadas cuatro. Se considera la variable aleatoria X: n
de mquinas que se encuentran averiadas durante un da.
Se pide:
a) Construir la tabla de probabilidades o distribucin de
probabilidad de esa variable aleatoria, denominada
funcin de masa de probabilidad o funcin de cuanta de
la variable aleatoria X. Por qu recibe ese nombre?
Representar grficamente dicha funcin.
b) Obtener la funcin de distribucin F(x) de la variable
aleatoria X. Representar grficamente dicha funcin.
Analizar sus propiedades.
c) Calcular la proporcin de das en que se encuentran
averiadas ms de una mquina y a lo sumo cuatro, o
probabilidad de que ocurra ese suceso. Idem como
mnimo una y menos de cuatro.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/19

TEOREMA.- (Condiciones necesarias y suficientes para
que una funcin sea funcin de distribucin)
Sea una variable aleatoria discreta X y una funcin real de
variable real ( ) x F
X
. Entonces ( ) x F
X
es la funcin de distribucin de X
si y slo si se verifica que
a) ( ) 0 F
X
= .
b) ( ) 1 F
X
= + .
c) ( ) x F
X
es una funcin montona no decreciente. Es decir, si
consideramos cualesquiera
2 1
x x < se verifica que
( ) ( )
2 X 1 X
x F x F .
d) ( ) x F
X
es una funcin continua por la derecha. Es decir, si
consideramos cualquier a se verifica que ( ) ( ) a F x F
X X
a x
lim
=
+

.
4.3. Esperanza y Varianza de una Variable
Aleatoria Discreta

Anlogamente a lo desarrollado para distribuciones de
frecuencias, surgen los siguientes conceptos de tendencia central.

DEFINICION.-
Sea una variable aleatoria discreta X con fmp ( ) x p
X
.
a) Se llama esperanza o media o valor esperado de la v.a. X,
notndose por E(X) o , al promedio de los valores de X respecto a la
distribucin de probabilidad de X, as
( ) ( )

=
x
X
x xp X E .
b) Se llama esperanza o valor esperado de una funcin g(X) de la
v.a. X, notndose por E(g(X)), al promedio de los valores de g(X)
respecto a la distribucin de probabilidad de X, as
( ) ( )

=
x
X
x p ) x ( g ) X ( g E .

Anlogamente a lo desarrollado para distribuciones de
frecuencias, surgen los siguientes conceptos de variabilidad.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/19
DEFINICION.-
Sea una variable aleatoria discreta X con fmp ( ) x p
X
. Se llama
varianza de la v.a. X, notndose por V(X) o
2
, al promedio de las
diferencias cuadrticas entre los valores de X y su media respecto a
su distribucin de probabilidad de X, as
( ) ( ) ( )

=
x
X
2
x p x X V .
La desviacin tpica o estndar de la v.a. X, notada por , es la
raz cuadrada de la varianza.

PROPIEDAD.-
Sea una variable aleatoria discreta X con fmp ( ) x p
X
y media .
Entonces
( ) ( ) ( ) ( )
2 2 2 2
X E ) X ( E X E X V = = .

EJERCICIO 4.5.-
Con relacin al ejercicio 4.4, se pide:
a) Calcular e interpretar la media, la mediana y la moda de
esa distribucin de probabilidad.
b) Calcular la varianza, la desviacin tpica y el coeficiente de
variacin de esa distribucin de probabilidad. Interpretar
los resultados.
c) Calcular e interpretar el coeficiente de asimetra de Fisher.

4.4. Variables Aleatorias Discretas
Multidimensionales

En la mayora de los fenmenos aleatorios se tiene inters a la
vez en dos o ms variables aleatorias discretas, dando lugar a lo que
se conoce como variables aleatorias discretas multidimensionales.
Para simplificar los desarrollos vamos a considerar el caso
bidimensional donde el inters se centra en lo que se denomina
variable aleatoria bidimensional, que no es ms que dos variables
aleatorias X e Y que cuando se consideran a nivel bidimensional se
representan por (X,Y).
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/19
De manera anloga al problema de la distribucin de
probabilidad de una v.a. unidimensional se plantea el de una
bidimensional, siendo habitual proporcionar dicha distribucin a
travs de la llamada funcin de masa de probabilidad conjunta de
(X,Y), notada por ( ) y , x P
Y , X
, que proporciona las probabilidades con
que X e Y pueden conjuntamente tomar los diferentes valores (x,y).
Es decir,
( ) [ ] y Y , x X P y , x P
Y , X
= = =
donde [ ] ( ) ( ) [ ] y Y x X P y Y , x X P = = = = .
Como en el caso unidimensional, estas probabilidades pueden
venir en forma de tabla como ocurre en la siguiente situacin.

EJEMPLO 4.4.1.-
Un determinado tipo de artculos se fabrica en dos fases o
etapas. La tabla siguiente muestra las probabilidades conjuntas
[ ] 5 ,..., 1 = j ; 4 , 3 , 2 , 1 i , y Y , x X P p
j i ij
= = = = ; para las variables X: n de
defectos en la 1 fase e Y: n de defectos en la 2 etapa.

X Y
0 1 2 3 4
0 0.14 0.13 0.10 0.04 0.03
1 0.14 0.12 0.08 0.03 0.03
2 0.04 0.02 0.02 0.01 0
3 0.03 0.02 0.01 0.01 0

En este caso resulta interesante estudiar la distribucin de cada
una de las variables por separado, ya que as conoceramos la
distribucin del n de defectos en cada una de las fases,
obtenindose las llamadas distribuciones marginales.
La distribucin marginal de X (resp. Y) se obtiene considerando
los valores que toma dicha variable y asignndoles las probabilidades
siguientes:
( ) [ ]

= = =
y
X
y Y , x X P x P
(resp. ( ) [ ]

= = =
x
Y
y Y , x X P y P ).
EJERCICIO 4.6.-
Obtener las dos distribuciones marginales del ejemplo anterior y
dar su significado.

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/19
En el ejemplo que estamos analizando resultara interesante
conocer como se comporta una de las variables cuando la otra se ha
manifestado en un determinado valor, ya que as conoceramos, por
ejemplo, la distribucin del n de defectos que se presentarn en una
fase dentro de aquellos artculos que tienen un determinado nmero
de defectos en la otra fase. Se obtendran, as, las llamadas
distribuciones condicionadas.
La distribucin de Y condicionada por X = x se obtiene
considerando los valores que toma la variable Y con las
probabilidades siguientes (resultado de emplear el concepto de
probabilidad condicionada):
[ ]
[ ] x X P
y Y , x X P
x X
y Y
P
X / Y
=
= =
=
|

\
|
=
=
.
Anlogamente, la distribucin de X condicionada por Y = y se
obtiene considerando los valores que toma la variable X con las
probabilidades siguientes (resultado de emplear el concepto de
probabilidad condicionada):
[ ]
[ ] y Y P
y Y , x X P
y Y
x X
P
Y / X
=
= =
=
|

\
|
=
=
.
EJERCICIO 4.7.-
Para aquellos artculos que salen de la 1 fase sin defectos,
obtener e interpretar la funcin de masa de probabilidad para el n de
defectos que aparecern en la segunda fase.

Por otra parte, cuando los sucesos asociados a dos v.a. X e Y
sean (resp. no sean) independientes diremos que dichas variables
aleatorias son independientes (resp. dependientes). Por tanto,
se verificar el siguiente resultado.
TEOREMA.-
Sea una variable aleatoria bidimensional discreta (X,Y) con fmp
conjunta ( ) [ ] y Y , x X P y , x P
Y , X
= = = . Entonces las siguientes
afirmaciones son equivalentes:
1) X e Y son v.a. independientes.
2) [ ] [ ] [ ] y Y P x X P y Y , x X P = = = = = , (x,y).
3) ( ) ( ) ( ) y P x P y , x P
Y X Y , X
= , (x,y).


IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/19
EJERCICIO 4.8.-
Se puede afirmar que el n de defectos que presenta un artculo
en la 1 y 2 fase son variables aleatorias independientes?

DEFINICION.-
Sea una variable aleatoria bidimensional discreta (X,Y) con fmp
conjunta ( ) [ ] y Y , x X P y , x P
Y , X
= = = . Se llama esperanza de cualquier
funcin g(X,Y) de estas variables aleatorias, notndose por ( ) [ ] Y , X g E ,
al nmero real
( ) [ ] ( )

=
y
Y , X
x
y , x P ) y , x ( g Y , X g E .

Casos particulares especialmente interesantes son:
1) g(X,Y) = X, da la media de la v.a. X, notada por
X
.
2) g(X,Y) = Y, da la media de la v.a. Y, notada por
Y
.
3) g(X,Y) = XY, da la media de la v.a. producto.
4) ( ) ) Y )( X ( Y , X g
Y X
= , permite obtener la llamada
covarianza entre X e Y que suele ser habitual notarla por
Cov(X,Y).
Se puede demostrar que
( ) ( ) ) Y ( E ) X ( E Y X E Y , X Cov = ,
expresin utilizada habitualmente para hallar la covarianza.

EJERCICIO 4.9.-
a) Calcular e interpretar las medidas anteriores en el
ejemplo considerado.
b) Qu relacin presentan los conceptos de independencia y
covarianza?
4.5. Pruebas de Bernoulli. Distribucin de
Bernoulli
Las llamadas pruebas de Bernoulli constituyen la forma ms
simple de modelar la incertidumbre en la realidad, en el sentido de
que permiten analizar situaciones donde haya dos resultados
incompatibles y exhaustivos (para un posible cliente compra/no
compra o visita/no visita, para un dispositivo falla/no falla, para un
medio de locomocin se retrasa/no se retrasa, etc.).
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
11/19
Se llama prueba de Bernoulli (Bernoulli trial) a todo
experimento aleatorio que conduzca a dos resultados llamados xito
y fracaso, que se notarn por A y A, respectivamente, y que
acontecen con probabilidades p y q, siendo p + q = 1. Es decir,
( ) A suceso el Ocurra P p =
( ) A suceso el Acontezca P q =
De manera esquemtica, una prueba de Bernoulli se indicar de
la forma siguiente
p 1 q Aleatorio Exp.

p ad probabilid con A
q ad probabilid con A
=
Ejemplo 4.5.1. - Prueba de Bernoulli cuando se analiza una
pieza para decidir si es defectuosa o correcta.
Se sabe que el 1 % de las piezas fabricadas por una mquina
son defectuosas.
------------------------------------
Al analizar una pieza concreta nos encontramos ante una
prueba de Bernoulli. Es decir,

0.01 prob. con (xito) A - Defectuosa
0.99 prob. con (fracaso) A - Correcta
pieza una Analizar
Ejemplo 4.5.2. - Prueba de Bernoulli cuando se analiza la
posibilidad de corte en el suministro de energa elctrica durante un
da.
Se sabe que en una zona se han producido cortes de suministro
de energa elctrica slo durante 3 das en un ao de 365 das.
------------------------------------
Al analizar para un da la posibilidad de que en la zona
considerada se produzcan cortes de suministro de energa elctrica,
nos encontramos ante una prueba de Bernoulli. Es decir, sabiendo
que 3/365 = 0.00822, resulta que

0.00822 prob. con (xito) A - cortes Con
0.99178 prob. con (fracaso) A - cortes Sin
da t. en un de elec Suministro
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
12/19
Ejemplo 4.5.3. - Prueba de Bernoulli cuando se vende un
microprocesador y se analiza la posibilidad de devolucin en el
perodo de garanta.
Se sabe que las devoluciones de microprocesadores en el perodo
de garanta es de 50 ppm.
------------------------------------
Al analizar un microprocesador en cuanto a la posibilidad de que
sea devuelto en dicho perodo, nos encontramos ante una prueba de
Bernouilli. Es decir,
0.000005 prob. con (xito) A - Devuelto
0.99995 prob. con (fracaso) A - devuelto No
garanta sador en Microproce
A efectos de poder cuantificar las pruebas de Bernoulli y de
extenderlas a una serie de repeticiones del experimento, es necesario
formalizar la definicin de la correspondiente variable aleatoria. Como
el inters al analizar una prueba de Bernoulli se centra en el suceso
xito, la v.a. asignar el valor 1 al xito y el valor 0 al fracaso. Sea
dicha v.a. X. Se tiene que

=
A ocurra cuando 1
A suceda cuando 0
X
O, expresndolo en trminos de probabilidades,
p - 1 = q X

p . prob con 1
q . prob con 0

=
Es decir, p = P(X = 1) y q = P(X = 0).
Para expresar una ley que recoja los valores de la v.a. X con sus
probabilidades, escribiremos

( ) 1 , 0 x , ) p 1 ( p x X P
x 1 x
= = =



Como esta v.a. se refiere a pruebas de Bernoulli, se conoce con
el nombre de distribucin de Bernoulli. Observamos que lo que
vara de una de estas distribuciones a otra de este tipo es la p, que
ser el nico parmetro de esta distribucin.

Def.- Se dice que una v.a. X sigue una ley de Bernoulli de parmetro
p, con 0 < p < 1, cuando su fmp sea
( ) 1 , 0 x , ) p 1 ( p x X P
x 1 x
= = =

.
Notndose X Br (p).
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
13/19

La representacin grfica de esta fmp resulta una distribucin
asimtrica a la derecha (resp. a la izquierda) si p < 0.5 (resp. p >
0.5), y una distribucin simtrica cuando p = 0.5; segn se puede
ver en la Figura 4.5-1.

0 0.2 0.4 0.6 0.8 1
x
0
0.2
0.4
0.6
0.8
1
P(X=x)
Funcin de masa de probabilidad
Br(p)
Br(0.1)
Br(0.5)
Br(0.9)

Figura 4.5-1
Se puede demostrar que la media y la varianza de una v.a. X
Br (p) son
( ) p X E
X
= = y ( ) ( ) p 1 p X V
2
X
= = .
4.6 Distribucin Binomial
Una generalizacin inmediata y fundamental de la distribucin de
Bernoulli surge cuando un experimento aleatorio con dos posibles
resultados se repite varias veces.
Supongamos pruebas de Bernoulli de la forma
p 1 q
p ad probabilid con A
q ad probabilid con A
Aleatorio Exp. =
donde la probabilidad de xito en cada prueba es p y se desarrollan n
pruebas independientes, de manera que el resultado de cada prueba
no tiene influencia sobre el resultado de cualquier otra prueba.
La v.a. X: nmero de xitos que aparecen al desarrollar estas n
pruebas, podra tomar cualquier valor desde 0 hasta n. Nuestro
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
14/19
inters se centra en calcular la probabilidad de obtener exactamente
X = x xitos en n pruebas. Se puede demostrar, ver anexo 4.6.1*,
que dicha probabilidad es la que figura en la siguiente definicin.

Def.- Se dice que una v.a. X sigue una ley binomial de parmetros n
y p, con n natural y la probabilidad p verificando que 0 < p < 1,
cuando su fmp sea
( ) n ,..., 1 , 0 x , ) p 1 ( p x X P
x n x
n
x
=
|
|

\
|
= =


Notndose X B(n,p).
Ejemplo 4.6.1. - Distribucin Binomial cuando se analiza una
muestra de 20 piezas fabricadas por una mquina y se calcula la
probabilidad de que aparezca a lo sumo una defectuosa.
------------------------------------
Segn el Ejemplo 4.5.1, se sabe que el 1 % de las piezas
fabricadas por una mquina son defectuosas. Si se seleccionan 20
piezas, la v.a. X: nmero de piezas defectuosas entre las 20
analizadas, es tal que X B(20,0.01). Por tanto,
( ) 20 ,..., 1 , 0 x , 99 . 0 01 . 0
20
x
x X P
x n x
=
|
|

\
|
= =

.
As, se tiene que
( ) ( ) ( ) ( ) ( ) ( ) = = + = = = = = 1 X P 0 X P 1 X 0 X P 1 X P
9831 . 0
19
99 . 0
1
01 . 0
20
1
20
99 . 0
0
01 . 0
20
0
=
|
|

\
|
+
|
|

\
|
= .

Esto significa que si cada da se analizan 20 piezas para decidir si
parar la produccin cuando el nmero de defectuosas sea superior a
1, resulta que la probabilidad de no parar la produccin durante un
da ser del 98.31 %. Es decir, que a lo largo de un ao de 300 das
laborables se espera que la produccin se tenga que parar un total de
5 das (exactamente 07 . 5 0169 . 0 300 = ).

FORMA DE LA FUNCION DE MASA B(n,p)
Si representamos grficamente la fmp de una v.a. B(n,p),
observamos que cuando n es fijo, se trata de una distribucin
asimtrica a la derecha (resp. a la izquierda) si p < 0.5 (resp. p >
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
15/19
0.5), y de una distribucin simtrica cuando p = 0.5; segn se puede
ver en la Figura 4.6.-1

0 3 6 9 12 15
x
0
0.05
0.1
0.15
0.2
0.25
0.3
P
(
X
=
x
)
Efecto del parametro p en la B(n,p)
con n fijo
B(15,0.2)
B(15,0.8)
B(15,0.5)

Figura 4.6-1
Adems, se demuestra que el valor de mxima probabilidad, la
moda, notado por Mo, se presenta en
( ) ( )
( ) [ ]

+
+ +
=
ntero )p no es e 1 si (n+ p 1 n
ro )p es ente 1 si (n+ 1 p 1 n y p 1 n
Mo
siendo [x] la parte entera del nmero x, es decir, el nmero entero
inmediatamente anterior a x. Esto se puede observar en la Figura
4.6-1.
Veamos lo que ocurre cuando n vara y cada vez se considera un
valor mayor de n.
Las Figuras 4.6-2 a 4.6-4 nos indican que, cualquiera que sea el
valor del parmetro p, la distribucin va perdiendo asimetra, siendo
cada vez ms simtrica y con una forma acampanada similar a la de
la distribucin normal. Si p = 0.5, a medida que aumenta n la
distribucin sigue conservando la caracterstica de ser simtrica, pero
va parecindose cada vez ms a una distribucin normal.
Por tanto, los rasgos de normalidad en una B(n,p) aparecen
cuando n es grande, habitualmente se suele considerar a partir de n
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
16/19
= 30, y la aproximacin es mejor cuanto ms prximo se encuentre
el valor de p a 0.5.
Este hecho tiene su justificacin en el teorema de De Moivre y
resulta extraordinariamente til a la hora de calcular de manera
sencillas probabilidades con una B(n,p) en la que n 30, como ocurre
en las aplicaciones de la binomial a los planes de muestreo dentro del
desarrollo de los resultados del muestreo de aceptacin.


0 2 4 6 8 10 12 14 16 18 20
x
0
0.04
0.08
0.12
0.16
0.2
0.24
P[X=x]
B(20,0.8)
B(20,0.5)

Figura 4.6-2

0 5 10 15 20 25 30 35 40 45 50
x 0
0.03
0.06
0.09
0.12
0.15
P[X=x]
B(50,0.8)
B(50,0.5)

Figura 4.6-3

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
17/19
0 10 20 30 40 50 60 70 80 90 100
x 0
0.02
0.04
0.06
0.08
0.1
P[X=x]
B(100,0.8)
B(100,0.5)

Figura 4.6-4

Relacin entre las Distribuciones B(n,p) y Br(p)
Se puede demostrar que toda v.a. X B(n,p) se puede expresar
como suma de n v.a. independientes y todas ellas igualmente
distribuidas segn una ley Br(p). Es decir,
( )
. ntes independie son y
; n ..., , 1 = i , p Br X que tal , X ... X X
i n 1
+ + =


Media y Varianza

Segn lo anterior, aplicando que para v.a. cualesquiera la
esperanza de la suma es la suma de las esperanzas, y para v.a.
independientes la varianza de la suma es la suma de las varianzas, se
concluye lo siguiente.

La media y la varianza en una v.a. X B(n,p) son
( ) np X E
X
= = y ( ) ( ) p 1 np X V
2
X
= =

Clculo de Probabilidades en una Binomial mediante Tablas
Calculadoras y ordenadores proporcionan en bastantes casos la
posibilidad de calcular probabilidades de una binomial, y en muchas
aplicaciones se sustituye dicha distribucin por su aproximacin
normal o de Poisson. No obstante, cuando el n de pruebas n es
pequeo se puede utilizar la tabla de probabilidades de la binomial,
adjuntada en fotocopia aparte, que proporciona para una v.a. X
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
18/19
B(n,p), segn diferentes valores de n y p, las probabilidades de que X
tome los diferentes valores 0, 1, ..., n.

EJERCICIO 4.6.2.-
SANYA es un fabricante de televisores que tiene dos almacenes
en la ciudad de Madrid, uno en la zona norte y el otro en la sur, para
poder abastecer a la metrpoli.
El de la zona norte abastece a 20 tiendas de la zona norte-
norte, 6 de la zona noreste y 8 de la zona noroeste. El de la zona sur
abastece a 15 tiendas de la zona sur-sur, 4 de la zona sureste y 11
de la zona noroeste. El 20% de las tiendas de la zona norte
demandan televisores a su almacn cada semana, mientras que ese
porcentaje es del 30% para las tiendas de la zona sur.

a) Identificar pruebas de Bernoulli.
b) Indicar la funcin de masa de probabilidad de las variables
aleatorias siguientes
N: nmero de tiendas que abastece de TV en una semana el
almacn de la zona norte
S: nmero de tiendas que abastece de TV en una semana el
almacn de la zona sur
Dibujar dichas funciones de masa de probabilidad.
c) Con qu probabilidad la prxima semana el almacn de la zona
norte suministrar TV a ms de dos tiendas? Justificar el modelo
de probabilidad utilizado.
4.6.1. Deduccin de la FMP en la Distribucin Binomial
Observamos que las n pruebas darn lugar a una sucesin de n
resultados, cada uno de los cuales ser xito (A) o fracaso ( A). Por
ejemplo, una sucesin con x xitos y n - x fracasos ser

veces x) - (n
-
veces x
A A A A A A ,..., , ,..., ,
Es decir, las x primeras pruebas resultan en xito, mientras el resto
resultan en fracaso. Ahora, la probabilidad de xito en cada prueba es
p y la probabilidad de fracaso es (1 - p). Puesto que las n pruebas
son independientes unas de otras, la probabilidad de cualquier
sucesin de resultados es el producto de las probabilidades para los
resultados individuales. Por tanto, la probabilidad de observar la
sucesin especfica de los resultados descritos anteriormente es
( )
x n x
p 1 p

.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





4.1 - 4.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
19/19
Anlogamente la probabilidad de cualquier sucesin especfica
con x xitos y n - x fracasos ser ( )
x n x
p 1 p

.
Nuestro inters se centra en determinar la probabilidad de
obtener precisamente x xitos, independientemente del orden de los
resultados, y no en la probabilidad de obtener una sucesin concreta
o especifica de x xitos y n - x fracasos. Hay varias sucesiones en las
que x xitos se podran ordenar entre n - x fracasos. Exactamente,
tantas como el nmero de formas diferentes de seleccionar x lugares
entre los n considerados, es decir, las combinaciones de n elementos
tomados de x en x. Adems, estas sucesiones son incompatibles, es
decir, no pueden ocurrir a la vez. Por tanto, recordando que la
probabilidad de la unin de sucesos incompatibles es igual a la suma
de las probabilidades de dichos sucesos, resulta que en nuestro caso
estamos sumando ( )
x n x
p 1 p

,
|
|

\
|n
x
veces. Luego se obtiene que
( ) n ,..., 1 , 0 x , ) p 1 ( p
n
x
x X P
x n x
=
|
|

\
|
= =

.



IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



4.8 - 4.9 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/8
4.8. Distribucin de Poisson
Es una de las distribuciones discretas ms utilizadas en
ingeniera, siendo fundamental tanto en control de calidad como en
fiabilidad. Recientemente se ha empezado a emplear en las medidas
de calidad de servicio que han de emplear los proveedores de acceso
a Internet.
Formalmente, surge como la distribucin lmite de la B(n,p)
cuando np y 0 p , n = se mantiene constante en el proceso de
tendencia al lmite. Es decir, cada vez se considera un nmero mayor
de pruebas de Bernoulli ( n ), pero con una probabilidad para el
suceso xito cada vez menor ( 0 p ), y a lo largo de este proceso de
tendencia al lmite se mantiene constante en , el nmero esperado
de xitos ( np = constante).
Por tanto, se demuestra que si X B(n,p) entonces
( ) .
! x
e p 1 p
n
x
) x X ( P
x
x n x
np , 0 p , n np , 0 p , n
lm lm

=

= =

= =

A su vez, es posible demostrar que la expresin
,... 2 , 1 , 0 x ,
! x
e
x
=


es una funcin de masa de probabilidad, donde
resulta que > 0 es el parmetro de esta nueva distribucin conocida
como distribucin de Poisson de parmetro . Por tanto, se tiene lo
siguiente.
Def.- Una v.a. X sigue una ley de Poisson de parmetro , con > 0
un nmero real positivo, cuando su fmp sea
( ) ,... 2 , 1 , 0 x ,
! x
e x X P
x
=

= =


Notndose X P ().
Aproximacin de la Distribucin Binomial por la de Poisson
El proceso formal de tendencia de la distribucin binomial a la
distribucin de Poisson se puede verificar intuitivamente, segn se
muestra en las figuras 4.8-1 a 4.8-3.
Estas figuras enfrentan la fmp de distribuciones binomiales, con
las condiciones citadas antes, a la fmp de la distribucin de Poisson
lmite. En concreto, se consideran distribuciones B(50,0.1),
B(100,0.05) y B(200,0.025), frente a la distribucin lmite, P (5),
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



4.8 - 4.9 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/8
observndose que las probabilidades con el modelo binomial son cada
vez ms parecidas a las que proporciona la distribucin de Poisson
lmite, a medida que se considera un n mayor y una p ms pequea,
pero siempre manteniendo constante el nmero esperado de xitos,
en este caso en = 5.

B(50,0.1) vs P(5)
0 4 8 12 16 20
0
0.04
0.08
0.12
0.16
0.2
B( 50, 0.1)
P(5)

Figura 4.8-1
B(100, 0.05) vs P(5)
0 4 8 12 16 20
0
0.04
0.08
0.12
0.16
0.2
B(100, 0.05)
P(5)

Figura 4.8-2
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



4.8 - 4.9 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/8
B ( 2 0 0 , 0 . 0 2 5 ) v s P ( 5 )
0 4 8 1 2 1 6 2 0
0
. 0 3
. 0 6
. 0 9
. 1 2
. 1 5
. 1 8
B ( 2 0 0 , 0 . 0 2 5 )
P ( 5 )

Figura 4.8-3
A efectos prcticos lo que ocurrir es que estaremos ante una
distribucin B(n,p) en la que n ser grande y p pequeo, con lo cual
el suceso xito tendr una probabilidad pequea, es decir, podremos
hablar de un "suceso raro"; y se podr utilizar la distribucin de
Poisson a la hora de realizar clculos sobre el n de sucesos raros que
van a acontecer en un n grande de pruebas. Por esta razn, la
distribucin de Poisson se conoce como ley de los sucesos raros, al
darnos la ley de probabilidad del n de sucesos raros que acontecen
en un n grande de pruebas, siendo individualmente, o en cada
prueba, raro el que ocurra ese suceso.
Por lo anteriormente expuesto, la distribucin de Poisson es muy
aplicada en control de calidad (los defectuosos o no conformes son
sucesos raros), estadsticas de accidentes, suicidios, etc.

A efectos prcticos se considera adecuada la aproximacin de
una distribucin B(n,p) por una distribucin P (), con = np, cuando
n 30
p 0.1
np 10.

Ejemplo 4.8.1.- Distribucin de Poisson como aproximacion a la
Binomial.
Una empresa tiene 250 ordenadores personales. La probabilidad
de que uno cualquiera de ellos necesite ser reparado durante una
semana es 0.01. Calcular la probabilidad de que menos de 4
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



4.8 - 4.9 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/8
ordenadores necesiten ser reparados durante una semana, mediante
la aproximacin de Poisson.
-----------------------------------
Sea la v.a. X: n de ordenadores de esta empresa que
necesitarn ser reparados durante una semana. Por tanto, se verifica
que X B(250,0.01). Como se cumplen las condiciones anteriores, se
puede aproximar la distribucin de X por la de una v.a. X* P (),
con 5 . 2 01 . 0 250 = = . Entonces, el valor de probabilidad buscado
ser ( ) ( ) 758 . 0 3 4
* *
= = < X P X P .
El Modelo de Probabilidad
El modelo de Poisson de la definicin presenta una fmp que
resulta ser asimtrica a la derecha, tanto ms cuanto ms prximo se
encuentre el valor de a 0, segn se puede ver en la Figura 4.8-4.
Se puede observar que se trata de una distribucin unimodal si no
es entero, encontrndose la moda en []. Si por el contrario es
entero, entonces es una distribucin bimodal que tiene sus valores de
moda en y - 1.
La Figura 4.8-4 nos muestra el comportamiento de la
distribucin de Poisson cuando se hace cada vez mayor. Se observa
que a mayor , ms parecida es la distribucin a una distribucin de
tipo normal. De hecho, a partir de 30 es vlida la aproximacin.
0 2 4 6 8 10 12 14 16 18
x
0
0.2
0.4
0.6
0.8
P[X=x]
Efecto del parmetro en una
dist. de Poisson
P(0.5)
P(1)
P(5)

Figura 4.8-4
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



4.8 - 4.9 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/8
0 5 10 15 20 25 30 35 40 45 50 55 60
x 0
0.03
0.06
0.09
0.12
0.15
P[X=x]
Dist. de Poisson segn valores
grandes del parmetro
P(10)
P(20)
P(30)

Figura 4.8-5
La media y la varianza de una v.a. X P () son
( ) ( ) = = = = X V , X E
2
X
X

Obsrvese que la media slo ser representativa cuando > 1.
Clculo de Probabilidades en una Poisson mediante Tablas
Calculadoras y ordenadores proporcionan en bastantes casos la
posibilidad de calcular probabilidades de una Poisson, y en algunas
ocasiones se sustituye dicha distribucin por su aproximacin normal
(cuando el parmetro es grande). No obstante, se puede utilizar la
tabla de probabilidades de la Poisson, adjuntada en fotocopia aparte,
que proporciona para una v.a. X P (), segn diferentes valores de
, las probabilidades de que X tome los diferentes valores 0, 1, 2, ....
4.9. El Proceso de Poisson. Aplicaciones
Una aplicacin muy interesante de la distribucin de Poisson en
muchos campos, entre ellos el control de calidad y la fiabilidad,
aparece cuando se considera el n de ocurrencias de un fenmeno
aleatorio que acontece u ocurre sobre la base de una unidad (por
unidad de tiempo, por unidad de longitud, por unidad de rea, por
unidad de volumen).


IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



4.8 - 4.9 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/8
Considrese una sucesin en el tiempo (o en el espacio) de
sucesos que de forma aleatoria se pueden producir en los instantes
,... t , t
2 1
como ocurrencias, llegadas, visitas a una web, fallos de una
mquina o de un software, huracanes, (fallos a lo largo de una pieza,
en el caso del espacio), etc. Sea la v.a. N(t): n de ocurrencias del
fenmeno aleatorio en [0,t]. Bajo los postulados del proceso de
Poisson, si las ocurrencias se producen a una intensidad o tasa de
ocurrencias constante de por unidad considerada, entonces para
cualquiera que sea t 0, se verifica que
N(t) P (t).

Ejemplo 4.9.1.- Proceso de Poisson y ley Binomial (Febrero 2006)

En poca de matrcula el nmero de alumnos que llegan al mostrador de
Secretara sigue una ley de Poisson de media 3 alumnos por minuto.
a) Cul es la probabilidad de que durante los prximos 3 minutos lleguen menos
de 6 personas? Responder de manera razonada. (3)
b) Si para llevar un control se registra el nmero de minutos que no llega nadie
Cul es la probabilidad de que en 20 minutos distintos elegidos aleatoriamente
de entre toda la maana, en menos de 5 no haya llegado nadie? Responder de
manera razonada. (7)
-----------------------------------
a) Sea Y= nmero de personas en 3 minutos

YP(=9); P(Y=k)=(e
-

k
)/k!

P(Y<6) = P(Y=0)+P(Y=1)+P(Y=2)+P(Y=3)+P(Y=4)+P(Y=5)= 0.11691

b) Z = nmero de minutos en los que no llega nadie de los 20

Z B(20,p); p=P(X=0)=e
-3
=0.0498, siendo X=nmero de alumnos por
minuto

y por tanto XP(=3).

P(Z<5)=0.9974
Ejercicio 4.9.2.- (Ampliacin) Sea un sistema cuyos fallos acontecen
segn un proceso de Poisson de intensidad . Demostrar que el
nmero mnimo de repuestos necesarios para hacer funcionar
ininterrumpidamente este sistema durante un tiempo t, con una
seguridad (probabilidad) de al menos , es el N mnimo tal que
) N ( F
) t ( N

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



4.8 - 4.9 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/8
siendo la expresin izquierda la funcin de distribucin de una v.a.
N(t) distribuida de Poisson de parmetro t.
Aplicacin al caso de un punto de luz donde se instalan unas
bombillas cuya tasa de fallos es de 1 fallo cada 200 das, para que no
falte luz durante 1400 das, con una seguridad de al menos el 99 %.
Y si la seguridad ha de ser de al menos un 99.9 %?
Postulados del Proceso de Poisson
Se dice que un proceso de ocurrencias de un fenmeno aleatorio
es un proceso de Poisson de intensidad , si se verifican los
postulados siguientes:
P1) ( ) ( ) 1 0 0 N P = = .
P2) ( ) ( ) ( ) ( ) t o t e exactament t 1 ) t ( N t t N P + = +
P3) ( ) ( ) ( ) ( ) t o e exactament 0 2 ) t ( N t t N P + .
P4) Postulado de incrementos estacionarios. En intervalos de la
misma longitud se tiene la misma ley de probabilidad para el n de
ocurrencias del fenmeno.
P5) Postulado de incrementos independientes. El n de ocurrencias
del fenmeno en intervalos disjuntos son v.a. independientes.
Nota.- Un estudio detallado del proceso de Poisson se puede ver en el
libro de Sarabia, A & Mat, C., Captulo V.
La distribucin de Poisson se utiliza en el dominio del tiempo
como modelo para el n de llamadas que recibir un telfono durante
un perodo del da, n de tareas que recibir un ordenador central
durante un periodo de tiempo, etc. En el caso de reas o volmenes,
esta distribucin sirve para representar el n de desperfectos en una
pieza, el n de estrellas en una regin del universo, etc.
Ejemplo 4.9.3.- Distribucin de Poisson en el nmero de accionamientos del
embrague de un vehculo durante un trayecto.
Se sabe que el nmero de accionamientos del embrague de un
vehculo, en un trayecto de autova, se comporta segn los
postulados de Poisson (los accionamientos no se producen en grupos,
ni son ms verosmiles en unos lugares que en otros, existe
independencia entre los accionamientos en intervalos de trayectos
disjuntos) a una tasa constante de = 0.3 accionamientos/km.
Cmo se distribuir el n de accionamientos en un trayecto de 200
km y cul ser el n ms probable de accionamientos en dicho
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010



4.8 - 4.9 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/8
trayecto? Qu valor de accionamientos es superado en el 99 % de
los trayectos de 100 km?
-----------------------------------
Sea la v.a. N(t): n de accionamientos del embrague de un
vehculo en un trayecto de autova de t km. Segn lo comentado,
N(t) P (t) con = 0.3 accionamientos/km. Por tanto, si se
considera un trayecto de 200 km resulta que
N(200) P ( 3 . 0 200 ) P (60),
distribucin bimodal cuyos valores de moda son 59 y 60,
correspondientes al n de accionamientos ms probable de un
vehculo en un trayecto de autova de 200 km.
En el caso de los trayectos de 100 km, se tiene que N(100) P
(30). Se busca el valor de x
0
tal que
( ) ( ) 99 . 0 x 100 N P
0
= > ( ) ( ) 01 . 0 x 100 N P
0
= .
Resulta que x
0
= 18. Lo que significa que ms de 18
accionamientos del embrague de un vehculo se producen en el 99 %
de los trayectos de autova de 100 km.



IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010




Material Comp. Tema 4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/9
MATERIAL COMPLEMENTARIO
TEMA 4
4.1.- En las siguientes preguntas hay cuatro posibles respuestas,
razonar aquella respuesta nica que se considere correcta.
1.- Consideremos una variable aleatoria discreta. Entonces
A) Su funcin de distribucin verifica que si x
1
< x
2
,
entonces F (x
1
) F (x
2
).
B) Su funcin de distribucin es continua.
C) El rea encerrada por F (x) vale 1.
D) Al menos dos de las afirmaciones anteriores son
ciertas.
2.- Sea X una variable aleatoria cualquiera con funcin de
distribucin asociada F(x). Cul de las siguientes afirmaciones es
FALSA, en general?
A) ( ) P a X b F( b ) F( a ) < < = .
B) F es continua por la derecha.
C) F es montona no decreciente.
D) ( ) P a X F( a ) < = 1 .
3.- Sobre la funcin de distribucin de una v.a. discreta se sabe
x 0 1 2 3 4
F(x) 0.1 0.3 0.7 0.9 1.0

Cunto vale p(X = 2)?
A) 1/5, ya que la variable toma 5 valores.
B) 0,7.
C) 0,4.
D) Falta informacin para calcularla.

4.- En un pas de 10 millones de habitantes hay un milln de
analfabetos. Se considera en cada individuo la caracterstica X: X = 1,
alfabeto; x = 0, analfabeto. Cul es la desviacin tpica de X?
A) 0,10
B) 0,09
C) 0,20
D) 0,30
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010




Material Comp. Tema 4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/9
5.- Sea la funcin
F ( x ) =

<
<
< <
3 1
3 x 2 k
2 x 1
4
1
1 x 0
x

Cul de las siguientes afirmaciones es falsa?
A) Para que sea una funcin de distribucin k
1
4
.
B) Si k =
1
5
no es una funcin de distribucin.
C) Si es una funcin de distribucin, lo ser de una
variable aleatoria discreta.
D) Para ningn valor de k es una funcin de
distribucin.
6.- La funcin de masa de probabilidad de una v.a. que sigue una
B(n, p)
A) Tiene un nico mximo.
B) Tiene un nico mnimo.
C) Tiene ms de un mximo y de un mnimo.
D) Verifica que ninguna de las afirmaciones anteriores
es verdadera.
7.- La probabilidad de leer un determinado peridico es 0.40. En
tales condiciones, elegidos al azar 15 lectores de peridicos, la
probabilidad de que 10 de ellos lean dicho peridico es:
A)
15
10
|
\

| 0.4
10
0.6
5
.
B) e
-6
6
10!
10
, al tratarse de una Poisson de parmetro
150.4 = 6.
C)
15
10
|
\

| 0.4
5
0.6
10
.
D) Lo indicado en al menos dos de los apartados
anteriores.

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010




Material Comp. Tema 4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/9
8.- Un sistema cuenta con 10 componentes para su funcionamiento,
siendo dichas componentes independientes en cuanto a su
funcionamiento. Sea p = 0,05 la probabilidad de que una componente
se estropee.
A) La probabilidad de que se estropeen 2 componentes
es 0,97.
B) La probabilidad de que todas estn funcionando es
0,5987.
C) La probabilidad de que funcionen a lo sumo 2 es
0,5987.
D) Al menos dos de las anteriores son ciertas.

9.- La distribucin de Poisson surge:
A) Como la distribucin lmite de la B(n,p) cuando
n, p0 y =np se mantiene constante en el
proceso de tendencia al lmite.
B) Como la distribucin lmite de la B(n,p) p0.5 y
=np se mantiene constante en el proceso de
tendencia al lmite.
C) Como una distribucin de probabilidad discreta que
se puede aproximar por una Bernoulli siempre.
D) Ninguna de las respuestas anteriores es cierta.

10.- La probabilidad de transmitir un bit errneamente es de
0.5*10^(-6). Se transmite un fichero de 2 millones de bits. Cul es
la probabilidad de que se reciba el fichero sin errores?
A) 0,9999.
B) 0,6243.
C) 0,3679.
D) Falta informacin para calcularla.

11.- El nmero de tornillos defectuosos que produce una factora en
un da es en media 7. La probabilidad de que en un da se produzcan
7 tornillos defectuosos es
A) 1.
B) La misma que la de que se produzcan 6
defectuosos.
C) No se puede saber al no tener el dato del nmero
de tornillos que se fabrican al dia.
D) Ninguna de las anteriores.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010




Material Comp. Tema 4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/9
12.- La probabilidad de que un ordenador falle durante las 100
primeras horas de funcionamiento es 0.005. Si una empresa compra
1000 ordenadores, la distribucin de probabilidad exacta del nmero
de ordenadores que fallarn en las 100 primeras horas
A) Tiene por varianza el valor 4.975.
B) Es asimtrica a la izquierda.
C) Tiene por moda los valores 4 y 5.
D) Verifica al menos dos los tres apartados anteriores.
13.- La probabilidad de que un da cualquiera un ordenador falle en
el proceso de arranque es de 0.05. La probabilidad de que
transcurran x das con arranque correcto antes del primer da que el
ordenador falle vendr dada por
A)
x
, ,
1
0 05 0 95 .
B)
x
, ,
1
0 95 0 05
C)
x
, , 0 05 0 95
D) Ninguna de las afirmaciones anteriores es
verdadera.
4.2.- Un jugador de un equipo de baloncesto de la ACB, que
acierta el 75 % de los tiros libres, se dispone a realizar un "uno ms
uno" (si anota la primera canasta, se le permite un segundo
lanzamiento, pero si falla en el primer lanzamiento no dispone de un
segundo. Su equipo se anota un punto por cada canasta conseguida).
Bajo la hiptesis de independencia en los resultados de los
lanzamientos, se considera la v.a X: nmero de puntos que obtiene
este jugador en un lanzamiento "uno ms uno". Se pide:
a) Obtener la funcin de masa de probabilidad de la v.a. X.
Representarla grficamente e interpretarla.
b) Obtener la funcin de distribucin de la v.a. X.
Representarla grficamente e interpretarla.
c) Obtener la esperanza, varianza y desviacin tpica de la
v.a. X. Interpretarlas. Comparar los resultados de estas
medidas con los correspondientes a la v.a. Y: nmero de
puntos que obtiene este jugador en un lanzamiento "dos
tiros libres", donde el jugador dispone siempre de un
segundo lanzamiento, cualquiera que sea el resultado del
primero.




IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010




Material Comp. Tema 4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/9
4.3.- Una v.a. X tiene por funcin de distribucin

<
=
2 x si , 1
2 < x 1 si ,
4
3
1 x 0 si ,
4
1
0 < x si , 0
) x ( F

Se pide:
a) Comprobar que efectivamente se trata de una funcin de
distribucin y representarla grficamente.
b) Qu tipo de v.a. es X? Representar grficamente su
distribucin de probabilidad. Indicar un ejemplo de
ingeniera elctrica donde podra aparecer esta funcin de
distribucin.
c) Calcular la probabilidad de que X supere el valor 0.5.
Mostrar grficamente dicha probabilidad sobre las
representaciones anteriores.
d) Obtener la esperanza y varianza de la v.a. X.
4.4.- Una empresa suministra energa elctrica a travs de dos
lneas de alta tensin A y B. La siguiente tabla de probabilidad
muestra las probabilidades conjuntas
[ ]
p P X x Y y i j
ij i j
= = = = , , , , , ; ,..., = 1 2 3 4 1 5; para las variables X: n de
fallos mensuales en la lnea A e Y: n de fallos mensuales en la lnea
B.

X Y
0 1 2 3 4
0 0.20 0.15 0.05 0.04 0.02
1 0.20 0.06 0.08 0.03 0.01
2 0.06 0.02 0.02 0 0
3 0.04 0.02 0 0 0

Se pide:
a) Obtener e interpretar las dos distribuciones marginales.
b) Obtener e interpretar la distribucin del n de fallos que
se producen en la lnea B, en aquellos meses en los que
no se produce ningn fallo en la lnea A.
c) Son independientes los fallos en ambas lneas?

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010




Material Comp. Tema 4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/9
4.5.- Se consideran los cinco enteros 1,2,3,4,5. Se elige uno de
ellos al azar (la probabilidad de elegir cada uno de ellos es la misma)
y se retiran entonces todos los inferiores al elegido (por ejemplo, si
se ha elegido el 3 se retiran slo el 1 y el 2. Si se ha elegido el 1 no
se retira ninguno). Se procede a continuacin a una segunda eleccin
entre los que quedan. Sea X
1
la variable que representa el nmero
obtenido en la primera extraccin y X
2
la variable que representa el
nmero obtenido en la segunda extraccin.

A) Demostrar de forma razonada que la distribucin de
probabilidad conjunta de (X
1
,X
2
) es

= = =
caso otro en 0
5 1
) 6 ( 5
1
) , (
2 1
j i
i
j X i X P
Nota.- Valrese si las variables son dependientes o
independientes.
B) Obtener de manera razonada las distribuciones de probabilidad
marginales.
C) Calcular de manera razonada P(X
1
+ X
2
> 7).
4.6.- Una empresa de energa elctrica ha clasificado los fallos
en el suministro en dos tipos: catastrficos y no catastrficos.
Adems, sabe que el 20 % de los fallos son de tipo catastrfico. Si en
un periodo determinado de tiempo se han producido 5 fallos,
determinar con qu probabilidad
a) Dos o ms fallos han sido de tipo catastrfico.
b) Dos o menos fallos han sido de tipo no catastrfico.
4.7.- Una mquina fabrica 120 piezas cada hora, con un 1 %
de la produccin defectuoso. Una vez obtenida la produccin de una
hora, se seleccionan aleatoriamente 5 piezas, y se decide continuar la
fabricacin si las 5 piezas inspeccionadas son correctas, mientras que
en otro caso se parar la produccin para analizar las causas de los
fallos.
a) Con qu probabilidad se parar la fabricacin al final de
una hora?
b) La fabricacin de cada da est planificada en dos turnos,
siendo cada turno de 7 horas, determinar el nmero de
horas esperado de una semana con 6 das de fabricacin
en que se tendr que parar la fabricacin de estas piezas.
Coincidir con el nmero de horas ms probable?
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010




Material Comp. Tema 4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/9
4.8.- Un inspector est encargado de examinar un cargamento
de componentes electrnicas. Debido a las restricciones de tiempo
slo se evaluar una muestra de 5 unidades, aunque el lote
considerado es de 40 unidades. El lote se acepta siempre que
aparezca a lo sumo una unidad defectuosa.
a) Con qu probabilidad se aceptar un cargamento que
presente un 10 % de unidades defectuosas?
b) Qu probabilidad hay de aceptar un lote que presente un
40 % de unidades defectuosas?
Nota.- Utilizar la distribucin hipergeomtrica que se define a
continuacin.
Sea una poblacin finita de N elementos que se encuentran
clasificados en dos grupos llamados xito y fracaso, que se notarn
por A y A. Por ejemplo, piezas defectuosas (A) y correctas ( A).
Supongamos que hay D elementos de tipo A y N - D elementos de
tipo A. Se selecciona una muestra aleatoria o al azar sin
reemplazamiento de n elementos, entonces la probabilidad de que la
v.a. X: nmero de elementos de tipo A tome un valor x, viene dada
por
( ) ( )} } { { D n D N n x
N
n
D N
x n
D
x
x X P , mn ,..., , 0 mx , =
|
|

\
|
|
|

\
|

|
|

\
|
= =
La v.a. X depende de tres parmetros:
El nmero de elementos de la poblacin, N.
El nmero de elementos de tipo A en la poblacin, D.
El nmero de elementos seleccionados, n.
Recibe el nombre de distribucin hipergeomtrica de
parmetros N, D y n; notndose X H(N,D,n).
Es generalmente razonable utilizar la distribucin binomial al
muestrear de una poblacin finita cuando el tamao de la muestra
no es superior al 5 % del tamao de la poblacin. Es decir, cuando
n N 0 05 . . Por tanto, en toda distribucin hipergeomtrica H(N,D,n),
si el cociente n/N (a menudo denominado la fraccin muestral) es
pequeo, digamos n N 0 05 . , entonces la distribucin binomial con
parmetros n y p = D/N es una buena aproximacin a la
hipergeomtrica, siendo esta aproximacin mejor cuanto ms
pequeo sea n/N.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010




Material Comp. Tema 4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/9
4.9.- Se ha determinado que las llegadas de mensajes a un
servidor se producen a un promedio de 2 mensajes cada 3 minutos,
siguiendo un proceso de Poisson. Se pide:
A) Calcular la probabilidad de que durante un cuarto de hora
lleguen ms de 4 mensajes. Cantidad ms probable de
mensajes que llegarn durante un cuarto de hora.
B) Si el 2 % de los mensajes que se reciben en este servidor
llevan anexionado ficheros y se selecciona una muestra
de 300 mensajes, obtener la probabilidad de que al
menos 3 lleven fichero anexo.
4.10.- A una gasolinera llegan en promedio 4 vehculos cada
hora siguiendo un proceso de Poisson. Se pide:
A) Con qu probabilidad durante una hora llegarn ms de
dos vehculos?
B) Cul es el nmero ms probable de vehculos que
acudirn a la gasolinera durante las prximas 3 horas?
Con qu probabilidad?
C) La gasolinera dispone de un servicio de lavado al que
acuden el 3 % de los coches que van a repostar. Con
qu probabilidad, en una muestra de 100 coches que
llegaron a la gasolinera, fueron 6 a lavar el coche? Y
menos de 6?
4.11.- En una factora de automviles que tiene la multinacional
RENANCIA se fabrican los modelos E20 y E30. La carrocera del
primero tiene 6 paneles de chapa y la del segundo 8 paneles de
chapa. Al da se producen 10 unidades del modelo E20 y 7 del E30.
Los ingenieros del Dpto. de Calidad han determinado, utilizando
sus amplios conocimientos de Estadstica adquiridos en la carrera,
que el n de defectos de superficie en la chapa de un automvil se
manifiesta a una media de 0.1 defectos por panel, segn un proceso
de Poisson. Se pide:
A) Razonar la veracidad o falsedad de las siguientes
afirmaciones
1. La distribucin de probabilidad del n de defectos en
ambos modelos es la misma.
2. El n de defectos encontrados en la produccin diaria
de los modelos E20 y E30 son variables aleatorias
independientes.
B) Con qu probabilidad, al inspeccionar todos los vehculos
fabricados del modelo E20 durante un da, se encontrar
algn defecto de superficie en los mismos?
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010




Material Comp. Tema 4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/9
C) Con qu probabilidad el n de paneles con 2 ms defectos
inspeccionados durante un da de los vehculos del modelo E30, es
menor o igual que 2?
4.12.- La cantidad de mujeres que acuden en un da a cierta
peluquera sigue una distribucin de Poisson con media 7, mientras
que el nmero de clientes masculinos se distribuye tambin como una
Poisson de varianza 3. Adems se ha comprobado que el nmero de
mujeres que acuden a dicha peluquera es independiente del nmero
de hombres que lo hacen.
A) Cul es la probabilidad de que en un da no acuda ningn
hombre? Y la de que acudan menos de 3 mujeres?
B) Hallar la probabilidad de que en un determinado da
acuda alguna persona a la peluquera.
C) Si se sabe que el nmero de clientas fue menor que 3,
cul es la probabilidad de que hayan acudido ms
mujeres que hombres?
D) Hallar la probabilidad de que en una semana haya habido
ms de un da en que acudieran a la peluquera
exactamente 4 hombres (suponer que la peluquera abre
seis das a la semana).
4.13.- En los estudios que se realizan sobre un nuevo
desfragmentador de discos de ordenador se ha observado que el
sistema falla a una tasa de 4 errores de desfragmentacin por cada
500 MB de memoria rastreada, asumindose un comportamiento
Poissoniano en la ocurrencia de los fallos del desfragmentador.
a) Calcular la probabilidad de que al inspeccionar un disco con 40 GB
el sistema cometa ms de un error de desfragmentacin.
Responder razonadamente.
b) Cuntos discos de 40 GB se debern desfragmentar en promedio
antes de encontrar el primero donde el sistema de
desfragmentacin comete ms de un error de desfragmentacin?
Responder razonadamente.
OBSERVACIONES.-
1. Los problemas 4.5, 4.8 y 4.11 (apartado c) corresponden al
programa de ampliacin.
2. El problema 4.12 ha sido facilitado por la Profesora Ercoreca.

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010




Solucin Material Comp. Tema 4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/1
SOLUCIONES A CUESTIONES Y ALGUNOS PROBLEMAS
DEL MATERIAL COMPLEMENTARIO DEL
TEMA 4

4.1.-
1.- A). 2.- A). 3.- C). 4.- D). 5.- D).
6.- D). 7.- A). 8.- B). 9.- A). 10.- C).
11.- B). 12.- A). 13.- D).
4.2.- a) P(X=0) = 0.25, P(X=1) = 0.1875, P(X=2)=0.5625.
b)

<
<
<
=
2
2 1
1 0
0
1
4375 . 0
25 . 0
0
) (
x
x
x
x
x F
c) E(X) = 1.3125, V(X) = .715, ( ) . X = 0845
E(Y) = 1.5, V(Y) = 0.375, ( ) Y . = 0612

4.9.- A) P(ms de 4 mensajes en 15 minutos) = 0.97075.
Valores ms probables: 9 y 10.
B) P(lleven anexionado fichero al menos 3 mensajes) =
0.938.

4.10.- A) 0.7619.
B) Valores ms probables: 11 y 12, con probabilidad
cada uno de ellos 0.11437.
C) P(6 laven el cohe) 0.05041. P( menos de 6 laven
el coche) 0.916

4.11.- A) La afirmacin 1 es falsa ya que la intensidad es
diferente, mientras que la 2 es verdadera.
B) 0.997.
C) 0.9975.

Nota sobre las interpretaciones.-
Para llegar a manejar con soltura las interpretaciones
probabilsticas se pueden consultar los problemas resueltos que hay
en los libros de apoyo, como un elemento adicional al necesario
seguimiento diario de la asignatura y la atencin en clase.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/11
TEMA 5
MODELOS DE PROBABILIDAD
CONTINUOS
5.1. Variables Aleatorias Continuas
El concepto de variable aleatoria continua fue estudiado en el
epgrafe 4.1 al introducir el concepto de variable aleatoria (v. a.) y
analizar los tipos de variables aleatorias. Recordamos algunos de los
ejemplos all considerados:
El consumo de energa elctrica de una casa durante un da, en
kwh.
El tiempo, en minutos, que estar sin servicio una red elctrica
ante un corte en el suministro de fluido elctrico por razones
meteorolgicas.
El tamao de un fichero informtico, en MB.

Debido a que en todos los ejemplos anteriores estamos en
presencia de fenmenos aleatorios y la variable que se est
analizando puede tomar cualquier valor de un intervalo, se trata de
variables aleatorias continuas. Cualquiera de ellas ser designada
por X, de una forma genrica.
5.2. Distribucin de Probabilidad de una
Variable Aleatoria Continua
Para estudiar mejor el fenmeno aleatorio y la variable X que se
est analizando se necesita conocer lo que se denomina la
distribucin de probabilidad de la v.a. X. Es decir, como su nombre
indica, se trata de proporcionar la manera en que se encuentra
distribuido el 100 % de la probabilidad entre los diferentes intervalos
de valores que puede tomar la variable.
Segn lo que se estudi en el Tema 1, cuando de una variable
continua X se van tomando ms y ms datos, el polgono de
frecuencias relativas presentar un comportamiento cada vez ms
suavizado que nos indicar la presencia de una curva continua que
gobierna la obtencin de esos datos.
Es decir, se puede establecer el concepto siguiente.

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/11
DEFINICION.- (Funcin de Densidad de una Variable
Aleatoria)
Se llama funcin de densidad de probabilidad (fdp) de una
variable aleatoria continua X a una funcin ( ) x f
X
real de variable real
que verifique
( ) x , 0 x f
X
.
( ) 1 dx x f
X
=

+

.

Es decir, cualquier funcin no negativa que recoja un rea
unidad puede actuar como densidad de una v.a.

EJERCICIO 5.1.-
Considerar la funcin f ( x ) x , x =
2
. Razonar si es una fdp. En
caso negativo indicar cmo se debera modificar esa funcin (e.g.
multiplicndola por una constante y/o redefinindola para que sea
positiva slo en un intervalo acotado) para disponer de una fdp.

La importancia de la funcin de densidad es que a partir de ella
se puede determinar la probabilidad que asigna la v.a. considerada a
cada intervalo, segn el siguiente resultado.

TEOREMA.- (Utilidad de la Funcin de Densidad)
Sea una variable aleatoria continua X con fdp ( ) x f
X
. Entonces se
verifica que
[ ] ( )dx x f b X a P
b
a
X

= < <
con a, b nmeros reales cualesquiera tales que a < b. Es decir, la
probabilidad con que la v.a. X toma valores en el intervalo (a,b), lo
que notamos por [ ] b X a P < < , se obtiene calculando el rea bajo la
fdp en dicho intervalo, ( )dx x f
b
a
X

(el rea amarilla en la figura


adjunta). Adems, lo anterior representa la proporcin de valores de
esta variable que se encontrarn en dicho intervalo.

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/11



( )
b
a
f x dx




EJERCICIO 5.2.-
Considerar la funcin
( )

<

0 x si , 0
0 x si , e 2 . 0
x f
x 2 . 0

a) Dibujarla y razonar que se trata de la fdp de una v.a.
continua X.
b) Si la v.a. X designa la duracin de una bombilla hasta que
falla, en miles de horas, calcular y representar
grficamente la probabilidad de que una bombilla falle
entre las 1000 y las 2000 horas de funcionamiento, as
como la proporcin de bombillas que durarn ms de
5000 horas.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/11
EJERCICIO 5.3.-
Se ha determinado que el tiempo requerido para realizar la
operacin de arranque de un ordenador, en segundos, se comporta
segn la funcin de densidad siguiente:
( )
[ ]


=
40 , 30 x si , 0
40 x 30 si , 1 . 0
x f
a) Calcular la proporcin de ordenadores que en su arranque
requieren ms de 38 segundos y mostrarla grficamente.
b) Determinar qu cantidad de tiempo se supera en el 90 %
de estos ordenadores.
c) Cmo variaran los resultados anteriores si la funcin de
densidad fuera un tringulo issceles cuya altura se
trazar sobre 35? Obtener la expresin de la funcin de
densidad y responder a los apartados a) y b).
A. Significado de la Funcin de Densidad

Para entender lo que significa el valor que toma una fdp f(x) en
un punto x nos planteamos la probabilidad con que la v.a.
correspondiente X se sita en los alrededores de dicho punto. Es
decir,
( ) ( ) x x f dx x f
2
x
x X
2
x
x P 2
x
x
2
x
x
=
(


+ < <


ya que el rea bajo f(x) en el intervalo |

\
|
+

2
x
x ,
2
x
x se puede
aproximar por el rea del rectngulo de base x y altura f(x).
Por tanto,
( )
x
2
x
x X
2
x
x P
x f


+ < <


lo que indica que la densidad en un punto x es aproximadamente
igual al cociente entre la masa de probabilidad en un intervalo en
torno a x y la longitud de dicho intervalo. Esto significa que cuantifica
masa de probabilidad por unidad de longitud (como las funciones de
densidad lineales de la fsica) y debe denominarse densidad de
probabilidad en el punto x.


IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/11
EJERCICIO 5.4.-
Interpretar las funciones de densidad de los ejercicios anteriores
con relacin a lo que se acaba de comentar.

B. Consecuencias de una Funcin de Densidad

TEOREMA.-
Sea una variable aleatoria continua X con fdp ( ) x f
X
. Entonces se
verifica que
1. [ ] . x , 0 x X P
0 0
= =
2. [ ] [ ] [ ] [ ]. b X a P b X a P b X a P b X a P < < = < = < = con a, b
nmeros reales cualesquiera tales que a < b.
Funcin de Distribucin
Otra forma de conocer o indicar la distribucin de probabilidad de
una v.a. es mediante la denominada funcin de distribucin que se
defini en el tema 4 y que es una funcin que refleje la probabilidad
en cada punto de una manera acumulada. Pasamos a estudiar dicha
funcin de una manera ms formal.

DEFINICION.-
Sea una variable aleatoria continua X. La funcin de distribucin
de esta v.a., notada por ( ) x F
X
, viene definida por ( ) ( ) x X P x F
X
= para
cada x , y nos indica la probabilidad con que la v.a. X tomar
valores no superiores a x .

TEOREMA.- (Relacin entre funcin de distribucin y de
densidad)
Sea una variable aleatoria continua X con funcin de distribucin
( ) x F
X
y fdp ( ) x f
X
. Entonces se verifica que
1. ( ) ( )du u f x F
x
X


= , para cada x .
2. ( )
dx
) x ( dF
x f = , para cada x donde F(x) es derivable.

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/11
Recordamos que las cuatro propiedades que caracterizan a una
funcin de distribucin se cumplirn en el caso de ser continuas.
Adems, en este caso F(x) ser continua y tambin, en muchos
casos, derivable en todos sus puntos.
EJERCICIO 5.5.-
Calcular las funciones de distribucin de las v.a.
correspondientes a los ejercicios 5.2 y 5.3.
EJERCICIO 5.6.-
a) Considrese la siguiente funcin
x
F(x)
0 4 8 12 16 20 24 28 32 36 40
0
0,2
0,4
0,6
0,8
1

Es una funcin de distribucin? En caso afirmativo, cmo se
obtendra la fdp asociada?
b) Considrese la siguiente funcin

( )


x
F x x x
x
<

>

2
0 0
0 1
1 1

Es una funcin de distribucin? En caso afirmativo, cul sera la fdp
asociada?

c) Considrese la siguiente funcin

( )



, x
x
F x , x
, e x

<

= =

>

02
0 0
0 05 0
1 0 95 0

Es una funcin de distribucin? En caso afirmativo, cul sera la fdp
asociada? Qu significado tendra en el contexto del ejercicio 4.2?

Recordamos de lo estudiado en el Tema 3 lo siguiente.

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/11

TEOREMA.- (Clculo de probabilidades en v.a. continuas
mediante la funcin de distribucin)
Sea una variable aleatoria continua X con funcin de distribucin
( ) x F
X
y fdp ( ) x f
X
. Entonces se verifica que
[ ] [ ] [ ] [ ]
), a ( F ) b ( F
b X a P b X a P b X a P b X a P
=
= < < = < = < =

con a, b nmeros reales cualesquiera tales que a < b.
EJERCICIO 5.7.-
Mostrar grficamente este resultado con una funcin de
distribucin genrica F(x). Utilizarlo para calcular las probabilidades
de los ejercicios 5.1 y 5.2 con la funcin de distribucin.
5.3. Esperanza y Varianza de una Variable
Aleatoria Continua
Anlogamente a lo desarrollado para distribuciones de
frecuencias, surgen los siguientes conceptos de tendencia central.

DEFINICION.-
Sea una variable aleatoria continua X con fdp ( ) x f
X
.
a) Se llama esperanza o media o valor esperado de la v.a. X,
notndose por E(X) o , al promedio de los valores de X respecto a la
distribucin de probabilidad de X, as
( ) ( )

= dx x xf X E
X
.
b) Se llama esperanza o valor esperado de una funcin g(X) de la
v.a. X, notndose por E(g(X)), al promedio de los valores de g(X)
respecto a la distribucin de probabilidad de X, as
( ) ( )dx x f ) x ( g ) X ( g E
X

= .




IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/11

De esa analoga surgen los siguientes conceptos de variabilidad.
DEFINICION.-
Sea una variable aleatoria continua X con fdp ( ) x f
X
. Se llama
varianza de la v.a. X, notndose por V(X) o
2
, al promedio de las
diferencias cuadrticas entre los valores de X y su media respecto a
la distribucin de probabilidad de X, as
( ) ( ) ( )dx x
X
f x X V

=
2
.
La desviacin tpica o estndar de la v.a. X, notada por , es la
raz cuadrada de la varianza.

PROPIEDAD.- Sea una v. a. continua X con fdp ( ) x f
X
y media .
Entonces ( ) ( ) ( ) ( )
2 2 2 2
) ( = = X E X E X E X V .
EJERCICIO 5.8.-
Para las distribuciones de los Ejercicios 5.2 y 5.3, se pide:
a) Calcular e interpretar la media, la mediana y la moda.
b) Calcular la varianza, la desviacin tpica y el coeficiente de
variacin. Interpretar los resultados.
5.4. Distribucin Uniforme
Los dos ejemplos que venimos manejando constituyen casos
particulares de dos modelos de probabilidad o distribuciones
continuas bsicas en las aplicaciones, como son la uniforme y la
exponencial. Con relacin a la primera, que es esencial en los
desarrollos de Simulacin al generar valores de cualquier variable
aleatoria continua y en los errores de redondeo, se tiene lo siguiente.






IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/11
DEFINICION.-
Se dice que una variable aleatoria continua X sigue una
distribucin uniforme en el intervalo [a,b], con a, b nmeros
reales cualesquiera tales que a < b; cuando su fdp sea
( )
[ ]

=
b , a x si , 0
b x si a ,
a b
1
x f
Se notar X U(a,b).
Funcin de distribucin de la uniforme
Sea una variable aleatoria continua X U(a,b), entonces
( )

>

<
=
b x 1
b x a
a b
a x
a x 0
x F .
Media y Varianza de la Uniforme
Si una variable aleatoria X U(a,b), entonces
2
) (
b a
X E
+
= ,
( )
12
) (
2
a b
X V

=

EJERCICIO 5.9.-
Cmo influye el valor del lmite inferior en la representatividad
de la media para distribuciones uniformes cuyo lmite superior es el
doble del lmite inferior?

Una de las propiedades de esta distribucin es la siguiente.
PROPIEDAD.- Si una variable aleatoria X U(a,b), entonces
( ) ( ) h x X x P h x X x P
2 2 1 1
+ < < = + < < , si
b h x x h x x a
2 2 1 1
< + < < + < < .
5.5. Distribucin Exponencial
Es un modelo de probabilidad apropiado para recoger el
comportamiento de algunos sistemas en cuanto a la duracin hasta el
fallo, adems de ser una distribucin bsica en otro tipo de
aplicaciones y el fundamento sobre el que se han desarrollado otras
distribuciones esenciales en la ingeniera. Especialmente importante
resulta en los anlisis de fiabilidad de redes o de software.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/11
DEFINICION.-
Se dice que una variable aleatoria continua X sigue una
distribucin exponencial de parmetro , con > 0; cuando su fdp
sea
( )

<

=

0 x si , 0
0 x si , e
x f
x

Se notar X E().
En la figura siguiente aparece la funcin de densidad de la
distribucin E(0.5).
















EJERCICIO 5.10.-
Dibujar en el mismo grfico las distribuciones E(2) y E(0.5).
a) Qu conclusiones se extraen de comparar ambas? Cul
es el efecto del parmetro?
b) Aplicarlo al caso de que un grupo de personas, A, presente
una distribucin de la duracin de las llamadas, en
minutos, E(2) y otro grupo, B, presente una distribucin de
la duracin de las llamadas E(0.5). En qu grupo hay ms
llamadas no cortas (por encima de 5 minutos)?
c) Cmo seran las funciones de densidad anteriores para el
caso de asegurar que la variable nunca tomar valores
inferiores a 1? Aplicarlo a un sistema de sorteo televisivo
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.1 - 5.5 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
11/11
donde se fuerza al cliente a estar al menos un 1 minuto en
cada llamada que se vaya a procesar.

TEOREMA.- (Funcin de distribucin de la exponencial)
Sea una variable aleatoria continua X E(), entonces
( )


<
=

0 x e 1
0 x 0
x F
x
.
EJERCICIO 5.11.-
Con relacin a las distribuciones del Ejercicio 5.10 calcular sus
funciones de distribucin.

TEOREMA.- (Media y Varianza de la Exponencial)
Si una variable aleatoria X E(), entonces

1
) ( = X E ,
2
1
) (

= X V

EJERCICIO 5.12.-
Con relacin a las distribuciones uniforme y exponencial:
a) Justificar la frmula de la media.
b) Justificar la expresin de la varianza.
EJERCICIO 5.13.-
En un proceso de fabricacin el tiempo para realizar una
operacin sigue una distribucin exponencial de media 5 minutos
truncada en 4 minutos (debe ser superior a 4 minutos por
restricciones del proceso).
a) Calcular la proporcin de operaciones en las que se
emplea ms de 5 minutos.
b) Encontrar la expresin de la funcin de densidad de la
v.a. analizada.
Ayuda.- Utilizar el concepto de probabilidad condicionada.


IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/9
5.6. La Distribucin Normal (Gauss-Laplace)
La distribucin normal es la distribucin ms importante tanto en
la teora estadstica como en sus aplicaciones. Fue propuesta por
Gauss y Laplace, en el siglo XIX, de manera independiente uno de
otro, como alternativa a la distribucin que se vena empleando hasta
el momento para los errores de medida, que se caracterizaba por ser
una distribucin simtrica en torno a una media m, pero recogiendo
en los intervalos h , con h =1, 2, 3; un porcentaje de errores de
medida muy inferior a los que aparecen habitualmente en la realidad.
Por esta razn, Gauss y Laplace propusieron un modelo de
probabilidad simtrico y acampanado que refleja mejor el
comportamiento real de los errores de medida, y que se conoce como
distribucin normal.
Adems, como todo error en una medida es una v.a. resultado
(suma) de muchas causas aleatorias, tendr un comportamiento
aproximadamente normal, segn el teorema del lmite central, con lo
cual se confirm lo adecuado de esta distribucin para reflejar dicho
fenmeno.
Definicin. Significado de los Parmetros
DEFINICION.
Se dice que una v.a. X sigue una distribucin normal o de Gauss-
Laplace de parmetros y
2
, con - < < y
2
> 0, cuando su
funcin de densidad de probabilidad sea

2
x
2
1
e
2
1
) x ( f


= , para - < x < . [5.1]
Notndose X ( )
2
, N .

Observacin.- Se prueba que f(x) es funcin de densidad. Es decir,
1) x , 0 ) x ( f .
2) 1 dx ) x ( f =

+

.
Se verifica que si X ( )
2
, N , entonces
E(X) = y V(X) =
2
, [5.2]
con lo cual dichos parmetros adquieren significado en la distribucin.
Adems, Me = Mo = .
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/9

EJEMPLO 5.6.1. DISTRIBUCION NORMAL AL MEDIR EL
DIAMETRO EXTERIOR DE UN DISCO DE
ORDENADOR

Se sabe que el dimetro exterior de unos discos de ordenador
que se estn fabricando de un determinado modelo, en mm, siguen
una ley normal de parmetros = 200 y
2
= 4. Representar la
funcin de densidad de dicha distribucin y extraer conclusiones
sobre el significado de los parmetros.
----------------------------------
Estamos ante una v.a. X N(200,4) cuya funcin de densidad
ser
2
2
200 x
2
1
e
2 2
1
) x ( f

= , para - < x < .



Su representacin grfica, mediante el procedimiento
Distribution Plotting del software STATGRAPHICS, se muestra en la
Figura 5.6-1.

Funcin de densidad de probabilidad, f(x),
en la distribucin N(200,4)
190 194 198 202 206 210
x
0
0.04
0.08
0.12
0.16
0.2
f(x)
200 196 204 192 208

Figura 5.6-1
Esta funcin de densidad es simtrica y unimodal respecto a ,
llamado parmetro de localizacin. Esto significa que el dimetro
medio exterior de los discos que se fabrican es de 200 mm, valor que
coincide con la moda, i.e, el valor ms frecuente, y con la mediana, lo
que nos permite afirmar que la mitad de los discos fabricados tienen
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/9
un dimetro exterior inferior o igual a 200 mm y la otra mitad
dimetros exteriores superiores a 200 mm.
Adems, se trata de una distribucin con forma acampanada, de
tal manera que la extensin del rango relevante de valores de la
variable o, dicho de otra forma, el peso de las colas, lo marca el
parmetro
2
, llamado parmetro de escala. Este valor es la
varianza, 4, en los valores de dimetro exterior de los discos
fabricados, expresado en mm
2
. Nos informa sobre el promedio de los
cuadrados de las diferencias de todos los valores de la v.a. X a su
media. Su raz cuadrada, , es la llamada desviacin tpica, medida
que informa sobre lo que se dispersan los valores de la v.a. X con
respecto a su media, en nuestro caso hay una dispersin de los
dimetros exteriores de los discos fabricados al dimetro exterior
medio de 2 mm.
El efecto de un cambio en la media de la distribucin normal
significa un desplazamiento del eje de simetra, como se muestra en
la Figura 5.6-2 donde se comparan dos distribuciones normales con la
misma varianza, 100, y distinta media, 500 y 550, respectivamente,
que representan, por ejemplo, el peso en gramos de los chuletones
servidos en dos restaurantes A y B, respectivamente.

Efecto de la media en una distribucin normal.
Comparacin entre N(500, 10
2
) y N(550, 10
2
)
450 480 510 540 570 600
x
0
0.01
0.02
0.03
0.04
f(x)
N(500, 10
2
)
N(550, 10
2
)

Figura 5.6-2
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/9
El efecto de un cambio en la varianza o en la desviacin tpica de
la distribucin normal significa dar mayor o menor peso a las colas de
la distribucin. Es decir, a mayor (resp. menor) mayor (resp.
menor) es el rango relevante de valores de la variable.
La Figura 5.6-3 compara dos distribuciones normales con la
misma media, 500, y distinta varianza, 100 y 25, respectivamente,
que representan, por ejemplo, los kilmetros recorridos por un
vehculo A y otro B, respectivamente, cada mes. La distribucin del
vehculo A presenta mayor dispersin, es decir, que de un mes a otro
varan ms los kilmetros recorridos que en el caso del vehculo B. De
hecho, segn lo comentado antes y por la simetra de la distribucin
normal, se puede afirmar que el vehculo A recorrer menos de 490
Km el 16 % de los meses, mientras que el vehculo B estar por
debajo de dicha cantidad tan slo en el 2.5 % de los meses. Tambin
se puede afirmar que el kilometraje mensual del vehculo B es mucho
ms regular u homogneo que el del A, lo que se refleja en el grfico
en un menor rango relevante de valores para la variable, o en una
mayor concentracin de los valores sobre la media, que en en el caso
del vehculo A.

Efecto de la desviacin tpica en una distribucin normal.
Comparacin entre N(500, 10
2
) y N(500, 5
2
)
450 470 490 510 530 550
x
0
0.02
0.04
0.06
0.08
f(x)
N(500, 10
2
)
N(500, 5
2
)

Figura 5.6-3


IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/9
FUNCION DE DISTRIBUCION DEL MODELO NORMAL
Como ya sabemos, en toda v.a. X continua juega un papel
fundamental la funcin de distribucin, que proporciona para cada x
real la probabilidad de que la v.a. tome un valor inferior o igual a x,
es decir, no superior a x.
Si X ( )
2
, N , entonces su funcin de distribucin es
( ) ( )



= =

x , ds
2
s
2
1
e
x
2
1
x X P x F
X
[5.3]

Esta integral no se puede expresar mediante funciones
elementales, aunque si es posible aproximar su valor mediante reas.
Para obtener los valores de ( ) x F
X
, para cada x > 0, se plante la
construccin de una tabla de probabilidad, pero no para cualquier
distribucin normal, sino para la llamada distribucin normal
estndar ( = 0 y
2
= 1); ya que cualquier v.a. X ( )
2
, N se
puede convertir en una v.a. Z ( ) 1 , 0 N , mediante la denominada
tipificacin o estandarizacin.

Si X es una v.a. con media
X
y desviacin tpica
X
, la v.a.
X
X
X
Z


=
se llama variable tipificada o estandarizada de la v.a. X. Se verifica
que 0
Z
= y 1
Z
= .
Adems, si X ( )
2
, N , entonces Z ( ) 1 , 0 N .


Si Z ( ) 1 , 0 N , entonces su funcin de densidad es
( )

=

z , e
2
1
z f
2
z
2
1
[5.4]
y su funcin de distribucin viene dada por
( ) ( )

= =

z ds e
z
z Z P z
s
,
2
2
1
2
1
[5.5]

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/9
Funcin de densidad de probabilidad, f(z),
en la distribucin N(0,1)
-5 -4 -3 -2 -1 0 1 2 3 4 5
z
0
0.1
0.2
0.3
0.4
f(z)

Figura 5.6-4
F u n c i n d e d is t r i b u c i n d e la N ( 0 , 1 ) , ( ) z
- 5 - 4 - 3 - 2 - 1 0 1 2 3 4 5
z
0
0 . 2
0 . 4
0 . 6
0 . 8
1

Figura 5.6-5
Area bajo la funcin de densidad de la N(0,1)
a la izquierda de cada valor z
0
> 0, ( )
0
z
-5 -3 -1 1 3 5
0
0.1
0.2
0.3
0.4
f(z)
0
z
0
( z
0
)
z

Figura 5.6-6
La representacin de la funcin de densidad de la normal
estndar posee las mismas caractersticas que la de la normal
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/9
generalizada, segn se ve en la Figura 5.6-4. La funcin de
distribucin de la normal estndar se muestra en la Figura 5.6-5.
La representacin grfica del valor ( )
0
z , probabilidad
acumulada en el valor z
0
de la normal estndar,

sobre la funcin de
densidad de la N(0,1), se muestra en la Figura 5.6-6.
Clculo de Probabilidades en una Normal mediante Tablas.
En algunos casos calculadoras y ordenadores proporcionan la
posibilidad de calcular probabilidades de una normal. No obstante, se
puede utilizar alguna de las tablas de probabilidad normal para
realizar dichos clculos. En fotocopia adjunta se encuentra la tabla de
la distribucin normal estndar, que proporciona para cada valor z 0
la probabilidad ( ) z , o porcentaje de valores en la distribucin N(0,1)
cuyo valor no supera a z.
Por ejemplo, se verifica que ( ) 8944 . 0 25 . 1 = ; lo que nos indica
que en la distribucin normal estndar hay un 89.44 % de
probabilidad de obtener valores no superiores a 1.25. Si queremos
encontrar el valor ( ) 975 . 0 z Z P N(0,1)/ la en z
0 0
= buscaremos en la
tabla el valor de probabilidad 0.975 que corresponde a la interseccin
de la fila 1 y la columna de 0.06, de donde 1.96 z
0
= . Es decir, el
97.5 % de probabilidad en una v.a. Z ( ) 1 , 0 N se acumula en 1.96.
Por tanto, resulta que ( ) 95 . 0 96 . 1 Z 96 . 1 P = .
El clculo de probabilidades para intervalos en la N(0,1) segn la
tabla adjuntada se realiza considerando la simetra de la distribucin
y utilizando las propiedades de la probabilidad. Bsicamente que
( ) ( ) ( ) ( )
( ) ( ). a b
b Z a P b Z a P b Z a P b Z a P
=
= < = < = < < =

EJERCICIO 5.8.-
Sea una v.a. Z ( ) 1 , 0 N , comprobar los siguientes resultados y
representar grficamente dicha probabilidad.
a) ( ) . 1574 . 0 3 Z 1 P = <
b) ( ) . 1574 . 0 1 Z 3 P = <
c) ( ) . 8185 . 0 1 Z 2 P =
d) ( ) . 1587 . 0 1 Z P = >
e) ( ) . 3174 . 0 1 Z P = >

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/9
La probabilidad que asigna una v.a. X normal no estndar a un
intervalo cualquiera se calcula tipificando la expresin sobre la que se
quiere determinar la probabilidad, lo que supone transformar dicho
intervalo en un intervalo de la distribucin N(0,1). Esto es,

( )


=
=


< <


<


<


= < <
a b
b
Z
a
P
b X a
P b X a P

para una v.a. X ( )
2
, N , siendo Z ( ) 1 , 0 N .
EJERCICIO 5.9.
Para la v.a. del ejemplo 5.6.1., calcular, interpretar y
representar grficamente las siguientes probabilidades.
a) ( ). 205 X 201 P <
b) ( ) 199 X 196 P < .
c) ( ) 203 X 195 P .
d) ( ) 203 X P > .
e) ( ) 5 . 196 X P .
A efectos de desarrollos posteriores se emplear la notacin
siguiente, lo que se muestra en la Figura 5.6-7.
( ) = >

z Z P N(0,1)/ la en valor el es z ,
Por ejemplo, 96 . 1 z
025 . 0
= , ya que si Z N(0,1), entonces
( ) 975 . 0 96 . 1 = .
Valor en la N(0,1),

z , que deja a la derecha una probabilidad


-5 -3 -1 1 3 5
0
0.1
0.2
0.3
0.4

z
z
f(z)
0

Figura 5.6-7
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010






5.6 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/9
Propiedades
Sea una v.a. X ( )
2
, N , entonces
1) E(X) = y V(X) =
2
.
2) Me = Mo = .
3) La funcin de densidad tiene dos puntos de inflexin en .
4) ( ) 6827 . 0 X P = + (aprox. el 68 % observ.)
( ) 9545 . 0 2 X 2 P = + (aprox. el 95 % observ.)
( ) 9973 . 0 3 X 3 P = + (aprox. el 99.7 % observ.)
( ) 999936 . 0 4 X 4 P = + (aprox. el 99.99 % observ.)
( ) 579 0,99999942 = + 5 X 5 P
( ) 8119758 0,99999999 = + 6 X 6 P
5) ( ) 3173 0 X P . = > (317300 ppm)
( ) 0455 0 2 X P . = > (45500 ppm)
( ) 0027 0 3 X P . = > (2700 ppm)
( ) 000064 0 4 X P . = > (64 ppm)
( ) 421 0,00000057 = > 5 X P (0,574 ppm; 574210 ppb)
( ) 9 E 880242 1 6 X P = > . (o bien 1880 ppb)
Nota.- Habitualmente se emplea ppmpartes por milln y ppbpartes
por billn.

La ltima propiedad significa que segn el modelo normal, en la
distribucin del ejemplo 5.5.1, de 10000 discos fabricados tendremos
aproximadamente un 68 %, exactamente 6827, con un dimetro
exterior entre 200 2 mm; aproximadamente un 95 %,
exactamente 9545, entre 200 4 mm; aproximadamente un 99.7
%, exactamente 9973, entre 200 6 mm; y 9999 con su dimetro
exterior entre 200 8 mm.
Si las especificaciones fueran de 200 6 mm, esta fabricacin
dara un 0.27 % de unidades no conforme a especificaciones, lo que
significa 2700 ppm de defectuosos. En el caso de que las
especificaciones recogieran un intervalo centrado en de longitud 8,
se encontraran fuera de especificaciones 64 ppm. Pero no olvidemos
que las especificaciones nos vienen dadas por el departamento
de diseo, siendo uno de nuestros objetivos reducir la de la
distribucin analizada, ya que con ello conseguiremos una reduccin
de las piezas no conformes a especificaciones.

NORMAL DISTRIBUTION TABLE


z 0 +


.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
.4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879

.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389

1.0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1.1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1.2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1.3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
1.4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319

1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767

2.0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
2.1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
2.2 .9861 .9864 .9868 .9871 .9875 .9878 .9881 .9884 .9887 .9890
2.3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
2.4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936

2.5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
2.6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
2.7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2.8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
2.9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986

3.0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
3.1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
3.2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
3.3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
3.4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998



ITIM, ITIG/S, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008




6.1 Carlos Mat
1/6
TEMA 6
DISTRIBUCIONES DE PROBABILIDAD
ASOCIADAS A LA NORMAL

6.1. Resultados Bsicos sobre Funciones Lineales de
Variables Aleatorias
Tanto en la teora como en las aplicaciones de la Estadstica es
muy habitual considerar funciones lineales de variables aleatorias. En
concreto, resultan imprescindibles para los desarrollos de Inferencia
Estadstica. Veamos algunas situaciones donde aparecen.

SITUACION 1
Consideremos la demanda diaria de electricidad en una zona a lo
largo de un mes. Antes de tener el dato de demanda diario nos
encontramos con una situacin de incertidumbre en el valor de dicha
demanda. Por tanto, si se considera la v.a. X: demanda diaria de
energa elctrica, en kw, en la zona considerada; al plantearse el
proceso de obtener la demanda en los 30 das del mes se estn
considerando 30 variables aleatorias
30 2 1
X ,..., X , X donde la variable
aleatoria
i
X , i = 1, ..., 30; representa la demanda de energa
elctrica el i-simo da considerado. El valor de demanda mensual,
antes de tener los datos diarios, ser una v. a., resultado de sumar la
demanda de cada uno de los 30 das, que se designar por S
30
y
vendr definida por
30 1 30
... X X S + + =
Es decir, la v.a. S
30
se expresa como una funcin o combinacin lineal
de las 30 variables aleatorias
30 2 1
,..., , X X X .

SITUACION 2
Durante un da se va a medir el dimetro exterior de 10 discos
compactos de ordenador. Antes de tomar las medidas nos
encontramos con una situacin de incertidumbre en la medida del
dimetro de cada disco. Por tanto, si se considera la v.a. X: dimetro
de un disco compacto, en mm; al plantearse el proceso de medir el
ITIM, ITIG/S, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008




6.1 Carlos Mat
2/6
dimetro de 10 discos se estn considerando 10 variables aleatorias
10 2 1
,..., , X X X donde la v.a.
i
X , i = 1, ..., 10; representa el valor
que en cuanto dimetro presentar el i-simo disco considerado. El
dimetro medio que presentarn estos 10 discos ser un nmero
cuando se tengan los 10 datos, pero antes de tomar estos datos ser
una v.a., llamada dimetro medio y notada por X , tal que
10
X ... X X
X
10 2 1
+ + +
=
Es decir, la v.a. X se puede poner de la siguiente forma:
10 2 1
X
10
1
... X
10
1
X
10
1
X + + + =
y X se expresa como una funcin lineal de las 10 variables
aleatorias
10 2 1
,..., , X X X .
DEFI NI CI ON.-
Sean n variables aleatorias
n 2 1
X ,..., X , X y n constantes o
nmeros reales
n 2 1
a ,..., a , a . Se dice que la v. a. Y definida por
n n 1 1
X a ... X a Y + + =
es una combinacin lineal de las v. a.
n 2 1
X ,..., X , X .
De una v.a. que sea combinacin o funcin lineal de otras
interesa su media, varianza y distribucin de probabilidad. En
cuanto a la media se verifica lo siguiente:
TEOREMA.-
Sean n variables aleatorias
n 2 1
X ,..., X , X y n constantes o
nmeros reales
n 2 1
a ,..., a , a . Si
n n 1 1
X a ... X a Y + + = , entonces
( ) ( ) ( )
n n 1 1
X E a ... X E a Y E + + = .
Utilizando el smbolo sigma mayscula, se expresar
( )
i
n
1 i
i
n
1 i
i i
X E a X a E

= =
=


Respecto a la varianza recordamos que para la suma o diferencia
de variables ( ) V aX bY a V( X ) b V( Y ) abCov( X ,Y ) = +
2 2
2 . Si extendemos
este resultado a una suma de n variables, utilizando el principio de
induccin matemtica, se verificar el siguiente resultado.
ITIM, ITIG/S, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008




6.1 Carlos Mat
3/6

TEOREMA.-
Sean n variables aleatorias
n 2 1
X ,..., X , X y n constantes o
nmeros reales
n 2 1
a ,..., a , a . Si
n n 1 1
X a ... X a Y + + = , entonces
( )

+ =

= = i j
j i j i i
n
1 i
2
i
n
1 i
i i
) X , X ( Cov a a 2 X V a X a V
Si las n v. a.
n
X X X ,..., ,
2 1
son independientes, entonces
( ) ( ) ( )
n
2
n 1
2
1
X V a ... X V a Y V + + = .

EJERCICIO 6.1.1.-
a) El nuevo sistema informtico multitarea HUMANO21
permite trabajar simultneamente con 20 programas. El
requerimiento de memoria RAM de un programa es una cantidad
aleatoria que presenta una media de 3000 KB y una desviacin tpica
de 50 KB. Obtener el valor esperado de memoria RAM en una sesin
en que se van a abrir 20 programas, as como la desviacin tpica.
b) El dimetro de un disco compacto, en mm, es una v. a. de
media 200 mm y desviacin tpica 2 mm. Cada da se toman al azar
10 discos y se mide su dimetro. Obtener la esperanza y varianza del
dimetro medio que presentarn estos 10 discos cada da.
6.1.1. Distribucin de Sumas de Variables
Aleatorias Independientes
En el epgrafe anterior se ha estudiado cmo obtener la media y
varianza de una v.a. que sea combinacin o funcin lineal de otras.
Ahora, vamos a proceder a hallar su distribucin de probabilidad en el
caso de considerar variables aleatorias distribuidas segn leyes
normales y que sean independientes.
TEOREMA.- Sean n variables aleatorias
n
X X X ,..., ,
2 1

independientes tales que ( )
2
i
i i
, N X , para i = 1, ..., n. Sea
n n
X X S + + = ...
1
la v.a. suma de las n v.a. anteriores. Entonces



= =
n
1 i
2
i
n
1 i
i n
, N S .
ITIM, ITIG/S, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008




6.1 Carlos Mat
4/6


EJERCICIO 6.1.2.-
Un hipermercado tiene dos puertas de entrada (y salida) A y B.
Por la puerta A (resp. B) entran cada minuto un n aleatorio de
personas distribuido ( ) 9 , 60 N (resp. ( ) 16 , 30 N ). Se pide:
a) Obtener la distribucin de probabilidad del n de personas
que entran cada minuto a este hipermercado. Representar
las tres distribuciones implicadas.
b) Con qu probabilidad durante un minuto entrarn a este
centro ms de 100 personas?



TEOREMA.-
Sean n variables aleatorias
n 2 1
X ,..., X , X independientes tales
que ( )
2
i
, N X , para i = 1, ..., n. Sea
n 1 n
X ... X S + + = la v.a.
resultado de sumar las n v.a. anteriores. Entonces
( )
2
n
n , n N S .


EJERCICIO 6.1.3.-
El nuevo sistema informtico multitarea HUMANO21 permite
trabajar simultneamente con 20 programas. El requerimiento de
memoria RAM de un programa es una cantidad aleatoria que sigue
una ley normal de media 3000 KB y una desviacin tpica de 50 KB.
Obtener la ley de probabilidad que rige la memoria RAM que se utiliza
en una sesin genrica en la que se tengan abiertos 20 programas.

Caso del Promedio (Media Muestral)
Un caso de suma particular muy interesante en las aplicaciones y
para desarrollos posteriores es el promedio. Vamos a analizar la
distribucin del promedio de variables normales.
ITIM, ITIG/S, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008




6.1 Carlos Mat
5/6

TEOREMA.-
Sean n variables aleatorias
n 2 1
X ,..., X , X independientes tales
que ( )
2
i
i i
, N X , para i = 1, ..., n. Sea
n
X ... X
n
S
S
n 1 n *
n
+ +
= = la v.a.
resultado de promediar las n v.a. anteriores. Entonces


= =
2
n
1 i
2
i
n
1 i
i
*
n
n
,
n
N S .

El caso del promedio de normales con la misma distribucin (o
idnticamente distribuidas) se refleja en el siguiente resultado.
TEOREMA.-
Sean n variables aleatorias
n 2 1
X ,..., X , X independientes tales
que ( )
2
i
, N X , para i = 1, ..., n. Sea ( )
n
X ... X
n
S
n X
n 1 n
+ +
= = la
v.a. resultado de promediar las n v.a. anteriores. Entonces
( )



n
, N n X
2
.
OBSERVACIONES.-
1) La notacin de x mayscula barra se utiliza por analoga
al caso de un conjunto de datos
n 2 1
x ,..., x , x de una misma variable
X; donde la media se notaba por x . Ahora, no tenemos un conjunto
de n datos sino un conjunto de n variables aleatorias
n 2 1
X ,..., X , X
todas ellas independientes y con la misma distribucin de
probabilidad que una v.a. ( )
2
, N X ; con lo cual el promedio de
esas n v.a., que se tratar de una nueva v.a., ser notado por ( ) n X y
denominado media muestral.
2) Este resultado se enuncia diciendo que la media muestral
en una poblacin ( )
2
, N X sigue tambin una ley normal con la
misma media que en la poblacin, pero con una varianza que es la n-
sima parte de la que presenta la poblacin. As, la media muestral
ITIM, ITIG/S, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008




6.1 Carlos Mat
6/6
en muestras de tamao 2 (resp. 4, 10, 100, ...) tendr como
varianza la mitad (resp. cuarta parte, dcima parte, centsima parte,
...) de la varianza que haya en la poblacin; con lo cual a mayor n
de v.a. normales promediadas, menor dispersin en el promedio.
EJERCICIO 6.1.4.-
En una fbrica se estn produciendo unas planchas de las que se
sabe que su espesor es una v.a., notada por X, distribuida segn una
ley normal de media 2 cm y desviacin tpica 0.08 cm. Cada hora se
seleccionan al azar 4 planchas y se mide su espesor.
a) Qu significado tiene en este caso la media muestral?
Qu distribucin de probabilidad tiene?
b) Representar la distribucin de X y en otro grfico, debajo
del anterior, la de ( ) 4 X .
c) Cuntas muestras tendrn su espesor medio dentro del
intervalo [ ] 12 . 2 , 88 . 1 ?



ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.2 Carlos Mat

1/5
6.2. Teorema del Lmite Central
En el epgrafe anterior se ha estudiado la distribucin de
probabilidad de sumas de variables aleatorias distribuidas segn
leyes normales e independientes, garantizndose que la suma
tambin sigue una distribucin normal.
El teorema que vamos a analizar a continuacin nos permite
afirmar que lo anterior tambin es aproximadamente cierto si se
suprime la hiptesis de normalidad en los sumandos y se suman al
menos 30 v.a. Es decir, cualquier suma de v.a. independientes
seguir aproximadamente una ley normal, con tal de que se tomen al
menos 30 sumandos. Este resultado, conocido como teorema del
lmite central, hace de la distribucin normal el lmite central de las
sumas y, por tanto, que sea la distribucin en torno a la cual girarn
los desarrollos estadsticos.

TEOREMA.- ( Teorema del Lmite Central de Lvy-
Lindeberg)
Sean n variables aleatorias
n 2 1
X ,..., X , X independientes tales
que ( ) + < =
i i
X E y ( ) + < =
2
i
i
X V , para i = 1, ..., n. Sea
n 1 n
X ... X S + + = la v.a. resultado de sumar las n v.a. anteriores.
Entonces la v.a. suma tipificada
( )
( )
n
n n
S V
S E S

tiene una distribucin aproximadamente N(0,1), siempre que sea n
30.
Como ( )

=
=
n
1 i
i n
S E y ( )

=
=
n
1 i
2
i
n
S V resulta que



= =
n
1 i
2
i
n
1 i
i n
, N mente aproximada distribuye se S
siempre que sea n 30.
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.2 Carlos Mat

2/5
CONSECUENCIAS PRACTICAS.-
1) El clculo de probabilidades de
n n
X X S + + = ...
1
, si se
verifican las hiptesis del teorema del lmite central, se realizar a
travs de la distribucin normal aproximada.
2) Al ser la media muestral un caso particular de suma,
resulta que el teorema anterior garantiza la normalidad de aquella en
la mayora de los casos. Es decir,
TEOREMA.-
Sea una poblacin o v.a. X con media y varianza
2
finitas.
Notemos por ( ) n X la v.a. media muestral (promedio de n v.a.
independientes de esta poblacin). Entonces
( )
n
n X
Z


=
tiene una distribucin que se aproxima a una N(0,1) a medida que n
aumenta.
Este teorema nos permite aproximar la distribucin de ( ) n X por
una curva normal, independientemente de la forma que presente la
poblacin. Una herramienta software muy instructiva sobre el TLC se
encuentra en la siguiente web.
http://www.vias.org/simulations/simusoft_cenlimit.html ).
EJERCICIO 6.2.1. -
Se ha estimado que en una zona industrial se demanda energa
elctrica al da segn una ley de media 10 Mw y desviacin tpica 2.5
Mw.
a) Cul es la distribucin de probabilidad de la demanda de
energa al bimestre? Y la de la demanda media de
energa al da?
b) Cul es la probabilidad de que en un mes se demande
menos de 190 Mw?
c) Qu cantidad es demandada al menos el 20 % de los
meses?
d) Cul es la probabilidad de que durante cada uno de los
doce meses de un ao la demanda en esta zona supere
los 280 Mw?

ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.2 Carlos Mat

3/5
EJERCICIO 6.2.2. -
Se ha estimado que los ficheros que se generan mediante un
sistema informtico requieren una memoria ROM que depende del
tipo de tarea realizada. Se han considerado dos tipos de fichero A y
B. Los A se comportan segn una ley de media 1 MB y desviacin
tpica 0.25 MB, mientras que los de tipo B se rigen segn una ley de
media 50 KB y desviacin tpica 4 KB. Semanalmente un usuario
genera 30 ficheros tipo A y 15 ficheros tipo B.
Se pide:
a) Cul es la distribucin de probabilidad de la memoria absorbida
durante una semana?
b) Cul es la probabilidad de que una semana requiera menos de
28 MB?
c) Qu cantidad de memoria es demandada al menos el 20 % de
los semanas?
d) Cul es la probabilidad de que durante alguna semana de una
quincena la demanda de memoria ROM supere los 35 MB?
Aproximacin Normal a la Distribucin Binomial
El teorema del lmite central implica que la distribucin binomial
con parmetros n y p se puede aproximar por la distribucin normal
de parmetros np y ( ) p np 1 . La razn de esto es que toda v.a.
( ) p n B Y , se puede expresar como
n
X X Y + + = ...
1
donde ( ) p Br X
i
,
para i = 1, ..., n; siendo variables independientes. Este resultado se
conoce como teorema de De Moivre.
Por ejemplo, la figura 6-2-1 muestra las probabilidades de una
B(100,0.4), mediante asterisco, y la funcin de densidad de su
aproximacin normal N(40, 24), en el intervalo [ ] 50 , 30 ; observndose
que se trata de una aproximacin muy apropiada.
Observemos que la v.a. Y es discreta mientras que su
aproximacin es continua. Por tanto, esto supondr:
1) Sustituir la barra de probabilidad de la binomial por el
rea de un rectngulo de base 1. Es decir, sustituir ( ) k Y P = por el
rea bajo un rectngulo de base el intervalo [ ] 0.5 k , 5 . 0 k + y altura
( ) k Y P = .
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.2 Carlos Mat

4/5
2) Aproximar el rea de dicho rectngulo por el rea bajo la
normal correspondiente en el intervalo [ ] 0.5 k , 5 . 0 k + . Es decir,
( ) ( ) 5 . 0 k Y 5 . 0 k P k Y P
*
+ = ,siendo ( ) ) p 1 ( np , np N Y
*
.

3 0 3 5 4 0 4 5 5 0
y
0
0 . 0 2
0 . 0 4
0 . 0 6
0 . 0 8
0 . 1
f ( y )
B ( 1 0 0 ,0 . 4)
v s
N ( 4 0 , 24 )

Figura 6-2-1
Lo anterior se llama correccin por continuidad y se puede
observar en la figura siguiente para el caso del valor 38 en las
condiciones del ejemplo anterior.
3 7 3 7 . 5 3 8 3 8 . 5 3 9 3 9 . 5 4 0 4 0 . 5 4 1 4 1 . 5 4 2
y
0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
f ( y ) , P ( Y = y )
( X 0 . 0 0 1 )
B ( 1 0 0 , 0 . 4 ) v s N ( 4 0 , 2 4 )
Figura 6-2-2
Significa que si ( ) p n B Y , , siendo n 30, ( ) 10 1 > ) ( , p n np min
y p ni muy pequeo ni muy grande, 0.1 < p < 0.9, entonces
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.2 Carlos Mat

5/5
( )

+
=
=


=
) p 1 ( np
np 5 . 0 k
) p 1 ( np
np 5 . 0 k
) p 1 ( np
np 5 . 0 k
) p 1 ( np
np Y
) p 1 ( np
np 5 . 0 k
P k Y P
*

EJERCICIO 6.2.3. -
Sea ( ) 4 . 0 , 100 B Y . Calcular las probabilidades ( ) 50 Y 45 P y
( ) 40 Y P en los siguientes casos:
a) exactamente,
b) sin y con correccin por continuidad.
Comentar los resultados.

Como la distribucin binomial se puede aproximar por la normal
y por la de Poisson, con el siguiente cuadro se delimitan los casos en
que se debe emplear cada aproximacin.

Aproximaciones a la Distribucin B(n,p)

Normal
Si
Poisson
si

n 30
Cualquier otra situacin
Cualquier otra situacin
n 30
10 np
p 0.1 ( p 0.9 analizando
fracasos)
Distribucin a utilizar
N(np, np(1-p)) P(np)
EJERCICIO 6.2.4. -
La empresa EURO2000 ha adquirido 100000 eurocalculadoras
para repartir entre sus clientes. El proveedor ha informado que
trabaja con un nivel de defectuosos de 2 diezmilsimas.
a) Qu distribucin de probabilidad debera considerar dicha
empresa para el n de defectuosos en su pedido?
b) Con qu probabilidad la empresa EURO2000 recibir menos
de 30 defectuosas?


ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

1/12
6.3. Distribuciones Asociadas al Muestreo de
Poblaciones Normales
6.3.1. I ntroduccin. Conceptos Asociados al Muestreo

En trminos generales, se puede afirmar que:

Cualquier aplicacin estadstica se basa en una muestra.

Por ejemplo:
* Para determinar la fiabilidad de un software, dispositivo o
sistema tomaramos datos de duracin de prototipos y de
sistemas lanzados al mercado.
* Para analizar el comportamiento del proceso de fabricacin de
un producto, se procedera a tomar datos sobre variables
(caractersticas) de ese producto.
* Para predecir el comportamiento de una magnitud (demanda
de un producto, tipos de inters, precios de materias primas,
etc.) nos basaramos en el histrico de la misma.

Se entiende por muestra cualquier subconjunto de una
poblacin.
Se llama tamao muestral al n de elementos que forman la
muestra.
La obtencin de muestras es un elemento esencial de la
Inferencia Estadstica.

Se entiende por Inferencia Estadstica al conjunto de mtodos
estadsticos que permiten extraer conclusiones o inferir propiedades
sobre la poblacin o variable aleatoria X objeto de estudio, mediante
la observacin de una muestra o conjunto de datos recogidos sobre
dicha variable aleatoria observable.

En toda aplicacin de los mtodos de inferencia estadstica a la
realidad estarn presentes varios elementos, algunos de los cuales
son los siguientes:
Una v.a. observable X. Si se puede suponer que esta v.a. se rige
por un modelo de probabilidad que es conocido, a excepcin de los
valores concretos que toman los parmetros, estaremos dentro de
la inferencia paramtrica. Cuando no se especifique un modelo
de probabilidad para esta v.a. y simplemente se suponga que es
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

2/12
continua o discreta, nos situaremos dentro de la inferencia no
paramtrica.
Una muestra observada ( )
n
x x x ,..., ,
2 1
de la v.a. observable X,
que utilizaremos para obtener informacin sobre el modelo de
probabilidad por el que se rige dicha variable aleatoria. Esta
muestra estar formada por un conjunto de n datos de la v.a. X,
con lo cual responder a la estructura de una n-tupla
( )
n
x x x ,..., ,
2 1
.
Una muestra aleatoria simple de tamao (m.a.s. de t.) n de
la v.a. X que consiste en n v.a. unidimensionales
n
X X X ,..., ,
2 1

independientes y cada una de ellas gobernada por la misma
distribucin de probabilidad que la v.a. X. Es decir, se tratar de n
v.a. independientes e idnticamente distribuidas (abreviadamente
v.a.i.i.d.) segn la distribucin de probabilidad de la v.a. X. Es
importante tener en cuenta que esta m.a.s. responde al hecho de
que la muestra ( )
n
x x x ,..., ,
2 1
antes de ser observada, ser una
v.a. n-dimensional ( )
n
X X X ,..., ,
2 1
en la que intervienen n v.a.
unidimensionales
n
X X X ,..., ,
2 1
i.i.d. Por tanto, esto supone
considerar una distribucin multidimensional ( )
n
X X X ,..., ,
2 1
en
los problemas de muestreo de una v.a. unidimensional X.

Cuando la poblacin de la cual se muestrea es normal aparecen
unas distribuciones de probabilidad esenciales en la Inferencia
Estadstica: chi-cuadrado, t de Student y F de Snedecor. Se trata de
distribuciones sobre las que luego se apoyan mtodos de tanto calado
prctico para el ingeniero, como el diseo de experimentos (anlisis
de la varianza), o de tanta repercusin en el futuro como el anlisis
multivariante. Adems, la primera de ellas est muy presente en
fiabilidad del software a travs de su relacin con la exponencial y
otra distribucin importante como la gamma.

ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

3/12
6.3.2. Distribucin Chi-Cuadrado
Es la distribucin necesaria para poder informar sobre la
varianza o desviacin tpica de una poblacin normal. Adems, es la
distribucin bsica para desarrollos y aplicaciones posteriores de los
mtodos estadsticos. Se conoce tambin como distribucin ji-
cuadrado de Pearson. Para vislumbrar la importancia de este modelo
basta decir que la distribucin chi-cuadrado es para los mtodos de
inferencia estadstica lo que la normal para la teora de la
probabilidad y de la estadstica.
Formalmente se define de la siguiente forma.
DEFI NI CI ON.-
Sean
n
X X ,...,
1
n v.a. distribuidas N(0,1) e independientes. La
v.a.
2 2
1 n
X X Y + + = ... se dice que sigue una distribucin chi-
cuadrado con n grados de libertad. Se notar Y
2
n
.
Si Y
2
n
, se puede demostrar que su funcin de densidad ser
( )
( )
y
n
n
y
n
n
Y
e y e y y f
2
1
1
2 2
1
1
2
2
2
1
2 1
2 1

= =

) ( con 0 < y <.



Veamos qu tipo de grficas aparecen en la fdp de una
distribucin chi-cuadrado con n grados de libertad. Cuando n vara se
van presentando distintas formas ya que, como muestra la Figura
6.3-1, para n = 1 resulta una densidad decreciente y asinttica con el
eje de ordenadas, para n = 2 una densidad decreciente que
corresponde exactamente a un caso particular de la distribucin
exponencial, mientras que para n = 4 se tiene una distribucin
unimodal, con moda en el interior del rango de la distribucin, de tipo
asimtrica a la derecha. Por esto, n es un parmetro de forma.
Obsrvese que se trata de la primera distribucin estudiada con este
tipo de parmetro.

ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

4/12
0 1 2 3 4 5
x
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
f(x)
Di st. Chi -Cuadrado con
n = 1, 2 y 4
n=2
n=1
n=4

Figura 6.3-1
0 5 10 15 20 25 30 35 40 45 50
x
0
1
f(x)
Di st. Chi -Cuadrado con
n = 10, 20 y 30
n=20
n=30
n=10

Figura 6.3-2

Adems, se demuestra que el valor de mxima probabilidad, la
moda, notado por Mo, se presenta en n - 2, cuando n 2.
Veamos lo que ocurre cuando n vara considerando cada vez un
valor mayor para los grados de libertad. En este caso, la Figura 6.3-2
nos muestra que a medida que aumenta n la distribucin va
perdiendo el carcter asimtrico a la derecha, para ir ganando
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

5/12
simetra y, sobre todo, comportamiento normal. Se trata de una
propiedad que afirma que una distribucin
2
n
, cuando n tiende hacia
infinito, se puede aproximar por una distribucin normal.
Clculo de Probabilidades en la Distribucin Chi-
Cuadrado
Esta distribucin se encuentra tabulada, vase la tabla
adjuntada. En dicha tabla para una v.a. X
2
n
y para cada n, dada
una probabilidad en la cola de la derecha de esta distribucin, se
proporciona el valor de esta distribucin que deja a la derecha esa
probabilidad. Es decir, la tabla da el valor
2

, n
tal que
( ) = >

2
, n
X P . Por ejemplo, 307 18
2
05 0 10
.
. ,
= , lo que indica
que el valor en la distribucin chi-cuadrado con 10 grados de libertad
que deja a la derecha una probabilidad del 5 % ser 18.307.
Adems, se puede consultar la siguiente web
http://www.statsoft.com/textbook/sttable.html. La siguiente tabla es
de http://www.geocities.com/Heartland/Hills/3224/statistics.html.

EJERCICIO 6.3.2.-

Obtener un intervalo en una chi-cuadrado con 14 grados de
libertad que recoja una probabilidad de un 95 %.
Media y Varianza de la Distribucin Chi-Cuadrado.
Se demuestra que la media y la varianza de una v.a. X
2
n
son
( ) n X E
X
= = y ( ) n X V
X
2
2
= = .
Si n 30 se aproxima una
2
n
por una distribucin N(n, 2n). No
obstante, hay otras aproximaciones mejores como puede verse en
Sarabia y Mat (1993).

ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

6/12

6.3.3. Distribucin t de Student
Es la distribucin necesaria para poder informar sobre la media
de una poblacin normal. Por ello, es una distribucin bsica para
desarrollos y aplicaciones posteriores de los mtodos estadsticos.
Fue descubierta por Gosset, en 1904, al estudiar la problemtica
del contenido de cebada en la cerveza.
Formalmente se define de la siguiente forma.



ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

7/12
DEFI NI CI ON.-
Sean dos variables aleatorias ) , ( 1 0 N X e
2
n
Y ,
independientes. La v.a.
n
Y
X
T = se dice que sigue una distribucin
t de Student con n grados de libertad. La notacin a emplear ser
n
t T .
Si
n
t T , se puede demostrar que su funcin de densidad ser
( ) ( )
( )
2
) 1 n (
2
T
n
t
1
2 1
2 1 n
n
1
) t ( f
+

= con - < t < .



EJERCICIO 6.3.3.-
Razonar intuitivamente con la ayuda de grficos el
comportamiento de la distribucin de la v. a. cociente de una N(0, 1)
y raz cuadrada del cociente de una chi-cuadrado con 4 grados de
libertad entre 4. Programar en MATLAB la simulacin de 100 valores
de esa v. a.

Veamos qu tipo de grficas aparecen en la fdp de una
distribucin t de Student con n grados de libertad. Cuando n vara se
van presentando distintas densidades en forma acampanada, como
muestra la Figura 6.3-3, donde en todas ellas la moda es el valor 0.
A medida que n vara slo se modifica la escala. Por esto, n es un
parmetro de escala.
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

8/12
- 6 - 5 - 4 - 3 - 2 - 1 0 1 2 3 4 5 6
0
0 . 0 5
0 . 1
0 . 1 5
0 . 2
0 . 2 5
0 . 3
0 . 3 5
0 . 4
D E N S I D A D E S D E S T U D E N T
n = 1 , 2 y 5
Figura 6.3-3

- 5 - 4 - 3 - 2 - 1 0 1 2 3 4 5
0
0 . 0 5
0 . 1
0 . 1 5
0 . 2
0 . 2 5
0 . 3
0 . 3 5
0 . 4
0 . 4 5
D E N S I D A D E S
S T U D E N T n = 1 0 v s N ( 0 , 1 )


N ( 0 , 1 )

Figura 6.3-4

Veamos lo que ocurre cuando n vara considerando cada vez un
valor mayor para los grados de libertad. En este caso, la Figura 6.6-4
nos muestra que a medida que aumenta n la distribucin va ganando
acampanamiento y, sobre todo, comportamiento como el de la
normal estndar. Se trata de una propiedad que afirma que una
distribucin
n
t , cuando n tiende hacia infinito, se puede aproximar
por una distribucin normal estndar.
Clculo de Probabilidades en la Distribucin t de Student
Se realiza mediante la tabla adjuntada. En dicha tabla para una
v.a.
n
t T y para cada n, dada una probabilidad en la cola de la
derecha de esta distribucin, se proporciona el valor de esta
distribucin que deja a la derecha dicha probabilidad. Es decir, la
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

9/12
tabla da el valor
, n
t tal que ( ) = >
, n
t T P . Por ejemplo,
812 1
05 0 10
. t =
. ,
, lo que indica que el valor en la distribucin t de
Student con 10 grados de libertad que deja a la derecha una
probabilidad del 5 % ser 1.812.
http://www.geocities.com/Heartland/Hills/3224/statistics.html.
muestra la siguiente tabla.



EJERCICIO 6.3.4.-

Obtener un intervalo simtrico respecto al origen en una t de
Student con 14 grados de libertad que recoja un 95 % de
probabilidad. Compararlo con el correspondiente intervalo del 95 %
en la N(0,1).

ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

10/12
Media y Varianza de la Distribucin t de Student
Se demuestra que la media y la varianza de una v.a.
n
t T son
( ) 0 = = T E
T
y ( ) . , 2
2
2
>

= = n
n
n
T V
T

6.3.4. Distribucin F de Snedecor
Surgi al plantearse el problema de estimar el cociente de
varianzas de poblaciones normales y despus se extendi su uso al
conjunto de tcnicas denominadas Anlisis de la Varianza.
Se obtiene a partir del cociente de distribuciones chi-cuadrado
independientes que se encuentran divididas por sus grados de
libertad. En concreto, se tiene lo siguiente.
DEFINICION.- Sean dos v.a. X
2
m
e Y
2
n
, independientes. La
v.a.
n
Y
m
X
F = se dice que sigue una distribucin F de Snedecor
con m y n grados de libertad. La notacin a emplear ser F
F(m,n).

Veamos qu tipo de grficas aparecen en la fdp de una
distribucin F de Snedecor con m y n grados de libertad. Las Figuras
6.3-5 y 6.3-6 nos muestran el comportamiento de esta densidad.
A efectos de las aplicaciones se maneja el valor ( ) n m F ,

tal que
( ) ( ) = >

n m F F P , ,
obtenindose del ordenador o de tablas. Estas se han construido
con = 0.1, 0.05 y 0.01. Vese la tabla adjunta.
Adems, se verifica que
( )
( ) m n F
n m F
,
1
,
1

=
lo que permite extender las tablas anteriores para = 0.9, 0.95
y 0.99.

ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

11/12
0 1 2 3 4
0
0 . 2
0 . 4
0 . 6
0 . 8
D E N S I D A D E S D E S N E D E C O R
F ( 5 , 5 ) y F ( 5 , 3 0 )
F ( 5 , 3 0 )

Figura 6.3-5
0 0.5 1 1.5 2 2.5 3 3.5 4
0
0.2
0.4
0.6
0.8
DENSIDADES DE SNEDECOR
F(5,5) y F(10,10)
F(10,10)

Figura 6.3-6
Adicionalmente, se pueden consultar tablas en Internet. Por
ejemplo, la web http://www.statsoft.com/textbook/sttable.html.

Unas tablas muy completas e interesantes se encuentran en

http://www.sjsu.edu/faculty/gerstman/StatPrimer/F-table.pdf



ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




6.3 Carlos Mat

12/12
EJERCICIO 6.3.6.-

Obtener un intervalo de colas iguales en una F de Snedecor con
4 y 9 grados de libertad que recoja un 90 % de probabilidad. Idem
para una F con 9 y 4 grados de libertad. Repetir el ejercicio para un
95 % de probabilidad.
Media y Varianza de la Distribucin F de Snedecor
Se demuestra que la media y la varianza de una v.a. F F(m,n)
son
( ) 2
2
>

= = n
n
n
F E
F
,
( ) . ,
) ( ) (
) (
4
4 2
2 2
2
2
2
>

+
= = n
n n m
n m n
F V
F


Adicionalmente, se puede consultar
http://www.informatica.us.es/~calvo/tablas_estadisticas.html
http://www.uam.es/personal_pdi/economicas/rociomar/tablas-probabilidad.pdf
http://www.elsevier.com/wps/find/bookdescription.cws_home/706358/description#des
cription

ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




Material Comp. Tema 6 Carlos Mat

1/6
MATERIAL COMPLEMENTARIO
TEMA 6
6.1.- En las siguientes preguntas hay cuatro posibles respuestas,
razonar aquella respuesta nica que se considere correcta.
1.- Cuando se relacionan varias variables es habitual proporcionar las
medidas de relacin entre ellas a travs de la llamada matriz de
varianzas-covarianzas, cuyo elemento (i,j) recoge la covarianza entre
las variables
j i
X y X , ) X , X ( Cov
j i
. Para tres variables X, Y y Z se
proporciona la matriz de covarianzas
X Y Z

=
36 0 6
0 16 8 . 1
6 8 . 1 25
Z
Y
X

Entonces
A) Se verifica que si la variable U = X+Y, entonces V(U) =
41.
B) Se verifica que si la variable W = Z - Y, entonces V(W) =
20.
C) Se verifica que si la variable H = X+Y+Z, no disponemos
de informacin suficiente para calcular la varianza de H.
D) Ninguna de las afirmaciones anteriores es verdadera.
2.- En un hipermercado virtual la compra de una persona con
tarjeta SISA, en euros, sigue una ley normal de media 20 y
desviacin tpica 6, mientras que la compra de una persona con
tarjeta RED, en euros, sigue una ley normal de media 40 y desviacin
tpica 4. Si en una hora 10 personas pagan con SISA y 20 lo hacen
con RED, los ingresos en dicha hora se distribuirn segn una ley
normal
A) De media 1000 y varianza 10 36 20 16
2 2
+ = 10000.
B) De media 1000 y varianza 680.
C) De media 1000 y varianza 140
2
.
D) De parmetros diferentes a los expresados en los otros
apartados.
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




Material Comp. Tema 6 Carlos Mat

2/6
3.- El teorema del lmite central
A) Establece la distribucin de una suma de v.a. con la
nica condicin de que el nmero de sumandos sea
elevado.
B) Dicha distribucin lmite depende del problema
analizado pero siempre ser simtrica, ya que
hablamos de lmite central, aunque puede no ser
normal.
C) Tiene como un caso particular la aproximacin de la
distribucin binomial por la distribucin de Poisson.
D) No verifica ninguna de las afirmaciones anteriores.
4.- Sea una v.a. X cualesquiera y sean X X
n 1
,..., n v.a. independientes
y con la misma distribucin de probabilidad que X, con n > 30.
Entonces
A) 95 . 0 96 . 1
X
96 . 1 P

<


< .
B) 05 . 0 96 . 1
X
P =

>


, si ( )
2
, N X .
C) 975 . 0 96 . 1
n
X
P

<


.
D) Al menos dos de las tres afirmaciones anteriores son
verdaderas.
5.- La distribucin chi-cuadrado con n grados de libertad verifica
A) Estar definida por el cuadrado de la suma de n
variables N(0,1) independientes.
B) No tener varianza para algunos valores de los grados
de libertad.
C) Tener una distribucin asimtrica a la derecha que se
hace cada vez ms simtrica al crecer n.
D) Al menos dos de las tres afirmaciones anteriores son
ciertas.
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




Material Comp. Tema 6 Carlos Mat

3/6
6.- La distribucin t de Student con n grados de libertad verifica
A) ( ) ( ) 2 Z 2 P 2 t 2 P
n
> con Z N(0,1).
B) Estar definida por el cociente entre una N(0,1) y una
chi-cuadrado con n grados de libertad, siendo ambas
independientes.
C) Tener una distribucin simtrica respecto al origen.
D) Al menos dos de las tres afirmaciones anteriores son
ciertas.
7.- La distribucin F de Snedecor con m y n grados de libertad
A) Se utiliza mucho en el anlisis de la varianza, ya que en
esa tcnica es frecuente el establecer el cociente de
sumas de cuadrados procedentes de una poblacin
normal.
B) Verifica que si ( ) n m F ,

designa al valor en dicha


distribucin que deja a la derecha probabilidad ,
entonces ( ) ( ) m n F n m F , ,
1 1
= .
C) Viene definida como el cociente de dos distribuciones
chi-cuadrado independientes.
D) Satisface al menos dos de las afirmaciones anteriores.

6.2.- Se sabe que el tiempo de funcionamiento hasta el fallo de unas
componentes sigue una ley normal con media 1600 horas y una
desviacin tpica de 400 horas. Se pide:
a) Con qu probabilidad la media muestral es mayor que
1500 horas a partir de una muestra aleatoria de 16
componentes?
b) Qu valor es superado por la media muestral de 16
componentes con probabilidad 0.2?
6.3.- Un taller de reparacin de vehculos emplea en cada reparacin
un tiempo, en horas, tal que la duracin media de las reparaciones es
de 4 horas y la desviacin tpica es de 1.225 horas. Adems, el taller
factura cada hora a 24 . Calcular razonadamente la probabilidad de
que la recaudacin por la reparacin de 40 vehculos sea superior a
3600 .
6.4.- Una central nuclear dispone de 40 dispositivos similares. Los
registros del departamento de mantenimiento indican que en
cualquier semana dada hay una probabilidad de 0.25 para que falle
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




Material Comp. Tema 6 Carlos Mat

4/6
uno de ellos. Utilizando la aproximacin con correccin por
continuidad
a) Cul es la probabilidad de que se averien durante una
semana menos de 12 dispositivos?
b) Con qu probabilidad ms de 6 dispositivos fallarn
durante una semana?
6.5.- En un proceso de fabricacin se sabe que el nmero de
unidades defectuosas producidas diariamente es una v.a. que se rige
por una Poisson de parmetro 10. Determinar la probabilidad con que
en un periodo de 100 das laborables el nmero de unidades
defectuosas supera el millar.
6.6.- El Departamento de Recursos Humanos de la Multinacional
COMPUSYS Inc. ha determinado que el salario anual, en $, de sus
empleados en todo el mundo sigue una ley normal con desviacin
tpica = 6000 $. Se han seleccionado aleatoriamente 25 empleados,
se pide:
a) Con qu probabilidad la media muestral superar a la
media poblacional en ms de 2000 $?
b) Qu valor ser superado por la desviacin tpica muestral
con una probabilidad de 0.10?
c) Con qu probabilidad la varianza muestral ser inferior a
la mitad de la varianza poblacional?
Nota.- La distribucin de la varianza muestral en muestras de
poblaciones normales fue descubierta por Fisher. En concreto, se
verifica que
( )
2
1
2
2
1

n
X
S n
.
6.7.- Utilizando las tablas, dar respuesta a los siguientes apartados
incluyendo la interpretacin y representacin grfica
correspondiente:
a) Con qu probabilidad una distribucin t de Student con 5
grados de libertad supera el valor 2.5? Y se encuentra
entre -2 y +2?
b) Qu valor es superado por una distribucin t de Student
con 7 grados de libertad con una probabilidad de 0.10?
c) Qu valor es superado por una distribucin F de
Snedecor con 8 y 7 grados de libertad con una
probabilidad de 0.10? Y con una probabilidad de 0.05?
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




Material Comp. Tema 6 Carlos Mat

5/6
d) Qu valor es superado por una distribucin F de
Snedecor con 6 y 14 grados de libertad con una
probabilidad de 0.90? Y con una probabilidad de 0.95?

6.8.- Una distribucin que a veces resulta interesante en algunas
aplicaciones es la distribucin de Pareto de parmetros k y a, con k >
0 y a un n real, cuya fdp es
a x ,
x
ka
) x ( f
1 k
k
=
+
;
notndose para la v.a. correspondiente ( ) a , k Pa X .
Se pide:
A) Demostrar que efectivamente es una distribucin de
probabilidad. Representarla grficamente y analizar el papel
de los parmetros. Comentar las caractersticas de este
modelo de probabilidad.
B) Calcular la media y la varianza.
C) En una cntrica tienda de CDs de una gran ciudad la
cantidad de dinero que se deja cada cliente en la caja se
distribuye, en euros, segn una ley de Pareto con
parmetros k = 2 y a = 5. Obtener razonadamente el
porcentaje de das en que la recaudacin correspondiente al
desembolso de 100 clientes ser superior a 1000 .
6.9.- Un ingeniero est digitalizando imgenes y piensa, por sus
conversaciones con un compaero experto en Estadstica, que la
distribucin de probabilidad para la variable X: tamao del fichero
correspondiente, en megabytes, se puede representar por
x 2
xe ) ; x ( f

= , con 0 < x , > 0.

Se pide:
a) Demostrar que efectivamente es una distribucin de
probabilidad. Representarla grficamente y analizar el papel del
parmetro. Comentar las caractersticas de este modelo de
probabilidad.
b) Calcular la media y la varianza.
c) Este ingeniero se enfrenta a una tarea consistente en digitalizar
200 imgenes y considera apropiado el modelo del apartado
anterior asignando al parmetro el valor = 2. Indicar la
ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




Material Comp. Tema 6 Carlos Mat

6/6
expresin de la variable aleatoria a considerar para estudiar el
tamao total de estas 200 imgenes. Con qu probabilidad
podr realizar esta tarea si su disco duro tiene actualmente una
capacidad de 215 megabytes? Debera pedir una ampliacin de
memoria? Razonar las respuestas.

6.10.- Se construye un eje cilndrico, para actuar como rotor en una
mquina elctrica, uniendo tres secciones. Posteriormente, para el
acabado de la pieza, se corta una seccin del mismo y se separa de
tal manera que la pieza final no incluye este trozo.
Admitiendo que las longitudes de las cuatro secciones se
distribuyen, en cm, segn normales N(1.6; 0.02), N(2.4; 0.25),
N(2.3; 0.05) y N(1; 0.01), respectivamente, donde el segundo
parmetro representa la varianza. Se pide:
a) Cmo se distribuye la variable aleatoria X longitud total
del eje?
b) Qu proporcin de ejes tienen su longitud en 5,3 0,01
cm? Responder razonadamente.
c) Entre qu valores simtricos respecto a la media se
encuentra la longitud del 80 % de los ejes?

ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008




Solucin Material Comp. Tema 6 Carlos Mat

1/1
SOLUCIONES A CUESTIONES Y ALGUNOS PROBLEMAS
DEL MATERIAL COMPLEMENTARIO DEL
TEMA 6
6.1.-
1.- D). 2.- B). 3.- D). 4.- C). 5.- C).
6.- C). 7.- A).
6.2.-
a) 0.8414.
b) 1684.16 horas.
6.3.- 0.9015.

6.4.-
a) 0.7081.
b) 0.8994.

6.5.- 0.5.

6.6.-
a) 0.0478.
b) 7058.64.
c) 0.02.
6.7.-
a) 0.0272. 0.8906.
b) 1.4152.
c) 2.7516. 3.7257.
d) 0.3471. 0.2528.

6.8.-
b) ( ) a
1 k
k
X E

= , para k > 1. ( )
( )( )
2
2
a
1 k 2 k
k
X V

= , para k > 2.
c) 0.5.

6.9.-
b) ( )

=
2
X E , ( )
2
2
X V

= .
c) 0.9332. Para evitar prximamente problemas de capacidad
debera pedir ya una ampliacin de memoria.

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/15
TEMA 7
INFERENCIA ESTADISTICA. ESTIMACION
PUNTUAL Y POR INTERVALO DE
CONFIANZA

7.1. Conceptos Generales en la Inferencia Estadstica.
Se denomina Inferencia Estadstica al conjunto de mtodos
estadsticos que permiten extraer conclusiones o inferir propiedades
sobre la poblacin o variable aleatoria X objeto de estudio, mediante
la observacin de una muestra o conjunto de datos recogidos sobre
dicha variable aleatoria observable.
Por ejemplo, esta parte de la Estadstica se emplear cuando
queramos sacar conclusiones de carcter general sobre varios
proveedores de acceso a Internet mediante datos obtenidos en una
serie de conexiones. Tambin nos permitir decidir si varias medidas
que hemos tomado al calibrar un aparato se pueden considerar
procedentes de una poblacin de medidas normal.
En toda aplicacin de los mtodos de inferencia estadstica a la
realidad estarn presentes los siguientes elementos:
Una v.a. observable X. Si se puede suponer que esta v.a. se
rige por un modelo de probabilidad que es conocido, a
excepcin de los valores concretos que toman los parmetros,
estaremos dentro de la inferencia paramtrica. Cuando no
se especifique un modelo de probabilidad para esta v.a. y
simplemente se suponga que es continua o discreta, nos
situaremos dentro de la inferencia no paramtrica.
Una muestra observada ( )
n 2 1
x ,..., x , x de la v.a. observable
X, que utilizaremos para obtener informacin sobre el modelo
de probabilidad por el que se rige dicha variable aleatoria. Esta
muestra estar formada por un conjunto de n datos de la v.a.
X, con lo cual responder a la estructura de una n-tupla
( )
n 2 1
x ,..., x , x .
Una muestra aleatoria simple de tamao (m.a.s. de t.) n
de la v.a. X que consiste n v.a. unidimensionales X X X
n 1 2
, ,...,
independientes y cada una de ellas gobernada por la misma
distribucin de probabilidad que la v.a. X. Es decir, se tratar
de n v.a. independientes e idnticamente distribuidas
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/15
(abreviadamente v.a.i.i.d.) segn la distribucin de
probabilidad de la v.a. X. Es importante tener en cuenta que
esta m.a.s. responde al hecho de que la muestra ( ) x x x
n 1 2
, ,..., ,
antes de ser observada, ser una v.a. n-dimensional
( )
n 2 1
X ,..., X , X en la que intervienen n v.a. unidimensionales
n 2 1
X ,..., X , X i.i.d. Por tanto, esto supone considerar una
distribucin multidimensional ( )
n 2 1
X ,..., X , X en los problemas
de muestreo de una v.a. unidimensional X.
Una funcin T de la m.a.s. de t. n de la v.a. X,
( )
n 2 1
X ,..., X , X T T = , denominada estadstico. Cuando esta
funcin se utiliza para estimar un parmetro se llama
estimador. Obsrvese que todo estadstico o estimador es
una v.a. por ser funcin de la muestra aleatoria simple. Por
ejemplo, en las inferencias sobre la media de una poblacin se
utiliza el estadstico media muestral

( )
n
X
X ,..., X , X T X
n
1 i
i
n 2 1

=
= = .
La distribucin de probabilidad del estadstico T, llamada
distribucin en el muestreo o distribucin muestral del
estadstico al indicar cmo se distribuyen los valores de T
segn las diferentes muestras que se puedan obtener. Por
ejemplo, si X N(,
2
), entonces
|
|

\
|


n
, N X
2
. Cuando la
distribucin en el muestreo del estadstico es difcil de obtener
se suele utilizar su distribucin asinttica o la distribucin de
una funcin del estadstico.

En la inferencia paramtrica se supone que la v.a. observable X
se rige por un modelo de probabilidad que es conocido en parte. Por
ejemplo, se sabe que la longitud de unas barras de acero sigue una
ley normal, pero se desconocen los parmetros y
2
de la misma. A
efectos de informar sobre los parmetros desconocidos de la v.a. X,
que designamos por , se utilizarn los elementos anteriores. Si
mediante la muestra observada ( )
n 2 1
x ,..., x , x se asigna un valor
numrico a , se dir que se ha empleado el mtodo denominado
estimacin puntual. Por otra parte, se puede emplear la muestra
para inferir un conjunto de valores plausibles para , mtodo
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/15
denominado estimacin por intervalo de confianza, mediante la
construccin de un intervalo o rango de valores que razonablemente
contenga al valor desconocido de . Adems, se podra utilizar la
muestra para aceptar o descartar valores para , mediante los
denominados contrastes de hiptesis.
Dentro de los mtodos de inferencia no paramtrica, entre los
cuales se incluyen aquellos destinados a realizar inferencias sobre
caractersticas de la muestra, destacan por su importancia los
siguientes:

Contrastes de aleatoriedad o independencia (randomness
tests). Sirven para decidir si una muestra se ha obtenido de forma
aleatoria o, dicho de otra forma, las observaciones se han extrado
de forma independiente unas de otras. Resultan fundamentales en
las aplicaciones, al basarse la mayora de los mtodos paramtricos
en que la muestra observada se puede considerar aleatoria.
Contrastes de bondad del ajuste (goodness of fit tests).
Permiten decidir si un modelo de probabilidad es adecuado o se
ajusta a un conjunto de datos. Pueden ser grficos, la decisin se
toma mediante un grfico que compara los datos o una funcin de
ellos con el modelo a ajustar. O analticos, la decisin se toma a
partir de una medida de discrepancia entre lo emprico y el modelo
terico que se pretende ajustar.

La clasificacin anterior de los mtodos de inferencia estadstica
se puede resumir en el siguiente esquema.

confianza de intervalo










Por
Puntual
Estimacin
Hiptesis de Contrastes
a Paramtric
ad Aleatoried de Contrastes
Ajuste del Bondad de Contrastes
a Paramtric No
a Estadstic Inferencia

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/15
7.2. Estimacin Puntual
Se puede realizar a travs de varios mtodos entre los que
destacan el mtodo de analoga, con el mtodo de los momentos
como caso particular, y el mtodo de mxima verosimilitud.
A partir de una muestra observada ( )
n 2 1
x ,..., x , x de la v.a.
observable X, que se rige por un modelo de probabilidad en el que
interviene un parmetro , se llama estimacin puntual del
parmetro a una funcin de ( )
n 2 1
x ,..., x , x , lo que ser indicado por
( )
n 2 1
*
x ,..., x , x = , cuya misin es asignar un valor concreto al
parmetro segn los datos observados.
Si el procedimiento anterior se desarrolla para una m.a.s. de t. n
de la v.a. X aparecer una funcin de ( )
n 2 1
X ,..., X , X , indicada por
( )
n 2 1
X ,..., X , X

= , que nos proporcionar las operaciones a realizar


con la m.a.s. para estimar el parmetro y que se llamar
estimador.
EJEMPLO 7.1. ESTIMADOR Y ESTIMACION DEL PARAMETRO
DE UNA POISSON
Se sabe que el nmero de vehculos que llegan a una gasolinera
durante 5 minutos, v.a. X, se distribuye segn una ley de Poisson de
parmetro . A partir de una muestra observada ( )
n 2 1
x ,..., x , x de la
v.a. observable X se ha obtenido que la estimacin de este parmetro
viene dada por

n
x
*
n
1 i
i
=
= .

a) Cul ser el estimador del parmetro ? Qu informacin
nos proporciona? Qu distribucin de probabilidad aproximada
tendr si n 30?
b) Durante 10 periodos de 5 minutos se han contabilizado 3, 7,
5, 6, 5, 5, 9, 12, 4 y 8 vehculos, cul ser la estimacin a
proporcionar para ?
------------------------------------
a) El estimador del parmetro ser
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/15
( )
n
i
X
X ,..., X , X

n
1 i
n 2 1

= =
=
.
Nos proporciona la informacin sobre la manera de calcular la
estimacin de este parmetro, consistente en este caso en promediar
la muestra. Adems, como se trata de una media muestral seguir
una distribucin de probabilidad aproximadamente normal de media
la de X, i.e., , y varianza la de X dividida por n, i.e., /n. Por tanto,
|

\
|

=
=
n
, N
n
i
X

n
1 i
.
b) Utilizando la informacin del enunciado, la estimacin que
debemos dar para es
4 . 6
10
8 4 12 9 5 5 6 5 7 3
n
x
*
n
1 i
i
=
+ + + + + + + + +
= =

=
vehc./5minutos.
As, 28 . 1 * = vehc./minuto.

7.2.1. Mtodo de Analoga. Mtodo de los Momentos.
Las estimaciones por el mtodo de analoga se obtienen a partir
de establecer unas caractersticas de analoga en la poblacin y en la
muestra cuya igualdad proporcionar las estimaciones. Un ejemplo se
puede consultar en el epgrafe 9.4 (pg. 492-493) de Mat (1995).

7.2.2. Mtodo de Mxima Verosimilitud.
Su idea bsica consiste en admitir que la ley de probabilidad
que gobierna a una v.a X (poblacin base) es aquella que dara
mxima densidad (resp. probabilidad) a la muestra observada, si X es
absolutamente continua (resp. discreta). Para ampliar conocimientos
sobre este mtodo se puede consultar Montgomery and Runger
(2002) o bien el epgrafe 9.1 de Mat (1995). Estimadores para los
modelos ms utilizados se pueden consultar en el epgrafe 9.4 (pg.
492-493) de Mat (1995).
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/15
EJEMPLO 7.2.- ESTIMADOR Y ESTIMACION DEL
PARAMETRO DE UNA EXPONENCIAL
POR MAXIMA VEROSIMILITUD
Se sabe que un determinado tipo de componentes electrnicas
empleadas en la fabricacin de ordenadores tienen un tiempo hasta el
fallo, en miles de horas, v.a. X, distribuido E(). Se puede demostrar
que la estimacin de mxima verosimilitud (emv) viene dada por

=
=
n
i
i
x
n
1
*
Si con 10 componentes se ha registrado un funcionamiento
total de 4000 horas, cul ser la emv de ?
------------------------------------
Utilizando la informacin dada, la emv para ser
5 . 2
4
10 n
*
n
1 i
i
x
= = =

=
fallos/miles de horas = 0.0025 fallos/hora.
7.3. Los Intervalos de Confianza. Elementos
Necesarios en su Construccin
Los intervalos de confianza constituyen el enfoque ms simple y
directo del problema de estimacin. Su objetivo es dar un intervalo
para el parmetro en el cual tengamos una determinada confianza
expresada en porcentaje.
Los pasos a dar para construir un intervalo de confianza asociado
a un parmetro son los siguientes.
1. Considerar una m.a.s. de t. n de la variable X.
2. Indicar el estadstico funcin de la m.a.s. de t. n que se
emplear (la operacin en la muestra que hace el mismo
papel que el parmetro en la poblacin. Por ejemplo, para
la media poblacional sera la media muestral. Para el
cociente de varianzas poblacionales, el cociente de
varianzas muestrales).
3. Transformar ese estadstico en un estadstico cuya
distribucin de probabilidad sea perfectamente conocida
(no dependa de parmetros desconocidos) y tal que en la
expresin del estadstico intervenga el parmetro a
estimar. En el caso de la media de una poblacin normal
con varianza desconocida el estadstico X se transforma
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/15
en el estadstico
( )
X
S
X
n

| |

|
\
cuya ley de probabilidad es
una t de Student con n 1 grados de libertad (una ley
perfectamente conocida en la que no intervienen
parmetros desconocidos). Es decir,

1


n
X
t
n
S
X

4. Determinar un intervalo en el que se encuentre el
estadstico con una determinada probabilidad 1 - . En
nuestro caso
=
(
(
(
(




1
2 1 2 1 / , / , n
X
n
t
n
S
X
t P
5. Deducir de ese intervalo un intervalo que contenga al
parmetro desconocido con una determinada probabilidad.
En nuestro caso

=
(

+

1
2 1 2 1
n
S
t X
n
S
t X P
X
n
X
n / , / ,

6. Aplicarlo a unos datos concretos y a un nivel de confianza
1 - concreto. Se sabe que una cota clave de unas piezas
que estamos fabricando es una v.a. designada por X y
medida en mm. Actualmente se est trabajando sobre la
hiptesis de que X sigue una ley normal de media y
varianza desconocidas. Para llevar a cabo inferencias sobre
ambos parmetros se va a tomar una muestra de 10
piezas. Qu intervalo resultar al 95 % de confianza si los
datos que finalmente se obtuvieron fueron 250.1, 250.4,
249.6, 249.7, 250.8, 249.3, 250.4, 249.5, 251 y 249.2?
Resulta que 10, 250 , 0.632456
X
n x mm s mm = = = . Si ahora
consideramos 1 - = 0.95, entonces
9,0.025
2.262 t = y el
intervalo que buscamos es 250 0.452433 mm . Se dice que
este intervalo se ha construido con una confianza del 95
%, lo que significa que si repitiramos el proceso con 100
muestras distintas obtendramos 100 intervalos y 95 de
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/15
ellos contendran al verdadero valor de la media
poblacional desconocida.

Cules son los elementos crticos de un intervalo de confianza?
Por un lado, el nivel de confianza y por otro su longitud. Cuanto
menor sea la longitud de un intervalo de confianza mayor ser la
precisin del mismo. Sin embargo, nivel de confianza y precisin
estn relacionados de forma inversa. A mayor nivel de confianza,
mayor longitud y, por tanto, menor precisin. Una pauta habitual es
fijar un nivel de confianza y una determinada precisin y deducir el
tamao muestral correspondiente.

Recapitulando, la metodologa anterior de los 6 pasos es la que
se aplica para obtener todos los intervalos que figuran en el epgrafe
7.4 y, en particular, la tabla resumen de intervalos de confianza
asociados a parmetros de poblaciones normales del epgrafe 7.4.4.,
cuando se dispone de unos datos.

A continuacin se expone la forma general de proceder, que
puede considerarse una ampliacin de lo explicado.


PROCEDIMIENTO GENERAL (Ampliacin)

Dada una variable aleatoria X cuya funcin de densidad es f(x/)
y una muestra aleatoria simple de tamao n cuya funcin de
densidad es
( ) ( ) ( ) f x x x f x
n X i
i
n
1 2
1
, ,..., =
=


se trata de obtener dos estadsticos H
1
(x
1
,x
2
, ,x
n
) y H
2
(x
1
,x
2
, ,x
n
)
tales que
P{H
1
(X
1
,X
2
, ,X
n
) H
2
(X
1
,X
2
, ,X
n
); } 1 - , 0 < < 1
donde la probabilidad es calculada a partir de ( ) ( )
1 2
, ,...,
n
f x x x y es
un nmero prefijado.

El intervalo [H
1
(x
1
,x
2
, , x
n
), H
2
(x
1
,x
2
, , x
n
)] obtenido a partir
de una muestra particular (x
1
,x
2
, ,x
n
), se dice que es el intervalo
concreto de confianza para y la cantidad 1 - recibe el nombre de
coeficiente de confianza. Ambos conceptos han sido aclarados en
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/15
ejercicios anteriores, pero se seguirn considerando en el prximo
desarrollo.

Para construir el intervalo de confianza para el parmetro que
toma sus valores en el intervalo [a, b], consideraremos un estadstico
* cuya funcin de densidad supondremos conocida e igual a g(*,)
y tal que su campo de variacin es toda la recta real.

Se trata de determinar dos valores h
1
y h
2
que, en general,
sern funciones de y de dos parmetros, p
1
y p
2
, respectivamente,
tales que
P{*< h
1
} = p
1
, P{ h
2
< *} = p
2

de manera que

P{h
1
* h
2
} = 1 - p
1
- p
2
= 1 - =

) ( h
) (
2
1
*)d , g(


h

No hemos expresado h
1
y h
2
como funciones respectivas de p
1
y
p
2
ya que, en la prctica, p
1
y p
2
suelen tomarse iguales a .
2


La zona comprendida entre las curvas
* = h
1
(,p
1
) y * = h
2
(,p
2
)
representadas en la Figura 6 - 1 recibe el nombre de banda de
confianza, en el sentido de que, para un valor de dado, el
estadstico * tomar, con probabilidad 1 - , un valor situado dentro
del segmento vertical comprendido entre las dos curvas
correspondiente a dicho valor de .
En la prctica no conocemos el verdadero valor de , por lo que
tenemos que aceptar la posibilidad de que su verdadero valor est
comprendido en un intervalo admisible. Por el contrario, y para una
muestra dada, conocemos el valor del estadstico *, digamos
0
*. La
recta * =
0
* cortar a las curvas h
1
y h
2
en los puntos (
2
,
0
*) y
(
1
,
0
*), respectivamente, supuesto el carcter continuo y
estrictamente montono de las mismas, o lo que es igual, supuesto
que las funciones h
1
y h
2
admiten funcin inversa es decir,

2
= h
2
-1
(
0
*),
1
= h
1
-1
(
0
*),
de manera que
(1) P{h
1
(
0
) * h
2
(
0
)} = P{h
2
-1
(
0
*) h
1
-1
(
0
*)} = 1 -

As, si
0
es el verdadero valor del parmetro, el intervalo
1
-
2

contendr a
0
siempre que el estadstico * tome sus valores en el
intervalo [*
1,0
; *
2,0
] lo que ocurrir con probabilidad 1 - . Esto
significa que, a la larga, sobre un elevado nmero de experiencias en
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/15
las que a partir de una muestra se calcule el valor del estadstico *
y, a partir de l y por medio del esquema indicado antes el intervalo
[
2
,
1
]; ste contendr al verdadero valor del parmetro en una
proporcin de veces dada por 1 - .
El intervalo definido por el primer miembro de (1) recibe el
nombre de intervalo aleatorio de confianza y en relacin a l es
cuando tiene sentido hablar de la probabilidad 1 - de contener al
verdadero valor del parmetro, ya que para una muestra dada el
intervalo concreto que resulte contendr o no al verdadero valor del
parmetro pero, en virtud de la probabilidad 1 - de contenerlo que
tiene el intervalo aleatorio, diremos que tenemos una confianza de
100 (1 - ) % de que ese intervalo concreto contenga el verdadero
valor del parmetro.



=h1( ,p1)

=h2( ,p2)

0
0

2,0

1,0
2
1




Figura 7-1

De lo anterior se deduce que para construir el intervalo de
confianza para un parmetro que toma sus valores en el intervalo
[a,b], son necesarios los siguientes elementos:
Un estadstico * cuya distribucin de probabilidad sea
conocida y en cuya expresin intervenga el parmetro .
Un nivel de confianza 1 - .
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
11/15


Veamos a continuacin algunos casos sencillos.

7.4. Intervalos de Confianza para los Parmetros
de Poblaciones Normales
En lo que sigue, supondremos que estamos considerando una
poblacin o v.a. ( )
2
, N X de manera que se dispondr de n
variables aleatorias
n
X X X ,..., ,
2 1
independientes y con la misma
distribucin de probabilidad que X. Es decir, supondremos que
n
X X X ,..., ,
2 1
constituyen una m.a.s. de t. n de ( )
2
, N X .
Posteriormente, dentro de la tabla de intervalos trabajaremos
con el caso de dos poblaciones normales o de proporciones.
7.4.1. Intervalo de Confianza para la Media
cuando la Varianza es Conocida
El estadstico a considerar es
n
X
X
n
i
i

=
=
1
, de manera que la
expresin del estadstico que depende de cuando la varianza es
conocida ser
) , ( 1 0 N
n
X



La construccin del intervalo con colas iguales se desarrolla a
continuacin


=
(
(
(
(

1
2 / 2 /
z
n
X
z P


=
(

+ 1
2 / 2 /
n
z X
n
z X P
de donde resulta que

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
12/15
El intervalo aleatorio (resp. concreto) de confianza para con
una confianza del 100(1 - )%, viene dado por

n
z X
2 /


(resp.
n
z x
2 /


).
EJERCICIO 7.4.1.- EFECTO DEL NIVEL DE CONFIANZA
Comparar la longitud de los intervalos de confianza para la
media de una poblacin normal con varianza conocida al 95 y al 99 %
de confianza. Si queremos pasar de una confianza del 95 % a una del
99 %, cunto ha de variar el tamao muestral?
EJERCICIO7.4.2.- DETERMINACION DEL TAMAO
MUESTRAL
Se sabe que el dimetro de unos anillos tiene una distribucin
aproximadamente normal con una desviacin tpica de 0.01 mm.
Qu tamao de muestra se necesitara si se quiere cometer un error
en el intervalo para la media inferior a 0.001 mm a un 95 % de
confianza?

Para ms detalles se pueden consultar las pginas 322 a 324 de
Montgomery and Runger (2002).

7.4.2. Intervalo de Confianza para la Media
cuando la Varianza es Desconocida
El estadstico a considerar sigue siendo
n
X
X
n
i
i

=
=
1
, pero la
expresin del estadstico que depende de cuando la varianza es
desconocida ser
1


n
X
t
n
S
X

La construccin del intervalo con colas iguales se desarrolla a
continuacin
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
13/15
=
(
(
(
(




1
2 1 2 1 / , / , n
X
n
t
n
S
X
t P

=
(

+

1
2 1 2 1
n
S
t X
n
S
t X P
X
n
X
n / , / ,

de donde resulta que

El intervalo aleatorio (resp. concreto) de confianza para con
una confianza del 100(1 - )%, viene dado por

n
S
t X
X
n 2 1 / ,
(resp.
n
s
t x
x
n 2 1 / ,
).
EJERCICIO 7.4.3.-
Se sabe que en unas tarjetas grficas que se estn ensayando
se presenta una calidad de animacin que es una v.a. designada por
X y medida en n de marcos por segundo (fps-frames per second).
Actualmente se est trabajando sobre la hiptesis de que X sigue una
ley normal de media y varianza desconocidas. Para llevar a cabo
inferencias sobre ambos parmetros se va a tomar una muestra de
10 tareas.
Se pide:
a) Indicar qu estadstico se utilizara para realizar inferencias
sobre la media. Qu distribucin en el muestreo sigue?
b) Determinar un intervalo simtrico en el que se encuentre
dicho estadstico con una probabilidad del 95 %.
c) Deducir del apartado anterior un intervalo que contenga a la
media con una probabilidad del 95 %.
d) Qu intervalo resultar si los datos que finalmente se
obtuvieron fueron 7.9, 14.1, 10.5, 15.1, 8.7, 12.3, 13.4,
12.5, 11.2 y 14.3?
e) Repetir el ejercicio para un 90 % de confianza.


IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
14/15
7.4.3. Intervalo de Confianza para la Varianza
El estadstico a considerar ser
( )
1
1
2
2

=

=
n
X X
S
n
i
i
X
, de manera
que la expresin del estadstico que depende de la varianza es

( )
2
1
2
2
1

n
X
S n

La construccin del intervalo con colas iguales se desarrolla a
continuacin
( )
=
(
(



1
1
2
2 1
2
2
2
2 1 1 / , / , n
X
n
S n
P

( ) ( )
=
(
(


1
1 1
2
2 1 1
2
2
2
2 1
2
/ , / , n
X
n
X
S n S n
P
de donde resulta que

El intervalo aleatorio (resp. concreto) de confianza para
2
con
una confianza del 100(1 - )%, viene dado por
( ) ( )
(
(


2
2 / 1 , 1 n
2
X
2
2 / , 1 n
2
X
S 1 n
,
S 1 n
(resp.
( ) ( )
(
(


2
2 / 1 , 1 n
2
x
2
2 / , 1 n
2
x
s 1 n
,
s 1 n
).

OBSERVACION. -
Si la media es conocida, entonces el estadstico a utilizar es
( )
2
2
1
2
n
n
i
i
X

=
.
Por un razonamiento anlogo al anterior, se concluye que

El intervalo aleatorio (resp. concreto) de confianza para
2

con una confianza del 100(1 - )%, viene dado por
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





7.1 7.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
15/15

( ) ( )
(
(
(
(
(
(

=

2
2 1
1
2
2
2
1
2
/ , / ,
,
n
n
i
i
n
n
i
i
X X
(resp.
( ) ( )
(
(
(
(
(
(

=

2
2 1
1
2
2
2
1
2
/ , / ,
,
n
n
i
i
n
n
i
i
x x
).
EJERCICIO 7.4.4.-
Con relacin al ejercicio 7.4.3, se pide:

a) Indicar qu estadstico se utilizara para realizar inferencias
sobre la varianza. Qu distribucin en el muestreo sigue?
b) Determinar un intervalo de colas iguales en el que se
encuentre dicho estadstico con una probabilidad del 90 %.
c) Deducir del apartado anterior un intervalo que contenga a la
varianza con una probabilidad del 90 %. Aplicarlo a los datos
obtenidos.






IINF, ITIM, ITIG/S, ITIE, ITIEI - Mt. Estad. de la Ing./ Estadstica
Curso 2 (S1, S2)/2009-2010



7.4.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/2
7.4.4. Tablas de Intervalos de Confianza

Tipo de Problema Estimacin Puntual Int. Conf. Bilateral al 100(1- )%
Media , Varianza
2

Conocida
x
n
z x
2



Diferencia de medias
2 1

, con
Varianzas
2
2
2
1
,
Conocidas
2 1
x x

n m
z ) x x (
2
2
2
1
2
2 1

+




Media de una Dist. Normal, con Varianza
2

Desconocida
x
n
s
t x
X
2
, 1 n


Diferencia de medias
2 1

de Normales
con
2
2
2
1
=
y desconocida (Nota 2)
2 1
x x

n
1
m
1
s t x x
c
2
, 2 n m
2 1
+

+

Diferencia de medias
2 1

Dos Normales
y
2
2
2
1

desconocidas (Nota 3)
2 1
x x

n
S
m
S
t x x
2
X
2
X
2
, k
2 1
2 1
+


Diferencia de medias
2 1

de Dos
Normales en muestras emparejadas (Nota 1)
d
n
s
t d
d
2
, 1 n


Varianza
2

de una Dist. Normal


2
x
s

( ) ( )
(
(


2
2 / 1 , 1 n
2
x
2
2 / , 1 n
2
x
s 1 n
,
s 1 n
IINF, ITIM, ITIG/S, ITIE, ITIEI - Mt. Estad. de la Ing./ Estadstica
Curso 2 (S1, S2)/2009-2010



7.4.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/2
Cociente de Varianzas
2
2
2
1

de Dist. Normal
2
X
2
X
2
1
s
s

( ) ( )
(
(

1 m , 1 n F
s
s
, 1 m , 1 n F
s
s
2
2
X
2
X
2
1
2
X
2
X
2
1
2
1

Proporcin o parmetro p de una Dist.
Binomial
p

n
) p 1 ( p
z p
2



Diferencia de Proporciones o de parmetros
2 1
p p
de Dos Dist. Binomial
2 1
p p

n
) p 1 ( p
m
) p 1 ( p
z p p
2 2 1 1
2 2 1

+





Notas.- 1) Los datos emparejados son datos de la forma )
n 2
x ,
n 1
x ( ),...,
22
x ,
12
x ( ),
21
x ,
11
x (
de manera que se consideran las n diferencias
n 2
x
n 1
x
n
d ,...,
22
x
12
x
2
d ,
21
x
11
x
1
d = = = . A partir de
esto, se obtiene
d
s y d
.
2)
)
`

+
+
=
2
2
X
S ) 1 n (
2
1
X
S ) 1 m (
2 n m
1
2
c
S . 3)
1 n
2
n
2
2
X
S
1 m
2
m
2
1
X
S
2
n
2
2
X
S
m
2
1
X
S
k

+
|

\
|
|

\
|
(
(
(

=

IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 7 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/5
MATERIAL COMPLEMENTARIO
TEMA 7

7.1.- En las siguientes preguntas hay cuatro posibles respuestas,
razonar aquella respuesta nica que se considere correcta.
1.- Una estimacin puntual de un parmetro del que depende la
distribucin de probabilidad de una v.a. X
A) Es un valor concreto que asigna un estadstico al
parmetro, para una muestra observada de tamao n
de la v.a. X.
B) Siempre proporciona menos precisin sobre el
verdadero valor de dicho parmetro que una estimacin
por intervalo de confianza.
C) Es un nmero real o constante que asigna el estimador
puntual al parmetro, para una muestra aleatoria
simple de la v.a. X.
D) Verifica lo expresado en al menos dos de las
afirmaciones anteriores.
2.- Los mtodos de estimacin puntual para un vector de
parmetros
r

A) No pueden incorporar ms que la informacin muestral
obtenida sobre la v.a. considerada.
B) No poseen propiedades particularmente destacables.
C) Proporcionan un mecanismo que indica las operaciones
a realizar con los datos para asignar valores a cada uno
de los elementos del vector
r
.
D) Verifican lo expresado en al menos dos de las
afirmaciones anteriores.
3.- El mtodo de estimacin puntual de analoga
A) Slo se puede emplear cuando haya un nico
parmetro.
B) Proporciona estimadores que no poseen propiedades
particularmente destacables.
C) Raramente proporciona las mismas estimaciones que el
mtodo de mxima verosimilitud.
D) No verifica ninguna de las afirmaciones anteriores.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 7 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/5
4.- El nivel o coeficiente de confianza con el que se construye
un intervalo de confianza para un parmetro es
A) La probabilidad de que el intervalo de confianza
obtenido a partir de una muestra concreta cubra el
verdadero valor del parmetro.
B) El porcentaje aproximado de intervalos construidos
para 100 muestras concretas que contienen al
parmetro.
C) El grado de precisin del intervalo construido para una
muestra concreta.
D) Ninguna de las afirmaciones anteriores.
5.- Sea X una v.a. distribuida ( )
2
, N . Sea
n 2 1
x ,..., x , x una
muestra observada de tamao n de la v.a. X con x y s
X
la media y
desviacin tpica muestral. Entonces, el intervalo de confianza para
A) Al 95 % de confianza es
n
96 . 1 x

, si
2
conocida.
B) Al 95 % de confianza es
n
s
96 . 1 x
X
, si
2

desconocida.
C) Construido al 100 % de confianza, resulta ser el
intervalo ms eficaz para estimar dicho parmetro.
D) No verifica ninguna de las afirmaciones anteriores.
6.- A partir de una muestra concreta de una distribucin normal
se calcula un intervalo de confianza para la media al 95 % de
confianza. Si queremos incrementar la precisin del intervalo final a
utilizar
A) Eliminaramos aquellos datos que fuesen menos
representativos de la muestra.
B) Aumentaramos el coeficiente de confianza al 99 %.
C) Tomaramos simultneamente las medidas indicadas en
A) y B).
D) No se conseguira con ninguna de las medidas
anteriores.
7.- A partir de una muestra concreta de una distribucin normal
se calcula un intervalo de confianza para la varianza al 95 % de
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 7 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/5
confianza. Si queremos incrementar la precisin del intervalo final a
utilizar
A) Recogeramos ms datos que aadiramos a los ya
disponibles.
B) Aumentaramos el coeficiente de confianza al 99 %.
C) Tomaramos simultneamente las medidas indicadas en
A) y B).
D) No se conseguira con ninguna de las medidas
anteriores.
8.- La aplicacin de los mtodos de estimacin por intervalo
de confianza
A) Con muestras grandes, n 30, se desarrolla a travs de
estadsticos cuyas distribuciones en el muestreo son
conocidas con total exactitud.
B) No se puede llevar a cabo con muestras pequeas y
distribuciones diferentes a la normal, al desconocerse
los estadsticos a manejar y sus distribuciones en el
muestreo.
C) Bajo la hiptesis de normalidad requieren estadsticos a
manejar cuyas distribuciones en el muestreo son
conocidas con exactitud.
D) Verifica lo expresado en al menos dos de las
afirmaciones anteriores.
7.2.- El encargado de mantenimiento de un taller tiene datos sobre
los tiempos de reparacin de una cierta mquina, que supone siguen
una ley normal. En concreto, le han enviado 10 notas de reparacin
en las que se reflejan los siguientes tiempos, medidos en horas,
2.4, 4.5, 5.3, 6.4, 7.2, 8.2, 8.5, 9, 9.5, 10.
Se pide:
a) Obtener un intervalo de confianza para el tiempo medio
de reparacin, a un 95 % de confianza.
b) Obtener un intervalo de confianza para la varianza de los
tiempos de reparacin, a un 90 % de confianza.
c) De cuntas notas de reparacin debe disponer si slo
est dispuesto a cometer un error de 5 minutos con el
intervalo para la media? Nota.- Considerar como
desviacin tpica la de los datos.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 7 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/5
d) Qu aspectos deberan tenerse en cuenta si el supuesto
de distribucin normal no es apropiado?
7.3.- En un laboratorio de ensayos se estn realizando pruebas para
analizar la resistencia a la tensin de unas piezas. Los datos
recogidos en una muestra de 10 piezas sobre esa variable y medidos
en kg/mm
2
son:
47.5, 50.1, 51.0, 50.9, 50.1, 48.1, 45.7, 48.7, 50, 48.1
Se pide:
a) Obtener un intervalo de confianza para la resistencia media
a la tensin de una de estas piezas, a un 95 % de confianza.
b) Obtener un intervalo de confianza para la desviacin tpica
de la tensin de una de estas piezas, a un 98 % de
confianza.
c) El departamento de produccin afirma que estas piezas
poseen una resistencia a la tensin promedio superior a los
50 kg/mm
2
. Tienen razn segn la muestra observada?
7.4.- La tabla que se muestra a continuacin presenta el nmero de
artculos satisfactorios y defectuosos en dos muestras independientes
tomadas despus de la introduccin de una modificacin importante
en un proceso de fabricacin.
Antes Despus
Satisfactorios 108 128
Defectuosos 18 8
Construir un intervalo de confianza al 95 % para la diferencia de
proporciones de artculos defectuosos en las correspondientes
poblaciones. Ha sido la modificacin un xito? Responder indicando
la confianza en la respuesta y explicando lo que eso significa.
7.5.- Se ha desarrollado un experimento para analizar cualquier
diferencia sistemtica en el contenido de cemento de unas placas
utilizadas en la construccin, a travs de los informes de dos
laboratorios A y B. Se tomaron ocho placas de diferentes fuentes.
Cada placa se parti en dos; una mitad fue elegida al azar y enviada
al laboratorio A y la otra mitad se envi al B. Los resultados,
expresados como porcentajes, se presentan a continuacin:
Lab. A (%) 20.3 18.8 17.9 21.5 20.5 19.3 19.8 18.2
Lab. B (%) 21.4 19.2 17.4 22.7 21.3 19.1 19.7 19.2
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Material Comp. Tema 7 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/5
Construir un intervalo de confianza al 95 % de confianza para la
diferencia media en las medidas de contenido de cemento realizadas
por los dos laboratorios. Hay diferencias significativas entre ambos
laboratorios?
Ampliacin.- Cuntas placas recomendaras enviar a los
laboratorios para que la longitud de un intervalo de confianza al 90 %
para la diferencia media en el contenido de cemento fuese inferior a
0.2?

7.6.- En un laboratorio de certificacin de software se est analizando
la eficiencia (en porcentaje) de paquetes de dos fabricantes A y B. Se
est trabajando sobre la hiptesis de que la eficiencia del software de
cada fabricante se rige por una ley normal.
Se han realizado ensayos con 8 paquetes del fabricante A y 10
programas del fabricante B, resultando que la media muestral de A es
80.5625 con una desviacin tpica muestral de 2.156; mientras que la
media muestral de B ha sido de 83.88 con una desviacin tpica
muestral de 1.336.
Respondiendo razonadamente, contestar a las preguntas
siguientes:
a) Se puede considerar que ambos fabricantes presentan la
misma variabilidad en sus medidas de eficiencia?
b) Podra concluir este laboratorio que los dos fabricantes son
igual de eficientes?
7.7.- Una empresa de productos educativos quiere saber si debe
emprender una campaa para potenciar el uso de las Nuevas
Tecnologas entre los estudiantes, para lo cual necesita conocer la
proporcin de estudiantes que dispone de ordenador porttil. Se
trabaja sobre la hiptesis de que esa proporcin es 0,15.
A) A cuntos estudiantes se deber encuestar si no se quiere
cometer un error superior a 0,01? Responder razonadamente
bajo el contexto habitual del 95 % de confianza.
B) Hasta qu valor se podra reducir dicho tamao muestral?
Responder razonadamente.
C) Se decidi preguntar a 1000 estudiantes en Madrid y a 500
en Barcelona, observndose que 30 de la capital y 40 de la
Ciudad Condal tenan porttil. Qu se puede concluir de
esta informacin? Responder de manera razonada.


IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Solucin Material Comp. Tema 7 Carlos Mat

1/3
SOLUCIONES A CUESTIONES Y ALGUNOS PROBLEMAS
DEL MATERIAL COMPLEMENTARIO DEL
TEMA 7
7.1.-
1.- A). 2.- C). 3.- B). 4.- B). 5.- A).
6.- D). 7.- A). 8.- C).
7.2.-
a)
[ ] 844 . 8 356 . 5
10
439 . 2
262 . 2 1 . 7
10
439 . 2
262 . 2 1 . 7

+

b)
[ ] 099 . 16 164 . 3
325 . 3
948 . 5 9
919 . 16
948 . 5 9
2 2




7.3.-
a)
[ ] 233 . 50 807 . 47
10
69562 . 1
262 . 2 02 . 49
10
69562 . 1
262 . 2 02 . 49
69562 . 1 87511 . 2 , 02 . 49
10
2 . 490
2
10
1

+
= = = = =

=
=

X X
n
i
i
S S
n
x
X


b)
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Solucin Material Comp. Tema 7 Carlos Mat

2/3
[ ] [ ] 5204 . 3 0928 . 1 393 . 12 1943 . 1
088 . 2
87511 . 2 9
666 . 21
87511 . 2 9
2
2


7.4.-
( )
( ) ( )
[ ] 15681 . 0 , 01124 . 0
136
9411 . 0 05882 . 0
126
85715 . 0 14285 . 0
96 . 1 08403 . 0
136

126


05882 . 0
136
8

14285 . 0
126
18

025 . 0
+

+
= =
= =
B B A A
B A
B
A
P P P P
Z P P
P
P


7.5.-
[ ] 088 . 0 013 . 1
658868 . 0 , 4625 . 0
8
2 1
8
1

= = =

=

d
i
i
S
d
d

Mediante el ensayo de diferentes valores de tamao muestral
se concluye que aproximadamente unas 10000 placas se recomienda
enviar a cada laboratorio.
7.6.-

a) El intervalo resultante del cociente de las varianzas contiene el valor 1. As,
al 90% de confianza ambos fabricantes presentan la misma variabilidad.

b) Como el intervalo resultante para la diferencia de medias
[ ] 8741 , 1 , 7609 , 4 , no incluye el valor 0 podemos afirmar que ambos fabricantes
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2009-2010





Solucin Material Comp. Tema 7 Carlos Mat

3/3
no son igual de eficientes. Como el intervalo slo contiene nmeros negativos
podemos concluir que el fabricante B es ms eficiente que el fabricante A.
7.7.-
a) Al menos a 4898 estudiantes.
b) Al menos a 3450 estudiantes.
c) La proporcin de estudiantes con porttil es distinta en ambas ciudades, al
95% de confianza.


ITIGS
Estadstica Bsica
Curso 2 (S2)/2009-2010





Int. Conf. Prob. Res. Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/3
PROBLEMA RESUELTO (MC TEMA 7, #7.7) DE
INTERVALOS DE CONFIANZA



Una empresa de productos educativos quiere saber si debe
emprender una campaa para potenciar el uso de las Nuevas
Tecnologas entre los estudiantes, para lo cual necesita conocer la
proporcin de estudiantes que dispone de ordenador porttil. Se
trabaja sobre la hiptesis de que esa proporcin es 0,15.
A) A cuntos estudiantes se deber encuestar si no se quiere
cometer un error superior a 0,01? Responder razonadamente
bajo el contexto habitual del 95 % de confianza. (4)
B) Hasta qu valor se podra reducir dicho tamao muestral?
Responder razonadamente. (2)
C) Se decidi preguntar a 1000 estudiantes en Madrid y a 500
en Barcelona, observndose que 30 de la capital y 40 de la
Ciudad Condal tenan porttil. Qu se puede concluir de
esta informacin? Responder de manera razonada. (4)
-------------------------












ITIGS
Estadstica Bsica
Curso 2 (S2)/2009-2010





Int. Conf. Prob. Res. Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/3
SOLUCION

a) Nos encontramos ante una distribucin binomial y se considera la hiptesis
de que la probabilidad de que se produzca el fenmeno tener ordenador
portatil es p=0,15. Por lo tanto estamos con un problema en el que se trabaja
con la el parmetro p de una distribucin binomial. El error mximo que se est
dispuesto a cometer es de 0,01 y debemos responder al 95% de confianza. Por
lo tanto tendremos:
01 , 0
) 1 (

2
05 , 0

n
p p
z 01 , 0
85 , 0 15 , 0
96 , 1
n
4898 n .
Luego para cometer un error no superior de 0,01 al 95% de confianza
deberamos encuestar al menos a 4898 estudiantes.

b) Para reducir el tamao muestral existen dos posibilidades, elevar el nivel
de error que estamos dispuestos a cometer o reducir el nivel de confianza.
Suponemos que queremos mantener la tasa de error, luego reduciremos el
nivel de confianza al 90%, que es un valor razonable y habitual en estos
contextos.
01 , 0
) 1 (

2
10 , 0

n
p p
z 01 , 0
85 , 0 15 , 0
645 , 1
n
3450 n .
Luego para cometer un error no superior de 0,01 al 90% de confianza
deberamos encuestar al menos a 3450 estudiantes.
c) Para comparar los resultados de la encuesta, de naturaleza binomial,
realizada en dos ciudades distintas debemos usar la diferencia de proporciones
de dos distribuciones binomiales. Consideraremos:
Madrid: 03 , 0 1000 / 30
1
= = p
Barcelona: 08 , 0 500 / 40
2
= = p
El intervalo de confianza para la diferencia de las proporciones al 95% de
confianza ser:
n
p p
m
p p
z p p
) 1 ( ) 1 (

2 2 1 1
2 / 2 1

+



=
500
92 , 0 08 , 0
1000
97 , 0 03 , 0
96 , 1 08 , 0 03 , 0 + = 02602 , 0 05 , 0

ITIGS
Estadstica Bsica
Curso 2 (S2)/2009-2010





Int. Conf. Prob. Res. Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/3
Como el intervalo resultante en el que se encuentra la diferencia entre
las proporciones de estudiantes de Madrid y Barcelona con ordenador porttil
no incluye el valor 0, podemos concluir que la proporcin de estudiantes con
porttil es distinta en ambas ciudades, al 95% de confianza.





IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/18
TEMA 8
INFERENCIA ESTADISTICA.
CONTRASTES DE HIPOTESIS
8.1. Conceptos Bsicos en los Contrastes de
Hiptesis
La vida real plantea continuamente interrogantes a los que se
debe dar una respuesta. Por ejemplo, los motores fabricados con un
nuevo proceso de produccin son ms resistentes o ms duraderos
que los que fabricamos con un proceso antiguo? La navegacin por
una red informtica es igual de eficaz con distintos navegadores o es
diferente?
Por otra parte, es habitual que cualquier persona se vea
sometida al dilema de elegir entre dos o ms alternativas, es decir, a
la toma de decisiones. Por ejemplo, un ingeniero de fiabilidad debe
decidir entre distintas distribuciones de probabilidad para representar
el tiempo de funcionamiento hasta el fallo de un dispositivo, mquina
o sistema.
Los contrastes de hiptesis, tambin llamados tests de hiptesis
o pruebas de hiptesis, constituyen el concepto estadstico necesario
para responder de una manera cientfica a los interrogantes que
plantea la vida real. Adems, se trata de un caso particular de la
toma de decisiones.
La metodologa de los contrastes de hiptesis proporciona las
herramientas necesarias al ingeniero o al cientfico para que la toma
de decisiones se apoye en la informacin disponible sobre el
problema y se lleve a cabo de una manera racional.
Los contrastes se pueden plantear sobre la muestra, el modelo
de probabilidad, la varianza de la poblacin, etc.

Una primera clasificacin de los contrastes es la siguiente.

Contrastes no paramtricos: se refieren a aquellas situaciones
donde no se presupone un determinado modelo de probabilidad.
Por ejemplo, los contrastes de aleatoriedad que plantean el
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/18
carcter aleatorio o de otro tipo de una muestra. O bien, los
contrastes de bondad del ajuste que analizan si debe aceptarse
un determinado modelo de probabilidad para unos datos o debe
rechazarse.

Contrastes paramtricos: se refieren a aquellas situaciones
que presuponen un determinado modelo de probabilidad. Por
ejemplo, los contrastes sobre parmetros de una distribucin
normal donde se trata de decidir si se deben considerar algunos
valores para dichos parmetros o deben rechazarse.
8.1.1. La Estructura de un Contraste de Hiptesis
En todo contraste de hiptesis se debe identificar lo siguiente:

Hiptesis nula (H
0
): representa la situacin en la que hay
ausencia del efecto que queremos estudiar.
Hiptesis alternativa (H
1
): representa la situacin en la
que se recoge el efecto de lo que queremos estudiar.
EJEMPLO 8.1.1.- CONTRASTE DE HIPOTESIS PARAMETRICO
Unas planchas que se utilizan en un proceso de fabricacin presentan un
espesor, en mm, distribuido normal de media 20. Si ltimamente hay sospechas de
que ese valor ha podido cambiar, cul sera el contraste de hiptesis a formular?
------------------------------------
La ausencia de cambio se expresa como 20 = , mientras que la presencia
del efecto a considerar se expresa por 20 , si no hay indicios hacia que haya
subido o bajado, o por 20 < si se sospecha que se ha reducido el espesor de
estas planchas.
El primer planteamiento se formula

=
20 :
20 :
1
0

H
H

mientras que el segundo sera

<
=
20 :
20 :
1
0

H
H


IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/18
EJEMPLO 8.1.2.- CONTRASTE DE HIPOTESIS NO
PARAMETRICO (BONDAD DEL AJUSTE)
Los siguientes datos, expresados en horas,
1050, 800, 1100, 950, 900, 800, 950, 800
se han obtenido como resultado de un ensayo de vida sobre unas componentes
informticas. Se sospecha que el tiempo de funcionamiento hasta el fallo de estas
componentes se rige por una distribucin cuya funcin de densidad es

t
1
900
f (t) e , t 0
900

= . Cmo sera el contraste de hiptesis a formular para
analizar si los datos proceden de dicha distribucin?
------------------------------------
Lo primero a tener en cuenta es que los contrastes de bondad del ajuste se
suelen plantear a travs de la funcin de distribucin.
Si el modelo de probabilidad que se propone tiene por funcin de distribucin
( ) x F
0
, x , y la funcin de distribucin verdadera o real de la v.a. de la que
se han obtenido los datos es F(x), el contraste de hiptesis de la bondad o
adherencia del ajuste enfrenta la hiptesis de que los datos se rigen por el
modelo con funcin de distribucin ( ) x F
0
; lo que se indica por
( ) ( ) x , x F x F : H
0 0

a la hiptesis alternativa de que los datos siguen un modelo con una funcin de
distribucin diferente de la ( ) x F
0
, para algn punto x; lo que se indica por
( ) ( ) x algn para , x F x F : H
0 1

En nuestro caso, ( )
0
900
0 0
1 0
x
x
F x
e x

<


Como se trata de una distribucin exponencial de parmetro 1/900, una
forma alternativa de indicarlo es
( )
0
1
: 1 900
:
H X E
H X

( ) 1 900 E


EJERCICIO 8.1.3.- CONTRASTE DE HIPOTESIS NO
PARAMETRICO (BONDAD DEL AJUSTE)
Indicar el contraste para analizar si se puede considerar aceptable que los datos 3,
4.6, 2, 5, 4 sobre la duracin de unos equipos, en aos, proceden de una
distribucin normal de media 3.85932 aos y desviacin tpica 0.7649 aos.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/18
EJEMPLO 8.1.4.- CONTRASTE DE HIPOTESIS NO
PARAMETRICO (ALEATORIEDAD)
La mayora de calculadoras y algunos paquetes permiten la generacin de
nmeros aleatorios del intervalo [0,1]. Cmo sera el contraste de hiptesis a
formular para analizar si n nmeros han sido obtenidos al azar de ese intervalo?
------------------------------------
Supongamos que los nmeros son
n
x x x ,..., ,
2 1
. La ausencia del efecto a
estudiar es que se trata de una muestra aleatoria, mientras que la presencia de ese
efecto se expresar diciendo que esos nmeros no forman una muestra aleatoria,
ya que ha sido generada por algn mecanismo que suponga una determinada
cadencia o secuencia en la toma de datos.
La formulacin del contraste ser

aleatoria muestra una forman no x x x H


aleatoria muestra una n constituye x x x H
n
n
,..., , :
,..., , :
2 1 1
2 1 0


Las hiptesis paramtricas pueden ser:
- Simples: hacen referencia a un solo resultado del parmetro.
- Compuestas: hacen referencia a varios resultados del parmetro.
Adems, el contraste paramtrico puede ser:
- Bilateral o de dos colas: si la hiptesis alternativa es del tipo:
H
1
: 20





- Unilateral o de una cola:





El contraste de hiptesis es el mtodo estadstico con el que
mediante la observacin de una muestra y la aplicacin de un
procedimiento basado en un estadstico me va a llevar a elegir entre
las dos hiptesis aceptando una de ellas y rechazando la otra. En ese
proceso de eleccin podemos actuar correctamente o cometer dos
tipos de errores que pasamos a estudiar.
Hip. Alternativa 20 Hip. Alternativa
Hip. Nula
Hip. Nula
Hip. Alternat. 20
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
5/18
8.1.2. Los Errores en un Contraste de Hiptesis
Si un contraste de hiptesis se realiza con xito, las posibilidades
de actuacin correcta se concretan en las siguientes situaciones:
Aceptar
0
H siendo
0
H verdadera.
Rechazar
0
H cuando sea falsa.
Pero a causa de los errores (siempre presentes) en la toma de
las muestras, podemos incurrir en las decisiones incorrectas:
Rechazar
0
H cuando
0
H sea verdadera. Error de tipo I
Aceptar
0
H cuando
0
H sea falsa. Error de tipo II
Estos dos errores que se pueden cometer en todo contraste de
hiptesis, llamados respectivamente error de tipo I y error de tipo II,
tienen las siguientes probabilidades:

= P (error de tipo I) = P(rechazar
0
H /
0
H es verdadera)
= P (error de tipo II) = P(aceptar
0
H /
0
H es falsa)

Dicho de otra forma, se verifica que
- Error de tipo I: Rechazo de la hiptesis nula cuando es
verdadera.
- Error de tipo II: Aceptacin de la hiptesis nula siendo
falsa.

El siguiente cuadro refleja la situacin con que nos podemos
encontrar al tomar cada decisin, segn se haya presentado el estado
de la naturaleza.

DECISIN
ESTADOS DE LA
NATURALEZA

Aceptar
0
H
(Rechazar
1
H )
Rechazar
0
H
(Aceptar
1
H )
0
H verdadera Decisin correcta con
Probabilidad 1 -
Error de tipo I con
Probabilidad
0
H falsa Error de tipo II con
Probabilidad
Decisin correcta con
Probabilidad 1 -

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
6/18
EJERCICIO 8.1.5.- SITUACIONES POSIBLES EN LOS
EJEMPLOS 8.1.1. y 8.1.2
Plantear el cuadro anterior en dichos ejemplos.

Las consecuencias que se derivan de cometer el error del tipo I
son ms graves que las derivadas de cometer un error de tipo II.
Por qu?

La Inferencia Estadstica ha propuesto contrastes de hiptesis en
los que se fija la probabilidad de cometer el error de tipo I,
denominada nivel de significacin y designada por , o una cota
superior para dicha probabilidad; y se maximiza la probabilidad de
tomar una decisin correcta en cuanto al rechazo de hiptesis falsas.
Es decir, se maximiza

1 - = 1 - P (error de tipo II) = P(rechazar
0
H /
0
H es falsa)
denominada potencia del contraste.

Por tanto, la inferencia estadstica disea contrastes de
hiptesis que tengan un probabilidad de cometer un error de tipo I
(nivel de significacin) muy baja, maximizando la probabilidad de
tomar una decisin correcta en cuanto al rechazo de hiptesis falsas.
Lo estndar es fijar el nivel de significacin en 0.05, pero
tambin se contemplan el resto de valores entre 0.01 y 0.1, ambos
inclusive.
Cuando disminuye aumenta , y viceversa. La nica forma de
disminuir ambos simultneamente es aumentar el tamao de la
muestra.
EJERCICIO 8.1.6.- CONTRASTE DE HIPOTESIS Y
ERRORES AL REALIZAR PRUEBAS CON
UN NUEVO MODELO DE PANTALLA DE
PLASMA
El modelo actual tiene una vida media de 15.000 horas de funcionamiento
continuado. Se hacen pruebas con un nuevo modelo asumiendo una duracin segn
una ley normal, cul sera el contraste a formular para detectar una vida media
mayor? Cules son los errores que puedo cometer al aplicar el contraste con unos
datos? De qu me informar la funcin de potencia de este contraste?

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
7/18
Los Contrastes de Hiptesis en Control de Calidad
(Ampliacin)
En el mbito de control de calidad conocido como recepcin de producto, al
nivel de significacin a veces se le llama riesgo del productor porque denota la
probabilidad de que un lote bueno sea rechazado, mientras que a se le llama
riesgo del consumidor al denotar la probabilidad de aceptar un lote de calidad
pobre.
En otro mbito del control de calidad como es el control de procesos, el
riesgo del productor se interpreta como la probabilidad de que un proceso que
produce valores aceptables de una caracterstica particular de la calidad sea
rechazado por funcionar de forma no satisfactoria, mientras que el riesgo del
consumidor es permitir que contine en operacin un proceso que est operando de
manera insatisfactoria con respecto a alguna caracterstica de calidad.
Segn lo desarrollado antes, se fija el riesgo del productor y se designa un
procedimiento de prueba para que se obtenga un valor pequeo del riesgo del
consumidor, sabiendo que este riesgo es una funcin del tamao de muestra y se
controla indirectamente. Cuanto mayor sea el tamao de muestra menor ser el
riesgo .

Los Contrastes de Hiptesis en STATGRAPHICS
(Ampliacin)

El procedimiento Hipothesis Tests permite analizar la curva de
potencia cuando se plantea un contraste sobre la media y sobre la
desviacin tpica de una normal, sobre la proporcin de una binomial
y sobre el parmetro de Poisson.
EJERCICIO 8.1.7.- CURVA DE POTENCIA EN EL
EJERCICIO 8.1.6
El ensayo de vida de 25 pantallas proporcion una media muestral de 16000
horas con una desviacin tpica de 400 horas. Se quiere analizar si la vida media en
el nuevo modelo es superior a la del modelo actual. Comprobar que la entrada de
datos al programa es la siguiente.

IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
8/18


Comprobar que la salida de datos del programa es la siguiente.

Hypothesis Tests
----------------
Sample mean = 16000,0
Sample standard deviation = 400,0
Sample size = 25

95,0% lower confidence bound for mean: 16000,0 +/- 136,871
[15834,9;16165,1]

Null Hypothesis: mean = 15000,0
Alternative: greater than
Computed t statistic = 12,5
P-Value = 2,67186E-12
Reject the null hypothesis for alpha = 0,05.

Interpretar dicha informacin y extraer conclusiones. Mostrar e interpretar la
curva de potencia.
8.1.3. Regin Crtica y Regin de Aceptacin
Cuando se realiza un contraste de hiptesis siempre habr un
estadstico y se pueden identificar dos regiones de valores del
estadstico que pasamos a analizar.

- Regin Crtica.
Conjunto de valores para el estadstico del contraste que nos
llevan a rechazar la hiptesis nula (Regin de rechazo).

- Regin de Aceptacin.
Conjunto de valores para el estadstico del contraste que nos
llevan a aceptar la hiptesis nula.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
9/18

Supongamos que en el ejemplo 8.1.1. la realizacin del contraste

=
20 :
20 :
1
0

H
H

conlleva aplicar la regla de decisin siguiente:


Aceptar H
0
cuando 0.3 20 X
Rechazar H
0
cuando 0.3 20 X

Las regiones crtica y de aceptacin resultantes se muestran a
continuacin.











EJEMPLO 8.1.8.- APLICACIN DE LOS CONCEPTOS
ANTERIORES A UN CONTRASTE DE
HIPOTESIS PARAMETRICO
(AMPLIACION)
Un fabricante est interesado en el comportamiento del voltaje de una
fuente de energa. Se supone que ste se distribuye segn un normal XN(,0.25
2
)
y el industrial desea contrastar

=
5 :
5 :
1
0

H
H

mediante el anlisis del voltaje de 8 unidades.

Si la regin de aceptacin en el contraste es [4.85,5.15]:

Regin de aceptacin
19.7 20 20.3
Regin de rechazo Regin de rechazo
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
10/18
a) Encontrar el valor de .
b) Encontrar la potencia del contraste para detectar un voltaje medio verdadero de
5.1V.
c) Repetir para n = 16.
d) Si =0.05, dnde se encuentra la regin de aceptacin?
e) Resumir en un cuadro todos los resultados y extraer conclusiones.
------------------------------------
a) Se verifica que
[ ]
[ ]
[ ] 0892 . 0 0446 . 0 2 7 . 1 2 697 . 1
8
25 . 0
5
2
8
25 . 0
15 . 0
8
25 . 0
5
15 . 0 5
5
15 . 5 , 85 . 4
.
.
0
0
= = >
(
(
(
(

>

=
=
(
(
(
(

>

= > =
(

=
(

=
Z P
X
P
X
P X P
X
P
verd H
H rech
P



debido a que se utiliza que bajo la hiptesis nula ( )
2
25 . 0 , 5 N X , de manera
que
|
|

\
|

8
25 . 0
, 5
2
N X .
b) Se verifica que
[ ]
[ ] [ ]
7134 . 0
5.1
5 .

.
2866 . 0 2843 . 0 0023 . 0 566 . 0 82 . 2
8
25 . 0
1 . 5 15 . 5
8
25 . 0
1 . 5
8
25 . 0
1 . 5 85 . 4
8
25 . 0
1 . 5
1 . 5
15 . 5 , 85 . 4

.
1
0
0
0
0
=
(

=
=
=
(

=
= + = > + < =
=
(
(
(
(

>

+
(
(
(
(

<

=
=
(

=
(

acep
P
falsa H
H acep
P
Z P Z P
X
P
X
P
X
P
falsa H
H rech
P


c) Se verifica que ahora 0164 . 0 = y 7881 . 0 = .
d) En este caso (asumiendo de nuevo n = 8) se razonara de la siguiente
forma:
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
11/18
[ ] [ ]
173 . 0 5
8
25 . 0
96 . 1 5 Re
96 . 1
8
25 . 0
8
25 . 0
025 . 0
8
25 . 0
8
25 . 0
5
05 . 0
5
5
5
5 , 5
5
,
05 . 0
.
.
05 . 0
975 . 0
0
0
=
= =
(
(
(
(

> =
(
(
(
(

>

(
(

=
>
=
(

=
+
=
(

=
(

=
aceptacin gin
C
k k
Z P
k X
P
k X
P
k k X
P
b a X
P
verd H
H rech
P


e) Los elementos esenciales para el contraste de la media con varianza conocida
se recogen en el siguiente cuadro para el ejemplo analizado. Qu conclusiones se
pueden extraer?
Tamao
muestral (n)
Reg. Acep. al
n. s.
n
z
25 . 0
5
2

) . . ( I t e P = ) . . ( II t e P =
( ) 1 . 5 :
1
= H )
Potencia
1
( ) 1 . 5 :
1
= H )
8 50.15 0.0892 0.7134 0.2866
16 50.15 0.0164 0.7881 0.2119
8 50.173 0.05 0.19135 0.80865
16 50.1225 0.05 0.09702 0.90298
8.2. Metodologa para el Desarrollo de los
Contrastes de Hiptesis
8.2.1. Pasos a Realizar en cualquier Contraste de
Hiptesis
1. Formulacin de las Hiptesis: hiptesis nula e
hiptesis alternativa
En primer lugar hay que determinar el parmetro que se quiere
estudiar y cules son los valores de este parmetro que constituyen
la hiptesis nula (tambin llamada hiptesis de trabajo) y la hiptesis
alternativa. En este caso se habla de un contraste paramtrico, ya
que se refiere a un parmetro de la variable aleatoria en observacin,
X.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
12/18
Existen contrastes no paramtricos, en los que las hiptesis no
se refieren a los valores que puede tomar los parmetros, sino que
hacen referencia a estudios de la distribucin de la poblacin (por
ejemplo, normalidad), mediante las pruebas de Kolmogorov-Smirnov,
Chi-Cuadrado. O bien, se refieren a la semejanza entre varios grupos
(Prueba de la U de Mann-Withney, etc.), o a caractersticas de la
muestra.
2. Especificar el nivel de significacin
Hay que fijar el valor de o probabilidad de cometer el error de
tipo I en el contraste. Este parmetro toma tpicamente los valores
0.1, 0.05, 0.01; aunque en situaciones genricas puede tomar otro
valor, que se encontrar tabulado en las tablas correspondientes.
Recordar que un nivel de significacin ms pequeo implica una
mayor exigencia a la prueba, pues se trata de cometer menos error.
3. Elegir el estadstico de contraste
Es necesario seleccionar una funcin T de una muestra aleatoria
simple de tamao n,
n 2 1
X ,..., X , X , de la variable aleatoria en
observacin, X. Por ser T una funcin de
n 2 1
X ,..., X , X se tratar de
un estadstico y, al utilizarse dicho estadstico para decidir en un
contraste de hiptesis, se hablar del estadstico del contraste.
Por lo general, el estadstico T ser funcin del estimador
natural asociado al parmetro que intervenga en las hiptesis. Por
ejemplo, si queremos estudiar la media de una poblacin el
estadstico de contraste ser la media muestral X
X
N
i
i
N
=
=

1
.
4. Establecer la regla de decisin
Conocido el nivel de significacin y la distribucin de
probabilidad del estadstico del contraste bajo la hiptesis nula
0
H , es
posible determinar la regin crtica del contraste y formular la regla
de decisin del mismo.
5. Recoger los datos y realizar los clculos
Se necesitan recoger datos de la poblacin o variable a estudiar
X. Una vez se haya construido el contraste de hiptesis, se procede a
realizar los clculos pertinentes al mismo.
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
13/18
6. Toma de decisiones estadsticas y de otro mbito.
La finalidad del contraste de hiptesis es la aceptacin o
rechazo de una de las dos hiptesis
0
H
1
H . Este hecho conlleva una
implicaciones prcticas muy importantes en el problema que estemos
analizando, bien sea de normalidad (no paramtrico), o comparando
la media de una muestra con la media de la distribucin
(paramtrico), con un grupo o varios grupos.
En resumen, podramos decir que los pasos en un contraste de
hiptesis (paramtrico o no, unigrupal o multigrupal) son:
Formulacin de hiptesis.
Seleccin de la prueba.
Valor experimental del estadstico. El estadstico del
contraste de la prueba seleccionada permite sustituir en l
los datos obtenidos de la muestra, y su resultado numrico
ser el valor experimental del estadstico.
Valor terico del estadstico bajo la hiptesis nula. La prueba
seleccionada nos proporcionar un valor terico del
estadstico bajo
0
H , que podremos encontrar tabulado, en
funcin de y de los grados de libertad, en su caso.
Cada prueba contiene una regla de decisin que compara los
valores terico y emprico del estadstico, y aceptar o
rechazar
0
H segn dicha relacin.
Conclusiones propias del problema estudiado.
8.2.2. Nivel de Significacin Observado o Valor P de un
Contraste
El llamado P-valor o nivel de significacin observado de un
contraste es el elemento que permite en la prctica tomar la decisin
entre la hiptesis nula y la alternativa de un contraste, a todos los
niveles de significacin posibles.
En todo contraste de hiptesis, se denomina nivel de
significacin observado o valor P del contraste al nivel de
significacin ms pequeo que haga que la muestra observada nos
indique que se debe rechazar
0
H . De esta manera, el investigador
puede apreciar lo exigente que puede ser con la prueba, escogiendo
un adecuado, de forma que la regla de decisin del contraste ser:
Aceptar
0
H si P >
Rechazar
0
H si P < .
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
14/18
Por ejemplo, si un valor P es 0,2 deberamos considerar niveles
de significacin a partir de 0,2 para rechazar la hiptesis nula, lo cual
no es viable, por lo que aceptamos la hiptesis nula a cualquier nivel
de significacin habitual entre el 1 y el 10 %.

Si el valor P fuese 0,003 deberamos considerar niveles de
significacin a partir de 0,003 para rechazar la hiptesis nula, lo cual
es viable con los niveles habituales, por lo que rechazamos la
hiptesis nula a cualquier nivel de significacin a partir de 0,003 (lo
habitual es entre el 1 y el 10 %).

Para un valor P entre 0,01 y 0,1 depender del nivel de
significacin que se considere.

Valor P en contrastes paramtricos (Ampliacin)

El valor P de un contraste depende de la localizacin de la
regin crtica o de rechazo. Sea T el estadstico del contraste y t el
valor tomado por dicho estadstico para los datos recogidos. Si la
regin crtica es bilateral, y t > 0 (resp. t < 0) el valor P es
P(T > t) + P(T < - t) = P(| T | > t)
(resp. P(T > -t) + P(T < t) = P(| T | > -t)

Si la regin es unilateral, el valor P del contraste es P(T > t), o
bien P(T < t), dependiendo de si la regin crtica est en la cola de la
derecha o de la izquierda, respectivamente.

EJEMPLO 8.2.1.-
P = 0.5: No podemos rechazar H
0
(aceptamos H
0
) a un nivel de
significacin . Habitualmente [0.01,0.1].
P = 0.07: No podemos rechazar H
0
a un nivel de significacin
inferior al 7%, por tanto rechazamos H
0
a un nivel superior.
P = 0: No podemos aceptar H
0
a ningn nivel de significacin .


IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
15/18
EJEMPLO 8.2.2.-
H
0
: =
0
H
1
:
0
X N(,
2
)
2
desconocida
Estadstico T
X
S
n
x
=

0
Bajo H
0
se distribuye t
n-1









Valor P = P[T>t] + P[T<-t] = 2P[T>t], para t > 0.
Valor P = P[T<t] + P[T>-t] = 2P[T<t], para t < 0.
EJEMPLO 8.2.3.-
H
0
: =
0
H
1
: >
0
(resp. H
1
: <
0
)







0
t
n-1,



-t
n-
0
t
n-1,

/2
Regin de rechazo H
0
Regin de rechazo H
0

Aceptamos H
0
/2 /2
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
16/18
Valor P = P[T>t] (resp. Valor P = P[T<t]), para cualquier t .
Si P 0 El estadstico estar claramente en la regin crtica.
Si P > 0.1 El estadstico estar en la regin de aceptacin.
EJEMPLO 8.2.4.-
En un laboratorio de ensayos se estn realizando pruebas para
determinar la resistencia a la tensin de unas piezas, obteniendo los
siguientes resultados:
47.5, 50.1, 51, 50.9, 50.1, 48.1, 45.7, 48.7, 50, 48.1 Kg/mm
2

Segn el departamento de produccin > 50 Kg/mm
2

a) Tienen razn segn la muestra obtenida? Responder utilizando
1% y 5% de nivel significacin. Qu les pueden decir los del
laboratorio a los de produccin?
b) Calcular el valor de P del contraste en cuestin.
------------------------
a) El estadstico es
8277 . 1
10
6956 . 1
50 02 . 49
10
50
=

= t
S
X
T
x

H
0
: 50

H
1
: >50


Rechazamos H
0
cuando T > t
9,







0 t
9,



t
p
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
17/18
A cualquier nivel de significacin de los utilizados habitualmente
([0.01,0.1]), no podemos rechazar H
0
y en consecuencia
aceptamos 50.
b) El contraste a considerar es
H
0
: 50

H
1
: < 50
A un nivel de significacin

rechazaremos H
0
cuando T < - t
9,










Valor P = P[T<-1.8277] = 0.0504
No podemos rechazar H
0
al 1% o al 5%. Pero debemos rechazar H
0
al
10%.
8.2.3. Relacin entre Intervalos de Confianza y
Contrastes de Hiptesis
Cuando se rechaza una hiptesis nula, habitualmente no se conoce el valor
del parmetro de la poblacin en cuestin. Todo lo que se sabe es que es ms
verosmil que el valor del parmetro sea mayor o menor que un valor concreto. Se
puede estimar su valor verdadero construyendo un intervalo de confianza para el
parmetro.
En algunas ocasiones, en lugar de llevar a cabo un procedimiento de contraste
de hiptesis sobre un parmetro, se puede construir un i. c. para el parmetro y
extraer conclusiones del mismo. Supongamos que se desea llevar a cabo el
contraste
0
-t
9,


=0.05

Valor P
-1.8277
Rechazo H
0
Acepto H
0
IINF, ITIE, ITIEI, ITIG/S, ITIM
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S1,S2)/2009-2010







8.1 8.2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
18/18


=
0 1
0 0
: H
: H

Si el nivel de significacin es , se pueden utilizar los datos de una muestra
para construir un intervalo de confianza (i.c.) para con una confianza del 100(1 -
) %. Si el valor de
0
no est incluido en el intervalo hay que rechazar
0
H ; pero
si
0
se encuentra en el intervalo calculado no hay evidencia para rechazar
0
H .
Una ventaja de este procedimiento es que se pueden contrastar muchas
hiptesis nulas de una vez. Se puede rechazar cualquier hiptesis nula de la forma

0
H : = cualquier valor que no pertenezca al intervalo
Por otra parte, el conocimiento de la regin de aceptacin de un contraste
permite desarrollar un i. c. Sin embargo, no se debe pensar que son conceptos
equivalentes ya que hay contrastes que no pueden ejecutarse desde un i.c.
Por tanto, se puede afirmar lo siguiente.
1. Todo intervalo de confianza [a, b] construido para un parmetro al
100(1 - ) % de confianza (bajo un estadstico con distribucin
simtrica), permite ejecutar el conjunto de contrastes de hiptesis


=
0 1
0 0
: H
: H

al nivel de significacin , concluyndose
[ ]
[ ]
0 0
0 0
, , no se puede rechazar H
, , se debe rechazar H
Si a b
Si a b


2. De todo contraste de hiptesis bilateral con una regin de aceptacin
al nivel de significacin para un parmetro se puede deducir un i.c. al
100(1 - ) % de confianza para dicho parmetro.
3. A partir de un i. c. se pueden construir pruebas de hiptesis, mientras
que hay contrastes de hiptesis que no pueden ejecutarse a travs de
intervalos de confianza. Por ejemplo, el contraste
0 0
1 1
:
:
H
H


=


no puede elaborarse desde un intervalo de confianza. Es necesario
desarrollar el llamado test de razn de verosimilitudes, para lo cual se
recomienda consultar la bibliografa especializada sobre Inferencia
Estadstica.
8.2.4. Tabla Resumen de Contrastes de Hiptesis
En muchos problemas prcticos los contrastes a realizar son los que figuran
en la tabla adjunta.
IINF, ITIM, ITIG/S, ITIE, ITIEI
Estadstica - Mtodos Estadsticos de la Ingeniera
Curso 2 (S1, S2)/2009-2010




8.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/3

8.2.4. Tabla Resumen de Contrastes de Hiptesis (Poblaciones Normales)

Caso
Hiptesis nula Estadstico del
Contraste
Hiptesis
alternativa
a
Regin crtica
o de rechazo
reduccin
Parmetro de la curva CO
1
conocido
: H
2
0 0

=

n /
x
z
0
0


=
H
1
:
0
H
1
: >
0
H
1
: <
0

| z
0
| > z
/2
z
0
> z

z
0
< - z


d = |
0
|/
d = (
0
)/
d = (
0
)/
2
o desconocid
: H
2
0 0

=

n / s
x
t
0
0

=
H
1
:
0
H
1
: >
0
H
1
: <
0

| t
0
| > t
n-1, /2
t
0
> t
n-1,
t
0
< - t
n-1,

d = |
0
|/
d = (
0
)/
d = (
0
)/
3
conocidos y
: H
2
2
2
1
2 1 0

=

n m
x x
z
2
2
2
1
2 1
0

=
H
1
:
1

2
H
1
:
1
>
2
H
1
:
1
<
2

| z
0
| > z
/2
z
0
> z

z
0
< - z


d = |
1

2
|/
2
2
2
1
+
d = (
1

2
)/
2
2
2
1
+
d = (
2

1
)/
2
2
2
1
+
4
os desconocid
: H
2
2
2
1
2 1 0
=
=

n
1
m
1
s
x x
t
c
2 1
0
+

=

H
1
:
1

2
H
1
:
1
>
2
H
1
:
1
<
2

| t
0
|>t
m+n-2,/2
t
0
> t
m+n-2,
t
0
<- t
m+n-2,

d = |
0
|/ 2
d = (
0
)/ 2
d = (
0
)/ 2
IINF, ITIM, ITIG/S, ITIE, ITIEI
Estadstica - Mtodos Estadsticos de la Ingeniera
Curso 2 (S1, S2)/2009-2010




8.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/3


Caso
Hiptesis nula Estadstico del Contraste Hiptesis
alternativa
Regin crtica o de
rechazo
Parmetro de la curva CO
5
os desconocid
: H
2
2
2
1
2 1 0

=

n
s
m
s
x x
t
2
2
2
1
2 1
0
+

=

( ) ( )
1 n
2
n /
2
2
s
1 m
2
m /
2
1
s
2
n
2
2
s
m
2
1
s
k

+
=


H
1
:
1

2
H
1
:
1
>
2
H
1
:
1
<
2

| t
0
| > t
k, /2
t
0
> t
k,
t
0
< - t
k,

----
----
----
6
Datos emparejados
0 : H
D 0
=
n / s
d
t
d
0
=
H
1
:
d
0

H
1
:
d
> 0

H
1
:
d
< 0
| t
0
| > t
n-1, /2
t
0
> t
n-1,
t
0
< - t
n-1,

----
----
----
7 2
0
2
0
: H = ( )
2
0
2
2
0
s 1 n

=
H
1
:
2

2
0


H
1
:
2
>
2
0
H
1
:
2
<
2
0

2
0
>
2
n-1, /2


2
0
<
2
n-1, 1/2

2
0
>
2
n-1,

2
0
<
2
n-1,1-

=/
0


=/
0
=/
0

IINF, ITIM, ITIG/S, ITIE, ITIEI
Estadstica - Mtodos Estadsticos de la Ingeniera
Curso 2 (S1, S2)/2009-2010




8.2.4 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/3
Caso
Hiptesis nula Estadstico del Contraste Hiptesis
alternativa
Regin crtica o de
rechazo
Parmetro de la curva
CO
8 2
2
2
1
0
: H =
2
2
2
1
0
s / s f =
H
1
:
2
1

2
2


H
1
:
2
1
>
2
2

f
0
> F
/2
(m-1,n-1)


f
0
< F
1-/2
(m-1,n-1)

f
0
> F

(m-1,n-1)
=
1
/
2


=
1
/
2

9
0 0
p p : H =
( )
0 0
0
0
p 1 np
np x
z

=
H
1
: p p
0
H
1
: p > p
0


H
1
: p < p
0

| z
0
| > z
/2
z
0
> z

z
0
< - z


----
----
----
10
2 1 0
p p : H =

=
n
1
m
1
) p 1 ( p
p p
z
2 1
0


2 1
p
n m
n
p
n m
m
p
+
+
+
=

H
1
: p
1
p
2
H
1
: p
1
> p
2


H
1
: p
1
< p
2

| z
0
| > z
/2
z
0
> z

z
0
< - z


----
----
----




IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009




Material Comp. Tema 8 Carlos Mat

1/6
MATERIAL COMPLEMENTARIO
TEMA 8
8.1.- En las siguientes preguntas hay cuatro posibles respuestas,
razonar aquella respuesta nica que se considere correcta.
1.- El contraste de hiptesis

2 : H
1 : H
2
2
2
1
1
2
2
2
1
0

A) Es un contraste de hiptesis nula compuesta frente
a hiptesis alternativa compuesta, al hacer
referencia en ambas hiptesis a dos parmetros.
B) Se desarrollar con una distribucin F de Snedecor
independientemente de la distribucin presupuesta
para las dos poblaciones manejadas.
C) Se puede considerar bilateral o de dos colas al
definir cada valor considerado, 1 y 2, dos colas.
D) No verifica ninguno de los apartados anteriores.
2.- En un contraste de hiptesis
A) El error de tipo I es el que se comete al rechazar la
hiptesis alternativa cuando es verdadera.
B) El error de tipo II es el que se comete al aceptar la
hiptesis alternativa cuando es falsa.
C) La probabilidad de cometer el error de tipo I ms la
de cometer el error de tipo II es 1.
D) Ninguno de los apartados anteriores es verdadero.
3.- En todo contraste de hiptesis paramtrico
A) La regin de aceptacin es aquella donde se acepta
la hiptesis nula, aunque tambin puede
considerarse como la regin donde se acepta la
hiptesis alternativa.
B) La regin crtica es una regin de valores para el
parmetro donde se invalida el contraste. De ah
viene su denominacin.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009




Material Comp. Tema 8 Carlos Mat

2/6
C) La regin de rechazo slo es posible construirla a
partir de considerar un nivel de significacin y un
estadstico cuya distribucin en el muestreo sea
conocida bajo la hiptesis nula.
D) Se cumplen al menos dos de las afirmaciones
anteriores.
4.- El valor P de un contraste de hiptesis
A) Simplemente permite disponer de ms informacin
sobre el contraste, pero resulta secundario a la hora
de elaborar un informe sobre las conclusiones del
contraste, ya que lo determinante es si tenemos
evidencia para aceptar o rechazar la hiptesis nula.
B) Es la probabilidad con que aceptamos H
0
para la
muestra observada.
C) Identifica una cota de probabilidad que nos permite
afirmar que aceptaremos H
0
a cualquier nivel de
significacin inferior o igual a esa cota y se
rechazar H
0
a cualquier nivel de significacin
superior al valor de la cota.
D) Cumple al menos dos de las afirmaciones
anteriores.
5.- En un contraste de hiptesis
A) Si la hiptesis nula se acepta al nivel de
significacin del 5%, se acepta tambin al 10%.
B) Si la hiptesis nula se rechaza al nivel de
significacin del 5%, se rechaza tambin al 10 %.
C) Si la hiptesis nula se acepta al nivel de
significacin del 10%, se podra rechazar al 5%,
pero nunca al revs.
D) Se cumplen al menos dos de las afirmaciones
anteriores.
6.- El contraste de bondad del ajuste de Kolmogorov-Smirnov
es un mtodo estadstico que
A) Utiliza como estadstico la mxima discrepancia
entre la funcin de densidad del modelo propuesto y
el histograma de los datos.
B) Se emplea para decidir si los datos de una muestra
estn muy ajustados y, por tanto, considerar la
media de dicha muestra como representativa de
toda la poblacin.
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009




Material Comp. Tema 8 Carlos Mat

3/6
C) Se emplea para aceptar o rechazar un modelo de
probabilidad para la poblacin original de la que se
ha obtenido cada dato.
D) Verifica al menos dos de los tres apartados
anteriores.
7.- Sobre el contraste de bondad del ajuste chi-cuadrado se
puede afirmar que:
A) Se puede aplicar a datos aislados de una variable
discreta.
B) Se puede aplicar a datos aislados de una variable
continua siempre que estos sean al menos 10.
C) Slo es aplicable si disponemos de 5 datos dentro de
cada intervalo o de una frecuencia de 5 en cada valor
de una variable discreta.
D) Al menos dos de los tres apartados anteriores son
verdaderos.
8.- Para contrastar al 5% de nivel de significacin si un dado
es equilibrado, se realizaron 300 tiradas obteniendo
1 2 3 4 5 6
48 53 49 47 51 52

El procedimiento debe ser
A) Un contraste de bondad de ajuste chi-cuadrado.
B) Un contraste de bondad de ajuste de Kolmogorov-
Smirnov.
C) Un contraste paramtrico para la proporcin de unos
del tipo H
0
:
6
1
= p .
D) Contraste de diferencias de proporciones.
8.2.- Los clientes con tarjeta de crdito de unos Grandes Almacenes
venan realizando unos gastos mensuales, en euros, que se
distribuan segn una ley normal de media 300. Debido a la crisis
econmica que impera en la sociedad esta empresa sospecha que ha
disminuido el gasto medio mensual de estos clientes y, si es as,
querra emprender acciones de cara a recuperar el nivel de gasto de
sus clientes, como intensificar la propaganda, realizar campaas
promocionales, etc. Por esta razn se ha analizado el gasto mensual
de 14 clientes resultando un gasto medio muestral de 275 y una
desviacin tpica muestral de 37.925.
Se pide:
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009




Material Comp. Tema 8 Carlos Mat

4/6
A) Obtener un intervalo de confianza, al 95 %, para el gasto
medio mensual en la nueva situacin.
B) Contrastar, al 5 % de significacin, que el gasto medio es
300 frente a la alternativa de que es inferior a 300. Encontrar el valor
P (sig. level en la terminologa de software) de este contraste.
Desarrollar este apartado con el software STATGRAPHICS bajo
WINDOWS (Describe -- Hipypothesis Tests) y mostrar la grfica
de la curva de potencia, interpretndola.
C) Extraer conclusiones operativas para estos Grandes
Almacenes.
8.3.- En el departamento de I + D de la multinacional FILMSA se est
intentando fabricar pelculas de silicio sobre zafiro con un espesor de
0.2 m. Una muestra de nueve de estas pelculas ha proporcionado
los siguientes espesores
0.20, 0.11, 0.19, 0.17, 0.26, 0.17, 0.27, 0.25, 0.17.
a) Contrastar, a un 5 % de significacin, la hiptesis de que
esos datos proceden de una ley normal.
b) Contrastar, a un 5 % de significacin, la hiptesis de que el
espesor medio real por este mtodo de fabricacin es de
hecho 0.2 frente a la alternativa de que no lo es.
8.4.- El encargado de mantenimiento de un taller tiene datos sobre
los tiempos de reparacin de una cierta mquina. En concreto, le han
enviado 10 notas de reparacin en las que se reflejan los siguientes
tiempos, medidos en horas,
2.4, 4.5, 5.3, 6.4, 7.2, 8.2, 8.5, 9, 9.5, 10.
Se pide:
a) Proponer una distribucin de probabilidad para los tiempos
de reparacin. Contrastarla a un nivel de significacin del 5
%.
b) Contrastar la hiptesis de que el tiempo medio empleado en
la reparacin supera las 9 horas a un 1, 5 y 10 % de nivel de
significacin. Calcular el valor P de este contraste.
c) Contrastar la hiptesis de que la desviacin tpica en los
tiempos de reparacin es de 2 horas, a un 1, 5 y 10 % de
nivel de significacin, respectivamente. Obtener el valor P de
este contraste.


IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009




Material Comp. Tema 8 Carlos Mat

5/6
8.5.- Un importante banco dispone de nueve servidores para
gestionar el servicio de e-mail a todas sus sucursales de la
Comunidad Autnoma de Madrid. Cada servidor se encarga de
reenviar los e-mails que recibe a la zona que gestiona. Durante la
ltima hora el nmero de e-mails recibido por cada uno de los
servidores fue, respectivamente: 125, 110, 138, 139, 122, 124, 130,
131 y 129. Comprobar, utilizando el contraste o test de bondad de
ajuste de la
2
(chi-cuadrado) si la llegada de e-mails se distribuye de
manera uniforme entre todos los servidores o, por el contrario, hay
servidores que realizan ms trabajo que otros.

8.6.- Una emisora de radio dispone de tres transmisores A, B y C
para realizar su trabajo. Cada da se utiliza uno de estos transmisores
y a lo largo del da pueden sufrir averas, pero stas son reparadas
inmediatamente. El nmero de averas diarias que sufre A es una v.a.
ditribuida segn una ley de Poisson de media 2, mientras que las
sufridas por el transmisor C siguen una ley poissoniana de intensidad
3 por da. Por lo que se refiere al transmisor B se tiene la siguiente
informacin sobre las averas que se han producido durante 100 das
en que fue utilizado por la emisora.

N averas 0 1 2 3 4
N das 35 40 17 6 2
La emisora tiene programacin las 24 horas del da.
a) Sugerir razonadamente una distribucin a la que se
ajusten los datos. Contrastarla a un nivel de significacin del 5 %.
b) La emisora utiliza A el 30 % de los das, B el 20 % de los
das y C el resto de las ocasiones. Un da elegido al azar registr tan
slo 1 avera, cul es la probabilidad de que ese da fuera utilizado el
transmisor C?
8.7.- En un departamento de I + D un ingeniero ha digitalizado
100 imgenes y ha obtenido la distribucin de frecuencias siguientes
Interv. (0.4,0.44] (0.44,0.48
]
(0.48,0.52
]
(0.52,0.56
]
(0.56,0.6]
N
imgenes
6 25 40 21 8
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009




Material Comp. Tema 8 Carlos Mat

6/6
para la variable X: tamao del fichero correspondiente, en
megabytes.
Se pide:
a) Construir e interpretar el histograma de frecuencias relativas
y el polgono de frecuencias relativas para esta distribucin de
frecuencias.
b) Proponer un modelo de probabilidad para la variable
aleatoria X. Contrastar dicho modelo al 5 % de significacin. Qu
utilidad tendra ese modelo para este ingeniero?
c) Este ingeniero se enfrenta a una tarea consistente en
digitalizar 200 imgenes y considera apropiado el modelo del
apartado anterior. Indicar la expresin de la variable aleatoria a
considerar para estudiar el tamao total de estas 200 imgenes. Con
qu probabilidad podr realizar esta tarea si su disco duro tiene
actualmente una capacidad de 110 megabytes? Debera pedir una
ampliacin de memoria? Razonar las respuestas.
8.8.- La empresa de reparacin de hardware REINFGA
(Reparaciones Informticas Garantizadas), en su continuo esfuerzo
por ofrecer el mejor servicio a sus clientes, ha recogido datos y ha
obtenido la distribucin de frecuencias siguiente para la variable X:
tiempo que factura por la reparacin de un ordenador, en das
laborables, entendiendo este n de das como una variable continua.
Interv. (0,1] (1,2] (2,3] (3,4] (4,5] (5,10]
N
ordenadores
40 20 15 10 5 10

Se pide:
a) Proponer razonadamente un modelo de probabilidad para esa
variable.
b) Contrastar dicho modelo.
c) Esta empresa est negociando con un organismo pblico un
contrato para llevar a cabo la reparacin de 80 ordenadores.
Este organismo est interesado en conocer qu probabilidad
ofrece REINFGA para los sucesos
1) Facturar por la reparacin del lote de 80 ordenadores ms
de 150 das.
2) Emplear en la reparacin de cada uno de esos 50
ordenadores no ms de un da.
Responder de manera razonada.


IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009






Soluc. Material Complementario Tema 8 Carlos Mat
1/2


SOLUCIONES A CUESTIONES Y ALGUNOS PROBLEMAS
DEL MATERIAL COMPLEMENTARIO DEL TEMA 8

8.1.-
1.- D). 2.- D). 3.- C). 4.- C). 5.- B).
6.- C). 7.- A). 8.- A).
8.2.-
A) La salida de STATGRAPHICS en el procedimiento Describe --
Hipypothesis Tests resulta:
95,0% confidence interval for mean: 275,0 +/- 21,8973 [253,103;296,897]


B) Otra parte de dicha salida es
Null Hypothesis: mean = 300,0
Alternative: less than
Computed t statistic = -2,46648
P-Value = 0,0141608
Reject the null hypothesis for alpha = 0,05.
The StatAdvisor
---------------
This analysis shows the results of performing a hypothesis test
concerning the mean (mu) of a normal distribution. The two hypotheses
to be tested are:
Null hypothesis: mu = 300,0
Alternative hypothesis: mu < 300,0
Given a sample of 14 observations with a mean of 275,0 and a standard
deviation of 37,925, the computed t statistic equals -2,46648. Since
the P-value for the test is less than 0,05, the null hypothesis is
rejected at the 95,0% confidence level. The confidence bound shows
that the values of mu supported by the data are less than or equal to
292,95.

8.4.-
a) Normal de media 7.1 y desv. tpica 2.4. Tambin, a efectos de sencillez se puede
proponer Normal de media 7 y desv. tpica 2.5. En este ltimo caso, el estadstico
resulta 0.1844, aceptndose el modelo propuesto a cualquier nivel de significacin
de los utilizados habitualmente.

b) No se puede rechazar que el tiempo medio de reparacin no supera las 9 horas,
a cualquier nivel de significacin de los utilizados habitualmente. El valor P de
este contraste
IINF, ITIM, ITIE, ITIEI, ITIG/S
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S1, S2)/2008-2009






Soluc. Material Complementario Tema 8 Carlos Mat
2/2

>

9 :
9 :
1
0
H
H

sabiendo que el estadstico correspondiente toma el valor -2.4634 es 0.9802.

c) El contraste


=
2 :
2 :
1
0
H
H
es equivalente al contraste


=
4 :
4 :
2
1
2
0
H
H
.
El estadstico toma el valor 13.385 y no se puede rechazar la hiptesis nula a
cualquier nivel de significacin de los utilizados habitualmente. El valor P de este
contraste es aproximadamente 0.15.
8.6.- Poisson de parmetro 0.9. Tambin, a efectos de sencillez se puede proponer
de parmetro 1. El estadstico resulta 0.039 y 0.748, respectivamente;
aceptndose el modelo propuesto en cada caso a cualquier nivel de significacin de
los utilizados habitualmente.

8.8.-
a) Exponencial de parmetro 0.4545.
b) El estadstico vale 0.9726. El valor crtico en el contraste, al 5 % de
significacin, es 9.488 por lo que a dicho nivel de significacin no se puede
rechazar ese modelo y debemos aceptarlo.
c) 1) Por aplicacin del Teorema del Lmite Central resulta 0.9066.
2) Como probabilidad de la interseccin de 80 sucesos independientes de
probabilidad 0.3653, resulta ser 1.027E-35. Es decir, un suceso de
probabilidad nula.

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010




Prctica 1 Carlos Mate
25 aos (1984-2009) de docencia en ICAI
1/7
CASOS PRACTICOS - PRACTICA 1
ESTADISTICA DESCRIPTIVA Y
ANALISIS DE DATOS
MODALIDAD A
Desarrollo del enunciado de la prctica, segn indicaciones al respecto, en
grupos de 3 alumnos ( excepcionalmente 2) formados libremente (no se admitirn
situaciones de alumnos sin grupo, ya que si as fuese el alumno carecera de
capacidad para el trabajo en equipo y, por tanto, para la puesta en prctica de lo
estudiado en la asignatura). Se considerar el D.N.I. del alumno que se encuentre
antes segn el orden alfabtico de apellidos.
MODALIDAD B
Los alumnos, en grupos de de 3 alumnos ( excepcionalmente 2) formados
libremente, propondrn un contexto de ingeniera (preferiblemente informtica) con
sus datos asociados y con un nivel de detalle similar al de la modalidad A, con el
objeto de alcanzar los objetivos que figuran en la ltima pgina de este documento.
En la entrega se incorporar el conjunto de datos (CD -o dispositivo de memoria- y
papel), que debe tener las siguientes caractersticas: al menos 2 atributos (Atributo
U y otro V) y al menos 3 variables cuantitativas continuas de las que conozcamos
los valores que han tomado en los distintos niveles de los atributos.
La resolucin del caso prctico incluir forzosamente los siguientes epgrafes,
con una justificacin de por qu se realiza con las variables concretas elegidas.
1.- Introducir el conjunto de datos en un fichero.
2.- Anlisis estadstico de una variable.
a) Construir e interpretar la tabla de frecuencias para los datos de una
variable y guardarla en el soporte correspondiente con el comentario
apropiado.
b) Construir e interpretar el histograma de frecuencias no acumuladas
(resp. acumuladas) para los datos de una variable (resp. otra) y
guardarlo en el soporte correspondiente con el comentario apropiado.
c) Calcular e interpretar las medidas estadsticas de una variable para los 2
niveles del atributo U y guardar la informacin en el soporte
correspondiente.
d) Representar en grfico de cajas la situacin anterior y grabarlo en el
soporte correspondiente, interpretando dicha representacin.
e) Calcular e interpretar las medidas estadsticas de una variable para los
diferentes niveles del atributo V y guardar la informacin en el soporte
correspondiente.
ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010




Prctica 1 Carlos Mate
25 aos (1984-2009) de docencia en ICAI
2/7
f) Representar en grfico de cajas con muescas la situacin anterior y
grabarlo en el soporte correspondiente, interpretando dicha
representacin y extrayendo conclusiones sobre la situacin analizada.
3.- Anlisis estadstico de dos variables.
a) Construir e interpretar el diagrama de dispersin para dos variables
cuantitativas consideradas y guardarlo en el soporte correspondiente
con el comentario apropiado.
b) Llevar a cabo un anlisis de regresin con dos de las variables
cuantitativas consideradas y guardar la salida correspondiente, que
debe incluir diagrama de dispersin con recta de regresin y anlisis de
regresin, en el soporte correspondiente con el comentario apropiado.
Interpretar la informacin ms relevante que se pueda extraer tanto de
la pantalla de texto como del grfico. Desarrollar una ampliacin con
este procedimiento paralela al enunciado del apartado 3 b) de la
modalidad A.
c) Qu regresin (lineal, parablica, exponencial, etc.) es ms adecuada
para tratar de establecer una relacin entre dos de las variables
consideradas? Qu utilidad tendra dicha regresin? Razonar las
respuestas. Guardar las pantallas grficas y de texto que sustenten la
respuesta a la primera pregunta en el soporte correspondiente con los
comentarios apropiados a las mismas.
CALIFICACIN
Para conseguir que dentro de los grupos se reparta de forma equitativa el trabajo
entre sus integrantes, cada uno de ellos tendr que evaluar la participacin
realizada por todos los miembros del grupo en la consecucin del trabajo. De esta
manera, a la modalidad A se le otorgar una nota mxima de 10 puntos por alumno
(30 puntos si el grupo est integrado por 3 alumnos) que ser repartida por los
propios integrantes del grupo. A la modalidad B se le otorgar una nota mxima de
15 puntos por alumno. Esta segunda modalidad deber incluir una justificacin
detallada sobre la eleccin del contexto y los datos.
MODALIDAD A
NOTA PREVIA A LA REALIZACION DEL TRABAJO.-
En lo que sigue, las letras a b c d e f g h representan, respecto del nmero de D.N.I.
de cada alumno lo siguiente:
a - decena de milln b - unidad de milln
c - centena de millar d - decena de millar
e - unidad de millar f - centena
g - decena h - unidad
Por ejemplo, si el D.N.I de un alumno es 50.134.725, las letras se sustituirn de la
forma siguiente:
ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010




Prctica 1 Carlos Mate
25 aos (1984-2009) de docencia en ICAI
3/7
a = 5 b = 0 c = 1 d = 3 e = 4 f = 7 g = 2 h = 5
ENUNCIADO
La empresa NETSTATS se dedica a mediciones estadsticas asociadas a
conexiones a la red, mediante un programa ejecutado en una mquina.
Perodo Veloc_A Perd_A Inef_A Veloc_B Perd_B Inef_B
Noche 48h 1a 150c 48g 1a 150b
Noche 49h 13 158g 49b 13 159d
Noche 93f 4 49h 93f f 40d
Noche 84e 1d 214f 875 1e 214d
Tarde 91g 4 54f 91a 0 52g
Tarde 37a 21 192f 37a 23 193a
Tarde 34a a 63e 34d 1 63a
Tarde 35a 4 52e 55a f 37b
Noche 52a f 5g3 105c b 45a
Maana 67h 1a 143b 94c h 35c
Tarde 38c 7 143f 384 5 1852
Noche 29g 2d 124f 29a 2f 114g
Noche 45c 14 136g 45b 7 73a
Maana 379 28 1874 378 29 193g
Maana 32g 19 1422 32f 16 1244
Tarde 58d 1h 95b 349 e 53c
Tarde 47e 1c 153b 64g e 46g
Tarde 37f 14 113e 36d 7 63c
Noche 98a 43 1945 775 32 2345
Maana 31a 9 82f 31a 7 84b
Maana 37f g 614 37g f 64d
Tarde 54b 1a 873 55h b 43g
Tarde 486 14 1632 528 13 1783
Maana 373 42 1350 346 15 1213
Tarde 382 13 953 354 c 567
ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010




Prctica 1 Carlos Mate
25 aos (1984-2009) de docencia en ICAI
4/7

Se eligen dos proveedores de acceso A y B desde los cuales se realizan las
conexiones y se eligen aleatoriamente varios servidores o pginas web (entre 10 y
15) a los que se va a llamar.
El programa realiza conexiones continuamente recogiendo datos sobre tiempo
medio empleado en las conexiones o velocidad de acceso, en centsimas de
segundo, nmero de conexiones perdidas (en porcentaje) y una medida de
ineficacia que relaciona la velocidad con el nmero de prdidas.
Los datos disponibles se han obtenido mediante los dos proveedores A y B;
as como durante los periodos de maana, tarde y la noche a lo largo de un mes.
Los datos recogidos se presentan en la tabla de la pgina 3.
Se pide:

1.- Introducir los datos en un fichero cuyo nombre ser STNETefg y en las
variables cuyos nombres sern Periodo, Veloc_A, Perd_A, Inef_A, Veloc_B,
Perd_B e Inef_B.


2.-
a) Construir e interpretar la tabla de frecuencias para los datos de la
ineficacia con el proveedor B y guardarla en el soporte correspondiente
con el comentario apropiado.
b) Construir e interpretar el histograma de frecuencias relativas no
acumuladas (resp. acumuladas) para los datos de ineficacia con el
proveedor A (resp. B). Interpretarlos. Guardarlos en el soporte
correspondiente con el comentario apropiado.
c) Calcular e interpretar las medidas estadsticas (excepto la suma) para
los datos de ineficacia, cuando se considera cada proveedor por
separado. Guardar la informacin en el soporte correspondiente.
d) Representar en grfico de cajas la situacin anterior y grabarlo en el
soporte correspondiente, interpretando dicha representacin. Se puede
considerar que estos proveedores, en cuanto a ineficacia en la conexin,
no presentan diferencias significativas?
e) Analizar las prdidas en el proveedor B segn el momento del da
considerado, mediante grficos de cajas con muescas. Interpretar y
sacar conclusiones. Guardar la informacin en el soporte
correspondiente con el comentario apropiado.


3.-
a) Construir e interpretar el diagrama de dispersin para las variables
Perd_B (Independent variable) e Inef_B (Dependent variable), y
guardarlo en el soporte correspondiente con el comentario apropiado.
ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010




Prctica 1 Carlos Mate
25 aos (1984-2009) de docencia en ICAI
5/7
b) Llevar a cabo un anlisis de regresin con dichas variables cuantitativas
y guardar la salida correspondiente, que debe incluir diagrama de
dispersin con recta de regresin y anlisis de regresin, en el soporte
correspondiente con el comentario apropiado. Interpretar la informacin
ms relevante que se pueda extraer tanto de la pantalla de texto como
del grfico. Obtener de la pantalla de texto anterior las siguientes
medidas estadsticas m a b b
Y X X Y 1 1 1 1 , , , ,
, , , . Interpretar y comentar, en el
contexto del problema real, la informacin de Estadstica Descriptiva
mostrada en la pantalla anterior.
c) Pregunta de Ampliacin.- Qu regresin (lineal, parablica,
exponencial, etc.) es ms apropiada para tratar de establecer una
relacin entre ineficacia y prdidas en cada proveedor? Qu utilidad
tendra dicha regresin? Razonar las respuestas. Guardar las pantallas
grficas y de texto que sustenten la respuesta a la primera pregunta en
el soporte correspondiente con los comentarios adecuados a las mismas.
NOTAS MUY IMPORTANTES PARA LA ENTREGA DEL TRABAJO
La entrega de la Prctica 1 se canalizar a travs del delegado del curso y se
podr realiza el jueves 20 de Mayo. Durante esa semana, cada miembro del grupo
deber enviar un correo electrnico al profesor en el que detalle su reparto de puntos entre
todos los miembros de su grupo.
Las respuestas debern estar escritas a mano (alternndose los miembros del
equipo la escritura de las respuestas a los diferentes epgrafes), y en letra
perfectamente legible, indicando previamente el nmero de pregunta y apartado. En
cada epgrafe se adjuntarn al texto las pantallas y/o grficos correspondientes a dicho
epgrafe mediante fotocopias reducidas pegadas. En la cabecera de las cinco nicas
hojas de respuestas, las cuales debern estar grapadas, figurarn, por este orden, los
apellidos, nombre, curso (segn las listas oficiales de Secretara) y D.N.I. de los alumnos
del grupo.
La primera hoja se destinar a la particularizacin a cada grupo de alumnos de los
datos de los diferentes epgrafes de los datos propuestos, como resultado de imprimir
con STATGRAPHICS el fichero con sus variables, mediante el procedimiento
correspondiente.
Adems, se entregar un CD o dispositivo de memoria (no se admiten
disquettes de 3.5) con etiqueta incluida y libre de virus, so pena de suspender la
asignatura, cuyo ttulo ser ITIG/S-Estadstica Bsica-CP1-2010 y en el que figurarn,
por este orden, los apellidos, nombre, curso (segn las listas oficiales de Secretara) y
D.N.I. de los alumnos. Este CD o dispositivo de memoria deber contener los ficheros y
variables, as como diapositivas (slides) o statfolios, statgallerys, y statreporters, que
recojan las pantallas de texto y grficas sobre las que se apoyen las respuestas a los
apartados del enunciado de la prctica. Adems, se deber indicar la modalidad elegida y el
nmero de la versin de STATGRAPHICS con la que se ha realizado la prctica, siendo
preferible la Versin 4 bajo WINDOWS que se encuentra disponible en las aulas de
nuestra Escuela.
El soporte utilizado para guardar las pantallas de texto y grficas debe numerarse de
acuerdo con los apartados del enunciado.
El incumplimiento de alguno de los aspectos de la normativa anterior se
sancionar con una reduccin de la calificacin en la prctica.
ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010




Prctica 1 Carlos Mate
25 aos (1984-2009) de docencia en ICAI
6/7

CONTENIDOS TEMATICOS Y OBJETIVOS DEL TRABAJO
Este primer caso prctico contempla contenidos de Estadstica Descriptiva, Anlisis
de Datos y Regresin. Los objetivos del mismo, todo ello sobre la base de un trabajo en
equipo, son:
1.- Iniciarse en el razonamiento estadstico aplicndolo al caso de ingeniera
analizado.
2.- Utilizar software estadstico, introduciendo datos en un fichero.
3.- Construir e interpretar tablas, diagramas y grficos sobre los datos.
4.- Obtener con el ordenador medidas estadsticas para los datos,
interpretndolas en el contexto del caso analizado.
5.- Iniciarse en la escritura de informes estadsticos aplicndolos al caso
analizado.
COMPETENCIAS
El desarrollo adecuado de este caso prctico ayuda al alumnado a
alcanzar las siguientes competencias.
Competencias transversales genricas
COMPETENCIAS TCNICAS TRANSVERSALES
CT1 Anlisis y sntesis
CT2 Resolucin de problemas
CT3 Comunicacin oral y escrita de conocimientos en lengua propia
CT5 Gestin de la Informacin
CT6 Aplicacin de la informtica en el mbito de estudio
CT7 Capacidad de organizar y planificar
CT8 Toma de decisiones
COMPETENCIAS SISTMICAS
CS1 Aplicar conocimientos
CS2 Aprendizaje y trabajo autnomos
CS4 Habilidades de investigacin*
CS5 Adaptacin a nuevas situaciones*
CS6 Creatividad*
COMPETENCIAS PERSONALES Y PARTICIPATIVAS
CP1 Objetivacin, identificacin y de organizacin
CP2 Razonamiento crtico
CP3 Trabajo en equipo
CP5 Relaciones personales
CP6 Capacidad para comunicarse con personas no expertas en la materia*
Las competencias marcadas con * se alcanzan slo con la modalidad B.
Adicionalmente, la modalidad B profundiza ms que la A en una adquisicin de
mayor calidad de las otras competencias.

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010




Prctica 1 Carlos Mate
25 aos (1984-2009) de docencia en ICAI
7/7

ORIENTACIONES PARA EL DESARROLLO DEL TRABAJO
Los conceptos estadsticos subyacentes en este trabajo, as como caractersticas
de los procedimientos, modo de trabajar, interpretaciones, anlisis similares, etc.; se
pueden consultar en los Captulos II, V, VI y XI de la obra siguiente.
Mat, C. (1995). Curso General Sobre STATGRAPHICS. Procedimientos. Mtodos
Estadsticos. Aplicaciones. Ejercicios Resueltos. Editorial Universidad Pontificia
Comillas. Madrid.
Tambin se puede consultar
Mat, C. & Oriol, N. (1996). Curso General Sobre STATGRAPHICS. Anexo para la
Versin Plus for Windows. Editorial Universidad Pontificia Comillas. Madrid.

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010



Material IS_Abril_2010 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/1
NORMAS DE CALIFICACION DE
ESTADSTICA BSICA

Profesor: Dr. D. Carlos Mat Jimnez


MATERIAL QUE SE PODR UTILIZAR EN EL EXAMEN
INTERSEMESTRAL ABRIL 2010

Los exmenes son de carcter terico-prctico, permitindose en la
parte prctica, exclusivamente y de manera intransferible, la utilizacin de
lo siguiente:
6 hojas tamao DIN A-4 grapadas con material terico del
curso o cursos anteriores, incluidas en una carpeta. En
beneficio del propio estudiante se recomienda que sean
elaboradas por ella/l misma/mismo.
Tabla de frmulas estadsticas, incluida en la carpeta anterior.
Calculadora u ordenador porttil que no necesite conexin a la
red elctrica y que no est conectado con otros dispositivos.

Est terminantemente prohibido el uso de telfonos mviles o el uso
de Internet en el ordenador.

En la parte terica se podr utilizar una calculadora no programable.

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
22 de Abril de 2010




Ex. Intersemestral Abril Prob. 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/4
Apellidos..........................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN DE PROBLEMAS DEL INTERSEMESTRAL
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe
abstenerse de formular preguntas sobre su contenido. Cada problema es evaluado sobre 10
puntos, figurando la puntuacin de cada apartado al final del mismo. El problema 1 (2) tiene
una valoracin del 40 (30) %. No se pueden quitar las grapas de ningn documento del
examen.
4) La duracin mxima de este examen es de 1 hora y 10 minutos.
--------------------
PROBLEMA 1
Algunos investigadores estn planteando aplicar tcnicas estadsticas a
la problemtica de los crackers (aquellos hackers que se entrometen en las
redes con fines dainos). Un estudio del nmero de webs visitadas (X) y
duracin de la conexin en minutos (Y) de 10 crackers ha dado los siguientes
resultados
= = =
= = =

n n n
i i i i
i 1 i 1 i 1
x y xy
37,6; 74,8; 1982,3
n n n
.
= =
= =

n n
2 2
i i
i 1 i 1
x y
1967; 7477, 4
n n
.
Se pide:
A) Calcular e interpretar la recta de regresin de Y sobre X. (3)
B) Evaluar de manera razonada la calidad del ajuste anterior. (2)
C) Qu cantidad de webs se le podra permitir visitar a un cracker antes de
cortarle la conexin, si la duracin de la conexin en la nueva ley contra
ataques informticos para personas acusadas de ser crackers ha de ser
de 1 hora? Responder de manera razonada. (2)
D) Construir de manera razonada e interpretar el grfico de cajas para los
siguientes datos de duracin de la conexin.
y
i
85 70 37 140 65 35 30 32 95 159
Utilizar el papel cuadriculado adjunto tomando un cuadro como 5
minutos. (3)
ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
22 de Abril de 2010




Ex. Intersemestral Abril Prob. 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/4












ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
22 de Abril de 2010




Ex. Intersemestral Abril Prob. 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/4

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
22 de Abril de 2010




Ex. Intersemestral Abril Prob. 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/4

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
22 de Abril de 2010




Ex. Intersemestral Abril Prob. 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/4
Apellidos..........................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN DE PROBLEMAS DEL INTERSEMESTRAL
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe
abstenerse de formular preguntas sobre su contenido. Cada problema es evaluado sobre 10
puntos, figurando la puntuacin de cada apartado al final del mismo. El problema 1 (2) tiene
una valoracin del 40 (30) %. No se pueden quitar las grapas de ningn documento del
examen.
4) La duracin mxima de este examen es de 1 hora y 5 minutos.
--------------------
PROBLEMA 2
En una Intranet de la empresa ICAITHEBEST, el 60 % de los
empleados consulta la base de datos A, el 35 la base de datos B y el 15 %
ambas bases de datos, habiendo empleados que no consultan ni A ni B.
a) Qu proporcin de empleados consultan alguna de las bases A
B? Qu porcentaje de empleados consulta slo la base A?
Responder de manera razonada. (2)

Segn la empresa, hay 200 empleados (numerados del 1 al 200) y de
ellos slo 30 han nacido fuera de Espaa. Se va a sortear entre los
empleados 3 premios, seleccionando al azar 3 nmeros del 1 al 200.
b) Calcular razonadamente la probabilidad de que los 3 premios
recaigan en extranjeros. (2)
c) Calcular razonadamente la probabilidad de que resulten premiados
tanto espaoles como extranjeros. (2,5)

La siguiente tabla informa sobre los salarios anuales, en miles de euros,
y la antigedad, en aos, de los 200 empleados.

SALARIOS
(10,12] (12,20] (20,36] (36,68] (68,132]
ANTIG.
(0,1] 20 10 4 1 0
(1,2] 15 25 12 2 0
(2,6] 5 10 20 3 2
(6,14] 0 5 14 36 5
(14,46] 0 0 2 8 1

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
22 de Abril de 2010




Ex. Intersemestral Abril Prob. 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/4
Se pide:
d) Determinar e interpretar la media y la mediana de los salarios de los
empleados que no superan los 2 aos en la empresa, comparando
ambas medidas e informando sobre la asimetra de la distribucin.
(3,5)






ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
22 de Abril de 2010




Ex. Intersemestral Abril Prob. 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/4

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
22 de Abril de 2010




Ex. Intersemestral Abril Prob. 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/4
























ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2008-2009
22 de abril de 2008 24 de abril de 2009




Ex. Intersemestral Abril Prob. 1 C. Mat & R. Caro 1/4
Apellidos................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN DE PROBLEMAS DEL INTERSEMESTRAL
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe abstenerse de
formular preguntas sobre su contenido. Cada problema es evaluado sobre 10 puntos, figurando la
puntuacin de cada apartado al final del mismo. El problema 1 tiene una valoracin del 40 % y el 2 del
30 %. No se pueden quitar las grapas de ningn documento del examen.
4) La duracin mxima de este examen es de 1 hora y 10 minutos.
5) Responder a las preguntas slo en el espacio reservado al efecto que es el anverso de cada hoja. El reverso
de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 1
Un centro de trabajo digital de alto rendimiento ha analizado las
variables
X: Nmero de pedidos que llegan a este centro cada hora, en la
semana 1.
Y: Nmero de pedidos que llegan a este centro cada hora, en la
semana 2.
Tras observar una muestra aleatoria simple de 53 periodos de
una hora en la semana 1, se obtuvo la siguiente tabla.

Valor de X 0 1 2 3 4 5 6 7 8 9
Frecuencia 1 2 6 7 10 16 8 2 0 1
a) Calcular e interpretar la mediana y la desviacin tpica. (3)

La observacin conjunta de 10 periodos de una hora en ambas
semanas proporcion la siguiente tabla.

X 5 2 3 1 6 2 5 3 7 5
Y 6 7 1 4 9 3 8 2 8 7
b) Calcular e interpretar el coeficiente de correlacin de
Pearson y el coeficiente de determinacin lineal. (2)
c) Determinar la recta de regresin de Y sobre X, interpretando
el significado prctico de sus coeficientes. (3)
d) Hacer predicciones acerca del valor de Y para los valores de
X: 4 y 9, justificando la calidad de dichas predicciones. (2)
ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2008-2009
22 de abril de 2008 24 de abril de 2009




Ex. Intersemestral Abril Prob. 1 C. Mat & R. Caro 2/4
































ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2008-2009
22 de abril de 2008 24 de abril de 2009




Ex. Intersemestral Abril Prob. 1 C. Mat & R. Caro 3/4












ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2008-2009
22 de abril de 2008 24 de abril de 2009




Ex. Intersemestral Abril Prob. 1 C. Mat & R. Caro 4/4

ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2008-2009
22 de abril de 2008 24 de abril de 2009




Ex. IS Abril Prob. 1 - Solucin C. Mat & R. Caro 1/3
SOLUCION AL PROBLEMA 1
(Propuesto por Prof. Carlos Mat)
a) Para calcular la mediana, ampliamos la tabla con la
frecuencia acumulada.

Valor de X 0 1 2 3 4 5 6 7 8 9
Frecuencia 1 2 6 7 10 16 8 2 0 1
Frec. Acum. 1 3 9 16 26 42 50 52 52 53

Como N = 53, entonces
( ) 27 53
1
2
5 Me x x
| | (
+
|
(
\
= = = . Al ser el punto que
reparte el conjunto de datos en dos partes iguales, nos indica que en
la mitad de las horas llegan 5 pedidos o memos, mientras que en la
otra mitad llegan ms de 5.
La aplicacin de la definicin lleva a
1
4.2641 ped/hora
k
i i
i
n x
x
N
=
= =

.
Anlogamente,
2
2 1
2
21.056 ped /hora
k
i i
i
n x
a
N
=
= =

. Por tanto,
2 2 2 2
2 1
21.056 4, 2641 2.87 ped /hora s a a = = = . As,
2
1.695 ped s s = + =
El nmero de pedidos se desva del n medio en 1.695 pedidos.
Es decir, en al menos 3 de cada 4 horas el # pedidos estar en el
intervalo 2 x s .

Errores ms comunes.-
(1) Calcular mal la mediana. La solucin 4,5 es errnea.
(2) Interpretacin errnea de la mediana.
(3) Calcular mal la media.
(4) Calcular mal la desviacin tpica.
(5) Falta la interpretacin de la desviacion tpica.

b) Para un conjunto de datos bidimensional o una distribucin
de frecuencia bidimensional, el coeficiente de correlacin
lineal de Pearson viene dado por

( ) ( ) , ,
3, 35
0, 676
1,868 2, 65 ( ) ( )
M
x y
Cov X Y Cov X Y
r
S S V X V Y
= = = =


ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2008-2009
22 de abril de 2008 24 de abril de 2009




Ex. IS Abril Prob. 1 - Solucin C. Mat & R. Caro 2/3
Al ser positivo y prximo a 0,7, indica que entre ambas
variables hay una cierta relacin directa lineal. Es decir, aumentos (o
disminuciones) en los pedidos en la semana 1 se trasladan a
aumentos (o disminuciones) en los pedidos en la semana 2. Dicha
relacin no es fuerte pero tampoco despreciable.

El coeficiente de determinacin lineal se obtiene como el
cuadrado de r, aunque tambin se puede definir a partir de las sumas
de cuadrados, viniendo en porcentaje. As,
( )
2
2 2
,
0, 676 0, 4561
( ) ( )
Cov X Y
SCR
r
V X V Y SCTO
= = = =


Nos indica que el 45,61 % de la variacin de los datos de
pedidos en la semana 2 respecto a la media de pedidos en dicha
semana (medida dicha variacin por SCTo), se explica por la relacin
lineal (SCR, con R de regresin) con el n de pedidos en la semana 1.
La otra mitad de variacin se explicar por otras relaciones distinta a
la lineal, relaciones con otras variables y causas aleatorias.

Errores ms comunes.-
(1) Confusin en la frmula de r.
(2) No se interpreta r.
(3) No se calcula r cuadrado.
(4) Errores en la interpretacin de r y r cuadrado.
c) A partir de los clculos anteriores, la recta de regresin de Y
sobre X viene dada por
( , )
( )
( )
Cov X Y
y y x x
V X
=
Es decir,
3, 35
5, 5 ( 3, 9)
3, 49
y x =
La recta ser 1, 756 0, 9598 y x = + . Esta recta nos dice que si
queremos relacionar linealmente Y con X de manera ptima
(consiguiendo el menor error), lo haremos con 1, 756 0, 9598 y x = + . Esto
significa que la ordenada en el origen es 1,756; es decir, el n de
pedidos que hay en una semana, al margen de lo que haya pasado la
semana anterior, es 1,756. La pendiente es 0,9598; lo que nos
informa de que, dentro del rango de variacin considerado, por cada
pedido adicional en la semana 1, tendremos casi otro pedido (0,9598
de pedido) en la semana 2.

ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2008-2009
22 de abril de 2008 24 de abril de 2009




Ex. IS Abril Prob. 1 - Solucin C. Mat & R. Caro 3/3

Errores ms comunes.-
(1) Se calcula mal la pendiente de la recta, dividiendo por la desviacin tpica de X.
(2) No se interpreta el significado prctico de sus coeficientes (aunque a veces se
interpreta la recta que NO se pide).
d) Las mejores predicciones acerca del valor de Y para los
valores de X: 4 y 9, vienen dadas por el valor que aparezca
en la recta de regresin sustituyendo x por 4 y 9.
( )
^
4 1, 756 0, 9598 4 5, 59 y x = = + =
( )
^
9 1, 756 0, 9598 10 10, 39 y x = = + =
La calidad de estas predicciones depende de dos factores:
El valor x est dentro o fuera del rango observado de x.
El error de la prediccin es menor cuanto mayor sea r
cuadrado.
Por ello, la prediccin ( )
^
4 5, 59 y x = = tiene sentido, aunque tendr
asociado bastante error. Mientras que la prediccin
( )
^
9 10, 39 y x = = adolece tambin de bastante error, incluso ms
que la anterior por estar ms alejada de la media, pero adems
ha de manejarse con mucha ms cautela ya que la abscisa se
sale del rango observado.

Errores ms comunes.-
(1) Se arrastran errores de apartados anteriores.
(2) No se informa de la calidad de las predicciones.

IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersemestral Nov. Prob. 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/4
Apellidos..........................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN DE PROBLEMAS DEL INTERSEMESTRAL
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe
abstenerse de formular preguntas sobre su contenido. Cada problema es evaluado sobre 10
puntos, figurando la puntuacin de cada apartado al final del mismo. El problema 1 (2) tiene
una valoracin del 40 (30) %. No se pueden quitar las grapas de ningn documento del
examen.
4) La duracin mxima de este examen es de 1 hora y 5 minutos.
5) Responder a las preguntas slo en el espacio reservado al efecto que es el anverso de cada hoja.
El reverso de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 1
En el artculo Web page design and download time de Jing Zhi
(http://www.cmg.org/downloads/JingZhi.pdf) se maneja informacin sobre las variables
X e Y que representan el nmero de paquetes observados en una transmisin por
Internet y el tiempo de descarga en esa transmisin, en segundos, respectivamente,
segn se muestra a continuacin.
y
i
0.214 0.290 0.412 0.164 0.295 0.530 0.633 0.774 0.384 0.342 0.142
x
i
16 28 42 12 28 57 69 84 42 26 14
Se pide:
A) Construir e interpretar el grfico de cajas para los datos del nmero de
paquetes, razonando si hay observaciones extremas. Utilizar el papel
cuadriculado adjunto tomando un cuadro como 4 paquetes. (4)
B) Calcular e interpretar el coeficiente de correlacin lineal y las tres sumas de
cuadrados. (4)
C) Qu cantidad de paquetes se pueden transmitir si el tiempo ha de ser de 0.8
segundos? Responder de manera razonada. (2)

IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersemestral Nov. Prob. 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/4












IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersemestral Nov. Prob. 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/4

IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersemestral Nov. Prob. 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/4

IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersem Nov. Prob. 1-Soluc Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/3
SOLUCION AL PROBLEMA 1 DEL IS
a) Los N = 11 datos del nmero de paquetes, ordenados de
menor a mayor valor, son:
12, 14, 16, 26, 28, 28, 42, 42, 57, 69, 84
Por tanto,
( )
( )
( )
2 6
1 3
3 9
28 paquetes
16 paquetes
57 paquetes
57 16 41 paquetes
Me Q x
Q x
Q x
RI
= = =
= =
= =
= =

Ya que
( )
1 1
1, 5 0, no es dato extremo Q RI x < .
Al ser
( )
3 11
1, 5 84, no es dato extremo Q RI x + > .
La representacin grfica es









Se trata de una distribucin asimtrica a la derecha, lo que
significa que en las transmisiones el n de paquetes bajo (50 %
inferior) se concentra en un intervalo bastante ms corto (14
paquetes) que el n de paquetes alto (50 % superior) que se
extiende en un intervalo mayor (56 paquetes). El 25 % inferior
de los paquetes transmitidos no supera los 16 paquetes,
mientras que el 25 % superior supera los 57 paquetes.
Errores ms comunes.-
(1) No se interpreta el grfico de cajas.

Box-and-Whisker Plot
0 20 40 60 80 100
x_num_paquet
IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersem Nov. Prob. 1-Soluc Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/3
b) Para proceder con el anlisis pedido calculamos el
coeficiente de correlacin lineal de Pearson. Para un
conjunto de datos bidimensional o una distribucin de
frecuencia bidimensional, viene dado por

( ) ,
4,1952
0, 991407
( ) ( ) 504, 54 0, 03549
Cov X Y
r
V X V Y
= = =


Al ser positivo y muy prximo a 1, indica que entre ambas
variables hay una muy acusada relacin lineal directa. Es decir,
aumentos (o disminuciones) en el nmero de paquetes enviados se
traslada aumentos (o disminuciones) en el tiempo de descarga de esa
transmisin.

Las sumas de cuadrados son

SCTo = 0,39041 seg.^2, representa la variacin total en los
datos de tiempo de descarga respecto al tiempo medio.
SCR = 0,383702 seg.^2, representa la parte de la variacin
anterior total de los datos de tiempo de descarga respecto al tiempo
medio, atribuida o explicada por la relacin lineal de esos tiempos con
el nmero de paquetes.
SCE = 0,0067 seg.^2, informa sobre la parte de la variacin
anterior total de los datos de tiempo de descarga respecto al tiempo
medio, no atribuida o a la relacin lineal de esos tiempos con el
nmero de paquetes. Se atribuye a relaciones no lineales de Y con X,
de Y con otras variables (como, por ejemplo, el trfico de la red, la
hora del da, etc) y causas aleatorias

Errores ms comunes.-
(2) Confusin en la frmula de r.
(3) No se interpreta r.
(4) Errores en la interpretacin de r.
(5) Se calculan mal las sumas de cuadrados.
(6) No se interpretan las sumas de cuadrados. O si se hace es de forma errnea.

c) Al querer que Y = 0,8 debemos buscar, es decir, predecir de
la mejor manera posible, el x que corresponde a y = 0,8.
Por tanto, emplearemos la recta de regresin de X sobre Y
que viene dada por
( , )
( )
( )
Cov X Y
x x y y
V Y
=
IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersem Nov. Prob. 1-Soluc Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/3
Es decir, 118, 201 6, 91652 x y = . Por tanto, 118, 2 0, 8 6, 91652 87, 6442 x = = ;
luego se podrn transmitir 87 paquetes.

Errores ms comunes.-
(7) Se calcula mal la recta, calculando la de Y sobre X.

IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersem Nov. Prob. 1-Soluc Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/3
SOLUCION AL PROBLEMA 1 DEL IS
a) Los N = 11 datos del nmero de paquetes, ordenados de
menor a mayor valor, son:
12, 14, 16, 26, 28, 28, 42, 42, 57, 69, 84
Por tanto,
( )
( )
( )
2 6
1 3
3 9
28 paquetes
16 paquetes
57 paquetes
57 16 41 paquetes
Me Q x
Q x
Q x
RI
= = =
= =
= =
= =

Ya que
( )
1 1
1, 5 0, no es dato extremo Q RI x < .
Al ser
( )
3 11
1, 5 84, no es dato extremo Q RI x + > .
La representacin grfica es









Se trata de una distribucin asimtrica a la derecha, lo que
significa que en las transmisiones el n de paquetes bajo (50 %
inferior) se concentra en un intervalo bastante ms corto (14
paquetes) que el n de paquetes alto (50 % superior) que se
extiende en un intervalo mayor (56 paquetes). El 25 % inferior
de los paquetes transmitidos no supera los 16 paquetes,
mientras que el 25 % superior supera los 57 paquetes.
Errores ms comunes.-
(1) No se interpreta el grfico de cajas.

Box-and-Whisker Plot
0 20 40 60 80 100
x_num_paquet
IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersem Nov. Prob. 1-Soluc Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/3
b) Para proceder con el anlisis pedido calculamos el
coeficiente de correlacin lineal de Pearson. Para un
conjunto de datos bidimensional o una distribucin de
frecuencia bidimensional, viene dado por

( ) ,
4,1952
0, 991407
( ) ( ) 504, 54 0, 03549
Cov X Y
r
V X V Y
= = =


Al ser positivo y muy prximo a 1, indica que entre ambas
variables hay una muy acusada relacin lineal directa. Es decir,
aumentos (o disminuciones) en el nmero de paquetes enviados se
traslada aumentos (o disminuciones) en el tiempo de descarga de esa
transmisin.

Las sumas de cuadrados son

SCTo = 0,39041 seg.^2, representa la variacin total en los
datos de tiempo de descarga respecto al tiempo medio.
SCR = 0,383702 seg.^2, representa la parte de la variacin
anterior total de los datos de tiempo de descarga respecto al tiempo
medio, atribuida o explicada por la relacin lineal de esos tiempos con
el nmero de paquetes.
SCE = 0,0067 seg.^2, informa sobre la parte de la variacin
anterior total de los datos de tiempo de descarga respecto al tiempo
medio, no atribuida o a la relacin lineal de esos tiempos con el
nmero de paquetes. Se atribuye a relaciones no lineales de Y con X,
de Y con otras variables (como, por ejemplo, el trfico de la red, la
hora del da, etc) y causas aleatorias

Errores ms comunes.-
(2) Confusin en la frmula de r.
(3) No se interpreta r.
(4) Errores en la interpretacin de r.
(5) Se calculan mal las sumas de cuadrados.
(6) No se interpretan las sumas de cuadrados. O si se hace es de forma errnea.

c) Al querer que Y = 0,8 debemos buscar, es decir, predecir de
la mejor manera posible, el x que corresponde a y = 0,8.
Por tanto, emplearemos la recta de regresin de X sobre Y
que viene dada por
( , )
( )
( )
Cov X Y
x x y y
V Y
=
IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersem Nov. Prob. 1-Soluc Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/3
Es decir, 118, 201 6, 91652 x y = . Por tanto, 118, 2 0, 8 6, 91652 87, 6442 x = = ;
luego se podrn transmitir 87 paquetes.

Errores ms comunes.-
(7) Se calcula mal la recta, calculando la de Y sobre X.

IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersemestral Nov. Prob. 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/4
Apellidos..........................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN DE PROBLEMAS DEL INTERSEMESTRAL
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe
abstenerse de formular preguntas sobre su contenido. Cada problema es evaluado sobre 10
puntos, figurando la puntuacin de cada apartado al final del mismo. El problema 1 (2) tiene
una valoracin del 40 (30) %. No se pueden quitar las grapas de ningn documento del
examen.
4) La duracin mxima de este examen es de 1 hora y 5 minutos.
5) Responder a las preguntas slo en el espacio reservado al efecto que es el anverso de cada hoja.
El reverso de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 2
Un aeropuerto tiene dos terminales de aterrizaje T1 y T2. Se sabe
que el 70 % de los vuelos aterrizan en la T2. Por otra parte, en la T1
aterriza el doble de vuelos nacionales que de internacionales, y 8 de cada
10 aterrizajes que se producen en la T2 corresponden a vuelos
internacionales.
a) Dibujar el diagrama en rbol para estudiar la incertidumbre
asociada al aterrizaje de un vuelo y la clasificacin del mismo en
nacional/internacional, indicando los sucesos elementales. (3)
b) Calcular la proporcin de vuelos que son internacionales y
aterrizan en la T2. Calcular la proporcin de vuelos internacionales
en este aeropuerto. Responder razonadamente comparando
ambos resultados. (4)
c) Razonar si los sucesos aterrizar en la T2 y vuelo internacional
son dependientes o independientes. (3)






IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersemestral Nov. Prob. 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/4

IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersemestral Nov. Prob. 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/4


























IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersemestral Nov. Prob. 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/4

IINF
Estadstica
Curso 2 (S1)/2009-2010
17 de Noviembre de 2009




Ex. Intersem Nov. Prob. 2-Soluc Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/1
SOLUCION AL PROBLEMA 2 DEL IS
a) La incertidumbre asociada a un vuelo consta de dos etapas.
Primera, si aterriza en la Terminal T1 en la T2. Segunda, si el vuelo
es Nacional (N) o Internacional (I).
Por tanto, el espacio muestral lo forman cuatro sucesos
elementales:
( ) ( ) ( ) ( )
1 2 3 4
1, , 1, , 2, , 2, T N T I T N T I = = = =

Errores ms comunes.-
(1) No poner sucesos sobre las ramas del rbol.
(2) No especificar, o hacerlo errneamente, los sucesos elementales.
(3) Decir que los sucesos elementales son independientes.

b) Se pide
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( ) ( )
2 2 2 0, 7 0, 8 0, 56
1 2
1
1 1 2 2 0, 3 0, 56 0, 66
3
P T I P T P I T
P I P T I P T I
P T P I T P T P I T
= = =
= + =
= + = + =

Se observa que el 56 % de los vuelos son internacionales y
aterrizan en la T2, mientras que el 66 % de los vuelos (un 10 % ms)
son internacionales.

Errores ms comunes.-
(4) Calcular mal las probabilidades implicadas.
(5) No razonar correctamente mediante la comparacin de ambas probabilidades.

c) Los sucesos T2 e I son sucesos dependientes, ya que
( ) ( ) 2 0, 8; 0, 66 P I T P I = =
Por tanto, saber que un vuelo aterriza en la T2 cambia la
probabilidad de que sea internacional (0,66 sin saberlo y 0,8
sabindolo).

Errores ms comunes.-
(6) No razonar la dependencia.
(7) Obtener mal las probabilidades implicadas.
(8) Decir que son independientes.
ITIE, ITIEI, ITIM
Mt. Estad. de la Ing.
Curso 2 (S2)/2008-2009
22 de abril de 2008 12 de junio de 2009




Ex. Final Junio Prob. 1 C. Mat & R. Caro 1/4
Apellidos................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN FINAL DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe abstenerse de
formular preguntas sobre su contenido. Cada problema es evaluado sobre 10 puntos, figurando la
puntuacin de cada apartado al final del mismo. La valoracin de cada problema sobre la nota del
examen es del 35 %, de manera que esta parte es un 70 % de la nota.
4) La duracin mxima de este examen es de 2 horas y 10 minutos.
5) Responder a las preguntas slo en el espacio reservado al efecto que es el anverso de cada hoja. El reverso
de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 1
PROAUTO es una reconocida cadena de atencin al automvil donde el
anlisis para cada da del tiempo medio de espera de un vehculo hasta ser
atendido, en horas, variable Y, y el nmero de empleados trabajando ese da,
X; a lo largo de 6 das ha proporcionado la siguiente informacin.

X 30 27 24 32 20 35
Y 0.5 1 0.9 0.6 1.2 0.4

a) Analizar e interpretar cualitativa y cuantitativamente la relacin entre
Y y X. Se quiere asegurar que el tiempo medio de espera en un da
no supera los 45 minutos, Cuntos trabajadores hay que tener?
Responder de manera razonada. (3)

PROAUTO posee dos centros A y B en la Comunidad de Madrid que
estn siendo sometidos a un riguroso anlisis estadstico. En concreto, se ha
podido determinar que la llegada de vehculos al centro A en horario estndar
(10-18) sigue un proceso de Poisson de intensidad 15 vehculos por hora,
considerndose que en horario no estndar (resto del da, sbados y domingos
de apertura) la intensidad se eleva un 40 % ms, tanto para A como para B.
Adems, en el centro B la intensidad en horario estndar es de 10 vehculos
por hora.

Se pide:
b) Indicar razonadamente la distribucin de probabilidad de la v.a.
N(1): n de vehculos que llegan durante un da al centro A en la
franja estndar
Indicar si existe una ley aproximada para N(1) y cul sera. (2)
ITIE, ITIEI, ITIM
Mt. Estad. de la Ing.
Curso 2 (S2)/2008-2009
22 de abril de 2008 12 de junio de 2009




Ex. Final Junio Prob. 1 C. Mat & R. Caro 2/4
c) Se ha determinado que del total de vehculos que entran en
PROAUTO en cada hora de la franja no estndar, el 40 % lo hace al
centro A. Estudiando datos horarios de esa franja se ha determinado
que en una hora en uno de los centros se recibieron ms de 100
vehculos, Con qu probabilidad el centro del que hablamos es el
centro B? Responder de manera razonada. (2)
d) Se ha estimado que cada vehculo que entra en PROAUTO en la
franja estndar deja un beneficio de 20 . Con qu probabilidad un
mes dejar en la franja estndar unos beneficios entre 45.000 y
47.000 ? Nota.- Se considera que un mes est formado por 4
semanas. (3)







ITIE, ITIEI, ITIM
Mt. Estad. de la Ing.
Curso 2 (S2)/2008-2009
22 de abril de 2008 12 de junio de 2009




Ex. Final Junio Prob. 1 C. Mat & R. Caro 3/4

ITIE, ITIEI, ITIM
Mt. Estad. de la Ing.
Curso 2 (S2)/2008-2009
22 de abril de 2008 12 de junio de 2009




Ex. Final Junio Prob. 1 C. Mat & R. Caro 4/4














































ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2008-2009
22 de abril de 2008 12 de junio de 2009




Ex. Junio Prob. 1 - Solucin Carlos Mat 1/3
SOLUCION AL PROBLEMA 1
(Propuesto por Prof. Carlos Mat)

a) Para proceder con el anlisis pedido calculamos el
coeficiente de correlacin lineal de Pearson y su cuadrado.
Para un conjunto de datos bidimensional o una distribucin
de frecuencia bidimensional, viene dado por

( ) ( ) , ,
0, 929981
( ) ( )
M
x y
Cov X Y Cov X Y
r
S S V X V Y
= = =


Al ser negativo y prximo a -0,93, indica que entre ambas
variables hay una cierta relacin directa inversa. Es decir, aumentos
(o disminuciones) en el nmero de empleados trabajando ese da se
trasladan a disminuciones (o aumentos) en el tiempo medio de
espera. Dicha relacin es importante y significativa.

El coeficiente de determinacin lineal se obtiene como el
cuadrado de r, aunque tambin se puede definir a partir de las sumas
de cuadrados, viniendo en porcentaje. As,
( )
( )
2
2
2
,
0, 9299 0, 8647
( ) ( )
Cov X Y
SCR
r
V X V Y SCTO
= = = =


Nos indica que el 86,47 % de la variacin de los datos de
tiempo medio de espera en un da respecto a la media de esos
tiempos (medida dicha variacin por SCTo), se explica por la relacin
lineal (SCR, con R de regresin) con el n de empleados trabajando
ese da. El 13,53 % restante se explicar por otras relaciones distinta
a la lineal, relaciones con otras variables y causas aleatorias.
Al querer asegurar que Y 45, debemos buscar, es decir,
predecir de la mejor manera posible, el x que corresponde a y = 45.
Por tanto, emplearemos la recta de regresin de X sobre Y que viene
dada por
( , )
( )
( )
Cov X Y
x x y y
V Y
=
Es decir, 40, 43 16, 2162 x y = . Por tanto,
45
^
40, 43 16, 2162 0, 75 28, 27
Y
x
=
= = ;
luego habr que tener 29 trabajadores.


ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2008-2009
22 de abril de 2008 12 de junio de 2009




Ex. Junio Prob. 1 - Solucin Carlos Mat 2/3
Errores ms comunes.-
(1) Confusin en la frmula de r.
(2) No se interpreta r.
(3) No se calcula r cuadrado.
(4) Errores en la interpretacin de r y r cuadrado.
(5) Se calcula mal la recta, calculando la de Y sobre X.

b) Del enunciado se deduce que la llegada de vehculos a los
centros A y B se produce de forma Poissoniana con las
intensidades siguientes

Centro Intensidad hora est. Intens. hora NO est.
A 15 veh/hora 21 veh/hora
B 10 veh/hora 14 veh/hora
Por tanto, aplicando la propiedad del proceso de Poisson la v.a. N(1),
n de vehculos que llegan durante un da al centro A en la franja
estndar (8 horas), se distribuir segn una ley de Poisson de
parmetro 15x8 = 120.
Una P(120), al tener su parmetro 30, se puede aproximar
por una ley normal de media y varianza iguales e iguales a . Por
tanto, N(1) se distribuye de manera aproximada segn una ley
N(120, 120).

Errores ms comunes.-
(1) No aplicar correctamente la propiedad del proceso de Poisson.
(2) No hablar de la aproximacin.
c) Indiquemos por V al suceso un vehculo entra al centro V en
una hora de la franja no estndar, con V = A, B. Se verifica
que P(A) = 0,4 y P(B) = 0,6. Sea el suceso H: en una hora
llegaron a uno de los centros ms de 100 vehculos. Se pide
( ) ( ) ( / )
( / )
( ) ( ) ( / ) ( ) ( / )
P B H P B P H B
P B H
P H P A P H A P B P H B

= =
+

Para calcular las verosimilitudes, se utiliza la informacin de la tabla
del principio, as
16
100
100
( / ) ( ) 1,11022 10
( / ) ( ) 0
A
B
P H A P X x
P H B P X

>
>
= =
= =

Considerando, respectivamente, una P(21) y una P(14). En
consecuencia, aparece 0/0, pero hablamos de 0s diferentes, ya que
ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2008-2009
22 de abril de 2008 12 de junio de 2009




Ex. Junio Prob. 1 - Solucin Carlos Mat 3/3
el del numerador es un infinitsimo de orden superior al del
denominador.
d) Designemos por (4 )
E
N S a la v. a. n de vehculos que
entran en PROAUTO en la franja estndar (8 horas) en 4
semanas. Claramente, ser la suma de los que entren el
centro A ms los que entren en B.
Aplicando la propiedad del proceso de Poisson, se trata de una
P(15x8x5x4)=P(2400), para A, y de una P(10x8x5x4)=P(1600), para
B. Para A se aproximar por una N(2400, 2400) y para B por una
N(1600, 1600), independientes. La suma de ambas ser una ley
N(4000, 4000), distribucin que consideraremos sigue (4 )
E
N S . Se
nos pide
( ) ( )
0 45000 20 (4 ) 47.000 2250 (4 ) 2350
E E
P P N S N S = = < < < <

Errores ms comunes.-
(1) Identificar mal las variables.
(2) Confundir beneficios con vehculos.
(3) No aplicar correctamente la propiedad del proceso de Poisson.
(4) No hablar de la aproximacin.

ITIM, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008





Ex. Final Junio Solucin Prob. 1 Carlos Mat 1/3
Apellidos................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN FINAL DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe abstenerse de
formular preguntas sobre su contenido. Cada problema es evaluado sobre 10 puntos, figurando la
puntuacin de cada apartado al final del mismo. La valoracin de cada problema sobre la nota del
examen es, respectivamente, 25 %, 25 % y 20 %, de manera que esta parte es un 70 % de la nota.
4) La duracin mxima de este examen es de 2 horas.
5) Responder a las preguntas slo en el espacio reservado al efecto que es el anverso de cada hoja. El reverso
de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 1
Recientemente se ha establecido la entidad financiera CAJICAI y nos ha
proporcionado la siguiente tabla que muestra el comportamiento del EURIBOR (tipo de
inters de referencia que toman los bancos para poner los suyos, evaluar sus riesgos,
etc.) durante un periodo de 50 semanas.

Intervalos (3.6, 4] (4, 4.4] (4.4, 4.8] (4.8, 5.2] (5.2, 5.6]
N de Semanas 8 12 14 10 6

Se pide:
a) Construir e interpretar el histograma de frecuencias absolutas acumuladas
y el polgono de frecuencias relativas acumuladas para los datos de esa
variable. (2)
b) Calcular e interpretar la mediana y el recorrido intercuartlico. (2)

El anlisis de la cantidad media de dinero solicitada por los clientes de
CAJICAI, en millones de euros, variable Y, y el EURIBOR, X; a lo largo de 10 meses
ha proporcionado la siguiente informacin.

X 3.5 3.8 4 4.2 4.5 4.8 5 5.2 5.4 5.6
Y 100 95 88 80 64 40 36 36 42 40

c) Obtener la recta de regresin entre Y y X, valorando su ajuste y utilidad. (3)
d) CAJICAI considera que hasta finales de Junio de 2008 llegarn la peticin
de 50 prstamos, estimando que la cantidad media de dinero solicitado en
cada prstamo ser de 100.000 euros, con una desviacin tpica de 9.000
euros. Calcular, de manera razonada y formulando las hiptesis
correspondientes, con qu probabilidad la peticin de esos 50 prstamos
dar lugar a una cantidad que supere los 6.000.000 euros. (3)
ITIM, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008





Ex. Final Junio Solucin Prob. 1 Carlos Mat 2/3

SOLUCION

a) El HFAA proporciona para cada intervalo de tipo de inters el n de
semanas en las que el tipo tom valores inferiores o iguales al lmite
superior del intervalo.
El PFRA da para cada valor de de tipo de inters la proporcin de semanas
en las que el tipo estuvo en valores no superiores a dicho tipo.
Errores ms comunes.-
1. Dibujar mal el polgono..
2. No indicar la interpretacin.

b)
La mediana de estos datos es
0.1
4.4 0.4 4.5428%
0.28
Me = + =
La primera y tercera cuartila de estos datos son
0.09
1 4 0.4 4.15%
0.24
Q = + = y
0.07
3 4.8 0.4 4.94%
0.2
Q = + =
Por tanto, el RI = 4.94 4.15 = 0.79 %.
La mitad de las semanas estudiadas el EURIBOR no ha superado el 4,54 %. El
50 % central de la variacin del EURIBOR se ha dado en un 0.79 %.

Errores ms comunes.-
1. Confundir el procedimiento de clculo de la mediana y cuartilas en este caso
(datos agrupados por intervalos), con el de datos sueltos.
2. No indicar la interpretacin.

c) La recta de regresin de Y sobre X es
222.397 34.8472 y x =
La utilidad de esta recta es poder explicar como se relaciona la cantidad media
solicitada por los clientes con el EURIBOR, de manera que se puedan predecir las
necesidades de dinero de los clientes cada mes segn el EURIBOR que vaya a darse.
Dado que r = -0.9428, podemos afirmar que es una relacin lineal inversa acusada, a
mayor valor del EURIBOR menor cantidad media solicitada por los clientes en cada
prstamo. Al ser
2
88.88 % r = , el ajuste es notable y de gran utilidad ya que el 88.88
% de la variacin de la cantidad solicitada respecto a la cantidad media se explica por
la relacin lineal que presenta la Y con la X.

Errores ms comunes.-

1. Clculo errneo de la recta.
2. Olvidar el clculo de los dos coeficientes y su interpretacin en relacin al
ajuste y utilidad de la recta.


ITIM, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008





Ex. Final Junio Solucin Prob. 1 Carlos Mat 3/3
d) La peticin de 50 prstamos supone la aparicin de 50 variables
aleatorias
1 2 50
, ,..., X X X que supondremos independientes y cumpliendo para i = 1,,
50
( )
( )
2 2
100.000
9.000
i
i
E X
V X
=
=

Se trata entonces de calcular la siguiente probabilidad
( ) ( )
1 50
... 6.000.000 15.71 0 P X X P Z + + > > =
que ha sido aproximada por la de una ley normal, utilizando el teorema del lmite
central, al cumplirse las hiptesis del mismo.

Errores ms comunes.-

1. Suponer normalidad de las variables.
2. Olvidar indicar la hiptesis de independencia y el teorema en el que se basa el
clculo.


ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008




Ex. Final Junio Solucin Prob. 2 Carlos Mat 1/3
Apellidos................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN FINAL DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe abstenerse de
formular preguntas sobre su contenido. Cada problema es evaluado sobre 10 puntos, figurando la
puntuacin de cada apartado al final del mismo. La valoracin de cada problema sobre la nota del
examen es, respectivamente, 25 %, 25 % y 20 %, de manera que esta parte es un 70 % de la nota del
examen.
4) La duracin mxima de este examen es de 2 horas y 10 minutos.
5) Responder a las preguntas slo en el espacio reservado al efecto que es el anverso de cada hoja. El reverso
de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 2
MICROTRONIC fabrica componentes electrnicos y ha determinado que
la duracin de los mismos (en miles de horas) viene dada por:
2
2
( ) , 2 f x x
x
=
(a) Comprobar con detalle que la funcin de distribucin viene dada por
0, 2
( )
2
, 2
x
F x
x
x
x
<

. (2)
(b) Calcular la proporcin de componentes con una duracin entre 4000
y 6000 horas. (1)
(c) Por otra parte, la empresa de fabricacin de software MACROSOFT
recibe el 30 % de los componentes de MICROTRONIC y el resto de
ELECMICRO, presentando los componentes de ELECMICRO una
duracin segn una exponencial de media 4000 horas, si un
componente ha fallado antes de las 3000 horas de funcionamiento,
con qu probabilidad lo fabric MICROTRONIC? Responder de
manera razonada. (3)
(d) Se han obtenido las siguientes observaciones:
4, 6.2, 8.7, 15.26, 20.1
correspondientes a cinco componentes tomados al azar. Son
compatibles estos datos con el modelo planteado? Responder de manera
detallada justificando los diferentes pasos. (4)


ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008




Ex. Final Junio Solucin Prob. 2 Carlos Mat 2/3
SOLUCION

a) Para comprobar lo que se pide vamos a obtener la funcin de distribucin
asociada al modelo dado mediante la realizacin de las siguientes
integrales.
( )
2
2
0, 0 ,
2 2
2
2
2 2 ,
,
x
x
ds
x x
F x
x
x x
ds
x
s


< <

= =



Errores ms comunes.-
1. Comprobar que f(x) es la densidad asociada a la F(x).
2. Comprobar que F(x) cumple las propiedades de una funcin de distribucin,
pero no comprobar que lo es de la f(x) dada.

b) La proporcin de componentes pedida es de un 16.667 %, ya que
( ) ( ) ( )
1
4 6 6 4
6
P X F F < < = = .
Errores ms comunes.-
1. Manejar diferentes unidades de tiempo a la vez (miles de horas y horas).

c) Sean los sucesos
M: Un componente es proporcionado por Microtronic
E: Un componente es proporcionado por Elecmicro
Sea la v. a. X: duracin de un componente, en miles de horas. Se pide

( )
( ) ( ) ( )
( )
3
3
3
P M P X M
M
P
X
P X

| |
=
|


\

Se verifica que
( ) ( ) ( ) ( ) ( ) ( )
1
0.3, 0.7, 3 , 3 0.5276
3
P M P E P X M P X E = = = =
Por tanto,
( )
0.213
3
M
P
X
| |
=
|

\

Errores ms comunes.-
1. No aplicar el teorema de Bayes.
2. Confundir el suceso que da la informacin con X > 3.

d) Para analizar si estos datos son compatibles con el modelo planteado se ha
de realizar un contraste de Kolmogorov-Smirnov cuya hiptesis nula es que
la funcin de distribucin terica es
( )
0
0,
2
2
2 ,
x
F x
x
x
x

<


ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008




Ex. Final Junio Solucin Prob. 2 Carlos Mat 3/3
Calculada la funcin de distribucin emprica, ( )
5
F x , se construye la tabla para
evaluar la distancia entre ( )
0
F x y ( )
5
F x en todos los datos recogidos y a la izquierda
de los mismos, llegndose a que ( ) ( ) { } ( ) ( )
5 5 0 5 0
max 4 4 0.5
x
D F x F x F F

= = = .
Mirando en la tabla general del contraste de Kolmogorov-Smirnov, resulta que la
probabilidad de obtener una diferencia superior a 0.5 con 5 datos ser mayor que 0.1,
es decir, ( )
5
0.5 P D > > 0.1; por lo que no podemos rechazar el modelo planteado
para los datos recogidos a cualquier nivel de significacin habitual (es decir, inferiores
al 10 %).

Errores ms comunes.-
1. No evaluar la distancia entre la funcin de distribucin emprica y la terica a la
izquierda de los datos.
2. Calcular mal la columna correspondiente a las probabilidades acumuladas en
el modelo a contrastar.
3. Mirar mal en la tabla del estadstico.


ITIG/S
Estadstica Bsica
Curso 2009-2010



Material JUN_2010

1/1


NORMAS DE CALIFICACION DE
ESTADISTICA BSICA
Profesor: Dr. D. Carlos Mat Jimnez

MATERIAL QUE SE PODRA UTILIZAR EN EL EXAMEN
FINAL JUNIO 2010
Los exmenes son de carcter terico-prctico, permitindose en la
parte prctica, exclusivamente y de manera intransferible, la utilizacin
de lo siguiente:
Una carpeta con
Tablas estadsticas grapadas.
20 hojas tamao DIN A-4 grapadas con material terico del
curso o cursos anteriores. En beneficio del propio estudiante
se recomienda que sean elaboradas por ella/l misma/mismo.
Calculadora u ordenador que no necesite conexin a la red elctrica
y que no est conectada con otros dispositivos.
Est terminantemente prohibido el uso de hojas sueltas,
telfonos mviles, etc.

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/4
Apellidos..........................................................................................
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Alumno nm..............
EXAMEN DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de
esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el
alumno debe abstenerse de formular preguntas sobre su contenido. Cada
problema es evaluado sobre 10 puntos, figurando la puntuacin de cada
apartado al final del mismo. La valoracin de los problemas es del 70 % sobre
la nota del examen, ponderndose cada problema as: 1) 25 %, 2) 25 % y 3) 20
%. Cada problema se entregar por separado en las hojas correspondientes.
No se pueden quitar las grapas de ningn documento del examen.
4) La duracin mxima de este examen es de 2 horas y 20 minutos.
--------------------
PROBLEMA 1
Un almacn de informtica recibe pedidos que clasifican en dos tipos:
complejos (C) y bsicos (B). Se sabe que el 5 % de los pedidos requieren un
tratamiento que es complejo. Adems, los pedidos de ambos tipos tienen un
comportamiento Poissoniano con una intensidad de 2 pedidos por semana de 5
das laborables para los complejos y 3 pedidos al da para los bsicos, siendo
independientes. Responder de manera razonada a las preguntas siguientes.
a) Calcular razonadamente la probabilidad de que en 10 pedidos haya
ms de 1 complejo. (2)
b) Indicar las caractersticas de la distribucin del nmero de pedidos
bsicos en una semana de 5 das laborables, esbozando la grfica
de su funcin de masa de probabilidad. Justificar razonadamente el
nmero ms probable de pedidos bsicos en una semana de 5 das
laborables. (3)
c) Calcular razonadamente la probabilidad de que en una semana no
haya pedidos. (2)
Esta empresa sirve el 70 % de los pedidos a USA y el resto a EUROPA.
Ha determinado que el tiempo que tarda en cobrar una factura de USA es una
uniforme entre 1 y 5 meses, mientras que en EUROPA se distribuye segn la
siguiente funcin de densidad
0.2
0 si 2
( )
0.2 si 2
t
t
f t
e t

=

>


d) Calcular razonadamente la proporcin de facturas que tardarn en
cobrarse ms de 3 meses y menos de 6. (3)

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/4













































ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/4













































ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 1 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/4

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/4
Apellidos..........................................................................................
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Alumno nm..............
EXAMEN DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de
esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el
alumno debe abstenerse de formular preguntas sobre su contenido. Cada
problema es evaluado sobre 10 puntos, figurando la puntuacin de cada
apartado al final del mismo. La valoracin de los problemas es del 70 % sobre
la nota del examen, ponderndose cada problema as: 1) 25 %, 2) 25 % y 3) 20
%. Cada problema se entregar por separado en las hojas correspondientes.
No se pueden quitar las grapas de ningn documento del examen.
4) La duracin mxima de este examen es de 2 horas y 20 minutos.
5) Responder a las preguntas slo en el espacio reservado al efecto en estas hojas
de respuesta. El reverso de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 2
La informacin referida a las calificaciones medias en el Bachillerato (X)
y en la Selectividad (Y) obtenida para 10 alumnos mediante las dos rectas de
regresin, se muestra a continuacin

(I) x - 0.51 - 1.0796y = 0
(II) 0.55x + 2.19 y = 0

a) Determinar razonadamente la expresin para predecir la nota de
Selectividad a partir de la nota en Bachillerato. Aplicacin a un alumno
con una nota en Bachillerato de 7.7. Razonar la calidad del ajuste tanto
cualitativa como cuantitativamente, interpretando el significado de las
medidas calculadas. (4)

Se trabaja sobre la hiptesis de que la nota de un alumno en Bachillerato
tiene de media 7 con desviacin tpica 0.7, mientras que en Selectividad la
media es 6 con desviacin tpica 0.3. Se seleccionan al azar 40 alumnos.

b) Con qu probabilidad la nota media de las notas (medias) de
Bachillerato de esos 40 alumnos superar la nota de 6.5? Sin hacer
clculos esa probabilidad en Selectividad ser mayor o menor?
Responder razonadamente. (2,5)

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/4
c) La distribucin de notas de Selectividad de 50 alumnos de Madrid se
muestra a continuacin
Calificaciones [5,5.5) [5.5,6) [6,7) [7,8) [8,10]
N de alumnos 20 14 9 5 2

Construir el polgono de frecuencias acumuladas en el papel
cuadriculado adjuntado. Para qu nos sirve esta representacin? (2)













d) Calcular e interpretar la tercera cuartila (1,5).
















ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/4













































ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/4

































ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/4
Apellidos..........................................................................................
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Alumno nm..............
EXAMEN DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de
esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el
alumno debe abstenerse de formular preguntas sobre su contenido. Cada
problema es evaluado sobre 10 puntos, figurando la puntuacin de cada
apartado al final del mismo. La valoracin de los problemas es del 70 % sobre
la nota del examen, ponderndose cada problema as: 1) 25 %, 2) 25 % y 3) 20
%. Cada problema se entregar por separado en las hojas correspondientes.
No se pueden quitar las grapas de ningn documento del examen.
4) La duracin mxima de este examen es de 2 horas y 20 minutos.
5) Responder a las preguntas slo en el espacio reservado al efecto en estas hojas
de respuesta. El reverso de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 3
En las pruebas para analizar el tiempo que permanece un internauta en la web
comercial CLIENTE-AMIGO (CA), en minutos, se ha determinado que dicho tiempo
tiene un comportamiento aleatorio definido por una distribucin normal
( )
2
, N .
Analizados los datos de permanencia de 100 internautas result la siguiente
informacin
100
1
350
i
i
x
=
=

;
100
2
1
1500
i
i
x
=
=


a) Determinar razonadamente la desviacin tpica y el coeficiente de variacin del
tiempo de permanencia en CA, interpretando ambos resultados. (2)
b) Obtener el intervalo simtrico respecto a la media de tiempos de permanencia
en esa web en el que se encuentra la mitad de internautas. (2)
c) Obtener razonadamente el intervalo de confianza para la media poblacional a
un nivel de confianza del 95%. (1,5)
d) Obtener razonadamente el intervalo de confianza para la varianza poblacional
a un nivel de confianza del 90%. (1,5)

Por otra parte, se sabe que de los 100 internautas hubo 15 que compraron un
producto en CLIENTE-AMIGO, mientras que de 500 internautas que visitaron TU-
WEB-AMIGA compraron ese mismo producto 60.
e) Obtener razonadamente el intervalo de confianza para la diferencia de
proporciones a un nivel de confianza del 95%. Se puede considerar que
ambas webs tienen la misma proporcin de clientes compradores del producto
considerado? (3)

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/4













































ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/4













































ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 3 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
4/4


ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 1_Solucin Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/1
Apellidos..........................................................................................
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Alumno nm..............
EXAMEN DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de
esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el
alumno debe abstenerse de formular preguntas sobre su contenido. Cada
problema es evaluado sobre 10 puntos, figurando la puntuacin de cada
apartado al final del mismo. La valoracin de los problemas es del 70 % sobre
la nota del examen, ponderndose cada problema as: 1) 25 %, 2) 25 % y 3) 20
%. Cada problema se entregar por separado en las hojas correspondientes.
No se pueden quitar las grapas de ningn documento del examen.
4) La duracin mxima de este examen es de 2 horas y 20 minutos.
--------------------
SOLUCION ABREVIADA AL PROBLEMA 1
a) Si X sigue B(10, 0.05), hay que calcular P(X>1) = 0.086.
b) Se trata de una Poisson de parmetro 15, cuyas modas son 14 y 15.
c) Prcticamente 0 (exactamente, exp(-17)).
d) Se trata de una aplicacin del teorema de la probabilidad total.
( )
6
0.2
3
2
3 6 0.7 0.3 0.2 0.515
4
t
P X e dt

< < = + =





ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 2_Solucin Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/1
Apellidos..........................................................................................
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Alumno nm..............
EXAMEN DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de
esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el
alumno debe abstenerse de formular preguntas sobre su contenido. Cada
problema es evaluado sobre 10 puntos, figurando la puntuacin de cada
apartado al final del mismo. La valoracin de los problemas es del 70 % sobre
la nota del examen, ponderndose cada problema as: 1) 25 %, 2) 25 % y 3) 20
%. Cada problema se entregar por separado en las hojas correspondientes.
No se pueden quitar las grapas de ningn documento del examen.
4) La duracin mxima de este examen es de 2 horas y 20 minutos.
5) Responder a las preguntas slo en el espacio reservado al efecto en estas hojas
de respuesta. El reverso de cada hoja se utilizar como BORRADOR.
--------------------
SOLUCION ABREVIADA AL PROBLEMA 2
a) Es la expresin (II). La nota pronosticada es 6.425. Para evaluar la
calidad del ajuste cualitativamente se usa r = 0.771 y cuantitativamente
r^2 = 0.594.
b) Por aplicacin del teorema del lmite central es prcticamente 1. La
probabilidad en Selectividad ser menor.
c) Para conocer el comportamiento acumulado y calcular centiles.

d) La tercera cuartila es 6.389.



ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
15 de Junio de 2010





Problema 3_Solucin Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/1
Apellidos..........................................................................................
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Alumno nm..............
EXAMEN DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de
esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el
alumno debe abstenerse de formular preguntas sobre su contenido. Cada
problema es evaluado sobre 10 puntos, figurando la puntuacin de cada
apartado al final del mismo. La valoracin de los problemas es del 70 % sobre
la nota del examen, ponderndose cada problema as: 1) 25 %, 2) 25 % y 3) 20
%. Cada problema se entregar por separado en las hojas correspondientes.
No se pueden quitar las grapas de ningn documento del examen.
4) La duracin mxima de este examen es de 2 horas y 20 minutos.
5) Responder a las preguntas slo en el espacio reservado al efecto en estas hojas
de respuesta. El reverso de cada hoja se utilizar como BORRADOR.
--------------------
SOLUCION ABREVIADA AL PROBLEMA 3
a) La desviacin tpica es 1.658 y el coeficiente de variacin es 47.4%.
b) El intervalo es 3.5 +- 1.118.
c) El intervalo de confianza para la media poblacional a un nivel de confianza del
95% es 3.5 +- 0.325.
d) El intervalo de confianza para la varianza poblacional a un nivel de confianza
del 90% es
[ ]
2 2
2 2
99,0.05 99,0.95
99 1.658 99 1.658 272.147 272.147
, , 2.228, 3.588
122.145 75.8552


= =





e) El intervalo de confianza para la diferencia de proporciones a un nivel de
confianza del 95% es
1 1 2 2
1 2 2
(1 ) (1 )

15 60 0.15 0.85 0.12 0.88
1.96
100 500 100 500
0.03 1.96 0.039 0.03 0.076
p p p p
p p z
m n


+ =

+ =
=


Como contiene al 0, se puede considerar que ambas webs tienen la misma
proporcin de clientes compradores del producto considerado, con un riesgo de
error del 5 %.

ITIG/S
Estadstica
Curso 2/2009-2010





Carlos Mat

1/1
ATENCION A ALUMNOS
EXAMEN DE SEPTIEMBRE 2010
Previa formulacin por correo electrnico con 24 horas de
antelacin del listado de dudas, el profesor de la asignatura
atender dudas de los alumnos en el despacho D-404, los siguientes
das y horas
Viernes 27 de agosto de 9:30 a 11:00.
Jueves 2 de septiembre de 9:30 a 11:00.

ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
27 de mayo de 2010




Prueba ITIGS10_2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
1/3
Apellidos ..........................................................................................
Nombre ...................................................... Firma ..............
D.N.I. ........................................................ Nmero de hoja ............
POR FAVOR, NO PASEN ESTA HOJA
HASTA QUE EL PROFESOR INDIQUE EL COMIENZO DE LA PRUEBA!
PRUEBA DE CLASE ITIGS10_2

1) Escrbanse apellidos, nombre, grupo y nmero de D.N.I. en la parte
superior de esta pgina.
2) Escrbanse apellidos, nombre, grupo y nmero de D.N.I. en el
espacio reservado al efecto en la hoja de repuestas. En el
rectngulo titulado PRUEBA pngase la secuencia siguiente ITIGS -
Estadstica 2, MAYO - 10, Prueba-2.
3) En cada pregunta hay tres posibles respuestas denominadas A, B y C.
Hay que elegir aquella respuesta nica que se considere correcta
en todos sus trminos y registrarlo con lpiz negro en la hoja
separada de respuestas. Asegrese que cuando responde una
pregunta, en la hoja separada de respuestas, el nmero y la respuesta
de la misma corresponde a la pregunta que est respondiendo. Si
cambia de opinin sobre alguna respuesta, borre por completo la
seal en la hoja de respuesta antes de hacer otra marca.
4) En caso de duda sobre una respuesta abstngase de contestar, ya
que las respuestas incorrectas restan puntos sobre la puntuacin final
obtenida (cada 2 fallos compensa 1 acierto).
5) La interpretacin del examen forma parte del mismo. En
consecuencia, el alumno debe abstenerse de formular preguntas
sobre su contenido.
6) Los clculos se pueden hacer en las propias hojas de este examen.
7) La parte de test de este documento se entregar al finalizar la
prueba, pero NO se tendr en cuenta lo que haya escrito en dicha
parte.
8) No se pueden quitar las grapas ni separar ninguna hoja de este
documento.
9) Tiene una duracin mxima de 20 minutos.
ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
27 de mayo de 2010




Prueba ITIGS10_2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
2/3
1.- Sea X una variable aleatoria cualquiera con funcin de
distribucin asociada F(x). Cul de las siguientes afirmaciones es
FALSA, en general?
A) ( ) P a X b F( b ) F( a ) = .
B) F es continua por la derecha.
C) F es montona no decreciente.
2.- Sea una distribucin binomial de parmetros n = 14 y p = 0.2.
Entonces:
A) Es asimtrica a la izquierda.
B) No se puede aproximar por otra distribucin.
C) Se puede aproximar por una ley de Poisson de media 7.

3.- La probabilidad de transmitir un bit errneamente es de
0.5*10^(-6). Se transmite un fichero de 2 millones de bits. Cul es
la probabilidad de que se reciba el fichero sin errores?
A) 0,9999.
B) 0,6243.
C) 0,3679.
4.- El nmero de piezas defectuosas producidas por una factora en
un da sigue una distribucin de Poisson de parmetro 1. Entonces
A) El nmero de piezas defectuosas ms probable durante 1
da es ninguna pieza o una, con la misma probabilidad.
B) La probabilidad de que haya dos defectuosas a lo largo de
un da es 1/2.
C) La probabilidad de que haya a lo sumo una defectuosa a
lo largo de un mes de 30 das laborables es 0,07.

5.- Al vestbulo de una estacin de tren llega una media de 15
pasajeros cada cuarto de hora. La llegada de los pasajeros tiene un
ritmo medio estable y lo hacen de forma independiente y Poissoniana.
El nmero de pasajeros que llegar en 1 hora se modela mediante:

A) Una distribucin de Poisson de parmetro =60
B) Una distribucin de Poisson de parmetro =15
C) Otra distribucin distinta de las anteriores.


ITIG/S
Estadstica Bsica
Curso 2 (S2)/2009-2010
27 de mayo de 2010




Prueba ITIGS10_2 Carlos Mat
25 aos (1984-2009) de docencia en ICAI
3/3
6.- Para una v. a. X continua con funciones de distribucin F(x) y
densidad f(x) se verifica que
A)
( ) ) ( ) ( a f b f b X a P = < <
.
B)
( ) . ) (

= < <
b
a
dx x F b X a P

C) Ninguna de las afirmaciones anteriores es verdadera.

7.- Si X es una variable aleatoria que se rige por una ley normal de
media = 10 y desviacin tpica = 2, el valor X = k tal que de
forma exacta se cumple que P(X < k) = 0.975 es
A) 12
B) 1.96
C) Ninguno de los valores anteriores.

8.- Sea X una variable aleatoria que se rige por una ley normal de
media = 300 y desviacin tpica = 15. Entonces ( ) P 280 X 340 < <
A) 0.7460.
B) 0.9050.
C) 0.9999

9.- Sea X una variable aleatoria que se rige por una ley normal de
media = 300 y desviacin tpica = 15. Entonces el centil del 70 %
es
A) 0.5244.
B) 307.87.
C) 324.96.

10.- Sea
1
X e
2
X variables aleatorias con
( ) ( )
1 2
X N 25, 64 y X N 25,16 ; donde el segundo nmero de cada
normal se refiere a la varianza de la misma y el primero a la media.
Entonces
A) La variable
2
X presenta aproximadamente el 95 % de
sus valores en el intervalo 25 32 .
B) ( ) ( )
1 2
P X 33 P X 29 > = > .
C) Ninguna de las afirmaciones anteriores es verdadera.

ITIM, ITIE, ITIEI, ITIGS
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008
10 de Junio de 2008



LISTADO DE PROBLEMAS
EXAMENES FINALES AOS ANTERIORES

F1.- (Junio 2004, propuesto por Carlos Mat)
Un equipo de investigacin de mercados ha recogido datos sobre el
mercado de la fotografa digital. En concreto, los siguientes datos representan
la resolucin (o tamao de la imagen) de 10 cmaras analizadas, en MPx
(mega pxeles):

1,5; 5,3; 6,5; 2,0; 4,5; 4,3; 2,4; 1,2; 5,7; 3,5.
Se considera esencial el segmento de consumidores de cmaras de al
menos 4 MPx.
Se pide:
a) Contrastar de manera razonada si los datos proceden de una normal
de media 5 y desviacin tpica 0,5. (3)
b) Obtener de manera razonada un intervalo de confianza al 95% de
confianza para la proporcin de mquinas en el mercado cuya
resolucin es de al menos 4 MPx. (3)
c) Habitualmente se trabajaba con la hiptesis de que dicha proporcin
era del 35 %. Ratifican los datos dicha hiptesis? Responder de
manera razonada. (2)
d) Este equipo denomina un mercado como dinmico cuando la
desviacin tpica de la variable crtica es superior a 2. Pueden dar
esa denominacin a este mercado? Responder de manera razonada
calculando un intervalo de confianza para al 90 % de confianza. (2)

F2.- (Junio 2006, propuesto por Mar Fenoy)
Una empresa petrolera busca nuevos yacimientos de crudo. Un
yacimiento petrolfero es explotable si contiene al menos cierta
cantidad de crudo a fin que su explotacin resulte rentable. Se ha
perforado un pozo en una zona para determinar la presencia de
petrleo. Un estudio geolgico de dicha zona ha estimado que la
probabilidad de que el yacimiento sea explotable es del 30%. Si el
yacimiento es explotable, la probabilidad que haya petrleo es del
90% y si el yacimiento no es explotable dicha probabilidad es del
20%
Se pide:
a) Cul es la probabilidad de que haya petrleo? (2)
Prob. exmenes otros aos Carlos Mat

1/3
ITIM, ITIE, ITIEI, ITIGS
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008
10 de Junio de 2008



b) Dados que se descubre petrleo Cul es la probabilidad de
que el pozo sea explotable? (2)
c) Dado que no se descubre petrleo Cul es la probabilidad
de que el pozo sea explotable? (3)
d) La compaa decide comprar cinco yacimientos. Cul es la
probabilidad de que haya petrleo en al menos uno de los
pozos? (3)

F3.- (Septiembre 2000, propuesto por Carlos Mat)
ELECWORLD, una multinacional de la generacin elctrica, como es
bien sabido se instal en una comunidad autnoma con una central de carbn
(B) y una central de ciclo combinado (C). Los datos disponibles sobre
produccin horaria con la central B, en Gw, son
540, 420, 480, 505, 510, 485, 530
Por otra parte, se sabe que la central C, durante la ltima quincena, ha
tenido una produccin media horaria de 440 Gw, con una desviacin tpica
muestral en dichos valores de 30 Gw.
Adems, se sabe que la produccin de energa durante cada hora y en
cada central se rige por una ley normal.
a) Contrastar si los datos de la central B proceden de una normal de
media 500 y desviacin tpica 20. (3)
b) Obtener, de manera razonada, un intervalo de confianza para la
produccin media horaria de energa con la central B, a un 95 % de
confianza. (3)
c) Obtener, razonadamente, un intervalo de confianza para la desviacin
tpica en la produccin horaria de la central C, a un 90 % de confianza.
(2)
d) El gerente de la central C asegura que su central produce cada hora,
en media, ms de 450 Gw. Tiene razn a los niveles de significacin
habituales? Responder de manera razonada y calculando el valor P
correspondiente. (2)

F4.- (Septiembre 2004, propuesto por Carlos Mat)
Se construye un eje cilndrico, para actuar como rotor en una mquina
elctrica, uniendo tres secciones. Posteriormente, para el acabado de la pieza,
se corta una seccin del mismo y se separa de tal manera que la pieza final no
incluye este trozo. Se pide:
a) Admitiendo que las longitudes de las cuatro secciones se
distribuyen, en cm, segn normales N(1.6; 0.02), N(2.4; 0.25),
N(2.3; 0.05) y N(1; 0.01), respectivamente, donde el segundo
Prob. exmenes otros aos Carlos Mat

2/3
ITIM, ITIE, ITIEI, ITIGS
Mt. Estad. de la Ing. / Estadstica Bsica
Curso 2 (S2)/2007-2008
10 de Junio de 2008



parmetro representa la varianza. Cmo se distribuye la variable
aleatoria X longitud total del eje? Qu proporcin de ejes tienen
su longitud en 5,3 0,01 cm? Responder razonadamente. (5)
b) Se selecciona una muestra de 10 ejes de los anteriormente
descritos tal que la suma de todas las longitudes de los mismos
es 41 cm y la suma de todas las longitudes al cuadrado es 229
cm
2
. Hallar un intervalo de confianza para la longitud media de la
poblacin de ejes, a un 95 % de confianza, y otro para la
desviacin tpica, al 90 % de confianza. Responder
razonadamente. (5)
AMPLIACION
FA1.- (Junio 2006, propuesto por Elena Landburu)
Se realiz un estudio sobre cmo se desarrollaban los pagos y
devoluciones en diferentes comercios en los primeros das de
implantacin del euro. Los datos son los de la siguiente tabla.
Grandes superficies Pequeas
superficies
Se paga y se devuelve en euros 150 50
Se paga en pesetas y se devuelve en euros 200 150
Se paga en pesetas y se devuelve en pesetas 50 100

a) Estimad la proporcin de compras con pago y devolucin en
euros. (2)
b) Se desea estimar la misma proporcin que en a) con una
confianza del 95%. Si el error de estimacin (semilongitud
del intervalo) no debe ser superior a 0,03, utilizando la
informacin muestral qu tamao muestral garantiza este
supuesto?, se consigue este supuesto con nuestra muestra
de 700 compras? (3)
c) La prensa afirmaba que al menos el 75% de las compras se
realizaba en euros (pagos y devoluciones). Existe evidencia
muestral para no aceptar esta hiptesis con nuestros datos?
(2)
d) Fijndonos ahora en las compras cuyos pagos y devoluciones
ignoraban la nueva moneda, hemos podido calcular un
intervalo de confianza para la diferencia de las proporciones
de compras entre grandes superficies y pequeos
comercios. Este es (-0,2742;-0,1424). Calculad el nivel de
confianza para este intervalo. Es significativa la diferencia
entre ambos tipos de establecimientos? (3)
Prob. exmenes otros aos Carlos Mat

3/3
ITIM, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008





Ex. Final Junio Solucin Prob. 1 Carlos Mat 1/3
Apellidos................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN FINAL DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe abstenerse de
formular preguntas sobre su contenido. Cada problema es evaluado sobre 10 puntos, figurando la
puntuacin de cada apartado al final del mismo. La valoracin de cada problema sobre la nota del
examen es, respectivamente, 25 %, 25 % y 20 %, de manera que esta parte es un 70 % de la nota.
4) La duracin mxima de este examen es de 2 horas.
5) Responder a las preguntas slo en el espacio reservado al efecto que es el anverso de cada hoja. El reverso
de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 1
Recientemente se ha establecido la entidad financiera CAJICAI y nos ha
proporcionado la siguiente tabla que muestra el comportamiento del EURIBOR (tipo de
inters de referencia que toman los bancos para poner los suyos, evaluar sus riesgos,
etc.) durante un periodo de 50 semanas.

Intervalos (3.6, 4] (4, 4.4] (4.4, 4.8] (4.8, 5.2] (5.2, 5.6]
N de Semanas 8 12 14 10 6

Se pide:
a) Construir e interpretar el histograma de frecuencias absolutas acumuladas
y el polgono de frecuencias relativas acumuladas para los datos de esa
variable. (2)
b) Calcular e interpretar la mediana y el recorrido intercuartlico. (2)

El anlisis de la cantidad media de dinero solicitada por los clientes de
CAJICAI, en millones de euros, variable Y, y el EURIBOR, X; a lo largo de 10 meses
ha proporcionado la siguiente informacin.

X 3.5 3.8 4 4.2 4.5 4.8 5 5.2 5.4 5.6
Y 100 95 88 80 64 40 36 36 42 40

c) Obtener la recta de regresin entre Y y X, valorando su ajuste y utilidad. (3)
d) CAJICAI considera que hasta finales de Junio de 2008 llegarn la peticin
de 50 prstamos, estimando que la cantidad media de dinero solicitado en
cada prstamo ser de 100.000 euros, con una desviacin tpica de 9.000
euros. Calcular, de manera razonada y formulando las hiptesis
correspondientes, con qu probabilidad la peticin de esos 50 prstamos
dar lugar a una cantidad que supere los 6.000.000 euros. (3)
ITIM, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008





Ex. Final Junio Solucin Prob. 1 Carlos Mat 2/3

SOLUCION

a) El HFAA proporciona para cada intervalo de tipo de inters el n de
semanas en las que el tipo tom valores inferiores o iguales al lmite
superior del intervalo.
El PFRA da para cada valor de de tipo de inters la proporcin de semanas
en las que el tipo estuvo en valores no superiores a dicho tipo.
Errores ms comunes.-
1. Dibujar mal el polgono..
2. No indicar la interpretacin.

b)
La mediana de estos datos es
0.1
4.4 0.4 4.5428%
0.28
Me = + =
La primera y tercera cuartila de estos datos son
0.09
1 4 0.4 4.15%
0.24
Q = + = y
0.07
3 4.8 0.4 4.94%
0.2
Q = + =
Por tanto, el RI = 4.94 4.15 = 0.79 %.
La mitad de las semanas estudiadas el EURIBOR no ha superado el 4,54 %. El
50 % central de la variacin del EURIBOR se ha dado en un 0.79 %.

Errores ms comunes.-
1. Confundir el procedimiento de clculo de la mediana y cuartilas en este caso
(datos agrupados por intervalos), con el de datos sueltos.
2. No indicar la interpretacin.

c) La recta de regresin de Y sobre X es
222.397 34.8472 y x =
La utilidad de esta recta es poder explicar como se relaciona la cantidad media
solicitada por los clientes con el EURIBOR, de manera que se puedan predecir las
necesidades de dinero de los clientes cada mes segn el EURIBOR que vaya a darse.
Dado que r = -0.9428, podemos afirmar que es una relacin lineal inversa acusada, a
mayor valor del EURIBOR menor cantidad media solicitada por los clientes en cada
prstamo. Al ser
2
88.88 % r = , el ajuste es notable y de gran utilidad ya que el 88.88
% de la variacin de la cantidad solicitada respecto a la cantidad media se explica por
la relacin lineal que presenta la Y con la X.

Errores ms comunes.-

1. Clculo errneo de la recta.
2. Olvidar el clculo de los dos coeficientes y su interpretacin en relacin al
ajuste y utilidad de la recta.


ITIM, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008





Ex. Final Junio Solucin Prob. 1 Carlos Mat 3/3
d) La peticin de 50 prstamos supone la aparicin de 50 variables
aleatorias
1 2 50
, ,..., X X X que supondremos independientes y cumpliendo para i = 1,,
50
( )
( )
2 2
100.000
9.000
i
i
E X
V X
=
=

Se trata entonces de calcular la siguiente probabilidad
( ) ( )
1 50
... 6.000.000 15.71 0 P X X P Z + + > > =
que ha sido aproximada por la de una ley normal, utilizando el teorema del lmite
central, al cumplirse las hiptesis del mismo.

Errores ms comunes.-

1. Suponer normalidad de las variables.
2. Olvidar indicar la hiptesis de independencia y el teorema en el que se basa el
clculo.


ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008




Ex. Final Junio Solucin Prob. 2 Carlos Mat 1/3
Apellidos................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN FINAL DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe abstenerse de
formular preguntas sobre su contenido. Cada problema es evaluado sobre 10 puntos, figurando la
puntuacin de cada apartado al final del mismo. La valoracin de cada problema sobre la nota del
examen es, respectivamente, 25 %, 25 % y 20 %, de manera que esta parte es un 70 % de la nota del
examen.
4) La duracin mxima de este examen es de 2 horas y 10 minutos.
5) Responder a las preguntas slo en el espacio reservado al efecto que es el anverso de cada hoja. El reverso
de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 2
MICROTRONIC fabrica componentes electrnicos y ha determinado que
la duracin de los mismos (en miles de horas) viene dada por:
2
2
( ) , 2 f x x
x
=
(a) Comprobar con detalle que la funcin de distribucin viene dada por
0, 2
( )
2
, 2
x
F x
x
x
x
<

. (2)
(b) Calcular la proporcin de componentes con una duracin entre 4000
y 6000 horas. (1)
(c) Por otra parte, la empresa de fabricacin de software MACROSOFT
recibe el 30 % de los componentes de MICROTRONIC y el resto de
ELECMICRO, presentando los componentes de ELECMICRO una
duracin segn una exponencial de media 4000 horas, si un
componente ha fallado antes de las 3000 horas de funcionamiento,
con qu probabilidad lo fabric MICROTRONIC? Responder de
manera razonada. (3)
(d) Se han obtenido las siguientes observaciones:
4, 6.2, 8.7, 15.26, 20.1
correspondientes a cinco componentes tomados al azar. Son
compatibles estos datos con el modelo planteado? Responder de manera
detallada justificando los diferentes pasos. (4)


ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008




Ex. Final Junio Solucin Prob. 2 Carlos Mat 2/3
SOLUCION

a) Para comprobar lo que se pide vamos a obtener la funcin de distribucin
asociada al modelo dado mediante la realizacin de las siguientes
integrales.
( )
2
2
0, 0 ,
2 2
2
2
2 2 ,
,
x
x
ds
x x
F x
x
x x
ds
x
s


< <

= =



Errores ms comunes.-
1. Comprobar que f(x) es la densidad asociada a la F(x).
2. Comprobar que F(x) cumple las propiedades de una funcin de distribucin,
pero no comprobar que lo es de la f(x) dada.

b) La proporcin de componentes pedida es de un 16.667 %, ya que
( ) ( ) ( )
1
4 6 6 4
6
P X F F < < = = .
Errores ms comunes.-
1. Manejar diferentes unidades de tiempo a la vez (miles de horas y horas).

c) Sean los sucesos
M: Un componente es proporcionado por Microtronic
E: Un componente es proporcionado por Elecmicro
Sea la v. a. X: duracin de un componente, en miles de horas. Se pide

( )
( ) ( ) ( )
( )
3
3
3
P M P X M
M
P
X
P X

| |
=
|


\

Se verifica que
( ) ( ) ( ) ( ) ( ) ( )
1
0.3, 0.7, 3 , 3 0.5276
3
P M P E P X M P X E = = = =
Por tanto,
( )
0.213
3
M
P
X
| |
=
|

\

Errores ms comunes.-
1. No aplicar el teorema de Bayes.
2. Confundir el suceso que da la informacin con X > 3.

d) Para analizar si estos datos son compatibles con el modelo planteado se ha
de realizar un contraste de Kolmogorov-Smirnov cuya hiptesis nula es que
la funcin de distribucin terica es
( )
0
0,
2
2
2 ,
x
F x
x
x
x

<


ITIM, ITIE, ITIEI, ITIG
Mt. Estad. de la Ing. / Estadstica
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008




Ex. Final Junio Solucin Prob. 2 Carlos Mat 3/3
Calculada la funcin de distribucin emprica, ( )
5
F x , se construye la tabla para
evaluar la distancia entre ( )
0
F x y ( )
5
F x en todos los datos recogidos y a la izquierda
de los mismos, llegndose a que ( ) ( ) { } ( ) ( )
5 5 0 5 0
max 4 4 0.5
x
D F x F x F F

= = = .
Mirando en la tabla general del contraste de Kolmogorov-Smirnov, resulta que la
probabilidad de obtener una diferencia superior a 0.5 con 5 datos ser mayor que 0.1,
es decir, ( )
5
0.5 P D > > 0.1; por lo que no podemos rechazar el modelo planteado
para los datos recogidos a cualquier nivel de significacin habitual (es decir, inferiores
al 10 %).

Errores ms comunes.-
1. No evaluar la distancia entre la funcin de distribucin emprica y la terica a la
izquierda de los datos.
2. Calcular mal la columna correspondiente a las probabilidades acumuladas en
el modelo a contrastar.
3. Mirar mal en la tabla del estadstico.


ITIM, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008




Ex. Final Junio Prob. 3 Raquel Caro 1/3
Apellidos................................................................................Firma:
Nombre...................................................... Grupo..............
D.N.I. ........................................................ Hoja nm..............
EXAMEN FINAL DE PROBLEMAS
INSTRUCCIONES
1) Escribir apellidos, nombre, grupo y nmero de D.N.I. en la parte superior de esta pgina.
2) Se valorar la claridad, precisin y brevedad en las respuestas.
3) La interpretacin del examen forma parte del mismo. En consecuencia, el alumno debe abstenerse de
formular preguntas sobre su contenido. Cada problema es evaluado sobre 10 puntos, figurando la
puntuacin de cada apartado al final del mismo. La valoracin de cada problema sobre la nota del
examen es, respectivamente, 25 %, 25 % y 20 %, de manera que esta parte es un 70 % de la nota.
4) La duracin mxima de este examen es de 2 horas.
5) Responder a las preguntas slo en el espacio reservado al efecto que es el anverso de cada hoja. El reverso
de cada hoja se utilizar como BORRADOR.
--------------------
PROBLEMA 3
En las pruebas de selectividad para ingresar en la UNIVERSIDAD, se sabe que
las calificaciones tienen un comportamiento aleatorio definido por una distribucin
normal N(, 1).

a) Determinar razonadamente la probabilidad de que las calificaciones no superen
a la media en ms de 1,5 puntos. (1.5)
b) Determinar razonadamente la nota de corte si queremos quedarnos con el 20
% superior de los alumnos con mejores calificaciones. (2)
c) Obtener razonadamente el intervalo de confianza para la media poblacional a
un nivel de confianza del 95%, sabiendo que el ao pasado la nota media fue
de 6,3 y que se examinaron 10.000 individuos. (3)
d) Este ao se estima que se presenten 6.400 y obtengan la misma nota media,
qu se puede decir del nuevo intervalo de confianza al 95 % de confianza?(1)
La probabilidad de que un alumno que solicita una Universidad obtenga plaza
en la misma es del 15 %.
e) Determinar la distribucin de probabilidad de la variable aleatoria nmero de
individuos que debe presentarse antes del primero que consiga la plaza y
calcular la probabilidad de que se requieran 3 individuos antes de asignar dicha
plaza. Obtener el nmero medio de individuos que deben examinarse hasta
que uno consiga la plaza. (2.5)






ITIM, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008




Ex. Final Junio Prob. 3 Raquel Caro 2/3
SOLUCIN PROBLEMA 3

a) Sea X la variable que representa la calificacin de un alumno examinado de
selectividad y que viene definida por una distribucin normal N(, 1). Nos piden
calcular
P( X < +1,5) = P (Z < 1,5) = 0,9332
siendo Z N(0,1)
b) Si queremos quedarnos con el 20 % superior de los alumnos con mejores
calificaciones, la nota de corte la obtendramos calculando
P( X k) = 0,80
donde k = 0,85 +

c) Determinacin del intervalo de confianza para la media poblacional cuando se
conoce la varianza.

Sea una poblacin representada por : N(, ), con conocida, de la que se extrae
m.a.s. de tamao n.
Para obtener un intervalo de confianza para la estimacin de la esperanza , se elige
como estadstico pivote:

cuya distribucin de probabilidad es N(0,1).

Para el nivel de confianza = 95 %, se puede establecer un valor tal que:


Despejando, se obtiene:



El intervalo puede expresarse como:
0,95
x
a
n






ITIM, ITIE, ITIEI
Mtodos Estadsticos de la Ingeniera
Curso 2 (S2)/2007-2008
22 de abril de 2008 20 de junio de 2008




Ex. Final Junio Prob. 3 Raquel Caro 3/3



Con los datos muestrales tenemos


d) Con la misma nota media y con n`= 6400 tenemos




Es decir, ha aumentado el radio del intervalo de confianza construido y, por lo tanto,
ha disminuido la precisin del mismo.


e) Sea A el suceso consistente en que un alumno consiga plaza en una determinada
universidad y P(A) = 0,15 = p. Por tanto q = 0,85.
Sea la variable aleatoria nmero de individuos que debe presentarse antes del
primero que consiga la plaza. El campo de variacin de esta variable es 1,2,3, .,
variable aleatoria de carcter dicotmico que siguen una distribucin geomtrica, cuya
funcin de cuanta es


con x = 1,2,3, .
Nos piden




El nmero medio de individuos ser:




FALLOS MS COMUNES
CONFUNDIR ESTIMADOR CON ESTIMACIN
DISEAR EL INTERVALO DE CONFIANZA CON VARIANZA
DESCONOCIDA
NO DEFINIR LA DISTRIBUCIN DE LA VARIABLE ALEATORIA
NMERO DE INDIVIDUOS QUE DEBE PRESENTARSE ANTES DEL
PRIMERO QUE CONSIGA PLAZA COMO DISTRIBUCIN
GEOMTRICA SINO COMO BINOMIAL, POISSON O NORMAL
NO SABER BUSCAR EN LAS TABLAS DE LA NORMAL
NO SABER TIPIFICAR

[ ]
0,95
6, 3 0, 0196
[ ]
0,95
6, 3 0, 0245
1
( )
x
P x q p

= =
2
1 2 3
( 3) ( 0, 0, 1) 0, 85 0,15 0,1083 P P = = = = = = = i
1
[ ] 6, 66 E
p
= =
I ITIG-ITIS
Estadstica Bsica
Curso 2007-2008








Alberto Aguilera 23 E 28015 Madrid Tel: 34 91 542 2800 Fax: 34 91 541 1132 www.doi.icai.upcomillas.es
DUDAS SOBRE LA ASIGNATURA
Atencin a alumnos en Septiembre, previo correo electrnico
enviado al profesor hasta el 3 de Septiembre a las 13:00 horas
indicando lista de dudas
o Prof. Carlos Mat (cmate@upcomillas.es)

You might also like