You are on page 1of 341

UNIVERSIDAD POLITCNICA DE VALENCIA

ESTADSTICA BSICA
PARA
INGENIERA

Mara Teresa Carot Snchez


Gonzalo Clemente Marn
Jos Mara Sanz Juan

DEPARTAMENTO DE ESTADSTICA E INVESTIGACIN


OPERATIVA APLICADAS Y CALIDAD

Enero 2013

Contenido

-2-

Contenido

CONTENIDO
1.

INTRODUCCIN
1.1.
1.2.
1.3.
1.4.
1.5.

2.

LA METODOLOGA ESTADSTICA ............................................................ 9


EL MTODO CIENTFICO ........................................................................ 12
SOFTWARE ESTADSTICO ...................................................................... 14
REDONDEO DE LOS DATOS ................................................................... 15
ALFABETO GRIEGO................................................................................. 17

ESTADSTICA DESCRIPTIVA
2.1. INTRODUCCIN ........................................................................................... 19
2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL ......................................... 22
2.2.1. Tablas de frecuencias ............................................................................ 23
2.2.2. Histogramas ........................................................................................... 23
2.2.3. Polgono de frecuencias ......................................................................... 25
2.2.4. Diagrama de puntos ............................................................................... 25
2.2.5. Grfico de tartas..................................................................................... 26
2.2.6. Grfico de Pareto ................................................................................... 26
2.2.7. Medidas de posicin .............................................................................. 27
2.2.8. Medidas de dispersin ........................................................................... 29
2.2.9. Diagrama e tallos y hojas ....................................................................... 31
2.2.10. Diagrama de caja-y-bigotes.................................................................. 32
2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL ........................................... 33
2.3.1. Tablas de frecuencia de doble entrada .................................................. 33
2.3.2. Frecuencias marginales ......................................................................... 36
2.3.3. Frecuencias condicionales ..................................................................... 37
2.3.4. Representaciones grficas de las distribuciones bidimensionales .......... 38
2.3.5. Covarianza muestral .............................................................................. 40
2.3.6. Regresin lineal ..................................................................................... 40
2.4. PROBLEMAS Y CUESTIONES DE EXMENES ........................................... 41

3.

PROBABILIDADES
3.1. INTRODUCCIN ........................................................................................... 47
3.2. PROBABILIDAD ............................................................................................. 48
3.2. ESPACIOS DE PROBABILIDADES ............................................................... 48
3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES ..................................... 52
Probabilizacin de Espacios Muestrales Discretos .......................................... 52
Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria ...... 53
Combinatoria ................................................................................................... 53
-3-

Contenido

3.5. PROBABILIDAD CONDICIONADA ................................................................ 54


3.6. TEOREMA DE LA INTERSECCIN .............................................................. 56
3.7. TEOREMA DE LA PARTICIN TOTAL ......................................................... 56
3.8. SUCESOS INDEPENDIENTES ..................................................................... 57
3.9. TEOREMA DE BAYES................................................................................... 58
3.10. PROBLEMAS PROPUESTOS ..................................................................... 59
Probabilidad condicional .................................................................................. 61
3.11. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 66

4.

CONCEPTO DE VARIABLE ALEATORIA


4.1. DEFINICIN DE VARIABLE ALEATORIA UNIDIMENSIONAL ...................... 77
4.2. FUNCIN DE DISTRIBUCIN ...................................................................... 78
4.3. VARIABLES DISCRETAS .............................................................................. 79
4.4. VARIABLES CONTINUAS ............................................................................. 81
Funcin de densidad ....................................................................................... 81
Transformacin de variables aleatorias ........................................................... 84
4.5. ESPERANZA MATEMTICA ......................................................................... 85
Esperanza matemtica .................................................................................... 85
Momentos ........................................................................................................ 86
4.6 PARMETROS DE TENDENCIA .................................................................... 88
Valor medio ..................................................................................................... 88
Mediana ........................................................................................................... 89
Cuartiles .......................................................................................................... 89
Moda ............................................................................................................... 90
4.7. VARIANZA. CONCEPTO Y PROPIEDADES ................................................. 90
Desviacin tpica.............................................................................................. 91
4.8. OTROS PARMETROS DE UNA DISTRIBUCIN ........................................ 91
Rango o Recorrido........................................................................................... 91
Coeficiente de variacin................................................................................... 92
Coeficiente de asimetra ................................................................................. 92
Coeficiente de apuntamiento o de curtosis ...................................................... 92
4.9. DISTRIBUCIONES BIDIMENSIONALES ....................................................... 93
Concepto ......................................................................................................... 93
Funcin de distribucin .................................................................................... 94
Funcin de densidad ....................................................................................... 95
Funcin de densidad marginal ......................................................................... 96
Funcin de densidad condicional ..................................................................... 98
Independencia de variables aleatorias ............................................................. 99
Esperanza de vectores aleatorios .................................................................. 100
Momentos ...................................................................................................... 101
Matriz de varianzas-covarianzas .................................................................... 102
-4-

Contenido

Combinacin lineal de variables aleatorias .................................................... 106


Curva de regresin condicional ...................................................................... 106
Recta de regresin mnimo cuadrtica ........................................................... 107
4.10. PROBLEMAS PROPUESTOS ................................................................... 109
4.11. PROBLEMAS Y CUESTIONES DE EXMENES ....................................... 113

5.

PRINCIPALES DISTRIBUCIONES DISCRETAS


5.1.
5.2.
5.3.
5.4.
5.5.
5.6.
5.7.
5.8.

6.

DISTRIBUCIN DICOTMICA ............................................................... 121


DISTRIBUCIN BINOMIAL ..................................................................... 122
DISTRIBUCIN HIPERGEOMTRICA ................................................... 123
DISTRIBUCIN DE POISSON ................................................................ 125
DISTRIBUCIN BINOMIAL-NEGATIVA .................................................. 126
DISTRIBUCIN MULTINOMIAL .............................................................. 127
PROBLEMAS PROPUESTOS ................................................................. 129
PROBLEMAS Y CUESTIONES DE EXMENES .................................... 143

PRINCIPALES DISTRIBUCIONES CONTINUAS


6.1.
DISTRIBUCIN UNIFORME ................................................................... 149
6.2.
DISTRIBUCIN EXPONENCIAL ............................................................. 150
Tasa de fallos ................................................................................................ 152
6.3.
DISTRIBUCIN NORMAL UNIDIMENSIONAL ....................................... 154
6.3.1. Variable normal tipificada ..................................................................... 155
6.3.2. Variable normal general ....................................................................... 158
6.3.3. Teorema central del lmite .................................................................... 160
Aproximacin de la binomial a la normal ....................................................... 161
Aproximacin de la Poisson a la normal ........................................................ 162
Correccin por continuidad ............................................................................ 163
6.4.
LA DISTRIBUCIN NORMAL BIDIMENSIONAL ..................................... 165
Distribuciones marginales .............................................................................. 166
Distribuciones condicionales .......................................................................... 166
6.5. PROBLEMAS PROPUESTOS .................................................................... 169
Distribucin uniforme ..................................................................................... 169
Distribucin exponencial ................................................................................ 170
Distribucin Normal........................................................................................ 172
Distribuciones bidimensionales ...................................................................... 182
6.6. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 185

-5-

Contenido

7.

DISTRIBUCIONES DERIVADAS DE LA NORMAL


7.1.
7.2.
7.3.
7.4.

8.

DISTRIBUCIONES EN EL MUESTRO
8.1.
8.2.
8.3.
8.4.
8.5.
8.6.
8.7.
8.8.
8.9.
8.10.

9.

DISTRIBUCIN CHI-CUADRADO .......................................................... 191


DISTRIBUCIN t ................................................................................... 192
DISTRIBUCIN F.................................................................................... 194
PROBLEMAS PROPUESTOS ................................................................ 195

POBLACIN, MUESTREO Y MUESTRA ................................................ 197


DISTRIBUCIN DE LA VARIANZA MUESTRAL ..................................... 201
DISTRIBUCIN DE LA MEDIA MUESTRAL ........................................... 203
DISTRIBUCIN DEL COCIENTE DE VARIANZAS ................................. 204
DISTRIBUCIN DE LA PROPORCIN .................................................. 206
DISTRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES ........ 207
DISTRIBUCIN DE LA DIFERENCIA DE PROPORCIONES ................. 208
VARIANZA EN POBLACIONES FINITAS ................................................ 210
PROBLEMAS PROPUESTOS ................................................................ 211
PROBLEMAS Y CUESTIONES DE EXMENES .................................... 212

INTRODUCCIN A LA INFERENCIA ESTADSTICA


9.1
ESTIMACIN PUNTUAL......................................................................... 217
9.2.
ESTIMACIN POR INTERVALOS DE CONFIANZA ............................... 220
9.2.1. Intervalo de confianza para la media poblacional ................................. 221
9.2.2. Intervalo de confianza para la varianza poblacional ............................. 223
9.2.3. Intervalo de confianza para el cociente de varianzas poblacionales.... 224
9.2.4. Intervalo de confianza para la proporcin ............................................ 225
9.2.5. Intervalo de confianza para la diferencia de proporciones.................... 227
9.2.6. Intervalo de confianza para la diferencia de medias poblacionales ...... 228
9.3.
TEST DE HIPTESIS ............................................................................. 230
Conceptos ..................................................................................................... 230
Obtencin de los tests .................................................................................. 234
9.4. TEST DE HIPTESIS PARMETRICOS ..................................................... 235
9.4.1. Contrastes de la media de una poblacional normal ............................. 235
9.4.2. Test de hiptesis para la varianza poblacional ..................................... 240
9.4.3. Test de hiptesis para el cociente de varianzas poblacionales ............ 241
9.4.4. Contrastes de proporciones ................................................................. 242
9.4.5. Test de hiptesis para la diferencia de medias poblacionales con
-6-

Contenido

muestras independientes ............................................................................... 246


9.4.6. Test para la diferencia de medias poblacionales con datos apareados
...................................................................................................................... 247
9.4.7.Test para la diferencia de proporciones ................................................ 248
9.4.8. Test de ajuste a una distribucin .......................................................... 250
9.4.9. Test de independencia ......................................................................... 252
9.5. PROBLEMAS PROPUESTOS ..................................................................... 255
Test de hiptesis ............................................................................................ 256
Tabla de contingencia .................................................................................... 260
Test de ajuste a una distribucin .................................................................... 261
9.6. PROBLEMAS Y CUESTIONES DE EXMENES ......................................... 262

10. ANLISIS DE LA VARIANZA


10.1. ANLISIS DE LA VARIANZA (I). UN FACTOR CONTROLADO................. 271
10.1.1. Generalidades ................................................................................... 271
10.1.2. Modelo terico. Hiptesis del modelo ................................................ 273
10.1.3. Hiptesis nula ................................................................................... 276
10.1.4. Ecuacin fundamental ....................................................................... 277
10.1.5. Test F................................................................................................ 277
10.1.6. Comparacin de medias. Test L.S.D. (diferencia mnima significativa)
...................................................................................................................... 278
10.2. ANLISIS DE LA VARIANZA (II). DOS FACTORES CONTROLADOS ...... 280
10.2.1. Introduccin. Planes factoriales ......................................................... 280
10.2.2. Anova para dos factores con repeticiones ......................................... 281
10.2.3. Concepto de Interaccin ................................................................... 281
10.2.4. Modelo y supuestos tericos ............................................................. 283
10.2.5. Hiptesis Nulas ................................................................................. 284
10.2.6. Descomposicin de las Sumas de Cuadrados. Test F ...................... 284
10.2.7. Comparacin de Medias. Test L.S.D. ................................................ 284
10.2.8. Validacin del modelo ........................................................................ 287
10.2.9. Igualdad de las varianzas ................................................................... 287
10.2.10. Estimacin de los efectos ................................................................. 288
10.2.11. Predicciones .................................................................................... 289
10.3. PROBLEMAS Y CUESTIONES DE EXAMEN ............................................ 290

11. REGRESIN LINEAL


11.1.
11.2.
11.3.

HIPTESIS DEL MODELO ..................................................................... 301


ESTIMACIN DE LOS COEFICIENTES DE REGRESIN ..................... 303
CONTRASTES DE SIGNIFICACIN DE LOS COEFICIENTES .............. 305
-7-

Contenido

11.4.
11.5.
11.6.
11.7.

VALIDACIN DEL MODELO .................................................................. 310


INTERVALOS DE PREDICCIN............................................................. 313
BONDAD DE AJUSTE ............................................................................ 315
PROBLEMAS Y CUESTIONES DE EXMENES .................................... 317

ANEXO A. Tablas de las principales distribuciones de


probabilidad
DISTRIBUCIN DE POISSON ........................................................................... 328
DISTRIBUCIN NORMAL TIPIFICADA .............................................................. 331
DISTRIBUCIN DE PEARSON ........................................................................ 332
DISTRIBUCIN t de Student ............................................................................. 335
DISTRIBUCIN F de snedecor ........................................................................... 338

BIBLIOGRAFA ......................................................................... 341

-8-

1. Introduccin

1. INTRODUCCIN
Contenido
1.1.
1.2.
1.3.
1.4.
1.5.

1.1.

LA METODOLOGA ESTADSTICA ............................................................ 9


EL MTODO CIENTFICO ........................................................................ 12
SOFTWARE ESTADSTICO...................................................................... 14
REDONDEO DE LOS DATOS................................................................... 15
ALFABETO GRIEGO................................................................................. 17

LA METODOLOGA ESTADSTICA

La estadstica es la ciencia que se ocupa de recoger los datos, analizarlos, resumirlos


e interpretarlos, y todo eso para convertir los datos en informacin, de manera que
nos sirva para tomar buenas decisiones o bien para resolver problemas.
Cuando alguien habla de hacer una estadstica quiere decir que le gustara
saber aspectos como cules son los valores ms frecuentes, cules son el mximo y
el mnimo, cul es la distribucin de sus frecuencias, porcentajes de algunos valores,
la tendencia a lo largo del tiempo o bien hacer predicciones de valores futuros.
La materia prima de la estadstica son los datos, y estos se pueden obtener de
tres maneras:

1)
2)

3)

De datos histricos: a partir de los registros, formularios, facturas, etc. Por


ejemplo, ventas de un determinado producto.
Datos experimentales: se hacen pruebas para ver cmo funciona un
proceso. Por ejemplo, qu relacin hay entre el rendimiento y la temperatura
de un proceso.
A partir de encuestas: es muy comn intentar conocer a una poblacin a
partir de una pequea parte de la misma elegida al azar. Por ejemplo, para
conocer las opiniones de los alumnos de la UPV, en lugar de preguntar a los
37000 ms de alumnos, es ms econmico preguntar a una parte
representativa de la poblacin a estudiar.

Esta tercera forma se la que vamos a seguir en primer lugar en el inicio de


esta materia en la ETSII.
Un ejemplo de encuesta es la que se muestra a continuacin:

-9-

1. Introduccin

EL OBJETO DE ESTA ENCUESTA ES OBTENER DATOS PARA LA REALIZACIN DE EJERCICIOS EN LAS CLASE DE
ESTADSTICA.
Pregunta 1. Indique su peso en kgs.
[________]
Pregunta 2. Indique su altura en cms.
[________]
Pregunta 3. Qu medios de transporte emplea para venir a la UPV?

1. Coche propio
2. Coche compartido
3. Bus
4. Metro o tranva
5. Bicicleta
6. Andando
7. Tren
8. Moto
9. Otro

Pregunta 4. Tiempo diario dedicado al estudio, en horas, de lunes a viernes


[________]
Pregunta 5. Tiempo dedicado al estudio durante el fin de semana (sbado y domingo), en horas.
[________]
Pregunta 6. Tiempo que tarda en llegar al Politcnico por las maanas, en minutos.
[________]
Pregunta 7. Qu deportes practica en la UPV?

1. Ftbol
2. Ftbol sala
3. Baloncesto
4. Tenis
5. Natacin
6. Bici
7. Gimnasia
8. Artes marciales
9. Vela
10. Marcha
11. Montaismo
12. Otros

Pregunta 8. Nota de entrada en la Universidad


[________]
Pregunta 9. Dispone de conexin a internet desde casa?
1. Si
2. No
Pregunta 10. En general, las instalaciones y servicios ofertados por la UPV son,

1. Muy malos
2. Malos
3. Regular
4. Buenos
5. Muy buenos

Pregunta 11. Edad.


[________]
Pregunta 12. Sexo.
1. Hombre
2. Mujer

MUCHAS GRACIAS POR SU COLABORACIN

Los pasos que seguimos son:

-10-

1. Introduccin

1)

Repartir el cuestionario a los alumnos y cumplimentarlo.

2)

Introducir los datos al ordenador. Para esto podemos desarrollar un programa


de captura de los datos aprovechando el Access de Microsoft, o mejor un
programa que est preparado por la captura de los datos de los encuestas,
como puede ser el DYANE 4.

3)

Una vez introducido los datos, hay que revisarlos por si hay alguien error o
valor raro que no fuera correcto.

4)

Hacer anlisis descriptivos de los datos:

a)

Resumen de todos los valores,

b)

Resumen en forma grfica.

5)

Contestar a varias preguntas, aplicando la metodologa estadstica pertinente.

Ejemplos de preguntas puede ser:

a) Cul es la nota media de acceso a la Universidad?


b) Cul es la proporcin de alumnos que cogen la bici para venir al Poli?
c) Cul distribucin de edades que hay en la clase?
d) Cul es la relacin que hay entre el peso y la altura de los alumnos?
e) La altura de los alumnos es diferente si es chico o chica?
f) etc.

La metodologa estadstica que aplican se resume en la figura siguiente

-11-

1. Introduccin

Recogida
de los datos

Distribucin de
frecuencias

Analisis de
regressin
Organizacin y
representacin
Estadstica
predictiva

Histogramas
Metodologa
estadstica

Anlisis de
correlacin

Tendencia central

Diseo de
Experimentos

Descriptiva
Modelos

Inferencia
estadstica
Analisis de la
variancia

Estimacin
Pruebas de hiptesis

Variable
Dispersin
aleatoria Clculo de
probabilidades
Distribuciones

Figura 1. 1. La metodologa estadstica

La inferencia estadstica se el proceso de conocer las propiedades de una poblacin


a partir de una muestra representativa de la misma.
La Estadstica tiene su fundamento en el clculo de probabilidades.

1.2.

EL MTODO CIENTFICO

La Estadstica utiliza el mtodo cientfico para desarrollar sus teoras. El mtodo


cientfico se basa en observar la naturaleza y formular una hiptesis de su
funcionamiento, y segn esta teora se producirn una serie de consecuencias. Si lo
que observamos no est en contradiccin con estas consecuencias, aceptamos la
hiptesis inicial. sta es aceptada hasta que encontramos una prueba que lo
invalida, y entonces debemos formular otra hiptesis y empezar de nuevo el proceso.

En la estadstica las etapas que seguimos se muestran en la Figura 1.2.:

-12-

1. Introduccin

Planteamiento del
problema

Formulacin del
modelo

Recogida de los
datos

Estimacin de los
parmetros

Hiptesis del
modelo

NO
Es vlido?

SI

Prediccin y
control

Figura 1. 2. El mtodo cientfico

Por ejemplo, queremos ver la prediccin del peso de una persona sabiendo su
altura. Se trata de un problema de regresin y el proceso que seguimos es parecido
al de la figura anterior.

-13-

1. Introduccin

1.3.

SOFTWARE ESTADSTICO

Para el tratamiento de los datos es muy interesante disponer de unos programas en


ordenador que nos facilita todo el desarrollo.
Es muy frecuente almacenar los datos con una hoja de EXCEL y a partir de
sta, cualquier software estadstico es capaz de leer la hoja de EXCEL y disponer los
datos para su tratamiento y anlisis.
La misma hoja de EXCEL tiene un complemento de anlisis de los datos. La
ventaja es que en cualquier empresa podemos disponer de la EXCEL y hacer un
anlisis bsico de los datos. Adems, uno mismo puede desarrollar programas
especficos por el tratamiento de los datos haciendo uso de los macros y del
VisualBasic que lleva incorporado el EXCEL.
El software que vamos a utilizar en esta materia es:
1. Statgraphics para Windows. El que damos en las prcticas de estadstica es la
versin 5.1 en ingls. En la UPVNET, dentro de los programas cientficos,
hay disponible la ltima versin del Statgraphics que se denomina Centurion,
y sta la podemos poner en ingls o en castellano.
2. EXCEL. Empleamos las funciones estadsticas o bien los complementos que
lleva la propia EXCEL. Es interesante cargar el complemento de Anlisis de
Datos, y tambin se pueden emplear las tablas dinmicas para extraer
informacin de un conjunto de datos.
3. DYANE 4. Es un programa muy til para el anlisis de las encuestas. Se
puede utilizar por la grabacin de los datos y despus hacer la exportacin a
un fichero en formato txt y pasarlo a formato de EXCEL.
4. MATHCAD 2000. Este software utilizamos para hacer los clculos
matemticos, pero tambin lleva todas las funciones estadsticas.
5. Lenguaje R. Es un programa de libre distribucin que se puede descargar de
http://cran.r-project.org. Es muy interesante, sobre todo para principiantes, el
cargar la librera Rcmdr. De esta forma no hace falta saberse los comandos
del R, ya que se presenta con mens como si fuera el Statgraphics.

Otro software estadstico muy bueno y que est disponible para toda la
comunidad de la UPV es el SPSS. Se lanza accediendo a UPVNET y a la carpeta de
programas cientficos. La nica limitacin es el nmero de usuarios que estn
utilizndolo al mismo tiempo. Eso depende de las licencias que haya contratado la
UPV.
Programas estadsticos adicionales son:
1. SAS. Dicen que es el mejor, pero tambin el ms caro.

-14-

1. Introduccin

2. BMDP. Fue el primero que haba y estaba programado en Fortran.


Actualmente hay una versin por Windows y an hay gente que le utiliza.
3. MINITAB. Este programa lo utilizan muchas empresas para sus clculos
estadsticos.

Actualmente todas las calculadoras cientficas disponen de las funciones


estadsticas ms bsicas. Es importante leer las instrucciones de las calculadoras
para utilizar esas funciones. Muchas veces hemos perdido el manual de la
calculadora, pero se puede obtener una copia accediendo a la WEB.

1.4.

REDONDEO DE LOS DATOS

La estadstica hace mucho uso de clculos a partir de los datos. Por eso es
importante tener en cuenta las siguientes reglas por el redondeo de los datos:

Cifras significativas:
1. La primera cifra significativa es el 1er dgito a partir de la izquierda que
es diferente de 0.
2. Cifras significativas es el nmero de dgitos contados a partir de la
primera incluida.
Ejemplos: 34,5 tiene 3 cifras significativas; 3,450 tiene 4 cifras
significativas; 0,0023 tiene 2 cifras significativas; 0,00230 tiene 3
cifras significativas.

Redondeo de un nmero que est justo a la mitad del intervalo: la regla que
se solo seguir es redondear el nmero par ms prximo que antecede al 5.
Las mquinas redondean hacia arriba a partir del 5. Ejemplos: 33,45 se
redondea a 33,4; 33,35 podra redondearse a 33,4 33,3; pero est ms
prximo el valor de 33,4. Si fuera 33,445 se redondea a 33,4, ya que tiene
menos distancia al valor de 33,4.

Cifras significativas en la presentacin de datos: se sigue la regla de los 2


dgitos de variacin. Ejemplo, si los datos son: 4,562 ; 4,673 ; 4,726; 4,364 ;
4,891; se pueden representar como: 4,56; 4,67; 4,73; 4,36; 4,89

Cifras significativas de una probabilidad: 3 cifras (o bien 4). Ejemplo:


Probabilidad de que llueva el fin de semana se del 10,5% 0,105; o bien
10,54 0,1054.
Decimales para el clculo de parmetros: Ejemplo de datos originales 3,4; 3,5;
3,1; 3,3; 3,9; 3,5; 3,5

-15-

1. Introduccin

3.
4.
5.
6.
7.
8.
9.

Media aritmtica: 1 cifra ms. Ejemplo: 3,46


Desviacin tpica: 1 cifra ms. Ejemplo: 0,24
Variancia: 2 cifras ms. Ejemplo: 0,0595 bien 0,060
Recorrido: mismas cifras. Ejemplo: 0,8
Modo: mismas cifras. Ejemplo 3,5
Coeficiente de variacin: 3 cifras. Ejemplo: 7,06% bien 0,0706
Coeficiente de correlacin: 2 cifras. Ejemplo: r=0,23 y la R cuadrado
es 0,23^2=5,29%
10. Coeficientes de regresin: y=a+bx. Por ejemplo, si y tiene dos
decimales, cada uno de los sumandos debe tener como mnimo 3
decimales. As a se expresar con 3 decimales, y b, en caso de
que x tenga valores hasta 100, debe estar expresado en 5 cifras
decimales porque al multiplicar por la cantidad x nos da un nmero
con 3 cifras decimales. Ejemplo: a=1,246; b=0,37152; x=75;
Y=1,246+0,37152*75=1,246+27,864=29,11

Cifras a guardar en los clculos:


1. En los clculos de sumas y restas de nmeros, el resultado final no
tiene ms cifras significativas despus del lugar decimal que el de
con menor nmero de ellas despus de la coma decimal. Ejemplo:
3,32+1,7= 5,0 ; 73,52-63=11,63 si no es exacto; 37,512-24 =
37,512 si 24 es exacto.
2. En los clculos con multiplicacin, divisin y extraccin de races de
nmeros, el resultado final no puede tener ms cifras significativas
que los datos con menor nmero de ellas. Ejemplo 72,34x 5,45 =
394; 1,547/0,032 = 46; (4,89)^0,5 = 2,21; 7,381x40= 295,2 si 40 es
exacto.

-16-

1. Introduccin

1.5.

ALFABETO GRIEGO

Debido a la notacin que se emplea en estadstica, es til conocer el alfabeto griego


que exponemos en la siguiente tabla.
Mays.
A
B

Mins.

Nombre
Alfa
Beta
Gamma
Delta
psilon
Zeta
Eta
Theta
Iota
Kappa
Lambda

Equivalente latino
a
b
c
d
e
f

m
n

Mu
Nu
Xi
Omicron
Pi
Rho
Sigma
Tau
Upsilon
Fi

Chi
Psi
Omega

x
y
z

Comentario
Probabilidad
Probabilidad

error

Parmetro poblacional en general


i
k
l

Parmetro de una exponencial o de


Poisson
media

o
p
r
s
t
u
v

Desviacin tpica

-17-

1. Introduccin

-18-

2. Estadstica Descriptiva

2. ESTADSTICA DESCRIPTIVA
Contenido
2.1. INTRODUCCIN ........................................................................................... 19
2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL ......................................... 22
2.2.1. Tablas de frecuencias ............................................................................. 23
2.2.2. Histogramas ............................................................................................ 23
2.2.3. Polgono de frecuencias .......................................................................... 25
2.2.4. Diagrama de puntos ................................................................................ 25
2.2.5. Grfico de tartas ...................................................................................... 26
2.2.6. Grfico de Pareto .................................................................................... 26
2.2.7. Medidas de posicin ................................................................................ 27
2.2.8. Medidas de dispersin ............................................................................. 29
2.2.9. Diagrama e tallos y hojas ........................................................................ 31
2.2.10. Diagrama de caja-y-bigotes ................................................................... 32
2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL........................................... 33
2.3.1. Tablas de frecuencia de doble entrada .................................................... 33
2.3.2. Frecuencias marginales........................................................................... 36
2.3.3. Frecuencias condicionales ...................................................................... 37
2.3.4. Representaciones grficas de las distribuciones bidimensionales ........... 38
2.3.5. Covarianza muestral................................................................................ 40
2.3.6. Regresin lineal ....................................................................................... 40
2.4. PROBLEMAS Y CUESTIONES DE EXMENES ........................................... 41

2.1. INTRODUCCIN

Gran parte de la Estadstica trata sobre la recopilacin de datos, anlisis de los


mismos, y la extraccin de conclusiones con objeto de resolver problemas.
Los datos que se presentan en la prctica pueden ser de tres tipos bsicos:
1) Datos cualitativos, que expresan una cualidad del objeto, como puede ser
bueno, malo, o tambin un color, blanco, negro, azul, etc..
2) Datos cuantitativos discretos, que expresan algo que podemos contar,
por ejemplo, nmero de defectos que tiene una pieza mecnica, nmero de
terminales en funcionamiento, nmero de accidentes de coche en una semana, etc..
3) Datos cuantitativos continuos, es decir, pueden medirse sobre una
escala continua y llevan comas decimales, por ejemplo, el dimetro de un eje, tiempo
que tarda una transaccin en ejecutarse, etc...
Decimos que los datos observados corresponden a valores de una variable
que representamos por X. Si disponemos de n datos, se representan por

x1 , x2 , x3 ,..., xn
-19-

2. Estadstica Descriptiva

y si son todos los datos de la variable X, se denomina poblacin y se representan por

x1 , x2 , x3 ,..., x N
La simple enumeracin de estos datos no nos da mucha informacin acerca
del fenmeno que estamos observando, por lo cual siempre se prefiere condensar la
informacin de modo que su interpretacin sea ms sencilla.
La forma de condensacin puede ser grfica o numrica.
variable vamos a estudiar los procedimientos ms usuales.

Para una sola

Escala de los datos


Otra clasificacin de los datos se refiere a la escala con que estn medidos. sta
puede ser de cuatro tipos:
a) Escalas No Mtricas (cualitativas)
i.
Escala nominal. Cuando la asignacin de los valores es totalmente
arbitraria. Por ejemplo, el cdigo de sexo, 1=hombre; 2=mujer.
ii.

Escala ordinal. Cuando la asignacin de los valores guarda una cierta


relacin de importancia, pero las diferencias no tienen sentido. Por
ejemplo, nivel de estudios: 1=Primaria, 2=Secundaria, 3=Bachiller,
4=Graduado.

b) Escalas Mtricas (cuantitativas)


i.
Escala de intervalo. Cuando la asignacin guarda un orden de
importancia y la diferencia entre intervalos tiene sentido. Se
caracteriza porque el origen de los datos es arbitrario. Por ejemplo,
grado de acuerdo con una afirmacin, la codificacin puede ser:
1.
2.
3.
4.
5.

Totalmente en desacuerdo
Ms bien en desacuerdo.
Indiferente.
Ms bien de acuerdo.
Totalmente de acuerdo

Pero la codificacin tambin podra haber sido con los cdigos -2, -1,
0, 1, 2.
ii.

Escala de ratio o de razn. Cuando el origen de los datos no es


arbitrario y tiene sentido las operaciones de multiplicacin y de
divisin. Por ejemplo, el peso, la altura, la longitud, etc.

Actividad 2.1.

En la encuesta que hay en el tema 1, para cada pregunta decir qu


tipo de escala utiliza la codificacin de los datos.

-20-

2. Estadstica Descriptiva

Mtodos estadsticos empleados para analizar la dependencia o la interdependencia


entre los datos observados
TCNICA DE ANLISIS MULTIVARIANTE
A) Relaciones de dependencia
Una
variable
dependiente/Mltiples Mltiples
variables dependiente
independientes

dependientes/mltiples

1. Anlisis de regresin mltiple


1. Anlisis discriminante multiple
2. Anlisis de regresin logstica
2. Anlisis
de
correlaciones
binaria
cannicas
3. Anlisis de clasificacin mltiple
3. Redes neuronales artificiales
4. AID
(Automatic
interaction
detection)
5. CHAID (Chi Square Automatic
Interaction Detection)
6. Anlisis conjunto categrico
7. Anlisis conjunto ordinal
B) Relaciones de interdependencias
Entre variables

Entre casos objetos

1. Anlisis
de
componentes
principales
2. Anlisis
factorial
de
correspondencias
3. Anlisis multidimensional

1. Anlisis
cluster)

de

grupos

MTODOS DE DEPENDENCIA ENTRE VARIABLES


Mtodo

Relacin funcional

Anlisis
regresin
simple

de

Anlisis
regresin
mltiple

de

Y1
(mtrica)

Anlisis de la
varianza

(mtrica, no mtrica)

Y1 X 1 X 2 X n
(mtrica)

(mtrica, no mtrica)

Y1 X 1 X 2 X n
(mtrica)

Anlisis
multivariante de
la varianza

X1

(no mtrica)

Y1 Y2 Ym X 1 X 2 X n
(mtrica)

-21-

(no mtrica)

(anlisis

2. Estadstica Descriptiva

MTODOS DE DEPENDENCIA ENTRE VARIABLES


Mtodo

Relacin funcional

Y1 X 1 X 2 X n

Anlisis
discriminante
mltiple

(no mtrica)

(mtrica)

Y1 X 1 X 2 X n

Anlisis conjunto

(no mtrica, mtrica)

(mtrica)

Y1 Y2 Ym X 1 X 2 X n

Correlacin
cannica

(mtrica, no mtrica)

(mtrica, no mtrica)

Y1 X 11 X 12 X 1n

Modelo
de
ecuaciones
estructurales

Y2 X 21 X 22 X 2 n
Y3 X 31 X 32 X 3n
(mtrica, no mtrica)

(mtrica, no mtrica)

2.2 ESTADSTICA DESCRIPTIVA UNIDIMENSIONAL


Si observamos una variable X y disponemos de n datos, en la forma x1 , x2 ,..., xn , una
manera sencilla de representarlos es mediante una tabla o un histograma de
frecuencias.
Llamamos "frecuencia absoluta" de un valor, al nmero de veces que aparece
dicho valor. La "frecuencia relativa" es el nmero de veces que aparece el valor
dividido por el nmero total de datos observados. Esto es:

Frecuencia relativa =

nmero de veces que aparece


nmero total de observaciones

El campo de existencia de una variable es el conjunto de posibles valores que


pueden tomar los datos.

-22-

2. Estadstica Descriptiva

2.2.1. Tablas de frecuencias

Una vez ordenados los datos de menor a mayor y agrupados en intervalos, se puede
formar la siguiente tabla de frecuencias,

Lmites
del
intervalo

Valor
de
clase

Frecuencia

Frecuencia
relativa

Frecuencia
acumulada

Frecuencia
acumulada
relativa

n1

n1
n

n1

n1
n

n1 n2

n1 n2
n

ai x bi

xi

ni

ni
fi
n

n1 n2 ni

n1 n2 ni
n

nk

nk
n

k
Sumas

2.2.2. Histogramas

El histograma de frecuencias divide el campo de existencia de la variable en una


serie de intervalos, que por lo general, son de igual longitud, determinando
exactamente los lmites de cada intervalo.
Para cada intervalo contamos el nmero de datos que pertenecen al mismo, y
en un diagrama X-Y, tomando como eje X la variable, y como ordenadas el nmero
de datos que hay en cada intervalo, representamos unos rectngulos con base igual

-23-

2. Estadstica Descriptiva

a la longitud del intervalo de clase y con altura igual al nmero de datos de dicha
clase.
Con el histograma podemos ver qu intervalos son ms frecuentes que otros.
Para ello es importante el nmero de subdivisiones que hagamos, ya que si son
pocas, no veremos nada, y si son muchas, tampoco. Por lo general, el nmero de
intervalos se sita entre 5 y 20. Tambin est la opcin de tomar como nmero de
intervalos la raz cuadrada del nmero de datos.
Si en lugar de poner como altura de los rectngulos la frecuencia absoluta,
ponemos la frecuencia relativa, se tiene el "histograma de frecuencias relativas", cuya
forma es exactamente la misma que el histograma de frecuencias absolutas, slo que
hay un cambio de escalas en la ordenada.
Al punto medio de cada intervalo se le llama valor de clase y representa a
dicho intervalo.
Si empezando por la izquierda del histograma, vamos acumulando las
frecuencias de los siguientes rectngulos, y los representamos, tendremos una figura
con una serie de rectngulos escalonados. Esta figura recibe el nombre de
"histograma de frecuencias acumuladas", el cual puede ser de frecuencias absolutas
o relativas, segn lo que vayamos acumulando.
Si la variable es discreta, el valor de la clase coincide con el valor discreto,
entonces recurrimos a un "diagrama de barras", colocando encima de cada valor una
barra de longitud igual a la frecuencia del valor. Lo mismo hacemos si las clases
corresponden a valores de una variable cualitativa (tipo de defecto,)

Figura 2. 1 Ejemplo de histograma.

-24-

2. Estadstica Descriptiva

2.2.3. Polgono de frecuencias

Un polgono de frecuencias se obtiene uniendo los puntos medios de la base superior


de cada rectngulo. Al igual que con los histogramas, tendremos cuatro tipos de
polgonos de frecuencias.

Histogram

18

frequency

15
12
9
6
3
0
43

53

63

73
Peso

83

93

103

Figura 2. 2 Polgono de frecuencias

2.2.4. Diagrama de puntos

Cuando hay pocos datos se pueden representar con un diagrama de puntos, el cual
se forma haciendo coincidir un punto grueso con cada valor de X que aparece. En
caso de que haya dos iguales, se coloca un punto encima de otro.

Figura 2. 3 Diagrama de puntos

-25-

2. Estadstica Descriptiva

2.2.5. Grfico de tartas


Otra representacin tpica para variables cualitativas es el grfico de tartas o en
crculo, en el cual cada clase se representa por un sector de rea proporcional a su
frecuencia. La frecuencia puede ser absoluta o relativa. En este ltimo caso se
interpreta que el 100% de la tarta se reparte entre las clases existentes.

Figura 2. 4 Grfico de tartas

2.2.6. Grfico de Pareto

El grfico de Pareto es un histograma de frecuencias pero ordenado de mayor


frecuencia a menor frecuencia. De esta forma se intenta destacar el hecho de que
unas pocas clases representan casi el total de los datos aparecidos. Esto recibe el
nombre de la ley del 20-80%, que se aplican en distintos aspectos de la economa.

Figura 2. 5 Grfico de Pareto

-26-

2. Estadstica Descriptiva

Adems de dar grficamente la situacin de los valores de una variable X, nos


interesa bsicamente contestar a dos preguntas:
1) Dnde est situada la variable?
2) Cul es su campo de variabilidad?
Para poder realizar comparaciones necesitamos unos valores numricos.
Aquellos que contestan a la primera pregunta se llaman "parmetros de posicin", y
los de la segunda pregunta, "parmetros de dispersin".

2.2.7. Medidas de posicin

Los parmetros de posicin que vamos a ver son: la media, la mediana, y la moda.
Si de una variable X, tenemos un conjunto de valores x1 , x2 ,..., xn , se define la
media como:
n

x
x=

i=1

n
Este valor coincide con la media aritmtica, pero como aqu slo son un parte
de los posibles valores de X, se denomina "media muestral".
Cuando el conjunto de valores de que disponemos son todos los de la
variable X, al conjunto de ellos se denomina "Poblacin", y su media recibe el nombre
de "media poblacional", representndola con el smbolo :
N

= m=

i=1

N
La media muestral representa el centro de masas de un histograma, y
corresponde al valor medio que toman los datos.
Es una medida poco robusta, ya que ante la aparicin de un valor anmalo, la
media se ve bastante modificada.
La "mediana" expresa aquel valor que por debajo de l hay 50% de los datos,

y por encima el 50% de los datos. Se representa por X , para una muestra, y el valor
depende de si el nmero de datos es impar o par. Si es impar la mediana coincide
con el valor central, previamente ordenados los valores de menor a mayor, y si es

-27-

2. Estadstica Descriptiva

par, se toma el punto medio de los valores centrales. De aqu que empleemos la
expresin:

X ( n+1 ) si n es impar
2
~

X = x + x

(n/2)
([n/2]+1)
si n es impar

~.
La "mediana poblacional" se representa por
La mediana es una medida robusta, esto es, se modifica poco ante la
aparicin de un dato anmalo.
La "moda" es aquel valor de X que se repite ms, es decir, el de ms
frecuencia. Si solamente hay una moda, se denomina "unimodal"; si hay varias, se
llama "multimodal". Vienen a ser los picos que forman un histograma de frecuencias
no acumulado.
En una distribucin simtrica, coinciden los tres parmetros, pero si hay una
cola hacia la derecha, lo que se llama "asimetra positiva", ocurre que:
moda < mediana < media

f(x)

Coef . Asim .Pearson

x~
x
s

Asimtrica positiva

moda

media
mediana

y si la cola es hacia la izquierda, es "asimetra negativa", y ocurre que


moda > mediana > media

-28-

2. Estadstica Descriptiva

f(x)
Asimtrica negativa

Coef .Asim.Pearson

x~
x
s

x
media
moda
mediana
Se define el "percentil p%" como aqul valor de X que deja a su izquierda un
p% de los datos. Si p = 25%, se le llama "primer cuartil" Q1 , si p= 50%, es el
"segundo cuartil " Q 2 , que coincide con la mediana, y para p=75% es el "tercer
cuartil" Q 3 . Los cuartiles dividen a los datos en 4 partes con igual nmero de ellos.

f(x)
CUARTILES

25%

25%

25%

25%

x
Q1

Q2

Q3

2.2.8. Medidas de dispersin

Las principales medidas que empleamos son: la varianza, la desviacin tpica, el


rango, y el coeficiente de variacin.
La varianza poblacional se representa por 2 , y se define con todos los datos
de la poblacin:
-29-

2. Estadstica Descriptiva

( x - )

2
=

i=1

Para el conjunto de valores x1, x2 , x3 ,..., xn de la variable X, la "varianza" es:


n

( x - x )

2
s =

i=1

n-1

Dicho valor nos sirve para hacer estimaciones de la varianza poblacional y recibe el
nombre de "cuasivarianza o varianza muestral corregida:
La varianza es una medida cuyas unidades estn al cuadrado. Para hacerlas
homogneas con las unidades de los datos y de la media se define la "desviacin
tpica muestral" como la raz cuadrada con signo positivo de la varianza muestral.
As:

s = + s2
Cuanto mayor es la varianza, mayor es la dispersin de los datos.
Otra idea de la variabilidad de los datos la proporciona el "recorrido", que se
define como la diferencia entre el mximo y el mnimo de los valores observados. Se
expresa como:

R = xm ax - xmin
Si n=2 la informacin que dan R y s 2 acerca de la dispersin de los datos es
la misma, ya que utilizan los mismos datos, pero para n=3, R ya no emplea uno de
ellos, pero an es una buena aproximacin. Para n>10, el rango ya no es til para ver
la dispersin de los datos, y entonces se preferir el empleo de s 2 .
El "coeficiente de variacin" es una medida adimensional de la dispersin, se
define como el cociente entre la desviacin tpica y la media, esto es:

C.V. =

100 o bien CV 100

y permite comparar la dispersin de dos conjuntos de datos.


As, por ejemplo, dos grupos de datos pueden tener la misma dispersin, sea
s=1, pero si la media de uno es de 10, y la del otro de 1000, lgicamente hay mayor
variacin relativa en el primero que en el segundo. Este coeficiente de variacin nos
da una idea de la "precisin" de los datos.

-30-

2. Estadstica Descriptiva

Otras medidas de dispersin son.

El recorrido intercuartlico: Q3-Q1


Desviaciones:
i. Media de las desviaciones absolutas respecto a la media:
n

x x
Dm=

i 1

ii. Mediana de las desviaciones absolutas respecto de la


mediana: MEDA= mediana x ~
x
i

MEDIDA DE ASIMETRA
El coeficiente de asimetra es,
n

( x
g1 =

- x )3 /n

i= 1

Si CA = 0 se trata de una distribucin simtrica; si CA<= la distribucin es


asimtrica hacia la izquierda; y si CA>0 la distribucin es asimtrica hacia la derecha.

MEDIDA DEL APLANAMIENTO


El coeficiente de aplanamiento es,
n

( x - x )

g2 =

/n

i= 1

Si CC=3 tiene el mismo aplanamiento (curtosis) que una campana de Gauss;


si CC>3 la distribucin es ms puntiaguda que la campana de Gauss; y si CC<3, la
distribucin es ms plana que la campana de Gauss.

2.2.9. Diagrama e tallos y hojas

El histograma de frecuencias es una buena herramienta para identificar la forma,


posicin y dispersin de los datos, pero hay una prdida de informacin, ya que los
datos individuales se pierden al representarlos en un grfico de rectngulos. Para ello
se emplean otros mtodos que dan la misma idea que el histograma, sin perder la
informacin individual de cada dato.

-31-

2. Estadstica Descriptiva

Se trata de dividir los nmeros en dos partes. La parte de la izquierda, que


llamamos "tallo", y la parte de la derecha, que llamamos "hojas". As el nmero 123,
tenemos el 12, que constituye el tallo, y el 3, que es la hoja. De esta forma para una
misma lnea agrupamos todos los nmeros que tienen el mismo tallo, as, por
ejemplo, para el 128, se agrupa junto al anterior como:

12 | 38
separando el tallo de las hojas mediante una barra vertical. Si tenemos el 115,
aparece otro tallo, y ahora la figura es:

11 | 5
12 | 38
De esta manera no perdemos los datos individuales, a la vez que se va
formando algo parecido a un histograma de frecuencias.
Cuando se quiere subdividir ms las clases, los diez dgitos de la derecha se
van agrupando de dos en dos, formando 5 nuevas clases. As:
Clase * = el 0 y el 1.
Clase T = el 2 y el 3.
Clase F = el 4 y el 5.
Clase S = el 6 y el 7.
Clase . = el 8 y el 9.
Tambin se puede hacer una agrupacin en dos: una del 0 al 4, y otra del 5 al
9.

2.2.10. Diagrama de caja-y-bigotes

Otra forma de representar los datos es mediante un diagrama de una Caja, cuyos
lados vienen dados por el primer cuartil y el tercer cuartil, y en su interior se dibuja el
segundo cuartil, esto es, la mediana. Partiendo de cada lado se dibujan unas lneas
que llegan hasta el 10 percentil, por un lado, y el 90 percentil por el otro. Para datos
extensos, se dibuja el 5 y el 95 percentiles. Concretamente, en el STATGRAPHICS
los bigotes se calculan con una longitud de 1,5 veces la anchura del rectngulo, y los
extiende hasta el ltimo punto que est dentro del bigote. De esta forma aquellos
puntos que quedan fuera de los bigotes, se consideran puntos anmalos, esto es,
puntos que posiblemente no pertenecen a la distribucin considerada.

-32-

2. Estadstica Descriptiva

La anchura de la Caja contiene el 50% de los datos, lo cual da una idea de la


dispersin, y la posicin de la mediana, junto con la longitud de los bigotes nos da
una idea de la simetra o no de los datos.
Este diagrama es muy til para comparar dos grupos de datos y observar de
forma grfica si hay diferencia o no entre ellos.

Box-and-Whisker Plot

45

55

65
Peso

75

85

Figura 2. 6 Diagrama de Caja y bigotes

2.3. ESTADSTICA DESCRIPTIVA BIDIMENSIONAL


2.3.1. Tablas de frecuencia de doble entrada

Cuando para cada elemento de la poblacin, o bien para cada unidad de estudio, se
observan dos caractersticas, y clasificamos cada unidad segn las dos
caractersticas, asignndola a una de las celdillas que resultan de dividir cada
caracterstica en un conjunto de intervalos, y contamos el nmero de unidades que
resultan en cada celdilla, se tiene una tabla de doble entrada o tambin se llama una
tabla de contingencia.
Como ejemplos tenemos:
- De cada alumno de una clase tomamos nota de su peso y su altura y lo
clasificamos en su celdilla correspondiente.
- Cada persona se puede clasificar segn que haya tomado o no la vacuna
contra la gripe y segn que haya o no contrado la enfermedad.

-33-

2. Estadstica Descriptiva

- En una fbrica donde hay tres turnos de produccin se cuenta el nmero de


defectos de calidad que hay en los coches producidos y se clasifican stos
en funcin del turno en que han sido producidos(1, 2 3) y del nmero de
defectos que contienen (0, 1, 2, 3 >=4)
Las caractersticas observadas se representan por (X,Y) siendo X la primera
de ellas, por ejemplo el peso, e Y la segunda, por ejemplo la altura. Para las
unidades
observadas
1,
2,...,
n
tenemos
los
valores
( x1 , y1 ),( x2 , y2 ),...,( xn , yn ) . Estas caractersticas, que tambin llamamos
variables muestrales, pueden ser ambas cualitativas,
por ejemplo,
defectuoso- correcto, o tipo de defecto; o ser ambas cuantitativas, caso del
peso-altura, o bien una de ellas cualitativa y la otra cuantitativa, en cuyo
caso se dice que es una variable bidimensional mixta.
Si la primera caracterstica podemos tener I intervalos, los cuales representan
I filas de una matriz, y para la segunda caracterstica tenemos J columnas de una
matriz, entonces se tiene una tabla de doble entrada de la siguiente forma:
Tabla 2.1. Tabla de frecuencias

total

1
2

nij

ni

n j

I
total

Donde se tiene la siguiente notacin:

nij = nmero de elemento en la celdilla ij.

ni = nmero de elementos de la fila i.


n j = nmero de elementos de la columna j.

n = nmero total de elemento observados.


-34-

2. Estadstica Descriptiva

La frecuencia absoluta de cada celdilla es nij y la frecuencia relativa es:

f r ( xi , y j ) =

nij nij
=
n n

La suma de las frecuencias relativas de todas las casillas es igual a la unidad,


esto es:

n
n
f ( x , y )= n = n = 1
ij

Como ejemplo de una tabla de doble entrada, supongamos que un fabricante


de automviles dispone de tres turnos de fabricacin de coches, y para cada turno
cuenta aquellos coches que han tenido 0 defectos de calidad, 1, 2,3, ms de 4
defectos de calidad. Para un da de produccin ha obtenido la siguiente tabla de
doble entrada

Tabla 2.2. Ejemplo de tabla de frecuencias

nmero de defectos de calidad

turno

A
B
C
Total

>=4

Total

310
390
220
920

50
40
60
150

30
60
90
180

40
50
10
100

20
10
20
50

450
550
400
1400

La tabla de frecuencias relativas es:

Tabla 2.3. Tabla de frecuencias relativas

nmero de defectos de calidad

turno

>=4

.221

.036

.021

.029

.014

.279

.029

.043

.036

.007

.157

.043

.064

.007

.014

Total

-35-

Total

2. Estadstica Descriptiva

2.3.2. Frecuencias marginales

Si a partir de una tabla de doble entrada solamente queremos estudiar una de las
caractersticas, tomaremos las frecuencias que aparecen en el lado derecho de la
tabla, si deseamos estudiar la primera caracterstica, o bien la fila que el margen de
abajo, si deseamos estudiar las segunda caracterstica. Cada una de esas
frecuencias son las llamadas frecuencias marginales, ya que aparecen justamente
en los mrgenes de las tablas de doble entrada.
As la frecuencia relativa de la clase xi es:

f r ( xi ) =

ni
n

y la frecuencia relativa de la clase y j es:

f r ( y j )=

n j
n

Lgicamente se cumple que:

f ( x )= nn

n
=1
n

n
=1
n

n
f ( y )= n
r

.j

Por ejemplo la distribucin de frecuencias marginales del nmero de defectos


de calidad es:

-36-

2. Estadstica Descriptiva

Tabla 2.4. Tabla de frecuencias marginales

nmero de defectos de calidad


0

turno

>=4

Total

.321

.393

.286

Total

.657

.107

.129

.071

.036

2.3.3. Frecuencias condicionales

En otras situaciones se quiere conocer la distribucin de una variable para un valor


dado de la otra. Por ejemplo, en la tabla de doble entrada para una valor de y j se
desea conocer la distribucin de las casillas que aparecen en esa columna. Dicha
distribucin recibe el nombre de distribucin de frecuencias condicionales, y su valor
para cada casilla es:

f r ( xi / y j ) =

nij
n j

Como es lgico, la suma de todas las frecuencias condicionales para ese


valor de y j es igual a la unidad.

n
f ( x / y )= n

ij

n j
=1
n j

Por ejemplo para el turno B la distribucin de frecuencias condicionales es:

-37-

2. Estadstica Descriptiva

Tabla 2.5. Tabla de frecuencias condicionales

nmero de defectos de calidad


0

>=4

Total

.709

.073

.109

.091

.018

1.000

A
turno

B
C
Total

2.3.4. Representaciones grficas de las distribuciones bidimensionales

Cuando se tienen los datos como ( x1 , y1 ),( x2 , y2 ),...,( xn , yn ) una forma inmediata de
representacin son unos ejes coordenados en los que cada punto representado
corresponde a un elemento observado con la primera coordenada igual al valor de X
y la segunda coordenada igual al valor de Y. Por ejemplo, si de cada alumno de la
clase se ha observado el peso y la altura, cada punto representa a un alumno.
El inters de estas representaciones se basa en la necesidad de contestar a
las preguntas de:
- Existe una relacin lineal entre las dos caractersticas?
- Cul es el grado de relacin lineal que hay?
- Se puede predecir un valor a partir del otro?
El diagrama que resulta recibe el nombre de diagrama de dispersin. Un
ejemplo de diagrama de dispersin aparece en la Figura 2.7.

-38-

2. Estadstica Descriptiva

Plot of Peso vs Altura

85

Peso

75

65

55

45
150

160

170

180

190

200

Altura

Figura 2. 7 Grfico de Dispersin

Otra forma de representacin es el histograma en tres dimensiones. Este


consiste en representar en un sistema de ejes X-Y-Z, las celdillas de la tabla de doble
entrada como formando un suelo de baldosas en el plano X-Y, y encima de cada
baldosa, que corresponde con cada casilla, una columna de altura proporcional a la
frecuencia relativa de cada una de ellas. Un ejemplo de histograma en tres
dimensiones es el que aparece en la Figura 2.8.

Figura 2. 8 Histograma en 3 dimensiones

-39-

2. Estadstica Descriptiva

El volumen del edificio que resulta se dice que es igual a la unidad. La


proyeccin de ese edificio sobre el plano X-Z resulta el histograma de frecuencias
relativas de X, y la proyeccin del edificio sobre el plano Y-Z resulta el histograma de
frecuencias relativas de la caracterstica Y.

2.3.5. Covarianza muestral

Mediante el grfico de dispersin o el histograma tridimensional, se puede observar si


hay una relacin lineal entre las variables, es decir, si para valores altos de una de
ellas, la otra tambin toma valores elevados. En este caso la relacin lineal es en
sentido positivo, y grficamente los puntos tienden a situarse alrededor de una recta
de pendiente positiva.
Cuando para valores altos de X se observan valores bajos de Y se dicen que
la relacin lineal es negativa.
Para dar una idea numrica de la relacin lineal entre las dos variables, se
define la covarianza muestral sxy como:
2

s xy =

1
( xi - x )( yi - y )
n 1 i

Como sxy tiene dimensiones, por ejemplo para (peso, altura) puede ser
kgs.cms, con objeto de tener una medida adimensional, se emplea el coeficiente de
correlacin muestral r xy que se define por:
2

s xy
r xy =
sx s y
r xy es un valor que siempre est entre -1 y +1. Cunto ms se acerca a la
unidad en valor absoluto, mayor es la relacin lineal que hay entre las dos variables.
Si vale cero, no hay ninguna relacin lineal entre las dos variables

2.3.6. Regresin lineal

Si observamos una relacin lineal entre los valores de X e Y, podemos ajustar un


recta que sea la que minimice, para el conjunto de todos los casos, la suma de
cuadrados entre el valor observado y el predicho por dicha recta.

-40-

2. Estadstica Descriptiva

La ecuacin de la recta de regresin de ajuste por mnimos cuadrados del


valor de Y conocido un valor de x, viene dada por,

y y rxy

sy
sx

(xx)

O bien,

y y

s xy
s x2

(xx)

2.4. PROBLEMAS Y CUESTIONES DE EXMENES

2.4.1.- En las pruebas de acceso del ltimo ao se seleccionaron al azar 120


alumnos de tres tipos de colegio y se tomaron en cuenta las notas obtenidas por cada
uno de ellos. Con estos datos se defini la variable aleatoria bidimensional (Tipo de
colegio, Calificaciones obtenidas) como muestra la tabla siguiente:
SUSPENSOS

APROBADOS

NOTABLES

SOBRESALIENTES

Total

fila
----------------------------------------------------|
3 |
15 |
22 |
6 |
----------------------------------------------------PRIVADO
|
3 |
24 |
8 |
5 |
----------------------------------------------------CONCERTADO |
4 |
8 |
17 |
5 |
----------------------------------------------------Total columna
10
47
47
16
PUBLICO

46
40
34
120

a) Completar la tabla anterior calculando las probabilidades de la distribucin


bidimensional conjunta de la variable (Tipo de colegio, Calificaciones) (0,5
puntos)
b) Completar la tabla siguiente con las distribuciones unidimensionales
marginales de las variables Tipo de colegio y Calificaciones (1 punto)

-41-

2. Estadstica Descriptiva

SUSPENSOS

APROBADOS

NOTABLES

SOBRESALIENTES

Total

fila
----------------------------------------------------|
3 |
15 |
22 |
6 |
----------------------------------------------------PRIVADO
|
3 |
24 |
8 |
5 |
----------------------------------------------------CONCERTADO |
4 |
8 |
17 |
5 |
----------------------------------------------------Total columna
10
47
47
16
PUBLICO

46
40
34
120

c) Completar la tabla siguiente con la distribucin condicional de las


calificaciones en los colegios privados (0,5 puntos)
SUSPENSOS
APROBADOS
NOTABLES
SOBRESALIENTES
----------------------------------------------------PUBLICO
|
3 |
15 |
22 |
6 |
----------------------------------------------------PRIVADO
|
3 |
24 |
8 |
5 |
----------------------------------------------------CONCERTADO |
4 |
8 |
17 |
5 |
----------------------------------------------------Total columna
10
47
47
16

-42-

Tot fila
46
40
34
120

2. Estadstica Descriptiva

SOLUCIN
Las frecuencias de cada casilla (en porcentaje) son:
SUSPENSOS

APROBADOS

NOTABLES

SOBRESAL.

PBLICO

3/120

15/120

22/120

6/120

PRIVADO

3/120

24/120

8/120

5/120

CONCERTADO

4/120

8/120

17/120

5/120

Total columna

Total
fila

120

Las distribuciones marginales (en porcentaje) son:


SUSPENSOS

APROBADOS

NOTABLES

SOBRESAL.

Total fila

PBLICO

46/120

PRIVADO

40/120

CONCERTADO

34/120

Total columna

10/120

47/120

47/120

5/120

120

La distribucin condicional de las notas para los colegios privados (en porcentaje) es:
SUSPENSOS

APROBADOS

3/40

24/40

NOTABLES

SOBRESAL.

Total
fila

PBLICO
PRIVADO

8/40

5/40

40

CONCERTADO
Total columna

2.4.2.- A partir del diagrama siguiente, que representa los datos de consumo
elctrico mensual entre enero 2010 y junio 2011, elija la respuesta correcta a las

-43-

2. Estadstica Descriptiva

siguientes

preguntas:

Box-and-Whisker Plot

20

30

40

50

60

70

Consumo
1. El consumo medio ha sido:
a. 49.4
b. 56.5
c. 43.5

(0,25 puntos)

2. El 75% de los meses se consumi:


a. Menos de 56.5 .
b. Ms de 56.5 .
c. Entre 43.5 y 56.5 .

(0,25 puntos)

3. El consumo mnimo observado en estos 20 meses fue de:


a. 20 .
b. 39 .
c. 42.5 .

(0,25 puntos)

4. La distribucin tiene una asimetra


(0,25 puntos)
a. Positiva, porque el tercer cuartil es mayor que el primer cuartil.
b. Negativa, porque el tercer cuartil es mayor que el primer cuartil.
c. Se puede decir que la distribucin es simtrica.

5. El 50% de los meses se consumi:


a. Ms de 56.5 .
b. Menos de 43.5 .
-44-

(0,25 puntos)

2. Estadstica Descriptiva

c. Entre 43.5 y 56.5 .


2.4.3.- Una empresa decide realizar un estudio sobre el consumo de un determinado
material, necesario para el proceso de fabricacin que lleva a cabo, en funcin del da
de la semana, en vistas a optimizar su stock semanal del producto y la deteccin de
posibles anomalas. Se han analizado un total de 57 das, de lunes a viernes. Con
estos datos de consumo se realiza el diagrama Box-Whisker mltiple que se muestra
a continuacin:

Grf ico de Cajas y Bigotes


Lunes

DIA

Martes
Mircoles
Jueves
Viernes
0

100

200

300

CONSUMO

-45-

400

500

2. Estadstica Descriptiva

A la vista de los diagramas, responder a las siguientes preguntas justificando


convenientemente las respuestas.

1. La mayor dispersin de consumo se produce:


(0.25
puntos)
a. Los lunes
b. Los martes
c. Los mircoles
d. Todos tiene la misma dispersin ya que el consumo es independiente
del da
Pues el rango intercuartlico es mayor.
2. La mayor asimetra se presenta:
a. Los jueves y es positiva
b. Los martes y es negativa
c. Los martes y es positiva
d. Los jueves y es negativa

(0.25 puntos)

Pues ese da se da la mayor distancia entre la mediana y la media, y


media > mediana.
3. En trminos medios, los das de menor consumo son:
puntos)
a. Los mircoles
b. Los viernes
c. Los martes
d. No se dispone de datos suficientes

(0.25

Pues la media es la que est ms a la izquierda de todos los das.


4. Cul de las siguientes afirmaciones es cierta?
puntos)
a. El 75% de los lunes se consume por encima de 300
b. El 75% de los lunes se consume por debajo de 300
c. El 25% de los mircoles se consume por debajo de 260
d. El 25% de los mircoles se consume por encima de 180

(0.25

El lmite derecho de la caja de los lunes, que corresponde al tercer


cuartil, est en 300.

-46-

3. Probabilidades

TEMA 3. PROBABILIDADES

Contenido
3.1. INTRODUCCIN ........................................................................................... 47
3.2. PROBABILIDAD ............................................................................................. 48
3.2. ESPACIOS DE PROBABILIDADES ............................................................... 48
3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES ..................................... 52
Probabilizacin de Espacios Muestrales Discretos ............................................ 52
Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria ........ 53
Combinatoria ..................................................................................................... 53
3.5. PROBABILIDAD CONDICIONADA ................................................................ 54
3.6. TEOREMA DE LA INTERSECCIN............................................................... 56
3.7. TEOREMA DE LA PARTICIN TOTAL.......................................................... 56
3.8. SUCESOS INDEPENDIENTES...................................................................... 57
3.9. TEOREMA DE BAYES ................................................................................... 58
3.10. PROBLEMAS PROPUESTOS ..................................................................... 59
Probabilidad condicional.................................................................................... 61
3.11. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 66

3.1. INTRODUCCIN
El objeto central del Clculo de probabilidades y de la estadstica, lo constituyen los
llamados fenmenos aleatorios. Los fenmenos aleatorios son aquellos fenmenos
reales que se caracterizan por la impredecibilidad de sus resultados y por la llamada
regularidad estadstica.
El clculo de probabilidades se ha desarrollado en situaciones en las cuales
se realiza un experimento y se observa un resultado. Pero dicho resultado no se
puede predecir de antemano con exactitud. A estos experimentos los llamamos
Experimentos Aleatorios. Este concepto tiene otras caractersticas comunes. La
primera de ellas es que no podemos saber de antemano su resultado, a lo sumo
podemos describir un conjunto de posibles resultados. Segundo es que dicho
experimento lo podemos repetir exactamente en las mismas condiciones y el
resultado ser totalmente distinto. No obstante, a medida que el nmero de
repeticiones del experimento va aumentando se presenta un comportamiento
caracterstico de la frecuencia con que aparece cada resultado, que llamamos
"regularidad estadstica"

-47-

3. Probabilidades

Si llamamos n al nmero de repeticiones del experimento aleatorio, a la


frecuencia absoluta, es decir, al nmero de veces que ocurre un determinado
resultado y a f r su frecuencia relativa, tendremos que:
fr=

Por definicin de fenmeno aleatorio, cuando n crece fr tiende a estabilizarse


alrededor de un cierto valor. Cuando el fenmeno aleatorio tiene esta propiedad,
diremos que posee la caracterstica de la Regularidad Estadstica.

3.2. PROBABILIDAD
Al repetir el experimento aleatorio, se observa que unos resultados aparecen ms
que otros, por lo cual cabe hablar de la posibilidad de que un suceso aparezca ms
veces que otro. Esto es, a cada suceso asociamos una medida de la posibilidad de
que tenga lugar. A esta medida se llama probabilidad de ocurrencia del suceso.
Tres puntos de vista o enfoques de la probabilidad:
Frecuencialista: la probabilidad de un suceso es el lmite al que tiende la
frecuencia relativa con que se presenta dicho suceso.
Objetivas: es el grado de evidencia de una proposicin cualquiera.
Subjetiva: es el grado de creencia personal en la veracidad de una
proposicin.

3.2. ESPACIOS DE PROBABILIDADES

E= Espacio muestral
x
A
x

x
x
x

A=suceso compuesto
x=suceso elemental

Figura 3. 1 Espacio muestral

-48-

3. Probabilidades

Al conjunto de los posibles resultados del experimento aleatorio se denomina


"Espacio muestral". Grficamente lo solemos representar por un crculo, tal como
aparece en la Figura 3. 1.
Si los resultados se pueden contar, o se pueden contabilizar, aunque sea para
un nmero infinito, el espacio muestral es discreto.
Si el espacio muestral es incontable, caso de un nmero real en el intervalo
de la recta real, se dice que el espacio muestral es "continuo".
Ejemplos de espacio muestrales son:
- Nmero de puntos al lanzar un dado (discreto y finito),
- Nmero de accionamiento de un interruptor hasta su fallo (discreto e infinito
numerable),
- Medida del peso de un paquete de arroz (contnuo).
Al espacio muestral lo representamos por la letra E.

Actividad 3.1:
Cul es el espacio muestral al lanzar un dado?
Cul es el espacio muestral al lanzar una moneda?
Cul es el espacio muestral al medir el peso de un paquete de arroz?.

Un suceso A, es cualquier subconjunto contenido en el espacio muestral. Si el


suceso es un posible resultado del experimento aleatorio, lo llamamos "suceso
elemental". Cualquier otro subconjunto se denomina "suceso compuesto".
Otros sucesos que se definen a partir del espacio muestral son:
1)

Suceso vaco. El que tericamente nunca va a aparecer. Lo representamos por

. (ej. Obtener 7 puntos al lanzar un dado normal)


2)

Suceso cierto. El que siempre aparece. El suceso E siempre aparece, ya que al


realizar el experimento aleatorio siempre tendr lugar algn resultado del espacio
muestral.

3)

Suceso complementario. Dado el suceso A E , el complementario A ocurre


cuando no aparece el A.
-49-

3. Probabilidades

4)

Sucesos mutuamente excluyentes. Cuando dados dos sucesos A1 , A2 , si


ocurre uno de ellos no ocurre el otro, es decir, no se pueden dar al mismo
tiempo.

5)

Suceso unin. Dados dos sucesos A1 , A2 , se llama suceso unin A1 A2


cuando aparece el A1 o el A2 ambos a la vez. Tambin recibe el nombre de
adicin.

6)

Suceso interseccin. Dados los sucesos A1 , A2 E se llama interseccin

A1 A2 , cuando sucede A1 y A2 a la vez.


Al igual que con el conjunto de nmeros se establecen unas operaciones que
dan lugar a otros nmeros, con los sucesos pertenecientes al espacio muestral, y
mediante operaciones de complementacin, unin e interseccin, dan lugar a otros
sucesos. El conjunto de dichos sucesos se dice que forman una -lgebra si se
cumplen las dos condiciones siguientes:
1) Si A F el suceso A tambin pertenece a F.
2) Si A1 , A2 ,.... F , el suceso unin infinita tambin pertenece a F.
Recordar las propiedades conmutativas y asociativas de la unin y de la
interseccin, y la propiedad distributiva de cada una de estas operaciones respecto
de la otra.
Realmente la probabilidad es una aplicacin del espacio muestral en la recta
real. Dado un espacio muestral E, y una -algebra F, decimos que la aplicacin
P : F es una probabilidad, si y solo si se cumplen los siguientes axiomas:
1) A F P(A) 0
2) P(E) = 1
3) A1 , A2 ,.... F; Ai

A = es P( A )= P( A )
j

i j

A partir de estos axiomas se demuestran las siguientes propiedades:


1) Probabilidad del suceso contrario: P( A ) = 1 - P(A)
2) Probabilidad del suceso vaco: P( ) = 1 - P(E) = 1 - 1 = 0
-50-

3. Probabilidades

3) Inclusin. Si A B, P(A) P(B)


4) A F, 0 P(A) 1 , ya que cualquier A E .
5) Probabilidad de la unin: P(A B) = P(A) + P(B) - P(A B)
Grficamente se observa en la Figura 3. 2.
E= Espacio muestral

B
AB

Figura 3. 2 Unin de sucesos

La demostracin es:

A B = A ( A B), y A ( A B) =
la probabilidad ser la suma de probabilidades,

P(A B) = P(A) + P( A B)
pero tambin el suceso B se puede poner como

B = (A B) ( A B)
como son conjuntos disjuntos

P(B) = P(A B) + P( A B)
de donde despejando P( A B) queda:

P(A B) = P(A) + P(B) - P(A B)


-51-

3. Probabilidades

Como generalizacin de la unin de tres o ms sucesos, tenemos la


expresin general de la unin de sucesos:

P(A B C) = P(A) + P(B) + P(C) - P(A B) - P(A C) - P(B C) + P(A B C)


Observar la correspondencia que hay entre probabilidades y la frecuencia
relativa de un suceso A.
A la tripleta (E,F,P) se denomina espacio probabilstico.

Actividad 3.2:
Un submarino lanza tres torpedos contra un barco. Cada uno de los torpedos
tiene una probabilidad de 0,7 de alcanzar el barco. Cul es la probabilidad
de hundir el barco?
Si de una baraja de 40 cartas extraemos 3 al azar, cul es la probabilidad
de que salgan 2 oros?
o Con reposicin,
o Sin reposicin.

3.4. PROBABILIZACIN DE ESPACIOS MUESTRALES


Podemos asimilar, desde un punto de vista mecnico, la probabilidad como la
cantidad de masa de 1 gramo que se reparte en el espacio muestral. De forma que la
probabilidad de un suceso corresponde con la cantidad de masa que incluye dicho
suceso dentro del espacio muestral. Si el espacio muestral es discreto, la cantidad de
masa de un gramo se encuentra repartida en un serie de puntos discretos. Si el
espacio muestral es continuo, la masa se reparte de forma continua en el espacio
muestral, aunque puede haber zonas donde haya ms cantidad de masa que en
otras.

Probabilizacin de Espacios Muestrales Discretos


Cuando el espacio muestral es discreto, cada resultado elemental tiene asignado un
peso, probabilidad, de manera que la suma de pesos elementales debe dar la unidad,
ya que la unin de todos ellos forma el espacio muestral E, y cada suceso elemental
es excluyente respecto a cualquier otro suceso elemental.
Si el espacio muestral discreto es finito y, adems cada uno de los resultados
es igualmente probable, entonces el peso, o probabilidad, que asignamos a cada
-52-

3. Probabilidades

suceso elemental es 1/n de resultados que hay. Pero si es un espacio muestral


discreto infinito pero numerable, como la suma debe dar 1, no puede pesar igual un
resultado que otro, no obstante se debe cumplir que la suma infinita de los pesos
converja a la unidad.
En cualquiera de los casos anteriores, la probabilidad de un suceso
compuesto es la suma de las probabilidades de los resultados individuales que lo
integran.

Probabilizacin de Espacios Muestrales Finitos Simtricos. Combinatoria


Para el caso de un espacio muestral discreto finito y simtrico, esto es, que cada
posible resultado tiene el mismo peso, la probabilidad de un suceso se puede calcular
sumando las probabilidades de los sucesos elementales que incluye, lo cual equivale
a aplicar la regla de:

P(suceso A) =

casos favorables
casos posibles

y para hacer un recuento de casos favorables y casos posibles debemos acudir a la


combinatoria, donde habr que distinguir si influye el orden, variaciones, o no influye
el orden, combinaciones, y dentro de cada uno de ellos, si los elementos se pueden
repetir no. As tenemos el siguiente esquema:

Combinatoria
Variaciones sin repeticin de m elementos tomados de n en n.:
- V m,n = m(m - 1)(m - 2)...(m - n + 1)
- Pn = n!
Variaciones con repeticin de m elementos tomados de n en n:
- V m,n = mn
- Pn, , ,... =

n!
donde + + ... = n
! !...

Combinaciones sin repeticin de m elementos tomados de n en n:

m
m!
=
n n! (m - n)!

- C m,n =

Combinaciones con repeticin de m elementos tomados de n en n.:

-53-

3. Probabilidades

m + n - 1

- Cm,n =

La probabilizacin de espacios muestrales contnuos se lleva a cabo mediante


una funcin llamada funcin de densidad.

Actividad 3.3:
Con las letras a, b, c, d
o Cuntas palabras de 2 letras se pueden formar?
o Cuntas palabras de 3 letras se pueden formar?
o Cuntas palabras de 4 letras se pueden formar?
o Si podemos repetir las letras, cuntas palabras de 2 letras se pueden
tener?
o Si no podemos repetir las letras, cuntas combinaciones de 2 letras
podra obtener?
o Si ahora podemos repetir las letras, Cuntas palabras podemos
obtener?

3.5. PROBABILIDAD CONDICIONADA


Dado un espacio muestral E, si conocemos que ha ocurrido un suceso A E , el
espacio muestral realmente se ha reducido ahora a dicho suceso A conocido, con lo
cual las probabilidades de los sucesos pertenecientes a E se modifican de acuerdo
con el conocimiento de A, y entonces el peso de cualquier B E viene dado por la
parte comn de B con A en relacin al total de A, que en el nuevo espacio muestral
es el suceso cierto.
Si partimos del espacio de probabilidades (E,F,P) y conocemos el suceso

A F, con P(A) 0 , definimos la probabilidad de suceso C condicionado a que ha


ocurrido el suceso A, como:

P A (B) = P(B/A) =

-54-

P(B A)
P(A)

3. Probabilidades

Actividad 3.4:
Al lanzar un dado, cul es la probabilidad de sacar un 2?
Si antes de mostrar el dado, yo lo veo y digo que es un nmero par, cul es
la probabilidad de que ahora sea el 2?

Esta medida as definida cumple los axiomas de probabilidad, esto es:


1) P(B/A) 0
2) P(A/A) = 1
3) Si B1 B2 = ; P( B1 B2 /A) = P( B1 /A) + P( B2 /A) .
Como es una probabilidad, rene todas las propiedades de la misma, es decir:
1) P( B/A) = 1 - P(B/A) .
2) P( /A) = 0 .
3) Si B1 B2 , P( B1 /A) P( B2 /A) .
4) B F, 0 P(B/A) 1 .
5) P( B1 B2 /A) = P( B1 /A) + P( B1 /A) - P( B1 B2 /A)
6) La definicin de probabilidad condicional se puede aplicar a la propia probabilidad
condicional:

P(C B A)
P(A B C)
P(A)
P A (C B) =
=
P A (C/B) =
P(A B)
P(A B)
P A (B)
P(A)

P(C/B/A) = P(C/B A)

-55-

3. Probabilidades

3.6. TEOREMA DE LA INTERSECCIN


La probabilidad de la interseccin de dos sucesos se puede obtener de la propia
definicin de probabilidad condicionada como:

P(A B) = P(A).P(B/A ) = P(B).P(B/A )


Para el caso de ser tres sucesos, la probabilidad de la interseccin es:

P(A B C) = P(A).P(B/A ).P(C/A B)


Lo anterior tambin se aplica a probabilidades condicionales, as:

P(A B/C) = P(A/C).P(B /A C)


Si A y B son independientes tambin lo son los sucesos complementarios, as
como entre todos ellos.

3.7. TEOREMA DE LA PARTICIN TOTAL


Dado un espacio muestral E, recibe el nombre de particin al conjunto de sucesos
A1 , A2 , A3 ,...., An tales que:
1) A1 A2 A3 ..... An = siendo Ai A j = i j , es decir son mutuamente
excluyentes.
2) La unin de dichos sucesos forman el espacio muestral, esto es:

A1 A2 ,....., An = E
Grficamente se representa en la Figura 3. 3.
E= Espacio muestral
A1
A2

Ai

AiB

An

Figura 3. 3 Teorema de la particin


-56-

3. Probabilidades

Si definimos otro suceso B incluido en E, a su vez queda dividido por la


particin efectuada sobre E, de modo que se puede reconstruir B mediante

B = ( A1 B) ( A2 B) .... ( An B)
Los conjuntos Ai B son mutuamente excluyentes, luego la probabilidad del
suceso B tambin es:

P(B) = P( Ai B) = P( Ai )P(B/ Ai )
i

3.8. SUCESOS INDEPENDIENTES


Dados dos sucesos A y B, se dicen que son independientes, si el que aparezca uno
de ellos no tiene nada que ver ni influye para nada en la aparicin del otro. Es decir,
que la probabilidad de uno de ellos condicionada al la presencia del otro no se ve
modificada. Matemticamente, dos sucesos A y B son independientes si y solo si se
cumple que:

P(A/B) = P(A)

P(B/A) = P(B)

Por la definicin de probabilidad condicional, si A y B son independientes:

P(A/B) =

P(A B)
= P(A)
P(B)

de donde

P(A B) = P(A).P(B)
Todo ello se puede generalizar a ms sucesos, de esta forma si A1 , A2 ,.... An
son independientes, la probabilidad de la interseccin es el producto de
probabilidades:

P( A1 A2 A3 ..... An ) = P( A1 ).P( A2 ).P( A3 )....P( An )

Actividad 3.5:
Cul es la probabilidad de que al lanzar dos monedas una sea cara y la otra
cruz?
-57-

3. Probabilidades

Cul es la probabilidad de que al sacar sin reemplazamiento dos cartas de


una baraja de 40, una de ellas sea oros?
Cul es la probabilidad de que al sacar 4 cartas haya 2 oros y 1 espada?
Un temario de oposicin tiene 50 temas. El tribunal elige 3 al azar y tenemos
que elegir uno de ellos. Si nos estudiamos 10 de los 50 temas, cul es la
probabilidad de aprobar?

3.9. TEOREMA DE BAYES


Efectuada una particin sobre el espacio muestral E, y dado el suceso B que est
incluido en E, deseamos calcular la probabilidad condicional de un suceso Ai ,
sabiendo que ha ocurrido el suceso B. Al suceso B tambin se le llama el efecto, y los
sucesos Ai (i = 1..n) expresan las distintas causas que pueden producir el efecto B.
El teorema de Bayes permite calcular la probabilidad de que habindose presentado
el efecto B, sea debido a una de las causas Ai .
Para su clculo aplicamos la definicin de probabilidad condicional:

P( Ai /B) =

P( Ai B)
P(B)

Para el denominador aplicamos la frmula de la probabilidad total, y el


numerador, como Ai y B no son independientes, lo podemos expresar como
producto de probabilidades, una de ellas condicional. As se tiene:

P( Ai /B) =

P( Ai B)
P( Ai ).P(B/ Ai )
=
P( Ai B) P( Ai )P(B/ Ai )
i

rbol de Bayes
Este tipo de problemas es muy interesante resolverlos mediante el rbol de
Bayes que se muestra a continuacin,

-58-

3. Probabilidades

P( A 1 B) P( A 1 )P(B / A 1 )

P(B / A 1 )

A1

P( A 1 )

P( A 2 B) P( A 2 )P(B / A 2 )

P(B / A 2 )
P( A 2 )
A2

Actividad 3.6:
En la urna U1 hay 2 bolas blancas y 2 negras, y en la urna U2 hay 3
blancas y 1 negra. Tomamos una bola de la urna U1 y la pasamos a la
urna U2. Despus sacamos una bola al azar de la urna 2 que resulta
ser blanca. Cul es la probabilidad de que la bola que haya pasado
de la urna U1 a la urna U2 sea negra?

Actividad 3.7:
Tres componentes de un sistema estn situados en serie. Si cada uno
de ellos tiene una probabilidad de funcionar del 90%, Cul es la
probabilidad de que funcione todo el sistema?
Y si los componentes estn situados en paralelo?
Y si los dos primeros estn en paralelo y la tercero esta en serie?

3.10. PROBLEMAS PROPUESTOS


3.10.1.

Se inspeccionan 4 componentes y se definen los siguientes sucesos:


A =" las cuatro componentes son defectuosas"
-59-

3. Probabilidades

B =" exactamente dos componentes funcionan correctamente"


C =" A lo sumo tres componentes son defectuosas"
A qu son equivalentes los siguientes sucesos?
a) BC

b) BC

c) ACd) AC.

Solucin:

a) C

c) E

b) B

d)

3.10.2.
En una ciudad se publican tres peridicos A, B y C. Supongamos que el
60% de las familias de la ciudad estn suscritas al peridico A, el 40% estn
suscritas al peridico B y el 30% al peridico C. Supongamos tambin que el
20% de las familias estn suscritas a los peridicos A y B, el 10% a A y C, el
20% a B y C y el 5% a los tres peridicos A, B y C.
a. Qu porcentaje de familias de la ciudad estn suscritas al menos a
uno de estos tres peridicos?
b. Qu porcentaje de familias de la ciudad estn suscritas nicamente a
uno de los tres peridicos?
Solucin:

3.10.3.
a)
b)
c)
d)
e)

a) 0.85

b) 0.45.

Cul es la probabilidad de obtener en la lotera primitiva?


un pleno,
cinco y el complementario,
cinco aciertos,
cuatro aciertos,
tres aciertos.

Solucin: a) 7.15E-8 b) 4.29E-7 c) 1.80E-5 d) 9.68E-4 e) 0.017

3.10.4.
Una caja contiene 100 chips, de los cuales 75 funcionan correctamente y
25 son defectuosos. Se seleccionan aleatoriamente 12 chips. Calcular la
probabilidad de que al menos un chip seleccionado sea defectuoso.
Solucin: 0.9751.

3.10.5.
Si las letras a,a,e,i,i,c,d,t,t,s,s se ordenan aleatoriamente, cul es la
probabilidad de que formen la palabra "estadistica"?.
-60-

3. Probabilidades

Solucin: 4.008E-7.

3.10.6.
Los alumnos que se presentan a este examen realizan 3 actividades
culturales. El 60% de ellos va al cine, el 40% al teatro y el 30% a museos.
Adems el 25% van al cine y al teatro, el 20% al cine y a museos, el 10% a
museos y teatros y el 2% realiza las tres actividades. Qu porcentaje de
alumnos realizan al menos una de las tres actividades?
a) 06700
b) 07900
c) 07500
d) 07700

Probabilidad condicional
3.10.7.
Cuatro marcas de ordenadores A, B, C y D presentan una oferta para un
cierto contrato. Un anlisis de los xitos obtenidos anteriormente por estas firmas
en contratos similares nos permite establecer que las probabilidades de llevarse
este contrato para cada una de las marcas son:
P(A) = 0.35 P(B) = 0.15 P(C) = 0.3

P(D) = 0.2

Antes de resolverse el contrato, la firma B retira su oferta. Hallar las nuevas


probabilidades de llevarse el contrato para A, C y D.
Solucin: P(A) = 0.411, P(C) = 0.352, P(D) = 0.235.

3.10.8.
Se hizo una encuesta a cien clientes de un almacn, de los cuales
sesenta dijeron que visitaban el almacn por un anuncio del peridico y el resto
no haban visto el anuncio. As mismo, cuarenta clientes hicieron compra, y de
ellos treinta haban visto el anuncio.
a) Cul es la probabilidad de que una persona que no vio el anuncio, hiciera
compra?
b) Cul es la probabilidad de que una persona que vio el anuncio, comprase?
Solucin: a) 1/4 b) 1/2.

-61-

3. Probabilidades

3.10.9.
Se dispone de una caja que contiene 5.000 chips, de los cuales 1.000
han sido fabricados por la compaa X y el resto por la compaa Y. El 10% de
los chips fabricados por la compaa X y el 5% de los fabricados por la compaa
Y son defectuosos. Si un chip seleccionado al azar es defectuoso, calcular la
probabilidad de que proceda de la compaa X.
Solucin: 1/3.

3.10.10.
Un sistema recibe energa elctrica el 30% del tiempo, energa hidrulica
el 60% y energa mecnica el 10% restante. Cuando funciona elctricamente la
probabilidad de avera es 0.002, cuando lo hace hidrulicamente es 0.001 y
cuando lo hace mecnicamente es 0.05. Hallar la probabilidad de avera.
Solucin: 0.0062.
3.10.11.
Una compaa utiliza un test para la contratacin del personal. El test lo
aprueban el 60% de los aspirantes. De los que pasan el test el 80% completan la
formacin. En una prueba, se emple a aquellos aspirantes que no aprobaron el
test. La formacin fue terminada con xito solo por el 50% de este grupo. Si no
se usar ningn test, que porcentaje de aspirantes podra esperarse que
completarn la formacin.
Solucin: 0.68.

3.10.12.
Dos cajas contienen cerrojos grandes y cerrojos pequeos. Supongamos
que una caja tiene 60 cerrojos grandes y 40 cerrojos pequeos y que la otra caja
tiene 10 grandes y 20 pequeos. Seleccionamos una caja al azar y extraemos un
cerrojo de la misma. Calcular la probabilidad de que el cerrojo sea grande.
Solucin: 7/15.

3.10.13.
Un lote de circuitos contiene un 2% de defectuosos. Cada circuito es
comprobado antes de su uso. El tster no es totalmente fiable ya que la
probabilidad de que el tster indique que un circuito es correcto siendo correcto
es 0.95 y la probabilidad de que el tster indique que es defectuoso siendo
defectuoso es 0.94. Si el tster ha indicado que un circuito es defectuoso, cul
es la probabilidad de que efectivamente sea defectuoso?
Solucin: 0.2772.

-62-

3. Probabilidades

3.10.14.
De todos los estudiantes de una universidad, el 70% son mujeres y el
30% son hombres. Si el 20% de las mujeres y el 25% de los hombres fuman.
Determinar la probabilidad de que un estudiante elegido al azar sea:
a)
b)
c)
d)

una mujer que fuma,


un hombre que fuma,
un fumador,
siendo fumador sea mujer.

Solucin: a) 0.14 b) 0.075 c) 0.215 d) 0.651.

3.10.15.
Un canal de comunicacin binario transporta informacin con dos tipos
de seal representados por 0 y 1. Debido a los ruidos, un 0 transmitido es
recibido a veces como 1 y un 1 transmitido es recibido a veces como 0. Para un
canal dado la probabilidad de que un 0 transmitido sea recibido como 0 es 0.94 y
la probabilidad de que un 1 transmitido sea recibido como 1 es 0.91. Por otra
parte la probabilidad de transmitir un 0 es 0.45. Si se enva una seal, calcular:

a) la probabilidad de que se reciba un 1,


b) la probabilidad de que se reciba un 0,
c) la probabilidad de que se haya transmitido un 1, sabiendo que se ha recibido
un 1,
d) la probabilidad de que se haya transmitido un 0, sabiendo que se ha recibido
un 0.
e) la probabilidad de que haya un error en la transmisin.
Solucin: a) 0.5275 b) 0.4725 c) 0.9488 d) 0.8952 e) 0.0765.

3.10.16.
Sea un canal de comunicacin, con tres tipos de seal 1,2 y 3 .Para i
=1,2,3, Ti es el suceso "el dgito i es transmitido y Ri es el suceso "el dgito i es
recibido". Sabemos que:
P(R1/T1 )=1- P(R2/T1 )=/2 P(R3/T1 )=/2
P(R1/T2)=/2 P(R2/T2)=1- P(R3/T2)=/2
P(R1/T3)=/2 P(R2/T3)=/2 P(R3/T3)=1-
Sabemos tambin que el 3 se transmite tres veces ms que el 1, y el 2 dos veces
ms que el 1.
a) Si se recibe un 1, cul es la probabilidad de que se haya enviado un 1?.
b) Calcular la probabilidad de que una transmisin sea errnea.
-63-

3. Probabilidades

Solucin: a)(2-2)/(2-2+2+3) b) (/6)+(/3)+(/2)

3.10.17.
Supongamos dos lneas de fabricacin del mismo producto. La primera
lnea fabrica 20 unidades/hora, de las cuales el 90% son apropiadas para una
segunda operacin. La segunda lnea produce 90 unidades/hora, de las cuales
slo el 20% son apropiadas. Todas las unidades van a un almacn comn. Si al
extraer una pieza al azar, ha resultado ser apropiada, cul es la probabilidad
de que provenga de la primera lnea?
Solucin: 0.5

3.10.18.
Por un canal de comunicacin se transmite una de las sucesiones de
letras AAAA, BBBB o CCCC con probabilidades P1, P2 y P3 (P1+P2+P3 =1).
Cada letra transmitida se recibe correctamente con una probabilidad n y cada
una de las otras dos opciones errneas (las otras dos letras) se reciben con
probabilidad (1-n)/2. Se supone que las letras se distorsionan
independientemente unas de otras (incluso dentro de la misma secuencia). Se
pide:
a) Hallar la probabilidad de que se haya transmitido AAAA si se ha recibido
ABCA.
b) Establecer la decisin a tomar al recibir ABCA cuando n=0.7 y P1=P2=1/8.
c) Cul es la probabilidad de que una secuencia recibida contenga al menos un
error?
Solucin: a) 2nP1/(2nP1+(1-n)P2+(1-n)P3)
CCCC c) 0.76

b) La decisin es que sea transmitido

3.10.19.
El Departamento de Control tcnico (DCT) realiza la clasificacin de los
aparatos fabricados. Cada aparato tiene, independientemente de los dems,
defectos con una probabilidad p. Durante una comprobacin el DCT revela la
existencia de defectos con una probabilidad igual a a. Adems, durante la
comprobacin un aparato en buen estado puede comportarse como defectuoso
con una probabilidad b. Todos los aparatos que en la comprobacin se
comportan incorrectamente son rechazados.
a) Hallar la probabilidad q0 de que un aparato no desechado tenga defectos y la
probabilidad q1 de que un aparato desechado tenga defectos.
b) Para qu condiciones q0 > q1 ?
-64-

3. Probabilidades

Solucin: a) q0=(1-a)p/((1-a)p+(1-b)(1-p)) y q1=ap/(ap+b(1 -p))

b) b>a

3.10.20.
En los ensayos de cierto equipo se ha determinado que la probabilidad
de buen funcionamiento de un rel, en ausencia de perturbaciones es 0.99,
si slo hay sobrecalentamiento se sita en 0.95, si slo hay vibraciones en 0.9 y
si
se dan ambas circunstancias baja a 0.8. Se supone que ambas
perturbaciones se presentan independientemente.
a) Hallar la probabilidad de que el rel falle en un ambiente donde la probabilidad
de sobrecalentamiento es 0.2 y la de vibraciones de 0.1.
b) Sabemos que se ha producido un fallo. Se ha detectado que ha habido
sobrecalentamiento. Cul es la probabilidad de que tambin hayan habido
vibraciones? Y si no se supiera nada sobre el sobrecalentamiento, cul
sera la probabilidad de que hubiera habido vibraciones?
c) Si se trabaja ahora en un entorno donde sobrecalentamiento y vibraciones no
son independientes, sino que, con las probabilidades del apartado a), la
probabilidad de que se den ambas a la vez es 0.05, cul es la probabilidad
de que el rel funcione correctamente?
Solucin: a) 0.0282 b) 0.3077 0.4255 c) 0.97

3.10.21.
Si A y B son dos sucesos independientes entonces: (determinar la
respuesta incorrecta)
a) A y B

no siempre son independientes.

b) P(A/B) P(A)
c) P(A/ B) P(A)
d) P(A/B) P(A)

3.10.22.
La probabilidad de que funcione una mquina cuando no existe ni
sobrecalentamiento ni vibraciones es del 99%. Si hay vibraciones y no
sobrecalentamiento, la probabilidad de que funcione es del 95%. Si hay
sobrecalentamiento y no vibraciones, la probabilidad de que funcione es del 90%.
Y si existen vibraciones y sobrecalentamiento a la vez, la probabilidad de que
funcione es del 80%. Calcular la probabilidad de que dicha mquina funcione un
da cualquiera en una fbrica en la cual la probabilidad de que existan
vibraciones es del 20% y la probabilidad de que exista sobrecalentamiento es del
15%.
a) 08965
-65-

3. Probabilidades

b) 09667
c) 09208
d) 08999

3.10.23.
Un proceso de fabricacin puede estar ajustado o desajustado. Cuando
est ajustado produce un 1% de piezas defectuosas y cuando est desajustado
un 10%. El proceso est desajustado el 25% del tiempo. En un momento
determinado, se toma una muestra de 10 piezas y no aparece ninguna
defectuosa. Calcular la probabilidad de que est ajustado en ese momento.
a) 0.8582
b) 0.8861
c) 0.9121
d) 0.9362

3.10.24.
Dados dos sucesos A y B pertenecientes al mismo espacio muestral E, la
probabilidad de que ocurra A es de 0.85 y la probabilidad de que ocurra B de
0.25. Entonces:
a)
b)
c)
d)

A y B son siempre dependientes pero no excluyentes.


A y B son siempre mutuamente excluyentes pero no dependientes.
B est siempre incluido en A.
ninguna de las anteriores es cierta

3.10.25.
Existe un test de control de piezas que rechaza piezas buenas un 5% de
las veces y piezas malas un 95%. Se sabe que en un proceso de fabricacin en
el que se aplica este test, la probabilidad de que una pieza que ha sido
rechazada sea buena es del 0.9%. Qu porcentaje de piezas defectuosas se
estn produciendo en dicho proceso?
a)
b)
c)
d)

85.28%
90.32%
14.73%
79.89%

3.11. PROBLEMAS Y CUESTIONES DE EXMENES

3.11.1. Para el siguiente esquema de fiabilidad, donde al lado de cada elemento


-66-

3. Probabilidades

figura la probabilidad de funcionamiento del elemento,


0,95
0,85

0,98
B

E
0,87
0,90

calcular la probabilidad de funcionamiento de todo el sistema. (1 punto)


Solucin cuestin 2:
La probabilidad de funcionamiento del primer grupo es:
RS1 1 [(1 RA )(1 RB )(1 RC )] 1 [(1 0,95)(1 0,98)(1 0,87)] 0,99987

Y la probabilidad de funcionamiento del segundo grupos es:


RS2 1 [(1 RD )(1 RE )] 1 [(1 0,85)(1 0,90)] 0,985

Y la probabilidad de funcionamiento de todo el sistema es,


RSYS RS1RS2 0,999870,985 0,9849

3.11.2. El departamento de recursos humanos de una gran empresa tiene


clasificados a sus empleados por grupos de edad. Un total de 220 estn entre 18 y
40 aos, 150 entre 41 y 55 aos y 50 con ms de 56 aos. De los ms jvenes el
20% tienen titulacin superior, el 30% otras titulaciones y el resto no tiene
estudios. El 15% del grupo de edad intermedia tiene titulacin superior, el 40%
otras titulaciones y el resto no tiene estudios. El grupo de mayor edad hay un 2%
con titulacin superior, 20% con otras titulaciones y el resto sin estudios.
a) Cul es la probabilidad de que al seleccionar al azar a un trabajador sea del
grupo de los mayores y no tenga estudios? (0,5 puntos)
b) Cul es la probabilidad de que al elegir al azar un expediente sea de un
titulado superior? (0,5 puntos)
c) Si los expedientes se encuentran ahora agrupados en tres carpetas, una para
cada grupo de edad y se cogen al azar 6 trabajadores de una carpeta tambin
elegida al azar y resulta que solo 2 de ellos no tienen ningn tipo de estudio
Cul es la probabilidad de que la carpeta elegida sea la de los jvenes? (1
punto)
Solucin cuestin 5:
-67-

3. Probabilidades

El rbol de Bayes es,

C1

C2

0,5

SE

C3

0,15
0,4

C4

C5

SE

C6

0,02

C7

0,2

C8

SE

C9

0,2
0,3
18-40
220/420

150/420

41-55

0,45
50/420
>=56

0,78

a) La probabilidad de que sea mayor de 56 y sin estudios es justamente el camino 9,


esto es,

P( Edad > 56 SinEstudio s ) = C 9 =

50
0 ,78 = 0 ,0929
420

b) La probabilidad de que al elegir uno al azar sea titulado superior es la suma de


los caminos 1, 4 y 7, esto es:

P( Superior ) C1 C 4 C 7

220
150
50
0,2
0,15
0,02 0,16
420
420
420

c) Ahora el rbol de probabilidades es,

-68-

3. Probabilidades

p1

2 de 6 sin estudios (c1)

6
p1 P(B(6;0,5) 2) 0,5 2 (1 0,5) 4 0,2344
2

18-40
1-p1

otros

1/3

2 de 6 sin estudios (c2) p1 P(B(6;0,45) 2) 6 0,45 2 (1 0,45)4 0,2780

p2
1/3

41-55
1-p2

1/3

otros

p3

2 de 6 sin estudios (c3)

>=56
1-p3

6
p1 P(B(6;0,78 ) 2) 0,78 2 (1 0,78 ) 4 0,0214
2

otros

La probabilidad pedida es,


P(jvenes/hay

de

sin

estudios)=

1
0,2344
C1
3

0,4391
1
1
C1 C2 C3 1
0,2344 0,2780 0,0214
3
3
3

3.11.3. Un fabricante de motores produce un 20% de defectuosos. El coste es de


5.000 por unidad y el precio de venta es de 10.000 euros. Si el motor es
defectuoso debe devolverse lo cobrado y pagar una indemnizacin de 7.000 .
a) Calcular el beneficio medio por motor si vende todos los motores tal como
salen de fbrica. (1 punto)
b) Se puede hacer una prueba de control de calidad A que cuesta 3.000 . y que
determina con toda seguridad si el motor es o no es defectuoso. Estudiar si es
rentable la prueba. (1 punto)
c) Se puede utilizar una prueba alterativa B, que conduce a conclusiones
errneas en un 5% de los casos. Calcular el precio mximo que puede
pagarse por dicha prueba. (1 punto)
d) En qu porcentaje de los casos en los que la prueba B indique que el motor
es correcto se tendr que pagar indemnizacin. (1 puntos)
NOTA: se asume que cuando la prueba indica que el motor es defectuoso no se
vende el mismo, mientras que si la prueba indica que el motor es correcto, se vende.
a) E(B) = 0.85000 + 0.2(-5000-7000)= 4000 2400 = 1600 euros
b) E(B) = 0.8(5000-3000) + 0.2(-5000-3000)=1600 1600 = 0 euros. Como 0
euros es menos que 1600 euros, NO ES RENTABLE hacer la prueba.

-69-

3. Probabilidades

c)

B=10000-5000-x
Prueba Correcto
0.95

Motor Correcto

Prueba
Defectuoso
0.05

0.8

B=-5000-x

B=-5000-x
Motor Defectuoso
0.2

Prueba
Defectuoso
0.95

Prueba Correcto
0.05

B=-5000-7000-x

E(B)=0.80.95(5000-x)-0.80.05(5000+x)-0.20.95(5000+x)-0.20.05(12000x)=1600
Despejando,
2530-x=1600, de donde el precio mximo a pagar por la prueba es 930 euros.
d)
MD=Motor defectuoso
MC=Motor correcto
PC=Prueba correcta

Por el teorema de Bayes,


P(MD/PC)= P(PC/MD)P(MD)/P(PC)=0.050.2/0.77=1.3%
Donde, por el teorema de la probabilidad total,
P(PC)= P(PC/MD)P(D)+P(PC/MC)P(MC)=0.050.2+0.950.8=0.01+0.76=0.77

-70-

3. Probabilidades

3.11.4. Una empresa electrnica fabrica una placa base para un determinado tipo de
ordenador. Se sabe que el porcentaje de placas base defectuosas de toda la
produccin es del 2%. El coste de fabricacin de cada placa es de 100 y se
vende cada una a 300. Si al instalar en el ordenador se detecta que no funciona
bien, se debe reemplazar por otra que seguro que no es defectuosa, pero cuyo
coste de fabricacin es de 150. La empresa puede realizar un test antes de
venderla, pero este test, cuando la placa es correcta, falla en el 1% de los casos, y
cuando la placa realmente est mal, acierta en el 90% de los casos. Se pide:
a) Sabiendo que el test dice que una placa est bien, calcular la probabilidad de
que dicha placa realmente sea defectuosa. (0,75 puntos)
b) Calcular el porcentaje de veces que se equivoca el test. (0,75 puntos)
c) Si el test resulta positivo, se instala la placa tal y como est (aun pudiendo ser
defectuosa). Si el test resulta negativo, una reparacin de 10 asegura que la
placa estar bien. Cul es el precio mximo que debemos pagar por el test
para que, en promedio, sea rentable?(2 puntos)
d) Si la placa base internamente consta de 10 componentes idnticas e
independientes, que asumimos que estn montados en serie, y un requisito es
que la probabilidad de no fallo de la placa base es del 80%, cul debe ser la
probabilidad de no fallo de cada componente? (0,75 puntos)
Solucin Cuestin 1:

C1

C2

0,99
C
0,01

0,98

0,1
0,02

C3

D
0,9

a) P(D / )

C4

C3
0,020,1
0,002

0,0021
C1 C3 0,980,99 0,020,1 0,9722

b) P(Error)=P(C2+C3)=0,980,01+0,020,1=0,0118. Es decir, el 1,18 % de las veces


se equivoca el test.
c) El beneficio es

-71-

3. Probabilidades

C1 =0,9702

C2 =0,0098

B1=300-100=200

0,99
C
0,01

0,98

0,1
0,02

C3 =0,002

B2=-100+300-10=190

B3=300-100-150=50

D
0,9

C4 =0,018

B4=-100+300-10=190

El valor medio del beneficio es,


E(B) = 2000,9702+(190)0,0098+500,002+(190)0,018 = 199,442
Sin hacer el test, el rbol con los beneficios es,

B1=300-100=200

B2=300-100-150=50

Y el valor medio del beneficio es,


E(B)=0,98200+0,0250=197
El precio mximo del test es 199,332-197=2,442 .
d)

Para que funcione el sistema deben funcionar todos los elementos, por lo que la
probabilidad de funcionamiento del sistema es,

-72-

3. Probabilidades

P(S) P(C1 C2 C10 ) P(C1)P(C2 )P(C10 ) P(C)10 0,8

De donde P(C) 0,81/ 10 0,9779debe ser la de cada componente.

3.11.5. Los componentes de un determinado producto estn dispuestos segn la


figura de abajo, donde al lado de cada elemento se indica la probabilidad de no
fallo del mismo.
0,85

0,75

0,95
5

0,93

a) Cul debe ser la probabilidad de no fallo del componente 4 para que en


conjunto la probabilidad de no fallo sea del 90%?
(1.5 puntos)

SOLUCIN:
Llamando de R la probabilidad de no fallo de cada componente, la fiabilidad del
sistema es,
Rsys (1 (1 R1)(1 R2 ))(1 (1 R3 )(1 R4 ))R5

Sustituyendo valores,
0.90 (1 0.150.07)(1 0.25(1 R4 ))0.95
0.90 0.9895(1 0.25(1 R4 ))0.95
1 0.25(1 R4 ) 0.9574
(1 R 4 )

1 0.9574
0.1703
0.25

De donde la probabilidad de no fallo del componente 4 es R 4 0.8297


3.11.6. Para comprobar si un motor elctrico es correcto o defectuoso el
Departamento de Calidad aplica dos pruebas independientes y sucesivas. La
primera prueba tiene una probabilidad de acertar en el diagnstico del 90%, y la
segunda prueba, cuando el motor es correcto acierta el 95% de los casos, pero
cuando el motor es defectuoso se equivoca en el 7% de las veces. Sabiendo que
-73-

3. Probabilidades

la proporcin de motores defectuosos es del 5%, se pide:


a) Si una cualquiera de las pruebas, pero no ambas, dice que el motor es correcto,
qu proporcin de casos realmente ser correcto el motor?
(1 punto)
b) Cul de las dos pruebas tiene mayor probabilidad de error?
(1 punto)

SOLUCIN:
a) El rbol de probabilidades es,

C1

C2

C3

C4

0.95
+
0.05

0.90
C
0.95

0.10

0.95
0.05

0.10
0.05

0 .0 7

+ C5
- C6

0.93
D
0.90

+ C7

- 0.07
0.093

- C8

La probabilidad que nos piden es,


C2 C3
0.950.900.05 0.950.100.95

C2 C3 C6 C7 0.950.900.05 0.950.100.95 0.050.100.93 0.050.900.07


0.0428 0.0903
0.1331

0.945
0.0428 0.0903 0.0047 0.0032 0.141

P(C / 1 )

b) La probabilidad de error de la primera prueba es del 10%, y la de la segunda


prueba, rbol de probabilidades es,

-74-

3. Probabilidades

C1

C2

0.95
C
0.95

0.05

0.07
0.05

+ C3

D
0.93

- C4

La probabilidad de error viene dada por la suma de probabilidades de los caminos 2 y


3. Esto es,
P(Error ) C2 C3 0.950.05 0.050.07 0.051

Por lo que la prueba 1 es la de mayor probabilidad de error.

-75-

3. Probabilidades

-76-

4. Concepto de variable aleatoria

4. CONCEPTO DE VARIABLE ALEATORIA


Contenido
4.1. DEFINICIN DE VARIABLE ALEATORIA UNIDIMENSIONAL ...................... 77
4.2. FUNCIN DE DISTRIBUCIN....................................................................... 78
4.3. VARIABLES DISCRETAS .............................................................................. 79
4.4. VARIABLES CONTINUAS ............................................................................. 81
Funcin de densidad ......................................................................................... 81
Transformacin de variables aleatorias ............................................................. 84
4.5. ESPERANZA MATEMTICA ......................................................................... 85
Esperanza matemtica ...................................................................................... 85
Momentos ......................................................................................................... 86
4.6 PARMETROS DE TENDENCIA .................................................................... 88
Valor medio ....................................................................................................... 88
Mediana ............................................................................................................ 89
Cuartiles ............................................................................................................ 89
Moda ................................................................................................................. 90
4.7. VARIANZA. CONCEPTO Y PROPIEDADES ................................................. 90
Desviacin tpica ............................................................................................... 91
4.8. OTROS PARMETROS DE UNA DISTRIBUCIN ........................................ 91
Rango o Recorrido ............................................................................................ 91
Coeficiente de variacin .................................................................................... 92
Coeficiente de asimetra ................................................................................... 92
Coeficiente de apuntamiento o de curtosis ........................................................ 92
4.9. DISTRIBUCIONES BIDIMENSIONALES ....................................................... 93
Concepto ........................................................................................................... 93
Funcin de distribucin ..................................................................................... 94
Funcin de densidad ......................................................................................... 95
Funcin de densidad marginal........................................................................... 96
Funcin de densidad condicional ...................................................................... 98
Independencia de variables aleatorias .............................................................. 99
Esperanza de vectores aleatorios ................................................................... 100
Momentos ....................................................................................................... 101
Matriz de varianzas-covarianzas ..................................................................... 102
Combinacin lineal de variables aleatorias ...................................................... 106
Curva de regresin condicional ....................................................................... 106
Recta de regresin mnimo cuadrtica ............................................................ 107
4.10. PROBLEMAS PROPUESTOS ................................................................... 109
4.11. PROBLEMAS Y CUESTIONES DE EXMENES ....................................... 113

4.1. DEFINICIN DE VARIABLE ALEATORIA UNIDIMENSIONAL

Dado un espacio de probabilidades (E,F,P) vemos que podemos asignar una


probabilidad a cada A F , pero en lugar de manejar frases para designar a los
sucesos, es ms cmodo numerizar los posibles resultados del experimento
aleatorio, de esta forma todas las frases se corresponden con nmeros. Estos
-77-

4. Concepto de variable aleatoria

nmeros sern variables y como su resultado es impredecible las llamamos variables


aleatorias.
Ms concretamente, dado un espacio probabilstico (E,F,P) diremos que la
aplicacin X : E R es una variable aleatoria unidimensional, si y solo si, la
antiimagen de cualquier intervalo I x =] - , x] pertenece a la sigma-lgebra F. La
representacin grfica de una variable aleatoria aparece en la Figura 4.1
.

Figura 4. 1.Variable aleatoria.

Todos los conjuntos de la forma ] - , x] , ms sus complementarios y los que


se pueden obtener por operaciones de unin e interseccin, forman lo que se llama
un conjunto de Borel en R, y cualquier conjunto est probabilizado, ya que su
antiimagen pertenece a F, el cual est probabilizado por la medida P. Esto es, la
probabilidad asignada a un conjunto de la recta real es la probabilidad de su
antiimagen. As:

P( I x ) = p(X I x ) = P[ Ox ( I x )] = P(X(e) x) = P(X x)


Llamando a O x ( I x ) el original por la aplicacin X del conjunto I x .

4.2. FUNCIN DE DISTRIBUCIN

Dada una variable aleatoria X, se llama funcin de distribucin de esta variable a la


funcin F(x) definida como sigue:

x R F(x) = P( I x ) = P(X(e) x) = P(X x)


-78-

4. Concepto de variable aleatoria

Esta funcin F(x) tiene las siguientes propiedades:


1) x R es 0 F(x) 1 , pues es una probabilidad.
2) El

lim F(x) = 1 .
x +

3) El

lim F(x) = 0 .
x -

4) La P(x ]a,b]) = F(b) - F(a) , ya que como a < b se cumple que

] - , a]+]a,b] =] - ,b]
] - ,a] ]a,b] =
y por el axioma tercera de la probabilidad,

P(a < X b) = F(b) - F(a)


luego,

P(x ] - ,a])+ P(x ]a,b]) = P(x ] - ,b]


5) F(x) es no decreciente. De la propiedad anterior:

F(b) = F(a) + P(a < X b)


6) F(x) es siempre continua por la derecha y si P(X = a) = 0 , tambin es
continua por la izquierda. Si P(X = a) 0 es discontinua por la izquierda con un salto
igual a P(X = a) .
Una analoga mecnica que resulta til es pensar que la cantidad de masa
(tiza) de 1 gramo se reparte a lo largo de la recta real, y entonces la funcin de
distribucin en un punto se define como la cantidad de masa que existe a su
izquierda, incluyendo dicho punto.

4.3. VARIABLES DISCRETAS

Una variable aleatoria es discreta cuando toma un conjunto finito de valores. Tambin
se llama categrica.

-79-

4. Concepto de variable aleatoria

La cantidad de masa se encuentra almacenada en un conjunto de puntos de


la recta real. La funcin de probabilidad P(x) define la cantidad de masa de cada
punto. La funcin de distribucin tiene unos saltos en los puntos discretos de masa.
Si la v.a. es discreta, la cantidad de masa est repartida en una serie de
puntos discretos de la recta real, cada uno de ellos con P( xi ) 0 . La funcin de
distribucin es la suma de todas las masas que hay a la izquierda, esto es:

F(x) =

P( x )
i

xi x

La forma grfica es una funcin escalonada donde en cada punto donde


existe la variable, hay un salto igual a la probabilidad en dicho punto.

Actividad 4.1:
Dibujar la funcin de probabilidad de la variable aleatoria del dado.
Dibujar la funcin de distribucin de la variable aleatoria del dado.
Cunto vale P(X=6)?
Cunto vale F(2,5)?
Cunto vale F(3)?
Cunto vale P(X>=5)?
Cunto vale P(x<5)?
Calcular la funcin de distribucin de la variable aleatoria suma de puntos al lanzar
dos dados.

Binom ial Distribucin


0,4

probabilidad

Prob. de Evento,Ensayos
0,1,10

0,3
0,2
0,1
0
0

Figura 4. 2. Funcin de probabilidad discreta

-80-

10

4. Concepto de variable aleatoria

probabilidad acumulativa

Binomial Distribucin
1

Prob. de Ev ento,Ensay os
0,1,10

0,8
0,6
0,4
0,2
0
0

10

x
Figura 4. 3. Funcin de distribucin discreta

4.4. VARIABLES CONTINUAS

Para una variable continua, la grfica no presenta ningn salto. Se trata del lmite de
la variable aleatoria discreta.

Funcin de densidad

Diremos que X es una v.a. continua, si existe una funcin f(x) no negativa, tal que
para todo a de la recta real se cumple que:
a

Fx (a) =

f(x)dx

Esta funcin f(x) se denomina funcin de densidad.


Tambin decimos que X es continua si la F(x) es continua en todo punto y
derivable respecto de x, excepto a lo sumo en un nmero finito de puntos o
intervalos. La derivada de la funcin de distribucin es la funcin de densidad,

f(x) =

dF(x)
dx

Por la definicin matemtica de derivada, se tiene que:


-81-

4. Concepto de variable aleatoria

f(x) =

dF(x)
F(x + x) - F(x)
= lim
x
dx
x 0

El numerador del lmite expresa la cantidad de masa que hay en un intervalo


de longitud x . Cuando x 0 , el lmite expresa la cantidad de masa que hay
encima de un incremento infinitesimal, esto es, la cantidad de masa por unidad de
longitud, lo que en mecnica recibe el nombre de una densidad, y de ah el nombre
de funcin de densidad para designar f(x) .
Para una variable aleatoria continua, la probabilidad de exactamente un punto
es P(X = a) = 0 , es decir, no hay probabilidad pero si hay densidad de probabilidad
encima del punto.
La cantidad de masa en el intervalo I =]a,b] es:
b

P(a < X b) = F(b) - F(a) = f(x)dx = P(a <= X b) = P(a X < b)


a

Si X es continua, la cantidad de masa en toda la recta real es:


+

f(x)dx = 1 = F(+ ) - F(- )

la cantidad de masa en un diferencial de longitud es:

f(x)dx
La funcin de densidad se puede tomar como el lmite de un histograma de
frecuencias cuando la base de los rectngulos es infinitesimal.
Para una variable discreta no existe la funcin de densidad, y la funcin que
expresa la cantidad de masa que hay en cada punto la denominamos "funcin de
probabilidad".

Actividad 4.2:

Si X est distribuida uniformemente entre 1 y 3:


o Cunto vale la funcin de distribucin en un punto cualquiera a?
o Cunto vale la funcin de densidad en un punto cualquiera a?
Si X est distribuida de forma triangular como se expresa en la figura siguiente,

-82-

4. Concepto de variable aleatoria

f(x)

x
0

3
Figura 4. 4 Distribucin triangular

o
o

Calcular la funcin de densidad y la funcin de distribucin en un punto


cualquiera a
Cul ser la probabilidad de que un punto est entre 1,5 y 2,5?

Si X est distribuida de forma triangular como se expresa en la figura siguiente,

f(x)

x
0

Figura 4. 5 Distribucin en tringulo issceles

o
o

Calcular la funcin de densidad y la funcin de distribucin en un punto


cualquiera a
Cul ser la probabilidad de que un punto est entre 1,5 y 2,5?

-83-

4. Concepto de variable aleatoria

Exponencial Distribucin

densidad

0,1

Media
10

0,08
0,06
0,04
0,02
0
0

10

20

30

40

50

60

probabilidad acumulativa

Figura 4. 6. Funcin de densidad

Exponencial Distribucin
1

Media
10

0,8
0,6
0,4
0,2
0
0

10

20

30

40

50

60

x
Figura 4. 7. Funcin de distribucin

Transformacin de variables aleatorias

En muchas ocasiones una variable aleatoria se obtiene como una funcin de


otra variable aleatoria, esto es una transformacin del tipo Y=g(X), y deseamos
conocer la distribucin de la nueva variable aleatoria Y sabiendo la distribucin de X.
Para ello aplicamos la definicin de la funcin de distribucin de Y,

Fy ( a ) P( Y a )
Y sustituyendo la expresin de Y en funcin de X, tenemos que,

Fy ( a ) P( Y a ) P( g( X ) a ) P( X g 1( a )) Fx g 1( a )

-84-

4. Concepto de variable aleatoria

Una vez conocida la funcin de distribucin de Y, podemos obtener todas las


dems caractersticas de la variable Y.
Espacio muestral

X
Y

e
X(e)
Y=g(X(e))

Figura 4. 8. Transformacin de variables

Por ejemplo, supongamos que el coste de una determinada materia prima


flucta en el mercado segn una funcin de densidad de,

f(x)

x
5 10 x 12
2

Pero el precio de venta de dicha materia prima es Y=1,3*X+20. La


probabilidad de que el precio de venta sea menor de 34 es,

P( Y 34 ) P( 1,30 X 20 34 ) P( X
P( X 10 ,77 )

10 ,77

10

34 20
)
1,30

5 dx 0 ,148
2

4.5. ESPERANZA MATEMTICA


Esperanza matemtica

Actividad 4.3:

Un casino plantea el siguiente juego de azar. Se hace una apuesta del resultado de
lanzar un dado. Se lanza una dado, si sale un 1, el casino dar 1000, si sale un 2
un 3, el casino dar 500, y si sale un 4, un 5 un 6, el casino dar 100. Cunto
tendremos que pagar por cada apuesta para participar en el juego?

-85-

4. Concepto de variable aleatoria

Dada la variable aleatoria X y una funcin uniforme g(x) , llamamos Esperanza


matemtica de dicha funcin, a la expresin:
Si la v.a. es discreta, la esperanza matemtica es:

E[g(x)] = g( xi )P( xi )
xi

y si la v.a. es continua, es:

E[g(x)] =

g(x)f(x)dx

donde f(x) es la funcin de densidad de una variable aleatoria continua.


El concepto de esperanza matemtica es el valor que cabe esperar de la
funcin g(x), si repetimos el experimento aleatorio hasta el infinito.

Actividad 4.4:

Calcular el valor medio de la suma de puntos al lanzar dos dados.

La esperanza matemtica es un operador lineal, esto es, sea X una variable aleatoria,
y g 1 (x) y g 2 (x) dos funciones uniformes de la misma, entonces la esperanza
matemtica de una combinacin lineal de dichas funciones es:

E[a g 1 (x) + b g 2 (x)] = aE[ g 1 (x)] + bE[ g 2 (x)]


La expresin se deduce a partir de la definicin de integral de Rieman-Stieljes.

Momentos

Dada la v.a. X, para el caso particular de que la funcin g(x) sea g(x) = x , la
esperanza matemtica de dicha funcin se denomina momento respecto al origen de
orden , y se escribe:
Si la v.a. es discreta, se tiene:

-86-

4. Concepto de variable aleatoria

= E( X ) = xi P( xi )
xi

y si la v.a. es continua,

= E( X ) = x

f(x)dx

El primer momento respecto al origen, recibe el nombre de media, o valor


medio, de la v.a. X, y se representa por la letra (griega).
Caso discreto es:

= xi P( xi )
xi

Caso continuo es:


+

xf(x)dx

Si la funcin g(x) es ahora g(x) = (X - ) , donde a cada valor de X le hemos


restado su media, es decir hemos centrado la variable, entonces la esperanza
matemtica de dicha funcin se denomina "momento centrado de orden , y su
expresin es:
Si la v.a. es discreta:

= E(X - ) = ( xi - ) P(xi )
xi

y si la v.a. es continua,

= E(X - ) =

(x - ) f(x)dx

donde f(x) es la funcin de densidad, de la v.a. X.


El momento centrado de orden uno es siempre nulo, ya que

1 = E(X - ) =

(x - )f ( x )dx =

ya que

xf ( x )dx - f ( x )dx = - 0

f ( x )dx expresa toda la cantidad de masa que hay en la recta real.

-87-

4. Concepto de variable aleatoria

Todo momento centrado se puede poner en funcin de momentos respecto al


origen, desarrollando el polinomio y tomando valores medios.

4.6 PARMETROS DE TENDENCIA

Valor medio

Ya hemos definido el valor medio como


+

= E(X) =

xf ( x )dx

y expresa, mecnicamente, el centro de gravedad de la distribucin de masas.


Es una medida "poco robusta", ya que un valor extremo modifica totalmente el
centro de masas. Grficamente se puede asimilar al punto de apoyo de una barra,
donde arriba situamos una serie de pesos, ya sea de forma puntual, caso de v.a.
discreta, o continua, caso de v.a. continua.
Tiene las siguientes propiedades:
1) Si multiplicamos la v.a. por una constante a, el valor medio queda
multiplicado por dicha constante.

E(aX) = a.
2) El valor medio de una constante es la misma constante.

E(a) = a
3) El valor medio de una suma de variables aleatorias es la suma de sus
medias.

E( X 1 + X 2 + ...+ X n ) = E( X 1 )+ E( X 2 )+ ...+ E( X n ) = 1 + 2 + ...n


4) El valor medio de una combinacin lineal de variables aleatorias es la
combinacin lineal de sus medias, esto es:

E( a1 X 1 + a 2 X 2 + ....+ a n X n ) = E( a1 X 1 ) + E( a 2 X 2 ) + ...+ E a n X n )
= a1 1 + a 2 2 + ...+ a n n

-88-

4. Concepto de variable aleatoria

Si el espacio muestral es discreto y simtrico, con n elementos, P( xi ) =

1
y
n

el valor medio es

E(x) = xi P( xi )= xi
i

1 x
=
n n

Actividad 4.5:

Calcular el valor medio de la variable aleatoria nmero de puntos al lanzar un dado.


Calcular el valor medio de la distribucin uniforme entre a y b.
Calcular el valor medio de la distribucin triangular.
Calcular el valor medio de la distribucin exponencial.

Mediana

Expresa el punto por debajo del cual est el 50% de los valores y por encima el 50 %
de los valores. Matemticamente, es aquel valor de x para el cual F(x), la funcin de
distribucin, vale 0,5.

F( xmed ) = 0,5
A aquel valor de x por debajo del cual hay una cantidad de masa de p%, se le
llama percentil p. De esta forma:

F( x p ) = p
La mediana es el percentil 50%.
La mediana es una medida muy robusta, ya que para un valor extremo
apenas se modifica.
Cuartiles
Si la cantidad de masa la dividimos en 4 partes, a cada uno de los puntos de
la divisin se le llama "cuartil". As el "tercer cuartil" es el que tiene por debajo de l
una cantidad de masa del 75%, es decir las 3/4 de los valores de x.

-89-

4. Concepto de variable aleatoria

Moda

Como su nombre indica, es el valor ms frecuente, es decir, el mximo valor de

P( xi ) , para una distribucin discreta, o el valor mximo de la curva f(x). Esta curva
puede tener varios mximos, y entonces la distribucin se denomina "multimodal".

4.7. VARIANZA. CONCEPTO Y PROPIEDADES

Se define como el momento centrado de orden 2, es decir:

2 var( X ) D 2 ( X ) E( X )2
Si la v.a. es discreta:
2
2
2
= E(X - ) = ( xi - ) P( xi )
xi

y si la v.a. es continua:
+
2
= E(X - ) =
2

(x - )

f(x)dx

Como todos los valores estn elevados al cuadrado, siempre es una cantidad
positiva. Cuanto mayor sea dicha cantidad, mayor dispersin hay en los datos.
Esta medida tiene las siguientes propiedades:
1) La varianza de una constante es cero.
2
D (a) = E(a - a) = 0

2) La varianza de una constante por la v.a. X es la constante al cuadrado por


la varianza de la variable aleatoria X.
2
2
2
D (a.X) = a D (X)

2
2
2
2
2
2
2
2
D (aX) = E(aX - a x ) = E[ a (X - x ) ] = a E(X - x ) = a D (X)

3) La varianza de a X + b es:
2
2
2
D (aX + b) = a D (X)

4) La varianza en funcin de los momentos respecto al origen vale:


-90-

4. Concepto de variable aleatoria

2
2
2
2
D (X) = E(X - ) = E( X - 2x + ) =

= E( X 2 ) - 2E(X) + 2 = 2 - 12
2
2
2
D (X) = E( X ) - E(X)

Desviacin tpica

La varianza es una medida al cuadrado y por lo tanto no se puede comparar con la


medida X. Para poder hacer comparaciones empleamos la raz cuadrada en signo
positivo de la varianza, a la cual denominamos desviacin tpica, y se expresa por:

= D(X) = + var(x) = + 2
Si la desviacin tpica es grande, indica que hay una gran dispersin en los
datos.
Tanto la varianza como la desviacin tpica son medidas poco robustas, ya
que para valores extremos (muy altos o muy bajos) se modifica en gran manera su
valor.

Actividad 4.6

Calcular la variancia de la variable aleatoria del dado.


Calcular la variancia de la distribucin uniforme entre a y b.
Calcular la variancia de la distribucin triangular.
Calcular la variancia de la distribucin exponencial.

4.8. OTROS PARMETROS DE UNA DISTRIBUCIN


Rango o Recorrido

Otra idea de la dispersin de los datos la indica la diferencia entre el mximo y el


mnimo, a la cual denominamos "Recorrido" o "Rango" de variacin de la v.a. X.

-91-

4. Concepto de variable aleatoria

Coeficiente de variacin

Es el cociente entre la desviacin tpica y la media de la v.a.

C.V. =

Sirve para comparar dispersiones de dos distribuciones, cuando stas tienen


diferentes situaciones en la recta real.

Coeficiente de asimetra

Para ver si una distribucin es asimtrica, empleamos el momento centrado de orden


3, ya que si existe simetra respecto de la media, los valores por encima de la media
tienden a compensarse con los valores por debajo de la media, y su valor ser nulo.
De lo contrario, habr un valor + si la asimetra es hacia la derecha de la media, o un
valor "-", si la asimetra es hacia la izquierda.
Pero como son valores al cubo, para que sea una medida adimensional,
dividimos por el cubo de la desviacin tpica. Se representa por
N

(x - x ) /(N - 1)
3

CA =

i=1

Coeficiente de apuntamiento o de curtosis

Para conocer el mayor o menor grado de apuntamiento de la distribucin, se emplea


el momento de orden 4, y para que sea adimensional, lo dividimos por la desviacin
tpica elevada a la cuarta. Se representa por:
N

(x - x )

CC =

/(N - 1)

i=1

Si es igual a 3, es el caso estndar, >3, est por encima del caso estndar, y <3 est
por debajo del caso estndar.

-92-

4. Concepto de variable aleatoria

4.9. DISTRIBUCIONES BIDIMENSIONALES


Concepto

Si al realizar un experimento observamos dos o ms valores, por ejemplo, al extraer


una persona al azar podemos anotar el peso, la altura, la edad, etc. Las dos, tres o
ms caractersticas observadas constituyen una variable aleatoria bidimensional o ndimensional.
La v.a. bidimensional se define como una aplicacin del espacio muestral en
el plano R 2 , de manera que a cada punto del espacio muestral le corresponde un
punto en el plano R 2 .
Al igual que en el caso unidimensional, podemos pensar que la masa de 1
gramo se encuentra ahora repartida en el plano, de manera que para cualquier punto
del plano, la antiimagen del conjunto de puntos del plano,

I x1,x2 = ( x1 , x2 )/ X 1 x1 , X 2 x2
es un suceso perteneciente a la -lgebra F, y por lo tanto, probabilizable.
Si las dos coordenadas son puntos discretos, entonces se dice que la v.a.
bidimensional es discreta, y si ambas son continuas, la v.a. bidimensional es
continua. Puede ser que una sea discreta y la otra continua, en cuyo caso cabe
hablar de v.a. mixtas.
Grficamente se representa en la Figura 4.9

-93-

4. Concepto de variable aleatoria

Figura 4. 9. Definicin de variable aleatoria bidimensional

Funcin de distribucin

Dada una v.a. bidimensional, definimos la funcin de distribucin F( x1 , x2 ) como

F( x1 , x2 ) = P( X 1 x1 ; X 2 x2 ) = P(( X 1(e),X 2 (e)) I x1,x2 )


es decir, es la cantidad de masa que existe por debajo y a la izquierda del punto

( x1 , x2 ) , incluyendo dicho punto.


Esta funcin tiene las siguientes propiedades:
1) 0 F( x1 , x2 ) 1 .
2)

lim F( x , x
1

)= 0

x1-

lim F( x , x
1

)= 0

x2 -

3)

lim F( x , x
x1+
x2 +

)= 1

4) La cantidad de masa en el rectngulo de la Figura 4.10 es:

-94-

4. Concepto de variable aleatoria

Figura 4. 10. Funcin de distribucin

P( a1 < X 1 b1 ; a2 < X 2 b2 ) = F( b1 ,b2 ) - F( a1 ,b2 ) - F( a2 ,b1 )+ F( a1 , a2 )


5) F( x1 , x2 ) es siempre continua por la derecha y discontinua por la izquierda
de ( x1 , x2) en aquellos puntos de probabilidad no nula.
6) Para v.a. discretas se obtiene sumando todas las masas que hay por
debajo y a la izquierda de punto ( x1 , x2 ) , incluyendo dichos valores.

Funcin de densidad

Si la variable aleatoria es continua, la cantidad de masa que hay por debajo y a la


izquierda del punto ( x1 , x2 ) equivale a calcular el volumen de masa en cada punto, la
de una funcin de punto, a la que llamamos funcin de densidad, de tal forma que:
+ +

f( x1 , x2 ) 0 y

f( x1 , x2 )d x1 d x2 = 1

- -

La funcin de distribucin se obtiene a partir de la funcin de densidad como:


a b

F(a,b) =

f( x , x
1

- -

-95-

)d x1 d x2

4. Concepto de variable aleatoria

O tambin por derivacin parcial de la funcin de distribucin, obtenemos la


funcin de densidad:

f( x1 , x2 ) =

2
F( x1 , x2 )
x1 x2

Como significado fsico, es la cantidad de masa por unidad de superficie.


La cantidad de masa debajo de una rea A viene dada por

P( x1 , x2 ) A) = A f( x1 , x2 )d x1 d x2
Para un rectngulo es:
b1 b2

P( a1 X 1 b1 ; a2 X 2 b2 ) =

f( x , x
1

)d x1 d x2

a1 a2

Al igual que en el caso unidimensional, cuando la v.a. es continua no existe


cantidad de masa en un punto, pero s que hay densidad encima de l.

Funcin de densidad marginal

Dada la v.a. bidimensional ( X 1 , X 2 ) con funcin de distribucin F( x1 , x2 ) , y en el


caso continuo, funcin de densidad f( x1 , x2 ) , deseamos saber la distribucin de una
de ellas, sin tener en cuenta la otra. A ello se llama distribucin marginal, ya que en
una tabla de doble entrada se calculaba en el margen derecho o en el margen inferior
de la tabla, de ah el trmino de "marginal".
La distribucin marginal de X 1 se obtiene imponiendo la condicin de que

X 2 pueda tener cualquier valor entre - y + . As la funcin de distribucin


marginal de X 1 es:

- - f( x1 , x2 )d x2 d x1
x1

F( x1 ) = lim F( x1 , x2 ) =
x2 +

y la funcin de densidad marginal es:


+

f( x1 ) =

f( x1 , x 2 )d x 2

-96-

4. Concepto de variable aleatoria

Para variables discretas se tiene que la funcin de probabilidad es,

P( X 1i ) = P( x1i , x 2j )
j

Fsicamente, viene a ser la proyeccin de toda la cantidad de masa que haba


en el plano, sobre un solo eje, ya sea el X 1 , o el X 2 .
X2

x1

X1

Figura 4. 11 Distribucin marginal de X1

Actividad 4.7:

1. Para la siguiente distribucin bidimensional, calcular:


o

P(X1=1).

PX2=2).

o
o

P(X1<=2).
P(X1=2,X2=2)

X2
0,28

0,18

0,24

0,15

0,09

2
1

0,06

X1

Figura 4. 12 Distribucin marginal de X1

-97-

4. Concepto de variable aleatoria

Funcin de densidad condicional

En otras ocasiones nos interesa conocer, para un determinado valor de la variable,


como se distribuye la otra. Por ejemplo, para aquellas personas que pesan 70 kg.,
cul es la distribucin de sus alturas. A esta distribucin se llama "distribucin
condicional".
Fsicamente equivale a realizar un corte infinitesimal que pasa por el punto
condicionante y paralelo al otro eje. Pero como la cantidad de masa que se toma ya
no vale la unidad, debemos hacer una redistribucin de manera que siga valiendo la
unidad.
La funcin de distribucin se define como el lmite de:

F( x2 / x1 ) = lim P( X 2 x2 / x1 < X 1 x1 + h) = lim


h0

h 0

P( X 2 x2 x1 X 1 x1 + h)
P( x1 X 1 x1 + h)

Si la v.a. ( X 1 , X 2 ) es discreta, la probabilidad

condicionada se obtiene

imponiendo la condicin de que la suma de pesos debe ser la unidad, y para ello
nada ms que dividir cada peso P( x1 , x2 ) por el total, que corresponde a la
distribucin unidimensional. Esto es,

P( X 2 / x1 ) =

P( x 2 , x1 ) P( x2 ).P( x1 / x 2 )
P( x 2 ).P( x1 / x 2 )
=
=
P( x1 )
P( x1 )
P( x2j )P( x1 / x2j )
j

Si la v.a. ( X 1 , X 2 ) es continua, anlogamente es

f( x2 / x1 ) =

f( x1 , x2 ) f( x2 )f( x1 / x2 )
f( x2 ).f( x1 / x2 )
=
=
f( x1 )
f( x1 )
f( x2 )f( x1 / x2 )d x2

cuya expresin es semejante al Teorema de Bayes.


Si la v.a. bidimensional es mixta se tiene en cuenta si la condicionante es
discreta o continua, y si la condicionada es discreta o continua.
Grficamente, y empleando la analoga mecnica, es fcil deducir cada
expresin. Recordar que una v.a. discreta no tiene funcin de densidad. Al pasar de
discretas a continuas, la regla sencilla es que donde pone "P" se cambia a "f", de
funcin de densidad, y donde pone un , se cambia a .

-98-

4. Concepto de variable aleatoria

X2

x1

x1+h

X1

Figura 4. 13Distribucin condicional de X2/x1

Actividad 4.8:

Para la siguiente distribucin bidimensional calcular:


o P(X2<=1/X1=2)
o P(X2=1/x1<=2)
o P(X1<=2/X2=2)

X2
0,28

0,18

0,24

0,15

0,09

2
1

0,06

X1

Figura 4. 14 Distribucin condicional

Independencia de variables aleatorias

Dada una variable aleatoria bidimensional ( X 1 , X 2 ) diremos que las v.a. marginales
2
X 1 , X 2 son independientes, cuando para cualquier ( x1 , x2 ) R se cumple que los

sucesos ] - , x1 ] y ] - , x2 ] son independientes, lo cual significa que:

P( X 1 x1 X 2 x2 ) = P( X 1 x1 ).P( X 2 x2 )

-99-

4. Concepto de variable aleatoria

Esto equivale a decir que la funcin de distribucin conjunta es igual al


producto

F( x1 , x2 ) = F 1 ( x1 ). F 2 ( x2 )
Si la v.a. es continua, y las marginales son independientes, la funcin de
densidad es el producto de funciones de densidad marginales.

f( x1 , x2 ) = f 1 ( x1 ). f 2 ( x2 )
Tambin se cumple que:

f( x2 / x1 ) =

f( x1 , x2 ) f( x1 ).f( x2 )
=
= f( x2 )
f( x1 )
f( x1 )

es decir, semejante a la probabilidad condicional.


Si las variables aleatorias marginales no son independientes, la funcin de
densidad conjunta se puede calcular como:

f( x1 , x2 ) = f( x1 ).f( x2 / x1 ) = f( x2 ).f( x1 / x2 )

Esperanza de vectores aleatorios

Dada la v.a. ( X 1 , X 2 ) y una funcin uniforme g( x1 , x2 ) se define esperanza


matemtica de dicha funcin, al valor medio que cabe esperar de dicha funcin, al
extraer infinitos valores de la v.a. bidimensional. Su expresin es
Si la v.a. es discreta,

E[g( x1 , x2 )] = g( x1i , x2j )P( x1i , x2j )


i

y si la v.a. es continua,

E[g( x1 , x 2 )] = R 2 g( x1 , x 2 )f( x1 , x 2 )d x1 d x 2
Adems de la propiedad de ser operador lineal, si las variables X 1 , X 2 son
independientes

g 1 ( x1 ) y g 2 ( x2 ) son

funciones

uniformes

de

X1 y X2 ,

respectivamente, entonces el valor medio del producto es el producto de valores


medios:
-100-

4. Concepto de variable aleatoria

E[ g 1 ( x1 ) g 2 ( x2 )] = E[ g 1 ( x1 )]E[ g 2 ( x2 )]
La media de la suma de v.a., sean varias independientes no, son suma de
valores medios.
Para distribuciones condicionales, el valor medio de una funcin es:
+

E[g( x1 )/ x2 ) =

g( x )
1

f c ( x1 / x2 )d x1

Pudiendo variar los lmites de integracin para cada valor de x 2 .

Momentos

Si la funcin g( x1 , x2 ) es ahora g( x1 , x2 ) = x1u . xv2 , a su esperanza matemtica se le


llama momento respecto al origen de orden u+v, su expresin es:
Si la v.a. es discreta

u,v = X 1iu . X v2j P( x1i ,x 2j )


i

Si la v.a. es continua,
u
v
u,v x1 . x2 f( x1 , x2 )d x1 d x2

Si en la funcin g( x1 , x2 ) = x1u xv2 , a cada valor de X i (i = 1,2) le restamos su


media, su esperanza matemtica recibe el nombre de momento centrado de orden
u+v, y se expresa por
u
v
u
v
u,v = E[( X 1 - 1 ) .( X 2 - 2 ) ] = ( x1 - 1 ) ( x2 - 2 ) f ( x )d x1 d x2 )

Algunos casos particulares son:

1,0 = x1
0,1 = x2
1,0 = 0
-101-

4. Concepto de variable aleatoria

0,1 = 0

2,0 = 2x1
0,2 = 2x2
Todo momento centrado se puede poner en funcin de los momentos
respecto al origen, desarrollando los polinomios y aplicando el operador valores
medio.

Matriz de varianzas-covarianzas
El momento centrado 1,1 = 11 cuya expresin es:

11 = E( X 1 - 1 )( X 2 - 2 ) = 12 cov( X 1 , X 2 )
recibe el nombre de covarianza y expresa el grado de relacin lineal que existe entre

X 1 y X 2 . Por ejemplo, si la distribucin de los valores es como la que aparece en la


Figura 4. 15.

X2

IV

II
III

X1
1
Figura 4. 15. Concepto de covariancia

-102-

4. Concepto de variable aleatoria

Tomando como punto de referencia el (1, 2) , centro de gravedad de masas,


y trazando dos rectas paralelas a los ejes coordenados, dividimos el plano en 4
regiones, marcadas con I, II, III y IV. En la regin I todos los valores de X 1 son
mayores que m1 , a igual que los de m2 , por lo que los productos ( x1 - 1 )( x2 - 2 )
sern positivos. En la regin III, tanto X 1 como X 2 estn por debajo de sus medias,
por lo cual el producto ( x1 - 1 )( x2 - 2 ) tambin ser positivo. En cambio en las
regiones II y IV, los productos son negativos. Como se observa en la figura, hay
muchos ms productos positivos que negativos, por lo cual la cantidad 11 ser
positiva, indicando una relacin lineal en sentido positivo, es decir, a medida que
aumenta una componente, aumenta el valor de la otra componente. Si la cantidad

11 < 0 indica que al aumentar una componente tiende a disminuir la otra.


Si 11 = 0 no hay ningn tipo de relacin lineal entre las variables marginales.
Si las variables son independientes 11 = 0 , pero no a la inversa.
La covarianza tambin se puede representar por:

11 = 12 = cov( X 1 , X 2 ) = E( X 1 X 2 ) - E( X 1 )E( X 2 )

Actividad 4.9:

Para la siguiente distribucin bidimensional, calcular la covariancia entre X1 y X2.

X2
0,28

0,18

0,24

0,15

0,09

0,55 2
0,45 1

1
0,52
E( X1) 10,52 20,33 30,15 1,63

0,06

0,33

0,15

E( X2 ) 10,45 20,55 1,45

-103-

X1

4. Concepto de variable aleatoria

E( X1X 2 ) 110,24 120,28 210,15 220,18

cov( X1, X 2 ) E( X1X2 ) E( X1 )E( X2 )


2,54 1,631,45 0,1765

310,06 320,09 2,54

Figura 4. 16 Covarianza

A la matriz V = [ij] siempre que i+j=2, recibe el nombre de matriz de


varianzas-covarianzas. Los elementos de la diagonal son las varianzas de las
distribuciones marginales.

Actividad 4.10:

Cules son los elementos de una matriz de varianza-covarianzas de 3 variables


aleatorias?

Coeficiente de correlacin
La covarianza es una cantidad al cuadrado, y para que sea adimensional, se divide
por sus desviaciones tpicas, recibiendo el nombre de "coeficiente de correlacin".

12 =

cov( X 1 , X 2 )
D( X 1 ).D( X 2 )

Siempre se cumple que cov 2 ( X 1 , X 2 ) D2 ( X 1 ). D2 ( X 2 )

12 es una cantidad que siempre est entre -1 y +1. Si 12 = +1 , hay una


relacin lineal perfecta en sentido positivo entre las variables X 1 , X 2 , y si es
negativa, hay una relacin lineal perfecta en sentido negativo.
Si 12 = 0 , significa que no hay correlacin lineal entre las v.a. X 1 , X 2 .

La matriz cuyo trmino general es el ij se llama matriz de correlacin.

-104-

4. Concepto de variable aleatoria

Actividad 4.11:

Calcular el coeficiente de correlacin de la distribucin bidimensional siguiente,

X2
0,28

0,18

0,24

0,15

0,09

2
1

0,06

X1

E( X12 ) 120,52 220,33 320,15 3,19


var( X1 ) E( X12 ) E( X1) 3,19 1,632 0,533
2

E( X22 ) 120,45 220,55 2,65

var( X 2 ) E( X 22 ) E( X 2 )

2,65 1,45 0,548


2

cov( X1 , X 2 )
var( X1 )var( X 2 )
0,1765
0,5330,548

0,327

Figura 4. 17 Coeficiente de correlacin

-105-

4. Concepto de variable aleatoria

Combinacin lineal de variables aleatorias

Si la variable aleatoria Y viene dada por una combinacin lineal de las v.a. X1, X2 de
la forma
2
2
2
2
2
D ( a1 X 1 a2 X 2 ) = a1 D ( X 1 )+ a2 D ( X 2 )

El valor medio de la v.a. Y es,


Y Si las v.a. X1, X2 son dependiente,
variables aleatorias es:

la varianza de una combinacin lineal de

2
2
D ( a1 X 1 + a2 X 2 ) = E( a1 X 1 + a2 X 2 - a1 1 - a2 2 ) =

= E( a1 ( X 1 - 1 )+ a2 ( X 2 - 2 ) )2 =

= E[ a12 ( x1 - 1 )2 + a22 ( x2 - 2 )2 + 2 a1 a2 ( x1 - 1 )( x2 - 2 )] =
= a12 12 + a22 22 + 2 a1 a2 E( x1 - 1 )( x2 - 2 ) =
= a12 12 + a22 22 + 2 a1 a2 cov( x1 , x2 )

Actividad 4.12:

Una variable X1 tiene de valor medio 4 y desviacin tpica 2. Otra variable aleatoria X2
tiene un valor medio de 3 y una desviacin tpica de 1, y la covariancia que hay entre
las dos variables se de 1,8. Calcular la variancia de la nueva variable aleatoria
Y=2X1-X2.

Curva de regresin condicional

Dada una distribucin bidimensional

( x1 , x2 ) ,se define la curva de regresin

condicional de x2 / x1 , como el lugar geomtrico de los puntos medios de las


distribuciones condicionales de x2 / x1 . Se expresin matemtica es:

E ( x2 / x1 ) x2 f c ( x2 / x1 )dx2 h( x1 )

-106-

4. Concepto de variable aleatoria

Esta curva h(x1) es la que minimiza los errores de prediccin de x 2 conocido

x1 . Se expresa tambin como x 2 h( x1 ) .


De forma anloga se obtendra la curva de regresin condicional de x1 / x2 ,
sin ms que intercambiar los subndices.

Actividad 4.12:

Calcular el E(X2/X1=2) para la siguiente distribucin bidimensional.

X2
0,28

0,18

0,24

0,15

0,09

2
1

1
E( X 2 / x1 2)

2i P( x 2i

0,06

X1

/ x 1 2)

x 2i

0,15
0,18
1
2
1,54
0,15 0,18
0,15 0,18

Figura 4. 18 Esperanza condicional

Recta de regresin mnimo cuadrtica

Si en lugar de una curva queremos encontrar la recta que minimiza la suma de los
cuadrados de los errores de prediccin de

x 2 conocido x1 , se tiene la recta de

regresin mnimo cuadrtica. Esta recta viene dada por

x2 2

cov( x1 , x2 )
( x1 1 )
12
-107-

4. Concepto de variable aleatoria

De forma anloga se obtiene la recta de regresin mnimo cuadrtica de

x1 / x2 .

Actividad 4.13:

Calcular la recta de regresin mnima-cuadrtica de la siguiente distribucin


bidimensional:

X2
0,28

0,18

0,24

0,15

0,09

2
1

0,06

X1

1,45 0,1765( x 1,63)


X
2
1
0,533
0,91 0,331x
X
2
1

Figura 4. 19 Recta de regresin mnimo cuadrtica

r.r.m.c

x 2 2

cov( x1, x 2 )
( x1 1 )
12

X2

c.r.c. x 2 h( x1 ) E( X2 / x1 )

X1

Figura 4. 20 Curva y rrmc

-108-

4. Concepto de variable aleatoria

4.10. PROBLEMAS PROPUESTOS

4.10.1.
Si X es la variable aleatoria nmero de puntos al lanzar un dado,
determinar su valor medio y su varianza.
Solucin: E(x) = 7/2 D2(x) = 224/9

4.10.2.
Si se selecciona al azar un nmero entero entre 1 y 100, cul es el valor
esperado?
Solucin: 50.5

4.10.3.
Las lecturas sobre sensores son analgicas (continuas), y deben ser
convertidas a una escala discreta para permitir su procesamiento digital. Sea X la
lectura de un sensor. En un caso muy sencillo, supongamos que si la lectura
iguala o supera un valor lmite t=1/2, el valor almacenado es 1 y en caso
contrario es 0. Si la funcin de densidad de X es:

0 x 1
x

f ( x ) x 2 1 x 2
0
otroscasos

Hallar la funcin de probabilidad de la variable aleatoria Y que indica el valor


almacenado.
Solucin: P(Y=0)=1/8 P(Y=1 )=7/8

4.10.4.
El tiempo, X, que tarda una mquina en elaborar un producto tiene como
funcin de densidad:

2 e2 x
f ( x)
0

x0
otroscasos

Si el mecanismo tarda 3 minutos o menos, el beneficio del fabricante es 100 euros. Si


tarda ms de tres minutos el beneficio es -200 euros. Si Y es el beneficio, hallar su
funcin de probabilidad y su funcin de distribucin.

4.10.5.
Un fabricante de motores produce un 30% de defectuosos. El coste es
de 4.000 . por unidad y el precio de venta es de 9.000 .. Si el motor es
defectuoso debe devolverse lo cobrado y pagar una indemnizacin de 6.000 .
a) Calcular el beneficio medio por motor.

-109-

4. Concepto de variable aleatoria

b) Se puede hacer una prueba de control de calidad A que cuesta 2.000 . y que
determina con toda seguridad si el motor es o no es defectuoso. Estudiar si es
rentable la prueba.
c) Se puede utilizar una prueba alterativa B, que conduce a conclusiones
errneas en un 10% de los casos. Calcular el precio mximo que puede
pagarse por dicha prueba.
Solucin: a)500 b)300 c)990

4.10.6.
La longitud de una cierta pieza se distribuye con la siguiente funcin de
densidad:

f ( x) k ( x 2) 2
0

1 x 2
2 x 2.5
otros valores

y se consideran correctas las piezas de longitud comprendida entre 1'5 y 2'1.Se


pide:
a) valor de la constante k
b) proporcin esperada de piezas correctas
c) funcin de distribucin de la variable longitud de la pieza
Solucin: a) k=0'694 b) 0'4163

4.10.7.

Sea X una variable aleatoria continua cuya funcin de densidad es:

k (1 x 2 )
f ( x)
0

x 0,3
x 0,3

Hallar:
a) El valor de la constante k.
b) Probabilidad de que X est comprendida entre 1 y 2.
c) Probabilidad de que X sea menor que uno.
d) Sabiendo que X es mayor que 1, probabilidad de que sea menor que 2.
Solucin: a) 1/12 b) 5/18 c) 1/9 d) 5/16
-110-

4. Concepto de variable aleatoria

4.10.8.

Dada la funcin de densidad de la variable aleatoria X:

f ( x ) 2 - x
0

0 x 1
1 x 2
otros valores

Hallar su funcin de distribucin.


Solucin: Fx ( x)

x2
2

si

0 x 1; Fx ( x ) 1

( 2 x )2
2

si

1 x 2

4.10.9.
La variable X est definida en el intervalo ]-, a] con funcin de densidad
f(x). La expresin:
a

x f ( x)dx

facilita:
a) el valor de la funcin de distribucin en el punto x=a.
b) el valor de la desviacin tpica de X.
c) es una expresin que vale 1.
d) es el valor medio de la variable X.

4.10.10.
Se realiza un estudio sobre la duracin de las llamadas en una centralita
telefnica y se estima que su funcin de densidad de la variable es:

1 2x
e
f ( x) 2
0

x0
otros valores

Hallar el valor esperado de la longitud de una llamada telefnica en esa estacin.


Solucin: E(x)=2

4.10.11.

Dada una variable aleatoria continua cuya funcin de densidad es:

-111-

4. Concepto de variable aleatoria

x 0.5
f ( x)
0

1 x 2
otrosvalores

Hallar su esperanza matemtica.


Solucin: 19/12.

4.10.12.

Dada una variable aleatoria continua cuya funcin de densidad es:

1
f ( x) 2 x
0

0 x 1
otros valores

Hallar su varianza.
Solucin: 4/45.

4.10.13.
De una estacin parte un tren cada 20 minutos. Un viajero llega de
imprevisto. Calcular:
a) Probabilidad de que espere el tren menos de 7 minutos
b) Valor medio del tiempo de espera
c) Probabilidad de que espere exactamente 12 minutos.
Solucin: a) 7/20 b) 10 c) 0.

4.10.14.
Se intenta estudiar el porcentaje de tiempo en el que se esta utilizando
un ordenador en un determinado departamento a lo largo de las semanas de
trabajo. Supongamos que el porcentaje de utilizacin del ordenador sigue una
funcin de densidad de probabilidad dada por:

3x 2
f ( x)
0

0 x 1
otros valores

Calcular el promedio y la varianza del porcentaje de utilizacin del ordenador.


Solucin: 0.75 0.0375

4.10.15.
Un almacenista compra a principio de semana N kg. de un producto
perecedero a 200 pts/kg. y lo revende a 300 pts/kg. La demanda se distribuye
exponencialmente con media 100 kg/semana, y aquellos kilos que no vende se
estropean y pierden. Calcular cuntos kilos del producto debe comprar a la
semana para maximizar su beneficio.
-112-

4. Concepto de variable aleatoria

Solucin: N= 40.55 Kg.

4.10.16.
Un revendedor de entradas sabe que la demanda diaria en la reventa de
las mismas se distribuye aleatoriamente, siendo Prob(D> d)= e-0.05 d. Si el
revendedor compra en taquilla a 200 ptas. y revende con un beneficio del 20%,
pero debe quedarse con las que no puede vender, calcular cuntas entradas
debe comprar al da para maximizar su beneficio.
Solucin: 4 entradas diarias

4.10.17.
Si X es una variable aleatoria que mide la duracin real de una lmpara,
X=EXP(), determinar el valor medio de su duracin.
Solucin: 1/

4.10.18.

Dada la funcin de densidad de la variable X:

x
5

f ( x ) 5
6 x

5
0

0 x1
1 x 5
5 x6
otros

determinar su valor medio.


Solucin: E(x) = 3

4.11. PROBLEMAS Y CUESTIONES DE EXMENES

4.11.1 El espesor de una plancha de acero sigue una distribucin aleatoria segn la
figura de abajo. La plancha de acero es adecuada para su uso siempre que el
espesor sea mayor de 1,75 mm y menor de 3 mm. Se pide:
f(x)

3,5

-113-

4. Concepto de variable aleatoria

a) Calcular la funcin de densidad en cada punto.


b) Calcular el E(X).
c) Calcular la proporcin de planchas defectuosas.
Solucin:
a)

Como el rea total bajo la funcin de densidad tiene que ser la unidad, la altura
de la figura debe ser,

( 2 1 )h
( 3,5 2 )h 1
2

De donde h=1/2.
La funcin de densidad ser:

a bx

f ( x ) h 1 / 2
0

x [ 1,2 ]
x [ 2;3,5 ]
resto

Aplicando la frmula de la ecuacin de una recta que pasa por 2 puntos, se tiene
y 0 h0

x 1 2 1

y
x 1
h y se tiene que y f ( x ) hx h
x 1
2 2

b) El valor medio viene dado por,


2

3 ,5

3 ,5
x3 x2 x2
x 1
1
E( x ) x f ( x )dx x( - )dx x dx
2 ,48

1
2
2 2
2
32 22 1 22 2

c) El porcentaje de defectuosas ser la suma del porcentaje de piezas por debajo


del lmite inferior de tolerancias ms el porcentaje de piezas defectuosas por
encima del lmite superior de tolerancias. Esto es,

p p1 p2 P( X 1,75 ) P( X 3 )

1,75

3 ,5 1
x 1
dx
dx 0 ,14 0 ,25 0 ,39
3 2
2

4.11.2 El contenido de arroz en gramos dentro de un paquete sigue una


distribucin con funcin de densidad,

1
x
2
para 239 x 254
5 ,35
150
f ( x ) 0 en otro caso
f(x)

a) Calcular la media y la dispersin del contenido de arroz en cada paquete.


b) Si el contenido de arroz es menor de 245 gr. se considera que es un paquete
defectuoso. Calcular el porcentaje de paquetes defectuosos.
-114-

4. Concepto de variable aleatoria

c) Si el contenido de arroz pesa menos de 245 gramos, el coste es de 1,25x 2 , y


si es mayor a 245 el coste es de 1,3x . Calcular el valor medio del coste del
contenido de arroz de un paquete.
Solucin:
a) El valor medio es,
254

E( X ) x
239

1
x
(2
)dx 246 ,15
5 ,35
150

Y la varianza se calcula como,

D 2 ( X ) E( X 2 ) E( X )

Siendo E( X 2 )

254

239

x 2

1
x
(2
)dx 60608 ,2
5 ,35
150

D 2 ( X ) E( X 2 ) E( X ) 60608 ,2 246 ,15 2 18 ,38


2

Y la desviacin tpica es D( X) 4,29


b) El porcentaje de paquetes defectuosos es,

1
x
(2
)dx 0 ,434
239 5 ,35
150

P( X 245 )

245

c) El valor medio del coste es,

E( c ) 1,25 x 2
245

239

254
1
x
1
x
(2
)dx 1,3 x
(2
)dx 31920
245
5 ,35
150
5 ,35
150

4.11.3 El espesor, X, de una determinada pieza sigue una distribucin


aleatoria, segn la siguiente funcin de densidad,

15 x
si 5 x 15
50
f ( x ) 0 en otro caso
f(x)

Sabiendo que la tolerancia del espesor es de 103 mm, se pide:


a)
b)
c)
d)

Calcular la proporcin de piezas defectuosas.


Por trmino medio, cunto vale el espesor de cada pieza?
Calcular la varianza del espesor de la pieza.
Calcular el valor de la media y el valor de la desviacin tpica del espesor
medio de 5 piezas tomadas al azar.
e) Si la pieza es correcta, el beneficio es de 10 /unidad, pero si es mayor que la
tolerancia superior se tiene una prdida de 2(X-13) /unidad, y en caso de
ser menor que la tolerancia inferior, la prdida es de 2(7-X)/unidad. Calcular
-115-

4. Concepto de variable aleatoria

el beneficio medio que obtendramos al producir 5000 piezas.


Solucin:
a)

La proporcin de piezas correctas es,


13

1 p
7

13

( 15 x )2
15 x
22
82
f ( x )dx
dx

0 ,60

50
250
100 100

7
7
13

De donde la proporcin de defectuosas es del p=0,40.


b)

La media de X es,

15 x
15
x2
E( x ) x
dx (
x
)dx
50
50
5
5 50
15

15

15

15 x 2
x3
1515 2 15 3 155 2
53

8 ,333

100
150 100 150
502 150 5
c)

La varianza es,

D 2 ( X ) E( X 2 ) E( X )

15

E( x 2 ) x 2
5

15 x
15 2 x 3
dx (
x
)dx
50
50
5 50
15

15

15 x 3
x4
1515 3 15 4 155 3
54

75

150
200 150 200
150 200 5
Y la varianza es,

D 2 ( x ) 75 8 ,332 5,611
d)

Llamando a Y el espesor medio, ste es,

x1 x2 x3 x4 x5
5

La media de y es,

E( y )

5E( x )
E( x ) 8 ,333
5

Y la desviacin tpica es,

D( y )
e)

D 2 ( x1 ) D 2 ( x2 ) D 2 ( x3 ) D 2 ( x4 ) D 2 ( x5 )
55 ,611

1,059
2
5
25

El valor medio del beneficio viene dado por,

-116-

4. Concepto de variable aleatoria

15 x
15 x
15 x
E( B ) 2( 7 x )
dx 10
dx 2( x 13 )
dx 5 ,2 / pieza
50
50
50
5
7
13
7

13

15

4.11.4 Sea una variable aleatoria X que representa el espesor, en milmetros,


de las arandelas que produce una mquina. Si la variable X tiene una
funcin de densidad dada por:

2.5 x x ( 1.9 ,2.1 ),


f(x)
caso contrario
0
Determinar:
a) La funcin de distribucin.
a) La probabilidad de que una arandela tenga un espesor igual a 1.95 mm.
b) P(1.95 < X < 2.05).
c) El valor a tal que P(X < a) = 0.25 e interpretar el resultado.
d) Sabiendo que la media de X es 2, calcular su varianza.
Solucin:
a)

0
x

F ( x ) 2.5xdx 1.25x 2 4.51


1.9
1

x 1.9
x (1.9,2.1)
x 2.1

b) P(X=1.95)=0
2.1

c) P( 1.95 X 2.05 )

2.5 xdx 0.5

1.9

d)

2.5xdx 0.25 1.25( a

1,9 2 ) 0.25 a=1.95

1.9
2.1

E( X ) [ E( X )]
2

2.5 xdx 2 2 4.01 4 0.01

1.9

4.11.5 En el almacn de un taller de fontanera hay tubos de cobre de 1.25


pulgadas de dimetro interior cortados a diferentes longitudes y
amontonados los trozos en un contenedor. Asumimos que la longitud de
los tubos cortados que se utilizan es una variable aleatoria cuya funcin de
densidad es:

-117-

4. Concepto de variable aleatoria

x (0.40 , 2.20),
caso contrario

x / k
f ( x)
0
Supuestos:
I.

Todos los tubos se compran a un proveedor pagando un coste de 3 /m

II.

Los tubos se eligen del contenedor al azar para proceder a su montaje en la


construccin de una caldera de vapor

III.

El coste de montaje de los tubos (preparacin, limpieza, soldadura, etc.)


asciende a 10 /m de tubo montado

IV.

Al cliente se le cobra segn los metros montados a razn de 50 /m

V.

Los tubos de longitud inferior a 0.50 m se desechan directamente y no se


montan

VI.

Los tubos de longitud comprendida entre 0.5 y 2.00 m se montan enteros

VII.

A los tubos con longitud mayor de 2.00 m, se les corta previamente el exceso
sobre los 2.00 m que se pierde y no se cobra. Los 2 m restantes se montan
como en el apartado anterior

Calcular:
a) El valor medio de la longitud de los tubos del contenedor.
b) El valor medio del beneficio por tubo del almacn.
Solucin:

f(x)

0,40

2,2

-118-

4. Concepto de variable aleatoria

a)

Recordando que

f ( x)dx 1

tendremos

2, 2

x
1
1 2
2
2
0,4 k dx 2k x 0,4 2k (2,2 0,4 ) 1
2, 2

despejando k=2,34
2 ,2

2 ,2 x
1
1
E( X ) xf ( x )dx x dx x 3 ( 2 ,2 3 0 ,4 3 ) 1,5077
0 ,4 k
3k 0 ,4 3k
x

E ( Beneficio ) E ( B) B( x) f ( x)dx
x

b)
B= (cobrado-pagado)

en cada caso

B1 =0 -3x = -3x

para (0,4 X 0,5)

B2 =50x-(3+10)x= 37x

para (0,5 X 2.0)

B3 =(50 . 2)-(3x+2 . 10)= 80-3x

para (2,0X 2,2)

0, 5

E ( Beneficio ) E ( B) B( x) f ( x)dx (3x)


0, 4

0, 5

2, 0

2, 0
2, 2
x
x
x
dx 37 x
dx (80 3x)
dx
0
,
5
2
,
0
2,34
2,34
2,34

2, 2

3 x3
37 x 3

1 80 x 2

x 3 0,0261 41,5064 13,2274 54,7077 euros / tubo

2,34 3 0, 4 2,3 3 0,5 2,34 2


2, 0

4.11.6 La longitud de una determinada pieza es una variable aleatoria con


funcin de densidad,

300 x
f ( x ) k
para 100 mm x 200 mm
3
f ( x) 0
en otro caso
Consideramos que la pieza es correcta cuando su longitud est entre 105 mm y 190
mm. Se pide:
a) Calcular el porcentaje de piezas defectuosas.
b) Calcular la funcin de distribucin de la variable aleatoria longitud de la pieza.
c) Si la longitud de la pieza es mayor de 190 la prdida que se produce es de
2
10, si la longitud es menor de 105 mm la prdida es de 30x , y si la pieza
es correcta el beneficio es de 200x . Por trmino medio, cul ser el
beneficio por cada pieza producida?
-119-

4. Concepto de variable aleatoria

Solucin:
La constante k la calculamos con la condicin de que la integral de la funcin de
densidad para todo su campo de existencia es igual a la unidad.

200

100

( 300 x )
dx 1
x

Integrando,
200

k - ( 300 x )2
k 200 2 100 2 k

30000 1
3
2
2 6
100 3 2
De donde k=0.0002
a)

La proporcin 1-p de piezas correctas es,


190

1 p 0 ,0002
105

( 300 x )
dx 0 ,864
3

Y la proporcin de piezas defectuosas es p=1-0,864=0,136.


b)

La funcin de distribucin para x entre 100 y 200 es,


x

( 300 x )
0 ,0002 ( 300 x )2
0 ,0002
F ( x ) 0 ,0002
dx
[ 40000 ( 300 x )2 ]


100
3
3
2
6
100
X

F(x) = 0 para x<100


F(x)= 1 para x>200
c)

El valor medio de cada pieza producida es,


105

E( B )

( 30 x

100

190

105

200 x0 ,0002

)0 ,0002

( 300 x )
dx
3

200
( 300 x )
( 300 x )
dx ( 10 )0 ,0002
dx
190
3
3

4060 / pieza

-120-

5. Principales distribuciones discretas

5. PRINCIPALES DISTRIBUCIONES DISCRETAS


Contenido
5.1.
5.2.
5.3.
5.4.
5.5.
5.6.
5.7.
5.8.

DISTRIBUCIN DICOTMICA ............................................................. 121


DISTRIBUCIN BINOMIAL ................................................................... 122
DISTRIBUCIN HIPERGEOMTRICA ................................................. 123
DISTRIBUCIN DE POISSON.............................................................. 125
DISTRIBUCIN BINOMIAL-NEGATIVA ................................................ 126
DISTRIBUCIN MULTINOMIAL ........................................................... 127
PROBLEMAS PROPUESTOS .............................................................. 129
PROBLEMAS Y CUESTIONES DE EXMENES .................................. 143

A continuacin vamos a estudiar las principales distribuciones discretas que aparecen


en la prctica. Para cada una de ellas definimos:
1) La funcin de probabilidad.
2) Valor medio.
3) Varianza.
4) Suma de variables aleatorias del mismo tipo.
5) Convergencia a otras variables.

5.1.

DISTRIBUCIN DICOTMICA

Diremos que X es una v.a. dicotmica de parmetro "p", y la representamos por

X D(p)
si toma nicamente dos valores posibles:
X = 1 , con probabilidad "p",
X = 0 , con probabilidad "q",
donde p + q = 1 .
Se suele asociar el "1" con la presencia de un cierto suceso, y "0" por su
ausencia. Por ejemplo, una pieza mecnica puede ser defectuosa, 1, o no tener
defecto, 0. Al lanzar una moneda aparece la cara, y lo asociamos con el "1", y en
caso contrario, lo asociamos con el "0".
-121-

5. Principales distribuciones discretas

El valor medio de X se calcula como:


E(X) = xi P( xi )= 1.P(1)+0.P(0)= 1.p+0.q =

xi

La varianza la calculamos a partir de los momentos respecto al origen, as


2
2
D (X) = 2 - 1

de donde
2
2
2
2
1 = p; 2 = E( X ) = xi P( xi ) = 1 .p + 0 .q = p

2
2
= p - p = p.(1 - p) = p.q

5.2.

DISTRIBUCIN BINOMIAL

Al repetir un experimento aleatorio n veces, de forma independiente, el nmero de


veces que aparece un suceso A, de probabilidad P(A), se denomina variable
aleatoria binomial, y se representa por,

X B(n, p)
Al realizar una vez el experimento aleatorio puede ocurrir el suceso A o el
suceso contrario. Al efectuar n repeticiones, una posible secuencia puede ser:

A A A A A.......A A
Supongamos que queremos calcular la probabilidad de que al repetir n veces
el experimento aleatorio, aparezcan veces el suceso A, esto es P(X = ) . Ello
significa en una secuencia de aparicin de los sucesos, hay -veces el A y, por lo

n -

tanto, n - veces el suceso A , con una cantidad de masa de P(A) P( A )

, y como

cada secuencia, con igual nmero de A son mutuamente excluyentes, el total de


secuencias viene dado por:

n!
! (n - )!
Luego la probabilidad de obtener exactamente veces el suceso A, es

n
P(X = ) = p (1 - p )n-

que recibe el nombre de "frmula binomial".

-122-

5. Principales distribuciones discretas

Tambin se puede considerar la variable binomial como una suma de "n"


variables aleatorias dicotmicas independientes, ya que al sumar el nmero de 1's
nos da el nmero de veces que aparece el suceso A. A partir de esta suma de
variables se pueden calcular las caractersticas de la binomial.
De este modo, el valor medio de la binomial es:
n

E(X) = E( X 1 + X 2 + ....+ X n ) = E( X i ) = p = n.p


La varianza de la binomial es:
n

i=1

i=1

2
2
D (X) = D ( X 1 + X 2 + ...+ X n ) = D2 ( X i )= pq = npq

Si X 1 B( n1 , p) y X 2 B( n2 , p) e independientes, la suma de estas dos v.a.


es otra binomial de parmetros X 1 + X 2 B( n1 + n2 ; p) .

Actividad 5.1:
Probabilidad de que al lanzar 5 monedas salgan dos caras.

5.3.

DISTRIBUCIN HIPERGEOMTRICA

Sea E una poblacin finita cuyos elementos son de dos tipos: el A o el A . El nmero
de veces que aparece el suceso A al realizar n extracciones sin reemplazamiento, se
denomina v.a. hipergeomtrica y se representa por:

X H(N,n, p)
Por ejemplo, supongamos un lote de N piezas, de las cuales hay N 1
defectuosas y N 2 correctas. Si tomamos n piezas al azar del lote y contamos el
nmero de piezas defectuosas que aparecen de entre esas "n", dicho nmero se
denomina variable hipergeomtrica.

-123-

5. Principales distribuciones discretas

n-
N1

N2

Figura 5. 1. Distribucin hipergeomtrica

Se suele representar por el esquema que aparece en la Figura 5. 1 5. 1.


La funcin de probabilidad es:

N 1 N 2

P(X = ) = n -
N1 + N 2

Se demuestra que el valor medio de esta v.a. es:

E(X) = np
y que su varianza es:
2
D (x) = npq.

N -n
N -1

Observar que cuando N es muy grande en relacin al tamao n de la muestra,


la varianza, tomando lmites, tiende a
2
D (X) = npq

esto es la varianza de la binomial. Por ello cuando se cumple la condicin de que

N
10
n
la variable hipergeomtrica se aproxima a la binomial B(n,p). Es decir, las
extracciones sin reemplazamiento equivalen a extracciones con reemplazamiento, ya
-124-

5. Principales distribuciones discretas

que al ser el tamao de la poblacin muy grande en relacin al tamao de la muestra,


hay muy pocas posibilidades de que un mismo elemento sea elegido dos veces.

Actividad 5.2:
Probabilidad de que al extraer al azar 3 cartas de una baraja de 40 cartas, dos de
ellas sean oros.

5.4.

En un contenedor hay 500 motores y se sabe que el 5% de ellos son defectuosos. Si


extraemos al azar 10 motores cul es la probabilidad de que en esos 10 hayan 2
motores defectuosos?

DISTRIBUCIN DE POISSON

Si observamos el nmero de defectos que aparecen en una pieza mecnica, estos


pueden ser 0,1,2,3..., y en teora pueden haber hasta infinitos defectos. Es decir, se
trata de un espacio muestral infinito numerable.
Un modelo matemtico que se ajusta bastante bien al nmero de defectos es
la distribucin de Poisson, la cual aparece como consecuencia del lmite de una v.a.
binomial B(n, p) cuando n , p 0 y se mantiene constante el producto de

n.p = .
Para obtener la funcin de probabilidad de la v.a. de Poisson, partimos de la
frmula de la binomial, y hacemos tender el lmite para cuando n y p 0 , as:

n
P(X = ) = p (1 - p )n- =

n!
n(n - 1)...(n - + 1)

n -
n -
=
p (1 - p ) =
p (1 - p )
! (n - )!
!
Haciendo tender n , p 0, q 1 , y queda
-
.
P(X = ) = e
!

La media es

E(X) = 1 =
y la varianza es

-125-

5. Principales distribuciones discretas

2
2
2
2
D (X) = 2 - 1 = + - =

Si X 1 PS( 1 ) y X 2 PS( 2 ) e independientes, la suma de v.a. de Poisson


da lugar a otra distribucin de Poisson de parmetro suma de parmetros.
Otra forma en que aparece la distribucin de Poisson es contando el nmero
de sucesos hasta un cierto tiempo "t", cuya expresin es:

- t
e ( t )
P( X t = ) =
!

donde t es el promedio de sucesos que ocurren en un tiempo t.


Para obtener los distintos valores de P(X = ) se emplea el baco de
Poisson.

Actividad 5.3:
o

5.5.

En una fbrica donde hay muchas mquinas se sabe que por trmino medio se
averan 2 al da. Se pide:
o

Probabilidad de que en un da se averen 4 mquinas.

Probabilidad de que se averen 4 mquinas en 5 das.

De una determinada pliza de seguros se sabe que reclaman por trmino medio 4 al
mes. Si por cada pliza hay que indemnizar con 1000, cunto dinero tenemos que
preparar para poder pagar al final del mes con una probabilidad del 95%?

DISTRIBUCIN BINOMIAL-NEGATIVA

El nmero de veces que hay que repetir un experimento aleatorio hasta que aparece
"r" veces el suceso A de probabilidad p, se llama variable aleatoria binomial
negativa, y se representa por:

X BN(r, p)
La funcin de probabilidad P(X = ) , se calcula pensando que para que en la
repeticin nmero haya aparecido el suceso A "r" veces, en los - 1 primeros
tiene que haber aparecido de cualquier forma r-1 veces el suceso A, y en la repeticin
el suceso A, de aqu:
-126-

5. Principales distribuciones discretas

- 1 r -1 -r
- 1 r -r
p q .p =
p q
P(X = ) =
r
1
r
1

El valor medio de esta variable aleatoria es:

E(X) =

r
p

y su varianza
2
D (X) =

rq
2
p

Un caso particular interesante es cuando r=1, esto es, el nmero de veces


que hay que repetir un experimento aleatorio hasta que aparece por primera vez el
suceso A. A este caso particular tambin recibe el nombre de "distribucin
geomtrica" o "distribucin de Pascal".
El valor medio y la varianza son:

E ( x)

1
p

D2 ( X )

p
q2

Actividad 5.4:

Cuntas veces, por trmino medio, hemos de tirar un dado para que salga por
primera vez el 1?

Cuntas veces por trmino medio hemos de tirar un dado para que salga por
segundo vez el 1?

5.6.

DISTRIBUCIN MULTINOMIAL

La distribucin multinomial es una generalizacin de la binomial. En lugar de contar la


aparicin de un suceso cada vez que realizamos un experimento aleatorio, contamos
ms de un suceso. De esta forma, nombrando a A1 , A2 ,..., Ak los distintos sucesos
que pueden aparecer al efectuar el experimento aleatorio, designamos con x1 el
-127-

5. Principales distribuciones discretas

nmero de veces que aparece el suceso A1, x2 el nmero a veces que aparece el
suceso A2, y xk el nmero de veces que aparece el suceso Ak, al repetir n veces el
experimento aleatorio,
La variable k-dimensional (x1, x2, ...,xk) recibe el nombre de variable aleatoria
multinomial, con funcin de probabilidad,

P( x1 1 ; x2 2 ;...; xk k )

n!
p11 p2 2 pk k
1! 2 ! ... k !

siendo pi la probabilidad que aparezca el suceso Ai al realizar una vez el experimento


aleatorio, y cumplindose que:

1 2 3 .... k n
p1 p2 p3 ... pk 1
Cuando k=2 se trata de la variable binomial, que tal como dice el nombre cuenta
dos sucesos aleatorios.
El valor medio de cada marginal viene dado por:

E ( xi ) npi
La variancia de cada marginal es:

D 2 ( xi ) npi qi
La covariancia (mide la relacin lineal que hay entre dos variables) entre dos
marginales es:

cov( xi , x j ) npi p j
Por ejemplo, si lanzamos n veces un dado, la variable aleatoria que cuenta el
nmero de 1's, 2's, 3's, 4's, 5's y 6's, es una variable aleatoria multinomial.

Actividad 5.5:

1. De 20 barajas de 40 cartas, saco al azar 8 cartas. Cul es la probabilidad de que


sean 2 oros, 1 espadas, 2 copas y 3 espadas.

-128-

5. Principales distribuciones discretas

5.7.

PROBLEMAS PROPUESTOS

5.7.1.- Si X es la variable aleatoria nmero de veces que hay que lanzar un dado
hasta obtener por primera vez un seis, determinar su valor medio.
Solucin: 6

5.7.2.- Un interruptor debe ser reemplazado despus del primer fallo. La probabilidad
de que funcione adecuadamente en cualquier utilizacin es 0,995. Si X indica el
nmero de veces que el interruptor ha funcionado correctamente hasta su
reemplazamiento, calcular su valor medio y su varianza.
Solucin: E(X) = 199 Var(X) = 39800

5.7.3.- Sea X el nmero de veces que se ha lanzado un dado hasta conseguir un


seis. Hallar:
a) Funcin de probabilidad de X,
b) Valor esperado de X.
Solucin: a) P(X = k) =(5/6)k-1 (1/6) k =1,2, . .

b) 6

5.7.4.- Una nave de fabricacin est integrada por un nmero considerable de


mquinas idnticas y se sabe por experiencia que el promedio de las que se averan
semanalmente es de 5.
a. Calcular la probabilidad de que hayan ms de 3 averiadas en la misma
semana.
b. Cul es el nmero de mquinas de reserva que se precisan en una semana
para tener una probabilidad al menos de 0,99 de que al averiarse cualquier
mquina podr sustituirse.
Solucin: a) 0,7340 b) 11

5.7.5.- En una central telefnica de una ciudad se reciben un promedio de 4 llamadas


por minuto, en las horas de mximo trfico. Si la instalacin tiene una capacidad tal
que puede atender a los sumo 12 llamadas por minuto, cul es la probabilidad de
que en un minuto determinado no sea posible dar lnea a todos los clientes que lo
-129-

5. Principales distribuciones discretas

soliciten?
Solucin: 0,0003

5.7.6.- Un servicio de mantenimiento de aviones realiza diferentes tipos de


reparaciones. Las solicitudes de reparacin para un sistema particular recibidas en un
perodo de tiempo pueden considerarse que constituyen un proceso de Poisson.
Concretamente:
SISTEMA

N MEDIO DE REPARACIONES
EN UNA SEMANA

motor

1 = 2.0

diseo

2 = 0.5

hidrulica

3 = 1.3

tren de aterrizaje

4 = 0.2

a) Cul es la probabilidad de que el nmero total de reparaciones solicitadas en


una semana sea mayor o igual que tres y menor o igual que 7?
b) Si el promedio de reparaciones de diseo se duplica y el promedio de
reparaciones de motor se reduce a la mitad, cul es la probabilidad de que
en dos semanas el nmero total de reparaciones sea menor o igual que 8?
Solucin: a) 0.7108 b) 0.7291

5.7.7.- Los fallos de fluido elctrico en una estacin de trabajo siguen una distribucin
de Poisson y tienen un promedio de 1,5 fallos al mes.
a) Cul es el nmero de fallos esperado en un ao?
b) Cul es la probabilidad de que se produzcan ms de 20 fallos en un ao?
c) Cul es la probabilidad de que el prximo fallo ocurra antes de 2 meses?
d) Cul es la probabilidad de que ocurra antes de tres meses pero no antes de
2 meses?
Solucin: a) 18 b) 0,2776 c) 0,9502 d) 0,0387

5.7.8.- Las mquinas de 5 fbricas diferentes se rompen con una frecuencia media de
-130-

5. Principales distribuciones discretas

1.2, 3.2, 0.7, 3.5 y 2.4 veces al da. Los procesos de rotura en los diferentes sitios son
independientes, y cada proceso se asume que satisface las condiciones de un
experimento de Poisson:
a) Cul es la probabilidad de que el nmero total de roturas en un da dado
exceda de 12 unidades?,
b) Despus de una rotura en cualquier fbrica cul es la probabilidad de que la
prxima rotura (sea cual sea la fbrica) ocurra en las dos horas siguientes?
Solucin: a) 0.3113 b) 0.60

5.7.9.- Se ha fabricado una partida de transistores con un 20% de unidades


defectuosas. Si X es una variable aleatoria que indica el nmero de transistores
defectuosos obtenidos al seleccionar 4 transistores de la partida, obtener su funcin
de probabilidad.

4
x

x
4 x
Solucin: P( x) (0.2) (0.8)

5.7.10.- Un sistema multiproceso utiliza 12 procesadores y ha sido configurado de


modo que puede satisfacer todas sus funciones, aunque mas lentamente, si
funcionan 9 procesadores. Si la probabilidad de que funcione cada procesador
durante el tiempo de ejecucin de un trabajo es 0,8 y los fallos de los procesadores
son independientes cul es la probabilidad de que el sistema funcione hasta que se
complete el trabajo?
Solucin: 0.7946

5.7.11.- Una compaa de seguros, que cuenta con 10.000 asegurados, determina
que el 0,005% de la poblacin fallece cada ao de un cierto tipo de accidente:
a) Calcular la probabilidad de que la compaa de seguros tenga que pagar a los
beneficiarios de 3 o ms de los asegurados contra tal tipo de accidente en un
ao determinado.
b) Cul es el nmero de accidentes al ao por trmino medio?
Solucin: a) 0,0144 b) 0,5

-131-

5. Principales distribuciones discretas

5.7.12.- Se seleccionan por separado tres muestras aleatorias en una lnea de


produccin en la cual el 5% de las unidades son defectuosas. Las dos primeras
muestras tienen un tamao igual a 20 y la tercera un tamao igual a 10. Cul es la
probabilidad de que el nmero de unidades defectuosas encontradas entre las tres
muestras sea mayor o igual que 1 y menor o igual que 4?.
Solucin: 0.81944

5.7.13.- Una partida de bujas con alta proporcin de inservibles (20%) sale al
mercado en paquetes de 4 unidades y en cajas de 10 paquetes. Calcular la
probabilidad de que:
a) Elegido un paquete al azar contenga 2 o ms bujas inservibles.
b) Elegida una caja al azar contenga ms de 10 bujas inservibles.
c) Elegida una caja al azar contenga 3 paquetes sin bujas inservibles.
Solucin: a) 0'1808 b) 0'1608

c) 0'2062

5.7.14.- Una mquina de fabricacin de tornillos produce por trmino medio 2


tornillos defectuosos por cada 85, empaquetndose stos en cajas de 170 unidades.
Cul es la probabilidad de que tomadas al azar 7 cajas, en slo 2 de ellas no haya
ningn tornillo defectuoso?
Solucin: 0'0064

5.7.15.- Una fbrica encuentra que el 20% de los diskettes que produce son
defectuosos. Si se eligen diez diskettes al azar de un lote, hallar la probabilidad de
que:
a) Hayan exactamente dos defectuosos.
b) Que dos o ms sean defectuosos.
Solucin: a) 0.3 b) 0.62419

5.7.16.- Cada hora se toman 50 unidades de la produccin de una mquina. Si la


muestra contiene dos o ms unidades defectuosas, se ajusta la mquina. Si esta
produce un 2% de unidades defectuosas, calcular el tiempo medio entre sucesivos
ajustes.

-132-

5. Principales distribuciones discretas

Solucin: (3'784-1) horas

5.7.17.- Una industria recibe piezas en lotes de un gran nmero de unidades. Se


desea reparar un plan de control de calidad de tal forma que tomando al azar n
unidades del lote, si se observa alguna defectuosa se rechaza el lote. Determinar n
para que si el lote tiene un 5% de unidades defectuosas, la probabilidad de
aceptarlos sea menor de 0,01.
Solucin: 90.

5.7.18.- Un cargamento de 20 acelermetros altamente sensibles deben ser


aceptados o rechazados en base a una muestra de 5 unidades seleccionadas
aleatoriamente del lote. El cargamento ser rechazado si en la muestra hay ms de
una unidad defectuosa. Cul es la probabilidad de que el cargamento sea aceptado
si se sabe que el 10% de las unidades no cumplen las especificaciones?.
Solucin: 0,9473

5.7.19.- Un comerciante compra rels elctricos en lotes de 1.000 unidades. En cada


lote se seleccionan 15 unidades, y el lote se acepta si el nmero de unidades
defectuosas es menor o igual que 3. El fabricante sabe que hay un 10% de unidades
defectuosas en cada lote, cul es la probabilidad de que sea rechazado un lote?
Solucin: 0,0555

5.7.20.- En una fbrica el nmero de accidentes por semana sigue una distribucin
de Poisson de parmetro =2. Se pide:
a) Probabilidad de que en una semana haya algn accidente
b) Probabilidad de que hayan 4 accidentes en el transcurso de 2 semanas
c) Probabilidad de que hayan 2 accidentes en una semana y otros 2 en la
siguiente
d) Es lunes, y ya ha habido un accidente. Calcular la probabilidad de que en esa
semana no haya ms de tres accidentes.

-133-

5. Principales distribuciones discretas

Solucin: a) 0'8646 b) 0'1954 c) 0'0733 d) 0'8348

5.7.21.- Un partida de diamantes industriales con una proporcin de inservibles de


15% sale al mercado en paquetes de 4 unidades y en cajas de 10 paquetes, elegida
una caja al azar calcular la probabilidad de que contenga 2 paquetes con al menos un
diamante defectuoso.
a) 00567
b) 01860
c) 02456
d) 00836

5.7.22.- Una lnea de fabricacin est compuesta por un nmero considerable de


robots Cul es el nmero de robots de reserva que se precisan en una semana para
tener una probabilidad al menos del 90% de que al averiarse cualquier robot podr
sustituirse?. Se sabe por experiencia que el promedio de averas es de 95 a la
semana.
a) 10
b) 16
c) 13
d) 14

5.7.23.- En una empresa de electrnica se reciben componentes en lotes de gran


tamao. Un lote se considera correcto si tiene menos de un 1 de piezas
defectuosas. Se toma una muestra de tamao n y si no aparece ninguna defectuosa
se acepta el lote. Calcular el tamao de muestra mnimo que se debe tomar si
queremos cometer un error de segunda especie con probabilidad menor del 8%
cuando el porcentaje de piezas defectuosas en el lote sea del 1%
a) 230
b) 240
c) 252
d) 265

-134-

5. Principales distribuciones discretas

5.7.24.- De un paquete de bolgrafos en los que hay un 18% que no funcionan, cul
es la probabilidad de tener que probar 6 de ellos hasta encontrar 3 que funcionen?.
a) 0.0116
b) 0.0326
c) 0.0097
d) 0.0177

5.7.25.- El nmero medio de defectos por metro cuadrado de una superficie cermica
es de 0.29, cul es la probabilidad de que una superficie de 50 m 2 encontremos 12
o mas defectos?
a) 0.9389
b) 0.2911
c) 0.8200
d) 0.7799

5.7.26.- La probabilidad de que en un telar se produzca al menos una avera en un


da, es del 5%. Calcular, por trmino medio, el nmero de averas que se producirn
semanalmente.
a) 0.359
b) 20.97
c) 0.0513
d) 0.0073

5.7.27.- En un lote de 40 diamantes industriales para mquinas de corte, existe una


probabilidad del 25 % de que un diamante no cumpla las caractersticas fsicas para
ser utilizado. Cuntos diamantes debemos tomar para tener una probabilidad de
0.98785 de que al menos uno nos va a ser til?

-135-

5. Principales distribuciones discretas

a) 8
b) 7
c) 5
d) 3

5.7.28.- Un plan de muestreo de materias primas en lotes de 1000 unidades, consiste


en tomar 10 piezas al azar, y si aparece alguna defectuosa se rechaza el lote.
Calcular la proporcin de piezas defectuosas en un lote que tenga una probabilidad
de ser rechazado, segn dicho plan de muestreo, de 0.1.
a) 0.3162
b) 0.2056
c) 0.0513
d) 0.0104

5.7.29.- Se denomina fiabilidad de un sistema informtico a la probabilidad de que


funcione satisfactoriamente. Supongamos que esta formado por 50 componentes
cuya funcin requiere el correcto funcionamiento de al menos 40 de ellos. La
probabilidad de que cada componente funcione despus de 100 horas es 0.9 y los
componentes se averan independientemente. cual es la fiabilidad del sistema
informtico despus de 100 horas?
Solucin: 0.985

5.7.30.- De una Base de Datos se cogen 20 registros para su verificacin. Se


considera que la Base de Datos es correcta cuando no hay ningn registro
defectuoso. Cual es la probabilidad de aceptar cuando la Base de Datos tiene un
10% de registros defectuosos?

-136-

5. Principales distribuciones discretas

Solucin: 0.12

5.7.31.- Se tiene constatado que 1/3 de una Base de Datos de Clientes de un


empresa son extranjeros. Tomando una muestra al azar de 10 registros de la Base
de Datos, estudiar:
a)

Probabilidad de que hayan 2 empresas extranjeras.

b)

Probabilidad de que hayan ms de 3 empresas extranjeras.

c)

Probabilidad de que hayan como mximo cinco empresas extranjeras.

Solucin: a) 0.1951 b) 0.44 c) 0.9235

5.7.32.- El control de calidad de las carcasas de ordenadores, se realiza tomando 2


unidades y contando el n de defectos que aparecen. El promedio de defectos que se
ha tenido hasta el presente es de 1.3 (entre las dos unidades). Cul es la
probabilidad de que, sin cambios en el proceso, aparezca una muestra con ms de 5
defectos?
Solucin: 0.002

5.7.33.- Si de cada 200 diskettes hay uno con virus, cuntos discos debemos
verificar para tener una probabilidad de 0.85 de encontrar al menos uno con virus?
Solucin: 379

5.7.34.- En un proceso de fabricacin de componentes electrnicos se produce un


0.5% de unidades defectuosas. Dichas componentes se expiden en cajas de 3.000
unidades.
a) Cul puede ser la poblacin de estudio?, y la variable aleatoria?, cmo se
distribuye?
b) Se desea acompaar cada caja con un certificado garantizando que la caja
contiene como mnimo C componentes correctas. cul es el mximo valor que
puede darse a C si se desea que la probabilidad de cumplir la garanta sea
-137-

5. Principales distribuciones discretas

superior al 99%?
Solucin: a) X= B(3000, 0.005) , N(15, 3.863) b) 2976 unidades

5.7.35.- Una persona rellena sus quinielas completamente al azar,


a) Cuntas tendra que rellenar si deseara tener una probabilidad superior al
95% de acertar al menos 13 resultados?
b) Si rellena 100.000 quinielas de la misma forma cul es la probabilidad de
obtener al menos dos veces una de 14 aciertos?
c) Y si rellena 1.000.000 quinielas?
Solucin: a) 494.018 quinielas b) 0.000308 c) 0.01992

5.7.36.- Una empresa de software desea vender un nuevo programa de aplicacin en


empresas, para ello enva publicidad postal a una muestra de 40 empresas,
invitndoles a conocer la ltima novedad de la empresa y ofrecerles un obsequio a
cambio. Los expertos estiman que un 30% de las empresas respondern a la
invitacin pero que, de stas, slo un 20% adquirir el programa. Calcula la
probabilidad de que despus de la demostracin nadie haya decidido comprar el
programa.
Solucin: 0.084

5.7.37.- Una determinada normativa oficial exige que para unos envos de disquetes,
el porcentaje de defectuosos no puede exceder del 10%; con el fin de controlar el
cumplimiento de dicho requisito un servicio de control inspecciona cada partida
seleccionando N disquetes al azar y rechazando el envo si encuentra ms de 2
defectuosos.
a) Calcular cunto debe valer N para que la probabilidad de aceptar un envo
que no satisfaga el requisito de calidad exigido sea inferior al 5 %.
b) Los disquetes se agrupan en cajas de 10 unidades que se envan en
paquetes de 50 cajas. Una caja se considera defectuosa si tiene ms de 1
disquete defectuoso. Si un envo tiene un 10% de disquetes defectuosos cul
es la probabilidad de que un paquete no tenga ninguna caja defectuosa? (definir
-138-

5. Principales distribuciones discretas

las poblaciones y variables aleatorias de estudio en cada caso).


Solucin: a) N= 62 unidades b) p= 0.0000002062

5.7.38.- Para controlar la calidad de las partidas de cierto tipo de piezas que se
reciben en una factora se utiliza el siguiente plan de muestreo en dos etapas:
1 - Se toma una primera muestra de 50 piezas. La partida se acepta si todas las
piezas resultan correctas y se rechaza si hay ms de 2 defectuosas.
2- En el resto de los casos se toma una muestra de otras 50 piezas,
aceptndose definitivamente la partida si en el total de las dos muestras hay
menos de 3 piezas defectuosas y rechazndose en el caso contrario.
a) Qu probabilidad tiene el plan anterior de aceptar una partida que tenga un
1% de piezas defectuosas?.
b) Si todas las partidas que llegan a la factora tienen un 1% de piezas
defectuosas, en promedio qu nmero de piezas se examinarn por partida?
Solucin: a) 0.9285 b) 69.04 unidades revisadas

5.7.39.- Se sabe que una mecangrafa comete en promedio un error cada 1000
caracteres tecleados. Calcular la probabilidad de que en un escrito que contiene 3000
letras haya ms de dos errores.
Solucin: 0.577

5.7.40.- Una pea juega a las quinielas 1000 boletos cada semana manteniendo 6
partidos fijos rellenando al azar los resultados (1, X 2) de los 8 restantes.
Supongamos que la pea acierta siempre los resultados de los 6 fijos:
a) Cmo se distribuye la variable aleatoria X: nmero de aciertos en una
quiniela?
b) Un boleto resulta premiado si ha acertado al menos 12 resultados, cmo se
distribuye la variable aleatoria Y: nmero de boletos premiados obtenidos en una
semana?
c) La pea juega todos los aos de la forma indicada las 40 jornadas en las que
hay quinielas, cmo se distribuye la variable aleatoria Z: nmero de semanas
en que la pea obtiene algn premio a lo largo del ao? (definir tambin la
poblacin y sucesos de estudio en todos los casos, y no considerar el partido del
-139-

5. Principales distribuciones discretas

pleno al 15, es decir slo 14 partidos).


Solucin: a) X: B(14, 0.33) b) Y: B(1000, 0.0196) N(19.66, 4.43) c) Z: B(40,1)

5.7.41.- Un campo de naranjos es atacado por una plaga de mosca del Mediterrneo
y se sabe que cada mosca deposita sus huevos (es decir "pica") en una sola naranja.
Suponiendo que en el huerto hay 200.000 naranjas y que es atacado por 50.000
moscas
a) Cul es la probabilidad de que una naranja tenga ms de una picada?.
b) Si las naranjas del huerto se vendieran en bolsas de 10 unidades cul sera
la probabilidad de que hubiera 10 naranjas sanas en la bolsa? (definir las
poblaciones y variables aleatorias de estudio en cada caso, as como los
supuestos para las que estn justificadas las distribuciones propuestas).
Solucin: a) 0.0265 b) 0.082

5.7.42.- Se sabe que el 1 por mil de las ostras que se encuentran en determinada
zona tiene una perla en su interior. Para hacer una determinada joya se precisan 5
ostras. cul es el nmero mnimo de ostras que hay que coger si se desea tener una
probabilidad superior al 95% de reunir las 5 perlas necesarias?.
Solucin: 9000 ostras

5.7.43.- Una determinada pieza de una mquina sufre a lo largo de su funcionamiento


impactos accidentales que la van deteriorando progresivamente. Estos impactos, no
apreciables exteriormente, se presentan siguiendo un proceso de Poisson de
parmetro =0.4 impactos por hora.
Se sabe que, a causa del deterioro ocasionado, la pieza falla al recibir el
decimoquinto impacto. Con el fin de evitar el fallo de la pieza, que puede
ocasionar serios daos a toda la mquina, la seccin de mantenimiento ha
decidido sustituir sistemticamente la pieza por otra nueva tras cada Z horas de
funcionamiento.
Cunto debe valer como mximo Z, si se desea que la probabilidad de fallo de
una pieza sea inferior a 0.05?

-140-

5. Principales distribuciones discretas

Solucin: 21.57

5.7.44.- La prdida espontnea de informacin de un "bit" almacenado en una


memoria de clculo se denomina fallo S. Este tipo de fallo no es muy frecuente
apareciendo en promedio uno por cada milln de horas y por "bit" almacenado. Sin
embargo, cuando el "chip" est expuesto a partculas alfa (ncleos de Helio), lo que
ocurre de forma natural en el ambiente, esta probabilidad de fallo S se ve
incrementada, siendo igual a 1 fallo por cada 1000 horas.
Si "chips" que contienen 6000 "bits" son expuestos a partculas alfa:
a) Qu distribucin sigue la variable aleatoria X: nmero de fallos S por hora en
un "chip"? Cul es la poblacin objeto de estudio? Justifica las respuestas.
b) Cul es la probabilidad de que en una hora haya al menos un fallo S en un
"chip"?. Sera anormal que hubiera cinco o ms fallos S en una hora? Justifica
la respuesta obteniendo la probabilidad del suceso correspondiente.
c) Si un mdulo contiene dos "chips" de estas caracterstica, sera extrao que
en dicho mdulo hubiera ms de 20 fallos S en una hora? Justifica la respuesta
obteniendo la probabilidad del suceso correspondiente.
d) Cul es la mediana de la distribucin del nmero de fallos S por mdulo y
por hora? Qu indica? Cul crees que ser el coeficiente de asimetra de esta
distribucin? Justifica las respuestas.
Solucin: a) 0.998 b) 9 0.715 c) 0.01 d) 12 y CA=0

5.7.45.- Para poder aceptar las partidas de diskettes que ofrece un nuevo proveedor,
una multinacional exige que el porcentaje de diskettes con algn sector defectuoso
no puede exceder el 2.5%.
Con el fin de controlar el cumplimiento de este requisito, un servicio de control en
recepcin inspecciona cada envo, seleccionando N diskettes al azar y rechazando
dicho envo si encuentra ms de dos diskettes defectuosos.
a) Calcular cunto debe valer N para que la probabilidad de aceptar un envo
que no satisfaga el requisito exigido sea inferior al 5%. (Utilizar aproximacin de
Poisson).
b) Los diskettes se comercializan en paquetes de 10 unidades, y a su vez los
paquetes se envan en cajas de 15 paquetes cada una. Un paquete se considera
-141-

5. Principales distribuciones discretas

defectuoso si tiene ms de 1 diskette daado. Si un envo tiene un 8% de


diskettes defectuosos:
b1)
Cmo se distribuye la variable aleatoria X: nmero de paquetes
defectuosos en una caja?
b2)

Sobre qu poblacin estar definida X?

b3)
Cul es la probabilidad de que una caja no tenga ningn paquete
defectuoso?
Solucin: a) N>248 b3) 0.044

5.7.46.- Un canal binario simtrico transmite los dgitos 0 y 1. Se supone que hay una
probabilidad de 0,2 de que al transmitir uno de los nmeros se reciba otro a causa de
ruidos o perturbaciones. supongamos que se enva un mensaje importante y para
transmitir "0" enviamos "000" y anlogamente para "1" enviamos "111". Se supone
que el receptor al traducir la seal recibida utiliza la regla de la mayora.
Ejemplo:
Si se recibe "110" se traduce como 1
Si se recibe "010" se traduce como 0
... ... ...
Cul es la probabilidad de que al traducir una seal sea errnea?
Solucin: 10.4%

-142-

5. Principales distribuciones discretas

5.8.

PROBLEMAS Y CUESTIONES DE EXMENES

5.8.1.- En un taller se ha recibido un envo de 150 tuercas de rosca mtrica 5, 2500


tuercas de rosca mtrica 6 y 2350 tuercas de rosca mtrica 7. Por un error del
proveedor vienen todas mezcladas en una nica caja.
a) Si tomamos 10 tuercas al azar, calcular la probabilidad de que haya
exactamente 5 de rosca mtrica 6. (0,5 puntos)
b) Ahora separamos una caja con 100 tuercas elegidas al azar Cul es la
probabilidad de que haya ms de 2 y menos de 5 tuercas de rosca mtrica 5?
(0,5 puntos)
c) Si un operario necesita exactamente 4 tuercas de rosca mtrica 6. Si las va
cogiendo una a una al azar Cul es la probabilidad de que tenga que sacar
exactamente 7 tuercas hasta conseguir las 4 necesarias? (0,5 puntos)
d) Si un operario coge un puado de 10 tuercas Cul es la probabilidad de que
haya exactamente 5 de rosca mtrica 6 y otras 5 de rosca mtrica 7? (0,5
puntos)
e) Si necesitamos exactamente 5 tuercas de rosca mtrica 5 Cuntas
deberemos coger aleatoriamente para garantizarnos una probabilidad del 90%
de que conseguiremos las 5 necesarias? (1 punto)

SOLUCIN
a) Llamando a X= nmero de roscas de mtrica 6, sta sigue una distribucin
binomial de parmetros,

X B(n 10;

2500
) B(10; 0,5)
5000

La probabilidad pedida es

10
P( X 5) 0,55 0,55 2520,510 0,2461
5
b) Llamando ahora a X= nmero de roscas de mtrica 5, sta sigue una distribucin
binomial de parmetros,

X B(n 100;

150
) B(100; 0,03)
5000

Y esta distribucin, como n>30 y p<0,1 y np<5, se puede aproximar a una distribucin
de Poisson de parmetros Ps( 3) . La probabilidad pedida es,

-143-

5. Principales distribuciones discretas

P( X 2 X 5) P( X 4) P( X 2) 0,8153 0,4232 0,3911

c) Si llamamos a X= nmero de tuercas que sacamos hasta tener 4 de mtrica 5,


sta es una distribucin binomial negativa de parmetros,
X BN(r 4; p 0,5)

La probabilidad de que exactamente X sea 7 es,


1 r
p (1 p) r
P( X )
r

7 1
0,5 4 (1 0,5)7 4 200,57 0,1563
P( X 7)
4 1

d) En este caso la X se trata de una distribucin multinomial de parmetros,

X M(n 10; p1 0,03 p2 0,5 p3 0,47)

Y la probabilidad pedida es,

P( X 1 0, X 2 5, X 3 5)

10!
0,030 0,55 0,475 0,1806
0! 5! 5!

e) El nmero de roscas de mtrica 5 que hay en n elegidas al azar, sigue una


distribucin binomial de parmetros,

X B(n; p 0,03) Ps ( n0,03)


La condicin impuesta es que P( Ps (0,03n) 5) 0,9 , y su contraria es

P( Ps (0,03n) 4) 0,10
Buscando en las tablas se tiene que 0,03n 8 de donde,

8
266,67 267
0,03

5.8.2.a) En la empresa FORD ESPAA S.A. se lleva a cabo el control de calidad del
proceso de imprimacin de las carroceras contando los defectos de todo tipo
(rayas, manchas, pelusas, crteres,) que aparecen en las carroceras antes
-144-

5. Principales distribuciones discretas

de proceder al lijado de dichos defectos como paso previo al pintado de las


carroceras. El ingeniero de calidad de la planta propone un plan de control de
calidad consistente en contar los defectos en 2 carroceras y rechazar que el
proceso sea correcto si en total aparecen ms de C defectos. Cul debe ser
ese valor C si queremos que cuando el promedio de defectos por carrocera
sea de 1,45 aceptemos el proceso como correcto en el 99% de los casos?(1,5
puntos)
b) En la misma empresa se inspeccionan las grapas de sujecin de la tapicera
cogiendo n grapas y aceptando el lote si en ellas aparece como mximo 5
defectuosas. Cul debe ser el nmero de grapas a inspeccionar si queremos
que un lote con solo un 1% de grapas defectuosas sea aceptado con una
probabilidad mayor del 99%? (1,5 puntos)
SOLUCIN
a) El nmero de defectos en una carrocera es una variable X=Ps() y en dos
carroceras Y=X1+X2=Ps(2).
Segn la propuesta habr que calcular un C tal que
P(Ps(2x1,45)C)=0,99.
En las tablas de la variable de Poisson esto ocurre para C=7
b) El nmero de grapas defectuosas en una muestra de n grapas es X=B(n,
P)Ps(nP) (despus comprobaremos la aproximacin)
Habr que buscar n para que
P(Ps(n0,01)5)=0,99
En las tablas de la Poisson, para =1,70 tenemos p(Ps(1,70)5)=0,9920 (>0,99)
Luego =1,70=n0,01n=170
Justificacin: n=170 >50, p=0,01<0,10 y nP=1,70< 5 luego vale la aproximacin

5.8.3.- El director de una fbrica, un Graduado en Tecnologas Industriales, debe


decidir el nmero de operarios de una cierta seccin de la fbrica que va a
contratar. Dichos operarios procesan unidades de un cierto producto, que llegan a
su seccin cada maana a primera hora. El nmero de unidades de dicho
producto que llega a la seccin cada da se distribuye segn una Poisson con
media 5. Cada operario puede procesar una y slo una unidad por da. Las
unidades que no se procesen se acumulan en un contenedor nico y sern
eliminadas mediante el uso de una mquina recicladora, lo que genera un coste

-145-

5. Principales distribuciones discretas

igual a 1000 por da que se utilice (independientemente del nmero de unidades


que tenga que reciclar).

a) Cuntos operarios tendr que contratar como mnimo para asegurarse que,
con una probabilidad del 95%, todas las unidades que llegan en un da
cualquiera sern procesadas? (1.25 puntos)

b) Suponiendo que se dispone de 9 operarios, cul es la probabilidad de que se


tenga que usar la mquina recicladora ms de 5 veces en un ao? Cul ser,
en promedio, el gasto de la fbrica en la mquina recicladora por ao?
(Suponer que la fbrica opera 300 das al ao). (1.25 puntos)

c) En promedio, cuntos das pasarn a partir de hoy hasta que la mquina


recicladora tenga que actuar por primera vez? Y por segunda vez? (0.5
puntos).
SOLUCIN
a) X=Ps(5)
Hay que buscar a/ P(Ps(5)a)0,95
trabajadores

segn baco P(Ps(5)9)=0,97

a=9

b) Segn los datos anteriores P(Ps(5)>9)=0,03 que es la probabilidad de que en


un da tengamos que utilizar la recicladora por uno o ms equipos reciclados
El nmero de das en 300 que se utiliza la recicladora X=B(n=300, P=0,03)=Ps(9)
P(X>5)=1-P(X5)=1-P(Ps(9)5)=1-0,12=0,88
El coste anual de la recicladora es Y=1000X

y su valor medio

E(Y)=1000E(X)=1000 x 9 =9000 Euros/ao


c) Das hasta 1 vez X=Bn(r=1, P=0,03)

E(X)=r/P= 1/0,03=33,33

Das hasta 2 vez X=Bn(r=2, P=0,03)

E(X)=r/P= 2/0,03=66,66

-146-

5. Principales distribuciones discretas

5.8.4.- Una empresa de telefona mvil factura un 5% de llamadas de duracin


superior a 10 minutos.
a) Calcular la probabilidad de que en 15 llamadas elegidas al azar haya
exactamente 1 con duracin superior a 10 minutos (1 punto)
b) Cul es el promedio de llamadas que tendremos que verificar hasta
encontrar 10 con duracin inferior a 10 minutos? (1 punto)
SOLUCIN
a) El nmero de llamadas con duracin superior a 10 en una muestra de n=15
llamadas, si sabemos que hay un 5% de llamadas con duracin superior a ese tiempo
ser una variable
X=B(n=15; P=0,05)

15
La P( X 1) 0,051 (1 0,05)14 0,3658
1
b) El nmero de llamadas hasta obtener 10 con una duracin inferior a 10 ser una
variable X=BN(r=10;P=0,95)
y su valor medio E(X)=r/P=10/0,95=10,526

-147-

5. Principales distribuciones discretas

-148-

6. Principales Distribuciones Continuas

TEMA 6. PRINCIPALES DISTRIBUCIONES CONTINUAS

Contenido
6.1.
DISTRIBUCIN UNIFORME ................................................................... 149
6.2.
DISTRIBUCIN EXPONENCIAL ............................................................. 150
Tasa de fallos .................................................................................................. 152
6.3.
DISTRIBUCIN NORMAL UNIDIMENSIONAL ....................................... 154
6.3.1. Variable normal tipificada ...................................................................... 155
6.3.2. Variable normal general......................................................................... 158
6.3.3. Teorema central del lmite ..................................................................... 160
Aproximacin de la binomial a la normal ........................................................ 161
Aproximacin de la Poisson a la normal .......................................................... 162
Correccin por continuidad.............................................................................. 163
6.4.
LA DISTRIBUCIN NORMAL BIDIMENSIONAL ..................................... 165
Distribuciones marginales ............................................................................... 166
Distribuciones condicionales ........................................................................... 166
6.5. PROBLEMAS PROPUESTOS .................................................................... 169
Distribucin uniforme....................................................................................... 169
Distribucin exponencial.................................................................................. 170
Distribucin Normal ......................................................................................... 172
Distribuciones bidimensionales ....................................................................... 182
6.6. PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 185

6.1.

DISTRIBUCIN UNIFORME

La variable aleatoria X sigue una distribucin uniforme en el intervalo [a;b] cuando


cualquier punto del mismo tiene la misma densidad de probabilidad. De este modo la
funcin de densidad es constante en todo el intervalo de definicin de la variable, tal
y como se expresa en la figura de abajo,

fx(x)

Figura 6. 1. Funcin de densidad de la distribucin uniforme

-149-

6. Principales Distribuciones Discretas

El valor de la altura de la funcin de densidad tiene que ser de tal forma que el rea
bajo dicha funcin y el eje de abscisas sea la unidad. De aqu que la funcin de
densidad sea,

f(x)

1
ba

La funcin de distribucin viene dada por,


x

F ( x ) f ( x )dx x

1
xa
dx
ba
ba

El valor medio es,


b

E( X ) x f ( x )dx

1
1 x2
b2 a2
ba
x
dx


ba
b a 2 a 2( b a )
2

Y la varianza se calcula como,

D 2 ( X ) E( X m x ) 2 E( X 2 ) E( X )
2

( b a )2
12

Actividad 6.1:
A partir de un valor al azar entre 0 y 1, obtener un valor al azar de una
uniforme entre 1 y 6.

6.2.

DISTRIBUCIN EXPONENCIAL

Sea X una v.a. no negativa con funcin de densidad

f(x) = e-x para 0 x < +


a esta v.a. se denomina distribucin exponencial, y se representa por X EXP( ) .

El valor medio y la varianza son:

E(X) =

y la funcin de distribucin es:


-150-

2
D (X) =

6. Principales Distribuciones Continuas

fX(x)

1/

2/

3/

4/

5/

6/

Figura 6. 2. Funcin de densidad exponencial

FX(x)
1

1/

2/

3/

4/

5/

6/

Figura 6. 3. Funcin de distribucin de la exponencial

Cuando veamos la distribucin de Poisson, definamos el "proceso de


Poisson" como aquel que cuenta el nmero de sucesos hasta un tiempo t, cuya
funcin de probabilidad es:

P(X(t) = ) =

- t
e .( t )
!

El tiempo aleatorio entre dos sucesos viene dado por la distribucin


exponencial. As, llamando a "T" la v.a. que indica el tiempo hasta el siguiente
-151-

6. Principales Distribuciones Discretas

suceso, se cumple que ese tiempo ser mayor que uno en concreto "t", siempre y
cuando de o a t, no haya ocurrido nada, esto es:

P(T > t) = P(X(t) = 0) =

0
- t
e .( t )
= e-t
0!

y la funcin de distribucin es:


- t

F T (t) = 1 - P(T > t) = 1 - e

que es la funcin de distribucin de la exponencial y es un modelo matemtico muy


empleado en el clculo los tiempos de vida de un elemento en su periodo de vida til.
Otra caracterstica de la exponencial es la falta de memoria, es decir,
sabiendo que es mayor que cierto valor, la probabilidad de que sea mayor que otro
valor ms avanzado es independiente de lo anterior al primer valor, esto es:

P(X > t + s/X > t) =

P(X > t + s) e- (t +s)


= t = e-s
P(X > t)
e

Actividad 6.2:
A partir de un valor al azar de una uniforme entre 0 y 1, obtener un valor al
azar de una exponencial de media 20.
Cul es la probabilidad de obtener un valor menor que la media de una
distribucin exponencial?
Cunto vale la mediana de una distribucin exponencial de media 20?

Tasa de fallos
Se trata del nmero de fallos por unidad de tiempo que tiene lugar en una poblacin
de muchos elementos. Matemticamente se define como un lmite de la probabilidad
que un elemento falle en el intervalo de t a t+t, cuando sabemos que el elemento
estaba funcionando en el instante t, todo eso dividido por incremento de t y cuando
este incremento tiende a cero. La expresin que resulta es:

-152-

6. Principales Distribuciones Continuas

La funcin R(t) = P(T>t) es la probabilidad que el elemento est en


funcionamiento durante un tiempo t, y se define como la fiabilidad de dicho elemento.
La tasa de fallos h(t) viene a ser la velocidad de extincin de los elementos de
una poblacin. Si dibujamos la funcin h(t) tomando como abscisas el tiempo, la
forma es como se ve en la Figura 6. 4.

h(t)=

Tasa de fallos
(funcin de azar)

precoces

accidentales

fatiga

t=tiempo
Figura 6. 4. Tasa de fallos

A esta curva se llama curva en baera. En ella se distinguen claramente tres zonas:
1. Zona A, de fallos precoces o infantiles. Es la etapa de fallos en garanta. Al
principio hay muchos elementos que fallan y poco a poco va decreciendo la
velocidad de fallos.
2. Zona B, de fallos accidentales. Los fallos en esta etapa son accidentales o
debidos al azar. Es la etapa de madurez o periodo de vida til y la tasa de
fallos h(t) es constante en el tiempo.
3. Zona C, de fallos por envejecimiento. A partir de una determinada edad
aparecen fallos por desgaste o envejecimiento de los elementos.
La distribucin exponencial es representativa de los fallos accidentales, donde h(t)
es constante. As, para la distribucin exponencial la tasa de fallo es:

-153-

6. Principales Distribuciones Discretas

Y es la constante de esa tasa de fallo, que expresa el nmero de fallos por


unidad de tiempo. Tener en cuenta que la media de la variable exponencial es
justamente la inversa de esa tasa de fallos.
En las otras dos zonas, la tasa de fallo se puede aproximar por medio de una
ecuacin lineal de la forma
h(t)=(t)-1
De manera que:

Si = 1, h(t) = y se trata de la distribucin exponencial.


Si > 1, h(t) es creciente y es representativo de la zona por
envejecimiento. La distribucin que sigue los tiempos de fallo es una
Weibull.
Si <1, h(t) es decreciente y es representativo de la zona infantil. La
distribucin del tiempo de fallo es tambin una Weibull.

La tasa de fallo tiene mucha importancia en la Ingeniera de Fiabilidad y del


Mantenimiento

6.3.

DISTRIBUCIN NORMAL UNIDIMENSIONAL

La distribucin ms importante, tanto por aspectos tericos como prcticos, es la


distribucin normal, la ms empleada y la que modeliza el mayor nmero de
comportamientos de la vida real.
La primera vez que se emple la distribucin normal fue durante el siglo XVIII
en la observacin de los errores de medicin, de forma que sus valores se ajustaban
bastante bien a una curva en forma de campana. La primera vez que se utiliz esta
distribucin fue debido a Moivre en 1733, para demostrar la aproximacin de la
binomial a la distribucin normal. Esta distribucin fue conocida tambin por Laplace
hacia el ao 1775, para demostrar que la suma de los efectos de muchas variables
cada una con poca importancia en relacin a las dems, era una distribucin normal.
No obstante debido a un error histrico, se atribuy a Gauss, cuya primera referencia
apareci en 1809, y por ello tambin se le da el nombre de "campana de Gauss" o
distribucin Gaussiana.
En un principio se pensaba que todas las distribuciones seguan una campana
de Gauss, de ah su nombre de "normal" o "estndar" para referirse a ella, ya que era
lo normal es que apareciera.

-154-

6. Principales Distribuciones Continuas

6.3.1. Variable normal tipificada


Aquella variable continua, con campo de existencia en toda la recta real, y con
funcin de densidad

f(x) =

1
2

e 2 x para - < x < +


2

se denomina variable "normal tipificada", y se representa por X N(0;1) .


f(x) es una funcin de densidad, ya que f(x) 0 y se demuestra que su
integral para todo el campo de existencia vale la unidad. La forma de la funcin f(x)
aparece en la Figura 6. 5.

fZ(z)

-3

-2

-1

Figura 6. 5. Funcin de densidad de la normal N(0;1)

El rea que hay bajo la curva f(x), la cual tiene forma de campana, y la recta
real vale la unidad.
+

f(x)dx = 1

Del estudio de la curva f(x) se deducen las siguientes propiedades:


1) Asntotas.

2) Simtrica respecto a x=0.


-155-

6. Principales Distribuciones Discretas

f(x) = f(-x)
3) Tiene un mximo en el punto x=0.
4) Para x < 0 es creciente y para x > 0 es decreciente.
5) En x = -1 y x = +1 hay puntos de inflexin, y es cncava para | x |> 1 , y convexa
en aquellos puntos en que | x |< 1 .
Todas estas propiedades corroboran la forma de campana que tiene la
funcin de densidad.
La media es y la varianza son:
E(X)= 1 = 0

de ah la notacin de N(0;1) para caracterizar a la distribucin, donde 0 corresponde


a la media, y 1 a la desviacin tpica.
Una de las caractersticas de la distribucin Normal es que la distribucin de
probabilidades es siempre la de la figura 6.6

6826%
9544%
9973%

-3

-2

-1

+1

+2 +3

Figura 6.6. reas bajo la campana de Gauss

La funcin de distribucin de la N(0;1) es


x

F(x) =

1 - 1 x2
e 2 dx
2

y para cada valor de x se obtiene un valor. Como la integral no es inmediata, se ha


tabulado su valor para cada punto x, de esta manera tenemos las reas a la izquierda
para cada punto, segn la Figura 6..
-156-

6. Principales Distribuciones Continuas

fZ(z)

FZ(z)

-3

-2

-1

Figura 6.7. Funcin de distribucin de la normal N(0;1)

Los valores de la normal tipificada o estndar, tambin se representan por z, y


mediante el smbolo z expresamos aquel valor de la abscisa que tiene a su derecha
una probabilidad , segn la Figura 6. 6

fZ(z)

-3

-2

-1

1 z

Figura 6. 6. rea a la derecha de un valor de la normal N(0;1)

De la Figura 6. 5 se deduce que


+

f(x)dx =

f(x)dx = 1 -

Actividad 6.3:
Calcular las siguientes probabilidades de una normal tipificada:
o P(Z<1)
-157-

6. Principales Distribuciones Discretas

o
o
o

P(Z>2)
P(-1<Z<+1)
P(-1.25<Z<2.37)

Calcular los siguientes valores de la normal tipificada:


o P(Z<a)=0.60
o P(Z>a)=0.35
o P(-a<Z<+a)=0.95
o Z0.05
o

Z0.90

6.3.2. Variable normal general


Dada la v.a. normal tipificada X N(0;1) , si aplicamos la transformacin lineal

Y = aX + b
resulta la distribucin normal general, cuyo campo de existencia es toda la recta real.
El valor medio de Y es,

E(Y) = E(a X + b) = a E(X) + b = a 0 + b = b = y


es decir, el coeficiente b coincide con la media de la distribucin.
La varianza de Y es
2
2
2
2
2
2
D (Y) = D (aX + b) = a D (X) = a .1 = Y

de donde "a" puede ser positivo o negativo, pero su mdulo coincide con la
desviacin tpica de y, as:
Y X
esto es
| a |=
La variable Y se representa por Y N(; ) , ya que conociendo y
conocemos todas sus caractersticas.
La funcin de densidad de Y es, a partir de la frmula del cambio de variable,

f y (y) = f x (x(y))

x=
-158-

dx
1
= f x (x(y))
dy
dy
dx

y-
| |

6. Principales Distribuciones Continuas

despejando x,

f y (y) =

1 (y - )2

e2

1 (y - )2
1
1
=
e 2 2
| a | 2

Se observa que esta funcin es simtrica respecto de , y tiene los puntos de


inflexin en .

La funcin de distribucin es:


y

F(y) =

1
2

1 y-
-

dy

Como para cada valor de y habra que tener una tablas con todas las
reas a la izquierda, lo que se hace es tipificar la variable y calcular el rea de la
normal tipificada. "Tipificar" o "estandarizar" una variable significa restar su valor
medio y dividirla por la desviacin tpica. As,

Y - a -
P(Y a) = P



y la variable

Y-
tiene una distribucin N(0;1) , por lo tanto:

a-

a-
P(Y a) = P N(0;1)
=

y expresa el valor de Y que deja a su derecha un rea de .

Actividad 6.4:
De una variable aleatoria normal de media 15 y desviacin tpica 1.5, calcular
las siguientes probabilidades:
P(Y<16)
P(Y>12.5)
P(12<Y<17)

La combinacin lineal de un conjunto de variables normales e independientes, es a


-159-

6. Principales Distribuciones Discretas

su vez otra distribucin normal. Esto es, si X 1 , X 2 ,..., X n son v.a. normales

Xi N(i ; i) , e independientes,
Y = a1 X 1 + a2 X 2 + ....+ an X n
entonces Y sigue una distribucin normal con

y = a1 1 + a2 2 + ...+ an n
2 2
2 2
2 2
2
D (Y) = a1 1 + a2 2 + ....+ an n

6.3.3. Teorema central del lmite


Si Y es una suma de n variables aleatorias independientes que satisfacen ciertas
condiciones generales, entonces para n suficientemente grande, Y se distribuye
segn una v.a. normal.
Ms concretamente, el teorema central del lmite dice que si X 1 , X 2 ,... X n es
una secuencia de n v.a. independientes con E( X i ) = i y D2 ( X i ) = i , y

Y = X 1 + X 2 + ...+ X n , entonces la suma tipificada

Sn =

Y - i
n

2
i

i=1

converge a una distribucin normal N(0;1) .


Cada X i representa una aportacin a la suma Y, la cual es de pequea
importancia en relacin a las dems, pero la suma de muchos factores de pequea
importancia cada uno de ellos, da lugar a la distribucin normal.
Un caso particular del teorema central del lmite es cuando todas las variables
aleatorias son independientes y tienen la misma distribucin. Esta propiedad se
recoge como el Teorema de Lindenberg-Levy.
Dicho teorema dice que para una sucesin de variables aleatorias
independientes X 1 , X 2 ,..., X n , la suma tipificada converge a una distribucin normal
N(0;1).

-160-

6. Principales Distribuciones Continuas

De esta forma, si E(Xi)= y D2(Xi)=2, la media y la varianza de


Y=X1+X2++Xn es:

E(Y) = E[ X 1 + X 2 + ...+ X n ] = 1 + 2 + ...+ n


2
2
2
D (Y) = D ( X 1 + X 2 + ...+ X n ) = n

D(Y) = n
De aqu que:

Sn =

Y - n

converge a una N(0;1).

Aproximacin de la binomial a la normal


Hemos visto que la v.a. binomial se puede considerar como la suma de n variables
aleatorias dicotmicas D(p) cada una de ellas con igual distribucin. En
consecuencia, si n , entonces podemos aplicar el teorema de Lindenberg-Levy,
y la suma tipificada converge a una distribucin normal N(0;1).
De esta forma

Y B(n, p) Y = X 1 + X 2 + ....+ X n
2
X i D(p) E( X i ) = p D ( X i ) = pq

de donde E( Y ) np y D 2 ( Y ) npq por lo que

Sn =

Y - np
N(0;1)
npq

Ello equivale a decir que:

B(n, p) - - - - - - - - - - > N(np; npq )


La aproximacin a la normal es bastante buena cuando se dan las siguientes
condiciones:
1) n > 30 .
2) 0 ,1 p 0 ,9
3) n p 5

-161-

6. Principales Distribuciones Discretas

Distribucin Binomial
0,4

B(10,01)
B(40,02)

0,3

PX(x)
0,2
0,1
0

10
x

20

Figura 6. 7. Aproximacin de la Binomial a la Normal

Aproximacin de la Poisson a la normal


La distribucin de Poisson de parmetro , por su propiedad aditiva, se
puede considerar como la suma de variables independientes de parmetro "1", y
en consecuencia tambin podemos aplicar el teorema de Lindenberg-Levy. De este
modo:

Y PS( ) ; Y = X 1 + X 2 + ... X
2
X i PS(1) ; E( X i ) = 1 ; D ( X i ) = 1

cuando

Sn =

Y - 1
1

y-

N(0;1)

lo cual es equivalente a

PS( ) - - - - - - - - - -- > N( , )
La aproximacin es bastante buena a partir de > 5 .

-162-

6. Principales Distribuciones Continuas

Distribucin de Poisson
0,3
Ps(10)
Ps(2)

0,25
0,2

PX(x)

0,15
0,1
0,05
0
0

10

15

20

25

x
Figura 6. 8. Aproximacin de la Poisson a la Normal

Correccin por continuidad


Al aproximar la distribucin binomial o la de Poisson a una normal, estamos pasando
de una variable discreta a otra continua, y al calcular probabilidades se comete un
error que puede ser apreciable cuando np o bien estn entre 5 y 25. Cuando np o
bien son elevados, el error cometido no es muy importante.
Por ejemplo, supongamos que X sigue una distribucin de Poisson de
parmetro =8, y nos piden calcular la probabilidad P(X>10). Aplicando la distribucin
de Poisson,

e88c
1 0 ,8159 0 ,1841
c!
c 0
10

P( X 10 ) 1 P( X 10 ) 1

Mediante la aproximacin a la normal es,

10 8

P( X 10 ) P Z
P( Z 0 ,7071 ) 0 ,2398
8

La diferencia con el valor exacto de la Poisson es muy apreciable.


Grficamente es,

-163-

6. Principales Distribuciones Discretas

Histogram for X

16
Error sin la correccin por continuidad

rea exacta de 0,1841

12
frequency

10,5
8

0
9 10 11
X

Figura 6. 9. Correccin por continuidad

El error sera menor si al efectuar la aproximacin a la variable continua, en


lugar de calcular el rea a la derecha de 10, tomramos el rea a la derecha de 10,5,
y as el clculo es,

10,5 8
P( Z 0,8839) 0,1884
P( X 10) P( X 10,5) P Z
8

Y esto es mucho mejor aproximacin al valor exacto de 0,1841 que sin hacer
esta correccin por continuidad.
De esta forma, si el rea pedida hubiera sido,

P(a X b)
Al pasar a una variable continua, y teniendo en cuenta que las desigualdades
puede ser estrictas o no, para el caso anterior la correccin por continuidad es,

P(a 0,5 X b 0,5)


Grficamente es,

-164-

6. Principales Distribuciones Continuas

P(a<X<b)

10

11

P(X=10)

9,5 10,5
Figura 6. 10. Correccin por continuidad

6.4.

LA DISTRIBUCIN NORMAL BIDIMENSIONAL

y la funcin de densidad conjunta de la

Para una variable aleatoria n-dimensional


normal general es:

f(y) =

1

- (y - ) V -1(y - )

e2
n
1/2
2 | det V |

y en el caso de dos dimensiones, el vector de medias es:

1 = E( y1 ) = b1
2 = E( y 2 ) = b2
y la matriz V de varianzas-covarianzas es:

11 12
V=

12 22
Calculando la inversa de V y el determinante de V , la funcin de densidad
bidimensional es:

f( y1 , y 2 ) =

1
2 1 2 1 - 2

y - 2
y - y - y -
1

1 1 - 2 1 1 2 2 + 2 2



2
2(1- ) 1
1 2 2

-165-

6. Principales Distribuciones Discretas

Si = 0 la funcin de densidad conjunta se puede expresar como producto


de funciones de densidad marginales y de ah que y1 e y 2 sean independientes. Esta
implicacin solamente se cumple para las variables normales.
Lo anterior equivale a decir que si la matriz de varianzas-covarianzas tiene
todos sus elementos nulos excepto en la diagonal, todas las marginales son
independientes entre si.

f(y1,y2)

y2

y1
Figura 6. 11. Distribucin normal bidimensional

Distribuciones marginales
Las distribuciones marginales siguen otra distribucin normal, es decir,

Y 1 N( 1 ; 1 ) e Y 2 N( 2 , 2 )
Hay que pensar que la proyeccin de la campana de Gauss sobre cualquiera
de los planos de Y 1 Y 2 define otra campana de Gauss.

Distribuciones condicionales
Dada la campana de Gauss en tres dimensiones, si efectuamos un corte infinitesimal,
la forma que tiene la distribucin de masas es otra campana de Gauss. La funcin de
densidad condicional de Y 2 sabiendo un valor de y1 es:
-166-

6. Principales Distribuciones Continuas

f c ( y 2 / y1 ) =

f( y 2 , y1 )
f( y1 )

que efectuando las correspondientes operaciones y agrupando trminos es:

f c ( y 2 / y1 ) =

1
2
2 1-

2
y 2 - 2 + ( y1 - 1 )
1
1


exp -

2
2
2
2 1-

En consecuencia, la distribucin condicional es otra normal,

2 ( y - );
2
Y 2 / y1 N 2 +
1 1 2 1 -

Lgicamente si = 0 queda la distribucin marginal de y 2 .


Lo mismo se puede decir de la distribucin condicional de Y 1 dado un valor
de y 2 :

1
2
Y 1 / y 2 N 1 + ( y 2 - 2 ); 1 1 -
2

sin ms que intercambiar los ndices.


Todas las distribuciones condicionales tienen la misma desviacin tpica al no
depender sta del valor y condicionante.

-167-

6. Principales Distribuciones Discretas

f(y1,y2)

y2

y1

Figura 6. 12. Distribucin normal bidimensional con correlacin de 0.6

f(y2 / y1)

y2

E(Y2 / y1)
y1
Figura 6.12. Distribucin condicional de Y2 dado y1.

-168-

6. Principales Distribuciones Continuas

f(y1 / y2)

y2

E(y1/ y2)

y1
Figura 6.13. Distribucin condicional de Y1 dado y2

6.5. PROBLEMAS PROPUESTOS

Distribucin uniforme
6.5.1.
Se ha desarrollado un programa de simulacin para una determinada
investigacin que tarda en ejecutarse entre 10 y 30 segundos, siguiendo una
distribucin uniforme. Qu nmero mximo de simulaciones se pueden hacer
para que la probabilidad de tardar ms de 45 minutos sea inferior a 1.5% ?
Solucin: 127

6.5.2.
La venta diaria de una fbrica de montaje de ordenadores se adapta a
una distribucin uniforme entre 20 y 40 unidades.
a) Despus de transcurridos 182 das de venta, cul es la probabilidad de
haber vendido ms de 5.600 ordenadores, suponiendo las ventas
independientes de un da para otro?.
b) Cuntos das de venta debemos considerar para asegurar, con un 67% de
probabilidad, la venta de ms de 6.000 unidades?
Solucin: a) 0.036

b) ms de 202 das

6.5.3.
El tiempo que tarda un programa en ejecutar un determinado
procedimiento sigue un modelo uniforme de 0 a 12 milisegundos. Calcula:

-169-

6. Principales Distribuciones Discretas

a) La proporcin de ejecuciones superiores a 5 milisegundos.


b) Aplicando la funcin de densidad, el primer y tercer cuartil.
Solucin: a) 0.5833

b) 3 y 9

Distribucin exponencial
6.5.4.
La distribucin exponencial se utiliza a menudo para modelizar la
duracin de un sistema. En este caso, la variable X indica el tiempo que funciona
el sistema antes de fallar. Si la duracin de un sistema, en aos, sigue una
distribucin exponencial de media E(X)=6 meses:
a) cul ser la funcin de densidad de la variable aleatoria X?
b) Y la desviacin tpica?
c) cul ser la probabilidad de que el sistema funcione por lo menos durante 1
ao?
Solucin: b) =1/2 c) 0.1353

6.5.5.
Si el tiempo de vida de una mquina sigue una distribucin exponencial,
siendo el tiempo medio entre fallos (MTBF) de 200 horas Cual es la
probabilidad de que transcurran ms de 200 horas sin que se produzca una
avera?
Solucin: 0'37

6.5.6.
Se ha comprobado que la vida de un diseo de un sistema informtico
sigue una distribucin exponencial con media de 8 aos (sin que se modifique
substancialmente el diseo). Se pide:
a) Calcular la probabilidad de que un diseo tenga una vida entre 3 y 12 aos.
b) La probabilidad de que un diseo que ha vivido sin modificarse ms de 10
aos, perdure 15 aos ms.
Solucin: a) 0,47 b) 0,15335

6.5.7.
Una empresa de fabricacin de carcasas de ordenador, tiene tres plantas
de proceso, y todas reciben planchas de metal para cortar y confeccionar las
carcasas (en kg.). La cantidad de Kg. de plancha de metal que puede procesar
una planta en un da se puede representar mediante una funcin exponencial
con un promedio de 4 (en miles de Kg.), para cada una de las tres plantas. Si las
plantas trabajan de forma independiente, calcular la probabilidad de que sean
exactamente dos de las tres plantas las que procesen ms de 4 (miles de Kg.) en
-170-

6. Principales Distribuciones Continuas

un da determinado.
Solucin: 0.26

6.5.8.
La duracin X de unos componentes electrnicos flucta aleatoriamente,
verificndose que Prob(X>x)= e-x. Se sabe que las componentes duran en
promedio 400 horas de funcionamiento. Qu porcentajes de las componentes
duran ms de 400 horas?
Solucin: 0.37

6.5.9.
La probabilidad de que la vida de unos componentes electrnicos sea
superior a t, decrece exponencialmente a medida que aumenta dicho parmetro,
fluctuando aleatoriamente, verificndose que P( V > t )=e -t. Se sabe que en el
50% de los casos la vida no sobrepasa 100 horas de funcionamiento.
Calcular la probabilidad de que con dos componentes, la vida del conjunto
sobrepase 100 horas:
a) Situados en paralelo.
b) Situados en serie.
Solucin: a) 0.75

b) 0.25

6.5.10.
En el servicio tcnico de mantenimiento y reparacin de una compaa
de ordenadores, el tiempo en horas que transcurre entre dos avisos consecutivos
de avera sigue una distribucin exponencial con media de un cuarto de hora, en
cualquier momento del da. Se pide :
a) Probabilidad de que si a las diez y media se recibe una llamada de aviso, la
prxima se reciba despus de las 11h.
b) Cul es el nmero mximo de avisos que se recibirn entre las once y media
y las trece horas con una probabilidad del 98%?
Solucin: a) 0,1353

b) Aprox. 11 avisos.

6.5.11.
El personal de una empresa de ingeniera usa un terminal para realizar
clculos tcnicos. El tiempo que cada tcnico emplea en una sesin es en
promedio 20 minutos. (Asumiendo que dicho tiempo sigue una distribucin
exponencial con f ( x ) ex ;x>0).
a) Calcular la probabilidad de que un tcnico emplee menos de 20 minutos en su
sesin.
-171-

6. Principales Distribuciones Discretas

b) Cuando un tcnico va a usar el terminal, encuentra que est ocupado por otro
que lleva ya media hora. Cul es la probabilidad de que tenga que esperar
ms de 10 minutos antes de que quede libre?
c) Sabiendo que una maana deben realizarse 10 sesiones en el terminal (cada
una de las cuales empieza nada ms terminar la anterior), calcular
aproximadamente la probabilidad de que todas ellas puedan finalizarse a lo
largo de las 4 horas de la jornada de la maana.
Solucin: a) 0.6321 b) P(X>10) c) 0.7364

6.5.12.
Un dispositivo est formado por dos componentes electrnicos iguales A
y B montados en serie. La duracin en horas de funcionamiento de dichos
componentes flucta aleatoriamente siguiendo una distribucin exponencial de
parmetro z. Si por motivos de seguridad es necesario que el dispositivo tenga
una fiabilidad del 99.4% a las t horas de funcionamiento, qu fiabilidad se
requiere a las t horas para cada uno de los dos componentes?
Solucin: 0.997

6.5.13.
La duracin de un determinado componente electrnico sigue una
distribucin exponencial de media 1000 horas. Un componente de este tipo lleva
funcionando 300 horas. Cul es la probabilidad de que siga funcionando
durante ms de 700 horas adicionales?
Solucin: 0.496

Distribucin Normal
6.5.14.
a)
b)
c)
d)
e)

Si Z es una variable aleatoria N(0,1), hallar:


P(Z 1.85)
P(Z -1.85)
P(1 Z 1.85)
P(-1.85 Z -1)
P(-1 Z 1.85)

Solucin: a) 0.9678 b) 0.0322 c) 0.1265 d) 0.1265 e) 0.8091

6.5.15.

Sea X una variable N(5,2). Calcular:

a) P(1 X 8)
-172-

6. Principales Distribuciones Continuas

b) P(X 1)
c) P(X -1)
Solucin: a) 0.9104 b) 0.0228 c) 0.00135.

6.5.16.
Los lmites medios de tolerancia de un interruptor son 400,5 amperios.
Si un interruptor se dispara a una intensidad menor de 39,5 o mayor de 40,5 se
considera defectuoso. Si los puntos de ruptura de los interruptores de una partida
se distribuyen normalmente con media 39,5 y desviacin tpica 0,2, cul ser el
porcentaje de interruptores defectuosos en esa partida?
Solucin: 0,5

6.5.17.
En la produccin de piezas para un motor de combustin interna, los
pesos presentan bastante dispersin. Una dispersin demasiado grande
provoca un mal funcionamiento. Supongamos que un fabricante concreto desea
rechazar el 3% de los cojinetes de menor peso y el 3% de los cojinetes de mayor
peso. Si el peso medio es 4,72 Kg, la desviacin tpica es 0,006 kg y la
distribucin de los pesos es normal, determinar el peso mximo y el peso mnimo
para que una pieza sea aceptada.
Solucin: 4.7087 y 4.7313

6.5.18.
Se admite que los pesos, expresados en kilogramos, de los jvenes
varones de un cierto grupo, se distribuyen segn una ley normal N(69, 6). Se
desea poder afirmar que la probabilidad de que el peso X de un joven, tomado al
azar de ese grupo, sea mayor que una cantidad L es 0.9. Calcular L.
Solucin: 61.29

6.5.19.
Los coeficientes intelectuales de los alumnos de un colegio siguen la ley
normal y se sabe que P(X>1.4)=0.1056 y P(X>1)=0.4013. Calcular los
parmetros de la distribucin.
Solucin: N=0.9 a=0.4

6.5.20.
Dada una variable aleatoria normal X tal que P(X15)=0.1 y
P(X20)=0.95, calcular:
a) P(X13)
b) un valor a tal que P(Xa)=0.05
c) un valor b tal que P(X>b)=0.5.
-173-

6. Principales Distribuciones Discretas

Solucin: a)0.00695 b)14.39 c)17.19

6.5.21.
La seal recibida por la pantalla de un ordenador se considera apta si la
desviacin del voltaje observado respecto del terico no es mayor de 10 voltios.
Las desviaciones observadas obedecen a una ley normal de media 0 y
desviacin tpica 5. Calcular que porcentaje de seales recibidas por la pantalla
se consideran aptas.
Solucin: 97,7%

6.5.22.
En un sistema binario, la informacin se representa mediante seales
elctricas (por ejemplo voltaje). Un voltaje representa el bit 0 y otro el bit 1.
Supongamos que deseamos representar los bits 0 y 1 por los voltajes 2 y 3
respectivamente. Debido a las fluctuaciones del voltaje en un circuito, la terminal
de entrada de un circuito digital no siempre recibe el voltaje destinado ya que es
frecuentemente distorsionada debido a ruidos en el canal. Muy a menudo, el
ruido se modela como una variable aleatoria distribuida normalmente y se
denomina ruido Gaussiano. Si el ruido es Gaussiano con media N=0 y desviacin
tpica a=0,22, y la terminal de entrada reconoce el bit 0 si el voltaje recibido es
menor de 2,6 y el bit 1 si el voltaje recibido es mayor o igual que 2,6, calcular la
probabilidad de que el receptor reconozca:
a) un 1 cuando se ha transmitido un 0
b) un 0 cuando se ha transmitido un 1.
Solucin: 0.0032 0.0344
6.5.23.
El tiempo medio de CPU necesario para la ejecucin de una clase de
programas en un ordenador central es 2,52 minutos y la desviacin tpica es 0,37
minutos. Si el tiempo de ejecucin se distribuye normalmente, Cul es la
probabilidad de que un programa seleccionado aleatoriamente requiera entre 2
y 4 minutos de CPU? cul es la probabilidad de que la diferencia en valor
absoluto entre el tiempo de ejecucin y la media sea menor o igual que 1
minuto?
Solucin: 0.92 0.9931

6.5.24.
El nivel de decibelios de un escape averiado sigue una distribucin
normal con media 90.4 decibelios y varianza 5.8 decibelios2 . Si se toma el valor
medio de dos medidas, en lugar de una medida nica cul ser su distribucin?
qu sucede a la varianza cuando se promedian dos medidas, en lugar de tomar
una nica?.
Solucin: N(90'4,1'70)

-174-

6. Principales Distribuciones Continuas

6.5.25.
Un ingeniero de proyectos que est colaborando en el diseo de una
refinera petroqumica. Se deben realizar cuatro actividades secuencialmente y
sin solapamiento. Las duraciones de las actividades se supone que son
variable aleatoria independientes normalmente distribuidas:
ACTIVIDAD

MEDIA

DESVIACIN TPICA

50 das

5 das

20 das

3 das

70 das

10 das

40 das

4 das

Cul es la probabilidad de que el tiempo total necesario para que se elaboren


las cuatro actividades no supere los 200 das?
Solucin: 0'9485

6.5.26.
Los dimetros de los ejes fabricados para una determinada aplicacin
estn distribuidos normalmente con una media de 3'810 cm y una desviacin
tpica de 0'051. Las arandelas de los ejes tienen dimetros interiores que estn
normalmente distribuidos con una media de 3'942 cm y una desviacin tpica de
0'025. Dados un eje y una arandela seleccionados al azar, cul es la
probabilidad de que el eje no entre en la arandela?
Solucin: 0'0102

6.5.27.
El peso neto de un paquete es una variable aleatoria N(20,2) y el del
envase es una variable aleatoria N(1, 0'2). Colocamos 13 de estos paquetes
sobre un soporte de madera que pesa 50 Kg. Cul es la probabilidad de que al
ponerlos en un montacargas cuya carga lmite es de 300 Kg. este no arranque?
Solucin: 0'9990.

6.5.28.
Los dimetros de los tornillos de una caja, medidos en cm siguen una
distribucin N(2,0'03) y los dimetros interiores de las tuercas de otra caja siguen
una distribucin N(2'02, 0'04). Un tornillo y una tuerca ajustarn si el dimetro
interior de la tuerca es mayor que el dimetro del tornillo y la diferencia entre
estos dimetros no es mayor de 0'05 cm. Si se seleccionan al azar un tornillo y
una tuerca cul es la probabilidad de que ajusten?
Solucin: 0'3811

6.5.29.

En un examen de selectividad, los estudiantes del colegio A alcanzan


-175-

6. Principales Distribuciones Discretas

calificaciones que se distribuyen N(625,10) y los del colegio B alcanzan


calificaciones que se distribuyen N(600,12'25). Si 2 estudiantes del colegio A y 3
del colegio B hacen este examen cul es la probabilidad de que el promedio de
las dos calificaciones de los estudiantes del colegio A sea mayor que el promedio
de los 3 estudiantes del colegio B?
Solucin: 09938

6.5.30.
La dimensin principal de cierta pieza producida en una fbrica se
distribuye normalmente con media 150 y varianza 0,16. Se sabe que las piezas
son aceptables si la longitud se halla comprendida entre 149.2 y 150.4. Calcular
la probabilidad de que al menos el 90% de las piezas de un lote sean correctas:
a) En el caso de que el tamao del lote sea 10.
b) En el caso de que sea 100.
Solucin: a) 0.4342 b) 0.0239 (0.0178 sin aplicar la correccin por continuidad)

6.5.31.
La resistencia elctrica de las lmparas fabricadas segn un determinado
proceso, se distribuye normalmente con =2.000 y =200. Dichas lmparas se
empaquetan en lotes de 100 unidades. Una lmpara se considera defectuosa si
su resistencia es inferior a 1900 y un lote se considera de baja calidad si 20 o
ms lmparas son defectuosas. Calcular la probabilidad p de que un lote sea
defectuoso.
Solucin: 0'993
6.5.32.
Si el tiempo de vida de un componente elctrico sigue una distribucin
exponencial, siendo el tiempo medio entre fallos es de 100 horas. Calcular la
probabilidad de que transcurran ms de 200 horas sin averas.
a) 03679
b) 01353
c) 06065
d) 00183

6.5.33.
Una mquina fabrica piezas cuya longitud sigue una distribucin Normal.
La probabilidad de que una pieza tenga una longitud mayor que 10 cm es del
668%, y la probabilidad de que sea menor que 5 cm es del 1587%. Si una pieza
se considera correcta cuando su longitud se encuentra entre 3 y 12 cm. Calcular
el porcentaje de piezas defectuosas fabricadas por la mquina.
a) 00290
b) 01919
c) 00668
-176-

6. Principales Distribuciones Continuas

d) 01857

6.5.34.
El peso en vaco de una bombona de butano sigue una distribucin
normal de media 6 Kg y desviacin tpica 1 Kg. El peso del gas es una variable
normal e independiente de la anterior de media 13 Kg y desviacin tpica 15 Kg.
Si el butanero pesa 8694 Kg y el montacargas no soporta ms de 100 Kg.
Calcular la probabilidad de que el montacargas suba.
a) 00005
b) 00040
c) 00322
d) 00427

6.5.35.
HIJOS DE ILUMINADA S.A. es una empresa que se dedica a producir
bombillas. En una de sus lneas se fabrican bombillas de 40 Vatios y se
introducen en paquetes de 40 bombillas. El filamento de las mismas tiene una
resistencia con distribucin NORMAL N(605,1.18) ohmios, y una bombilla se
considera correcta cuando su resistencia esta situada entre los valores 607.86
y 600.96.Cul es la probabilidad de que elegido un paquete (de 40 bombillas)
al azar, contenga 2 ms bombillas defectuosas (por la resistencia)?
a)
b)
c)
d)

0.81142
0.00849
0.18858
0.04084

6.5.36.
Disponemos de un montacargas que soporta 100 Kg, y queremos
utilizarlo para que, en un 95% de las veces, pueda subir 3 paquetes de cemento.
Para su traslado, los paquetes son colocados sobre un palet de madera. El peso
individual de cada paquete tiene una distribucin normal N(20,0.5)Kg. Cul
debe ser el peso mximo del palet?
a)
b)
c)
d)

37.53
36.51
38.57
29.53

6.5.37.
Una determinada mquina fabrica lminas de acero cuyo espesor sigue
una distribucin normal N(0.1, 0.005) cm. La mquina se considera que funciona
mal, y por tanto se debe revisar, si al tomar una muestra, el espesor promedio de
las lminas es superior a 0.1041cm. Calcular el nmero de piezas que
deberemos tomar para que, cuando la mquina funcione bien, slo tengamos
que revisarla en un 5% de las veces.
a)

9
-177-

6. Principales Distribuciones Discretas

b)
c)
d)

6
4
8

6.5.38.
La media de una variable aleatoria normal que modeliza el tiempo de
ejecucin de un determinado algoritmo es de 5 veces la desviacin tpica. Se
cumple adems que P(X6)=0.84134. Calcular la media y la desviacin tpica.
Solucin: 5 y 1

6.5.39.
El tiempo de transmisin va modem de un fichero con una gran cantidad
de informacin, que se realiza semanalmente en una empresa (45 veces al ao),
se distribuye normalmente con una media de 168 seg. y una desviacin tpica de
5 seg. Calcular:
a) El nmero de veces con un tiempo de transmisin entre 165 y 175 seg.
b) El nmero de veces con un tiempo de transmisin mayor que 180 seg.
Solucin: a) 29 b) 0.369

6.5.40.
En un multiplexor de gran potencia, se pueden establecer 4600
conexiones por minuto. El nmero de conexiones por minuto se ha podido
estudiar, que es una variable aleatoria que sigue una distribucin de Poisson de
valor =4489. Calcular la probabilidad de que en un minuto el multiplexor est
saturado de llamadas.
Solucin: 0.0480

6.5.41.
Una empresa de fabricacin de mesas de ordenador, posee dos plantas
de produccin (A y B), en la planta A, la altura de las mesas fluctan con media
75 cm. y =1.2 cm, y en la planta B, la altura de las mesas fluctan con media 77
cm. y =0.9 cm. Suponiendo que ambas variables se distribuyen normalmente,
determinar la probabilidad de que al seleccionar al azar una mesa de la planta A
y otra de la planta B, resulte la mesa de la planta A mas alta que la de la planta
B.
Solucin: 0.0918

6.5.42.
La dimensin de un determinado componente electrnico (para
incorporarlo en la placa base) fabricada por una determinada firma, exige que
est comprendida entre 149.2 mm y 150.4 mm (fuera de estos limites hay
problemas). Se comienza a trabajar con un proveedor cuya dimensin de la
componente se distribuye normalmente con media 150 mm y varianza 0.16 mm.
-178-

6. Principales Distribuciones Continuas

Calcular la probabilidad de que al menos el 90% de los componentes de un lote


sean correctas:
a) Si el tamao del lote es 10.
b) Si el tamao del lote es 100.
Solucin: a) 0.434 b) 0.0236

6.5.43.
El tiempo medio de CPU necesario para la ejecucin de una clase de
programas en un ordenador central es 2.52 minutos y la desviacin tpica es 0.37
minutos. Si el tiempo de ejecucin se distribuye normalmente.
a) Determinar la probabilidad de que un programa seleccionado aleatoriamente
requiera entre 2 y 4 minutos de CPU.
b) Calcular la probabilidad de que la diferencia en valor absoluto entre el tiempo
de ejecucin y la media sea menor o igual que 1 minuto.
Solucin: a) 0.92 b) 0.9931
6.5.44.
La variable X se distribuye normalmente con media 200. Se sabe que la
probabilidad de que X sea superior a 250 es 0.2. Calcular cuntos valores
independientes de X deben observarse para tener una probabilidad mayor que
0.5 de que el mayor de ellos sea superior a 300.
Solucin: 15 (clave: P(xmax>300)=1-P(Todos<300))

6.5.45.
Unas 180 personas matriculadas en la universidad estn en una cola
para pagar las matrculas de los cursos; el importe no es el mismo en cada caso
pero se estima una media por persona de 85.000 ptas. y una desviacin de
12.300 ptas. Qu probabilidad hay de que el cajero haya recibido en total ms
de 15 millones de ptas.?
Solucin: 0.9656

6.5.46.
Se calcula que durante el prximo mes de enero las ventas de una
empresa de ordenadores bajarn entre 350 y 610 millones de ptas., con una
probabilidad del 80%, siendo la cifra ms probable de disminucin de ventas los
480 millones de pts. cul es la probabilidad de que las ventas disminuyan
menos de 500 millones de pts. aceptando un modelo de distribucin
aproximadamente normal?
Solucin: 0.5792

6.5.47.

Se ha advertido que el nmero de errores al escribir por primera vez un


-179-

6. Principales Distribuciones Discretas

programa sigue una distribucin de Poisson de media 0.8 errores por pgina del
listado. Calcula la probabilidad de que:
a) Haya algn error en una pgina.
b) En un procedimiento de diez pginas haya ms de diez errores.
c) En las 500 pginas de que consta el programa haya menos de 350 errores.
Solucin: a) 0.55067 b) 0.18411 c) 0.005868

6.5.48.
Se ha calculado, de acuerdo con experiencias anteriores, que dos de
cada cinco alumnos matriculados en una determinada asignatura, no acudirn a
realizar el examen. Teniendo en cuenta que los alumnos son convocados en
distintas aulas de examen, a cuntos debe convocarse en un aula, con
capacidad para 120 personas, para poder asegurar espacio para todos los que
se presenten, con una probabilidad de 0.975?
Solucin: 180 alumnos

6.5.49.
La resistencia de un montacargas de una fbrica es de 10 Tm.; en el
mismo se cargan paquetes de peso aleatorio distribuido uniformemente entre 40
y 60 Kg. Determinar el nmero mximo de paquetes que pueden cargarse
manteniendo la probabilidad de rebasar la carga crtica inferior al 1 por mil.
Solucin: 195 paquetes.
6.5.50.
El nmero de placas base correctas que se elaboran en una fbrica de
componentes de ordenador cuadruplica al de placas defectuosas. Se pide:
a) La probabilidad de que de 200 placas producidas en un da ms de 40 y
menos de 70 sean defectuosas.
b) Las placas que deben producirse en un da para, con un 90% de probabilidad,
asegurar ms de 100 placas correctas con el fin de satisfacer la demanda.
Solucin: a) 0.464 b) 133 piezas

6.5.51.
El peso de las naranjas que llegan a una envasadora se distribuye
normalmente con media 150 gr. y desviacin tpica 30 gr. Calcular el nmero
mnimo de naranjas que es necesario introducir en una bolsa para que la
probabilidad de que sta pese menos de 5 Kg. sea inferior al 1%.
Solucin: 37 naranjas

6.5.52.

En una poblacin normal de media 20 y desviacin tpica 4, a qu


-180-

6. Principales Distribuciones Continuas

distancia de la media se encuentra?:


a) el segundo cuartil.
b) el tercer cuartil.
c) el valor que dista 1.5 veces el Intervalo intercuartlico por encima del tercer
cuartil.
Solucin: a) 0 b) 2.7 c) 30.8

6.5.53.
Un fabricante exige a sus proveedores de placas de montaje que un
determinado orificio de las mismas tenga un dimetro comprendido entre 96 y
102 micras, debiendo desecharse las que no verifiquen esta condicin.
Si un proveedor sabe que las placas que produce son de una calidad tal, que el
10% de ellas tienen el orificio con un dimetro mayor de 100 micras y que el 5%
de las placas lo tienen inferior a 97 micras, y suponiendo que dicho dimetro se
distribuye normalmente, determinar el porcentaje de placas que deben ser
desechadas por el proveedor. Qu debera hacer ste para disminuir dicho
porcentaje?.
Solucin: 0.6%

6.5.54.
Un determinado microprocesador tiene una probabilidad de error de
clculo de una entre un milln. Para un determinado proceso se realizan
4.800.000 operaciones y el efecto de cada error es restar una dcima de unidad
de su valor correcto. Cul es la probabilidad de que el nmero obtenido sea
exactamente una unidad por debajo del valor real?
Solucin: 0.015

6.5.55.
Por un punto de una carretera pasa en promedio un coche cada 20
segundos en un sentido y un coche cada 15 segundos en el sentido contrario.
a) Qu tiempo transcurrir en promedio entre el paso por el punto de dos
coches consecutivos, sea cual sea el sentido en el que circulen? (Indicar con
precisin las hiptesis realizadas para responder a esta cuestin.)
b) t segundos despus del paso de un coche llega por un lateral a dicho punto
un peatn que desea cruzar. Cmo se distribuir la variable aleatoria "tiempo
desde que llega hasta que pasa un coche"? Justificar la respuesta.
c) Si el peatn necesita disponer de 10 segundos sin que pase ningn vehculo
para poder cruzar cul es la probabilidad de que pueda cruzar nada ms
llegar sin tener que esperar?
Solucin: a) 8.6 seg c) 0.31
-181-

6. Principales Distribuciones Discretas

6.5.56.
Una industria dispone de dos envasadoras de un producto qumico. La
primera dosifica el 75% de la produccin y la segunda el resto. Se sabe que el
peso de producto por envase es una variable N(170,7) en la primera envasadora
y N(176,7) en la segunda. Se consideran como incorrectos aquellos paquetes
cuyo contenido neto es superior a 180 gr. Se pide:
a) Calcular la probabilidad que tiene cada envasadora de producir una paquete
incorrecto
b) Si se elige un paquete al azar y resulta ser incorrecto, hallar la probabilidad de
que haya sido envasado por la segunda mquina
c) Si se eligen 5 paquetes al azar, calcular la probabilidad de que 2 de ellos
hayan sido envasados por la 1 mquina.
Solucin: a) 0.0764 y 0.2843 b) 0.55 c) 0.0330

Distribuciones bidimensionales

6.5.57.
Un sistema electrnico contiene cuatro componentes. Sea Xj el tiempo
transcurrido hasta que falla la componente j (j=1,2,3,4). Suponemos que X 1,X2,X3
y X4 son variable aleatoria independientes y cada una de ellas tiene como
funcin de distribucin F. El sistema funciona mientras funcione el componente 1
y al menos uno de los otros tres componentes. Determinar la funcin de
distribucin de la variable aleatoria X que indica el tiempo de duracin del
sistema.
Solucin: FX(t)=1-(1-F(t))(1-F(t)3) t>0

6.5.58.
Dos sistemas de ignicin son utilizados en un satlite, como un
dispositivo redundante para ayudar a garantizar la ignicin. Si ambos sistemas
poseen tiempos de supervivencia distribuidos exponencialmente, el primero con
una media de 3 aos y el segundo con una media de 4 aos, cul es la
probabilidad de que al menos uno sobreviva 2 aos?.
Solucin: 0'8086.

6.5.59.
Sea X la temperatura en F e Y la cantidad de lluvia en pulgadas/acre de
una ciudad seleccionada aleatoriamente. Se sabe que:
Cov(X,Y)=8'12

Var(X)=78'24

-182-

Var(Y)=2'17

6. Principales Distribuciones Continuas

Calcular el coeficiente de correlacin existente entre estas dos variables, qu


conclusiones se pueden obtener?
Si hubiramos medido la temperatura en grados Celsius y la lluvia en litros/m2,
sera diferente el valor de la covarianza? y el valor del coeficiente de
correlacin?.
Solucin: 0'623

6.5.60.
Sean X1, X2 y X3 tres variables aleatorias independientes e idnticamente
distribuidas. Cada una de ellas tiene una distribucin uniforme sobre el intervalo
(0,1). Determinar el valor de E[(X1-2X2+X3)2].
Solucin: 0.5

6.5.61.
Sean X e Y dos variable aleatoria tales que Var(X)=9 Var(Y)=4 y
cov(X,Y)=-1. Calcular:
a) Var(X+Y)
b) Var(X-3Y+4).
Solucin: a) 11 b) 51

6.5.62.
Sean X e Y dos variables aleatorias, que pueden ser dependientes, tales
que Var(X)=Var(Y). Demostrar que la covarianza de las variables aleatorias X+Y
y X-Y es nula.

6.5.63.
El coste de fabricar un pequea pieza para una mquina de corte es una
variable aleatoria (X) con funcin de densidad f(x) = x/2 - 5 en el intervalo [10,12]
y nula en el resto. El precio de venta es otra variable aleatoria (Y), que se puede
calcular en funcin del coste de fabricacin, segn la expresin: precio de venta
(Y) = coste(x) + 10% coste(x). Calcular la probabilidad de que el precio de venta
de una pieza sea inferior 13.
a)
b)
c)
d)

6.5.64.

0.8265
0.9649
0.7641
0.5153

La recta de regresin mnimo cuadrtica de Y/X

a) Es el lugar geomtrico de los valores medios de Y/Xi.


b) Es siempre la mejor funcin de prediccin de los valores de Y a partir de los
-183-

6. Principales Distribuciones Discretas

de X.
c) Pasa siempre por el punto medio de la distribucin de (X,Y)
d) Tiene pendiente negativa si el coeficiente de correlacin entre X e Y es
prximo a cero.

6.5.65.
Un ingeniero que est diseando la cabina de un avin, considera que el
brazo del piloto alcanza una longitud X y su altura sentado es Y. Estas variables
siguen una distribucin normal bivariante siendo X=88'9 y=91'44 X=4'06
Y=3'3 =0'8 . Hallar la probabilidad de que un piloto seleccionado al azar:
a) alcance con el brazo una longitud de ms de 96'52
b) tenga sentado una altura de ms de 96'52.
Solucin: a) 0'0307 b) 0'0618

6.5.66.
Una empresa grande de ingeniera y arquitectura pasa un conjunto de
tests a los aspirantes a entrar en la seccin de diseo. Los ndices importantes
son la destreza manual X y la visin espacial Y que se consideran juntos. Datos
anteriores sugieren que estas dos variables tienen una distribucin normal
bivariante con parmetros X=75, Y=60, X=10, Y=15 y =0,6.
a) Obtener la distribucin condicional de la puntuacin conseguida en visin
espacial, Y, para una destreza manual baja X=50, y para una destreza manual
alta X=90.
b) Si se requiere una puntuacin mnima en visin espacial de 80 para ser
aceptado cul es la probabilidad de que sea aceptado un aspirante con una
puntuacin en destreza manual de 50? y con una puntuacin de 90? existe
alguna relacin entre las variables X e Y?.
Solucin: a) N(37'5,12) N(73'5,12) b) 2x10-4 0'2946

6.5.67.
Dado un lote especfico de engranajes, se cree que la duracin del
tratamiento de calor a que ha sido sometido, X, y la profundidad del
endurecimiento Y tienen una distribucin normal bivariante con X =18 segundos,
Y =7'87 mm, X = 4'8, Y = 2'03 y = 0'87 .
a) Obtener la recta de regresin E(Y/X=x) que proporciona el valor esperado de
la distribucin condicional de la profundidad del endurecimiento para los
distintos tiempos.
b) Obtener la distribucin condicional del endurecimiento para una duracin
del tratamiento de 15 segundos.
c) Si X=15, cul es la probabilidad de que la profundidad del endurecimiento
-184-

6. Principales Distribuciones Continuas

est entre 5'84 y 9'90?


d) Si la profundidad del endurecimiento es de 7,62, cul es el valor esperado de
la duracin del tratamiento?
Solucin: a) E(Y/X=x)=7'87+0'3679(x-18); b) N(6'76,1);

c) 0'8204; d) 17'44

6.5.68.
Se supone que la resistencia a la rotura de las soldaduras, Y, y el
dimetro de las soldaduras, X, siguen una distribucin normal bivariante. El
modelo tiene los parmetros X=0'201 pulgadas, Y=2240 p.s.i., X=0'046,
y=342 y =0'75.
a) Obtener E(Y/X=x)
b) si se observa un dimetro de 0'184 cul es la distribucin condicional de la
resistencia a la rotura?
c) Si X=0'184, cul es la probabilidad de que la resistencia a la rotura sea
mayor de 1500 p.s.i.?
Solucin: a) E(Y/X=x)=2240+5576'08(x-0'201) b) N(2145'20,226'211) c) 0'9978

6.5.69.
En los mensajes que se transmiten en una red de ordenadores se tiene
constatado que la Carga del Sistema (X) y el Tiempo de Respuesta (Y) fluctan
aleatoriamente con media mx = 20.5 trabajos y my = 5.2 seg., desviaciones tpicas
x =5.7 trabajos y y =1.3 seg. y coeficiente de correlacin r=0.85. Entre que
limites fluctuara el Tiempo de Respuesta del 95% de los mensajes cuando hay
una carga de 22 trabajos?
Solucin: 4.125 y 6.865

6.5.70.
En una red de ordenadores se ha realizado un estudio de regresin
comprobndose que la relacin entre la carga del sistema y el tiempo de
respuesta de cualquier consulta, se ajusta mediante la recta
TIEMPO_RESPUESTA en funcin de la CARGA_SISTEMA, con un coeficiente
de correlacin de 0.9, y se sabe que cuando la carga del sistema es de 6
trabajos, el tiempo medio de respuesta de cualquier consulta flucta en el 95%
de los casos entre 15 y 35 segundos. cunto vale la desviacin tpica de la
variable TIEMPO_RESPUESTA?
Solucin: 11.47

6.6. PROBLEMAS Y CUESTIONES DE EXMENES


6.6.1. Se sabe que el tiempo de vida de un determinado componente electrnico
sigue una distribucin exponencial de media 125 minutos. Se pide:
-185-

6. Principales Distribuciones Discretas

a) Probabilidad de que el componente dure ms de 3 horas. (0.5 puntos)


b) Sabiendo que el componente estaba funcionando a las 3 horas, calcular la
probabilidad de que siga funcionando despus de 4 horas. (0.5 puntos)
c) Si colocamos 2 componentes en serie, cul es la probabilidad de que la vida
del sistema formado por estos dos componentes dure ms de 100 minutos?
Considerar componentes independientes. (1 punto)
d) Cuando falla un componente lo sustituimos por otro. Si al final hemos utilizado
50 componentes, cul es la probabilidad de que la suma de las vidas de los 50
componentes est entre 100 horas y 110 horas? (1 punto)
SOLUCIN:
La vida del componente sigue una distribucin exponencial X EXP( 1/ 125 0,008)
a) La probabilidad de que dure ms de 3 horas es,
P( X 180) e180 e0,008180 e1,44 0,2369

b) Sabiendo que a los 180 minutos ya estaba funcionando, la probabilidad de


que dure ms de 240 minutos es,
P( X 240 / X 180)

P( X 240 X 180) P( X 240) e 240

e 60 e 0,00860 e 0,48 0,6188


P( X 180)
P( X 180) e 180

c) Para el sistema en serie, para que la vida del sistema dure ms de 100
minutos se debe cumplir que los dos componentes duren ms de 100
minutos, y como son componentes independientes, la probabilidad es,
P( X 100) P( X1 100 X2 100) P( X1 100)P( X2 100) e 100 e 100 e 2100 e 20,008100
e 1,6 0,2019

d) De acuerdo con el teorema central del lmite, la suma de variables


independientes y con la misma distribucin sigue una normal de media la
suma de las medias y varianza la suma de varianzas. Esto es,
S X1 X2 ... X50
1
E(S) E( X1 X2 ... X50 ) E( X1 ) E( X 2 ) ...E( X50 ) 50 50125 6250 minutos

1
1
D2 (S) D2 ( X1 X2 ... X50 ) D2 ( X1 ) D2 ( X2 ) ... D2 ( X50 ) 50 2 50
781250 min

0,0082
-186-

6. Principales Distribuciones Continuas

D(S) 883,88 minutos


La probabilidad que nos piden es,

6600 6250 6000 6250


P(10060 S 11060) P(6000 S 6600)

883,88 883,88
0,396 ( 0,283) 0,6539 0,3886 0,2653

6.6.2. En el envasado de una marca de frutos secos, por normativa uno de los
parmetros a controlar es el peso de cada paquete. Esta variable sigue una
distribucin Normal de media 110 g y de desviacin tpica 2 g.
a. Calcular la probabilidad de que un paquete pese ms de 113 g. (0,5 puntos)
Llamando X al peso por cada paquete y siguiendo esta una distribucin del tipo
X~N(110,2), la probabilidad pedida es:

b. De acuerdo a la normativa para el control del contenido efectivo de los


productos alimenticios envasados, un paquete de estas caractersticas se
considera defectuoso si su contenido es inferior al 95,5% del valor nominal,
que en este caso coincide con la media. Calcular la proporcin de paquetes
defectuosos, es decir, que incumplen la normativa. (1 punto)
Los paquetes que incumplirn la normativa sern aquellos que su peso sea
inferior a
=0,955
Es por ello que la probabilidad pedida ser:

c. Estos paquetes se envasan en cajas de 40 unidades. Si una caja contiene 3 o


ms paquetes defectuosos son retirados de la cadena de produccin.
Determinar el porcentaje de cajas que se retiran de la cadena de envasado. (1
punto)

-187-

6. Principales Distribuciones Discretas

Se retiran aquellas caja con 3 o ms paquetes defectuosos, por lo que se define


una nueva variable Y que determina el nmero de defectuosos en cada caja. Esta
nueva variable sigue una distribucin del tipo Y~B( 40, 0,0067).
La probabilidad pedida ser:

d. Una cadena de supermercados hace un pedido de 200 cajas de dicho


producto. Calcular la probabilidad de que en el total del pedido haya ms de
10 paquetes que incumplan la normativa. (1 punto)
Definimos una nueva variable T que sume el nmero de defectuosas que hay en
las 200 cajas, esto es:
, siendo Yi el nmero de paquetes defectuosos en la caja i,
tal y como se defini en el apartado anterior.
Esta nueva variable, por el Teorema Central del Lmite, tendr como distribucin
T~ N(200400,0067,
probabilidad pedida es:

00 0 0 0

09

)=N(53,6, 7,3)

por lo que la

e. En el proceso de control de calidad, cuantas cajas por trmino medio han de


controlarse hasta encontrar la primera que sea defectuosa? (1 punto)
Sea S, el nmero de cajas a controlar antes de encontrar una defectuosa. Esta
variable sigue una distribucin de tipo S~BN(1, 0,00247), por lo que en trmino
medio el nmero de cajas que tiene que controlar hasta que parezca la primera
defectuosa es:
cajas habr que controlar

6.6.3. El 50% de unos cartuchos de tinta para impresin duran 10 horas. Admitiendo
que la duracin de los cartuchos sigue una distribucin exponencial, se pide:
a) Calcular la probabilidad de que un cartucho recin instalado permita imprimir
durante ms de 18 horas. (1 punto)
b) Cul es la probabilidad de que con los 20 cartuchos que vienen en una caja
podamos imprimir durante ms de 300 horas. (1 punto)
-188-

6. Principales Distribuciones Continuas

Solucin:
a) La funcin de distribucin de la exponencial es Fx ( x) 1 ex . Para x=10
1 e 10 0,5 y despejando el valor de es
ln0,5
0,0693
10

La probabilidad pedida es,


P( X 18) e18 e0,069318 0,2873

b) la duracin total de los cartuchos es,

Y X1 X2 ... X20

Aplicando el teorema central del lmite, la variable Y se aproxima a una normal


de media y varianza dado por,
20

E( Y )

E( X ) 200,0693 288,6
1

i1

20

var( Y )

var( X ) 200,0693
1

i1

4164,51

D( Y) 64,5

La probabilidad pedida es,


300 288,6

P( Y 300) P Z
P( Z 0,1767) 0,4299
64,5

6.6.4. La vida de un componente electrnico y la temperatura del entorno siguen una


distribucin normal bivariante de covarianza -30 h C. La vida del componente se
distribuye de forma normal, con media 100 horas y desviacin tpica 10. Sabemos
adems que la probabilidad de que la temperatura sea superior a 30 es 0,0228 y
la de que sea superior a 20 C es 0,5. Se pide:
a) Calcular la probabilidad de que el componente funcione ms de 100 horas si
la temperatura es de 25 C. (1 punto)
Solucin:
como P(T>20)=0.5, la media de la temperatura ser 20, y
1-f(z)=0.0228 para z=2.0, por lo tanto s=30-20/2.0=5
De modo que el vector de medias ser m=(100, 20) y la matriz V ser (100,30//-30,25). El coeficiente de correlacin ser entonces r=-0.6
(X|y=25)=N(100-0.6*10/5*(25-20); 10*sqrt(1-0.6))=N(94,8)
Por lo tanto P(X>100)=1- f((100-94)/8)=1- f(0.75)=0.227
-189-

6. Principales Distribuciones Discretas

-190-

7. Distribuciones derivadas de la normal

7.

DISTRIBUCIONES DERIVADAS DE LA NORMAL

Contenido
7.1.
7.2.
7.3.
7.4.

7.1.

DISTRIBUCIN CHI-CUADRADO ............................................................ 191


DISTRIBUCIN t .................................................................................... 192
DISTRIBUCIN F ..................................................................................... 194
PROBLEMAS PROPUESTOS .................................................................. 195

DISTRIBUCIN CHI-CUADRADO

La distribucin chi-cuadrado aparece cuando hacemos la suma de variables


aleatorias normales tipificadas y al cuadrado. De esta forma, z1, z2, , zn son v.a.
N(0;1) e independientes, la variable chi-cuadrado se define como

2n Z 12 Z 22 ... Z n2
La funcin de densidad es asimtrica a la derecha.

Chi-Cuadrado Distribucin

densidad

0,24
0,2

Grad. de libertad
3
5
9
15
30

3
5
9
15

0,16
0,12
0,08

30

0,04
0
0

20

40

60

80

Figura 7. 1. Funcin de densidad de la chi-cuadrado

El nmero de sumandos son los grados de libertad de la chi-cuadrado.


El valor medio es

E( 2n ) n
y la variancia viene dada por,

D 2 ( 2n ) 2n
-191-

7. Distribuciones derivadas de la normal

El inters de esta variable se debe a que la varianza muestral sigue una


distribucin chi-cuadrado. Ms concretamente,

( n 1)

s2
2n 1
2

El valor de n2( ) es aquel valor de la chi-cuadrado que deja a su derecha un


rea de probabilidad , segn la expresin

P( 2n 2n( ) )

Actividad 7.1:

Calcular la probabilidad P( 32 5 )

Calcular el valor de a tal que P( 32 a ) 0 ,10 , esto es 32( 0 ,10 ) o bien

32;0 ,10 .

7.2.

DISTRIBUCIN t

La t de STUDENT se define como el cociente entre una variable normal N(0;1) y la


raz cuadrado de una chi-cuadrado dividida sta por sus grados de libertad. As,

tn

Z
2n
n

Donde z es una variable N(0;1) e independiente de la chi quadrado.


La forma de la funcin de densidad es parecida a la normal N(0;1), pero un
poco ms aplanada. Cuando n>30, la funcin de densidad de la t coincide con la
funcin de densidad de la normal N(0;1).

-192-

7. Distribuciones derivadas de la normal

t de Student Distribucin

densidad

0,4

Grad. de libertad
2
5
9
17
30

0,3
0,2

0,1

30

0
-8

-4

x
Figura 7. 2. Funcin de densidad de la t de Student

El valor medio de la tn es,

E [ tn ] 0

La varianza de la tn es,

D 2 ( tn )

n
para n>2
n2

La cantidad tn es aquel valor de la tn que deja a su derecha un rea de


probabilidad , segn la expresin,

P( tn tn )
La media muestral est relacionada con una distribucin t cuando la
desviacin tpica no es conocida y se estima a partir de la desviacin tpica muestral,
ms concretamente, la expresin,

t n 1

sigue una distribucin tn-1 con n-1 grados de libertad.

Actividad 7.2:
Calcular la probabilidad de P(t3> 2,33)
Calcular la probabilidad de P(t5<-1,96)
Calcular la probabilidad de P(|t7|>2,1)

Calcular el valor de a que cumple P(t9>a)=0,10, esto es

-193-

t 90,10

7. Distribuciones derivadas de la normal

7.3.

DISTRIBUCIN F

La distribucin F aparece como un cociente de dos variables chi-cuadrado cada una


de ellas divididas por sus grados de libertad, e independientes, esto es,

2n1
Fn1 ,n2

2
n2

n1
n2

Se dice que el cociente sigue una distribucin F con n1 y n2 grados de


libertad, n1 para el numerador y n2 para el denominador.
La funcin de densidad es asimtrica hacia la derecha.

F (ndice de varianza) Distribucin


1

Numerador g.l.,Denominad
10,10
5,9
13,16

densidad

0,8
0,6
0,4
0,2
0
0

x
Figura 7. 3. Funcin de densidad de una F

El valor medio de una F es,

E [ Fn1 ,n2 ]

n2
para n2 >2
n2 2

D 2 ( Fn1 ,n2 )

2n22 ( n1 n2 2 )
n1 ( n2 2 )( n2 4 )

y la varianza es,

El valor de Fn1 ,n2 es aquel valor de la F que deja a su derecha un rea de


probabilidad , segn la expresin,

-194-

7. Distribuciones derivadas de la normal

P( Fn1 ,n2 Fn1 ,n2 )

El cociente de dos varianzas muestrales sigue una distribucin F, ms con


concretamente,

s12
s22

12

Fn1 1,n2 1

22

Actividad 7.3:

Calcular la probabilidad de P( F3;5 10 )

Calcular el valor de a tal que P( F7 ;9 a ) 0 ,05 , esto es

7.4.

F70;9,05

PROBLEMAS PROPUESTOS

7.4.1. Determinar a y b para que P(as2b)=0'8 si s2 procede de una muestra


aleatoria simple de tamao 16 de una poblacin NORMAL N(8,2).

Solucin: a = 2.28, b = 5.95

-195-

7. Distribuciones derivadas de la normal

-196-

8. Distribuciones en el muestreo

8. DISTRIBUCIONES EN EL MUESTRO

Contenido
8.1.
8.2.
8.3.
8.4.
8.5.
8.6.
8.7.
8.8.
8.9.
8.10.

POBLACIN, MUESTREO Y MUESTRA .................................................... 197


DISTRIBUCIN DE LA VARIANZA MUESTRAL ......................................... 201
DISTRIBUCIN DE LA MEDIA MUESTRAL ............................................... 203
DISTRIBUCIN DEL COCIENTE DE VARIANZAS ..................................... 204
DISTRIBUCIN DE LA PROPORCIN ...................................................... 206
DISTRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES ............ 207
DISTRIBUCIN DE LA DIFERENCIA DE PROPORCIONES ..................... 208
VARIANZA EN POBLACIONES FINITAS.................................................... 210
PROBLEMAS PROPUESTOS .................................................................... 211
PROBLEMAS Y CUESTIONES DE EXMENES ........................................ 212

8.1.

POBLACIN, MUESTREO Y MUESTRA

Poblacin y muestra
El conjunto de todos los elementos bajo estudio se denomina Poblacin, y a una
parte de ellos recibe el nombre de Muestra. Por ejemplo si queremos estudiar el
nivel de renta en la Comunidad Valenciana, la poblacin es el conjunto de individuos
que pertenecen a dicha Comunidad y una muestra es una parte de esa poblacin,
elegida al azar, a partir de la cual se quiere deducir las caractersticas de toda la
poblacin.
Conociendo cada elemento de la poblacin, conocemos todas las
caractersticas y parmetros de la misma. Una poblacin se puede caracterizar por
una funcin de distribucin, la cual depende de un conjunto de parmetros. As:

F(x; 1 , 2 ,..., k )
Si todos los elementos de la poblacin son conocidos, los parmetros
1 , 2 ,..., k son perfectamente conocidos. A estos parmetros se denominan
"parmetros poblacionales" y se representan por letras griegas.
El problema estriba en que no podemos conocer todos los elementos de la
poblacin, debido a uno de los siguientes motivos:

-197-

8. Distribuciones en el muestreo

1) La poblacin es muy extensa y llevara mucho tiempo su recopilacin.


2) El coste de obtener la informacin es muy elevado.
3) Al obtener la informacin se puede destrozar el elemento de la poblacin.
Por ejemplo, para obtener la tensin de rotura de una barra de acero.
4) La poblacin como tal puede no existir todava. Por ejemplo, el conjunto de
piezas producidas por una mquina.
En tales casos no queda ms remedio que tomar una pequea parte de la
poblacin y a partir de ella intentar deducir el valor de los parmetros poblacionales.
A esa pequea parte de la poblacin se denomina "muestra".
Los datos de una muestra se pueden considerar como un conjunto de
variables aleatorias, todas ellas con la misma funcin de distribucin
F(x, 1 , 2 ,..., k ) , as:

x = ( x1 , x2 ,..., xn )
A cualquier funcin de estos valores,

( x1 , x 2 ,..., x n ) , se denomina

"estadstico".
El problema se reduce a obtener un estadstico, funcin de los datos
muestrales, que nos d una aproximacin del parmetro poblacional, lo cual se
expresa por:

1 = 1( x1 , x 2 ,..., x n )
La cantidad 1 vara para cada x1 , x2 ,..., xn , luego se puede considerar como
una funcin o transformacin de n-variables aleatorias, y por lo tanto, tendr una
media, una varianza, as como su propia F( 1 ) ,

E( 1 )
2
D ( 1 )

Con lo cual nos interesa estudiar las propiedades de esa distribucin en


relacin al parmetro desconocido poblacional.
A las distribuciones que tienen los estadsticos muestrales, y que dependen
de los parmetros poblacionales y del tamao de la muestra, se denominan
Distribuciones en el Muestreo y son las que nos permitirn relacionar los estadsticos
muestrales con los parmetros de la poblacin con vistas a un posible conocimiento
de estos ltimos.

-198-

8. Distribuciones en el muestreo

Poblacin N(15; 2.5)


Muestra 1

n=10

Muestra
2

Muestra
m

x1

s1

x2

s2

xm

sm

.
.
.
.

Histogram

Histogram

Histogram

600

80

80

400
300
200

frequency

frequency

frequency

500
60
40
20

60
40
20
0

100

-1

-3,7

-1,7

0,3

2,3

-0,5

4,3

0,5

1,5

0,3

0,6

0,9

1,2

1,5

1,8

SIGMAS

MEANS

Figura 8. 1. Poblacin y muestra

Se debe cuidar mucho la forma de extraccin de la muestra, ya que sta debe


ser representativa de la poblacin. Si al obtener la muestra, cada elemento de la
poblacin tiene la misma posibilidad de salir, se dice que la muestra es "aleatoria
simple".
Si el tamao de la poblacin no es muy elevado en relacin al tamao de la
muestra, se aplican unos procedimientos que se estudian en "Muestreo en
poblaciones finitas". En este tema suponemos que el tamao de la poblacin es muy
grande en relacin a la muestra, es decir, estamos en "Muestreo en poblaciones
infinitas".

-199-

8. Distribuciones en el muestreo

Tipos de muestreo
Los muestreos pueden ser probabilsticos y no probabilsticos. Entre los
probabilsticos, los ms utilizados son:

Muestreo aleatorio simple. Cada elemento de la poblacin tiene la misma


probabilidad de salir elegido para formar parte de la muestra.

Muestreo sistemtico. Cuando la poblacin est enumerada en una lista y


queremos obtener los elementos a lo largo de la lista. Para ello se divide el
tamao de la poblacin entre el nmero de elementos a extraer en la muestra.
Est cociente dar, por ejemplo, un valor h. A continuacin se elige un
nmero al azar de 1 a h, por ejemplo k, y los elementos a extraer son el k, el
k+h, el k+2h, y as sucesivamente.

Muestreo estratificado. Cuando en la poblacin se pueden formar grupos


con una cierta homogeneidad (Ej. Grupos de edad, grupos por estatus
econmico, etc.). A cada grupo se denomina estrato, y el tamao n de la
muestra a tomar se subdivide para cada estrato segn algn criterio de
afijacin.

Muestreo por conglomerados. Cuando en la poblacin se pueden formar


grupos con una cierta heterogeneidad, y cada uno de esos grupos, de por s,
puede representar al total de la poblacin. El procedimiento es traer un
nmero al azar de conglomerados, y para cada uno de ellos examinamos
todos sus elementos.

Muestreo por etapas. Viene a ser una generalizacin de los conglomerados.


En lugar de examinar todos los elementos del conglomerado, se toma una
muestra aleatoria del mismo.

Entre los muestreos no probabilsticos, los ms empleados son:

El muestreo opintico. Es funcin del entrevistador la eleccin del elemento


de la poblacin a examinar.

El muestreo por cuotas. Se requiere un cierto nmero de elementos para


cada grupo de la poblacin. Se van tomando elementos de la poblacin,
segn algn procedimiento establecido de antemano, antes que se cubre la
cuota para dichos tipos de elementos.

Muestreo por bola de nieve. Cuando es difcil acceder a los elementos de la


poblacin, debido a su desconocimiento. Cuando se encuentra a alguno de
ellos, se le pregunta si nos puede indicar la existencia de otros. A su vez esos
otros nos pueden guiar para encontrar nuevos elementos de la poblacin.
-200-

8. Distribuciones en el muestreo

Distribuciones muestrales
En este apartado supondremos que la poblacin estudiada sigue una distribucin
normal, N( ; ) , y que de ella, extraemos unos valores ( x1 , x2 ,..., xn ) al azar e
independientemente. Cada X i se puede considerar, antes de que aparezca el valor
concreto, como N( ; ) , es decir, son variables aleatorias independientes con la
misma distribucin normal.

POBLACIN

MUESTRA
PX ( x )

fX(x)
(X1, X2, ..., Xn)

1/n

X
Caractersticas muestrales
(variables aleatorias)

Caractersticas poblacionales
(constantes)
(media)

x (media muestral)

(varianza)

s n2 (varianza muestral)

s n21 (cuasivarianza)
(desviacin tpica)

sn (desv. tpica muestral)


sn-1 (cuasidesviacin tpica)

p (proporcin)

f (proporcin muestral)

Figura 8. 2 Distribuciones muestrales

8.2.

DISTRIBUCIN DE LA VARIANZA MUESTRAL

Una distribucin n se define como una suma de variables N(0;1) al cuadrado e


2

independientes. El valor medio y la varianza son:

E( 2n ) = n
2
2
D ( m ) = 2n

-201-

8. Distribuciones en el muestreo

Cuando n>30 se distribuye segn una normal N(n; 2n ) .


El estadstico

( x - x )

S n2

se denomina varianza muestral y al definido por

( x - x )

S n21

n 1

se le conoce como varianza muestral corregida o cuasivarianza muestral.


La raz cuadrada positiva de la varianza muestral es la desviacin tpica
muestral y se representa por s
Sea ( x1 , x2 ,..., xn ) una muestra aleatoria simple extrada de una poblacin
normal N(; ) , se demuestra que el estadstico

( x - x )

2
sigue una distribucin n-1 .
2

Multiplicando y dividiendo por n

n ( xi - x )2
i

2
2
s = n-1

o por (n-1),

(n - 1) ( xi - x )2
i

(n - 1)

= (n - 1)

= 2n-1

Actividad 8.1:

De una poblacin normal N(30;2,5) se extrae una muestra de tamao 5, Cul es la


probabilidad que la desviacin tpica muestral sea mayor de 3,5?

-202-

8. Distribuciones en el muestreo

8.3.

DISTRIBUCIN DE LA MEDIA MUESTRAL

La media muestral de un conjunto de valores muestrales ( x1 , x2 ,..., xn ) ,


viene dada por

La media y la varianza de x son :

E( x ) = ; D2 ( x ) =

Como x =

1
1
1
x1 + x2 + ...+ xn es una combinacin de variables normales, x
n
n
n

ser a su vez una normal,

X N(E( x ); D( x )) N( ;

)
n

o bien tipificando,

x-
= N(0;1)

n
Si es desconocida y empleamos los datos de la muestra para estimarla, y
la sustituimos por s, la desviacin tpica muestral, se obtiene que en lugar de una
N(0;1) sigue una distribucin t de Student de n-1 grados de libertad.
Una distribucin t de Student se define como un cociente de

tn =

N(0,1)

2n
n

El valor medio y la varianza son:

-203-

8. Distribuciones en el muestreo

E( t n ) = 0
2
D ( tn )= n - 2

Cuando n>30 se distribuye segn una N(0;1).


As:

x-
= t n -1
s
n

Actividad 8.2:

De una poblacin normal de media 15 y desviacin tpica 3 se extrae una muestra de


tamao 7. Cul ser la probabilidad que la media muestral sea mayor de 16?

De una poblacin normal hemos obtenido la estimacin de la media con un valor de


15,3 y una estimacin de la desviacin tpica con una estimacin de 2,3. Si de esta
poblacin obtengamos una muestra de tamao 9, Cul es la probabilidad que la
media muestral sea mayor de 17,2?

___________________________________________________________________

8.4.

DISTRIBUCIN DEL COCIENTE DE VARIANZAS

Una distribucin F n1,n2 se define como un cociente de dos independientes dividida


2

cada una por sus grados de libertad

2n

n1
F n1,n2 = 2

n2
Sea X N( 1 ; 1 ) y otra poblacin Y N( 2 ; 2 ) , e independientes. Si de la
primera poblacin extraemos una m.a.s ( x1 , x2 ,..., xn ) y de la segunda otra m.a.s.

( y1 , y2 ,..., yn ) , el cociente de sus varianzas muestrales, dividida cada una de ellas


por su varianza poblacional, se distribuye segn una F de n1 , n2 grados de libertad.
-204-

8. Distribuciones en el muestreo

Esto es:
2

s1

12 =
F n -1,n -1
2
1

s2

22
Para cada muestra
2

( n1 - 1) s12 = 2n1-1

1
2

( n2 - 1) s22 = 2n2-1

dividiendo cada

por sus grados de libertad y efectuando su cociente, resulta la

definicin de una distribucin F de n1 - 1, n2 - 1 grados de libertad.


Si las varianzas poblacionales son iguales 12 = 22 = , el cociente de
varianzas muestrales es una F,
2

s1 =
F n1-1,n2-1
2
s2
Por lo general, se suele colocar la varianza muestral mayor en el numerador,
y la menor en el denominador.

Actividad 8.3:

De dos poblaciones normales con la misma variancia sacamos una muestra de cada
una de ellas. La primera de tamao 7, y la segunda de tamao 9. Cul es la
probabilidad que la variancia de la primera muestra sea mayor que el doble que la
variancia de la segunda muestra.

-205-

8. Distribuciones en el muestreo

8.5.

DISTRIBUCIN DE LA PROPORCIN

Proporcin de defectuosas

El nmero X de unidades defectuosas de una muestra aleatoria simple de n unidades


sigue una distribucin Binomial B(n;p). Como X es una suma de dicotmicas, cuando
np>5, el nmero de defectuosas en la muestra sigue una distribucin normal,

X N np; np(1 p)

La proporcin de unidades defectuosas en la muestra es

X
n

Y f sigue una distribucin normal

p(1 p)

f N p;

Proporcin de defectos (defectos por unidad)


En caso de que X cuenta el nmero de defectos que hay entre todas las piezas de
una muestra de tamao n, esta variable aleatoria sigue una distribucin de Poisson
PS(c), donde c es el nmero medio de defectos por muestra. Si c>5 el nmero de
defectos sigue una distribucin normal,

X N (c; c )
La proporcin de defectos b(defectos por unidad) es

X
n

En la que f sigue una distribucin normal,

f N u ;

Donde u es el nmero medio de defectos por unidad.


-206-

8. Distribuciones en el muestreo

Actividad 8.4:

8.6.

Una mquina produce piezas con una proporcin de defectuosas del 2%. Si de esta
mquina extraemos una muestra de 60 piezas, cul ser la probabilidad que la
proporcin de piezas defectuosas en la muestra sea mayor del 3%?

DISTRIBUCIN DE LA DIFERENCIA DE MEDIAS MUESTRALES

Si de una poblacin que sigue una N(1 , 1) extraemos una muestra aleatoria simple
de tamao n1 , y de otra poblacin con distribucin N(2 , 2) se extrae otra muestra
aleatoria simple de tamao n2, y para cada una de dichas muestras calculamos las
medias muestrales, cada una de ellas sigue una distribucin,

x1 N ( 1 ,

1
n1

x2 N ( 2 ,

2
n2

La diferencia de medias muestrales, como es una combinacin lineal de


variables normales, sigue una distribucin,

12 22

x1 x2 N 1 2 ;

n1 n2

Si 1 y 2 son desconocidas, las estimamos a partir de sus desviaciones


tpicas muestrales, y suponiendo que n1 y n2 son suficientemente grandes, la
diferencia de medias muestrales sigue una distribucin,

s2 s2
x1 x2 N 1 2 ; 1 2

n1 n2

Si 1 y 2 son desconocidas, pero iguales, la mejor estimacin de la comn


es,

2 s 2

s12 (n1 1) s22 (n2 1)


n1 n2 2

Y la diferencia de medias muestrales seguir una distribucin t de Student con


n1+n2-2 grados de libertad. Esto es,
-207-

8. Distribuciones en el muestreo

( x1 x2 ) ( 1 2 )
t n1 n2 2
1 1
s

n1 n2

Actividad 8.5:

De una poblacin normal N(40;3) sacamos una muestra de tamao 10, y de otra
poblacin normal N(45; 3,5) sacamos una muestra de tamao 13. Cul es la
probabilidad que la media muestral de la segunda muestra sea mayor que la media
de la primera muestra.

Si en el ejemplo anterior las desviaciones tpicas realmente son estimaciones de las


desviaciones tpicas poblacionales, cul sera ahora la probabilidad que la media
muestral de la segunda muestra fuera mayor que la media muestral de la primera
muestra.

8.7.

DISTRIBUCIN DE LA DIFERENCIA DE PROPORCIONES

Proporcin de defectuosas
Si de un lote de gran tamao en el cual conocemos la proporcin de defectuosas p1,
tomamos una muestra de tamao n1, la fraccin de defectuosas es,
f1

x1
n1

Y sigue una distribucin normal

f1 N ( p1 ,

p1 (1 p1 )
)
n1

Si efectuamos el mismo procedimiento, pero para otra poblacin con


proporcin p2, la fraccin de unidades defectuosas sigue una distribucin normal

f 2 N ( p2 ,

p 2 (1 p 2 )
)
n2

La diferencia de fracciones, como es una combinacin lineal de variables


-208-

8. Distribuciones en el muestreo

normales, sigue otra distribucin normal,

p (1 p1 ) p 2 (1 p 2 )
f1 f 2 N p1 p 2 , 1

n1
n2

Si p1 y p2 son desconocidas pero iguales, la mejor estimacin de la p comn


es,
p

x1 x2
n1 n1

Y en tal caso la diferencia de proporciones sigue una distribucin,

1 1
f1 f 2 N 0; p (1 p )

n1 n1

Proporcin de defectos (defectos por unidad)


Para la diferencia de proporcin de defectos, la frecuencia observada es,

f1

x1
n1

Como x1 sigue una distribucin de Poisson de parmetro p1 , la aproximacin a la


normal es,

p
f1 N p1 , 1
n1

Y para una diferencia de proporciones de defectos, la distribucin normal que sigue


es,

p
p
f1 f 2 N p1 p 2 , 1 2

n1 n2

Si p1 y p2 son iguales pero desconocidas, la mejor estimacin de la proporcin de


defectos es,

x1 x2
n1 n1

Donde:

x1 = total de defectos de la muestra de tamao n1


x2 = total de defectos de la muestra de tamao n2 .
Y la diferencia de proporciones sigue una distribucin normal
-209-

8. Distribuciones en el muestreo

1 1
f1 f 2 N 0; p

n1 n1

Observar que estar frmulas son las mismas que para la diferencia de proporciones
de defectuosas sin mas que cambiar la pq por p, y donde p es la proporcin (nmero)
de defectos por unidad.

Actividad 8.6:

8.8.

Una maquina hace piezas con una proporcin de defectos del 5%, y otra mquina
hace las mismas piezas con una proporcin de defectos del 3%. Si cogen una
muestra de 50 unidades de la primera mquina y 70 piezas de la segunda mquina,
cul ser la probabilidad que la proporcin de defectos observada en la primera
muestra sea mayor que la proporcin de defectos de la segunda muestra?

VARIANZA EN POBLACIONES FINITAS

Cuando el tamao de la poblacin no es muy grande en relacin al tamao de la


muestra, las varianzas de los estadsticos muestrales difieren un poco de las
varianzas en caso de poblaciones infinitas. Concretamente para la media muestral,
proporcin muestral, y para el total de la muestra, las varianzas quedan multiplicadas
por un factor de correccin

N n
. As, las expresiones de dichas varianzas son:
N 1

Para la media muestral x es,

D2 ( x)

n N 1

Para la proporcin muestral f es,

D2 ( f )

2 N n

Para el total T

pq N n
n N 1

x
i 1

de la muestra es,

-210-

8. Distribuciones en el muestreo

D 2 (T ) n 2

8.9.

N n
N 1

PROBLEMAS PROPUESTOS

8.9.1.- Dada una poblacin NORMAL N(5,2), cul es la probabilidad de que la media
muestral para una muestra de tamao 4 sea superior a 6? Y si el tamao es 25?
Solucin: 0.1587 0.0062

8.9.2.- Se extraen dos muestras aleatorias simples de tamaos n1=22 y n2=30 de


una poblacin NORMAL de varianza 9. Calcular la probabilidad de que la diferencia
de medias de ambas muestras sea superior a 1.
Solucin: 0.235

8.9.3.- Determinar el tamao de muestra a tomar en el estudio de la fabricacin de


ciertas piezas para que la media muestral de una cierta dimensin difiera de la media
poblacional en menos de 1 cm con una probabilidad del 95% si =3.
Solucin: 36

8.9.4.- En la inspeccin de recepcin por lotes se mide la longitud de una


determinada pieza, su distribucin poblacional es N(10,0'15). Se toma una muestra
de tamao 25, si x <10 no se compra el lote x >10 se compra pagando sobre el
precio una cantidad adicional y=1000( x -10)2 (en euros). Determinar :
a) La distribucin de la cantidad adicional.
b) La probabilidad de que dicha cantidad sea inferior a 2 euros.
c) Valor de k / P( y>k )= 0'001
Solucin: b) 0.9319 c) 8.64

-211-

8. Distribuciones en el muestreo

8.9.5.- Un fabricante produce lmparas elctricas con una vida media de 2.000 horas
y una desviacin tpica de 200 horas. Mediante la modificacin del proceso de
fabricacin se piensa elevar la media a 2.200 horas conservando la dispersin. Si se
tena una muestra de 10 lmparas producidas antes del cambio, se toma una
muestra de 30 despus del mismo y se halla la diferencia entre las medias
muestrales, cul es la probabilidad de que esta diferencia est entre 195 y 205?
Se admite una distribucin NORMAL para la vida de las lmparas.
Solucin: 0.056

8.9.6.- Determinar a y b para que P(as'2b)=0'8 si s'2 procede de una muestra


aleatoria simple de tamao 16 de una poblacin NORMAL N(8,2).
Solucin: a = 2.28, b = 5.95

8.10.

PROBLEMAS Y CUESTIONES DE EXMENES

8.10.1.- El espesor de unas planchas de acero sigue una distribucin normal con
varianza 5,4. Se pide:
a) Si tomamos una muestra de tamao n=20, cul es la probabilidad de que la
desviacin tpica sea superior a 3. (1 punto)
b) Cul debe ser el nmero de planchas a medir para que la probabilidad de
que la media muestral de estas planchas difiera de la media poblacional en
ms de 2 unidades sea inferior al 10%? (1punto)
Solucin :

(n 1)s 2

a) P( s 3) P

919
P192 31,66 0,034
5,4

b) La condicin que se debe cumplir es,

P( x 2) 0,10
-212-

8. Distribuciones en el muestreo

El suceso contrario es,

P( x 2) 0,90

2
x
2
P

0,90

n
n
n

Buscamos el valor de z 0,05 1,645 , y de la expresin anterior el valor de n se


obtiene de,

1,645

n
Despejando n se tiene,

1,645 5,4
2

n=3,65 de donde el valor de n tiene que ser como mnimo de n=4.

8.10.2.- La longitud de una pieza utilizada en un proceso de montaje sigue una


distribucin normal de media 50 mm y desviacin tpica 12 mm. Si extraemos una
muestra aleatoria simple de 16 piezas. Determinar:
a. Cul es la probabilidad de que su media sea menor de 58? (0,5 puntos)

La media muestral seguir una distribucin del tipo


probabilidad pedida es:

~N(50, 12/16), por lo que la

b. Entre qu valores se encontrar el 38% de las medias muestrales obtenidas


al tomar reiteradamente muestras de 16 piezas de ese lote? (1,5 puntos)

La probabilidad pedida es:

-213-

8. Distribuciones en el muestreo

Asumiendo simetra para simplificar

c. Qu tamao tendra que tener la muestra para que la probabilidad de


encontrar medias superiores a 52 fuese 0,2578? (1,5 puntos)

El tamao de muestra n debe cumplir que:

d. Calcular la probabilidad de que la varianza muestral sea mayor de 12,5? (1


punto)

La varianza muestral sigue una distribucin del tipo


probabilidad pedida ser:

por lo que la

8.10.3.- En un proceso de fabricacin se dispone de dos mquinas. El peso de las


piezas fabricadas por la mquina A sigue una distribucin N (100; 2). El peso de las
piezas fabricadas por la mquina B sigue una distribucin N (102; 2). Se toma una
muestra aleatoria de 5 piezas fabricadas por la mquina A y se calcula la media
muestral. A continuacin se toma otra muestra de 5 piezas de B y se calcula la media
muestral. Cul es la probabilidad de que la media muestral de A sea mayor que la
-214-

8. Distribuciones en el muestreo

de B? (2 puntos)
Solucin:

x A N (100; 2

5)

x B N (102; 2

5)

E x A x B E x A E x B 100 102 2

2 x A x B 2 x A 2 x B (4 / 5) (4 / 5) 1,6

P x A x B P x A x B 0 P N (2; 1,6 ) 0 2 / 1,6 (1,58) 0,057

-215-

8. Distribuciones en el muestreo

-216-

9. Inferencia en poblaciones normales

9. INTRODUCCIN A LA INFERENCIA ESTADSTICA

Contenido
9.1
ESTIMACIN PUNTUAL ......................................................................... 217
9.2.
ESTIMACIN POR INTERVALOS DE CONFIANZA ............................... 220
9.2.1. Intervalo de confianza para la media poblacional .................................. 221
9.2.2. Intervalo de confianza para la varianza poblacional ............................... 223
9.2.3. Intervalo de confianza para el cociente de varianzas poblacionales ..... 224
9.2.4. Intervalo de confianza para la proporcin .............................................. 225
9.2.5. Intervalo de confianza para la diferencia de proporciones ..................... 227
9.2.6. Intervalo de confianza para la diferencia de medias poblacionales ........ 228
9.3.
TEST DE HIPTESIS ............................................................................. 230
Conceptos ....................................................................................................... 230
Obtencin de los tests .................................................................................... 234
9.4. TEST DE HIPTESIS PARMETRICOS ..................................................... 235
9.4.1.
Contrastes de la media de una poblacional normal .......................... 235
9.4.2.
Test de hiptesis para la varianza poblacional ................................. 240
9.4.3.
Test de hiptesis para el cociente de varianzas poblacionales ........ 241
9.4.4.
Contrastes de proporciones ............................................................. 242
9.4.5.
Test de hiptesis para la diferencia de medias poblacionales con
muestras independientes ................................................................................ 246
9.4.6.
Test para la diferencia de medias poblacionales con datos
apareados ....................................................................................................... 247
9.4.7.
Test para la diferencia de proporciones ........................................... 248
9.4.8.
Test de ajuste a una distribucin...................................................... 250
9.4.9.
Test de independencia ..................................................................... 252
9.5. PROBLEMAS PROPUESTOS ..................................................................... 255
Test de hiptesis ................................................................................................. 256
Tabla de contingencia ......................................................................................... 260
Test de ajuste a una distribucin ......................................................................... 261
9.6. PROBLEMAS Y CUESTIONES DE EXMENES ......................................... 262

9.1

ESTIMACIN PUNTUAL

Sea X una v.a. cuya funcin de distribucin F(x;) depende del parmetro poblacional
, y una muestra aleatoria simple (x1, x2, , xn) extrada de la misma poblacin. El
proceso de estimacin consiste en elegir una funcin de dichos datos muestrales,
de manera que sus valores se aproximen lo mejor posible al valor
verdadero y desconocido del parmetro .
-217-

9. Inferencia en poblaciones normales

Cul es el criterio para saber que nos aproximamos lo mejor posible al valor
verdadero del parmetro?
Llamando a

2
se sigue el criterio de elegir de forma que minimice la cantidad ( - ) , o lo que

es equivalente, que minimice por trmino medio esa cantidad. Esto se puede
expresar como:

Imaginemos que tenemos dos posibles funciones de la muestra (estimadores)


y
para estimar el mismo parmetro poblacional (la media de una distribucin
N(0;1)), con las distribuciones que aparecen en la Figura 9. 1.

0,4
N(0,1)
N(0,2)

0,3
fx(x)

0,2
0,1
0
-10

-6

-2

10

x
Figura 9. 1. Dispersin de los estimadores

Observamos que
ser preferible al , ya que est centrado en el valor verdadero,
y tiene una dispersin menor que la del estimador .
Si el valor medio del estimador coincide con el parmetro a estimar, se dice
que el estimador es centrado o insesgado,

E( ) =
Caso contrario existe un sesgo b( ) que se define como,
-218-

9. Inferencia en poblaciones normales

b( ) E( )

0,4
N(0,2)
N(2,1)

0,3
fx(x)
0,2
0,1
0
-10

-6

-2

10

Figura 9. 2. Comparacin de estimadores

Supongamos ahora que las distribuciones de los estadsticos fueran las que
aparecen en la Figura 9. 2. Aqu no tendramos un criterio claro para elegir, ya que si
uno es preciso, el otro es ms exacto.
La exactitud del estimador es la propiedad de proporcionar valores cerca del
valor verdadero, y la precisin se refiere a la dispersin de dichos valores.

x x
xx
x

x
x

Preciso pero no exacto

Exacto pero no preciso

x xx
x x

Exacto y preciso

Figura 9. 3. Exactitud y precisin de un estimador

Para comparar estos estadsticos debemos elegir otros criterios, por ejemplo,
el que sea Uniformemente de Mnima Varianza (UMV), es decir, entre todos los
posibles estimadores ser mejor el que tenga una varianza ms pequea.
Luego en primer lugar, nos interesa estudiar aquellos estimadores que sean
insesgados y de mnima varianza.
-219-

9. Inferencia en poblaciones normales

El error cuadrtico medio se descompone en sesgo al cuadrado y varianza del


estimador, segn la siguiente expresin:

E( - )2 b()2 D2 ()
Para cada estimador
nos interesa conocer su funcin de distribucin, su
media y su varianza o desviacin tpica. La varianza del estimador viene dada por
la expresin
, cuya expresin depende, por lo general, de un parmetro
poblacional. Por ejemplo, la varianza de la media muestral es,

D 2 (x)

2
n

En caso de no conocer la varianza poblacional, la estimamos por la varianza


muestral, con lo cual la varianza del estimador es realmente una estimacin de la
varianza poblacional del estimador. Esto se expresa mediante
. La desviacin
tpica de esta varianza estimada se denomina error estndar del estimador , y se
expresa mediante EE () , lo cual viene a ser equivalente a la notacin D () . El error
estndar de la media muestral es,

EE ( x )

9.2.

s
n

ESTIMACIN POR INTERVALOS DE CONFIANZA

No solamente interesa obtener un valor concreto del parmetro desconocido, sino


tambin una idea de la precisin de la estimacin. Con este objeto proporcionamos
un intervalo de valores, cuyos lmites son funcin de los valores muestrales, de forma
que tendr una gran probabilidad, 1 - , de contener al valor verdadero del parmetro
estimado. Es decir, se debe cumplir la condicin de que

P( L1 (x) L2 (x)) = 1 -
Cuanto menor sea el intervalo, mayor es la precisin del estimador.
Si cambia la muestra, tambin cambia los valores L1 y L2 , de manera que
tenemos unos intervalos aleatorios.
A la cantidad 1 - se denomina "coeficiente o nivel de confianza" y es el
coeficiente o nivel de significacin. Por lo general, es el 5% el 1%. Si tomamos
= 5% significa que de cada 100 intervalos que obtengamos para estimar , 95
contendrn al valor verdadero y desconocido del parmetro y 5 no lo contendrn.
-220-

9. Inferencia en poblaciones normales

Esta idea se expone en la Figura 9. 4.

Figura 9. 4. Concepto de intervalos de confianza

Para obtener intervalos de confianza elegimos una funcin g(x; ) cuya


distribucin, es conocida, y no depende del parmetro a estimar y que permite
despejar en funcin de todo lo dems. Vamos a verlo con casos sencillos que
estudiamos a continuacin.

9.2.1. Intervalo de confianza para la media poblacional

Si x procede de una poblacin normal N(; ) de


conocidas, entonces:

x-

= N(0;1)

n
y podemos obtener dos valores de la N(0;1) tales que

x-

P - z/2
+ z/2 = 1 -

despejando queda:

-221-

media y desviacin tpica

9. Inferencia en poblaciones normales


P - z/2
x - + z/2
= 1 -
n
n

de donde:


P x - z/2
x + z/2
= 1 -
n
n

Si la poblacional es desconocida, se tiene que

x-
= t n -1
s
n
y obtenemos unos valores de la t n-1 tales que:

x-
/2
/2

P - t n -1
+ t n -1 = 1 -

despejando queda:

s
s
P x - tn-/21
x + tn-/21
= 1 -
n
n

Y los lmites del intervalo son:

L1 ( x ) x - t n-/21

L2 ( x ) x t n-/21

s
n
s
n

Error de estimacin de la media poblacional


Si empleamos el estadstico x para estimar la media poblacional, el error de
estimacin es justamente la semiamplitud del intervalo de confianza, esto es,

z / 2

Si no conocemos la el error de estimacin es,

tn/2-1
-222-

s
n

9. Inferencia en poblaciones normales

Si el tamao N de la poblacin no es muy grande en relacin al tamao de la


muestra, a la varianza hay que aplicar el factor de correccin

N n
por poblacin
N 1

finita, y los errores de estimacin son,

z / 2

N n
N 1

t n/2-1

N n
N 1

Clculo del tamao muestral para un error determinado


Si deseamos saber cuntas unidades debemos evaluar para que nuestra
estimacin de la media poblacional no sea superior a un error determinado con un
nivel de confianza de 1 , despejando el tamao muestral n de las frmulas
anteriores del error, tenemos la expresin,

z 2
n

Si no conocemos la el valor de la n es,

s t / 2 s z 2

n n 1

2

Se aproxima a la normal para no tener que recurrir a tanteos al estar la


incgnita n en la frmula del clculo inicial.
Si la poblacin es finita, el valor de la n se despeja de sus expresiones
respectivas, donde aparece el factor de correccin por poblacin finita.

9.2.2. Intervalo de confianza para la varianza poblacional


Para una m.a.s. ( x1 , x2 ,..., xn ) extrada de una poblacin normal N(; ) , tenemos
que

(n 1)

s2

= 2n-1

y podemos calcular unos valores de la chi-cuadrado tales que

s2
P 2 (n 1) 2 2 = 1 -
n -1,

2
n-1,1- 2
-223-

9. Inferencia en poblaciones normales

despejando

2
1
1

= 1-
P 2

(n 1) s 2 2

n -1,
2
n-1,1- 2

2
(n 1) s 2
(
n

1
)
s
= 1-
P
2 2
2


n -1,
n -1,12
2

9.2.3. Intervalo de confianza para el cociente de varianzas poblacionales

Sea X 1 una m.a.s. extrada de una poblacin N(1; 1) , y X 2 otra m.a.s. extrada de
una poblacin N(2 ; 2) , se tiene que:

s12

12 =
s 22

F n1-1,n 2 -1

22
y podemos obtener unos valores de la F tal que:

P F 1n-1-1,/2n 2 -1

/2 = 1 -
F n1-1,n 2 -1
s

s12

2
1
2
2
2
2

12

2
1
1

2
P 1-/2 2 /2
= 1-
s1
F
F
n
n
1-1,n 2 -1
1-1,n 2 -1

s 22

s12
s12

2
2
s 22
s2

1
P /2
2 1-/2 = 1 -
F n1-1,n 2 -1 2 F n1-1,n 2 -1

-224-

9. Inferencia en poblaciones normales

Actividad 9.1:
En una planta de envasado de agua se toman al azar de la cadena de produccin 15
botellas, y se analiza para cada una de ellas el contenido de calcio en mg/l.,
resultando los siguientes valores:
25 29,4 28,1 27,5 31 27,7 24,7 33,1 32,2 29,4 33,3 28,4 31 26,8 33,3
Se pide:
a) Estimar la media poblacional y su error de estimacin con un nivel de
significacin del 5%.
b) Calcular un intervalo de confianza para la media poblacional, con un
coeficiente de confianza del 95%.
c) De antemano se sabe que la varianza es 9, cunto vale el intervalo de
confianza al 95% para la media poblacional?
d) Cuntas botellas se deben examinar para estimar la media poblacional con
un error menor del 1 mg/l y un nivel de confianza del 95%?

9.2.4. Intervalo de confianza para la proporcin


Si de una poblacin con proporcin poblacional de defectuosas p 0 tomamos una
muestra aleatoria de tamao n y observamos el nmero X de piezas defectuosas,
como el valor de X sigue una distribucin binomial, y sta se puede aproximar a una
distribucin normal, un intervalo de confianza para la proporcin p0 , viene dado por,

p z/2

p q
p0 p z/2
n

p q
n

Siendo p la proporcin muestral, esto es,

p f

x
n

Si p fuera la proporcin de defectos entre las n piezas, entonces X sigue una


distribucin de Poisson, y como se puede aproximar a una distribucin normal, el
intervalo de confianza para la proporcin de defectos es,

p z/2

p
p
p0 p z/2
n
n
-225-

9. Inferencia en poblaciones normales

Error de estimacin de la proporcin


El error de estimacin de la proporcin de unidades defectuosas viene dado
por la expresin que hay a la derecha del del intervalo de confianza para la
proporcin, esto es,

pq
n

z/2

Para el caso de poblacin finita, hemos de adjuntar a la varianza el factor de


correccin

N n
, y el error es,
N 1

z/2

pq
n

N n
N 1

Si no conocemos la p poblacional, hay que obtener una estimacin previa p ,


o bien ponernos en el caso ms desfavorable, y es considerar que el producto
pq=0,25, que es lo mximo que puede ser dicho producto.
El tamao muestral para un error determinado se obtiene despejando n de las
expresiones anteriores.
Si estamos estimando la proporcin de defectos, el intervalo de confianza se
basa en la distribucin de Poisson, y resultan las mismas expresiones pero quitando
la q, es decir, cambiando pq por p. Las expresiones de los errores son,

z/2

p
n

z/2

p
n

N n
N 1

Actividad 9.2:
De una produccin de componentes electrnicos se examinaron 75, y resultaron 5
defectuosos.
a) Calcular un intervalo de confianza para la proporcin de componentes
defectuosos.
b) Cuntas piezas se deben examinar para estimar el valor verdadero de la
proporcin de piezas defectuosas con un error menor de 0,01 y una confianza
de 95%?
c) Calcular el tamao muestral si no conocemos un valor previo de p.
d) Calcular el tamao muestral si tenemos una estimacin previa de p=0,04.
-226-

9. Inferencia en poblaciones normales

e) Caso de suponer una poblacin finita de N=1000 bujas.


f) Mismo enunciado que el anterior, pero suponiendo que deseamos estimar la
proporcin de defectos por unidad de buja.

9.2.5. Intervalo de confianza para la diferencia de proporciones


Si de una poblacin de proporcin de defectuosas p1 tomamos una muestra aleatoria
de tamao n1 y observamos que hay X1 defectuosas; y de otra poblacin de
proporcin de defectuosas p2 tomamos una muestra aleatoria de tamao n2 y
observamos el nmero de defectuosas X2, como tanto X1 como X2 siguen
distribuciones normales, si los tamaos de muestra son suficientemente grandes, la
diferencia

X1 X 2

n1
n2
tambin sigue una distribucin normal, y un intervalo de confianza para la diferencia
de proporciones viene dado por,

p 1 - p 2 z / 2

p 1 q1

n1

p 2 q 2
n2

p1 - p 2 p 1 - p 2 z / 2

p 1 q1

n1

p 2 q 2
n2

Donde,

p 1 f1

x1
n2

p 2 f 2

x2
n2

Si las proporciones se refieren a defectos por unidad, el intervalo de confianza


es el mismo, pero cambiando el producto de pq por p, esto es,

p 1 - p 2 z / 2

p 1
n1

p 2
n2

p1 - p 2 p 1 - p 2 z / 2

p 1
n1

p 2
n2

Actividad 9.3:
De una muestra de 400 alumnos de la ETSII, 27 de ellos dijeron que fumaban
habitualmente, en cambio de una muestra de 500 alumnos de la Bellas Artes dijeron
que fumaban 35. Se pueden considerar que el porcentaje de fumadores en BBAA
es bastante superior al de la ETSII?

-227-

9. Inferencia en poblaciones normales

9.2.6. Intervalo de confianza para la diferencia de medias poblacionales


Si de una poblacin normal N(1;1 ) , extraemos una muestra de tamao n1 y
calculamos la x1 ; y de otra poblacin normal N( 2 ; 2 ) extraemos otra muestra
aleatoria de tamao n2, y observamos x 2 , como la diferencia x1 x 2 sigue una
distribucin normal,

2 2
x1 x2 N 1 2 ; 1 2

n1 n2

Un intervalo de confianza para la diferencia de medias poblacionales, siempre


y cuando los tamaos muestrales sean bastante elevados, es,

x1 - x2 z/2

12 + 22 -
12 + 22
x1 x2 z/2
1
2
n1

n2

n1

n2

En el caso de no conocer las varianzas poblacionales 2 las estimamos a


partir de las varianzas muestrales s 2 y el intervalo de confianza es,

/2
x1 - x2 t n1+n 2 2

s12

n1

s 22
n2

1 2 x1 - x2 tn1/2+n 2 2

s12

n1

s 22
n2

Si admitimos que las varianzas poblacionales son iguales pero desconocidas,


la varianza comn la estimamos a partir de una ponderacin de las varianzas
muestrales, esto es,

( n1 - 1) s12 + ( n2 - 1) s 22
s =
n1 + n2 - 2
2

Y el intervalo de confianza es,


/2

x1 - x2 t n1+n 2-2 s

1
n1

1
n2

1 2 x1 - x2 tn1/2+n 2-2 s

1
n1

1
n2

Actividad 9.4:
1. Un almacenista de pilas alcalinas desea conocer la duracin media de las pilas que
ofrece un nuevo proveedor. Para ello ha tomado 12 pilas al azar y ha medido el
tiempo de duracin en horas. Los resultados han sido:

-228-

9. Inferencia en poblaciones normales

Duracin(hrs.)
27.5
31.2
33.4
29.8
25.4
30.5
31.7
26.3
29.2
32.1
30.8
28.6
a)
b)
c)
d)

Cul es la estimacin de la duracin media.


Cul es la estimacin de su dispersin?
Qu error se comete en la estimacin de la duracin media?
Calcular los intervalos de confianza para la duracin media y la dispersin de
la duracin de la pilas.

2. El almacenista anterior tiene la oportunidad de comprar pilas alcalinas de otro


nuevo proveedor que afirma que las que l fabrica tiene una mayor duracin. Para
ello el almacenista extra 10 pilas de este nuevo proveedor y mide la duracin de las
mismas. Los resultados han sido:
Duracin(hrs.)
31.3
33.5
34.2
29.4
28.5
30.7
32.9
31.7
30.3
32.1
a)
b)
c)
d)
e)

Estimar la media y la varianza de la duracin de las pilas.


Calcular los errores de estimacin.
Calcular el intervalo de confianza para diferencia de medias.
Estimar el intervalo de confianza para la desviacin tpica.
Contrastar la hiptesis de que el segundo proveedor es mejor que el
-229-

9. Inferencia en poblaciones normales

f)

primero.
Contrastar la hiptesis de igualdad de varianzas.

3. En la tabla siguiente se recogen medidas de desgaste de las suelas de zapatos de


10 chicos. Las suelas se fabricaron de dos materiales sintticos A y B. La pregunta a
contestar es, hay diferencias entre el material A y el B en cuanto a desgaste de la
suela de zapato.

Chico
1
2
3
4
5
6
7
8
9
10

Material A
13,2
8,2
10,9
14,3
10,7
6,6
9,5
10,8
8,8
13,3

Material B
14,0
8,8
11,2
14,2
11,8
6,4
9,8
11,3
9,3
13,6

Diferencia(B-A)
0,8
0,6
0,3
-0,1
1,1
-0,2
0,3
0,5
0,5
0,3

El material se asign de forma aleatoria a cada zapato.


a) Obtener un intervalo de confianza para la diferencia de la media del desgaste
entre los dos tipos de materiales.

9.3.

TEST DE HIPTESIS

Conceptos
Una hiptesis es una afirmacin acerca de algo. Por ejemplo, el parmetro es igual
a cero. Bajo esta suposicin estudiamos los datos y su comportamiento, y si no hay
mucha discrepancia entre lo observado y lo esperado, aceptamos tal afirmacin,
cuanto menos decimos que no hay suficiente evidencia como para rechazar la
hiptesis establecida.
En consecuencia, se plantea el problema como una toma de una de las dos
decisiones siguientes:
-230-

9. Inferencia en poblaciones normales

d 0 = acepto la afirmacin planteada.


d 1 = rechazo la afirmacin planteada.
La afirmacin que realizamos se llama "hiptesis nula" y casi siempre va
ligada a lo que es habitual indicando que hay nulo cambio; y la contraria se llama
"hiptesis alternativa".
Si la hiptesis respecto del valor de un parmetro se reduce a un punto,
decimos que la hiptesis es "simple", y si se trata de un conjunto de puntos, decimos
que la hiptesis es "compuesta".
Hiptesis simples son H0(=0) frente a la alternativa H1(=1). Hiptesis
compuestas son H0( 0) frente a la alternativa H1( 1). As pues, podemos tener
H0(=0) vs
H1(0)
que es un test bilateral cuando los valores alternativos estn a ambos lados del valor
supuesto, y
H0(0)
H0(0)

vs
vs

H1(>0)
H1(<0)

o bien
o bien

H0(=0)
H0(=0)

vs
vs

H1(>0)
H1(<0)

que son test unilaterales, porque los valores alternativos estn a un lado del valor
supuesto.
La hiptesis alternativa es la ms fuerte, y se suele colocar como hiptesis
nula aquella cuyas consecuencias econmicas sean ms graves. Es decir, la
hiptesis nula tiende a ser ms conservadora, de modo que no cambia su
formulacin a menos de que no haya evidencias objetivas muy fuertes en su contra.

Regin de aceptacin y de rechazo


Una vez planteadas la hiptesis nula y la alternativa, el problema consiste en
tomar una muestra de la poblacin, y a partir de ella decidir si aceptar o rechazar la
hiptesis nula, en funcin de la coherencia de los valores muestrales con la hiptesis
nula establecida.
Esto equivale a dividir el espacio muestral en dos zonas. Si el punto muestral
cae en la zona de aceptacin, que llamamos X0(s), aceptamos H0, y si cae en la zona
de rechazo X1(s) aceptamos H1, lo cual implica rechazar H0. La letra "s" indica la
particin efectuada. Esquemticamente es como aparece en la Figura 9. 5.

-231-

9. Inferencia en poblaciones normales

Figura 9. 5. Test de hipotesis

Encontrar el test significa encontrar la subdivisin del espacio muestral que


minimiza las prdidas de las decisiones errneas, segn la matriz de prdidas

Decisin\Espacio paramtrico

0 0

d0

0, decisin correcta

d1

Error 1 ()

1 1

W(d1,0)

Error 2 ()

W(d0,1)

0, decisin correcta

Suponemos que cuando la decisin es la correcta, la prdida es cero.

Errores de primera y segunda especie


En el contraste de hiptesis se pueden cometer dos errores:
1) Rechazar H 0 , cuando realmente es verdadera.
2) Aceptar H 0 , cuando realmente es falsa.
El primero de ellos se llama error de primera especie o tipo I cuya probabilidad
es , y viene dado por,
= P(x X 1 (s)/ 0 )
y el segundo es el error de segunda especie o tipo II cuya probabilidad es , y es

= P(x X 0 (s)/ 1 )

-232-

9. Inferencia en poblaciones normales

x/n

x/n

LI

LS

Figura 9.6. Valor de la

Para un contraste de hiptesis nos interesara que tanto como sean cero,
o ambos lo ms pequeo posible. Lo primero no se puede conseguir salvo que
analicemos toda la poblacin. Para conseguir lo segundo bastara con aumentar
suficientemente el tamao de la muestra con lo que aumentamos nuestra informacin
y reducimos la probabilidad de equivocarnos. De tal forma que si hacemos =0, se
cumple, para una misma n, que =1; y al contrario, si hacemos que =0, para una
misma n, se cumple que =1.
La Potencia del test se define como:

Pot s ( ) = P(x X 1 (s)/ )


es decir, la probabilidad de rechazar la hiptesis nula en funcin del valor del
parmetro. El mejor test es aquel que para =0 la potencia es mnima y para otro
valor sea mxima.
La curva caracterstica es la complementaria de la curva de potencia, es decir,
CC ( ) P(aceptar H 0 / )

-233-

9. Inferencia en poblaciones normales

Pa
1
1-

Pr
1

1-
1-

1-
0

Curva Caracterstica

Curva de Potencia

Figura 9. 7. Potencia del test

Obtencin de los tests


La forma prctica de obtencin del test de hiptesis es la siguiente: bajo el supuesto
de que se cumple la hiptesis nula H0, observamos un estadstico "T", funcin de la
muestra, que seguir un determinado tipo de distribucin, y por lo tanto ser muy
probable que el valor observado est dentro del campo de existencia de la
distribucin T. Esta idea aparece representada en la Figura 9. 8.

Intervalo Esperado

LI

LS

Figura 9. 8. Distribucin del estadstico T

Pero si el valor observado cae fuera del intervalo esperado, esto est en
contradiccin con la hiptesis nula, lo cual nos lleva a rechazarla. Por lo general, el
intervalo esperado corresponde al 1 - de los datos, siendo = 5% .
Tambin se puede decir que si la probabilidad de obtener un valor mayor que
-234-

9. Inferencia en poblaciones normales

el observado, el cual viene dado por:


P(T > Tobserv ) = p - value

es muy pequeo, p - value < , entonces es algo raro, bajo el supuesto de que se
cumpla la hiptesis nula, lo cual nos lleva a rechazarla.
Es decir, que admitimos un cierto nivel de discrepancia entre lo esperado y lo
observado, pero si la discrepancia es muy grande, esto lleva a rechazar la hiptesis
nula.
Con este razonamiento encontramos los principales test, que vemos a
continuacin.

9.4. TEST DE HIPTESIS PARMETRICOS

9.4.1. Contrastes de la media de una poblacional normal


Las hiptesis que planteamos son H 0 ( = 0 ) frente a H 1 ( 0 ) , supuesto que
la varianza poblacional sea conocida. El estadstico a emplear es:

T=

x - 0

= N(0;1) Z

n
y bajo el supuesto de la hiptesis nula, se cumple que:

P(- z/2 < T < + z/2 ) = 1 -


y si la T observada resulta

| T 0 |> z/2
entonces se rechaza la hiptesis nula.
Si la varianza poblacional es desconocida, empleamos el estadstico t:

-235-

9. Inferencia en poblaciones normales

T=

x - 0
= t n -1
s
n

y bajo el supuesto de la hiptesis nula, se cumple que:

P(- tn-/21 T + tn-/21 ) = 1 -


luego, si

| T0 |> tn-/21
rechazamos la hiptesis nula.
Grficamente es segn la Figura 9. 9.

Zona de rechazo

Zona de aceptacin

LI

LS

Figura 9. 9. Zonas de aceptacin y de rechazo

El test "s" es mejor que el "t" para contrastar H o ( = 0 ) .

Pr
1

s
t

0
-236-

9. Inferencia en poblaciones normales

Figura 9. 10. Comparacin de test 0=15

Con este planteamiento tambin se puede resolver un test a un slo lado, por
ejemplo

H 0 ( > 0 ) frente a H 1 ( 0 ) con conocido


El estadstico a observar es el mismo

T=

x - 0

n
las zonas de aceptacin y de rechazo son segn la Figura 9. 11.

Zona de rechazo

Zona de aceptacin

LI
Figura 9. 11. Test unilateral

Esto significa que el rea en lugar de repartirse a ambos lados, slo est
en el lado de H 1 , ya que bajo H0 ( > 0) , lo normal es que la t observ. se vaya hacia la
izquierda de la figura.
De esta forma, si:

T observ.> - z
aceptamos la H0.
De forma anloga, si el test de hiptesis es,

H 0 ( 0 ) frente a H 1 ( 0 ) con conocido


Las zonas de aceptacin y de rechazo se muestran en la figura siguiente,
-237-

9. Inferencia en poblaciones normales

Zona de rechazo

Zona de aceptacin

LI

LS

Actividad 9.5
Un proveedor de pilas alcalinas del tamao de R6 asegura que pueden funcionar por
trmino medio hasta 40 horas. El comprador de las pilas, para contrastar tal
afirmacin, prueba 9 de ellas y observa el tiempo de duracin de cada uno de ellas.
El resultado ha sido:
40,5 39,5

41

42

37

35

43

41,5 42,5

a) Se puede aceptar la afirmacin del proveedor?


b) Cunto vale el p-valor del test?
c) Si realmente la duracin de las pilas fuera de 35 horas, cul ser la
probabilidad de aceptar que funcionan por trmino medio 40 horas?
d) Cul ser el tamao muestral a tomar por que la probabilidad de aceptar la
hiptesis nula sea del 60%

Aplicacin del test de hiptesis para la media poblacional


En funcin de la escala de la x , la zona de aceptacin del test H0(=0) frente
a H1(0) es,

X 0 ( s) x / 0 z / 2
x 0 z / 2

n
n

Que grficamente es colocar dos lneas, la LCS y la LCI, siendo,


LCS= 0 z / 2

LCI= 0 z / 2

-238-

0
n

9. Inferencia en poblaciones normales

Tomamos una muestra de tamao, calculamos su media muestral, y si este


valor est entre el LCI y el LCS, aceptamos que la media poblacional no se ha
modificado.

Rechazamos H0
LCS
Aceptamos H0
LCI

Muestra 1

Muestra 2

Figura 9. 12. Grfico de control para la media poblacional

Clculo de la
Para el test H0(=0) frente a H1(0), si la media en lugar de 0 cambia a
1 , la probabilidad de que un punto muestral est dentro de los lmites de aceptacin

es,

P ( LCI x LCS ) P z
x z

2 n
0

2 n 1

Suponiendo que la no haya cambiado, para obtener la probabilidad


tipificamos, pero ahora la distribucin de x es x N(1;

) y el valor de la

1 0 z / 2
1
0 z / 2
n
n

n
n

Sustituyendo valores calcularamos el valor de .

Tamao muestral
Si nos dan dos puntos de la curva caracterstica (0 ,1 ) y (1;) , el tamao
de muestra para realizar el contraste de hiptesis, se obtiene imponiendo que la
-239-

9. Inferencia en poblaciones normales

curva caracterstica pase por esos dos puntos y despejando el valor de n se tiene,

z / 2 z
n
d

Donde d

1 0

z z

/ 2 2 2

es el descentrado relativo, y 1 0 .

9.4.2. Test de hiptesis para la varianza poblacional


El mismo razonamiento se aplica para la varianza poblacional. As para el contraste
2
2
2
2
H 0 ( = 0 ) frente a H 1 ( 0 )

empleamos el estadstico
2
observ
. = ( n 1)

s2

2
0

2n-1

y por lo tanto se pueden calcular unos valores de la chi-cuadrado tales que:

P( 2n-1,1-/2 2n1 2n-1,1-/2 ) = 1 -


2
y en consecuencia, si la observ
. est fuera de ese intervalo, rechazamos la hiptesis

nula H 0 ( 2 = 02 ) .
Para el contraste de
2
2
2
2
H 0 ( = 0 ) frente a H 1( > 0 )
2
si el valor de la observ
. se va hacia la derecha, da ms peso a H 1 que a H 0 , luego el

rea se va hacia la derecha. Grficamente es segn la Figura 9. 13.

-240-

9. Inferencia en poblaciones normales

1-

2n-1()

2n-1

Figura 9. 13. Zona de rechazo.


2
Si observ
. > n-1, , rechazamos la H 0
2

Actividad 9.6.
La duracin de las pilas alcalinas se sabe que tiene una desviacin tpica de 3
minutos. Para comprobar que una nueva remesa de pilas tienen la misma dispersin,
se prueba 11 de ellas y la desviacin tpica muestral ha sido s=3,7. Se puede decir
que la dispersin es mucho mayor en esta segunda remesa?

9.4.3. Test de hiptesis para el cociente de varianzas poblacionales


Anlogamente, para contrastar
2
2
2
2
H 0 ( 1 = 2 ) frente a H 1 ( 1 2 )

el estadstico a observar es:

s12
F observ.=

12 =
F n -1,n -1
2
s2

22
que bajo el supuesto de que 12 = 22 , el estadstico se reduce a:

-241-

9. Inferencia en poblaciones normales

F observ.=

s12
= F n1-1,n 2-1
s 22

Tomando como s1 la mayor de las cuasivarianzas muestrales, el cociente


deber ser la unidad, pero si es un poco mayor que la unidad, todava no hay
evidencia de que 12 22 , pero si el cociente es bastante mayor que la unidad,
entonces si hay razn para pensar que 12 22 .

Fn(1)1, n2 1

Fn1 1, n 2 1

Figura 9. 14. Zona de rechazo

Ese bastante nos lo indica el cociente de varianzas muestrales, de forma que


si F observ.> F n1/2-1,n2-1 , rechazamos la H 0 , y podemos decir que 12 > 22 .

Actividad 9.7.
De una remesa de 11 pilas alcalinas la desviacin tpica ha sido de 3,7 y de una
segunda remesa de 13 pilas alcalinas la desviacin tpica ha sido de 4,6. Se puede
decir que la dispersin de la segunda remesa es mucho mayor que la dispersin de la
primera?

9.4.4. Contrastes de proporciones


Para contrastar si el porcentaje de defectos de un lote de piezas es p0 , muestreamos
n piezas al azar del lote, y observamos el nmero X de piezas defectuosas. En
principio, si el tamao del lote es grande en comparacin con la muestra, X sigue una
-242-

9. Inferencia en poblaciones normales

distribucin Binomial B(n,p), pero si np>5, se puede aproximar a una distribucin


normal X N(np; np(1 - p) ) . Con ello bajo el supuesto de que p = p0 la cantidad X
se distribuye segn una N( np0 ; np0 (1 - p0 ) ) y tipificando se tiene:

z=

X - n p0
np0 (1 - p0 )

Esta cantidad Z sigue una distribucin N(0;1), de forma que el valor observado
cabe esperar que est dentro del campo de existencia de la normal tipificada, con
una probabilidad del 95% (tomando = 0,05 ). En caso de que ocurra lo esperado,
no hay razn para rechazar la hiptesis nula de que p = p0 . Es decir, la regin de
aceptacin del test es,

- z/2 < z < + z/2


y la regin de rechazo es la contraria,

| z | > z/2

Actividad 9.8
De un contenedor con 10000 piezas se afirma que el porcentaje de defectuosas es
del 2%. Para contrastarlo se toma una muestra de 50 unidades y se observa que hay
2 defectuosas.
a) Es eso coherente con la hiptesis nula de que el porcentaje es del 2%?
b) Cunto vale el p-valor del test?
c) Si viniera un contenedor con un porcentaje del 5%, cul ser la probabilidad
de aceptar la hiptesis nula?
d) Si queremos que la probabilidad anterior fuera de 0,40 qu tamao de
muestra debemos tomar?

Clculo de la para un proporcin


Para el test H 0 ( p p0 ) frente a H 1 ( p p0 ) los lmites de la zona de
aceptacin son,

-243-

9. Inferencia en poblaciones normales

LCS p 0 z / 2

p0 q0
n

LCI p 0 z / 2

p0 q0
n

Si la proporcin fuera p1, el valor de es,

p0q0
pq
p p0 z / 2 0 0 / p1 )
n
n

P( LCI f LCS / p1 ) P( p0 z / 2

Cuando p0 cambia a p1, la f sigue una distribucin normal N ( p1 ;

p1 q1
),
n

pero los lmites de la zona de aceptacin no cambian, y el valor de es,

p q
p q
p 0 z / 2 0 0 p1
p 0 z / 2 0 0 p1

n
n

p1 q1
p1 q1

n
n

Sustituyendo valores, calcularamos el valor de .


Para la proporcin de defectos(defectos por unidad), es todo igual pero
cambiando pq por slo p.

Grficos de control para la proporcin de piezas defectuosas


Para controlar que la proporcin de piezas defectuosas de un proceso
industrial se mantiene en un nivel de p0 , tomamos una muestra al azar de tamao n
y observamos la proporcin muestral,

p f

x
n

Siendo x el nmero de piezas defectuosas que aparecen en la muestra.


Las sucesivas muestras de tamao n, vamos graficando en ordenadas el valor
de dicha proporcin muestral, y siempre que la misma est dentro de unos lmites de
aceptacin para el test H 0 ( p p0 ) frente a H 1 ( p p0 ) diremos que el proceso est
bajo control, tal y como se refleja en la figura de abajo.

-244-

9. Inferencia en poblaciones normales

Rechazamos la H0

f=x/n

LCS p 0 z / 2

p 0 q0
n

LCI p 0 z / 2

Muestra 1

p 0 q0
n

Tiempo

Muestra 2

Aceptamos la H0
Figura 9. 15. Grfico de control para la proporcin de defectuosas

Siempre que la proporcin observada de la muestra est dentro de dichos


lmites, asumiremos que el proceso se encuentra dentro de lo que cabe esperar, pero
cuando un punto salga de dichos lmites, habr que buscar la causa del cambio del
proceso.

Tamao muestral
Si nos dan dos puntos de la curva caracterstica (0 ,1 ) y (1;) , el tamao
de muestra para realizar el contraste de hiptesis, se obtiene imponiendo que la
curva caracterstica pase por esos dos puntos y despejando el valor de n se tiene,
z / 2 p0 q0 z pq

p
0

Para la proporcin de defectos (defectos por unidad), el tamao de muestra a


tomar para que el test pase por los dos puntos de la curva caracterstica es,
z
p z p

n /2 0

p
0

-245-

9. Inferencia en poblaciones normales

9.4.5.
Test de hiptesis para la diferencia de medias poblacionales con
muestras independientes
Si partimos de dos poblaciones de dos poblaciones que siguen distribuciones
N(1,1) y N(2 , 2) respectivamente, para realizar el contraste de,
H (1 2 )

frente a

H (1 2 )

Tomamos una muestra de tamao n1 de la primera poblacin y otra muestra


de tamao n2 de la segunda poblacin, calculamos las medias muestrales de cada
muestra, y observamos el estadstico,

( x1 x2 ) ( 1 2 )
12 22

n1 n2

El cual sigue una normal tipificada. Si el valor de T cae dentro de la zona de


aceptacin (1-) no hay razn para rechazar la hiptesis nula. El rea de aceptacin
es,
z / 2 T z / 2
En el caso de que 1 y 2 sean desconocidas pero iguales, la comn la
estimamos mediante,

s12 (n1 1) s 22 (n2 1)


n1 n2 2

Y el estadstico

( x1 x 2 ) ( 1 2 )
s

1
1

n1 n2

Sigue una t de Student con n1+n2-2 grados de libertad.


Si

t n1 / 2n2 2 T t n1 / 2n2 2
Aceptamos la hiptesis nula de igualdad de medias.
Para el contraste unilateral

H (1 2 )

frente

Aceptamos la H0 cuando
-246-

H (1 2 )

9. Inferencia en poblaciones normales

T t n1 n2 2

9.4.6. Test
apareados

para

la

diferencia

de medias

poblacionales con

datos

Se trata de un contraste para la diferencia de medias de dos poblaciones, pero en


que las muestras obtenidas no son independientes, sino que estn de alguna forma
relacionadas una a una, de manera que el tamao de las muestras es el mismo. Es
tpico el caso de que de un elemento de la poblacin realizamos mediciones antes y
despus de un tratamiento y queremos contrastar si hay diferencias debido al
tratamiento.
El tamao de la muestra es n, y para cada elemento tenemos las
observaciones x1i y x2i, la primera y segunda medicin, y deseamos contrastar si las

d i x1i x2i
son por trmino medio cero. Es decir, el test de diferencias de medias,

H (1 2 )

frente a H (1 2 )

Se reduce al test

H ( d 0)

frente a H ( d 0)

Para ello aplicamos este test a la variable di y observamos el estadstico,

T
n

Donde d

di
i 1

y sd

(d
i 1

d 0
sd

d )2

n 1

Si tn/12 T tn/12 aceptamos la hiptesis nula de igualdad de medias y en


caso contrario la rechazamos.

-247-

9. Inferencia en poblaciones normales

Actividad 9.9.
En la tabla siguiente se recogen medidas de desgaste de las suelas de zapatos de 10
chicos. Las suelas se fabricaron de dos materiales sintticos A y B. La pregunta a
contestar es, hay diferencias entre el material A y el B en cuanto a desgaste de la
suela de zapato.
Chico
1
2
3
4
5
6
7
8
9
10

Material A
13,2
8,2
10,9
14,3
10,7
6,6
9,5
10,8
8,8
13,3

Material B
14,0
8,8
11,2
14,2
11,8
6,4
9,8
11,3
9,3
13,6

Diferencia(B-A)
0,8
0,6
0,3
-0,1
1,1
-0,2
0,3
0,5
0,5
0,3

Las mediciones son las alturas que restan en las suelas de los zapatos.
El material se asign de forma aleatoria a cada zapato.
a) Suponiendo que los datos fueran independientes, hay diferencias entre el
material A y B?
b) Como los datos se han obtenido a pares (son dependientes), qu material es
el mejor?

9.4.7. Test para la diferencia de proporciones


Se trata de un contraste para comprobar si las proporciones de dos poblaciones son
iguales o distintas. Suponemos que la primera poblacin tiene una proporcin p1 de
una determinada caracterstica, y de sta tomamos una muestra al azar de n
elementos, y la segunda poblacin tiene una proporcin p2 de la misma caracterstica,
y tomamos una muestra al azar de n2 elementos.
El test que plantamos es

-248-

9. Inferencia en poblaciones normales

H ( p1 p2 )

frente a H ( p1 p2 )

El cual equivale a,

H ( p1 p2 0)

frente a H ( p1 p2 0)

Para su contraste empleamos el estadstico,

( f1 f 2 ) (0)
1 1
p (1 p )
n1 n2

donde

x1 x 2
n1 n2

f1

x1
n1

f2

x2
n2

Siendo x1 y x2 el nmero de elementos de la muestra que poseen la


caracterstica que estamos estudiando.
Bajo el supuesto de que se cumpla la H0 , y n1 y n2 lo suficientemente grandes,
el estadstico T se distribuye segn una normal tipificada.
Si z / 2 T z / 2 aceptamos la hiptesis nula con un nivel de significacin
de , y en caso contrario rechazamos la hiptesis nula.

Actividad 9.10
Se quiere comprobar si dos lotes con un determinado tipo de componente presenta el
mismo porcentaje de unidades defectuosas. Para comprobarlo se sacan 40 piezas
del primer lote y resulta que hay 2 defectuosas; y despus se sacan 50 piezas del
segundo lote y resulta que hay 4 piezas defectuosas.
a) Podemos afirmar que el porcentaje es el mismo?
b) Cunto vale el p-valor del test?

-249-

9. Inferencia en poblaciones normales

9.4.8. Test de ajuste a una distribucin


Cuando observamos unos datos extrados al azar de una poblacin se plantea la
hiptesis de si dicha poblacin sigue una determinada distribucin o por el contrario
los datos no se puede decir que proceden de dicha poblacin supuesta.
Vamos a plantear el test de ajuste a una distribucin mediante un ejemplo
sencillo, como es la distribucin aleatoria del los puntos extrados al lanzar un dado.
La funcin de probabilidad es,

P( X x i )

1
para
6

x i 1,2,3,4,5,6

El objetivo de la prueba es comprobar si un dado est trucado o no. Para ello


lanzamos el dado 60 veces y anotamos la frecuencia de cada cara. Imaginemos que
el resultado haya sido.
OBSERVADO ESPERADO
9
10
13
10
7
10
14
10
12
10
5
10
A la vista de los resultados, podemos decir que el dado est bien?
Bajo el supuesto de que el dado est bien la frecuencia esperada de cada xi
es

1
nP( xi ) 60 10
6
Si observamos que las frecuencias fluctan alrededor del valor de 10, diremos
que no hay motivo para pensar que el dado est trucado. Pero si las frecuencias que
observamos se separan mucho de 10, habr motivo para pensar que el dado
realmente est trucado, ya que existen valores que se escapan de lo que cabe
esperar.
Cmo decimos que hay mucha diferencia respecto de lo que esperamos?
Para medir est diferencia empleamos el estadstico Chi-cuadrado, cuya
expresin es,
k

c
i 1

(Oi E i ) 2
k21
Ei

donde:
o i = frecuencia observada del valor xi .
-250-

9. Inferencia en poblaciones normales

e i = frecuencia esperada del valor de xi .

Las hiptesis que se plantean son:


H0(los datos siguen la distribucin del dado) frente a H1(los datos no siguen la
distribucin del dado)
Bajo el supuesto de la H0 se demuestra que el estadstico c2 sigue una
distribucin 2 de k-1 grados de libertad, donde k es el nmero de intervalos o
nmero de sumas de la chi-cuadrado.
La aplicacin del test consistir-a en calcular la cantidad c2 y si

Si

c2 k21,

aceptamos la H0

Si

c2

rechazamos la H0.

k21,

O bien calculamos el p-valor del estadstico c2 , esto es,

p valor P k21 c2

Y si,
El p-valor > aceptamos la H0
El p-valor < rechazamos la H0 .
En la siguiente hoja de clculo EXCEL hemos realizado la aplicacin de este
test.
OBSERVADO ESPERADO CONTRIBUCION
9
10
0,1
13
10
0,9
7
10
0,9
14
10
1,6
12
10
0,4
5
10
2,5
Suma
6,4
p-valor,

0,269218814

Por lo tanto no podemos rechazar que el dado sea correcto con =0,05.

-251-

9. Inferencia en poblaciones normales

En resumen, para comprobar si unos datos ( x1 , x2 ,...., xn ) se ajustan a una


determinada distribucin aleatoria con funcin de distribucin F(x), el procedimiento a
seguir es:
1) Dividir el campo de existencia de la v.a. X en k intervalos disjuntos, a ser
posible equiprobables (con igual probabilidad de pertenecer a uno de los
intervalos).
2) Contar el nmero de datos que caen en cada intervalo. Esto es las oi .
3) Calcular la frecuencia esperada en cada intervalo, mediante ei npi .
4) Calcular la cantidad
k

c
i 1

(Oi E i ) 2
k2 s 1
Ei

donde s es el nmero de parmetros que definen la F(x) estimados a partir de los


propios datos.
Si para calcular la pi debemos conocer los parmetros de la distribucin,
entonces los grados de libertad k-1 se reducen con el nmero s de parmetros que
estimamos a partir de los propios datos.
Por ejemplo, si X es una normal debemos conocer la media y la sigma. Pero
si son desconocidos, hay que estimarlos a partir de los propios datos. De este modo,
para este caso el valor de la s=2.
Comprobamos si la c2 cae dentro de la zona de aceptacin, con lo cual
decimos que los datos siguen esa funcin de distribucin F(x), o si caen el la zona de
rechazo, y decimos que no se admite que los datos siguen esa F(x).
Para que el test funcione bien, un requisito es que la frecuencia esperada sea
al menos de 5, esto es, que n pi 5 . En caso de que algn intervalo no cumpla esta
condicin, se combina con los anteriores o posteriores para cumplir que la frecuencia
esperada al menos sea de 5.

9.4.9. Test de independencia


En muchas ocasiones clasificamos a los elementos de una poblacin en funcin de
dos caractersticas, la A y la B, donde la caracterstica A tiene r posibles valores, y la
B tiene c posibles valores. La clasificacin de cada elemento segn el valor de A y el
valor de B da lugar a una tabla de doble entrada, filas y columnas, que recibe el
nombre de tabla de contingencia. Por ejemplo, la tabla de turno de fabricacin en
filas y nmero de defectos de calidad en cada coche en columnas.
-252-

9. Inferencia en poblaciones normales

La pregunta que se formula es tiene algo que ver el turno de trabajo con el
que aparezcan ms o menos defectos de calidad? En definitiva, se trata de
comprobar si la caracterstica A es independiente de la caracterstica B, es decir,
plantemos un test de independencia entre las dos caractersticas.
Recordamos la notacin expuesta en el tema de estadstica descriptiva
bidimensional.
1

total

1
2
i

nij

ni

n j

I
total
Y llamando a:
pi = probabilidad de pertenecer a la clase i de la caracterstica A.
p j = probabilidad de pertenecer a la clase j de la caracterstica B.

La probabilidad de pertenecer a la clase Ai y a la clase Bj es,

P( Ai B j )
Y bajo el supuesto de independencia, se cumple que,

pij P( Ai B j ) P( Ai )P( B j ) pi p j
Y las hiptesis son,

H 0 ( pij pi p j

i, j ) frente a H 1 ( pij pi p j

a menos un par i, j )

Para comprobar esta hiptesis aplicamos el estadstico chi-cuadrado como,


r

c2

(oij eij ) 2

i 1 j 1

eij

Donde:
o ij = frecuencia observada en la casilla i,j.
e ij = frecuencia esperada en la casilla i,j.

-253-

9. Inferencia en poblaciones normales

Bajo el supuesto de independencia, e ij se calcula como

eij pij n pi p j n
Siendo

pi

ni
n

p j

n j
n

Que sustituyendo queda,

eij

ni n j
ni n j
n
n n
n

Y bajo la H0 la cantidad c2 se distribuye segn una Chi-cuadrado de (r-1)(c1) grados de libertad. La regla de decisin es,
Si c ( r 1)( c 1), aceptamos la H0.
2

Si c ( r 1)( c 1), rechazamos la H0.


2

O bien calculando el

p valor P (2r 1 )( c1 ) c2 ,

Si p-valor > aceptamos la H0.


Si p-valor < rechazamos la H0.
Para que funcione bien el test la frecuencia esperada en cada casilla debe ser
superior a 5.
Para el contraste de igualdad de proporciones de varias poblaciones o para la
igualdad de varias poblaciones (contraste de homogeneidad), los datos se clasifican
como una tabla de contingencia y se aplica el mismo procedimiento que el visto en el
test de independencia.

Actividad 9.11:
Se toma una muestra de estudiantes de diferentes grupos de clase de aula y se les
pide su opinin en cuanto a una propuesta de cambio del plan de estudios. Los
resultados son los siguientes:

-254-

9. Inferencia en poblaciones normales

Clase
1
2
3
4

A favor
120
70
60
40

En contra
80
130
70
60

Podemos decir que algunos grupos de clase estn ms a favor de la propuesta que
otros?
Se ha preguntado a un grupo de hombres y mujeres si fuman cigarrillos de forma
habitual. Los resultados han sido:

Mujer
Hombre

Fuma
9
20

No fuma
11
40

Hay diferencias entre los hombres y las mujeres en cuanto al hbito de fumar
cigarrillos?

9.5. PROBLEMAS PROPUESTOS


9.5.1.
Calcular el tamao de la muestra para que el error relativo de s' 2
respecto de 2 sea inferior al 25% con una probabilidad mayor del 80%.
Solucin: 52

9.5.2.
Para estudiar el espesor de la capa de imprimacin de la carrocera de
un determinado modelo de automvil se examinaron 10 vehculos obtenindose
los siguientes valores
{ 45, 40, 44, 43, 45, 43, 46, 45, 44, 45 }
medidos en micras. En el supuesto de que sigan una distribucin NORMAL :
a) Calcular un intervalo de confianza al nivel =0'05 para el promedio del
espesor.
b) Lo mismo para la varianza del espesor.
Solucin: a) [42.78; 45.21] b) [1.37; 9.63]
-255-

9. Inferencia en poblaciones normales

9.5.3.
Una resistencia elctrica ha sido medida 6 veces, resultando los valores
en ohmios :
{ 1'5, 1'6, 1'4, 1'5, 1'3, 1'1 }
Calcular el intervalo de confianza para la media con =0'05.
Solucin:[1.21,1.59]
9.5.4.
Para un intervalo de confianza de un determinado parmetro con un nivel
de confianza del 90%; indicar cul de las siguientes afirmaciones es correcta:
a) contiene con una probabilidad del 90% el valor real y desconocido del parmetro
poblacional a estimar.
b) es la regin de aceptacin de un test de hiptesis al 10%.
c) estima puntualmente con una probabilidad del 90% el parmetro muestral.
d) ninguna de las anteriores.

Test de hiptesis
9.5.5.
Una muestra de 16 transistores de cierto tipo ha presentado una vida
media de 734 horas. Puede aceptarse que la media poblacional es de 740
horas con un nivel de significacin =0'05?
a) Supuesta normalidad y conocido =12 horas.
b) Supuesta normalidad y conocido s'=12 horas.
Solucin: a) no [728.12,739.88] b) si [727.61,740.39]

9.5.6.
Sea X una variable aleatoria de distribucin NORMAL N(m,1). Con el fin
de contrastar la hiptesis de que la media poblacional es m=2 frente a m2 se
toma una muestra, siendo esta:
{ 2'1, 2'2, 2'5, 1'9, 1'2 }
Puede aceptarse la hiptesis nula con =0'05?
Solucin: si 1.98 [1.1235,2.8765]
9.5.7.
Tras numerosas comprobaciones, el nmero de pulsaciones por minuto
de varones de 20 a 25 aos se distribuye segn una NORMAL N(72,9). Si una
muestra de 100 jugadores de ftbol da como media 64 pulsaciones por minuto,
debemos considerar esta diferencia como significativa con =0'05?
Solucin: no 64 70.5195
-256-

9. Inferencia en poblaciones normales

9.5.8.
El contenido de un determinado elemento en un acero es una variable
aleatoria NORMAL N(35,1). Se sospecha que una modificacin del proceso da
lugar a un aumento del contenido medio del elemento en cuestin, y se sabe que
es imposible que lo disminuya.
a) Plantear el Test de hiptesis que confirme el aumento de dicho elemento.
Tomar =0'05.
b) Calcular la probabilidad de aceptar la hiptesis nula para diferentes valores
de la media.
La modificacin no altera las dispersiones.
Muestra {35'5, 34'0, 36'8, 37'0, 35'8, 37'5, 34'5, 38'0, 37'5, 36'0}
Solucin: a) x 35.62 b) {35,0.975} {35.62,0.5} {36.0,0.115} {36.2,0.033}

9.5.9.

Se tiene el Test de hiptesis


Ho : 2=4
H1 : 2=9
a partir de una muestra aleatoria simple de tamao n=21 procedente de una
poblacin NORMAL. La regin de aceptacin es Xo(s)={ x / s'26} y la de rechazo
X1(s)={ x / s'27}. Si s'2 esta entre ambos se decide aceptar con probabilidad 0'6 y
rechazar con probabilidad 0'4. Hallar las probabilidades de los riesgos de I y II
especie.

Solucin: = 0.04 = 0.2

9.5.10.
Una empresa anuncia que el 10% de las unidades de un artculo en
venta procede de sus fbricas, frente a un competidor que asegura que dicho
porcentaje es menor. Se toma una muestra de 100 artculos, de los cuales slo 3
son de la primera empresa. Puede aceptarse que sta tiene razn? Tomar
=0'05.
Solucin: no 0.03 0.05065

9.5.11.
En el proceso de fabricacin de tornillos se desea que la proporcin
mxima de tornillos defectuosos producidos debe ser de un 5o/o. En un control de
fabricacin tomamos una muestra de 100 tornillos y encontramos uno
defectuoso.
a) Se puede afirmar que el proceso esta fuera de control? Tomar =0'05.
b) Qu ocurre si la direccin quiere mas precisin en el test?
-257-

9. Inferencia en poblaciones normales

Solucin: a) no 0.01 [0.0073, 0.0927]


9.5.12.
Un partido afirma que el 55% de los electores estn de acuerdo con sus
ideas frente a un problema. Se toma una muestra de 1.000 electores y se obtiene
una proporcin del 51%. Puede sostener el partido poltico dicha afirmacin?
Tomar =0'05.
Solucin: no 0.51 [0.5192, 0.5808]
9.5.13.
La proporcin de unidades defectuosas en un lote de 100 unidades del
proveedor A es del 4%, mientras que un lote de 150 unidades del proveedor B
es del 7%. Hay evidencias para decir que el proveedor A produce menos
unidades defectuosas que el proveedor B? Tomar =0'05.
Solucin: no 0.9941 < 1.96

9.5.14.
La variabilidad de un proceso en condiciones de produccin correctas es
de 3 unidades. Se dispone de una muestra de tamao n=15, con los siguientes
valores:
{ 27, 17, 18, 30, 17, 22, 16, 23, 26, 20, 22, 16, 23, 21, 17 }
Funciona correctamente el proceso? Tomar =0'05.
Solucin: no [3.6185, 16.7907]

9.5.15.

Para contrastar
Ho : =1
H1 : =2

se dispone de una nica observacin x que proviene de una distribucin de


Poisson Ps(). Si se toma como regin de rechazo 4, calcular las
probabilidades de los errores de tipo I y tipo II.
Solucin: = 0.0189 = 0.85712

9.5.16.
Una partida de gran tamao de piezas se considera vlida si tiene menos
de un 2% de piezas defectuosas (H0 :p002). Para su control se toman 9 piezas
y se acepta la partida si todas las piezas son correctas. Cul es la probabilidad
-258-

9. Inferencia en poblaciones normales

de cometer un error de 2 especie si en realidad el lote inspeccionado tiene un


10% de piezas defectuosas?
a) 03874
b) 06126
c) 02252
d) 07748

9.5.17.
HIJOS DE ILUMINADA S.A. es una empresa que se dedica a producir
bombillas. En una de sus lineas se fabrican bombillas de 40 Watios. El filamento
de las mismas tiene una resistencia con distribucin NORMAL N(605,1.18)
ohmios, y una bombilla se considera correcta cuando su resistencia esta situada
entre los valores 607.86 y 600.96. Para comprobar que el proceso de
fabricacin esta bajo control, es decir, que la media vale 605, los operarios de la
linea realizan un test consistente en tomar muestras de tamao 7 de forma
peridica, y si la resistencia media esta situada entre los valores 606.338 y
603.662 se acepta que el proceso esta bajo control. Determinar la probabilidad
de cometer el error de primera especie, y el de segunda especie cuando el valor
de la media poblacional es de 606.5.
a)
b)
c)
d)

=0.00270, =0.44540
=0.02571, =0.35942
=0.02571, =0.44540
=0.00270, =0.35942

9.5.18.
Para contrastar la hiptesis de igualdad de precisin de dos mtodos de
anlisis, utilizamos la distribucin:
a) N(m1+m2, 12 22 )
b) n21 n2
c) Fn1 ,n2
d) t n1 n2

9.5.19.
Se quiere contrastar la hiptesis nula de que la proporcin de piezas
defectuosas en una partida es menor o igual al 1%, contra la alternativa de que
es mayor. Para ello se realiza el siguiente plan: se van tomando piezas de la
partida hasta que aparezca una defectuosa. Si el nmero de piezas tomadas
hasta ese momento es menor o igual que 2 se acepta la partida y en caso
contrario se rechaza. Calcular el error de segunda especie para una proporcin
de piezas defectuosas del 10%.
a) 0.1900
b) 0.1000
-259-

9. Inferencia en poblaciones normales

c) 0.0975
d) 0.0950

9.5.20.
Una determinada mquina fabrica lminas de acero cuyo espesor sigue
una distribucin normal N(0.1, 0.005) cm. La mquina se considera que funciona
mal, y por tanto se debe revisar, si al tomar una muestra, el espesor promedio de
las lminas es superior a 0.1041cm. Si al tomar una muestra el promedio de
longitud es inferior a 0.1041cm y por tanto no revisamos la mquina, cul de
estas afirmaciones es cierta?
a)
b)
c)
d)

Podemos estar cometiendo un error de primera especie


Podemos estar cometiendo un error de segunda especie
Seguro que cometeremos un error de primera especie
Seguro que cometeremos un error de segunda especie

Tabla de contingencia
9.5.21.
La siguiente tabla muestra la frecuencia con la que se dan las distintas
calidades de piezas en dos mquinas de una determinada empresa. Se
pretende comprobar mediante un test 2 si existen diferencias significativas entre
las dos mquinas en cuanto a nmero de piezas fabricadas de cada calidad.
Calcular el nivel de significacin de dicho test.

Mquina A
Mquina B

Piezas
intiles
15
42

Piezas
reciclables
33
61

Piezas
correctas
60
82

a) 005
b) 010
c) 025
d) 050

9.5.22.
Un estudio realizado sobre el nmero de accidentes mortales de
automvil durante el ltimo puente festivo, muestra los siguientes resultados, en
funcin del tamao del coche y el estado del conductor y los pasajeros:

MUERTOS \ TAMAO DEL COCHE

PEQUEO

MEDIANO

GRANDE

al menos uno

49

35

18

ninguno

71

65

62

-260-

9. Inferencia en poblaciones normales

En un peridico (A) se afirma que el tamao del coche (y su equipamiento de


seguridad) no influye en el nmero de accidentes mortales, mientras que otro (B)
dice que s, y que la distribucin es:
MUERTOS \ TAMAO DEL COCHE

PEQUEO

MEDIANO

GRANDE

al menos uno

46

34

20

Ninguno

74

66

60

Con los datos expuestos:


a. Slo el peridico A tiene razn, el tamao del coche no influye en la
siniestrabilidad del accidente.
b. Slo el peridico B tiene razn, y el tamao del coche si que influye en el
nmero de muertos, y la distribucin que aporta es aceptable.
c. Ninguno de los dos peridicos tiene razn, ya que el tamao del coche si
que influye, pero la distribucin no es la dada por el peridico
d. No se puede afirmar nada, ya que la muestra es demasiado pequea y
los grados de libertad no son suficientes.

Test de ajuste a una distribucin


9.5.23.
Se han sacado 200 muestras de 3 piezas en una lnea de montaje,
encontrndose fuera de tolerancia las siguientes:
N. de piezas
defectuosas

N. de muestras

100

80

15

Cul de las siguientes afirmaciones es cierta?


a) Con una confianza del 95% rechazamos
de parmetro B(3,0.2).
b) Con una confianza del 99% rechazamos
de parmetro B(3,0.2).
c) Con una confianza del 90% no podemos
binomial de parmetro B(3,0.2).
d) Con una confianza del 85% no podemos
binomial de parmetro B(3,0.2)

-261-

que sigan una distribucin binomial


que sigan una distribucin binomial
rechazar que sigan una distribucin
rechazar que sigan una distribucin

9. Inferencia en poblaciones normales

9.5.24.
El n de llamadas va modem que recibe un ordenador por unidad de
tiempo se ha muestreado dando los siguientes resultados:
N llamadas
Frecuencia
----------------------------------------------0
144
1
136
2
74
3
32
4
11
5
2
6
1
Pudiendo aceptarse que la variable tiene una distribucin de Poisson, calcular el valor
de .
Solucin: 1`1

9.6. PROBLEMAS Y CUESTIONES DE EXMENES


9.6.1. Una fbrica trabaja con dos mquinas A y B. El coste semanal, X A, de
reparacin para la mquina A se aproxima a una distribucin Normal con
parmetros A=350 y A2=500. El coste semanal, XB, de reparacin de la mquina
B se apro ima a una distribucin normal con parmetros B=200 y B2=400.
Queremos estudiar el coste de las reparaciones de cada mquina y, para ello,
tomamos una muestra aleatoria de nA=5 facturas de reparaciones de la mquina A
y otra de nB=4 de la mquina B y calculamos las medias muestrales de los costes
de reparacin. Si queremos comparar los costes de las dos mquinas:
a)

Determinar la distribucin de la diferencia de los costes medios muestrales. (1


punto)

b)

Hallar la probabilidad de que la diferencia entre el coste medio muestral de A y


el coste medio muestral de B sea superior a 180 euros. (0.5 puntos)

c)

Hallar la probabilidad de que al tomar las dos muestras de facturas, como se


indica en el enunciado, la cuasivarianza del coste de la mquina A sea
superior a 114 veces la cuasivarianza del coste de B? (1.5 puntos)
SOLUCIN:
a)
,
b)

-262-

9. Inferencia en poblaciones normales

x A xB N A B ,

A2
nA

2
500 400
n BB N (350 200,

)
5
4

N (150, 200 ) N (150, 14,14)

c)

P( S A2 11,4S B2 ) P( S A2 / S B2 11,4) P(
P( F( n A 1), ( n B 1) 11,4

S A2 / A2
B2

11
,
4
)
S B2 / B2
A2

400
) P( F4,3 9,12) 0,05
500

9.6.2. El tiempo que tarda en realizar la entrega de los paquetes a los clientes de la
ciudad de Valencia una empresa de mensajera ubicada en el polgono de la
Fuente del Jarro es, de forma habitual, una variable con distribucin N(m=35min,
=10min). La semana pasada se incorporaron al trabajo tres repartidores nuevos
con poca experiencia, hecho que podra afectar a los tiempos de entrega
empeorndolos. Para hacer un control verificamos el tiempo de entrega de 4
paquetes seleccionados aleatoriamente y obtenemos los siguientes valores
expresados en minutos (40; 15; 42; 70).
a.

Con un nivel de significacin del 5% Hay evidencias significativas de un


empeoramiento del tiempo medio de entrega? (1 punto)

b.

Cul sera el valor de del test anterior si el tiempo medio de entrega


hubiese aumentado a 45 minutos? (1 punto)

c.

Calcular un intervalo de confianza al 99% para la media del tiempo de entrega


y otro al 95% para la varianza de dicho tiempo de entrega (0,75 puntos)

d.

Cuntos envos deberamos controlar para estimar la media real del nuevo
tiempo de espera con error absoluto menor de 2 minutos y un nivel de
confianza del 80%? (0,75 puntos)

SOLUCIN:
a) Se trata de un test sobre la media m de una poblacin normal
Es un test unilateral porque el cambio solo es previsible que se d en un
sentido (aumentar) por lo tanto tenemos
H0: m=m0=35 minutos
H1: m>35
Dado que conocemos la desviacin tpica =10, la regla de decisin es
-263-

9. Inferencia en poblaciones normales

Aceptar H0 si

x m0 z

Calculamos x 41,75 y

n
35 1,645

10
43,225
4

Como x 41,75 43,225


podemos aceptar la hiptesis nula y admitir
que no ha habido un aumento significativo del tiempo medio de reparto.
b) =P( ceptar H0/ H1 cierta)=P( x 43,25 / m 45 )=P(N(45, /n)43,25)=
P(N(45, 10/4)43,25)= P(N(45, 5)43,25)=(43,25-45/5)=(-0,35)=0,3632
c)

El intervalo de confianza para la media con varianza conocida es

x z / 2

y con nuestros datos

41,75 2,57

(41,75 12,85 )

10
4

(28,90 54,60)

El intervalo de confianza para la varianza poblacional es


(n 1) s 2

2
n-1; /2

3. 505583

2
3 0025

(n 1) s 2
n-1;1-/2

3 .505583

32 0975

3. 505583
3 .505583
2
9384
0216
(16163; 7021944)

z
1,285 . 10
d) n / 2
41,28 42 entregas
2
e

9.6.3. Queremos estudiar si se mantiene la proporcin de circuitos integrados


defectuosos que se producen en un proceso de produccin. Lo habitual es que
-264-

9. Inferencia en poblaciones normales

haya alrededor de un 0,5%. Para comprobarlo, tomamos una muestra de 300


circuitos y si encontramos un circuito defectuoso o ms decimos que la proporcin
es superior a 0,5%.
a) Determinar, para este contraste de hiptesis, cunto vale la probabilidad de
error de 1 especie (1,25 puntos).
b) Si la proporcin de circuitos defectuosos del proceso fuera del 1% cunto
valdra la probabilidad de error de 2 especie? Qu significado tiene? (1,50
puntos)
c) Si al tomar la muestra de 300 circuitos nos sale uno defectuoso qu decisin
tomamos? Qu tipo de error podramos estar cometiendo? (0,75 puntos)

SOLUCIN:
H0(p=0005) vs H1(p>0005)
a)

b)

El 49% de las veces que apliquemos este test, aceptaremos que la proporcin
de piezas defectuosas es p=0005 cuando en realidad es 001 (por lo tanto nos
estaremos equivocando)
c) Tal y como dice el enunciado, si nos sale X1, rechazamos la H0.
El nico tipo de error que podemos cometer es el de primera especie ya que
hemos RECHAZADO.

9.6.4. De forma habitual, el 10% de los envos de una empresa de distribucin


presentan alguna incidencia como retrasos, errores, etc. Despus de la
incorporacin de varios conductores inexpertos y a lo largo de una semana se
controlan 50 envos registrndose incidencias en 6 de ellos.
a) Con un nivel de significacin del 5% hay evidencias significativas de un
empeoramiento en la proporcin de envos con incidencias? (1,5 puntos)
b) Cul sera el valor de del test anterior si la proporcin de envos con
incidencias hubiese aumentado a un 15%? (1,5 puntos)
c) Cuntos envos deberamos controlar para estimar la proporcin real de
envos con incidencias con un error absoluto menor del 4% y un nivel de
confianza del 80%? (0,5 puntos).
-265-

9. Inferencia en poblaciones normales

d) Calcular un intervalo de confianza al 99% para la proporcin poblacional P de


envos con incidencias despus de la incorporacin de los nuevos
conductores.(0,50 puntos)
Solucin:
a) Las hiptesis a contrastar son: H0:P=P0= 0,10
H1:P>0,10 ya que de
acuerdo con el enunciado el cambio podra suponer un empeoramiento
respecto al funcionamiento habitual, es decir, una proporcin mayor que la
habitual
La regin de aceptacin para este test es
Aceptar si p P0 z
Como p=6/50=0,12 <

P0 (1 P0 )
n
0,10 1,645

0,10 . 0,90
0,169
50

Podemos aceptar H0 y concluir que no ha habido un incremento significativo


de la proporcin de envos con incidencias
b) =P( ceptar H0/ H1)=P(p<0,169/P=0,15)=P(N(0,15 0,15 . 0,85/50)<0,169)=
P(N(0,15 0,05)<0,169)= (

0,169 0,15
) (0,38) 0,6480
0,05

c) El nmero de envos a controlar, considerando como proporcin habitual 0,10


es

z2 / 2 p (1 p )
1,2852 . 0,10 . 0,90
n0

92,77 93 envios
0,042
e2
Si tomamos como estimacin previa de P el valor muestral 0,12 sale 108,98
109
Envos.
d) El intervalo de confianza es

p z / 2

p (1 p )
012 .088
012 2,57
(00019; 02381)
n
50

9.6.5. El nmero de llamadas diarias realizadas con el mvil por las alumnas de 1
de GITI podemos admitir que es una variable de Poisson de media 2,5
llamadas/da y el de las llamadas realizadas por los chicos tiene una distribucin
de Poisson de promedio 1,5 llamadas/da.
Al entrar al examen todos dejan su mvil en la mesa del profesor. Elegido uno
de los mviles al azar, queremos verificar la hiptesis nula de que pertenece a una
chica frente a la alternativa de que es de un chico.
-266-

9. Inferencia en poblaciones normales

Como regla de decisin adoptamos la siguiente: Si el telfono tiene


registradas tres llamadas o ms a lo largo del da anterior, lo asignamos a una chica y
si tiene registradas dos o menos llamadas decimos que es de un chico.
a) Plantear estadsticamente las hiptesis a contrastar y las regiones de
aceptacin y rechazo propuestas en el enunciado. (1 punto)
b) Calcular el riesgo de primera especie de la prueba. Interpretar la respuesta.
(1,5 puntos).
c) Calcular el riesgo de segunda especie de la prueba. Interpretar la respuesta.
(1,5 puntos).
Solucin
a) Las hiptesis a contrastar son:
H0: =2,5 (pertenece a una chica)
H1: =1,5 (pertenece a un chico)
Las regiones de aceptacin y rechazo son:
Aceptar H0 si X 3
Rechazar H0 si X 2

Siendo X=Ps()

b) =P(Rechazar H0/ H0)= P(X 2/=2,5)=P( Ps (2,5)2)=0,5438 (El 54,38% de


los telfonos de las chicas seran asignados a los chicos con el test
propuesto)
c) =P( ceptar H0/ H1)=P(X3/=1,5)=P(Ps(1,5)3)=1-P(Ps(1,5)2)=
1-0,8088=0,1912 (El 19,12 % de los telfonos de los chicos seran asignados
a las chicas con el test propuesto)

9.6.6. El espesor de unas planchas de acero sigue una distribucin normal con
varianza 5,4. Se pide:
a) Si tomamos una muestra de tamao n=20, cul es la probabilidad de que la
desviacin tpica sea superior a 3. (1 punto)
b) Cul debe ser el nmero de planchas a medir para que la probabilidad de
que la media muestral de estas planchas difiera de la media poblacional en
ms de 2 unidades sea inferior al 10%? (1punto)
Solucin 3:
(n 1)s 2

a) P(s 3) P

919
2
P 19
31,66 0,034

5,4
-267-

9. Inferencia en poblaciones normales

b) La condicin que se debe cumplir es,


P( x 2) 0,10

El suceso contrario es,


P( x 2) 0,90

2
x
2
P

0,90

n
n
n

Buscamos el valor de z0,05 1,645 , y de la expresin anterior el valor de n se


obtiene de,
2

1,645

Despejando n se tiene,
n

1,645 5,4
2

n=3,65 de donde el valor de n tiene que ser como mnimo de n=4.

9.6.7. Un auditor de calidad est comprobando si los productos de un almacn


logstico de la empresa Mercadona cumplen los requisitos establecidos. Para ello
ha inspeccionado 30 de ellos y ha observado que 5 no cumplen los requisitos. Se
pide:
a) Calcular el intervalo de confianza para la proporcin de productos que no
cumplen los requisitos, con un nivel de significacin del 8%. (0,5 puntos)
b) Cul es el error mximo que cometemos en la estimacin de dicha
proporcin con un nivel de significacin del 8%. (0,5 puntos)
c) Qu tamao de muestra habra que tomar si conocemos que el total de
productos almacenados es de 5000 y el error mximo que deseamos cometer
es de un 3% con un nivel de significacin del 5%? (1punto)
Solucin 4:
a) La proporcin estimada es p

5
0,167 . Con un 0,08 el valor de la z es
30

z0,04 1,75 . Y el intervalo de confianza es,

p z / 2

0,286
pq
0,167(1 0,167)
0,167 1,75
0,167 0,119
n
30
0,048

b) El error mximo cometido es 0,119 .


c) El tamao de muestra viene dado por
-268-

9. Inferencia en poblaciones normales

z / 2

p q N n

n N 1

Sustituyendo valores,
0,167(1 0,167) 5000 n
0,032 1,962

simplificando
n
4999
8,42

5000 n
n

9,42n 5000, y despejando n queda,

5000
539,79 . Esto , tomaremos n=540 elementos.
9,42

9.6.8. En un proceso de soldadura manual por puntos de planchas de acero, la


distancia entre puntos resultante viene siendo una variable con distribucin N(2
cm, 0,5 cm).
a) Ante las quejas del rea de montaje, el jefe de la lnea decide comprobar si se
ha modificado sensiblemente la media de las distancias entre puntos. Para
ello, mide las distancias entre 10 parejas de puntos de soldadura elegidas al
azar obteniendo los siguientes valores expresados en cm
( 2,3 2,5 1,9 2,6 3,0 2,1 2,7 2,5 3,1 2,2 )
Con un nivel de significacin =0,10 Qu podemos concluir? (Plantear las
hiptesis apropiadas y justificar la respuesta) (1 punto)
b)

Si la media de las distancias hubiese pasado a ser realmente 2,5 cm Cul


sera el riesgo de la prueba anteriormente propuesta? (1 punto)

c)

Olvidando los dos apartados anteriores de este ejercicio, supongamos que el


jefe decide aceptar que la media de las distancias es 2 cm si el promedio de
9 distancias entre puntos de soldadura est entre 1,5 y 2,25 cm Cul sera
el riesgo de esta prueba? (1 punto)

Solucin 5:
a) Se trata de un test bilateral sobre la media de una poblacin Normal con
conocida, dado que no hay indicios de que el cambio haya sido en un determinado
sentido
H0: m=2 H1: m2
Y la regala de decisin


0,5
Aceptar H 0 si x m0 z / 2
2 1,645
1,74 2,26)
n
10

-269-

9. Inferencia en poblaciones normales

Como x 2,49 (1,74 2,26) debemos rechazar la hiptesis nula y aceptar que ha
habido un cambio en la media.
b) Recordemos que

P( Aceptar H 0 / H 1cierta ) P( x (1,74 2,26) / m 2,5) P( N (2,5,


(

0,5
10

) (1,74 2,26)

2,26 2,5
1,74 2,5
) (
) (1,52) (4,81) 0,0643 0 0,0643
0,158
0,158

c) Dada la expresin de la regin de aceptacin, las hiptesis establecidas son


H0: m=2 H1: m2
Recordemos que
P(Re chazar H0 / H0 cierta) P( x (1,5

2,25) / m 2) P(N(2,

0,5
9

) (1,5 2,25)

1,5 2
2,25 2
1 P(N(2, 0,167) (1,5 2,25) 1 (
) (
) 1 (1,497) ( 2,99)
0
,
167
0,167

1 0,9328 0,0014 0,0686

-270-

10. Anlisis de la varianza

10. ANLISIS DE LA VARIANZA

Contenido
10.1. ANLISIS DE LA VARIANZA (I). UN FACTOR CONTROLADO. ................... 271
10.1.1. Generalidades ................................................................................ 271
10.1.2. Modelo terico. Hiptesis del modelo.............................................. 273
10.1.3. Hiptesis nula ................................................................................. 276
10.1.4. Ecuacin fundamental .................................................................... 277
10.1.5. Test F ............................................................................................. 277
10.1.6. Comparacin de medias. Test L.S.D. (diferencia mnima significativa)
.................................................................................................................... 278
10.2. ANLISIS DE LA VARIANZA (II). DOS FACTORES CONTROLADOS .......... 280
10.2.1. Introduccin. Planes factoriales ...................................................... 280
10.2.2. Anova para dos factores con repeticiones ...................................... 281
10.2.3. Concepto de Interaccin ................................................................. 281
10.2.4. Modelo y supuestos tericos........................................................... 283
10.2.5. Hiptesis Nulas ............................................................................... 284
10.2.6. Descomposicin de las Sumas de Cuadrados. Test F .................... 284
10.2.7. Comparacin de Medias. Test L.S.D............................................... 284
10.2.8. Validacin del modelo ...................................................................... 287
10.2.9. Igualdad de las varianzas ................................................................ 287
10.2.10. Estimacin de los efectos .............................................................. 288
10.2.11. Predicciones .................................................................................. 289
10.3. PROBLEMAS Y CUESTIONES DE EXAMEN ................................................ 290

10.1. ANLISIS DE LA VARIANZA (I). UN FACTOR CONTROLADO


10.1.1. Generalidades
Bajo el nombre de Anlisis de la Varianza se conocen un conjunto de mtodos
estadsticos aplicables en general al anlisis de observaciones que dependen
simultneamente de varios factores. Fue desarrollado por Fisher en el 1er tercio del
siglo pasado.
Los factores a considerar, y que se presume pueden influir sobre la respuesta,
son aqullos que podemos realmente controlar fijando a voluntad sus niveles
(factores controlados).
-271-

10. Anlisis de la varianza

Los factores pueden ser cuantitativos, cuando sus niveles corresponden a


valores medibles (temperatura, pH, etc.) o cualitativos en otro caso (tipo de hojalata,
variedad, mtodo de fabricacin etc.).
Un ejemplo servir para ilustrar un problema tpico de aplicacin de estos
mtodos.
En un estudio sobre corrosin (X) en botes de conservas se desea investigar
la influencia al respecto del tipo de hojalata, pH del lquido de gobierno y temperatura
de almacenamiento del bote. En la terminologa clsica del Anlisis de la Varianza
existen en este caso tres factores:

Tipo de hojalata
pH
Temperatura de conservacin
cuyos efectos se desean estudiar.
Para cada factor, se considerarn en el estudio diferentes niveles (si el factor
es cuantitativo) o variantes (si el factor es cualitativo). As por ejemplo:
Factor tipo de hojalata (cualitativo): Se desean estudiar tres tipos distintos A, B
y C (3 variantes).
Factor pH (cuantitativo): Se estudiarn conservas a pH 4'5 y pH 5'5 (2
niveles).
Factor temperatura de almacenamiento (factor cuantitativo): Se almacenarn
los botes a 0 C, 15 C y 30 C (3 niveles).
A cada combinacin de variantes de los diferentes factores se le denomina
tratamiento, por ejemplo un tratamiento ser: bote hojalata tipo B con pH del lquido
de gobierno 4'5 almacenado a 15 C. En total existirn en este caso 3x2x3=18
tratamientos diferentes.
Una experiencia podra consistir en preparar 5 botes (repeticiones) con cada
uno de los 18 tratamientos posibles, con lo que constara en total de 18x5 = 90 botes
o unidades experimentales.

-272-

10. Anlisis de la varianza

El objetivo en una experiencia de este tipo sera el analizar cules de los tres
factores tienen una influencia significativa sobre el grado de corrosin del bote al
cabo de, por ejemplo, un mes de almacenamiento.
En aquellos factores cuyo efecto sea significativo, se desear adems, precisar la
naturaleza del mismo, determinando, qu variantes difieren significativamente entre s
* Resumen:
-

X : variable a estudiar o respuesta (grado de corrosin en el ejemplo).


Factores: posibles causas controlables que pueden ser fuente de variabilidad
en la respuesta (tipo de hojalata, pH, temperatura, etc.).
Variantes o niveles: valores que pueden tomar los factores.
Tratamiento: combinacin de niveles
Unidad experimental: Unidad fsica sobre la que se aplica un tratamiento
(bote, parcela, animal de ensayo etc.)
Repeticiones: nmero de veces que se aplica un mismo tratamiento (sobre
diferentes unidades experimentales) en una misma experiencia, o nmero de
veces que se repite la experiencia bajo las mismas condiciones.

Los mtodos del Anlisis de la Varianza, asumen la existencia de un modelo


probabilstico que explica los resultados observados en funcin de un conjunto de
parmetros desconocidos relativos a los efectos de los diferentes factores en estudio
y de una perturbacin aleatoria.
La tcnica de anlisis consiste, en general, en descomponer la variabilidad total
del conjunto de las observaciones expresada por la suma de cuadrados global (Xijk X)2 con N -1 grados de libertad, en un conjunto de trminos independientes, con sus
correspondientes grados de libertad, relativos a los diferentes factores en estudio y al
error experimental. La comparacin de cada uno de estos trminos con el
correspondiente a la perturbacin aleatoria residual ( error), permite contrastar la
significacin de los factores estudiados.
Inicialmente desarrollaremos la teora bsica del Anlisis de la Varianza en el
caso ms sencillo de un solo factor controlado, dejando para ms adelante la
generalizacin al caso de varios factores.

10.1.2. Modelo terico. Hiptesis del modelo


Consideremos, por ejemplo, que se desean comparar I variantes distintas de un
determinado proceso industrial. De cada variante se hacen J pruebas cuyos
resultados podemos considerar como una muestra aleatoria simple extrada de la
poblacin de posibles resultados que podran obtenerse con dicha variante.
-273-

10. Anlisis de la varianza

Variante
Poblacin
Muestra

N(1,)

N(i,)

N(I,)

(X11X1J)

(X21X2J)

(XI1XIJ)

Como veremos a continuacin, nuestras hiptesis sobre el modelo implican que


cada una de estas poblaciones tiene una distribucin N(i,), y la hiptesis nula a
contrastar es H0: 1 = 2 = I.

x1

x4

x2

x5

x3

Figura 10. 1. Distribucin de las poblaciones

Vemos por tanto que el problema que tenemos no es ms que la generalizacin a


I medias del problema de comparacin de dos medias visto en un tema anterior.
Sea I el nmero de niveles del factor y J el nmero de observaciones para cada
una de las variantes (supondremos que dicho nmero es el mismo para todas las
variantes, en cuyo caso el modelo se denomina EQUILIBRADO).
Sea Xij la j-ava observacin (j = 1...J) correspondiente a la i-ava variante del factor
(i = 1...I). Siendo i = (Xij) el valor medio poblacional correspondiente a dicha
variante, se tendr:
Xij = i + ij

(1)

-274-

10. Anlisis de la varianza

i
i

x ij

Figura 10. 2. Error experimental

donde jj es una perturbacin aleatoria que origina las diferencias existentes entre las
observaciones de una misma variante o tratamiento; adems (ij) =0
Con respecto a los residuos ij se harn, adems, las siguientes hiptesis:
a) Homocedasticidad: 2ij = 2 (ij) = 2 i, j no dependiendo por tanto de la
variante i considerada.
Esta hiptesis hace necesaria la comprobacin previa, mediante el test de
Bartlett u otros similares, de la homogeneidad de las varianzas en los diferentes
grupos o variantes.
b) Incorrelacin: Cov (ij,ij) = 0 si ii' y/o jj'; es decir, todos los residuos estn
mutuamente incorrelacionados.
c) Normalidad: los IxJ residuos ij tienen una distribucin conjunta normal

multivariante N(0,2 I)
Las hiptesis b) y c) implican la independencia de los residuos.
El modelo terico anterior puede formularse de una forma alternativa que resulta
aconsejable por su ms fcil generalizacin al caso de varios factores.
Sea = i /I el promedio de los valores medios de las diferentes variantes i=i es la diferencia entre la media de la variante i y el promedio general; i mide por lo
tanto el efecto especfico (positivo, negativo o nulo) de la variante i del factor.
Evidentemente, se verifica i = (i - ) = i - I = 0
Como i = + i, el modelo terico puede formularse como sigue
Xij = + i + I
Con i = 0

-275-

10. Anlisis de la varianza

ij
i

Xij

Figura 10. 3. Descomposicin de un valor observado

Donde:
Xij = j-ava observacin de la variante i del factor
= promedio general
i = efecto especfico de la variante i del factor
ij = residuos N (0,) e independientes entre s.

10.1.3. Hiptesis nula


La hiptesis nula a contrastar es que el factor no influye sobre la respuesta, es decir,
que todos los niveles tienen la misma media
Ho : 1 = 2 = 3 = I =
H1 : i j
Estas hiptesis son equivalentes a contrastar
H0 : i = 0
H1 : i 0 ya que sustituyendo i por + i
Ho : + 1 = + 2 = + 3 = = + I =
1 = 2 = 3 = . = I = 0

i = 0 Se debe cumplir que i 0


i

-276-

10. Anlisis de la varianza

10.1.4. Ecuacin fundamental


Llamando

X ..

Xi .

ij X ij
IJ
j X ij
J

media general de todas las observaciones

media de la variante i

La ECUACIN FUNDAMENTAL del Anlisis de la varianza muestra la


descomposicin de la variabilidad total de la variable respuesta estudiada.

ij

( X ij X ..)2 J i ( X i . X ..)2 ij ( X ij X i .)2

SCT

SCF

SCR

(Xij X..)2 se le denomina Suma de Cuadrados Total (SCT) pues mide la


variabilidad total del conjunto de las I x J observaciones.

J (Xi-X..)2 se denomina Suma de Cuadrados debida al factor(SCF) pues


mide la magnitud de las desviaciones de la media de cada variante a la media
general. Mide la parte de la variabilidad total debida o explicada por el factor.

(Xij-Xi.)2 se denomina Suma de Cuadrados Residual pues se basa en las


desviaciones de cada observacin respecto a la media de la variante
respectiva. Mide la parte de variabilidad total existente en las observaciones
no explicadas por el factor, es decir, la debida a causas aleatorias (error
experimental, otros factores no estudiados, etc.).

10.1.5. Test F
Si a las sumas de cuadrados anteriores (SCF y SCR) las dividimos por sus grados de
libertad correspondientes (I-1) e I(J-1) respectivamente) obtenemos los cuadrados
medios CMF y CMR.
Se demuestra que si la hiptesis nula es cierta i 0

-277-

10. Anlisis de la varianza

CMF
F( I 1 ),I ( J 1 )
CMR

La hiptesis nula i 0 se contrastar, por tanto, calculando a partir de las


observaciones el estadstico CMF/CMR = Fc y rechazndola si este es mayor que el
valor en tablas de F( I 1 ),I ( J 1 ) para la probabilidad de error de 1 especie
considerado. Esta regla es equivalente a rechazar H0 si el p-valor correspondiente al
Fc calculado es menor que .
Rechazar H0 equivale a aceptar con un nivel de significacin , que el factor
influye en la respuesta estudiada.

10.1.6. Comparacin de medias. Test L.S.D. (diferencia mnima


significativa)
Si el test F pone de manifiesto la existencia de un efecto significativo del factor, y ste
es cualitativo, resulta procedente estudiar entre qu variantes del factor son
significativas las diferencias i - i. La forma de operar consiste en general, en
calcular una "diferencia mnima significativa" (DMS) tal que dos variantes i, j difieren
significativamente si |Xi.-Xj.| > DMS.
En el test de Tuckey se propone como L.S.D. DMS

DMS QI,I ( J 1 )

CMR
J

I = n de niveles del factor (en general n de medias a comparar).


J = n de observaciones en cada variante (en general, n de datos con que se
ha calculado cada una de las medias a comparar).
Nota: En la determinacin de la significacin del efecto de un factor (o su
equivalente, en la determinacin de la significacin de la diferencia entre dos
medias), debemos hacer notar:
a) Que el hecho de que las diferencias sean significativas no implica que las
diferencias sean necesariamente importantes. El anlisis de la varianza, si la
variabilidad residual es pequea, puede dar como significativas diferencias
que en la prctica carezcan de importancia.

-278-

10. Anlisis de la varianza

b) Si el anlisis no da como significativas determinadas diferencias no quiere


decir que stas no existan sino que, simplemente, el test no tiene suficiente
potencia para detectarlas. Este hecho tiene especial importancia cuando
intentamos interpretar el por qu algunas veces, a pesar de obtener en la
prctica diferencias importantes entre las medias, stas no llegan a ser
significativas. Lo que habra que hacer en este caso es aumentar el tamao
de la experiencia o reducir el error experimental (disminuir el CMR),
aumentando la homogeneidad del material experimental o utilizando un
diseo ms adecuado.
Los resultados obtenidos se reflejan en el siguiente
CUADRO RESUMEN DEL ANLISIS DE LA VARIANZA
Grados
Origen de Suma de
de
la varianza cuadrados
libertad

Cuadrado
medio

FACTOR

CMF

SCF

I-1

ERROR

SCR

I(J-1)

TOTAL

SCT

IJ-1

F calculada F tablas

SCF
I 1
SCR
CMR
I( J 1 )

CMF
CMR

F( I 1 ),I ( J 1 )

EJEMPLO:
Se desea estudiar la influencia de la materia prima sobre la resistencia de unas
piezas de plstico. Para ello se realizaron experiencias utilizando cuatro materias
primas diferentes. Con cada materia prima se fabricaron cinco piezas midindose
finalmente la resistencia en cada una de las veinte piezas fabricadas. Los resultados
fueron:

MAT PRIMA 1
6,0
6,2
6,5
6,8
6,0

MAT PRIMA 2
6,2
6,1
5,9
6,0
6,0

MAT PRIMA 3
5,9
6,0
6,0
6,2
5,8

-279-

MAT PRIMA 4
5,0
5,1
4,2
4,6
4,5

10. Anlisis de la varianza

Cuadro resumen del Anlisis de la Varianza


----------------------------------------------------------------------------Fuente
SC
gl
CM
F calc
p-Valor
----------------------------------------------------------------------------Factor
7,922
3
2,64067 36,17
0,0000
Residual
1,168 16
0,073
----------------------------------------------------------------------------Total
9,09
19

Dado que el p-Valor es menor que 0,01, existen diferencias estadsticamente


significativas al nivel del 99% de confianza entre las medias de las cuatro materias
primas. Esta afirmacin es equivalente a decir que la materia prima utilizada influye
sobre la resistencia de las piezas de plstico con un nivel de significacin del 99%.
En el apartado siguiente analizaremos cul o cules de las variantes de la materia
prima son diferentes en cuanto a su resistencia promedio.
Tests de rangos
Repeticiones Media
Grupos diferentes
-------------------------------------------------------------------------------M.P. 4
5
4,68
X
M.P. 3
5
5,98
X
M.P. 2
5
6,04
X
M.P. 1
5
6,30
X
Observamos que solo la cuarta materia prima da lugar a una resistencia media
estadsticamente diferente a las dems siendo menor en valor que el resto

10.2. ANLISIS DE LA VARIANZA (II). DOS FACTORES CONTROLADOS


10.2.1. Introduccin. Planes factoriales
Apoyndonos en los conceptos y terminologa expuestos en el apartado anterior,
vamos a desarrollar este apartado de forma esquemtica. Solamente desarrollaremos
en profundidad aquellos conceptos que sean nuevos y propios del presente capitulo.
PLANES FACTORIALES. Constituyen un diseo especial para el estudio
simultneo de dos o ms factores en el que todos los niveles de todos los factores se
combinan entre s. Los utilizaremos en este tema como diseo base para desarrollar
las tcnicas del Anlisis de la Varianza para dos factores.

-280-

10. Anlisis de la varianza

10.2.2. Anova para dos factores con repeticiones


Utilizaremos como diseo base para el estudio de este apartado, el siguiente diseo
factorial

FACTOR B
FACTOR
A

B1

B2

Bj

BJ

A1

=n

=n

A2

A3

Ai

= n
Xijk.

AI

10.2.3. Concepto de Interaccin


Se dice que hay interaccin entre dos factores si el efecto conjunto de la variante i de
uno de ellos con la j del otro, no es igual a la suma de los efectos simples
respectivos. (Efectos no aditivos).
Tambin se dice que existe interaccin entre dos factores cuando el efecto de uno
de ellos depende del nivel que consideremos en el otro.
De manera similar a la anterior, se dice que no existe interaccin entre dos
factores cuando el incremento en la respuesta (+ -) al pasar de un nivel a otro de
uno de los factores, es el mismo en cualquiera de los niveles que podamos
considerar del otro factor.
Vamos a considerar algunos ejemplos representativos.
a) Consideremos el ejemplo de la corrosin de los botes de hojalata en el que
contemplamos dos factores: Factor tipo de hojalata (hojalata A y hojalata B) y
Factor pH (pH1, PH2 y pH3)

-281-

10. Anlisis de la varianza

Figura 10. 4. Grfico de interacciones

En este primer caso, cualquiera que sea el pH, la hojalata A presenta mayor
corrosin que la hojalata B y, adems, LA DIFERENCIA ENTRE UNA Y OTRA
HOJALATA ES LA MISMA PARA CUALQUIER pH.
En el caso de la Figura 10.4, influyen los dos factores (hojalata A mayor corrosin
que la B, y a mayor pH menor corrosin) pero no hay interaccin entre ellos.

Figura 10. 5. Hay interaccin

En el caso de la Figura 10.5, el efecto del factor hojalata depende del valor del pH
que consideremos. As, a pH bajo presenta menor corrosin la hojalata B, a pH
intermedio el grado de corrosin es el mismo y a pH alto presenta menor corrosin la
hojalata B. Obsrvese que en este caso no tiene sentido preguntarse qu hojalata es
ms resistente si no se especifica cul va a ser el pH a emplear en la conserva.

-282-

10. Anlisis de la varianza

b) Consideremos ahora la calidad organolptica de tres zumos de naranja


(natural, pasteurizado, esterilizado) a travs del tiempo (recin preparado, a
los 5 das, a los 15 das) conservados a temperatura constante.

Figura 10. 6. Grfico de interacciones

Obtenga el lector sus propias conclusiones


Hay interaccin?
Por qu?
Qu zumo es mejor?
Se comportan igual los tres zumos?
Influye el tiempo de conservacin en la calidad? Cmo?

10.2.4. Modelo y supuestos tericos


El modelo terico completo es

X ijk i j ( )ij ijk donde


Xijk = valor de la K.sima observacin en el tratamiento formado por la variante
i del primer factor con la variante j del segundo.
= promedio general
i = efecto especfico de la variante i del 1er factor
j = efecto especfico de la variante j del 2 factor
()ij = efecto de la interaccin entre los factores en sus niveles i, j,
respectivos.
ijk = residuo aleatorio

-283-

10. Anlisis de la varianza

( )

ij

( )

ij

Supuestos:

( ijk ) 0
ijk N ( 0 , )

independientes e incorrelacionados

10.2.5. Hiptesis Nulas


Las hiptesis nulas a contrastar son la ausencia de efecto sobre la respuesta de cada
uno de los factores as como la ausencia de interaccin entre ellos
H0: i 0

H1: i 0

j 0

j 0

( )ij 0

( )ij 0

10.2.6. Descomposicin de las Sumas de Cuadrados. Test F


La variabilidad total de las observaciones se descompone de la siguiente forma
similar al ANOVA de un factor

( X ijk

ijk

X ...)2 JN ( X X ...)2 IN ( X X ...)2 N ( X X .. X X ...) ( X


X )2
i ..
. j.
ij .
. j.
ijk
ij .
i
j
ij
ijk

SCT

SCF1

SCF2

(IJN - 1)

(I - 1)

(J - 1)

SCint
(I - 1)(J - 1)

SCR
IJ(N - 1) gl

La significacin de cada factor se obtiene calculando el cociente

FGLF
,GLR significativo al nivel

SCF GLF CMF


Fc

SCR GLR CMR

FGLF ,GLR No significativo

10.2.7. Comparacin de Medias. Test L.S.D.


Si algn factor resulta significativo podr determinarse entre que variantes hay
diferencias significativas comparando la diferencia de medias con la L.S.D. DMS
-284-

10. Anlisis de la varianza

DMS Qa,glr CMR b


a = n de medias a comparar entre si (n de variantes del factor).
b = n de datos con que se calcul cada una de las medias anteriores.
EJEMPLO:
En una experiencia para analizar la influencia de un nuevo catalizador en dos
mtodos A y B de sntesis de un producto orgnico, se ensayaron 4 dosis de
catalizador. Con cada una de las 8 combinaciones - tratamientos - dosis x mtodo se
realizaron tres experiencias.
Los resultados, expresados en gr. de producto obtenido con la misma cantidad de
materia prima en 1 hora, se recogen en la tabla siguiente:

Dosis de catalizador (mg.)


Mtodo/Do
sis
A

075

125

150

68
60
62
60
45
66

91
75
86
72
71
60

90
98
94
64
75
70

105
95
99
48
55
50

Solucin
El modelo es:

X ijk i j ( )ij ijk

0
0
( ) 0
i

ij

( )

ij

ijk N ( 0 , ) independientes.

-285-

10. Anlisis de la varianza

Cuadro resumen del anlisis de la varianza

O.V.

SC

GL

CM

Fc

Ft

Total

709696

23

Catalizado
r

153513

'01
5'29 * *
51171 1239 F30'16

Mtodo

343204

'01
8'53 * *
343204 8312 F10'16

CxM

146913

'01
5'29 * *
48971 1186 F30'16

Error

66066

16

Interaccin

4129

Son significativos todos los efectos al 99 % (p < 0'01)

Interpretacin de Resultados

Interaction Plot

rendimiento

101

m e todo
A
B

91
81
71
61
51
0,75

1,25

1,50

dosis
a) La interaccin es significativa, luego no existe una concentracin de catalizador
ptima. La concentracin de 1'50, que con el mtodo A da el rendimiento promedio
mximo (99'67 gr), con el mtodo B da el mnimo rendimiento promedio (51 gr).
Luego habr que estudiar el efecto del catalizador en cada uno de los mtodos.

-286-

10. Anlisis de la varianza

b) No obstante, el mtodo A presenta para cada concentracin del catalizador, un


rendimiento mayor que el mtodo B. Por ello sera conveniente la utilizacin del
catalizador slo en el mtodo A, y preferiblemente, a la dosis mxima.

10.2.8. Validacin del modelo


Para validar el modelo del anlisis de la varianza, debemos comprobar que se
cumplen la hiptesis que se hacen de los residuos. Es decir, que son normales, con
media cero, varianza igual para todas las poblaciones, y que los residuos son
independientes.
Por tal motivo debemos examinar los distintos grficos de los residuos y, si no
observamos ningn comportamiento sistemtico, quiere decir que podemos aceptar
la hiptesis del residuo y por lo tanto aceptar el modelo del anlisis de la varianza.

10.2.9. Igualdad de las varianzas


Una forma sencilla para contrastar la igualdad de varianzas de las distintas
poblaciones es hacer el mismo anlisis de la varianza pero dando como variable
dependiente el cuadrado del residuo del ANOVA con los datos originales.
Si con este ANOVA los factores no tienen significacin, quiere decir que se
cumple la hiptesis nula de igualdad de las varianzas de todas las poblaciones.
Aplicando esta tcnica al ejemplo anterior con dos factores, los resultados son:

Anlisis de la Varianza paraRESIDUALS^2 - Sumas de Cuadrados de Tipo III


-------------------------------------------------------------------------------Fuente
Suma de cuadrados
GL Cuadrado Medio Cociente-F
P-Valor
-------------------------------------------------------------------------------EFECTOS PRINCIPALES
A:Dosis
4517,83
3
1505,94
1,61
0,2261
B:Mtodo
1040,17
1
1040,17
1,11
0,3071
INTERACCIONES
AB

6163,02

2054,34

2,20

0,1280

RESIDUOS
14953,9
16
934,616
-------------------------------------------------------------------------------TOTAL (CORREGIDO)
26674,9
23
-------------------------------------------------------------------------------Los cocientes F estn basados en el error cuadrtico medio residual.

-287-

10. Anlisis de la varianza

Como todos los p-values son superiores a 0,05, no hay ningn efecto
significativo y eso quiere decir que las varianzas de todas las poblaciones son
iguales.

10.2.10. Estimacin de los efectos


El efecto i viene dado por

i i -
Su estimacin es:

i xi - x

El efecto de la interaccin entre dos factores es:

( )ij ij - ( i j )
Y su estimacin es,
^

)
i
( )ij xij - ( x
j
Para el ejemplo anterior, la tabla de las medias es,
Tabla de Medias por mnimos cuadrados para Rendimiento
con 95,0 Intervalos de confianza
-------------------------------------------------------------------------------Error
Lmite
Lmite
Nivel
Frecuencia Media
Estndar
Inferior
Superior
-------------------------------------------------------------------------------Media Total
24
73,2917
Dosis
0,75
6
60,1667
2,62335
54,6054
65,7279
1
6
75,8333
2,62335
70,2721
81,3946
1,25
6
81,8333
2,62335
76,2721
87,3946
1,5
6
75,3333
2,62335
69,7721
80,8946
Mtodo
A
12
85,25
1,85499
81,3176
89,1824
B
12
61,3333
1,85499
57,4009
65,2657
Dosis segn Mtodo
0,75
A
3
63,3333
3,70997
55,4685
71,1981
0,75
B
3
57,0
3,70997
49,1352
64,8648
1
A
3
84,0
3,70997
76,1352
91,8648
1
B
3
67,6667
3,70997
59,8019
75,5315
1,25
A
3
94,0
3,70997
86,1352
101,865
1,25
B
3
69,6667
3,70997
61,8019
77,5315
1,5
A
3
99,6667
3,70997
91,8019
107,531
1,5
B
3
51,0
3,70997
43,1352
58,8648
--------------------------------------------------------------------------------

Por ejemplo, la estimacin del efecto A , es,

-288-

10. Anlisis de la varianza

A xA - x 85,25 - 73,29 11,96

Esto significa que cuando tomamos el mtodo A, por trmino medio, con
respecto a la media general, la variable observada aumenta con 11,96.

El efecto de
1 ,25

1,25 x1,25 - x 81,83 - 73,29 8 ,54


El efecto de la interaccin es,
^

A
( )A;1,25 xA;1,25 - ( x
1,25 ) 94 ,0 - ( 73,29 11,96 8 ,54 ) 0 ,21

10.2.11. Predicciones
Si por ejemplo hemos comprobado que la mejor combinacin de los factores es el
nivel i para el factor A y el nivel j para el factor B, la prediccin de la media de los
resultados con esa combinacin de los factores,
^

( )
i
ij

j
ij
El error de prediccin viene dado por el CMresidual , es decir, la varianza del
residuo.
En el ejemplo anterior, cuando el mtodo sea el A y la dosis sea 1,25, la
prediccin del valor medio es,
^

A
A;1,25

1,25 ( )A;1,25 73,29 11,96 8 ,54 0 ,21 =94

Como la varianza residual es de CMresidual =41,29, un intervalo de


confianza para el valor medio con esas condiciones es,

94 1,96

41,29
94 7 ,27 [ 86 ,73; 101,27 ]
3

Con un nivel de confianza del 95%, y donde 3 es el nmero de datos con los
que se ha calculado la media de 94.

-289-

10. Anlisis de la varianza

10.3. PROBLEMAS Y CUESTIONES DE EXAMEN


10.3.1. Para evaluar la actuacin que el gobierno est teniendo en el caso Bankia, se
ha realizado una encuesta a un total de 261 ciudadanos de ambos sexos en cinco
ciudades diferentes, donde cada ciudadano ha puntuado de 1 a 10 la actuacin del
Gobierno. A los datos obtenidos se les ha aplicado un ANOVA de dos factores con
interacciones cuyos resultados ms relevantes se muestran a continuacin:

Analysis of Variance for PUNTUACION/100 - Type III Sums of Squares


-------------------------------------------------------------------------------Source
Sum of Squares
Df
Mean Square
F-Ratio
P-value(APROXIMADO)
-------------------------------------------------------------------------------MAIN EFFECTS
A:CIUDAD
124,595
4
---------B:SEXO
6,23191
1
---------INTERACTIONS
AB

4,73289

----

----

----

RESIDUAL
833,325
---3,32002
-------------------------------------------------------------------------------TOTAL
1061,3
260

Intervalos al 95% para las medias

PUNTUACIN

5,8
4,8
3,8
2,8
1,8
1

CIUDAD

-290-

10. Anlisis de la varianza

Grfico de interacciones
PUNTUACIN
6,2

SEXO
H
M

5,2
4,2
3,2
2,2
1

CIUDAD

1) Completar la tabla ANOVA


Analysis of Variance for PUNTUACION/100 - Type III Sums of Squares
-------------------------------------------------------------------------------Source
Sum of Squares
Df
Mean Square
F-Ratio
P-Value
-------------------------------------------------------------------------------MAIN EFFECTS
A:CIUDAD
124,595
4
31,1488
9,38
0,0000
B:SEXO
6,23191
1
6,23191
1,88
0,1719
INTERACTIONS
AB

4,73289

1,18322

0,36

0,8395

RESIDUAL
833,325
251
3,32002
-------------------------------------------------------------------------------TOTAL
1061,3
260
--------------------------------------------------------------------------------

2) Qu efectos son significativos con =0,05


a) Sexo, ciudad e interaccin
b) Sexo y ciudad
c) Solo sexo
d) Solo ciudad (p-valor <0,05)
3) Qu ciudad o ciudades presentan diferencias significativas con =0,05
a) 2, 3 y 4
b) 1 respecto de las dems

-291-

10. Anlisis de la varianza

c) 5 respecto de las dems (nico intervalo que no se solapa con el


resto)
d) 1 y 2

4) En qu ciudad o ciudades presentan diferencias significativas las


puntuaciones de ambos sexos
a) En la 5
b) En la 2,3 y 4
c) En la 1
d) En ninguna (ya que la interaccin no es significativa por lo que las
medias son iguales en todas las ciudades. No son significativamente
diferentes)

10.3.2. Se ha recogido la valoracin de un lder poltico en dos ciudades distintas 1 y


2 (Factor A), dividida cada una en tres barrios segn su nivel adquisitivo (Alto,
Medio y Bajo) (Factor B). Parece que el mtodo ms indicado para ver si existe
influencia de estos dos factores sobre dicha valoracin es un Anlisis de la
Varianza:
a) Los resultados obtenidos con el Statgraphics han sido estos qu conclusiones
obtenemos?

-------------------------------------------------------------------------------Source
Sum of Squares
Df
Mean Square
F-Ratio
P-Value
-------------------------------------------------------------------------------MAIN EFFECTS
A:Ciudad
60,8444
1
60,8444
21,37
0,0000
B:Nivel
84,6889
2
42,3444
14,87
0,0000
INTERACTIONS
AB
29,4889
2
14,7444
5,18
0,0076
RESIDUAL
239,2
84
2,84762
-------------------------------------------------------------------------------TOTAL (CORRECTED)
414,222
89
--------------------------------------------------------------------------------

b) A la vista de las grficas siguientes y, teniendo en cuenta las conclusiones


obtenidas en el apartado anterior, determinar cul es la ciudad en la que se tiene una

-292-

10. Anlisis de la varianza

valoracin ms alta del lder poltico y qu nivel adquisitivo tienen, justificando en qu


grficas has obtenido dichas conclusiones y porqu.

Means and 95,0 Percent LSD Intervals

Valoracin

6,8
5,8
4,8
3,8
2,8
A

Nivel
Means and 95,0 Percent LSD Intervals

Valoracin

5,8
5,3
4,8
4,3
3,8
3,3
1

Ciudad

-293-

10. Anlisis de la varianza

Interaction Plot

Valoracin

7,1

Nivel
A
B
M

6,1
5,1
4,1
3,1
1

Ciudad

10.3.3. En una fbrica de botellas de plstico se quiere decidir qu producto resulta


ms resistente. Para ello se supone que tanto el tipo de plstico utilizado como
materia prima, como el volumen de las botellas, pueden afectar a dicha
resistencia. Se estudiaron tres tipos de plstico, (A;B;C) y 4 volmenes diferentes
(0,75; 1; 1,25 y 1,5), midiendo la resistencia de 3 botellas elegidas al azar para
cada posible combinacin de tipo de plstico y volumen (se analizaron 36 botellas
en total).
a) Completar la tabla del ANOVA de dos factores que result de dicho
experimento (1 puntos):

Fuente
Plstico
Volmen
Plstico x Volmen
Residual
Total

SC
2287,17
1613,64
2284,61
639,33
6824,75

Gl
2
3
6
24
35

CM
1143,585
537,88
380,7683
26639

Fc
42929
20191
14294

b) En vista de la tabla anterior, qu se puede decir de la significacin de los


efectos de los factores estudiados? Qu significado tiene en este caso
concreto de estudio la interaccin? Tomar = 0.05 (0,5 puntos)
Para el plstico:
0, 05
2, 24

340 P valor 0,05 Efecto significat ivo

Para el volumen:
0, 05
3, 24

Tc=42929 > F tablas


Tc=20191 > F tablas

301 P valor 0,05 Efecto significat ivo


-294-

10. Anlisis de la varianza

Para la interaccin:Tc=14294 > F tablas


0, 01
6, 24

2,51 P valor 0,05 Efecto significat ivo

El efecto significativo de la interaccin puede interpretarse como que el efecto del


volumen no es el mismo en los tres tipos de plastic

A partir del grfico de interaccin, qu combinacin de tipo de plstico y volumen da


una botella ms resistente? Si por motivos econmicos el nico tipo de plstico que
se puede utilizar es el C, qu volumen de botella da una mayor resistencia?

Grfico de interaccin
106

Resistencia

96

Plstico
A
B
C

86
B

76
66

56
0,75

1,25

1,5

Volmen
Mejor combinacin (mayor resistencia) : Plstico A y Volumen 1,5 litros
Para el plstico C el volumen que ofrece mayor resistencia es de 1 litro

10.3.4. Una cooperativa agrcola vende tres tipos de fitoreguladores (A, B y C) para
regular el crecimiento de trigo. Para determinar cul es el ms efectivo, se
seleccionan al azar 12 parcelas de trigo con caractersticas similares. En tres de
ellas se aplica el fitoregulador A, en otras tres parcelas el fitoregulador B y en otras
seis, el C. En todos los casos, la aplicacin se realiza por medio de un atomizador
a una dosis de 10 mg/ha. Los resultados obtenidos, medidos como longitud media
(mm) de 10 plantas seleccionadas al azar al cabo de 3 semanas de aplicacin
(variable longitud) son los indicados en la tabla. Los datos se analizan con
ANOVA utilizando Statgraphics, obtenindose el grfico que se muestra a
continuacin.

-295-

10. Anlisis de la varianza

Means and 95,0 Percent LSD Intervals


880
longitud

780
680
580
480
380
280
A

fitoregulador A
373

365

312

fitoregulador B
739

711

695

fitoregulador

fitoregulador C
615
844
711
648
809
663

Prctica 2:
- Cul de las siguientes afirmaciones es correcta?
(2,5
puntos)
a) A la vista de la grfica se deduce que el p-valor del test del ANOVA es superior
a 0,05.
b) A la vista de la grfica se deduce que el p-valor del test del ANOVA es inferior a
0,05.
c) A partir de la grfica no es posible deducir ninguna de las dos respuestas
anteriores.
d) Depende del nivel de significacin del test, el cual no se puede deducir del
grfico.
Solucin: los intervalos LSD se han construido con un nivel de confianza 1- =95%,
de modo que =0,05. Dado que los intervalos LSD no se solapan significa que
alguna de las medias es significativamente distinta de las dems considerando
=0,05, por lo que se rechaza la hiptesis nula H0: mA=mB=mC. Consecuentemente,
p-valor< , de modo que la respuesta correcta es la b).

- Teniendo en cuenta que x A =350, x B x C =750, qu tipo de fitoregulador se


recomendara para maximizar la longitud?
(2,5 puntos)
a) El de tipo B, ya que la longitud de su intervalo LSD es mayor que la de C lo cual
sugiere que tiene una mayor probabilidad de que se alcancen valores mayores de
longitud.
b) El de tipo C, ya que la longitud de su intervalo LSD es menor que el de B lo cual
sugiere que su desviacin tpica es menor.

-296-

10. Anlisis de la varianza

c) El de tipo B C.
d) Cualquiera de los tres, ya que se acepta la hiptesis nula H0: mA=mB=mC.
Solucin: la c) ya que se solapan sus intervalos LSD, por lo que debe aceptarse la
hiptesis de que mB=mC.

- Una de las hiptesis del ANOVA es que la poblacin de datos de la variable longitud
se ajusta a un modelo Normal en cada uno de los tres fitoreguladores ensayados.
Cmo se podra verificar si esta hiptesis es admisible?
(2,5 puntos)
a) La hiptesis de normalidad es admisible dado que los intervalos LSD son
simtricos.
b) Habra que estudiar si los 12 datos de la tabla se ajustan bien a un modelo
Normal.
c) Habra que calcular los residuos del ANOVA y estudiar si stos se ajustan bien a
un modelo Normal.
d) No hay suficientes datos para estudiar si el modelo Normal es admisible.
Solucin: los intervalos LSD son siempre simtricos, por lo que la respuesta a) es
falsa. Dado que la media de A es significativamente menor que las otras dos,
tampoco es correcto utilizar directamente los 12 datos de la tabla, pues tenemos una
mezcla de dos poblaciones con distinta media. La respuesta correcta es la c), pues
hay tcnicas que permiten estudiar si el modelo Normal es admisible aunque slo
tengamos 12 datos.

10.3.5. Una industria qumica desea estudiar el efecto del tipo de catalizador y de la
concentracin de un cierto aditivo denominado NCV en la calidad final del producto
elaborado. Para ello se ha diseado un experimento ensayando tres catalizadores
diferentes: A, B y C (factor CAT) combinados con tres concentraciones de aditivo:
4, 5 y 6 (factor NCV). Cada uno de los nueve tratamientos se ensay dos veces,
midindose en cada prueba un parmetro de calidad final (variable LAT). Tras la
realizacin del experimento y la recogida de datos se llev a cabo un Anlisis de la
Varianza cuya tabla resumen se muestra a continuacin:

Analysis of Variance for LAT - Type III Sums of Squares


-----------------------------------------------------------------Source

Sum of Squares

Df

Mean Square

F-Ratio

-----------------------------------------------------------------MAIN EFFECTS
A:CAT

77,7733

___

________

_____

B:NCV

_______

___

41,4867

_____

-297-

10. Anlisis de la varianza

INTERACTIONS
AB
RESIDUAL

_______

___

________

16,56

___

________

_____

-----------------------------------------------------------------TOTAL (CORRECTED)

250,52

___

------------------------------------------------------------------

a) Completa la tabla resumen del ANOVA, indicando qu efectos son


estadsticamente significativos (=0,05). Justificando la respuesta, as como los
clculos realizados. (3,5 puntos)
Analysis of Variance for LAT - Type III Sums of Squares
-----------------------------------------------------------------Source

Sum of Squares

Df

Mean Square

F-Ratio

-----------------------------------------------------------------MAIN EFFECTS
A:CAT

77,7733

38,8866

21,13

B:NCV

82,9734

41,4867

22,55

73,2133

18,303

9,95

16,56

1,84

INTERACTIONS
AB
RESIDUAL

-----------------------------------------------------------------TOTAL (CORRECTED)

250,52

17

------------------------------------------------------------------

Respuesta: Dado que se han realizado 18 pruebas experimentales, el nmero de


grados de libertad totales ser 18 1 = 17. Como en los dos factores hay dos niveles,
los grados de libertad de cada factor sern 3 1 = 2. La interaccin doble tendr 2 2
= 4 grados de libertad, y los residuales se obtienen por diferencia: Dfres = 17 2 2
4=9
Cuadrado medioNCV = suma de cuadrados / gr. Lib
41,4867 = SC / 2 SC = 82,9734
SCAB = SCtotal SCCAT SCNCV = 73,2133
Dividiendo las sumas de cuadrados por los grados de libertad se obtiene el cuadrado
medio. Dividiendo el cuadrado medio de un factor entre el cuadrado medio residual
se obtiene la F-ratio.
El F-ratio de CAT (21,13) y el F-ratio de NCV (22,5) superan el valor crtico (=0,05)
de una F2;9 que vale 4,26. El F-ratio de la interaccin (9,95) supera el valor crtico
(=0,05) de una F4;9 que vale 3,63. Por tanto, el efecto simple de los dos factores y de
la interaccin son estadsticamente significativos.
b) Qu informacin aporta el siguiente grfico? Dicha informacin es coherente
con las conclusiones del apartado anterior? Por qu? (2,5 puntos)

-298-

10. Anlisis de la varianza

Means and 95,0 Percent LSD Intervals


13,3

LA T

11,3

9,3

7,3

5,3

ALG

CAT

Respuesta: Este grfico muestra los intervalos LSD (Least Significant Differences)
para el factor CAT, obtenidos con un nivel de confianza del 95%. A la vista del grfico
se deduce que el valor medio de la variable LAT es significativamente distinto entre
los catalizadores A y el B, as como tambin entre B y C ya que sus intervalos LSD
no se solapan. Sin embargo, no hay diferencias significativas entre A y C porque sus
respectivos intervalos se solapan. Por tanto, se deduce que:
mB < (mA = mC)
La informacin deducida del grfico es coherente con el hecho de que el factor CAT
resulta estadsticamente significativo, pues ello indica que al menos uno de los
catalizadores tendr un valor medio significativamente distinto de los dems.

Soluciones
a) Los dos factores y la interaccin son significativas (p-valor<005), lo que implica
que las ciudades y los distintos niveles adquisitivos valoran al poltico de diferente
manera.
La interaccin significara que los distintos niveles no valoran igual en las dos
ciudades.
b) Dado que la interaccin es significativa no podemos mirar en los intervalos LSD ya
que nos dan los valores del factor sin tener en cuenta la relacin con la otra variable.
Si miramos en la grfica Interaction Plot vemos que la valoracin ms alta es en la
ciudad 1 con nivel adquisitivo Alto y Medio, que tienen idntica valoracin.
Si hubiramos mirado en los LSD (que no es lo correcto aunque en este caso difieren
poco) slo es la ciudad 1 con nivel alto.

-299-

10. Anlisis de la varianza

-300-

11. Regresin lineal

11. REGRESIN LINEAL


Contenido
11.1.
11.2.
11.3.
11.4.
11.5.
11.6.
11.7.

11.1.

HIPTESIS DEL MODELO ..................................................................... 301


ESTIMACIN DE LOS COEFICIENTES DE REGRESIN ..................... 303
CONTRASTES DE SIGNIFICACIN DE LOS COEFICIENTES .............. 305
VALIDACIN DEL MODELO................................................................... 310
INTERVALOS DE PREDICCIN ............................................................. 313
BONDAD DE AJUSTE............................................................................. 315
PROBLEMAS Y CUESTIONES DE EXMENES .................................... 317

HIPTESIS DEL MODELO

Supongamos que tenemos la variable aleatoria bidimensional (X,Y) donde X es la


altura de una persona, Y es su peso, y a partir de una muestra de n personas,
quisiramos predecir el peso de una de ellas conociendo su altura. Para ello
aplicamos un modelo de la forma Y=g(X), siendo la ms sencilla la recta, de manera
que a la nube de puntos (X,Y) queremos ajustar la mejor recta que pase por todos
ellos.
El modelo terico a aplicar es:

Y = + X +
donde es una variable normal de media 0 y de varianza . X es un valor fijo, y
, son los parmetros que definen la recta, que se llama recta de regresin.
Como

es aleatorio, tambin Y ser aleatorio con una distribucin normal de

media:

E(Y) = + X + E( ) = +
y varianza
2
2
2
D (Y) = D ( ) =

Tngase en cuenta que + X representan aqu una constante.


Si para una altura determinada el valor medio del peso fuera siempre el
mismo, no habra inters en ajustar una recta a los puntos, puesto que el conocer X
no aporta nada para predecir el valor de Y. Esto significara que el coeficiente de
correlacin es cero y la recta de regresin es paralela al eje de las X.
-301-

11. Regresin lineal

En caso contrario, el coeficiente de correlacin es distinto de cero, y puede


ser interesante ajustar una recta a la nube de puntos (X,Y). Grficamente es:

Figura 11. 1. Distribuciones condicionales.

Para una X fijada, el conjunto de puntos de Y forman una campana de Gauss.


Los valores medios de dichas campanas se encuentran sobre la recta + X y la
dispersin de cada campana es siempre la misma. A esta ltima propiedad se le
llama homocedsticidad.
La ecuacin Y = + X + significa que, conocido X, podemos predecir un
valor de Y, excepto una cantidad residual , que llamamos error, la cual engloba la
influencia de todos los dems factores sobre la variable Y.
Los errores tienen que cumplir la condicin de ser independientes. Esta
propiedad se expresa diciendo que los errores o residuos deben estar
incorrelacionados entre si.
Con todo ello las hiptesis del modelo

Y = + X +
son:
1)

Para cada X, Y sigue una distribucin normal de media + X y de


varianza 2 .

2)

sigue una distribucin normal de media 0 y varianza 2 .


-302-

11. Regresin lineal

3)

Los residuos estn incorrelacionados.

4)

Los residuos no siguen un comportamiento sistemtico.

5)

Los residuos no tienen valores anmalos.

Si queremos reducir el error de prediccin, podemos introducir otra variable X2


de forma que haya una mejor explicacin de la variable Y. En otros casos,
directamente queremos conocer la relacin entre una variable dependiente Y, y dos o
ms variables independientes X1 y X2. El modelo a aplicar es:

Y = + 1 X 1+ 2 X 2 +
entonces se dice que el modelo es de regresin lineal mltiple.
Las hiptesis a aadir son:

11.2.

6)

Las variables X's son independientes entre si.

7)

El nmero de datos es mayor que el nmero de variables X's.

ESTIMACIN DE LOS COEFICIENTES DE REGRESIN

Para una nube de puntos (X,Y) como el de la figura siguiente

y
ei
y

X
Figura 11. 2. Recta de ajuste

la mejor recta de regresin es aquella que la suma de los cuadrados de los


segmentos verticales dibujados sea mnima. Dichos segmentos representan el error
-303-

11. Regresin lineal

entre el valor observado y un valor predicho. Esto es, conociendo un valor de X, el


valor predicho es:

Y = + X
y el error es

= Y - Y = y - - X
que por trmino medio tendr un valor al cuadrado de:

E(y - - X )2
y debemos elegir los parmetros y de forma que

mnimo E(Y - - X )2
Para ello hacemos

E
E
= 0;
=0

y obtenemos los valores de y , a los cuales llamamos a y b, respectivamente.


Los valores que se obtienen son:
2

b=

S xy
2
S xx

y = a + bx
Donde,
n

S xy2 ( xi x )( yi y )
i 1
n

S xx2 ( xi x ) 2
i 1

En regresin lineal mltiple, por ejemplo, para dos variables, el modelo es

Y = 0 + 1 X 1+ 2 X 2 +
y la condicin a cumplir es mn E(Y - 0 - 1 X 1 - 2 X 2 ) , y obtenemos unos valores
2

de b0 ,b1 ,b2 , en funcin de los datos muestrales.


-304-

11. Regresin lineal

11.3.

CONTRASTES DE SIGNIFICACIN DE LOS COEFICIENTES

y , son funciones de los datos

Se observa que a y b, las estimaciones de

muestrales ( x1 , y1 ),( x2 , y2 ),...( xn , yn ) , de manera que, para cada

muestra de n

puntos extrada al azar, cambian los valores de a y b. En consecuencia, a y b son dos


variables aleatorias con sus medias y sus varianzas. Se demuestra que para el
estadstico a son:

E(a) =
n

2
D (a) =

2 xi2
i=1

n( x - n x )
2

2
i

i=1

y para el estadstico b son:

E(b) =
2
D (b) =

2
n

x -nx
2
i

i=1

siendo 2 la varianza residual, cuya estimacin viene dada por:


n

2
i

2 =

i=1

n2

Como 2 es desconocida, la sustituimos por 2 , a y b siguen distribuciones t


de Student de n-2 grados de libertad. Es decir:

a - E(a)
= t n- 2
D(a)

-305-

11. Regresin lineal

b - E(b)
= t n- 2
D(b)
o bien:

a -
b-
= t n- 2 ;
= t n- 2
D(a)
D(b)
las primeras hiptesis que se plantean es si

y son nulas o por el contrario

tienen un valor significativamente distinto de cero.


Para contrastar H 0 ( = 0) observamos la cantidad

a -0
D(a)
lo cual da un nmero. Si ste est dentro del campo de existencia de la t, al 95%,
decimos que no hay razn para rechazar que = 0 .
Para contrastar H o ( = 0) observamos la cantidad

b -0
D(b)
lo cual da otro nmero. Si ste se encuentra dentro del campo de existencia al 95%
de una t n- 2 , decimos que no hay razn para rechazar que = 0 .
En la prctica, el valor de

b
se le llama t-value, y se calcula la probabilidad
D(b)

de que una t n- 2 sea, en mdulo, mayor que la t-value. Si dicha probabilidad es menor
que 0,05, rechazamos la hiptesis nula de que el coeficiente es cero.

Simple Regression - Peso vs. Altura


Dependent variable: Peso
Independent variable: Altura
Linear model: Y = a + b*X

-306-

11. Regresin lineal

Coefficients
Least Squares

Standard

Parameter Estimate

Error

Statistic

P-Value

Intercept

-78,486

19,6355

-3,99714

0,0002

Slope

0,833335

0,110693

7,52833

0,0000

Analysis of Variance
Source

Sum of Squares Df

Mean Square F-Ratio

P-Value

Model

2815,93

2815,93

0,0000

Residual

2782,35

56

49,6848

Total (Corr.)

5598,28

57

56,68

Correlation Coefficient = 0,709224


R-squared = 50,2999 percent
R-squared (adjusted for d.f.) = 49,4124 percent
Standard Error of Est. = 7,04874
Mean absolute error = 5,20749
Durbin-Watson statistic = 2,12033 (P=0,6706)
Lag 1 residual autocorrelation = -0,0660485

The StatAdvisor
The output shows the results of fitting a linear model to describe the relationship between Peso and
Altura. The equation of the fitted model is
Peso = -78,486 + 0,833335*Altura
Since the P-value in the ANOVA table is less than 0,05, there is a statistically significant relationship
between Peso and Altura at the 95,0% confidence level.
The R-Squared statistic indicates that the model as fitted explains 50,2999% of the variability in Peso.
The correlation coefficient equals 0,709224, indicating a moderately strong relationship between the
variables. The standard error of the estimate shows the standard deviation of the residuals to be
7,04874. This value can be used to construct prediction limits for new observations by selecting the
Forecasts option from the text menu.

-307-

11. Regresin lineal

The mean absolute error (MAE) of 5,20749 is the average value of the residuals. The Durbin-Watson
(DW) statistic tests the residuals to determine if there is any significant correlation based on the order in
which they occur in your data file. Since the P-value is greater than 0,05, there is no indication of serial
autocorrelation in the residuals at the 95,0% confidence level.

En regresin lineal mltiple se acta con el mismo criterio, pero adems se


suele hacer un contraste de hiptesis de que todos los coeficientes de regresin son
nulos, esto es:

H 0 ( 1 = 2 = 0)
frente que al menos uno de

ellos es distinto de cero. Para esto aplicamos un

procedimiento semejante al anlisis de la varianza. Se calcula el valor de 2 por dos


procedimientos que veremos a continuacin, y que bajo el supuesto de la hiptesis
H 0 ( 1 = 2 = 0) , deben dar lo mismo, esto es, que el cociente:

12

1
22

Siempre el numerador va a ser mayor que el denominador, y en caso de que


ese cociente sea muy elevado, eso es indicio de que al menos un coeficiente de
regresin es distinto de cero.

Figura 11. 3. Valores predichos


n

( y - y )

12 =

i=1

-308-

11. Regresin lineal

( y - y
i

22 =

i=1

n-2

y el cociente de varianzas sigue una F de 1 y n-2 grados de libertad.

Multiple Regression - Peso


Dependent variable: Peso
Independent variables:
Altura
Edad
Sexo=2

Standard

Parameter

Estimate

Error

Statistic

P-Value

CONSTANT

-101,667

36,5018

-2,78526

0,0074

Altura

0,621629

0,144015

4,31641

0,0001

Edad

3,3533

1,18711

2,82477

0,0066

Sexo=2

-7,22088

3,53274

-2,04399

0,0458

Analysis of Variance
Source

Sum of Squares Df

Mean Square F-Ratio

P-Value

Model

3434,97

1144,99

0,0000

Residual

2163,31

54

40,0613

Total (Corr.)

5598,28

57

28,58

R-squared = 61,3576 percent


R-squared (adjusted for d.f.) = 59,2108 percent
Standard Error of Est. = 6,3294
Mean absolute error = 4,85517

-309-

11. Regresin lineal

Durbin-Watson statistic = 2,1583 (P=0,7124)


Lag 1 residual autocorrelation = -0,081475

The StatAdvisor
The output shows the results of fitting a multiple linear regression model to describe the relationship
between Peso and 3 independent variables. The equation of the fitted model is
Peso = -101,667 + 0,621629*Altura + 3,3533*Edad - 7,22088*Sexo=2
Since the P-value in the ANOVA table is less than 0,05, there is a statistically significant relationship
between the variables at the 95,0% confidence level.
The R-Squared statistic indicates that the model as fitted explains 61,3576% of the variability in Peso.
The adjusted R-squared statistic, which is more suitable for comparing models with different numbers of
independent variables, is 59,2108%. The standard error of the estimate shows the standard deviation of
the residuals to be 6,3294. This value can be used to construct prediction limits for new observations by
selecting the Reports option from the text menu. The mean absolute error (MAE) of 4,85517 is the
average value of the residuals. The Durbin-Watson (DW) statistic tests the residuals to determine if there
is any significant correlation based on the order in which they occur in your data file. Since the P-value is
greater than 0,05, there is no indication of serial autocorrelation in the residuals at the 95,0% confidence
level.
In determining whether the model can be simplified, notice that the highest P-value on the independent
variables is 0,0458, belonging to Sexo=2. Since the P-value is less than 0,05, that term is statistically
significant at the 95,0% confidence level. Consequently, you probably don't want to remove any
variables from the model.

11.4.

VALIDACIN DEL MODELO

Aparte de contrastar las hiptesis nulas de que los coeficientes de regresin son cero
o no, hay que comprobar las hiptesis del modelo acerca de los residuos. Esto es:
1) Son normales
2) Media cero.
3) Varianza constante.
4) Incorrelacionados.
5) No hay valores anmalos.
1) Normalidad
Para comprobar la normalidad de los residuos se realiza un grfico probabilstico
normal, como el de la figura siguiente:

-310-

11. Regresin lineal

Normal Probability Plot

99,9
99

percentage

95
80
50
20
5
1
0,1
-13

-8

-3

2
RESIDUALS

12

17

Figura 11. 4. Test de ajuste a una normal.

Si los puntos estn situados sobre una recta, decimos que los datos se
ajustan a una distribucin normal.
2) Media cero
Se puede calcular el intervalo de confianza del residuo. Si el intervalo de confianza al
95% incluye al 0, decimos que la media es 0 con un nivel de significacin del 5%.
3) Varianza constante
Para ello realizamos un grfico de dispersin de ei frente a x. Por ejemplo, si el
grfico fuera como el de la figura siguiente:

Figura 11. 5.Varianza no constante

-311-

11. Regresin lineal

se observa que a medida que aumenta X, aumenta la dispersin, lo que contradice la


hiptesis de homocedsticidad del modelo.
4) Autocorrelacin
Por ejemplo, si el grfico de ei frente a x es como el de la figura siguiente:

Figura 11. 6. Residuos en funcin de x

significa que los residuos estn correlacionados, ya que primero son negativos, luego
positivos, negativos, etc.. Es decir, no hay independencia de los residuos.
Este caso particular corresponde a una situacin en que la nube de puntos
(X,Y) tiene la forma de una parbola, pero se ha ajustado una recta, tal como en la
figura de abajo:

Figura 11. 7. Falta de ajuste

En general, las grficas de residuos no tienen que mostrar ningn


-312-

11. Regresin lineal

comportamiento sistemtico.

5) Valores anmalos
Se pueden determinar dibujando los residuos en funcin de x, y observando aquellos
puntos que sean muy extremos, tanto por arriba, como por abajo de la media.
Tambin se pueden estandarizar los residuos, y observar aquellos cuyos valores
sean ms de 3 en mdulo.

11.5.

INTERVALOS DE PREDICCIN

Una vez que el modelo ha pasado la etapa de validacin, se puede emplear para
realizar predicciones de y0 , conociendo un valor de x0 . Se pueden efectuar dos tipos
de predicciones:
a)

Dado un valor de x0 , cunto vale por trmino medio el valor de y0 ? Es


una prediccin para la media de y0 .

b)

Dado un valor de x0 , cunto vale el valor de y0 ? Es una prediccin


para un valor puntual de y0 .

Para el segundo caso habr una mayor imprecisin que para el primero,
puesto que resulta ms difcil predecir un valor puntual, que una media, en donde los
valores altos y bajos se pueden compensar.
El intervalo de prediccin para la media de y0 es:
/2

a + b x0 + t n2

1 ( x0 x )2

n
s
xx

y para un valor puntual es:


/2

a + bx0 + t n2

1 ( x0 x )2

1 + +

n
s
xx

donde
n

2
S xx = ( xi x )
i=1

-313-

11. Regresin lineal

Grficamente, los lmites superior e inferior de dichos intervalos forman unas


curvas alrededor de la recta de regresin, tal como se presenta en la figura siguiente:

Plot of Fitted Model


Peso = -78,486 + 0,833335*Altura
85

Peso

75

65

55

45
150

160

170

180

190

200

Altura

Fi
gura 11. 8. Intervalos de prediccin.

Las curvas mas interiores corresponden a la prediccin de un valor medio de


Y, y las mas exteriores, a un valor puntual de Y.
Cuando X coincide con x , la amplitud de los intervalos es mnima, tal y como
se observa en la figura 11.8, y se corresponde con las frmulas.

-314-

11. Regresin lineal

Plantear el
problema

Formular el
modelo
y=a+bx+e

Calcular
coeficientes

Validacin del
modelo

NO
Ok?

SI

Previsin y control

Figura 11. 9. Formulacin de modelos de regresin

11.6.

BONDAD DE AJUSTE

Para dos modelos de regresin que cumplan las hiptesis, )cul de los dos es el
mejor? o bien para uno de ellos, )cunto de bien se ajustan los datos al modelo?
Para determinar el grado de ajuste de los puntos se calcula el coeficiente de
determinacin R 2 , el cual viene dado por:
2
R = 1

suma de cuadrados residual


suma de cuadrados total

Cunto ms se ajuste a 100% el R 2 , mejor ser el ajuste de los datos al


modelo.

-315-

11. Regresin lineal

Si introducimos otra variable al modelo, el valor de R 2 siempre aumenta, pero


puede ser que la aportacin de la nueva variable no sea significativa. Por ello se
calcula el R 2 ajustado, el cual es:

= 1

2
adjus.

2
var.residual
= 1 2
var.total
Y

el cual penaliza la introduccin de nuevas variables, y en caso de no ser


significativas, disminuye el valor de R 2adju.

Mtodo del incremento de la suma de cuadrados


Modelo 1 (ms sencillo)

y = 0 + 1 x1 +
Suma de cuadrados:

SCT 1 = SCE1 + SCR1


Modelo 2 (ms completo)

y = 0 + 1 x1 + 2 x2 +

Suma de cuadrados

SCT 2 = SCE 2 + SCR2


Incremento de la suma de cuadrados SCR = SCR1 - SCR2
El modelo 2 es mejor que el 1 si:
SCR

1
> F 1,
g.l.mod elo 2
SCR 2
g.l.modelo 2

-316-

11. Regresin lineal

11.7.

PROBLEMAS Y CUESTIONES DE EXMENES

11.7.1.- Se quiere estudiar la relacin existente entre la renta, en millones de euros,


para diferentes provincias espaolas y el nmero de automviles y motocicletas (en
miles de unidades) en las mismas. Para ello se tienen para cada provincia la
relacin de automviles y motocicletas as como su renta media.
Los resultados obtenidos mediante regresin se muestran a continuacin.
Anlisis de Regresin Mltiple
----------------------------------------------------------------------------Variable dependiente: RENTA_PROV
----------------------------------------------------------------------------Error
Parmetro

Estimacin

Estadstico

estndar

P-Valor

----------------------------------------------------------------------------CONSTANTE

6343.96

1127.17

5.62823

0.0000

AUTOMOVIL

0.610523

0.024924

24.4954

0.0000

MOTOS

0.110201

0.0565941

1.94722

0.0575

----------------------------------------------------------------------------Anlisis de Varianza
----------------------------------------------------------------------------Fuente

Suma de cuadrados

GL Cuadrado medio Cociente-F

P-Valor

----------------------------------------------------------------------------Modelo

9.02343E10

4.51172E10

Residuo

1.37954E9

47

2.9352E7

1537.11

0.0000

----------------------------------------------------------------------------Total (Corr.)

9.16139E10

49

R-cuadrado = 98.4942 porcentaje


R-cuadrado (ajustado para g.l.) = 98.4301 porcentaje
Error estndar de est. = 5417.75
Error absoluto medio = 3469.87
Estadstico de Durbin-Watson = 2.29066 (P=0.1528)
Autocorrelacin residual en Lag 1 = -0.153461

-317-

11. Regresin lineal

Con los resultados anteriores y un nivel de significacin de un 5%

1. Cules son las variables que presentan una influencia significativa sobre el nivel
de renta provincial? (2,5 puntos)
a)
b)
c)
d)

AUTOMOVIL y MOTOS
AUTOMOVIL
MOTOS
El modelo no es significativo

2. El coeficiente de determinacin del modelo representado tiene un valor de: (2,5


puntos)
a)
b)
c)
d)

-0.153461
98.4942
6343.96
1537.11

3. Empleando el modelo completo cul es el valor esperado de la renta provincial


si AUTOMOVIL=1000 y MOTOS= B=500? (2,5 puntos)
a)
b)
c)
d)

6343.96
7505.533
7009.5835
55.1005

4. La estimacin del parmetro AUTOMOVIL representa: (2,5 puntos)

a) Incremento medio en el valor esperado de la renta provincial por cada coche


que se matricula manteniendo constante el resto de variables independientes.
b) Incremento medio en el valor esperado de la renta provincial por cada mil
coches que se matriculan manteniendo constante el resto de variables
independientes.
c) Incremento en el valor esperado de la renta provincial por cada mil coches
que se matriculan manteniendo constante el resto de variables independientes
-318-

11. Regresin lineal

d) Incremento en el valor esperado de la renta provincial por cada coche que se


matricula sin matricularse ninguna moto.

11.7.2.- La relacin que existe entre la potencia de un coche (horsepower) y su


consumo (mpg) y su pas de procedencia se ha estudiado a travs de un modelo de
regresin como el que se ve en la siguiente salida del statgraphics:
----------------------------------------------------------------------------Dependent variable: horsepower
-----------------------------------------------------------------------------

Parameter

Standard

Error

Statistic

Estimate

P-Value

----------------------------------------------------------------------------CONSTANT
mpg
Pais

161,85

6,75849

23,9477

0,0000

-2,56657

0,196964

-13,0306

0,0000

1,43398

2,909

0,492947

0,6228

----------------------------------------------------------------------------Analysis of Variance
----------------------------------------------------------------------------Source

Sum of Squares

Df

Mean Square

F-Ratio

P-Value

----------------------------------------------------------------------------Model

55446,7

27723,3

Residual

33589,4

147

228,499

121,33

0,0000

----------------------------------------------------------------------------Total (Corr.)

89036,1

149

R-squared = 62,2744 percent


R-squared (adjusted for d.f.) = 61,7611 percent
Standard Error of Est. = 15,1162
Mean absolute error = 11,615
Durbin-Watson statistic = 1,46866 (P=0,0005)
Lag 1 residual autocorrelation = 0,26547

-319-

11. Regresin lineal

1) De qu trminos depende de forma significativa para un valor de =0,05 la


variable dependiente? Justifica la respuesta (0,50 puntos)
a) Contante, mpg, pas
x b) Constante, mpg porque sus P-valores son menores q ue 0,05
c) Pas
d) La dependencia nos la da la R-squared.

2) Cunto vale el coeficiente de determinacin? (0,50 puntos)

a) Lo obtenemos de la tabla del anlisis de la varianza y nos lo da el p-value


indicndonos que como es menos que 005 el modelo es vlido.
b) Lo obtenemos de la tabla del anlisis de la varianza y se calcula como la raz
cuadrada de la SCE/SCT y vale 15,1162
x c) Lo obtenemos de la tabla del anlisis de la varianza y se calcula como la
SCE/SCT por 100 y vale 62,2744%
d) Nos lo da la tabla del anlisis de la varianza y es el valor F-Ratio 121,33 que al ser
tan grande significa que el modelo es vlido.

11.7.3.- Se estudia la relacin entre la composicin de un cemento tipo Portland y el


calor desprendido durante la fase de fraguado. Para ello se midi la cantidad de calor
desprendido en caloras por gramos de cemento junto con las variables que se
pensaba podan tener influencia sobre el calor desprendido A, B y C que representan
el contenido en porcentaje de tres productos.

Los resultados se obtenidos se muestran a continuacin.

-320-

11. Regresin lineal

Anlisis de Regresin Mltiple


----------------------------------------------------------------------------Variable dependiente: Calor
----------------------------------------------------------------------------Error
Parmetro

Estimacin

Estadstico

estndar

P-Valor

----------------------------------------------------------------------------CONSTANTE

48,1936

3,9133

12,3153

0,0000

1,69589

0,204582

8,28954

0,0000

0,656915

0,0442342

14,8508

0,0000

0,250018

0,184711

1,35356

0,2089

-----------------------------------------------------------------------------

Anlisis de Varianza
----------------------------------------------------------------------------Fuente

Suma de cuadrados

GL Cuadrado medio Cociente-F

P-Valor

----------------------------------------------------------------------------Modelo

2667,65

889,217

Residuo

48,1106

5,34562

166,34

0,0000

----------------------------------------------------------------------------Total (Corr.)

2715,76

12

R-cuadrado = 98,2285 porcentaje


R-cuadrado (ajustado para g.l.) = 97,638 porcentaje
Error estndar de est. = 2,31206
Error absoluto medio = 1,57588
Estadstico de Durbin-Watson = 2,11016 (P=0,3638)
Autocorrelacin residual en Lag 1 = -0,116306

-321-

11. Regresin lineal

Anlisis de Regresin Mltiple


----------------------------------------------------------------------------Variable dependiente: Calor
----------------------------------------------------------------------------Error
Parmetro

Estimacin

Estadstico

estndar

P-Valor

----------------------------------------------------------------------------CONSTANTE

52,5773

2,28617

22,998

0,0000

1,46831

0,121301

12,1047

0,0000

0,66225

0,0458547

14,4424

0,0000

-----------------------------------------------------------------------------

Anlisis de Varianza
----------------------------------------------------------------------------Fuente

Suma de cuadrados

GL Cuadrado medio Cociente-F

P-Valor

----------------------------------------------------------------------------Modelo

2657,86

1328,93

Residuo

57,9045

10

5,79045

229,50

0,0000

----------------------------------------------------------------------------Total (Corr.)

2715,76

12

R-cuadrado = 97,8678 porcentaje


R-cuadrado (ajustado para g.l.) = 97,4414 porcentaje
Error estndar de est. = 2,40634
Error absoluto medio = 1,90933
Estadstico de Durbin-Watson = 1,92164 (P=0,4717)
Autocorrelacin residual en Lag 1 = -0,054504

-322-

11. Regresin lineal

A.

El coeficiente de determinacin del modelo matemtico ms adecuado tiene un


valor de: (0,25 puntos)
a. 2,40634
b. 97,638
c. 2,31206
d. 97,4414 Cuando se comparan modelos se usa el R-cuadrado
(ajustado para gl)

B. La ecuacin matemtica que se debera utilizar para predecir el valor del calor
desprendido en la fase de fraguado es:
(0,25 puntos)
a. Calor=48,1936+0,656915B+1,69589A
b. Calor=52,5773+0,66225B+1,46831A
significativo)

(el coeficiente de C no es

c. Calor=48,1936+0,250018C+0,656915B+1,69589A
d. Ninguno de los anteriores

C. La estimacin del parmetro A representa:

(0,25 puntos)

a. Decremento medio en el valor del calor por cada unidad que aumenta
el parmetro A
b. Incremento medio en el valor del calor por cada unidad que
aumenta el parmetro A manteniendo constante el resto de
variables independientes.
c. Incremento medio en el valor del calor por cada unidad que aumenta el
parmetro A
d. Ninguna de los anteriores

D. Qu valor obtendramos del calor desprendido si A=11, B=56 y C=8


puntos)

(0,25

103,63563
a. 105,81471 (sustituyndolas variables significativas en el modelo
segundo que es el apropiado)
-323-

11. Regresin lineal

b. 106,45871
c. 105,635774

11.7.4.- Para estudiar a qu se debe la variabilidad obtenida en funcin del tipo de


fitoregulador, se analiza en laboratorio la composicin de cada un de ellos y se
encuentra que su composicin es muy similar, pero difieren en la concentracin de
una hormona de crecimiento vegetal denominada auxina (variable conc). El
fitoregulador A contiene 10 g/l de auxina, el de tipo B contiene 40 g/l y el de tipo C, 20
g/l. El efecto de la concentracin sobre la longitud obtenida (datos de la tabla anterior)
se analiza con regresin lineal mltiple, obtenindose los siguientes resultados:
Multiple Regression Analysis
----------------------------------------------------------------------------Dependent variable: longitud
-----------------------------------------------------------------------------

Parameter

Standard

Error

Statistic

Estimate

P-Value

----------------------------------------------------------------------------CONSTANT

-258,333

125,178

-2,06372

0,0691

73,0

11,1942

6,52125

0,0001

-1,21667

0,211749

-5,7458

0,0003

conc
conc^2

----------------------------------------------------------------------------Analysis of Variance
----------------------------------------------------------------------------Source

Sum of Squares

Df

Mean Square

F-Ratio

P-Value

----------------------------------------------------------------------------Model
Residual

299756,0

149878,0

45876,0

5097,33

29,40

0,0001

----------------------------------------------------------------------------Total (Corr.)

345632,0

11

R-squared = 86,7269 percent


-324-

11. Regresin lineal

R-squared (adjusted for d.f.) = 83,7774 percent


Standard Error of Est. = 71,3956
Mean absolute error = 47,5

Teniendo en cuenta los resultados del modelo de regresin, qu concentracin de


auxina deber tener el fitoregulador para maximizar la longitud, bajo las condiciones
del experimento? Considerar =0,05.
(2,5 puntos)

a) conc = 20
b) conc = 30
c) conc = 40
d) conc = 20 o bien conc = 40
e) ninguna de las anteriores

Solucin: las dos variables del modelo son estadsticamente significativas ya que su pvalor es menor a 0,05. La ecuacin resultante ser: Longitud = 258,333 + 73 conc
1,217 conc2
Para determinar el mximo relativo de esta ecuacin, hay que derivar e igualar a
cero:
d(long)/dc = 73 2 1,217 conc = 0 conc = 73/(21,217) = 30 g/l.

-325-

11. Regresin lineal

-326-

Anexo A

ANEXO A. Tablas de las principales distribuciones de probabilidad

DISTRIBUCIN DE POISSON .......................................................................................... 328


DISTRIBUCIN NORMAL TIPIFICADA ............................................................................ 331
DISTRIBUCIN

2n DE PEARSON .................................................................................. 332

DISTRIBUCIN t de Student ............................................................................................ 335


DISTRIBUCIN F de snedecor ......................................................................................... 338

-327-

Anexo A

DISTRIBUCIN DE POISSON
c

P( X c )
i 0

0,02
0,04
0,06
0,08
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
1,00
1,10
1,20
1,30
1,40
1,50
1,60
1,70
1,80
1,90
2,00
2,10
2,20
2,30
2,40
2,50
2,60
2,70
2,80
2,90
3,00
3,10
3,20
3,30
3,40
3,50
3,60
3,70
3,80
3,90
4,00
4,10
4,20
4,30
4,40
4,50
4,60
4,70
4,80
4,90

c=0
0,9802
0,9608
0,9418
0,9231
0,9048
0,8607
0,8187
0,7788
0,7408
0,7047
0,6703
0,6376
0,6065
0,5769
0,5488
0,5220
0,4966
0,4724
0,4493
0,4274
0,4066
0,3679
0,3329
0,3012
0,2725
0,2466
0,2231
0,2019
0,1827
0,1653
0,1496
0,1353
0,1225
0,1108
0,1003
0,0907
0,0821
0,0743
0,0672
0,0608
0,0550
0,0498
0,0450
0,0408
0,0369
0,0334
0,0302
0,0273
0,0247
0,0224
0,0202
0,0183
0,0166
0,0150
0,0136
0,0123
0,0111
0,0101
0,0091
0,0082
0,0074

c=1
0,9998
0,9992
0,9983
0,9970
0,9953
0,9898
0,9825
0,9735
0,9631
0,9513
0,9384
0,9246
0,9098
0,8943
0,8781
0,8614
0,8442
0,8266
0,8088
0,7907
0,7725
0,7358
0,6990
0,6626
0,6268
0,5918
0,5578
0,5249
0,4932
0,4628
0,4337
0,4060
0,3796
0,3546
0,3309
0,3084
0,2873
0,2674
0,2487
0,2311
0,2146
0,1991
0,1847
0,1712
0,1586
0,1468
0,1359
0,1257
0,1162
0,1074
0,0992
0,0916
0,0845
0,0780
0,0719
0,0663
0,0611
0,0563
0,0518
0,0477
0,0439

c=2
1,0000
1,0000
1,0000
0,9999
0,9998
0,9995
0,9989
0,9978
0,9964
0,9945
0,9921
0,9891
0,9856
0,9815
0,9769
0,9717
0,9659
0,9595
0,9526
0,9451
0,9371
0,9197
0,9004
0,8795
0,8571
0,8335
0,8088
0,7834
0,7572
0,7306
0,7037
0,6767
0,6496
0,6227
0,5960
0,5697
0,5438
0,5184
0,4936
0,4695
0,4460
0,4232
0,4012
0,3799
0,3594
0,3397
0,3208
0,3027
0,2854
0,2689
0,2531
0,2381
0,2238
0,2102
0,1974
0,1851
0,1736
0,1626
0,1523
0,1425
0,1333

c=3
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
0,9999
0,9999
0,9997
0,9995
0,9992
0,9988
0,9982
0,9975
0,9966
0,9956
0,9942
0,9927
0,9909
0,9889
0,9865
0,9810
0,9743
0,9662
0,9569
0,9463
0,9344
0,9212
0,9068
0,8913
0,8747
0,8571
0,8386
0,8194
0,7993
0,7787
0,7576
0,7360
0,7141
0,6919
0,6696
0,6472
0,6248
0,6025
0,5803
0,5584
0,5366
0,5152
0,4942
0,4735
0,4532
0,4335
0,4142
0,3954
0,3772
0,3594
0,3423
0,3257
0,3097
0,2942
0,2793

-328-

i e
i!

c=4
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
0,9999
0,9999
0,9998
0,9997
0,9996
0,9994
0,9992
0,9989
0,9986
0,9982
0,9977
0,9963
0,9946
0,9923
0,9893
0,9857
0,9814
0,9763
0,9704
0,9636
0,9559
0,9473
0,9379
0,9275
0,9162
0,9041
0,8912
0,8774
0,8629
0,8477
0,8318
0,8153
0,7982
0,7806
0,7626
0,7442
0,7254
0,7064
0,6872
0,6678
0,6484
0,6288
0,6093
0,5898
0,5704
0,5512
0,5321
0,5132
0,4946
0,4763
0,4582

c=5
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
0,9999
0,9999
0,9999
0,9998
0,9997
0,9997
0,9994
0,9990
0,9985
0,9978
0,9968
0,9955
0,9940
0,9920
0,9896
0,9868
0,9834
0,9796
0,9751
0,9700
0,9643
0,9580
0,9510
0,9433
0,9349
0,9258
0,9161
0,9057
0,8946
0,8829
0,8705
0,8576
0,8441
0,8301
0,8156
0,8006
0,7851
0,7693
0,7531
0,7367
0,7199
0,7029
0,6858
0,6684
0,6510
0,6335

0 1 2 3 4 5 6 7 8 9 10

c=6
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
0,9999
0,9999
0,9997
0,9996
0,9994
0,9991
0,9987
0,9981
0,9974
0,9966
0,9955
0,9941
0,9925
0,9906
0,9884
0,9858
0,9828
0,9794
0,9756
0,9713
0,9665
0,9612
0,9554
0,9490
0,9421
0,9347
0,9267
0,9182
0,9091
0,8995
0,8893
0,8786
0,8675
0,8558
0,8436
0,8311
0,8180
0,8046
0,7908
0,7767

c=7
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
0,9999
0,9999
0,9998
0,9997
0,9996
0,9994
0,9992
0,9989
0,9985
0,9980
0,9974
0,9967
0,9958
0,9947
0,9934
0,9919
0,9901
0,9881
0,9858
0,9832
0,9802
0,9769
0,9733
0,9692
0,9648
0,9599
0,9546
0,9489
0,9427
0,9361
0,9290
0,9214
0,9134
0,9049
0,8960
0,8867
0,8769

c=8
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
1,0000
0,9999
0,9999
0,9998
0,9998
0,9997
0,9995
0,9994
0,9991
0,9989
0,9985
0,9981
0,9976
0,9969
0,9962
0,9953
0,9943
0,9931
0,9917
0,9901
0,9883
0,9863
0,9840
0,9815
0,9786
0,9755
0,9721
0,9683
0,9642
0,9597
0,9549
0,9497
0,9442
0,9382

Anexo A

DISTRIBUCIN DE POISSON
c

P( X c )
i 0

5,00
5,10
5,20
5,30
5,40
5,50
5,60
5,70
5,80
5,90
6,00
6,10
6,20
6,30
6,40
6,50
6,60
6,70
6,80
6,90
7,00
7,20
7,40
7,60
7,80
8,00
8,20
8,40
8,60
8,80
9,00
9,20
9,40
9,60
9,80
10,0
10,2
10,4
10,6
10,8
11,00
11,20
11,40
11,60
11,80
12,00
12,20
12,40
12,60
12,80
13,00
13,20
13,40
13,60
13,80
14,00
14,20
14,40
14,60
14,80
15,00

c=0
0,0067
0,0061
0,0055
0,0050
0,0045
0,0041
0,0037
0,0033
0,0030
0,0027
0,0025
0,0022
0,0020
0,0018
0,0017
0,0015
0,0014
0,0012
0,0011
0,0010
0,0009
0,0007
0,0006
0,0005
0,0004
0,0003
0,0003
0,0002
0,0002
0,0002
0,0001
0,0001
0,0001
0,0001
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

c=1
0,0404
0,0372
0,0342
0,0314
0,0289
0,0266
0,0244
0,0224
0,0206
0,0189
0,0174
0,0159
0,0146
0,0134
0,0123
0,0113
0,0103
0,0095
0,0087
0,0080
0,0073
0,0061
0,0051
0,0043
0,0036
0,0030
0,0025
0,0021
0,0018
0,0015
0,0012
0,0010
0,0009
0,0007
0,0006
0,0005
0,0004
0,0003
0,0003
0,0002
0,0002
0,0002
0,0001
0,0001
0,0001
0,0001
0,0001
0,0001
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000
0,0000

c=2
0,1247
0,1165
0,1088
0,1016
0,0948
0,0884
0,0824
0,0768
0,0715
0,0666
0,0620
0,0577
0,0536
0,0498
0,0463
0,0430
0,0400
0,0371
0,0344
0,0320
0,0296
0,0255
0,0219
0,0188
0,0161
0,0138
0,0118
0,0100
0,0086
0,0073
0,0062
0,0053
0,0045
0,0038
0,0033
0,0028
0,0023
0,0020
0,0017
0,0014
0,0012
0,0010
0,0009
0,0007
0,0006
0,0005
0,0004
0,0004
0,0003
0,0003
0,0002
0,0002
0,0002
0,0001
0,0001
0,0001
0,0001
0,0001
0,0001
0,0000
0,0000

c=3
0,2650
0,2513
0,2381
0,2254
0,2133
0,2017
0,1906
0,1800
0,1700
0,1604
0,1512
0,1425
0,1342
0,1264
0,1189
0,1118
0,1052
0,0988
0,0928
0,0871
0,0818
0,0719
0,0632
0,0554
0,0485
0,0424
0,0370
0,0323
0,0281
0,0244
0,0212
0,0184
0,0160
0,0138
0,0120
0,0103
0,0089
0,0077
0,0066
0,0057
0,0049
0,0042
0,0036
0,0031
0,0027
0,0023
0,0020
0,0017
0,0014
0,0012
0,0011
0,0009
0,0008
0,0007
0,0006
0,0005
0,0004
0,0003
0,0003
0,0002
0,0002

-329-

i e
i!

c=4
0,4405
0,4231
0,4061
0,3895
0,3733
0,3575
0,3422
0,3272
0,3127
0,2987
0,2851
0,2719
0,2592
0,2469
0,2351
0,2237
0,2127
0,2022
0,1920
0,1823
0,1730
0,1555
0,1395
0,1249
0,1117
0,0996
0,0887
0,0789
0,0701
0,0621
0,0550
0,0486
0,0429
0,0378
0,0333
0,0293
0,0257
0,0225
0,0197
0,0173
0,0151
0,0132
0,0115
0,0100
0,0087
0,0076
0,0066
0,0057
0,0050
0,0043
0,0037
0,0032
0,0028
0,0024
0,0021
0,0018
0,0016
0,0013
0,0012
0,0010
0,0009

c=5
0,6160
0,5984
0,5809
0,5635
0,5461
0,5289
0,5119
0,4950
0,4783
0,4619
0,4457
0,4298
0,4141
0,3988
0,3837
0,3690
0,3547
0,3406
0,3270
0,3137
0,3007
0,2759
0,2526
0,2307
0,2103
0,1912
0,1736
0,1573
0,1422
0,1284
0,1157
0,1041
0,0935
0,0838
0,0750
0,0671
0,0599
0,0534
0,0475
0,0423
0,0375
0,0333
0,0295
0,0261
0,0230
0,0203
0,0179
0,0158
0,0139
0,0122
0,0107
0,0094
0,0083
0,0072
0,0063
0,0055
0,0048
0,0042
0,0037
0,0032
0,0028

0 1 2 3 4 5 6 7 8 9 10

c=6
0,7622
0,7474
0,7324
0,7171
0,7017
0,6860
0,6703
0,6544
0,6384
0,6224
0,6063
0,5902
0,5742
0,5582
0,5423
0,5265
0,5108
0,4953
0,4799
0,4647
0,4497
0,4204
0,3920
0,3646
0,3384
0,3134
0,2896
0,2670
0,2457
0,2256
0,2068
0,1892
0,1727
0,1574
0,1433
0,1301
0,1180
0,1069
0,0966
0,0872
0,0786
0,0708
0,0636
0,0571
0,0512
0,0458
0,0410
0,0366
0,0326
0,0291
0,0259
0,0230
0,0204
0,0181
0,0161
0,0142
0,0126
0,0111
0,0098
0,0087
0,0076

c=7
0,8666
0,8560
0,8449
0,8335
0,8217
0,8095
0,7970
0,7841
0,7710
0,7576
0,7440
0,7301
0,7160
0,7017
0,6873
0,6728
0,6581
0,6433
0,6285
0,6136
0,5987
0,5689
0,5393
0,5100
0,4812
0,4530
0,4254
0,3987
0,3728
0,3478
0,3239
0,3010
0,2792
0,2584
0,2388
0,2202
0,2027
0,1863
0,1710
0,1566
0,1432
0,1307
0,1192
0,1085
0,0986
0,0895
0,0811
0,0734
0,0664
0,0599
0,0540
0,0487
0,0438
0,0393
0,0353
0,0316
0,0283
0,0253
0,0226
0,0202
0,0180

c=8
0,9319
0,9252
0,9181
0,9106
0,9027
0,8944
0,8857
0,8766
0,8672
0,8574
0,8472
0,8367
0,8259
0,8148
0,8033
0,7916
0,7796
0,7673
0,7548
0,7420
0,7291
0,7027
0,6757
0,6482
0,6204
0,5925
0,5647
0,5369
0,5094
0,4823
0,4557
0,4296
0,4042
0,3796
0,3558
0,3328
0,3108
0,2896
0,2694
0,2502
0,2320
0,2147
0,1984
0,1830
0,1686
0,1550
0,1424
0,1305
0,1195
0,1093
0,0998
0,0910
0,0828
0,0753
0,0684
0,0621
0,0562
0,0509
0,0460
0,0415
0,0374

Anexo A

P( X c )

DISTRIBUCIN DE POISSON

i1

i e
i!

1,00
28
26

0,95
0,90
24

0,85
0,80

22

0,75
20

Funcin de distribucin P(Xx)

0,70

19

0,65

18

0,60

17
16

0,55

15

0,50
0,45

0,40
0,35
0,30
0,25

c=

0,20

0,15

10

12

11

13

14

0,10
0,05
0,00
0

-330-

10

11

12

13

14

15

16

17

18

19

20 M z

Anexo A

DISTRIBUCIN NORMAL TIPIFICADA


z

( z) P( Z z)

1
2

t2
2

dt

-3
-2,9
-2,8
-2,7
-2,6

0,0013
0,0019
0,0026
0,0035
0,0047

0,0010
0,0018
0,0025
0,0034
0,0045

0,0007
0,0018
0,0024
0,0033
0,0044

0,0005
0,0017
0,0023
0,0032
0,0043

0,0003
0,0016
0,0023
0,0031
0,0041

0,0002
0,0016
0,0022
0,0030
0,0040

0,0002
0,0015
0,0021
0,0029
0,0039

0,0001
0,0015
0,0021
0,0028
0,0038

0,0001
0,0014
0,0020
0,0027
0,0037

0,0000
0,0014
0,0019
0,0026
0,0036

0.0
0,1
0,2
0,3
0,4

0,5000
0,5398
0,5793
0,6179
0,6554

0,5040
0,5438
0,5832
0,6217
0,6591

0,5080
0,5478
0,5871
0,6255
0,6628

0,5120
0,5517
0,5910
0,6293
0,6664

0,5160
0,5557
0,5948
0,6331
0,6700

0,5199
0,5596
0,5987
0,6368
0,6736

0,5239
0,5636
0,6026
0,6406
0,6772

0,5279
0,5675
0,6064
0,6443
0,6808

0,5319
0,5714
0,6103
0,6480
0,6844

0,5359
0,5753
0,6141
0,6517
0,6879

-2,5
-2,4
-2,3
-2,2
-2,1

0,0062
0,0082
0,0107
0,0139
0,0179

0,0060
0,0080
0,0104
0,0136
0,0174

0,0059
0,0078
0,0102
0,0132
0,0170

0,0057
0,0075
0,0099
0,0129
0,0166

0,0055
0,0073
0,0096
0,0125
0,0162

0,0054
0,0071
0,0094
0,0122
0,0158

0,0052
0,0069
0,0091
0,0119
0,0154

0,0051
0,0068
0,0089
0,0116
0,0150

0,0049
0,0066
0,0087
0,0113
0,0146

0,0048
0,0064
0,0084
0,0110
0,0143

0,5
0,6
0,7
0,8
0,9

0,6915
0,7257
0,7580
0,7881
0,8159

0,6950
0,7291
0,7611
0,7910
0,8186

0,6985
0,7324
0,7642
0,7939
0,8212

0,7019
0,7357
0,7673
0,7967
0,8238

0,7054
0,7389
0,7704
0,7995
0,8264

0,7088
0,7422
0,7734
0,8023
0,8289

0,7123
0,7454
0,7764
0,8051
0,8315

0,7157
0,7486
0,7794
0,8078
0,8340

0,7190
0,7517
0,7823
0,8106
0,8365

0,7224
0,7549
0,7852
0,8133
0,8389

-2,0
-1,9
-1,8
-1,7
-1,6

0,0228
0,0287
0,0359
0,0446
0,0548

0,0222
0,0281
0,0351
0,0436
0,0537

0,0217
0,0274
0,0344
0,0427
0,0526

0,0212
0,0268
0,0336
0,0418
0,0516

0,0207
0,0262
0,0329
0,0409
0,0505

0,0202
0,0256
0,0322
0,0401
0,0495

0,0197
0,0250
0,0314
0,0392
0,0485

0,0192
0,0244
0,0307
0,0384
0,0475

0,0188
0,0239
0,0301
0,0375
0,0465

0,0183
0,0233
0,0294
0,0367
0,0455

1,0
1,1
1,2
1,3
1,4

0,8413
0,8643
0,8849
0,9032
0,9192

0,8438
0,8665
0,8869
0,9049
0,9207

0,8461
0,8686
0,8888
0,9066
0,9222

0,8485
0,8708
0,8907
0,9082
0,9236

0,8508
0,8729
0,8925
0,9099
0,9251

0,8531
0,8749
0,8944
0,9115
0,9265

0,8554
0,8770
0,8962
0,9131
0,9279

0,8577
0,8790
0,8980
0,9147
0,9292

0,8599
0,8810
0,8997
0,9162
0,9306

0,8621
0,8830
0,9015
0,9177
0,9319

-1,5
-1,4
-1,3
-1,2
-1,1

0,0668
0,0808
0,0968
0,1151
0,1357

0,0655
0,0793
0,0951
0,1131
0,1335

0,0643
0,0778
0,0934
0,1112
0,1314

0,0630
0,0764
0,0918
0,1093
0,1292

0,0618
0,0749
0,0901
0,1075
0,1271

0,0606
0,0735
0,0885
0,1057
0,1251

0,0594
0,0721
0,0869
0,1038
0,1230

0,0582
0,0708
0,0853
0,1020
0,1210

0,0571
0,0694
0,0838
0,1003
0,1190

0,0559
0,0681
0,0823
0,0985
0,1170

1,5
1,6
1,7
1,8
1,9

0,9332
0,9452
0,9554
0,9641
0,9713

0,9345
0,9463
0,9564
0,9649
0,9719

0,9357
0,9474
0,9573
0,9656
0,9726

0,9370
0,9484
0,9582
0,9664
0,9732

0,9382
0,9495
0,9591
0,9671
0,9738

0,9394
0,9505
0,9599
0,9678
0,9744

0,9406
0,9515
0,9608
0,9686
0,9750

0,9418
0,9525
0,9616
0,9693
0,9756

0,9429
0,9535
0,9625
0,9699
0,9761

0,9441
0,9545
0,9633
0,9706
0,9767

-1,0
-0,9
-0,8
-0,7
-0,6

0,1587
0,1841
0,2119
0,2420
0,2743

0,1562
0,1814
0,2090
0,2389
0,2709

0,1539
0,1788
0,2061
0,2358
0,2676

0,1515
0,1762
0,2033
0,2327
0,2643

0,1492
0,1736
0,2005
0,2297
0,2611

0,1469
0,1711
0,1977
0,2266
0,2578

0,1446
0,1685
0,1949
0,2236
0,2546

0,1423
0,1660
0,1922
0,2207
0,2514

0,1401
0,1635
0,1894
0,2177
0,2483

0,1379
0,1611
0,1867
0,2148
0,2451

2,0
2,1
2,2
2,3
2,4

0,9772
0,9821
0,9861
0,9893
0,9918

0,9778
0,9826
0,9864
0,9896
0,9920

0,9783
0,9830
0,9868
0,9898
0,9922

0,9788
0,9834
0,9871
0,9901
0,9925

0,9793
0,9838
0,9875
0,9904
0,9927

0,9798
0,9842
0,9878
0,9906
0,9929

0,9803
0,9846
0,9881
0,9909
0,9931

0,9808
0,9850
0,9884
0,9911
0,9932

0,9812
0,9854
0,9887
0,9913
0,9934

0,9817
0,9857
0,9890
0,9916
0,9936

-0,5
-0,4
-0,3
-0,2
-0,1
-0.0

0,3085
0,3446
0,3821
0,4207
0,4602
0,5000

0,3050
0,3409
0,3783
0,4168
0,4562
0,4960

0,3015
0,3372
0,3745
0,4129
0,4522
0,4920

0,2981
0,3336
0,3707
0,4090
0,4483
0,4880

0,2946
0,3300
0,3669
0,4052
0,4443
0,4840

0,2912
0,3264
0,3632
0,4013
0,4404
0,4801

0,2877
0,3228
0,3594
0,3974
0,4364
0,4761

0,2843
0,3192
0,3557
0,3936
0,4325
0,4721

0,2810
0,3156
0,3520
0,3897
0,4286
0,4681

0,2776
0,3121
0,3483
0,3859
0,4247
0,4641

2,5
2,6
2,7
2,8
2,9
3

0,9938
0,9953
0,9965
0,9974
0,9981
0,9987

0,9940
0,9955
0,9966
0,9975
0,9982
0,9990

0,9941
0,9956
0,9967
0,9976
0,9982
0,9993

0,9943
0,9957
0,9968
0,9977
0,9983
0,9995

0,9945
0,9959
0,9969
0,9977
0,9984
0,9997

0,9946
0,9960
0,9970
0,9978
0,9984
0,9998

0,9948
0,9961
0,9971
0,9979
0,9985
0,9998

0,9949
0,9962
0,9972
0,9979
0,9985
0,9999

0,9951
0,9963
0,9973
0,9980
0,9986
0,9999

0,9952
0,9964
0,9974
0,9981
0,9986
1,0000

Jos Jabaloyes Vivas Vicente Chirivella Gonzlez

-331-

Anexo A

DISTRIBUCIN 2n DE PEARSON
1,00
0,95
0,90

0,85
0,80

0,75

Funcin de distribucin P(n x)

0,70

P(n2 x ) e t / 2
0

t n / 21
dt
2 n / 2
n/ 2

n=1
n=2
n=3
n=4
n=5
n=6
n=7
n=8
n=9
n=10
n=12

0,65
0,60

0,55
0,50

0,45
0,40

n=14
n=16
n=18
n=20
n=22
n=24
n=26
n=28

0,35

n=30

0,30

0,25
0,20

0,15
0,10

0,05
0,00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51

-332-

Anexo A

DISTRIBUCIN

e t / 2

120

125

P(n2 x )

DE PEARSON (Cont.)

tn / 21
dt
2n / 2 n / 2

1,00
0,95
0,90

0,85

n=30
n=35

0,80

n=40
n=45

0,75

Funcin de distribucin P(n x)

n=50

0,70
2

n=55

0,65

n=60

0,60

n=65
n=70

0,55

n=75
n=80

0,50

n=85

0,45

n=90

0,40

n=95

0,35

n=100

0,30

0,25
0,20

0,15
0,10

0,05
0,00
10

15

20

25

30

35

40

45

50

55

60

65

70

-333-

75

80

85

90

95

100

105

110

115

130

135

140

Anexo A

DISTRIBUCIN CHI-CUADRADO DE PEARSON

P( X x )

t2

2 2 n2

dt
2n ()

0.9995 0.999

0.995

0.99

0.975

0.95

0.90

0.50

0.10

0.050

0.025

0.01

0.005

0.001 0.0005

1
2
3
4
5

0.000
0.001
0.015
0.064
0.158

0.000
0.002
0.024
0.091
0.210

0.000
0.010
0.072
0.207
0.412

0.000
0.020
0.115
0.297
0.554

0.001
0.051
0.216
0.484
0.831

0.004
0.103
0.352
0.711
1.146

0.016
0.211
0.584
1.064
1.610

0.455
1.386
2.366
3.357
4.352

2.706 3.842
4.605 5.992
6.251 7.815
7.779 9.488
9.236 11.071

5.024
7.378
9.348
11.143
12.833

6.635
9.210
11.345
13.277
15.086

7.879
10.597
12.838
14.860
16.750

10.827
13.815
16.266
18.466
20.515

12.115
15.201
17.731
19.998
22.106

6
7
8
9
10

0.299
0.485
0.710
0.972
1.265

0.381
0.599
0.857
1.152
1.479

0.676
0.989
1.344
1.735
2.156

0.872
1.239
1.647
2.088
2.558

1.237
1.690
2.180
2.700
3.247

1.635
2.167
2.733
3.325
3.940

2.204
2.833
3.490
4.168
4.865

5.348
6.346
7.344
8.343
9.342

10.645
12.017
13.362
14.684
15.987

12.592
14.067
15.507
16.919
18.307

14.449
16.013
17.535
19.023
20.483

16.812
18.475
20.090
21.666
23.209

18.548
20.278
21.955
23.589
25.188

22.457
24.321
26.124
27.877
29.588

24.102
26.018
27.867
29.667
31.419

11
12
13
14
15

1.587
1.935
2.305
2.697
3.107

1.834
2.214
2.617
3.041
3.483

2.603
3.074
3.565
4.075
4.601

3.054
3.571
4.107
4.660
5.229

3.816
4.404
5.009
5.629
6.262

4.575
5.226
5.892
6.571
7.261

5.578
6.304
7.042
7.790
8.547

10.341
11.340
12.340
13.339
14.339

17.275
18.549
19.812
21.064
22.307

19.675
21.026
22.362
23.685
24.996

21.920
23.337
24.736
26.119
27.488

24.725
26.217
27.688
29.141
30.578

26.757
28.300
29.819
31.319
32.802

31.264
32.909
34.527
36.124
37.698

33.138
34.821
36.477
38.109
39.717

16
17
18
19
20

3.536
3.980
4.439
4.913
5.398

3.942
4.416
4.905
5.407
5.921

5.142
5.697
6.265
6.844
7.434

5.812
6.408
7.015
7.633
8.260

6.908 7.962 9.312


7.564 8.672 10.085
8.231 9.390 10.865
8.907 10.117 11.651
9.591 10.851 12.443

15.339
16.338
17.338
18.338
19.337

23.542
24.769
25.989
27.204
28.412

26.296
27.587
28.869
30.144
31.410

28.845
30.191
31.526
32.852
34.170

32.000
33.409
34.805
36.191
37.566

34.267
35.718
37.156
38.582
39.997

39.252
40.791
42.312
43.819
45.314

41.308
42.881
44.434
45.974
47.498

21
22
23
24
25

5.895
6.404
6.924
7.453
7.991

6.447 8.034
6.983 8.643
7.529 9.260
8.085 9.886
8.649 10.520

8.897
9.543
10.196
10.856
11.524

10.283
10.982
11.689
12.401
13.120

11.591
12.338
13.091
13.848
14.611

13.240
14.042
14.848
15.659
16.473

20.337
21.337
22.337
23.337
24.337

29.615
30.813
32.007
33.196
34.382

32.671
33.925
35.173
36.415
37.653

35.479
36.781
38.076
39.364
40.647

38.932
40.289
41.638
42.980
44.314

41.401
42.796
44.181
45.558
46.928

46.796
48.268
49.728
51.179
52.619

49.010
50.510
51.999
53.478
54.948

12.198
12.879
13.565
14.256
14.954

13.844
14.573
15.308
16.047
16.791

15.379
16.151
16.928
17.708
18.493

17.292
18.114
18.939
19.768
20.599

25.337
26.336
27.336
28.336
29.336

35.563
36.741
37.916
39.088
40.256

38.885
40.113
41.337
42.557
43.773

41.923
43.195
44.461
45.722
46.979

45.642
46.963
48.278
49.588
50.892

48.290
49.645
50.994
52.336
53.672

54.051
55.475
56.892
58.301
59.702

56.407
57.856
59.299
60.734
62.160

26 8.537 9.222
27 9.093 9.803
28 9.656 10.391
29 10.227 10.986
30 10.804 11.588

11.160
11.808
12.461
13.121
13.787

40 16.906 17.917 20.707 22.164 24.433 26.509 29.051 39.335 51.805 55.759 59.342 63.691 66.766 73.403 76.096
50 23.461 24.674 27.991 29.707 32.357 34.764 37.689 49.335 63.167 67.505 71.420 76.154 79.490 86.660 89.560
60 30.339 31.738 35.534 37.485 40.482 43.188 46.459 59.335 74.397 79.082 83.298 88.379 91.952 99.608 102.69
7
70 37.467 39.036 43.275 45.442 48.758 51.739 55.329 69.335 85.527 90.531 95.023 100.43 104.22 112.32 115.58
80 44.792 46.520 51.172 53.540 57.153 60.392 64.278 79.334 96.578 101.88 106.62 112.32 116.32 124.84 128.26
90 52.277 54.156 59.196 61.754 65.647 69.126 73.291 89.334 107.56 113.15 118.14 124.11 128.29 137.20 140.78
100 59.895 61.918 67.328 70.065 74.222 77.929 82.358 99.334 118.49 124.34 129.56 135.81 140.17 149.45 153.16

Jos Jabaloyes Vivas


Vicente Chirivella Gonzlez

-334-

Anexo A

DISTRIBUCIN t de Student

P( X x )

(1 t 2 / n)

n1
2

n1
)
2

(n / 2) n

dt

n
x
0

1
2
3
4
5
6
7
8
9
10
11
12
13
14
16
18
20
22
24
26
28
30
0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1

0,5317 0,5353 0,5367 0,5374 0,5379 0,5382 0,5384 0,5386 0,5387 0,5388 0,5389 0,5390 0,5391 0,5391 0,5392 0,5393 0,5393 0,5394 0,5394 0,5394 0,5395 0,5395
0,5628 0,5700 0,5729 0,5744 0,5753 0,5760 0,5764 0,5768 0,5770 0,5773 0,5774 0,5776 0,5777 0,5778 0,5780 0,5781 0,5782 0,5783 0,5784 0,5785 0,5785 0,5786
0,5928 0,6038 0,6081 0,6104 0,6119 0,6129 0,6136 0,6141 0,6145 0,6148 0,6151 0,6153 0,6155 0,6157 0,6160 0,6162 0,6164 0,6165 0,6166 0,6167 0,6168 0,6169
0,6211 0,6361 0,6420 0,6452 0,6472 0,6485 0,6495 0,6502 0,6508 0,6512 0,6516 0,6519 0,6522 0,6524 0,6528 0,6531 0,6533 0,6535 0,6537 0,6538 0,6539 0,6540
0,6476 0,6667 0,6743 0,6783 0,6809 0,6826 0,6838 0,6847 0,6855 0,6861 0,6865 0,6869 0,6873 0,6876 0,6881 0,6884 0,6887 0,6890 0,6892 0,6894 0,6895 0,6896
0,6720 0,6953 0,7046 0,7096 0,7127 0,7148 0,7163 0,7174 0,7183 0,7191 0,7197 0,7202 0,7206 0,7210 0,7215 0,7220 0,7224 0,7227 0,7229 0,7231 0,7233 0,7235
0,6944 0,7218 0,7328 0,7387 0,7424 0,7449 0,7467 0,7481 0,7492 0,7501 0,7508 0,7514 0,7519 0,7523 0,7530 0,7536 0,7540 0,7544 0,7547 0,7549 0,7551 0,7553
0,7148 0,7462 0,7589 0,7657 0,7700 0,7729 0,7750 0,7766 0,7778 0,7788 0,7797 0,7804 0,7810 0,7815 0,7823 0,7829 0,7834 0,7839 0,7842 0,7845 0,7848 0,7850
0,7333 0,7684 0,7828 0,7905 0,7953 0,7986 0,8010 0,8028 0,8042 0,8054 0,8063 0,8071 0,8078 0,8083 0,8093 0,8100 0,8106 0,8111 0,8115 0,8118 0,8121 0,8124
0,7500 0,7887 0,8045 0,8130 0,8184 0,8220 0,8247 0,8267 0,8283 0,8296 0,8306 0,8315 0,8322 0,8329 0,8339 0,8347 0,8354 0,8359 0,8364 0,8367 0,8371 0,8373

1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9

0,7651 0,8070 0,8242 0,8335 0,8393 0,8433 0,8461 0,8483 0,8501 0,8514 0,8526 0,8535 0,8544 0,8551 0,8562 0,8571 0,8578 0,8584 0,8589 0,8593 0,8597 0,8600
0,7789 0,8235 0,8419 0,8518 0,8581 0,8623 0,8654 0,8678 0,8696 0,8711 0,8723 0,8734 0,8742 0,8750 0,8762 0,8772 0,8779 0,8785 0,8791 0,8795 0,8799 0,8802
0,7913 0,8384 0,8578 0,8683 0,8748 0,8793 0,8826 0,8851 0,8870 0,8886 0,8899 0,8910 0,8919 0,8927 0,8940 0,8950 0,8958 0,8965 0,8970 0,8975 0,8979 0,8982
0,8026 0,8518 0,8720 0,8829 0,8898 0,8945 0,8979 0,9005 0,9025 0,9041 0,9055 0,9066 0,9075 0,9084 0,9097 0,9107 0,9116 0,9123 0,9128 0,9133 0,9138 0,9141
0,8128 0,8638 0,8847 0,8960 0,9030 0,9079 0,9114 0,9140 0,9161 0,9177 0,9191 0,9203 0,9212 0,9221 0,9235 0,9245 0,9254 0,9261 0,9267 0,9272 0,9276 0,9280
0,8222 0,8746 0,8960 0,9076 0,9148 0,9196 0,9232 0,9259 0,9280 0,9297 0,9310 0,9322 0,9332 0,9340 0,9354 0,9365 0,9374 0,9381 0,9387 0,9392 0,9396 0,9400
0,8307 0,8844 0,9062 0,9178 0,9251 0,9300 0,9335 0,9362 0,9383 0,9400 0,9414 0,9426 0,9435 0,9444 0,9458 0,9468 0,9477 0,9484 0,9490 0,9495 0,9499 0,9503
0,8386 0,8932 0,9152 0,9269 0,9341 0,9390 0,9426 0,9452 0,9473 0,9490 0,9503 0,9515 0,9525 0,9533 0,9546 0,9557 0,9565 0,9572 0,9578 0,9583 0,9587 0,9590
0,8458 0,9011 0,9232 0,9349 0,9421 0,9469 0,9504 0,9530 0,9551 0,9567 0,9580 0,9591 0,9601 0,9609 0,9622 0,9632 0,9640 0,9647 0,9652 0,9657 0,9661 0,9665

2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9

0,8524 0,9082 0,9303 0,9419 0,9490 0,9538 0,9572 0,9597 0,9617 0,9633 0,9646 0,9657 0,9666 0,9674 0,9686 0,9696 0,9704 0,9710 0,9715 0,9720 0,9724 0,9727
0,8585 0,9147 0,9367 0,9482 0,9551 0,9598 0,9631 0,9655 0,9674 0,9690 0,9702 0,9712 0,9721 0,9728 0,9740 0,9750 0,9757 0,9763 0,9768 0,9772 0,9776 0,9779
0,8642 0,9206 0,9424 0,9537 0,9605 0,9649 0,9681 0,9705 0,9723 0,9738 0,9750 0,9759 0,9768 0,9774 0,9786 0,9794 0,9801 0,9807 0,9812 0,9816 0,9819 0,9822
0,8695 0,9259 0,9475 0,9585 0,9651 0,9694 0,9725 0,9748 0,9765 0,9779 0,9790 0,9799 0,9807 0,9813 0,9824 0,9832 0,9838 0,9843 0,9848 0,9851 0,9854 0,9857
0,8743 0,9308 0,9521 0,9628 0,9692 0,9734 0,9763 0,9784 0,9801 0,9813 0,9824 0,9832 0,9840 0,9846 0,9855 0,9863 0,9869 0,9874 0,9877 0,9881 0,9884 0,9886
0,8789 0,9352 0,9561 0,9666 0,9728 0,9767 0,9795 0,9815 0,9831 0,9843 0,9852 0,9860 0,9867 0,9873 0,9882 0,9888 0,9894 0,9898 0,9902 0,9905 0,9907 0,9909
0,8831 0,9392 0,9598 0,9700 0,9759 0,9797 0,9823 0,9842 0,9856 0,9868 0,9877 0,9884 0,9890 0,9895 0,9903 0,9910 0,9914 0,9918 0,9921 0,9924 0,9926 0,9928
0,8871 0,9429 0,9631 0,9730 0,9786 0,9822 0,9847 0,9865 0,9878 0,9888 0,9897 0,9903 0,9909 0,9914 0,9921 0,9927 0,9931 0,9935 0,9937 0,9940 0,9942 0,9944
0,8908 0,9463 0,9661 0,9756 0,9810 0,9844 0,9867 0,9884 0,9896 0,9906 0,9914 0,9920 0,9925 0,9929 0,9936 0,9941 0,9945 0,9948 0,9950 0,9952 0,9954 0,9956
0,8943 0,9494 0,9687 0,9779 0,9831 0,9863 0,9885 0,9901 0,9912 0,9921 0,9928 0,9933 0,9938 0,9942 0,9948 0,9952 0,9956 0,9958 0,9961 0,9963 0,9964 0,9965

3
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9

0,8976 0,9523 0,9712 0,9800 0,9850 0,9880 0,9900 0,9915 0,9925 0,9933 0,9940 0,9945 0,9949 0,9952 0,9958 0,9962 0,9965 0,9967 0,9969 0,9971 0,9972 0,9973
0,9007 0,9549 0,9734 0,9819 0,9866 0,9894 0,9913 0,9927 0,9936 0,9944 0,9949 0,9954 0,9958 0,9961 0,9966 0,9969 0,9972 0,9974 0,9976 0,9977 0,9978 0,9979
0,9036 0,9573 0,9753 0,9835 0,9880 0,9907 0,9925 0,9937 0,9946 0,9953 0,9958 0,9962 0,9965 0,9968 0,9972 0,9975 0,9978 0,9979 0,9981 0,9982 0,9983 0,9984
0,9063 0,9596 0,9771 0,9850 0,9893 0,9918 0,9934 0,9946 0,9954 0,9960 0,9965 0,9968 0,9971 0,9974 0,9977 0,9980 0,9982 0,9984 0,9985 0,9986 0,9987 0,9988
0,9089 0,9617 0,9788 0,9864 0,9904 0,9928 0,9943 0,9953 0,9961 0,9966 0,9970 0,9974 0,9976 0,9978 0,9982 0,9984 0,9986 0,9987 0,9988 0,9989 0,9990 0,9990
0,9114 0,9636 0,9803 0,9876 0,9914 0,9936 0,9950 0,9960 0,9966 0,9971 0,9975 0,9978 0,9980 0,9982 0,9985 0,9987 0,9989 0,9990 0,9991 0,9992 0,9992 0,9993
0,9138 0,9654 0,9816 0,9886 0,9922 0,9943 0,9956 0,9965 0,9971 0,9976 0,9979 0,9982 0,9984 0,9986 0,9988 0,9990 0,9991 0,9992 0,9993 0,9993 0,9994 0,9994
0,9160 0,9670 0,9829 0,9896 0,9930 0,9950 0,9962 0,9970 0,9975 0,9979 0,9982 0,9985 0,9987 0,9988 0,9990 0,9992 0,9993 0,9994 0,9994 0,9995 0,9995 0,9996
0,9181 0,9686 0,9840 0,9904 0,9937 0,9955 0,9966 0,9974 0,9979 0,9983 0,9985 0,9987 0,9989 0,9990 0,9992 0,9993 0,9994 0,9995 0,9996 0,9996 0,9996 0,9997
0,9201 0,9701 0,9850 0,9912 0,9943 0,9960 0,9971 0,9977 0,9982 0,9985 0,9988 0,9989 0,9991 0,9992 0,9994 0,9995 0,9996 0,9996 0,9997 0,9997 0,9997 0,9997

4
4,1
4,2
4,3
4,4
4,5
4,6
4,7
4,8
4,9

0,9220 0,9714 0,9860 0,9919 0,9948 0,9964 0,9974 0,9980 0,9984 0,9987 0,9990 0,9991 0,9992 0,9993 0,9995 0,9996 0,9996 0,9997 0,9997 0,9998 0,9998 0,9998
0,9239 0,9727 0,9869 0,9926 0,9953 0,9968 0,9977 0,9983 0,9987 0,9989 0,9991 0,9993 0,9994 0,9995 0,9996 0,9997 0,9997 0,9998 0,9998 0,9998 0,9998 0,9999
0,9256 0,9739 0,9877 0,9932 0,9958 0,9972 0,9980 0,9985 0,9988 0,9991 0,9993 0,9994 0,9995 0,9996 0,9997 0,9997 0,9998 0,9998 0,9998 0,9999 0,9999 0,9999
0,9273 0,9750 0,9884 0,9937 0,9961 0,9975 0,9982 0,9987 0,9990 0,9992 0,9994 0,9995 0,9996 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999
0,9289 0,9760 0,9891 0,9942 0,9965 0,9977 0,9984 0,9989 0,9991 0,9993 0,9995 0,9996 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
0,9304 0,9770 0,9898 0,9946 0,9968 0,9979 0,9986 0,9990 0,9993 0,9994 0,9995 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 1,0000
0,9319 0,9779 0,9903 0,9950 0,9971 0,9982 0,9988 0,9991 0,9994 0,9995 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 1,0000 1,0000
0,9333 0,9788 0,9909 0,9953 0,9973 0,9983 0,9989 0,9992 0,9994 0,9996 0,9997 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 1,0000
0,9346 0,9796 0,9914 0,9957 0,9976 0,9985 0,9990 0,9993 0,9995 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 1,0000
0,9359 0,9804 0,9919 0,9960 0,9978 0,9986 0,9991 0,9994 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 1,0000

5
5,1
5,2
5,3
5,4
5,5
5,6
5,7
5,8
5,9

0,9372 0,9811 0,9923 0,9963 0,9979 0,9988 0,9992 0,9995 0,9996 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 1,0000
0,9384 0,9818 0,9927 0,9965 0,9981 0,9989 0,9993 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999
0,9395 0,9825 0,9931 0,9967 0,9983 0,9990 0,9994 0,9996 0,9997 0,9998 0,9999 0,9999 0,9999 0,9999 1,0000
0,9406 0,9831 0,9934 0,9970 0,9984 0,9991 0,9994 0,9996 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999
0,9417 0,9837 0,9938 0,9972 0,9985 0,9992 0,9995 0,9997 0,9998 0,9998 0,9999 0,9999 0,9999 1,0000
0,9428 0,9842 0,9941 0,9973 0,9986 0,9992 0,9995 0,9997 0,9998 0,9999 0,9999 0,9999 0,9999
0,9438 0,9848 0,9944 0,9975 0,9987 0,9993 0,9996 0,9997 0,9998 0,9999 0,9999 0,9999 1,0000
0,9447 0,9853 0,9946 0,9977 0,9988 0,9994 0,9996 0,9998 0,9999 0,9999 0,9999 1,0000
0,9457 0,9858 0,9949 0,9978 0,9989 0,9994 0,9997 0,9998 0,9999 0,9999 0,9999
0,9466 0,9862 0,9951 0,9979 0,9990 0,9995 0,9997 0,9998 0,9999 0,9999 0,9999

6
6,1
6,2
6,3
6,4
6,5
6,6
6,7
6,8
6,9

0,9474 0,9867 0,9954 0,9981 0,9991 0,9995 0,9997 0,9998 0,9999 0,9999 1,0000
0,9483 0,9871 0,9956 0,9982 0,9991 0,9996 0,9998 0,9999 0,9999 0,9999
0,9491 0,9875 0,9958 0,9983 0,9992 0,9996 0,9998 0,9999 0,9999 0,9999
0,9499 0,9879 0,9960 0,9984 0,9993 0,9996 0,9998 0,9999 0,9999 1,0000
0,9507 0,9882 0,9961 0,9985 0,9993 0,9997 0,9998 0,9999 0,9999
0,9514 0,9886 0,9963 0,9986 0,9994 0,9997 0,9998 0,9999 0,9999
0,9521 0,9889 0,9965 0,9986 0,9994 0,9997 0,9998 0,9999 1,0000
0,9528 0,9892 0,9966 0,9987 0,9994 0,9997 0,9999 0,9999
0,9535 0,9895 0,9967 0,9988 0,9995 0,9998 0,9999 0,9999
0,9542 0,9898 0,9969 0,9988 0,9995 0,9998 0,9999 0,9999

7
7,2
7,4
7,6
7,8
8

0,9548 0,9901 0,9970 0,9989 0,9995 0,9998 0,9999 0,9999


0,9561 0,9906 0,9972 0,9990 0,9996 0,9998 0,9999 1,0000
0,9572 0,9911 0,9974 0,9991 0,9996 0,9998 0,9999
0,9584 0,9916 0,9976 0,9992 0,9997 0,9999 0,9999
0,9594 0,9920 0,9978 0,9993 0,9997 0,9999 0,9999
0,9604 0,9924 0,9980 0,9993 0,9998 0,9999

-335-

Anexo A

M Teresa Carot Snchez


x

DISTRIBUCIN t de Student

P( X x )

(1 t 2 / n)

n 1
2

n1
)
2

(n / 2) n

n
x
0

35
40
45
50
55
60
65
70
75
80
85
90
95
100
110
120

0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
0,5
0,55
0,6
0,65
0,7
0,75
0,8
0,85
0,9
0,95

0,5198
0,5395
0,5592
0,5787
0,5980
0,6170
0,6358
0,6542
0,6723
0,6899
0,7071
0,7238
0,7400
0,7557
0,7709
0,7854
0,7994
0,8129
0,8257

0,5198
0,5396
0,5592
0,5788
0,5981
0,6171
0,6359
0,6544
0,6724
0,6901
0,7073
0,7241
0,7403
0,7560
0,7712
0,7858
0,7998
0,8132
0,8261

0,5198
0,5396
0,5593
0,5788
0,5981
0,6172
0,6360
0,6545
0,6726
0,6902
0,7075
0,7242
0,7405
0,7562
0,7714
0,7860
0,8001
0,8135
0,8264

0,5198
0,5396
0,5593
0,5789
0,5982
0,6173
0,6361
0,6546
0,6727
0,6904
0,7076
0,7244
0,7407
0,7564
0,7716
0,7863
0,8003
0,8138
0,8267

0,5198
0,5396
0,5593
0,5789
0,5982
0,6173
0,6362
0,6546
0,6728
0,6905
0,7077
0,7245
0,7408
0,7566
0,7718
0,7864
0,8005
0,8140
0,8269

0,5199
0,5397
0,5594
0,5789
0,5983
0,6174
0,6362
0,6547
0,6728
0,6905
0,7078
0,7246
0,7409
0,7567
0,7719
0,7866
0,8006
0,8141
0,8270

0,5199
0,5397
0,5594
0,5789
0,5983
0,6174
0,6363
0,6548
0,6729
0,6906
0,7079
0,7247
0,7410
0,7568
0,7720
0,7867
0,8008
0,8143
0,8272

0,5199
0,5397
0,5594
0,5790
0,5983
0,6175
0,6363
0,6548
0,6729
0,6907
0,7080
0,7248
0,7411
0,7569
0,7721
0,7868
0,8009
0,8144
0,8273

0,5199
0,5397
0,5594
0,5790
0,5984
0,6175
0,6363
0,6549
0,6730
0,6907
0,7080
0,7248
0,7412
0,7570
0,7722
0,7869
0,8010
0,8145
0,8274

0,5199
0,5397
0,5594
0,5790
0,5984
0,6175
0,6364
0,6549
0,6730
0,6908
0,7081
0,7249
0,7412
0,7570
0,7723
0,7870
0,8011
0,8146
0,8275

0,5199
0,5397
0,5594
0,5790
0,5984
0,6175
0,6364
0,6549
0,6731
0,6908
0,7081
0,7249
0,7413
0,7571
0,7723
0,7870
0,8011
0,8147
0,8276

0,5199
0,5397
0,5594
0,5790
0,5984
0,6176
0,6364
0,6549
0,6731
0,6909
0,7082
0,7250
0,7413
0,7571
0,7724
0,7871
0,8012
0,8147
0,8277

0,5199
0,5397
0,5595
0,5790
0,5984
0,6176
0,6364
0,6550
0,6731
0,6909
0,7082
0,7250
0,7414
0,7572
0,7724
0,7871
0,8013
0,8148
0,8277

0,5199
0,5397
0,5595
0,5791
0,5984
0,6176
0,6365
0,6550
0,6732
0,6909
0,7082
0,7251
0,7414
0,7572
0,7725
0,7872
0,8013
0,8149
0,8278

0,5199
0,5397
0,5595
0,5791
0,5985
0,6176
0,6365
0,6550
0,6732
0,6910
0,7083
0,7251
0,7415
0,7573
0,7726
0,7873
0,8014
0,8150
0,8279

0,5199
0,5397
0,5595
0,5791
0,5985
0,6177
0,6365
0,6551
0,6732
0,6910
0,7083
0,7252
0,7415
0,7574
0,7726
0,7874
0,8015
0,8150
0,8280

0,5199
0,5398
0,5596
0,5793
0,5987
0,6179
0,6368
0,6554
0,6736
0,6915
0,7088
0,7258
0,7422
0,7580
0,7734
0,7881
0,8023
0,8159
0,8289

1
1,05
1,1
1,15
1,2
1,25
1,3
1,35
1,4
1,45
1,5
1,55
1,6
1,65
1,7
1,75
1,8
1,85
1,9
1,95

0,8379
0,8495
0,8606
0,8710
0,8809
0,8902
0,8990
0,9072
0,9148
0,9220
0,9287
0,9349
0,9407
0,9461
0,9510
0,9556
0,9598
0,9636
0,9672
0,9704

0,8383
0,8500
0,8610
0,8715
0,8814
0,8907
0,8995
0,9077
0,9154
0,9226
0,9293
0,9355
0,9413
0,9466
0,9516
0,9561
0,9603
0,9641
0,9677
0,9709

0,8387
0,8503
0,8614
0,8719
0,8818
0,8911
0,8999
0,9081
0,9158
0,9230
0,9297
0,9359
0,9417
0,9470
0,9520
0,9565
0,9607
0,9646
0,9681
0,9713

0,8389
0,8506
0,8617
0,8722
0,8821
0,8914
0,9002
0,9085
0,9162
0,9233
0,9300
0,9363
0,9421
0,9474
0,9523
0,9569
0,9611
0,9649
0,9684
0,9716

0,8392
0,8508
0,8619
0,8724
0,8824
0,8917
0,9005
0,9087
0,9164
0,9236
0,9303
0,9366
0,9423
0,9477
0,9526
0,9572
0,9613
0,9652
0,9687
0,9719

0,8393
0,8510
0,8621
0,8726
0,8826
0,8919
0,9007
0,9090
0,9167
0,9239
0,9306
0,9368
0,9426
0,9479
0,9528
0,9574
0,9616
0,9654
0,9689
0,9721

0,8395
0,8512
0,8623
0,8728
0,8828
0,8921
0,9009
0,9092
0,9169
0,9241
0,9308
0,9370
0,9428
0,9481
0,9530
0,9576
0,9617
0,9656
0,9691
0,9723

0,8396
0,8513
0,8624
0,8730
0,8829
0,8923
0,9011
0,9093
0,9170
0,9242
0,9309
0,9372
0,9429
0,9483
0,9532
0,9577
0,9619
0,9657
0,9692
0,9724

0,8397
0,8515
0,8626
0,8731
0,8830
0,8924
0,9012
0,9095
0,9172
0,9244
0,9311
0,9373
0,9431
0,9484
0,9534
0,9579
0,9621
0,9659
0,9694
0,9725

0,8398
0,8516
0,8627
0,8732
0,8832
0,8925
0,9013
0,9096
0,9173
0,9245
0,9312
0,9375
0,9432
0,9486
0,9535
0,9580
0,9622
0,9660
0,9695
0,9727

0,8399
0,8517
0,8628
0,8733
0,8833
0,8926
0,9014
0,9097
0,9174
0,9246
0,9313
0,9376
0,9433
0,9487
0,9536
0,9581
0,9623
0,9661
0,9696
0,9728

0,8400
0,8517
0,8629
0,8734
0,8834
0,8927
0,9015
0,9098
0,9175
0,9247
0,9314
0,9377
0,9434
0,9488
0,9537
0,9582
0,9624
0,9662
0,9697
0,9729

0,8401
0,8518
0,8629
0,8735
0,8834
0,8928
0,9016
0,9099
0,9176
0,9248
0,9315
0,9378
0,9435
0,9489
0,9538
0,9583
0,9625
0,9663
0,9698
0,9729

0,8401
0,8519
0,8630
0,8736
0,8835
0,8929
0,9017
0,9100
0,9177
0,9249
0,9316
0,9378
0,9436
0,9490
0,9539
0,9584
0,9626
0,9664
0,9698
0,9730

0,8402
0,8520
0,8631
0,8737
0,8836
0,8930
0,9018
0,9101
0,9178
0,9250
0,9318
0,9380
0,9438
0,9491
0,9540
0,9585
0,9627
0,9665
0,9700
0,9731

0,8403
0,8521
0,8632
0,8738
0,8837
0,8931
0,9020
0,9102
0,9180
0,9252
0,9319
0,9381
0,9439
0,9492
0,9541
0,9587
0,9628
0,9666
0,9701
0,9732

0,8414
0,8531
0,8643
0,8749
0,8849
0,8944
0,9032
0,9115
0,9193
0,9265
0,9332
0,9394
0,9452
0,9505
0,9554
0,9599
0,9641
0,9678
0,9713
0,9744

2
2,05
2,1
2,15
2,2
2,25
2,3
2,35
2,4
2,45
2,5
2,55
2,6
2,65
2,7
2,75
2,8
2,85
2,9
2,95

0,9733
0,9760
0,9785
0,9807
0,9827
0,9846
0,9862
0,9877
0,9891
0,9903
0,9914
0,9923
0,9932
0,9940
0,9947
0,9953
0,9959
0,9964
0,9968
0,9972

0,9738
0,9765
0,9790
0,9812
0,9832
0,9850
0,9866
0,9881
0,9894
0,9906
0,9917
0,9926
0,9935
0,9943
0,9949
0,9955
0,9961
0,9966
0,9970
0,9974

0,9742
0,9769
0,9793
0,9815
0,9835
0,9853
0,9869
0,9884
0,9897
0,9909
0,9919
0,9929
0,9937
0,9945
0,9951
0,9957
0,9962
0,9967
0,9971
0,9975

0,9745
0,9772
0,9796
0,9818
0,9838
0,9856
0,9872
0,9886
0,9899
0,9911
0,9921
0,9931
0,9939
0,9946
0,9953
0,9959
0,9964
0,9968
0,9972
0,9976

0,9748
0,9774
0,9798
0,9820
0,9840
0,9858
0,9874
0,9888
0,9901
0,9913
0,9923
0,9932
0,9940
0,9948
0,9954
0,9960
0,9965
0,9969
0,9973
0,9977

0,9750
0,9776
0,9800
0,9822
0,9842
0,9859
0,9875
0,9890
0,9902
0,9914
0,9924
0,9933
0,9941
0,9949
0,9955
0,9961
0,9966
0,9970
0,9974
0,9977

0,9752
0,9778
0,9802
0,9824
0,9843
0,9861
0,9877
0,9891
0,9904
0,9915
0,9925
0,9934
0,9942
0,9950
0,9956
0,9961
0,9966
0,9971
0,9975
0,9978

0,9753
0,9779
0,9803
0,9825
0,9844
0,9862
0,9878
0,9892
0,9905
0,9916
0,9926
0,9935
0,9943
0,9950
0,9957
0,9962
0,9967
0,9971
0,9975
0,9978

0,9754
0,9781
0,9805
0,9826
0,9846
0,9863
0,9879
0,9893
0,9906
0,9917
0,9927
0,9936
0,9944
0,9951
0,9957
0,9963
0,9968
0,9972
0,9976
0,9979

0,9756
0,9782
0,9806
0,9827
0,9847
0,9864
0,9880
0,9894
0,9906
0,9918
0,9928
0,9937
0,9945
0,9952
0,9958
0,9963
0,9968
0,9972
0,9976
0,9979

0,9757
0,9783
0,9807
0,9828
0,9847
0,9865
0,9881
0,9895
0,9907
0,9918
0,9928
0,9937
0,9945
0,9952
0,9958
0,9964
0,9968
0,9973
0,9976
0,9979

0,9757
0,9784
0,9807
0,9829
0,9848
0,9866
0,9881
0,9895
0,9908
0,9919
0,9929
0,9938
0,9946
0,9952
0,9959
0,9964
0,9969
0,9973
0,9977
0,9980

0,9758
0,9784
0,9808
0,9830
0,9849
0,9866
0,9882
0,9896
0,9908
0,9919
0,9929
0,9938
0,9946
0,9953
0,9959
0,9964
0,9969
0,9973
0,9977
0,9980

0,9759
0,9785
0,9809
0,9830
0,9849
0,9867
0,9882
0,9896
0,9909
0,9920
0,9930
0,9939
0,9946
0,9953
0,9959
0,9965
0,9969
0,9973
0,9977
0,9980

0,9760
0,9786
0,9810
0,9831
0,9851
0,9868
0,9883
0,9897
0,9910
0,9921
0,9931
0,9939
0,9947
0,9954
0,9960
0,9965
0,9970
0,9974
0,9977
0,9981

0,9761
0,9787
0,9811
0,9832
0,9851
0,9869
0,9884
0,9898
0,9910
0,9921
0,9931
0,9940
0,9948
0,9954
0,9960
0,9966
0,9970
0,9974
0,9978
0,9981

0,9772
0,9798
0,9821
0,9842
0,9861
0,9878
0,9893
0,9906
0,9918
0,9929
0,9938
0,9946
0,9953
0,9960
0,9965
0,9970
0,9974
0,9978
0,9981
0,9984

3
3,05
3,1
3,15
3,2
3,25
3,3
3,35
3,4
3,45
3,5
3,55
3,6
3,65
3,7
3,75
3,8
3,9
4

0,9975
0,9978
0,9981
0,9983
0,9985
0,9987
0,9989
0,9990
0,9992
0,9993
0,9994
0,9994
0,9995
0,9996
0,9996
0,9997
0,9997
0,9998
0,9998

0,9977
0,9980
0,9982
0,9985
0,9987
0,9988
0,9990
0,9991
0,9992
0,9993
0,9994
0,9995
0,9996
0,9996
0,9997
0,9997
0,9998
0,9998
0,9999

0,9978
0,9981
0,9983
0,9985
0,9987
0,9989
0,9991
0,9992
0,9993
0,9994
0,9995
0,9995
0,9996
0,9997
0,9997
0,9997
0,9998
0,9998
0,9999

0,9979
0,9982
0,9984
0,9986
0,9988
0,9990
0,9991
0,9992
0,9993
0,9994
0,9995
0,9996
0,9996
0,9997
0,9997
0,9998
0,9998
0,9999
0,9999

0,9980
0,9982
0,9985
0,9987
0,9989
0,9990
0,9991
0,9993
0,9994
0,9995
0,9995
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999

0,9980
0,9983
0,9985
0,9987
0,9989
0,9991
0,9992
0,9993
0,9994
0,9995
0,9996
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999

0,9981
0,9983
0,9986
0,9988
0,9989
0,9991
0,9992
0,9993
0,9994
0,9995
0,9996
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999

0,9981
0,9984
0,9986
0,9988
0,9990
0,9991
0,9992
0,9993
0,9994
0,9995
0,9996
0,9997
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999

0,9982
0,9984
0,9986
0,9988
0,9990
0,9991
0,9993
0,9994
0,9995
0,9995
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999
0,9999

0,9982
0,9984
0,9987
0,9989
0,9990
0,9992
0,9993
0,9994
0,9995
0,9996
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999
0,9999

0,9982
0,9985
0,9987
0,9989
0,9990
0,9992
0,9993
0,9994
0,9995
0,9996
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999
0,9999

0,9983
0,9985
0,9987
0,9989
0,9991
0,9992
0,9993
0,9994
0,9995
0,9996
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999
0,9999

0,9983
0,9985
0,9987
0,9989
0,9991
0,9992
0,9993
0,9994
0,9995
0,9996
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999
0,9999

0,9983
0,9985
0,9987
0,9989
0,9991
0,9992
0,9993
0,9994
0,9995
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999
0,9999
0,9999

0,9983
0,9986
0,9988
0,9989
0,9991
0,9992
0,9993
0,9994
0,9995
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999
0,9999
0,9999

0,9984
0,9986
0,9988
0,9990
0,9991
0,9993
0,9994
0,9995
0,9995
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999
0,9999
0,9999

0,9987
0,9989
0,9990
0,9992
0,9993
0,9994
0,9995
0,9996
0,9997
0,9997
0,9998
0,9998
0,9998
0,9999
0,9999
0,9999
0,9999
1,0000

-336-

dt

Anexo A

M Teresa Carot Snchez

DISTRIBUCIN t de Student

P( X x )

(1

t 2 n21 ( n21 )
)
dt
n
( n2 ) n

tn()

Probabilidad de una cola


n

0.0005

0.001

0.005

1
2
3
4
5

636.578 318.289 63.656


31.600 22.328 9.925
12.924 10.214 5.841
8.610
7.173 4.604
6.869
5.894 4.032

0.01

0.025

0.05

0.1

0.2

0.25

0.3

0.4

0.45

0.475

31.821
6.965
4.541
3.747
3.365

12.706
4.303
3.182
2.776
2.571

6.314
2.920
2.353
2.132
2.015

3.078
1.886
1.638
1.533
1.476

1.376
1.061
0.978
0.941
0.920

1.000
0.816
0.765
0.741
0.727

0.727
0.617
0.584
0.569
0.559

0.325
0.289
0.277
0.271
0.267

0.158
0.142
0.137
0.134
0.132

0.079
0.071
0.068
0.067
0.066

6
7
8
9
10

5.959
5.408
5.041
4.781
4.587

5.208
4.785
4.501
4.297
4.144

3.707
3.499
3.355
3.250
3.169

3.143
2.998
2.896
2.821
2.764

2.447
2.365
2.306
2.262
2.228

1.943
1.895
1.860
1.833
1.812

1.440
1.415
1.397
1.383
1.372

0.906
0.896
0.889
0.883
0.879

0.718
0.711
0.706
0.703
0.700

0.553
0.549
0.546
0.543
0.542

0.265
0.263
0.262
0.261
0.260

0.131
0.130
0.130
0.129
0.129

0.065
0.065
0.065
0.064
0.064

11
12
13
14
15

4.437
4.318
4.221
4.140
4.073

4.025
3.930
3.852
3.787
3.733

3.106
3.055
3.012
2.977
2.947

2.718
2.681
2.650
2.624
2.602

2.201
2.179
2.160
2.145
2.131

1.796
1.782
1.771
1.761
1.753

1.363
1.356
1.350
1.345
1.341

0.876
0.873
0.870
0.868
0.866

0.697
0.695
0.694
0.692
0.691

0.540
0.539
0.538
0.537
0.536

0.260
0.259
0.259
0.258
0.258

0.129
0.128
0.128
0.128
0.128

0.064
0.064
0.064
0.064
0.064

16
17
18
19
20

4.015
3.965
3.922
3.883
3.850

3.686
3.646
3.610
3.579
3.552

2.921
2.898
2.878
2.861
2.845

2.583
2.567
2.552
2.539
2.528

2.120
2.110
2.101
2.093
2.086

1.746
1.740
1.734
1.729
1.725

1.337
1.333
1.330
1.328
1.325

0.865
0.863
0.862
0.861
0.860

0.690
0.689
0.688
0.688
0.687

0.535
0.534
0.534
0.533
0.533

0.258
0.257
0.257
0.257
0.257

0.128
0.128
0.127
0.127
0.127

0.064
0.064
0.064
0.064
0.063

21
22
23
24
25

3.819
3.792
3.768
3.745
3.725

3.527
3.505
3.485
3.467
3.450

2.831
2.819
2.807
2.797
2.787

2.518
2.508
2.500
2.492
2.485

2.080
2.074
2.069
2.064
2.060

1.721
1.717
1.714
1.711
1.708

1.323
1.321
1.319
1.318
1.316

0.859
0.858
0.858
0.857
0.856

0.686
0.686
0.685
0.685
0.684

0.532
0.532
0.532
0.531
0.531

0.257
0.256
0.256
0.256
0.256

0.127
0.127
0.127
0.127
0.127

0.063
0.063
0.063
0.063
0.063

26
27
28
29
30

3.707
3.689
3.674
3.660
3.646

3.435
3.421
3.408
3.396
3.385

2.779
2.771
2.763
2.756
2.750

2.479
2.473
2.467
2.462
2.457

2.056
2.052
2.048
2.045
2.042

1.706
1.703
1.701
1.699
1.697

1.315
1.314
1.313
1.311
1.310

0.856
0.855
0.855
0.854
0.854

0.684
0.684
0.683
0.683
0.683

0.531
0.531
0.530
0.530
0.530

0.256
0.256
0.256
0.256
0.256

0.127
0.127
0.127
0.127
0.127

0.063
0.063
0.063
0.063
0.063

40
60
120

3.551
3.460
3.373
3.290

3.307
3.232
3.160
3.090

2.704
2.660
2.617
2.576

2.423
2.390
2.358
2.326

2.021
2.000
1.980
1.960

1.684
1.671
1.658
1.645

1.303
1.296
1.289
1.282

0.851
0.848
0.845
0.842

0.681
0.679
0.677
0.674

0.529
0.527
0.526
0.524

0.255
0.254
0.254
0.253

0.126
0.126
0.126
0.126

0.063
0.063
0.063
0.063

0.001

0.002

0.01

0.02

0.05

0.1

0.2

0.4

0.5

0.6

0.8

0.9

0.95

Probabilidad de dos colas


Jos Jabaloyes Vivas
Vicente Chirivella Gonzlez

-337-

Anexo A

DISTRIBUCIN F de snedecor

P( X x )

n1

n2

n1

n12 n22 t 2
(

n1
n2
,
2
2

) (n2 n1t )

n1 n 2

dt

Fn(,)n
1

Grados de libertad de la varianza mayor (n 1)


3
4
5
6

2
0.01

0.05

0.01

0.05

0.01

0.05

0.01

0.05

0.01

0.05

7
0.01

0.05

0.05

0.01

0.05

0.01

1
2
3
4
5
6
7
8
9

161.45
18.51
10.13
7.71
6.61
5.99
5.59
5.32
5.12

10
11
12
13
14
15
16
17
18
19

4.96
4.84
4.75
4.67
4.60
4.54
4.49
4.45
4.41
4.38

10.04
9.65
9.33
9.07
8.86
8.68
8.53
8.40
8.29
8.18

4.10
3.98
3.89
3.81
3.74
3.68
3.63
3.59
3.55
3.52

7.56
7.21
6.93
6.70
6.51
6.36
6.23
6.11
6.01
5.93

3.71
3.59
3.49
3.41
3.34
3.29
3.24
3.20
3.16
3.13

6.55
6.22
5.95
5.74
5.56
5.42
5.29
5.19
5.09
5.01

3.48
3.36
3.26
3.18
3.11
3.06
3.01
2.96
2.93
2.90

5.99
5.67
5.41
5.21
5.04
4.89
4.77
4.67
4.58
4.50

3.33
3.20
3.11
3.03
2.96
2.90
2.85
2.81
2.77
2.74

5.64
5.32
5.06
4.86
4.69
4.56
4.44
4.34
4.25
4.17

3.22
3.09
3.00
2.92
2.85
2.79
2.74
2.70
2.66
2.63

5.39
5.07
4.82
4.62
4.46
4.32
4.20
4.10
4.01
3.94

3.14
3.01
2.91
2.83
2.76
2.71
2.66
2.61
2.58
2.54

5.20
4.89
4.64
4.44
4.28
4.14
4.03
3.93
3.84
3.77

3.07
2.95
2.85
2.77
2.70
2.64
2.59
2.55
2.51
2.48

5.06
4.74
4.50
4.30
4.14
4.00
3.89
3.79
3.71
3.63

20
21
22
23
24
25
26
27
28
29

4.35
4.32
4.30
4.28
4.26
4.24
4.23
4.21
4.20
4.18

8.10
8.02
7.95
7.88
7.82
7.77
7.72
7.68
7.64
7.60

3.49
3.47
3.44
3.42
3.40
3.39
3.37
3.35
3.34
3.33

5.85
5.78
5.72
5.66
5.61
5.57
5.53
5.49
5.45
5.42

3.10
3.07
3.05
3.03
3.01
2.99
2.98
2.96
2.95
2.93

4.94
4.87
4.82
4.76
4.72
4.68
4.64
4.60
4.57
4.54

2.87
2.84
2.82
2.80
2.78
2.76
2.74
2.73
2.71
2.70

4.43
4.37
4.31
4.26
4.22
4.18
4.14
4.11
4.07
4.04

2.71
2.68
2.66
2.64
2.62
2.60
2.59
2.57
2.56
2.55

4.10
4.04
3.99
3.94
3.90
3.85
3.82
3.78
3.75
3.73

2.60
2.57
2.55
2.53
2.51
2.49
2.47
2.46
2.45
2.43

3.87
3.81
3.76
3.71
3.67
3.63
3.59
3.56
3.53
3.50

2.51
2.49
2.46
2.44
2.42
2.40
2.39
2.37
2.36
2.35

3.70
3.64
3.59
3.54
3.50
3.46
3.42
3.39
3.36
3.33

2.45
2.42
2.40
2.37
2.36
2.34
2.32
2.31
2.29
2.28

3.56
3.51
3.45
3.41
3.36
3.32
3.29
3.26
3.23
3.20

30
31
32
33
34
38
42
46
50
60

4.17
4.16
4.15
4.14
4.13
4.10
4.07
4.05
4.03
4.00

7.56
7.53
7.50
7.47
7.44
7.35
7.28
7.22
7.17
7.08

3.32
3.30
3.29
3.28
3.28
3.24
3.22
3.20
3.18
3.15

5.39
5.36
5.34
5.31
5.29
5.21
5.15
5.10
5.06
4.98

2.92
2.91
2.90
2.89
2.88
2.85
2.83
2.81
2.79
2.76

4.51
4.48
4.46
4.44
4.42
4.34
4.29
4.24
4.20
4.13

2.69
2.68
2.67
2.66
2.65
2.62
2.59
2.57
2.56
2.53

4.02
3.99
3.97
3.95
3.93
3.86
3.80
3.76
3.72
3.65

2.53
2.52
2.51
2.50
2.49
2.46
2.44
2.42
2.40
2.37

3.70
3.67
3.65
3.63
3.61
3.54
3.49
3.44
3.41
3.34

2.42
2.41
2.40
2.39
2.38
2.35
2.32
2.30
2.29
2.25

3.47
3.45
3.43
3.41
3.39
3.32
3.27
3.22
3.19
3.12

2.33
2.32
2.31
2.30
2.29
2.26
2.24
2.22
2.20
2.17

3.30
3.28
3.26
3.24
3.22
3.15
3.10
3.06
3.02
2.95

2.27
2.25
2.24
2.23
2.23
2.19
2.17
2.15
2.13
2.10

3.17
3.15
3.13
3.11
3.09
3.02
2.97
2.93
2.89
2.82

80
100
200
1000

3.96
3.94
3.89
3.85
3.84

6.96
6.90
6.76
6.66
6.63

3.11
3.09
3.04
3.00
3.00

4.88
4.82
4.71
4.63
4.61

2.72
2.70
2.65
2.61
2.60

4.04
3.98
3.88
3.80
3.78

2.49
2.46
2.42
2.38
2.37

3.56
3.51
3.41
3.34
3.32

2.33
2.31
2.26
2.22
2.21

3.26
3.21
3.11
3.04
3.02

2.21
2.19
2.14
2.11
2.10

3.04
2.99
2.89
2.82
2.80

2.13
2.10
2.06
2.02
2.01

2.87
2.82
2.73
2.66
2.64

2.06
2.03
1.98
1.95
1.94

2.74
2.69
2.60
2.53
2.51

4052.2 199.50 4999.3 215.71 5403.5 224.58 5624.3 230.16 5763.9 233.99 5858.9 236.77 5928.3 238.88 5980.9
98.50 19.00 99.00 19.16 99.16 19.25 99.25 19.30 99.30 19.33 99.33 19.35 99.36 19.37 99.38
34.12 9.55 30.82 9.28 29.46 9.12 28.71 9.01 28.24 8.94 27.91 8.89 27.67 8.85 27.49
21.20 6.94 18.00 6.59 16.69 6.39 15.98 6.26 15.52 6.16 15.21 6.09 14.98 6.04 14.80
16.26 5.79 13.27 5.41 12.06 5.19 11.39 5.05 10.97 4.95 10.67 4.88 10.46 4.82 10.29
13.75 5.14 10.92 4.76
9.78
4.53
9.15
4.39
8.75
4.28
8.47
4.21
8.26
4.15
8.10
12.25 4.74
9.55
4.35
8.45
4.12
7.85
3.97
7.46
3.87
7.19
3.79
6.99
3.73
6.84
11.26 4.46
8.65
4.07
7.59
3.84
7.01
3.69
6.63
3.58
6.37
3.50
6.18
3.44
6.03
10.56 4.26
8.02
3.86
6.99
3.63
6.42
3.48
6.06
3.37
5.80
3.29
5.61
3.23
5.47

NOTA: Los valores de la

para 1- son los mismos que los de

-338-

para .

Anexo A

DISTRIBUCIN F de Snedecor
(Continuacin)

P( X x )

n1

n2

n1

n12 n22 t 2
( 21
n

n2
2

) (n2 n1t )

n1 n 2

dt

Fn(,)n
1

10

12
0.01

0.05

0.01

Grados de libertad de la varianza mayor (n1)


16
20
30
50
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01

100
0.05
0.01

0.05

0.05

0.01

1
2
3
4
5
6
7
8
9

241.88
19.40
8.79
5.96
4.74
4.06
3.64
3.35
3.14

10
11
12
13
14
15
16
17
18
19

2.98
2.85
2.75
2.67
2.60
2.54
2.49
2.45
2.41
2.38

4.85
4.54
4.30
4.10
3.94
3.80
3.69
3.59
3.51
3.43

2.91
2.79
2.69
2.60
2.53
2.48
2.42
2.38
2.34
2.31

4.71
4.40
4.16
3.96
3.80
3.67
3.55
3.46
3.37
3.30

2.83
2.70
2.60
2.51
2.44
2.38
2.33
2.29
2.25
2.21

4.52
4.21
3.97
3.78
3.62
3.49
3.37
3.27
3.19
3.12

2.77
2.65
2.54
2.46
2.39
2.33
2.28
2.23
2.19
2.16

4.41
4.10
3.86
3.66
3.51
3.37
3.26
3.16
3.08
3.00

2.70
2.57
2.47
2.38
2.31
2.25
2.19
2.15
2.11
2.07

4.25
3.94
3.70
3.51
3.35
3.21
3.10
3.00
2.92
2.84

2.64
2.51
2.40
2.31
2.24
2.18
2.12
2.08
2.04
2.00

4.12
3.81
3.57
3.38
3.22
3.08
2.97
2.87
2.78
2.71

2.59
2.46
2.35
2.26
2.19
2.12
2.07
2.02
1.98
1.94

4.01
3.71
3.47
3.27
3.11
2.98
2.86
2.76
2.68
2.60

2.54
2.40
2.30
2.21
2.13
2.07
2.01
1.96
1.92
1.88

3.91
3.60
3.36
3.17
3.00
2.87
2.75
2.65
2.57
2.49

20
21
22
23
24
25
26
27
28
29

2.35
2.32
2.30
2.27
2.25
2.24
2.22
2.20
2.19
2.18

3.37
3.31
3.26
3.21
3.17
3.13
3.09
3.06
3.03
3.00

2.28
2.25
2.23
2.20
2.18
2.16
2.15
2.13
2.12
2.10

3.23
3.17
3.12
3.07
3.03
2.99
2.96
2.93
2.90
2.87

2.18
2.16
2.13
2.11
2.09
2.07
2.05
2.04
2.02
2.01

3.05
2.99
2.94
2.89
2.85
2.81
2.78
2.75
2.72
2.69

2.12
2.10
2.07
2.05
2.03
2.01
1.99
1.97
1.96
1.94

2.94
2.88
2.83
2.78
2.74
2.70
2.66
2.63
2.60
2.57

2.04
2.01
1.98
1.96
1.94
1.92
1.90
1.88
1.87
1.85

2.78
2.72
2.67
2.62
2.58
2.54
2.50
2.47
2.44
2.41

1.97
1.94
1.91
1.88
1.86
1.84
1.82
1.81
1.79
1.77

2.64
2.58
2.53
2.48
2.44
2.40
2.36
2.33
2.30
2.27

1.91
1.88
1.85
1.82
1.80
1.78
1.76
1.74
1.73
1.71

2.54
2.48
2.42
2.37
2.33
2.29
2.25
2.22
2.19
2.16

1.84
1.81
1.78
1.76
1.73
1.71
1.69
1.67
1.65
1.64

2.42
2.36
2.31
2.26
2.21
2.17
2.13
2.10
2.06
2.03

30
31
32
33
34
38
42
46
50

2.16
2.15
2.14
2.13
2.12
2.09
2.06
2.04
2.03

2.98
2.96
2.93
2.91
2.89
2.83
2.78
2.73
2.70

2.09
2.08
2.07
2.06
2.05
2.02
1.99
1.97
1.95

2.84
2.82
2.80
2.78
2.76
2.69
2.64
2.60
2.56

1.99
1.98
1.97
1.96
1.95
1.92
1.89
1.87
1.85

2.66
2.64
2.62
2.60
2.58
2.51
2.46
2.42
2.38

1.93
1.92
1.91
1.90
1.89
1.85
1.83
1.80
1.78

2.55
2.52
2.50
2.48
2.46
2.40
2.34
2.30
2.27

1.84
1.83
1.82
1.81
1.80
1.76
1.73
1.71
1.69

2.39
2.36
2.34
2.32
2.30
2.23
2.18
2.13
2.10

1.76
1.75
1.74
1.72
1.71
1.68
1.65
1.62
1.60

2.25
2.22
2.20
2.18
2.16
2.09
2.03
1.99
1.95

1.70
1.68
1.67
1.66
1.65
1.61
1.57
1.55
1.52

2.13
2.11
2.08
2.06
2.04
1.97
1.91
1.86
1.82

1.62
1.61
1.59
1.58
1.57
1.53
1.49
1.46
1.44

2.01
1.98
1.96
1.93
1.91
1.84
1.78
1.73
1.68

60
80
100
200
1000

1.99
1.95
1.93
1.88
1.84
1.83

2.63
2.55
2.50
2.41
2.34
2.32

1.92
1.88
1.85
1.80
1.76
1.75

2.50
2.42
2.37
2.27
2.20
2.18

1.82
1.77
1.75
1.69
1.65
1.64

2.31
2.23
2.19
2.09
2.02
2.00

1.75
1.70
1.68
1.62
1.58
1.57

2.20
2.12
2.07
1.97
1.90
1.88

1.65
1.60
1.57
1.52
1.47
1.46

2.03
1.94
1.89
1.79
1.72
1.70

1.56
1.51
1.48
1.41
1.36
1.35

1.88
1.79
1.74
1.63
1.54
1.52

1.48
1.43
1.39
1.32
1.26
1.24

1.75
1.65
1.60
1.48
1.38
1.36

1.39
1.32
1.28
1.19
1.08
1.01

1.60
1.49
1.43
1.28
1.11
1.01

6055.9 243.90 6106.7 246.47 6170.0 248.02 6208.7 250.10 6260.4 251.77 6302.3 253.04 6333.9 254.31 6365.6
99.40 19.41 99.42 19.43 99.44 19.45 99.45 19.46 99.47 19.48 99.48 19.49 99.49 19.50 99.50
27.23 8.74 27.05 8.69 26.83 8.66 26.69 8.62 26.50 8.58 26.35 8.55 26.24 8.53 26.13
14.55 5.91 14.37 5.84 14.15 5.80 14.02 5.75 13.84 5.70 13.69 5.66 13.58 5.63 13.46
10.05 4.68
9.89
4.60
9.68
4.56
9.55
4.50
9.38
4.44
9.24
4.41
9.13
4.37
9.02
7.87
4.00
7.72
3.92
7.52
3.87
7.40
3.81
7.23
3.75
7.09
3.71
6.99
3.67
6.88
6.62
3.57
6.47
3.49
6.28
3.44
6.16
3.38
5.99
3.32
5.86
3.27
5.75
3.23
5.65
5.81
3.28
5.67
3.20
5.48
3.15
5.36
3.08
5.20
3.02
5.07
2.97
4.96
2.93
4.86
5.26
3.07
5.11
2.99
4.92
2.94
4.81
2.86
4.65
2.80
4.52
2.76
4.41
2.71
4.31

NOTA: Los valores de la

para 1- son los mismos que los de

para .

Jos Jabaloyes Vivas y Vicente Chirivella Gonzlez


-339-

Anexo A

-340-

Bibliografa

BIBLIOGRAFA
PEA, DANIEL (1986), Estadstica, modelos y mtodos. Vol. 1 Fundamentos, Alianza
Universidad Textos, Madrid.
MONTGOMERY, DOUGLAS C. Y RUNGER, GEORGE C, (2003), Probabilidad y estadstica
aplicadas a la ingeniera, Limusa-Wiley, Mxico.
ROMERO, RAFAEL Y ZNICA, LUISA ROSA (2008), Mtodos estadsticos e ingeniera,
Editorial UPV- 637, Valencia.
Formulario y tablas de estadstica, Editorial UPV n 104, Valencia.

-341-

You might also like