You are on page 1of 59

Vicente D.

Estruch Fuster
Valentn Gregori Gregori
Almanzor Sapena Piera

LECCIONES DE ESTADSTICA
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

EDITORIAL
UNIVERSITAT POLITCNICA DE VALNCIA

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Primera edicinLPSUHVD, 2010
3ULPHUDHGLFLyQHOHFWUyQLFD
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

de la presente edicin:
Editorial Universitat Politcnica de Valncia
www.editorial.upv.es

Distribucin: pedidos@editorial.upv.es
Tel. 96 387 70 12

Vicente D. Estruch Fuster


Valentn Gregori Gregori
Almanzor Sapena Piera

ISBNHGLPSUHVD: 978-84-8363-599-5
,6%1HGHOHFWUyQLFD

Ref. editorial: 

Queda prohibida la reproduccin, distribucin, comercializacin,


transformacin, y en general, cualquier otra forma de explotacin, por
cualquier procedimiento, de todo o parte de los contenidos de esta obra
sin autorizacin expresa y por escrito de sus autores.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Sumario

Indice de notaciones 9

Prologo 11

1 Estadstica Descriptiva 13
1.1 Representacion de variables estadsticas . . . . . . . . . . . . . 13
1.1.1 Poblacion y variable estadstica . . . . . . . . . . . . . . 13
1.1.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

1.1.3 Tablas de frecuencias . . . . . . . . . . . . . . . . . . . . 14


1.1.4 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.1.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.1.6 Representaciones gracas . . . . . . . . . . . . . . . . . 15
1.2 Medidas de centralizacion y de dispersion de una variable
estadstica cuantitativa . . . . . . . . . . . . . . . . . . . . . . . .19
1.2.1 Medidas de posicion central . . . . . . . . . . . . . . . . 19
1.2.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2.3 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.2.4 Propiedades de la media aritmetica . . . . . . . . . . . . 21
1.2.5 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.2.6 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.2.7 La media ponderada . . . . . . . . . . . . . . . . . . . . 23
1.2.8 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2.9 Otras medias . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2.10 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.2.11 Medidas de dispersion de una variable estadstica
cuantitativa . . . . . . . . . . . . . . . . . . . . . . . . . 26
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
4 Sumario

1.2.12 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.2.13 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.2.14 Estadsticos robustos . . . . . . . . . . . . . . . . . . . . 30
1.2.15 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.3 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.4 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . 43
1.5 Proyecto: Medidas de asimetra y forma . . . . . . . . . . . . . 48
1.5.1 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
1.6 Proyecto: Diagrama Box-and-whisker . . . . . . . . . . . . . . . 52

2 Distribuciones bidimensionales 53
2.1 Distribuciones bidimensionales . . . . . . . . . . . . . . . . . . 53
2.1.1 Variable estadstica bidimensional . . . . . . . . . . . . 53
2.1.2 Representacion graca de una distribucion bidimensional 54
2.1.3 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.1.4 Medidas de centralizacion y dispersion . . . . . . . . . . 55
2.1.5 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.1.6 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

2.1.7 Frecuencias marginales . . . . . . . . . . . . . . . . . . . 58


2.1.8 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.2 Regresion y correlacion . . . . . . . . . . . . . . . . . . . . . . . 61
2.2.1 Lneas de regresion . . . . . . . . . . . . . . . . . . . . . 61
2.2.2 Rectas de regresion . . . . . . . . . . . . . . . . . . . . . 61
2.2.3 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.2.4 Calculo abreviado de las rectas de regresion . . . . . . . 63
2.2.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.2.6 El coeciente de correlacion lineal . . . . . . . . . . . . 65
2.2.7 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
2.3 Regresion polinomica . . . . . . . . . . . . . . . . . . . . . . . . 67
2.3.1 Regresion parabolica . . . . . . . . . . . . . . . . . . . . 67
2.3.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.3.3 Regresion polinomica general . . . . . . . . . . . . . . . 69
2.4 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.5 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . 82
2.6 Proyecto: Otras funciones de ajuste . . . . . . . . . . . . . . . 85
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Sumario 5

3 Probabilidad 87
3.1 Espacios Probabilsticos . . . . . . . . . . . . . . . . . . . . . . 87
3.1.1 Experimentos aleatorios . . . . . . . . . . . . . . . . . . 87
3.1.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.1.3 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.1.4 Algebra de sucesos . . . . . . . . . . . . . . . . . . . . . 88
3.1.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.6 Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.7 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.8 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.9 Propiedades de una funcion probabilidad . . . . . . . . 90
3.1.10 Axiomatica de Kolmogorov . . . . . . . . . . . . . . . . . 91
3.1.11 Probabilidad de Laplace . . . . . . . . . . . . . . . . . . 91
3.1.12 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.1.13 Pruebas repetidas. Espacio producto . . . . . . . . . . . 92
3.1.14 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.1.15 Probabilidad suma . . . . . . . . . . . . . . . . . . . . . 93
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

3.1.16 Probabilidad compuesta . . . . . . . . . . . . . . . . . . 93


3.1.17 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.1.18 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.1.19 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.1.20 Diagramas de arbol . . . . . . . . . . . . . . . . . . . . 95
3.1.21 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
3.2 Probabilidad condicionada. Teorema de Bayes . . . . . . . . . . 97
3.2.1 Probabilidad condicionada . . . . . . . . . . . . . . . . . 97
3.2.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.2.3 Probabilidad total . . . . . . . . . . . . . . . . . . . . . 99
3.2.4 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.2.5 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . 101
3.2.6 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.2.7 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.2.8 Probabilidad geometrica . . . . . . . . . . . . . . . . . . 102
3.2.9 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
3.3 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . 103
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
6 Sumario

3.4 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . 119


3.5 Proyecto: Analisis de tests para diagnosis . . . . . . . . . . . . 123

4 Variables aleatorias 125


4.1 Variables aleatorias . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.1.1 Variables aleatorias discretas . . . . . . . . . . . . . . . 125
4.1.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.1.3 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.1.4 Funcion de distribucion de una variable aleatoria discreta ..126
4.1.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.1.6 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
4.1.7 Propiedades de la funcion de distribucion F de una va-
riable aleatoria discreta X . . . . . . . . . . . . . . . . . 129
4.1.8 Eleccion de la funcion de probabilidad . . . . . . . . . . 129
4.1.9 Esperanza de una variable aleatoria discreta . . . . . . . 130
4.1.10 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4.1.11 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.1.12 Varianza de una variable aleatoria discreta . . . . . . . 131
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

4.1.13 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132


4.1.14 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.1.15 Momentos ordinarios y momentos centrales . . . . . . . 132
4.2 Variables aleatorias continuas . . . . . . . . . . . . . . . . . . . 133
4.2.1 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
4.2.2 Esperanza y varianza de una variable aleatoria continua 135
4.2.3 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
4.2.4 Algunas propiedades . . . . . . . . . . . . . . . . . . . . 136
4.2.5 Distribucion de una variable . . . . . . . . . . . . . . . . 137
4.3 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.4 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . 153
4.5 Proyecto: Distribuciones multivariantes . . . . . . . . . . . . . 158
4.6 Proyecto: Procesos estocasticos . . . . . . . . . . . . . . . . . . 162
4.6.1 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

5 Distribuciones discretas 165


5.1 La distribucion binomial . . . . . . . . . . . . . . . . . . . . . . 165
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Sumario 7

5.1.1 Distribucion binomial . . . . . . . . . . . . . . . . . . . 165


5.1.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
5.1.3 Graca de una distribucion binomial . . . . . . . . . . . 167
5.1.4 Parametros fundamentales de la distribucion binomial . 167
5.1.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
5.1.6 Ajuste de una distribucion binomial a una distribucion
de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . 168
5.1.7 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
5.2 La distribucion de Poisson . . . . . . . . . . . . . . . . . . . . . 169
5.2.1 Preliminares . . . . . . . . . . . . . . . . . . . . . . . . 169
5.2.2 La distribucion de Poisson . . . . . . . . . . . . . . . . . 170
5.2.3 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
5.2.4 Ajuste de una distribucion de Poisson a una binomial . 171
5.3 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . 173
5.4 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . 183
5.5 Proyecto: La distribucion Binomial Negativa y la Geometrica . 186
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

6 Distribuciones continuas 187


6.1 La distribucion uniforme . . . . . . . . . . . . . . . . . . . . . . 187
6.1.1 Distribucion uniforme . . . . . . . . . . . . . . . . . . . 187
6.2 La distribucion normal . . . . . . . . . . . . . . . . . . . . . . . 189
6.2.1 Distribucion normal . . . . . . . . . . . . . . . . . . . . 189
6.2.2 La distribucion normal estandar . . . . . . . . . . . . . 190
6.2.3 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
6.2.4 Ajuste de una distribucion normal a una distribucion
de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . 194
6.2.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
6.2.6 Nota . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
6.2.7 Ajuste de una distribucion normal a una distribucion
binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
6.2.8 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
6.2.9 Ajuste de una distribucion normal a una de Poisson . . 199
6.3 La distribucion Exponencial . . . . . . . . . . . . . . . . . . . . 199
6.3.1 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 200
6.4 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . 202
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
8 Sumario

6.5 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . 220


6.6 Proyecto: La distribucion Gamma . . . . . . . . . . . . . . . . 224

7 Distribuciones muestrales 227


7.1 Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
7.2 Error muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
7.2.1 Precision y abilidad de un estadstico . . . . . . . . . . 229
7.2.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
7.2.3 Errores muestrales de sesgo y aleatorios . . . . . . . . . 230
7.3 Media y varianza de medias y sumas muestrales . . . . . . . . . 230
7.3.1 Poblaciones innitas o muy grandes . . . . . . . . . . . 230
7.3.2 Poblaciones nitas . . . . . . . . . . . . . . . . . . . . . 231
7.4 Muestras de poblaciones normales . . . . . . . . . . . . . . . . 232
7.4.1 Distribucion de la media muestral X y de la suma S,
con 2 conocida . . . . . . . . . . . . . . . . . . . . . . 232
7.4.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
7.4.3 Distribucion de la media muestral X, con 2 desconocida..232
7.5 Teorema central del lmite y consecuencias . . . . . . . . . . . . 233
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

7.5.1 Consecuencias . . . . . . . . . . . . . . . . . . . . . . . 233


7.5.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
7.5.3 Diferencia entre medias muestrales . . . . . . . . . . . . 234
7.6 Inferencia Estadstica . . . . . . . . . . . . . . . . . . . . . . . . 234
7.6.1 Estimacion de parametros . . . . . . . . . . . . . . . . . 235
7.6.2 Estimacion puntual . . . . . . . . . . . . . . . . . . . . . 235
7.6.3 Estimacion por intervalos . . . . . . . . . . . . . . . . . 236
7.6.4 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
7.6.5 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
7.7 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . 241
7.8 Ejercicios propuestos . . . . . . . . . . . . . . . . . . . . . . . . 246
7.9 Proyecto: Estimacion de una proporcion . . . . . . . . . . . . . 248

Bibliografa 251

Indice de materias 253

Tablas estadsticas 257


Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Indice de notaciones

B(n, p) distribucion binomial


E(X) esperanza de una variable aleatoria X
suceso imposible (conjunto vaco)
N conjunto de los numeros naturales
N (, ) distribucion normal
esperanza de una variable aleatoria
suceso seguro (conjunto referencial), espacio muestral
P (k) probabilidad de Poisson
xy covarianza
desviacion tpica
2 varianza
var(X) varianza de la variable aleatoria X
x media de xi
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

smbolo de pertenencia
smbolo de inclusion
smbolo de interseccion
smbolo de union
AB diferencia de conjuntos
A suceso contrario (conjunto complementario)
p multiplo de p
i.e. id est (expresion latina y se lee es decir)
Vmn Variaciones de m elementos de orden n
RVmn Variaciones con repeticion de m elementos de orden n
Cm n Combinaciones de m elementos de orden n
 
m n
numero combinatorio equivalente a Cm
n
n! factorial de n
d
X=D La variable aleatoria X sigue una distribucion D
d
XD La variable aleatoria X sigue aproximadamente una
distribucion D
Ri.j Ejercicio Resuelto j del Captulo i
P i.j Ejercicio Propuesto j del Captulo i

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Prologo

La Universidad Espanola emprende una etapa inedita con el denomi-


nado Plan Bolonia. En el nuevo plan el tiempo del que dispone el profesorado
para la imparticion de la docencia matematica se ha reducido drasticamente.
De esta manera la clasica clase magistral del siglo anterior se vuelve, en oca-
siones, menos expositiva y mas orientadora hacia la busqueda de conocimien-
tos en los que el universitario debera involucrarse de una manera mas activa.
El presente libro es un texto elemental sobre Estadstica concebido para
los alumnos de Ingeniera que se graduaran en estos nuevos planes aunque
basicamente el contenido corresponde al curso que los autores han impartido
en la Escuela Politecnica Superior de Gandia (EPSG) en anteriores cursos
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

academicos. El poco tiempo de que se dispone para su imparticion queda


patente, en cierta manera, en la ausencia de demostraciones, en su sentido
mas estricto (el captulo tres podra considerarse una excepcion), pues estas
solo aparecen como tales en la resolucion de algunos ejercicios de caracter
teorico, que se encuentran al nal de cada captulo. Ello permite una lectura
uida del texto.
No obstante lo dicho en el parrafo anterior, y aun usando terminologa
sencilla, la redaccion matematica del texto es rigurosa en su exposicion. Si en
algun momento, por motivos que entendemos pedagogicos, hemos relajado el
rigor, este habitualmente se ve compensado con la aparicion de un epgrafe
en letra pequena (cuya lectura puede omitirse sin perjuicio de comprender el
resto del texto), que pone enfasis en el aspecto matematico cuyo rigor haba
sido diluido, a conciencia.
Permtasenos armar que, modestamente, es en la exposicion didacti-
ca en donde los autores se han esmerado, y esperamos haberlo conseguido.
En efecto, ademas de las detalladas argumentaciones del contenido a lo largo
del texto, estas van acompanadas de un buen numero de ejemplos y tablas
disenadas para calculos y gracos. Al nal de cada captulo se ofrece una lista
de ejercicios con una resolucion detallada de cada uno y despues se proponen
otros que motiven al estudioso. Cada captulo acaba con la descripcion de

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
12 Prologo

algun Proyecto que es una extension o aplicacion de la teora del texto.


Concretando el programa desarrollado, los 7 captulos seleccionados,
por este orden, han sido: Estadstica descriptiva, distribuciones bidimensiona-
les, probabilidad, variables aleatorias, distribuciones discretas, distribuciones
continuas y distribuciones muestrales.
Para la comprension del texto, ademas de un conocimiento elemen-
tal del calculo, y de conceptos matematicos basicos, se requieren del Algebra
conocimientos de combinatoria elemental que se usan en el calculo de probabi-
lidades y en el estudio de la distribucion binomial. Del Analisis Matematico se
necesita un conocimiento basico de la integral denida de Riemann, y tambien
de la derivada, para el tratamiento de las variables aleatorias continuas.
Para variables aleatorias discretas se han demostrado algunos resulta-
dos que han sido extendidos, de manera natural, para variables aleatorias
continuas aunque, como se pone de maniesto en su momento, las pruebas en
este ultimo caso requieren de conocimientos mas profundos sobre la integral
de Riemann.
Otros aspectos interesantes, como el calculo del area que encierra la
campana de Gauss, o la obtencion del sistema normal de ecuaciones de las
rectas de regresion, se sugiere desde estas lneas que deben ser considerados
como ejercicios en algun curso de Analisis Matematico.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Los autores agradeceran cualquier sugerencia tendente a mejorar el pre-


sente texto en ediciones sucesivas.
Deseamos mostrar nuestro agradecimiento a los restantes profesores (M.
Alamar, F. J. Boigues, J. Pastor, B. Roig y A. Vidal) de la Unidad Docente
en la EPSG del Departamento de Matematica Aplicada de la Universidad
Politecnica de Valencia, por sus indicaciones en la preparacion del texto.
Los autores

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Captulo 1

Estadstica Descriptiva

Se podra entender la Estadstica como la ciencia que tiene por objeto


el estudio de datos. Los metodos estadsticos se aplican a datos generalmente
numericos que proceden de observaciones efectuadas sobre alguna caracters-
tica de un colectivo o sobre resultados de una experimentacion.
La Estadstica Descriptiva, de la que nos ocuparemos en el texto ba-
sicamente, es el primer paso del estudio del conjunto de datos y se limita a
la obtencion de gracos y parametros representativos de la serie de datos.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

La extrapolacion de conclusiones de los datos obtenidos de una parte de un


colectivo a todo el colectivo constituye la tecnica de la Inferencia Estadstica
que se vera someramente en el ultimo captulo.

1.1 Representacion de variables estadsticas

1.1.1 Poblacion y variable estadstica

Poblacion es un conjunto de elementos (individuos) con algun carac-


ter comun. Muestra es un subconjunto representativo de dicha poblacion.
Nosotros, salvo algun caso aislado, siempre consideraremos poblaciones ni-
tas. En Estadstica se consideran dos tipos de caracteres (que se explican por
su denominacion): cualitativos y cuantitativos. Al caracter objeto de estu-
dio se le denomina variable estadstica (cualitativa o cuantitativa), y esta
divide la poblacion, de manera natural, en clases (subconjuntos disjuntos) al
considerar los diversos atributos de la variable, que a su vez pueden dar lugar
a subclases.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
14 Estadstica Descriptiva

1.1.2 Ejemplo

En un aula determinada, los alumnos constituyen la poblacion, el sexo


y el lugar de nacimiento son variables cualitativas, mientras que el peso y
la talla de cada alumno son cuantitativas. Si escogemos al azar dos las de
alumnos, estos constituyen una muestra. La poblacion puede quedar dividida
en dos clases: la de los chicos y la de las chicas. A su vez, cada clase puede
dar lugar a subclases atendiendo a los diversos pesos, por ejemplo.

1.1.3 Tablas de frecuencias

Frecuencia (absoluta) de una clase es el numero de elementos de la


clase. Frecuencia relativa de una clase es el cociente entre la frecuencia
absoluta y el numero de elementos de la poblacion (supuesto este nito).
La recopilacion de los datos de una variable se efectua disponiendolos en
tablas de frecuencias, que se denominan distribuciones unidimensionales
o bidimensionales segun que intervenga una o dos variables. Por brevedad,
denominamos tabla a una tabla de frecuencias en donde al menos aparecen xi
y las frecuencias absolutas fi correspondientes. Los N valores numericos xi
que puede tomar una variable se denominan serie estadstica, serie de datos
(o de numeros) o con otras expresiones alusivas similares segun los autores.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

En el caso de una variable cuantitativa, que haya sido ordenada, se


denomina frecuencia absoluta acumulada a la suma de las frecuencias
absolutas de un determinado valor de la variable y de todos los anteriores. De
manera similar se dene el concepto de frecuencia relativa acumulada. El
lector reconocera algunas propiedades sencillas de estos conceptos observando
el siguiente ejemplo.

1.1.4 Ejemplo

Las calicaciones en la asignatura de Fsica obtenidas por 20 alumnos


de una determinada clase, siguiendo el listado, son las siguientes: 6, 4, 5, 8,
7, 3, 4, 5, 5, 10, 9, 7, 8, 2, 9, 3, 10, 4, 7, 4. Aqu la poblacion es la clase de
20 alumnos, la variable estadstica, calicacion en Fsica, es cuantitativa, y
sus valores numericos xi son los numeros del 2 al 10.

A partir de ahora cuando recurramos al signo de sumatorio omitire-
mos el recorrido de los subndices de este si no hay posibilidad de confusion.
La recopilacion de los datos de este ejemplo da lugar a la siguiente
tabla de frecuencias, de interpretacion obvia, y en donde dejamos constancia
de la notacion que se empleara en este captulo, al referirnos a las diversas
frecuencias.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Representacion de variables estadsticas 15

Numero Frecuencia Frecuencia Frecuencia Frecuencia


de puntos absoluta relativa absoluta acumulada relativa acumulada
xi fi hi Fi Hi
2 1 0.05 1 0.05
3 2 0.10 3 0.15
4 4 0.20 7 0.35
5 3 0.15 10 0.50
6 1 0.05 11 0.55
7 3 0.15 14 0.70
8 2 0.10 16 0.80
9 2 0.10 18 0.90
10  2  0.10 20 1.00
fi = 20 hi = 1

En ocasiones, cuando la variable estadstica puede tomar cualquier valor


real de un intervalo, interesa agrupar los valores que toma dicha variable cuan-
titativa en intervalos, por lo general de igual amplitud, que suelen denominarse
clases, y a los puntos medios de los intervalos se les denomina marcas de clase.

1.1.5 Ejemplo
La siguiente tabla muestra las tallas agrupadas de 200 jovenes.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Intervalo Marcas de clase fi hi Fi Hi


[1.50, 1.70[ 1.60 70 0.35 70 0.35
[1.70, 1.80[ 1.75 60 0.30 130 0.65
[1.80, 1.90[ 1.85 50 0.25 180 0.90
[1.90, 2.00[ 1.95 20 0.10 200 1.00
 
fi = 200 hi = 1

Observese que, en este caso, no todos los intervalos tienen la misma


amplitud, pero s son de la misma forma (cerrados por la izquierda y abiertos
por la derecha), a efectos de uniformizar criterios.

1.1.6 Representaciones gracas


Las conclusiones a las que se puede llegar del estudio de una variable
pueden ser mas faciles, en ocasiones, a traves de representaciones gracas de
los datos que se poseen sobre la variable estadstica. Las mas utilizadas son:

(1) Diagrama de barras: Son rectangulos de igual base, generalmente


dispuestos en posicion vertical, en donde la altura de cada uno es pro-
porcional a la frecuencia de la clase que representa.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
16 Estadstica Descriptiva

Los dos siguientes diagramas de barras son los que corresponden a


las frecuencias absolutas y absolutas acumuladas, respectivamente, del
Ejemplo 1.1.4

Diagrama de barras de frecuencias absolutas


Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Diagrama de barras de frecuencias absolutas acumuladas


El pictograma es una variante del diagrama de barras donde se sustituye
el rectangulo por un dibujo alusorio a la variable estadstica, objeto de
estudio.
El siguiente pictograma representea la distribucion, por sexos, de los
que accedieron a portales de internet de informacion general en los anos
2008 y 2009, en un cierto pas miembro del G20.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Representacion de variables estadsticas 17

(2) Graco de sectores: Son representaciones en sectores que dividen,


generalmente, a un crculo de manera que el area (o angulo) de cada
sector es proporcional a la frecuencia (absoluta o relativa) de la clase
que representa.

Imaginemos que en una reunion de 720 personas se observa que 360


tienen el pelo negro, 180 de color rubio, 60 de color blanco, y 120 sin deter-
minar (otros). El correspondiente diagrama por sectores sera el adjunto.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

En el caso de variables cuantitativas se pueden, ademas de los anteriores


gracos, considerar los siguientes:

(3) Polgono de frecuencias : En estos las ordenadas de las frecuencias


absolutas se unen mediante una lnea poligonal. De manera analoga se
dibujan los polgonos de frecuencias absolutas (o relativas) acumuladas.

El siguiente polgono de frecuencias absolutas es el que corresponde al


Ejemplo 1.1.4

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
18 Estadstica Descriptiva

Para el caso de valores agrupados se puede utilizar el histograma.

(4) Histograma: Representacion graca formada por rectangulos cuyas


areas son proporcionales a las respectivas frecuencias de los interva-
los considerados. En el caso de que la amplitud de los intervalos sea
constante este diagrama se convierte, como es facil de vericar, en un
diagrama de barras.

El histograma adjunto corresponde al Ejemplo 1.1.5. Observese que el


area que corresponde a las 70 tallas del intervalo [1.50, 1.70[ coincide con la
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

suma de las areas que corresponden a 50 y 20 tallas de los intervalos [1.80, 1.90[
y [1.90, 2.00[, respectivamente. Tambien el area que corresponde a las 60 tallas
del intervalo [1.70, 1.80[ es el triple del area que corresponde a las 20 tallas
del intervalo [1.90, 2.00[.
Como caso especial tenemos el cartograma que hace uso de distintos
sombreados sobre un mapa para distinguir las variables estadsticas.
El siguiente cartograma representa la incidencia de muerte subita tras
un infarto agudo de miocardio (tasa anual por cada 100000 habitantes).

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Medidas de centralizacion y de dispersion de una variable estadstica cuantitativa 19

1.2 Medidas de centralizacion y de dispersion de


una variable estadstica cuantitativa

En cuanto sigue de este captulo supondremos que disponemos de una


variable estadstica cuantitativa X, en una poblacion de N elementos, que
toma los valores x1 , x2 , . . . , xN . Ahora bien, es bastante usual que alguno
de los valores que toma X este repetido, de manera que solo haya r dis-
tintos, y que para simplicar la notacion supondremos que, ordenados de
menor a mayor, son x1 , x2 , . . . , xr . Por otra parte cuando N es grande es
casi imprescindible que se den las frecuencias absolutas fi correspondientes
r
a xi (i = 1, 2, . . . , r), de manera que fi = N . A continuacion, y por cri-
i=1
terios de sencillez, para referirnos a los valores que toma X, usaremos unas
veces la notacion exhaustiva x1 , x2 , , xN , y en otras haremos mencion a la
frecuencia fi de cada xi sin explicitar el recorrido del subndice.

1.2.1 Medidas de posicion central

Se denominan valores centrales de la variable X a ciertos valores, de


calculo sencillo, que representan, de alguna forma, a todos los xi . Veamos los
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

mas representativos.
Se denomina moda (y se denota Mo ) de un conjunto de valores de una
variable estadstica X a aquel valor o caracter que posee mayor frecuencia
absoluta. Puede existir, obviamente, mas de una moda. Como valor central
es, en ocasiones, muy poco representativo, aunque de calculo muy sencillo.
En el caso de valores agrupados se puede hablar de intervalo modal, o bien,
elegir el representante de clase del intervalo modal. (Observese que hablar de
la moda tiene tambien sentido cuando X es una variable cualitativa).
Supongamos ahora que hemos ordenado todos los N valores que ha
tomado la variable X de manera creciente. Si N es impar se denomina me-
diana (y se denota Me ) al valor que ocupa la posicion central, y si N es par
se toma como mediana la semisuma de los dos valores centrales. En el caso
de que la variable X tomara valores agrupados el calculo de la mediana se
obtiene mediante una simple interpolacion lineal.
La ventaja de utilizar la mediana como valor central estriba en que no
se deja inuenciar por valores extremos, pero tiene el inconveniente de que no
tiene en cuenta los valores de la variable.
Cuando N es grande, si estan dispuestos los valores de X como hemos
indicado en el calculo de la mediana, y sin entrar en detalles, supongamos que
podemos dividir estos en cuatro partes iguales. Entonces se pueden considerar
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
20 Estadstica Descriptiva

los denominados cuartiles Q1 , Q2 , y Q3 de manera que la primera cuarta


parte de los valores es inferiror a Q1 , otra cuarta parte esta comprendida entre
Q1 y el segundo cuartil Q2 , que como es evidente no es sino la mediana, otra
cuarta parte entre la mediana y Q3 , y la ultima cuarta parte es superior a
Q3 . De manera mas precisa, si N es par, entonces Q1 es la mediana de los
primeros N2 valores y Q3 es la mediana de los N2 valores superiores. Si N es
impar prescindiremos del valor central y entonces calcularemos Q1 y Q3 como
en el caso anterior.
De modo identico se denen los deciles o percentiles si el conjunto
ordenado de los valores que toma X se divide en 10 o 100 partes, respectiva-
mente.
La media aritmetica (que denotaremos x) de un conjunto de valores
de una variable estadstica cuantitativa X es la suma de los N valores que
toma la variable dividido por N . Si se conocen las frecuencias fi de los valo-
res xi , se puede simplicar el calculo anterior y obtener la media aritmetica
mediante la expresion

fi xi
x= (1.1)
N
Observese que el peso de cada xi para el calculo de x es su frecuencia
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

absoluta.
En el caso de valores agrupados para el calculo de la media se utilizan
las marcas de clase.

1.2.2 Ejemplo

En la tabla de frecuencias correspondiente al Ejemplo 1.1.4 de las notas


de Fsica, la moda es el 4, pues se repite 4 veces, la mediana es el 5.5, pues las
posiciones 10 y 11, cuando se ordenan las notas de manera creciente (vease la
tabla de frecuencias absolutas acumuladas), las ocupan las calicaciones 5 y
6, respectivamente, y la media aritmetica es:

1 2 + 2 3 + 4 4 + 3 5 + 1 6 + 3 7 + 2 8 + 2 9 + 2 10
x = =6
20

1.2.3 Ejemplo

Veamos la moda , mediana y media de la siguiente tabla de frecuencias


correspondiente a la talla (en metros) de 99 alumnos.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
edidas de centralizacion y de dispersion de una variable estadstica cuantitativa 21

Intervalo Marcas de clase fi Fi


[1.55, 1.65[ 1.60 15 15
[1.65, 1.75[ 1.70 55 70
[1.75, 1.85[ 1.80 25 95
[1.85, 1.95[ 1.90 4 99

fi = 99
En la columna de las frecuencias absolutas fi se observa que el intervalo
modal es el [1.65, 1.75[. La media aritmetica la calcularemos a traves de las
correspondientes marcas de clase:
15 1.60 + 55 1.70 + 25 1.80 + 4 1.90
x= 1.72
99
La mediana es el elemento que, tras ordenarse las tallas de manera
creciente, ocupa la posicion 50, y que, como se observa en la columna de
frecuencias acumuladas Fi , se encuentra en el intervalo mediano [1.65, 1.75[
ocupando la posicion 35 dentro de este.
Entonces podemos establecer la proporcion de que si a los 55 alumnos de
este intervalo les corresponde una amplitud de 0.10 (al distribuirse de menor
a mayor), al alumno que esta en la posicion 35 le corresponde
0.10
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

35 0.06
55
As pues (ver graco inferior) la mediana es 1.65 + 0.06 = 1.71

1.2.4 Propiedades de la media aritmetica


Sea xi una serie de numeros. Se denomina desviacion de un valor xi
respecto de la media aritmetica, a la diferencia di = xi x. Se tienen entonces
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
22 Estadstica Descriptiva

las siguientes propiedades:

1. La suma de los productos  de las desviaciones de los valores xi por sus


frecuencias fi es cero, i.e. fi di = 0. (Ver ejercicio R1.1)

2. Sea P un numero real cualquiera. Denominemos Di a la desviacion de


xi respecto a P , i.e. Di = xi P . Se tiene entonces (ver ejercicio R1.2)
que la diferencia entre la media aritmetica y P es la media aritmetica
de las desviaciones de los valores de la variable respecto a P , es decir:

fi Di
xP = (1.2)
N

Como consecuencia de ello se obtiene un nuevo metodo para obtener de


manera sencilla, en algunos casos, la media x (ver Ejercicio R1.9), pues
se tiene 
fi Di
x=P + =P +D (1.3)
N
donde D denota la media de la serie de numeros Di .

3. La suma de los productos de los cuadrados de las desviaciones por las


frecuencias respectivas es mnima cuando P es x, i.e.,
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

 
fi Di2 fi d2i

Las ventajas del uso de la media aritmetica radican en su sencillo calculo


y que depende de todos los valores. Como inconveniente esta el hecho
que de su conocimiento no se desprenda si los valores xi estan lejos o
cerca de ella.

1.2.5 Nota
La propiedad 2 de la seccion anterior admite la siguiente generalizacion:
Si zi es una serie de numeros obtenida de otra serie xi de manera que
zi = axi + b, donde a, b R entonces

z = ax + b (1.4)

1.2.6 Ejemplo
Consideremos la serie de numeros siguiente: 3,5,7. Sea ahora la serie
zi = 2xi + 1, es decir zi esta formada por 7, 11, 15. Se tiene que:
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Medidas de centralizacion y de dispersion de una variable estadstica cuantitativa 23

3+5+7 7 + 11 + 15
x= =5 y z= = 11
3 3
Observese que se satisface (1.4).

1.2.7 La media ponderada


Imaginemos un accionista que adquiere acciones de una empresa en tres
momentos como se indica a continuacion. 200 acciones a 25 euros, 300 a 24
euros y 500 a 20 euros. La intencion del accionista es vender conjuntamente
las acciones sin perder dinero. La media de los tres precios de las acciones es
(25 + 24 + 20)/3 = 23, pero obviamente esto es irrelevante pues lo que interesa
conocer es el precio medio de la accion que segun (1.1) vale
200 25 + 300 24 + 500 20
x= = 22.20 euros
1000
Por lo tanto el accionista debera vender las acciones al menos a 22.20
euros.
Observese que para el calculo de x se ha tenido en cuenta las cantidades
de acciones obtenidas para cada precio, o sea, se han ponderado los precios a
traves de sus frecuencias absolutas. As, las acciones de 20 euros han tenido
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

un mayor peso en el calculo de x pues su coeciente, 500, es mayor que el de


las otras dos acciones.
Este ejemplo admite la siguiente generalizacion.
Se denomina media ponderada de los valores numericos x1 , . . . , xr
con pesos w1 , . . . , wr , respectivamente, (con wi 0) a
w1 x1 + + wr xr
x= (1.5)
W

r
siendo W = wi > 0.
i=1
Observese que tambien se puede escribir
wi wr
x= x1 + + xr
W W
wi
y que si llamamos pi = se verica
W
  wi 1  W
pi = = wi = =1
W W W
Si reescribimos entonces el calculo anterior de x en la forma:
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
24 Estadstica Descriptiva

200 300 500


x= 25 + 24 + 20
1000 1000 1000
esto nos sugiere otra manera de denir la media ponderada como sigue.
Se denomina media ponderada de los valores numericos x1 , . . . , xr con
pesos p1 , . . . , pr , respectivamente, donde 0 pi < 1 y p1 + + pr = 1, a

r
x= pi xi (1.6)
i=1

Ambas expresiones (1.5) y (1.6) son equivalentes. El enunciado de un


problema debe sugerir cual resulta mas comoda de utilizar.
Puede darse el caso de que algun valor de xi se repita con pesos distintos.
En tal caso una tabla de frecuencias con sus respectivos pesos facilita los
calculos para la obtencion de x (vease Ejercicio R1.15).

1.2.8 Ejemplo
El profesor, a comienzos del curso, advierte a sus alumnos que realizaran
4 ejercicios de la asignatura de manera que cada ejercicio puntua (pondera)
doble que el anterior. Las calicaciones obtenidas por un alumno, en este
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

orden, son 2, 4, 5 y 6. Veamos la calicacion nal del alumno con dos razo-
namientos distintos:

(a) Decir que la calicacion b de un ejercicio puntua el doble que la ca-


licacion a de otro ejercicio debe de interpretarse como si hubiera 3
calicaciones: a, b, b. Entonces, segun el enunciado podemos considerar
que nuestro alumno ha obtenido un dos, dos cuatros, cuatro cincos y
ocho seises, por lo que su calilcacion media nal resulta
12+24+45+86 78
x= = = 5.2
15 15

Observese que para el calculo de x se ha utilizado la expresion (1.5).


En efecto, el profesor en realidad haba decidido que los pesos wi de las
calicaciones x1 , x2 , x3 y x4 de cada alumno fueran 1,2,4 y 8, respecti-
vamente.

(b) Por el enunciado, si p1 es el peso de 2 entonces los pesos pi de 4, 5 y 6


son, respectivamente, p2 = 2p1 , p3 = 2p2 = 4p1 , p4 = 2p3 = 8p1 . Como
se ha de vericar que p1 + p2 + p3 + p4 = 1, entonces

p1 + 2p1 + 4p1 + 8p1 = 15p1 = 1


Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Medidas de centralizacion y de dispersion de una variable estadstica cuantitativa 25

1 2 4 8
y por tanto p1 = , p2 = , p3 = , p4 = .
15 15 15 15
As, la calicacion nal segun (1.6) es

1 2 4 8 78
x= 2+ 4+ 5+ 6= = 5.2
15 15 15 15 15

1.2.9 Otras medias


Cuando todos los valores de xi son positivos se pueden denir otras
medias como las siguientes:

N
(1) La media geometrica: G= N x1 xN = xf11 xfrr
Para entender el signicado de esta media consideraremos el siguiente
ejemplo:
Supongamos que se desea calcular el peso p de un objeto mediante una
balanza desequilibrada (observese la gura).
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Podemos proceder de la siguiente manera: En primer lugar disponemos


el objeto en una parte de la balanza y obtenemos su peso p1 . A conti-
nuacion disponemos el objeto en la otra parte de la balanza y obtenemos
el peso p2 .
Segun la ley de la palanca, se tiene l1 p = l2 p2 y l1 p1 = l2 p.
p p2
Por tanto, = , de donde se obtiene p2 = p1 p2 y, en consecuencia,
p1 p
p = p1 p2 .
Es decir, el peso del objeto resulta la media geometrica de las dos pe-
sadas.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
26 Estadstica Descriptiva

N N
(2) La media armonica: H= =
1 1 fi
+ +
x1 xN xi

fi x2i
(3) La media cuadratica: M=
N

Las cuatro medias quedan ordenadas con arreglo a su magnitud, del


siguente modo:
HGxM (1.7)

Al objeto de entender el signicado de la media armonica considerare-


mos el siguiente ejemplo.

1.2.10 Ejemplo
Supongamos que hemos recorrido el trayecto Alicante-Valencia a razon
de 90 Km/h y el regreso Valencia-Alicante a 110 Km/h. Vamos a calcular la
velocidad media en el trayecto de ida y vuelta.
La media aritmetica para x1 = 90 y x2 = 100 dara como respuesta
90 + 110
= 100 Km/h, que sera un resultado erroneo.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

2
En efecto, el tiempo invertido en recorrer la distancia D entre ambas
D D
ciudades sera a la ida y a la vuelta. La velocidad media en la ida y
90 110
vuelta sera pues:
espacio 2D 2
velocidad = = = = 99 Km/h
tiempo D D 1 1
+ +
90 110 90 110
que es precisamente la media armonica de las dos velocidades.
Otra aplicacion puede verse en el ejercicio P1.11.
A partir de ahora por media entenderemos la media aritmetica.

1.2.11 Medidas de dispersion de una variable estadstica


cuantitativa
El conocimiento de cualquiera de los valores de centralizacion estudiados
en el epgrafe anterior no es suciente para saber si los valores xi , que toma
una variable estadstica cuantitativa X, estan proximos o alejados de estos.
Para saber cuan agrupados estan los valores alrededor de un valor medio se
denen las medidas de dispersion. Las mas importantes, que veremos a
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Medidas de centralizacion y de dispersion de una variable estadstica cuantitativa 27

continuacion, son: el recorrido, la desviacion media, la varianza y la desviacion


tpica. Cuanto mayores sean estas medidas de dispersion, tanto mayor es la
dispersion de los valores respecto de la media y, en consecuencia, menor la
representatividad de los valores centrales.
Para un conjunto de valores xi de una variable estadstica cuantitativa
se denomina:

(1) Recorrido a la diferencia entre el mayor y el menor de dichos valores.

(2) Desviacion media (que denotaremos dm ) a la media aritmetica de los


valores absolutos de las desviaciones respecto de la media, as pues

m fi |xi x|
d =
N

(3) Varianza, que denotaremos 2 , a la media aritmetica de los cuadrados


de las desviaciones de esos valores respecto a la media, as pues

2 fi (xi x)2
= (1.8)
N
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Se puede demostrar que 2 verica la expresion (vease Ejercicio R1.3)



2 fi x2i
= x2 (1.9)
N

Si designamos por P un numero real cualquiera y Di = xi P entonces


se puede demostrar que (vease Ejercicio R1.4)

  2
2 fi Di2 fi Di
= (1.10)
N N

fi Di
y puesto que no es mas que la media aritmetica de las desvia-
N
ciones Di , entonces teniendo en cuenta (1.9) podemos concluir que (1.10)
expresa el hecho de que: la varianza de los valores x1 , x2 , . . . , xN , coin-
cide con la de las desviaciones D1 , D2 , . . . , DN .
Observese que para el calculo de la varianza por este ultimo procedi-
miento no necesitamos conocer la media aritmetica.

(4) Desviacion tpica o estandar, que denotaremos , es la raz cuadrada


positiva de la varianza.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
28 Estadstica Descriptiva

La desviacion tpica tiene en cuenta todos los valores que toma la va-
riable estadstica X y es de signicado sencillo ya que es de igual na-
turaleza que los datos utilizados. En particular es interesante en las
distribuciones normales, que veremos mas adelante, en las que la curva
representativa de las frecuencias tiene la forma de campana. As se con-
sideran valores proximos a la media los del intervalo [x , x + ], y
medianamente proximos los del intervalo [x 2, x + 2]. Los valores
que quedan fuera de este ultimo intervalo se consideran extraordinarios.

Para el calculo de las medidas de dispersion en el caso de valores agru-


pados se utilizan las marcas de clase de cada intervalo.

1.2.12 Ejemplo

La distribucion en frecuencias de las tallas aproximadas (en me-


tros) de 150 adolescentes son las siguientes:
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Talla Frecuencia
1.60 1
1.62 3
1.64 7
1.66 20
1.68 30
1.70 34
1.72 26
1.74 16
1.76 9
1.78 2
1.80 2

Disponganse los calculos y hallese la media, la desviacion media, la


varianza y la desviacion tpica de dicha distribucion, usando sus deni-
ciones.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Medidas de centralizacion y de dispersion de una variable estadstica cuantitativa 29

xi fi fi xi xi x |xi x| (xi x)2 fi |(xi x)| fi (xi x)2


1.60 1 1.60 0.10 0.10 0.0100 0.10 0.0100
1.62 3 4.86 0.08 0.08 0.0064 0.24 0.0192
1.64 7 11.48 0.06 0.06 0.0036 0.42 0.0252
1.66 19 31.54 0.04 0.04 0.0016 0.76 0.0304
1.68 30 50.40 0.02 0.02 0.0004 0.60 0.0120
1.70 34 57.80 0.00 0.00 0.0000 0.00 0.0000
1.72 26 44.72 0.02 0.02 0.0004 0.52 0.0104
1.74 16 27.84 0.04 0.04 0.0016 0.64 0.2560
1.76 10 17.60 0.06 0.06 0.0036 0.60 0.0360
1.78 2 3.56 0.08 0.08 0.0064 0.16 0.0128
1.80 2 3.60 0.10 0.10 0.0100 0.20 0.0200
P
= 150 255 4.24 0.2016

El recorrido de la variable estadstica es 1.80-1.60=0.20



fi xi 255
La media es x =  = = 1.70
fi 150


|fi (xi x)| 4.24
La desviacion media dm =  = 0.0283
fi 150
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.


fi (xi x)2 0.2016
La varianza es 2 =  = 0.0013
fi 150


0.2016
Finalmente, la desviacion tpica es = 0.0367
150

1.2.13 Nota
Tambien se utilizan como medida de dispersion los llamados momentos cen-
trales, que se denen como la media aritmetica de las potencias sucesivas de las
desviaciones respecto de la media aritmetica. As se dene momento de orden n
(n N) como: P
fi (xi x)n
n =
N

En particular, el momento 1 de orden 1 es cero, como vimos anteriormente,


y el de orden 2 es la varianza:
P
fi (xi x)2
2 = = 2
N

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
30 Estadstica Descriptiva

1.2.14 Estadsticos robustos

Cualquier funcion denida en una serie numerica estadstica se de-


nomina estadstico. La moda de una serie estadstica es un indicador de
posicion central que puede denominarse robusto porque resulta poco inuida
por la existencia de algunos valores extremos, digamos anormales, y que en
ocasiones provienen de errores en la medicion o lectura. Su uso es recomen-
dable cuando se trata de variaciones muy discontinuas en una serie.
La media puede no resultar un indicador adecuado de medida central
en aquellas series asimetricas o con valores extremos. Como consecuencia
en dichas series tampoco la desviacion tpica sera un parametro adecuado de
dispersion, pues su calculo se basa en desviaciones respecto a la media. En
estos casos se utiliza el intervalo intercuartlico Q3 Q1 .

1.2.15 Ejemplo

Se considera la serie estadstica xi , ordenada de manera creciente, si-


guiente
4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 9, 12, 15, 20
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Al transcribir los datos se reemplaza por error 20 por 0 dando lugar a


x
una nueva serie yi . Vamos a calcular la media, x, la mediana, M e, cuartiles
primero y tercero, Qx1 y Qx3 y desviacion tpica, x , de la serie xi , y sus
homologos, con notacion adecuada, de la serie yi .
Disponemos la tabla de frecuencias de la serie xi con las columnas ade-
cuadas para utilizar la formula (1.9) para el calculo de x2 , y de esa manera
es innecesario realizar la tabla de la serie yi , pues en la practica solo hay que
suprimir la la que corresponde a xi = 20.

xi fi fi xi x2i fi x2i
4 6 24 16 96
5 4 20 25 100
6 3 18 36 108
7 2 14 49 98
8 1 8 64 64
9 1 9 81 81
12 1 12 144 144
15 1 15 225 225
20 1 20 400 400

= 20 140 1316
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Medidas de centralizacion y de dispersion de una variable estadstica cuantitativa 31

140
Atendiendo a la tabla x = = 7.
20
x 5+6
M e= = 5.5 pues 5 y 6 son los valores centrales de las serie
2
ordenada xi , que corresponden a las posiciones 10 y 11, respectivamente.
El cuartil Qx1 es la mediana de los 10 primero datos de la serie xi , y por
4+4
tanto Qx1 = = 4.
2
Analogamente, Qx3 es la mediana de los 10 ultimos datos de la serie y
7+8
resulta Qx3 = = 7.5. As, el intervalo intercuartlico para la serie xi es
2
3.5. 
2 fi xi 1316
Se tiene que x = x2 = 72 = 16.8 y por tanto
N 20

x = 16.8 4.1

120
En cuanto a la serie yi es evidente que y = = 6.
20
Como la serie yi queda de la forma

0, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 9, 12, 15
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

x 5+5 4+4 7+7


ahora se tiene M e= = 5, Qy1 = = 4, Qy3 = = 7. As, el
2 2 2
intervalo intercuartlico para la serie yi es 3.
916
Por otra parte y2 = 62 = 9.8, y por tanto y = 9.8 3.1.
20
Observese que y se ha desviado en una unidad respecto a x, mientras
y
que Me solo se ha desviado media unidad. Por otra parte y se ha desviado
practicamente una unidad respecto a x , y la diferencia Qy3 Qy1 = 3, solo se
ha desviado media unidad de Qx3 Qx1 = 3.5.
As pues en nuestro caso la mediana y el intervalo intercuartlico de
la serie xi se han comportado de manera mas robusta frente a la media y
x
desviacion tpica, respectivamente, pues M e y Qx3 Qx1 se han visto menos
y
afectados que Me y Qy3 Qy1 , respectivamente, frente al error causado.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
32 Estadstica Descriptiva

1.3 Ejercicios resueltos


R1.1 Demuestrese que la suma de los productos de las desviaciones de los
valores xi de una variable X, respecto a la media x, por las frecuencias
respectivas fi , es nula.
Solucion:

fi xi
Sea x = y denotemos di = xi x
N
   
Se tiene fi di = fi (xi x) = fi xi x fi = N x xN = 0

R1.2 Sea P un numero real cualquiera. Demuestrese la expresion (1.3), i.e.


que la diferencia entre la media y P , es la media de las desviaciones
Di = xi P , de los valores de la variable respecto a P .
Solucion:

1  1  1 
N N N
1
xP = xi P = xi N P = (xi P )
N N N N
i=1 i=1 i=1
Si hacemos intervenir las frecuencias absolutas fi , la anterior expresion
se escribe en la forma: 
fi Di
xP =
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

N

fi x2i
2
R1.3 Demostrar la expresion (1.9) = x2
N
Solucion:
 
2 fi (xi x)2 fi (x2i 2xxi + x2 )
= = =
N N
    
fi x2i fi xi 2 fi fi x2i 2 2 fi x2i
= 2 x +x = 2x + x = x2
N N N N N
R1.4 Con la terminologa del Ejercicio R1.2, demostrar la expresion (1.10)
  2
2 fi Di2 fi Di
=
N N

Solucion:
  fi [(xi P ) (x P )]2
2 fi (xi x)2
= = =
N N


 fi (xi P )2 + (x P )2 2(xi P )(x P )
= =
N
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Ejercicios resueltos 33
   fi (xi P )
fi Di2
= + (x P )2 2(x P )
N N
Teniendo ahora en cuenta el Ejercicio R1.2, esta ultima expresion vale:
 fi D2  fi D2  fi Di 2
2
i
(x P ) = i

N N N

R1.5 Una antena ha registrado 15 senales que se han clasicado en 4 grupos:


A,B,C y D. Los datos obtenidos son los siguientes:

B A A D A
D B D A D
D D C D A
(a) Construyase la tabla de distribucion de frecuencias que corresponda.
(b) Cual es la moda?

Solucion:

(a) La tabla de frecuencias resulta

xi fi hi
1
A 5
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

3
2
B 2 15
1
C 1 15
7
D 7 15

= 15 1

(b) Puesto que el grupo D de senales es el de mayor frecuencia abso-


luta, se tiene que M o = D.

R1.6 La calicacion nal de una alumno en una asignatura ha sido 5. Para


obtenerla se han tenido en cuenta las calicaciones de dos parciales, que
han sido 3 y 4, que ponderan igual, y la calicacion de un ejercicio nal
que pondera el 60% de la calicacion nal. Cual ha sido la calicacion
del ejercicio nal?
Solucion: El enunciado sugiere el uso de (1.6).
Si denominamos x al valor de la calicacion del ejercicio nal, segun la
condicion el enunciado, la media ponderada satisface:

5 = p1 3 + p2 4 + 0.6 x

Como p1 + p2 + 0.6 = 1 y p1 = p2 entonces p1 = p2 = 0.2 y en conse-


cuencia 5 = 0.2 3 + 0.2 4 + 0.6 x de lo que se deduce x = 6.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
34 Estadstica Descriptiva

R1.7 Durante cuatro anos se ha adquirido un producto a distintos precios por


unidad: el primer ano a 10 euros, el segundo ano a 12 euros, el tercer
ano a 14 euros y el cuarto ano a 15 euros. Calcular el coste medio de
dicho producto durante los cuatro anos en los 2 supuestos siguientes:

(a) Que el numero de unidades adquiridas al ano es constante.


(b) Que la cantidad de dinero gastado al ano es constante.

Solucion:

(a) Supongamos que se adquieren k unidades del producto en cada


ano. Entonces se tiene
10k + 12k + 14k + 15k
x= = 12.75 euros
4k
(b) Supongamos que se han adquirido k1 , k2 , k3 y k4 unidades en el
primer, segundo, tercer y cuarto ano, respectivamente. Entonces
se tiene que
10k1 = 12k2 = 14k3 = 15k4
de donde se obtiene
5k1
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

k2 =
6
5k1
k3 =
7
2k1
k4 =
3
En consecuencia la media pedida resulta
10k1 + 12k2 + 14k3 + 15k4
x = =
k1 + k2 + k3 + k4
5k1 5k1 2k1
10k1 + 12 + 14 + 15
= 6 7 3 =
5k1 5k1 2k1
k1 + + +
6 7 3
10k1 + 10k1 + 10k1 + 10k1 40 42
= = 12.44 euros
135k1 135
42
Otra forma de resolver este apartado es la siguiente. Sea D el
dinero gastado cada ano. Entonces el numero de unidades adquiri-
D D D D
das en los anos sucesivos es , , , . Por tanto el coste
10 12 14 15
medio es:
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Ejercicios resueltos 35

4D 4
H= D D D D
= 1 1 1 1 = 12.44
10 + 12 + 14 + 15 10 + 12 + 14 + 15

Observese que H es la media armonica de 10, 12, 14 y 15.

R1.8 Realcense los diagramas de barras (de frecuencias absolutas y acumu-


ladas) para las marcas de clase del Ejemplo 1.1.5.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

R1.9 Disponganse adecuadamente las columnas del Ejemplo 1.2.12 de las 150
tallas para obtener la media y la varianza a traves de las desviaciones
Di respecto a P=1.72.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
36 Estadstica Descriptiva

Solucion:

xi fi Di = xi P fi Di Di2 fi Di2
1.60 1 0.12 0.12 0.0144 0.0144
1.62 3 0.10 0.30 0.0100 0.0300
1.64 7 0.08 0.56 0.0064 0.0448
1.66 19 0.06 1.14 0.0360 0.0684
1.68 30 0.04 1.20 0.0016 0.0480
1.70 34 0.02 0.68 0.0004 0.0136
1.72 26 0.00 0.00 0.0000 0.0000
1.74 16 0.02 0.32 0.0004 0.0064
1.76 10 0.04 0.40 0.0016 0.0160
1.78 2 0.06 0.12 0.0036 0.0072
1.80 2 0.08 0.16 0.0064 0.0128

= 150 -3 0.2616


11
fi Di
i=1 3
x=P + = 1.72 + = 1.72 0.02 = 1.70
N 150
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

2

11 
11
fi Di2 fi Di  
2 i=1 i=1 0.2616 3 2
= = 0.0013
N N 150 150

R1.10 Hallese la moda, media, desviacion media y desviacion tpica de las


tallas del Ejemplo 1.1.5

Solucion:
Tomamos como valores xi de la variable, las marcas de clase.

xi fi fi xi xi x (xi x)2 fi (xi x)2 |xi x| fi |xi x|


1.60 70 112.0 0.1425 0.0203 1.4214 0.1425 9.975
1.75 60 105.0 0.0075 0.0001 0.0034 0.0075 0.450
1.85 50 92.5 0.1075 0.0116 0.5778 0.1075 5.375
1.95 20 39.0 0.2075 0.0431 0.8611 0.2075 4.150
P
= 200 348.5 2.8638 19.95
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Ejercicios resueltos 37

Mo = 1.6

xi fi 348.5
x = = = 1.7425
N 200

|xi x| fi 19.95
dm = = = 0.0998
N 200

2 (xi x)2 fi 2.86375
= = = 0.0143
N 200
= 0.1197

R1.11 Considerense de nuevo las tallas del Ejemplo 1.1.5.


(a) Verifquese que la suma de las desviaciones respecto a la media es
0.
(b) Hallese 2 a traves de la expresion (1.9).
(c) Hallese 2 a traves de (1.10) tomando P = 1.75.
Solucion:
Dispondremos sendas tablas adecuadas para los calculos a realizar.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

xi fi xi x fi (xi x) x2i fi x2i


1.60 70 0.1425 9.975 2.5600 179.200
1.75 60 0.0075 0.450 3.0625 183.750
1.85 50 0.1075 5.375 3.4225 171.125
1.95 20 0.2075 4.150 3.8025 76.050

= 200 0 610.125

(a) Observese que la cuarta columna suma 0.


(b) Utilizamos ahora la expresion (1.9) y el valor de x calculado en el
ejercicio anterior se tiene:

fi x2i 610.125
2 = x2 = 1.74252 = 0.0143
N 200
(c) La nueva tabla adecuada con las desviaciones es la que sigue

xi Di = xi 1.75 fi Di Di2 fi Di2


1.60 0.15 10.5 0.0225 1.5750
1.75 0.00 0.0 0.0000 0.0000
1.85 0.10 5.0 0.0100 0.5000
1.95 0.20 4.0 0.0400 0.8000

= -1.5 2.8750
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
38 Estadstica Descriptiva

Utilizando, nalmente, la expresion (1.10):

  2  2
2 fi Di2 fi Di 2.875 1.5
= = = 0.0143
N N 200 200

R1.12 Calculese la media y varianza de la siguiente serie estadstica a traves


de sus marcas de clase agrupandolas primero en intervalos de amplitud
igual a 5 y despues en intervalos de amplitud 10.

49 48 43 42 49 41 42 43 43 44 44 51 53 54 51 59 58
57 56 54 51 54 53 64 62 64 63 62 61 62 68 68 67 66 69

Solucion: En primer lugar dispondremos la tabla de frecuencias resul-


tante agrupando los valores en intervalos de amplitud 5.

Intervalo Marcas de fi xi fi x2i x2i fi


clase (xi )
[40,45[ 42.5 8 340 1806.25 14450
[45,50[ 47.5 3 142.5 2256.25 6768.75
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

[50,55[ 52.5 8 420 2756.25 22050


[55,60[ 57.5 4 230 3306.25 13225
[60,65[ 62.5 7 437.5 3906.25 27343.75
[65,70[ 67.5 5 337.5 4556.25 22781.25

= 35 1907.5 106618.75

Atendiendo a los valores de la tabla se tiene


1907.5
x = = 54.5
35
106618.75
2 = 54.52 = 76
35

Dispondremos ahora la tabla de frecuencias resultante agrupando los


valores en intervalos de amplitud 10.

Intervalo Marcas de fi xi fi x2i x2i fi


clase (xi )
[40,50[ 45 11 495 2025 22275
[50,60[ 55 12 660 3025 36300
[60,70[ 65 12 780 4225 50700

= 35 1935 109275
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Ejercicios resueltos 39

Atendiendo a los valores de la tabla se tiene


1935
x = 55.28
35
109275
2 = 55.282 65.63
35

R1.13 Dada la siguiente tabla de frecuencias, calculense la media aritmetica


x, geometrica G, armonica H y cuadratica M y compruebese que estos
valores verican el orden que se indica en (1.7).

xi fi
2 2
4 4
8 2

Solucion:
Para el calculo de x, G, H y M dispondremos los calculos en la siguiente
tabla
xi fi x2i fi xi fi x2i xfii
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

2 2 4 4 8 1
4 4 16 16 64 1
8 2 64 16 128 14

8 36 200 94

Se tiene entonces que

36
8

8
x= = 4.5 G= 22 44 82 = 216 = 4
8

8 8 32 
H= 2 4 2 = 9 = = 3. 5
2 + 4 + 8 4
9

200 10
M= = =5
8 2
y efectivamente se verica

HGxM

R1.14 Calculese la media aritmetica y la varianza de la siguiente tabla de fre-


cuencias tomando P = 1000 y utilizando las expresiones (1.3) y (1.10).
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
40 Estadstica Descriptiva

xi fi
998 5
999 8
1000 4
1001 3
1002 5

Solucion:
Si disponemos los datos necesarios en una tabla, eligiendo P = 1000,
tendremos

xi Di = xi P fi fi Di Di2 fi Di2
998 2 5 10 4 20
999 1 8 8 1 8
1000 0 4 0 0 0
1001 1 3 3 1 3
1002 2 5 10 4 20

= 25 5 51
de donde se obtiene
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.


fi Di 5
x = P+ = 1000 + = 1000 0.2 = 999.8
N 25
     2
2 fi Di2 fi Di 2 51 5
= = =
N N 25 25
51 1 50
= = =2
25 25 25

R1.15 Una empresa asocia a su cuenta de resultados el siguiente numero a


cada uno de los meses del ano natural

Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
10 10 10 10 12 12 12 9 9 10 12 10

Hallese la media de esos numeros bajo los siguientes supuestos

(a) Ignorando la diferencia de das entre los distintos meses, i.e. todos
ponderan igual.
(b) Asignando a cada mes un peso pi equivalente a su fraccion de das
respecto al ano.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Ejercicios resueltos 41

(c) Asignando a cada mes el peso wi que es su numero de das.


(d) Atribuyendo un peso igual pi [0, 1[ a cada uno de los 8 primeros
meses y una decima mas a cada uno de los 4 ultimos.
(e) Atribuyendo los siguientes pesos wi ordenadamente por meses:

0, 1, 2, 0, 1, 2, 0, 1, 2, 0, 1, 2

Solucion:

(a) La media x esta sujeta como unica ponderacion a las frecuencias


absolutas y por tanto
2 9 + 6 10 + 4 12
x= = 10.5
12
no das mes 
(b) El peso pi de cada mes es y evidentemente pi = 1.
365
As pues, en este caso la media segun (1.6) resulta
31 28 31 30 31 30
x = 10 + 10 + 10 + 10 + 12 + 12 +
365 365 365 365 365 365
31 31 30 31 30 31
+ 12 + 9+ 9+ 10 + 12 + 10 =
365 365 365 365 365 365
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

3833
= 10.504
365
Para realizar los calculos nos podra haber sido de ayuda la si-
guiente tabla de frecuencias absolutas fi con sus pesos pi respec-
tivos.

xi meses de 28 das meses de 30 das meses de 31 das


pi = 28/365 pi = 30/365 pi = 31/365
fi fi fi
9 1 1
10 1 1 4
12 2 2

Segun la tabla hubieramos calculado

30 31 28 30 31
x = 1 9+1 9+1 10 + 1 10 + 4 10 +
365 365 365 365 365
30 31 3833
+ 2 12 + 2 12 = 10.504
365 365 365
que coincide con el resultado anterior.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
42 Estadstica Descriptiva

(c) Atendiendo al enunciado, si el lector escribe segun (1.5) la media


buscada en la forma
31 10 + 28 10 + 31 10 + + 31 10
x=
365
observara que coincide con el apartado (b).
(d) Segun el enunciado si p es el peso de cada uno de los 8 primeros
meses entonces p + 0.1 es el de los ultimos 4 meses. Se habra de
vericar entonces 8p + 4(p + 0.1) = 1 de lo que se deduce que
p = 0.05. As pues el peso de cada uno de los ultimos meses es
0.15.
La tabla de frecuencias absolutas fi con sus pesos pi respectivos es
la siguiente

xi No de meses con No de meses con


pi = 0.05 pi = 0.15
fi fi
9 1 1
10 4 2
12 3 1
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

y usando (1.6) se tiene

x = 1 0.05 9 + 1 0.15 9 + 4 0.05 10 +


+ 2 0.15 10 + 3 0.05 12 + 1 0.15 12 = 10.4

(e) Segun el enunciado podemos establecer para la solucion la siguiente


tabla de frecuencias absolutas fi con sus pesos wi respectivos

xi No de meses con No de meses con No de meses con


wi = 0 wi = 1 wi = 2
fi fi fi
9 1 1
10 3 1 2
12 1 2 1

y utilizando (1.5) se tiene


1 1 9 + 1 2 9 + 1 1 10 + 2 2 10 + 2 1 12 + 1 2 12
x = =
12
125
= = 10.416
12

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Ejercicios propuestos 43

1.4 Ejercicios propuestos


P1.1 En una clase de 20 alumnos se ha preguntado el numero de asignaturas
suspendiada en el primer semestre, y se han obtenido los siguientes
resultados:
3, 3, 3, 2, 2, 2, 3, 3, 2, 4, 4, 2, 4, 4, 3, 2, 3, 4, 4, 1

Construyase la tabla de distribucion de frecuencias que corresponda y


diversos tipos de diagramas.
P1.2 En un estudio sobre la abilidad de un nuevo tipo de termostatos, se
ha realizado una prueba con 50 de ellos. Se haban programado todos
para que se activaran a la misma temperatura (5.5o C), se han obtenido
los siguientes resultados donde cada valor indica la temperatura real a
la que cada termostato se ha activado (se han subrayadao los valores
mayor y menor):

4.4 4.2 3.4 5.3 3.9


4.4 5.1 4.4 5.2 4.0
5.8 4.4 4.4 5.7 4.6
4.4 2.8 4.3 5.0 4.3
3.6 4.6 4.3 4.3 4.4
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

4.1 4.3 4.2 4.0 4.4


4.3 4.0 3.7 5.7 4.2
4.0 4.8 4.6 6.0 3.9
6.0 5.0 4.7 4.3 4.9
4.0 3.9 4.4 4.3 4.8

Agrupense los datos en intervalos adecuados y construyase la tabla de


frecuencias que corresponda.
P1.3 Para estudiar el precio de mercado de un determinado componente
electronico, en euros, se ha tomado una muestra en 30 tiendas y se
han obtenido los siguientes valores
116, 146, 136, 119, 106, 118, 118, 156, 143, 122, 116, 139, 127, 106,
145, 129, 120, 122, 130, 114, 146, 133, 124, 141, 133, 131, 144, 146,
133, 141.

(a) Calculese la media aritmetica, la mediana y la desviacion tpica.


(b) Compruebese que si se agrupan los datos en una tabla con inter-
valos de clase, [100,110[, [110,120[, [120,130[, [130,140[, [140,150[ y
[150,160[, los resultado que se obtienen a partir de la tabla para la
media y desviacion tpica de las marcas de clase no coinciden con
los obtenidos en el apartado (a).
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
44 Estadstica Descriptiva

(c) Dibujese el diagrama de barras de las frecuencias absolutas y ab-


solutas acumuladas, para los datos agrupados en clases.

P1.4 Calculese la media aritmetica de los valores 2,6,5,9 y 2.

(a) Compruebese que, si a cada uno de los valores se le suman 4


unidades, se obtiene otra serie con distinta media pero identica
varianza.

(b) Que relacion existe entre las medias de la serie original y la mo-
dicada?

(c) Si ahora se multiplica cada valor de la serie original por 2 y se


suman 3 unidades, que relacion existe entre las medias y las va-
rianzas de la serie original y la modicada?

P1.5 Se ha medido la velocidad de un coche a lo largo de un viaje de 4 horas.


Los resultados han sido los que se muestran en la siguiente tabla:
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Km/h minutos
Menos de 40 10
Entre 40 y 50 20
Entre 50 y 60 35
Entre 60 y 70 40
Entre 70 y 80 50
Entre 80 y 90 40
Entre 90 y 100 30
Entre 100 y 120 10
Entre 120 y 150 5

Calculese la velocidad media y la desviacion tpica, teniendo en cuenta


las marcas de clase. Realcese el diagrama de barras de las frecuencias
absolutas y absolutas acumuladas para las marcas de clase.

P1.6 Se ha analizado el funcionamiento de 15 circuitos electronicos en condi-


ciones extremas y se ha registrado la duracion en horas en que cada
circuito funciono correctamente, como muestra la siguiente tabla:
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Ejercicios propuestos 45

Circuito Duracion Circuito Duracion


A 31 I 22
B 14 J 20
C 19 K 32
D 17 L 19
E 34 M 27
F 25 N 11
G 17 O 23
H 35

Calculese la media, mediana, desviacion media, cuartiles, intervalo in-


tercuartlico, recorrido, varianza y desviacion tpica de la duracion.

P1.7 En una pequena empresa se paga a los 5 trabajadores 1100 euros men-
suales, los dos encargados cobran 1500 euros/mes y el gerente cobra
6500 euros/mes.

(a) Calculese la media, moda, mediana y desviacion tpica del sueldo


mensual que se cobra en esta empresa.
(b) Valorese el signicado de los resultados obtenidos.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

P1.8 En una comunidad autonoma existen 3 grandes plantas de fabricacion


de componentes electronicos. La primera dispone de 542 trabajadores
con salario mensual medio de 1080 euros. En la segunda planta trabajan
843 empleados con sueldo mensual medio de 860 euros. Finalmente, el
sueldo mensual medio de los 1538 trabajadores de la tercera planta es
de 815 euros. Calculese el sueldo mensual medio y la desviacion tpica.

P1.9 Para la calicacion nal de una asignatura se tienen en cuenta los 3


parciales por igual y la nota del ejercicio global. Un alumno ha obtenido
en los parciales las calicaciones: 7, 8 y 9. Cuanto ha de ponderar el
ejercicio global para que obteniendo un 9 en dicho ejercicio la calicacion
nal sea 8.5?

P1.10 Un alumno ha realizado 3 ejercicios en una asignatura. La calicacion


nal ha sido de 6.4. Sabemos que el tercer ejercicio ponderaba un 60%
de la asignatura y que el primero y segundo ponderan lo mismo. Cual
ha sido la calicacion del tercer ejercicio si la media del primer y segundo
ejercicio es 5.5?

P1.11 Una tienda ha vendido cierto numero de unidades de un producto A


en el primer trimestre del ano y cada mes ha ingresado 5000 euros
como importe de las ventas de dicho producto. El precio medio de cada
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
46 Estadstica Descriptiva

unidad ha sido de 3 euros el primer mes, 2,50 euros el segundo y 2 euros


el tercero. Hallese el precio medio en que se ha vendido cada unidad.

P1.12 Sea xi una serie de datos estadsticos de media x y varianza x2 y sea yi


una nueva serie de manera que yi = axi + b, donde a, b R. Designemos
por y y y2 la media y varianza, respectivamente, de yi . Demuestrese
que

(a) y = ax + b
(b) y2 = a2 x2

P1.13 Supongamos que en una poblacion de N elementos, los valores cuanti-


tativos de una variable estadstica estan agrupados en intervalos de clase
de la forma [Li1 , Li [ y denotemos por fi y Fi las frecuencias absoluta y
absoluta acumulada de la variable en dichos intervalo, respectivamente.
Demuestrese que una expresion adecuada para el calculo de los cuartiles
Qr (r = 1, 2, 3) viene dada por

Li Li1 r
Qr = Li1 + ( N Fi1 )
fi 4
donde [Li1 , Li [ es el intervalo de clase donde queda localizado el cuartil
rN
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Qr , i.e. Fi1 < Fi .


4
Observese que Q2 es la mediana, y para su calculo algunos autores
preeren utilizar la expresion
 
Li Li1 N
M e = Li1 + ( + 0.5) Fi1
fi 2
que se corresponde mas con el concepto de busqueda del valor central
(vease el Ejemplo 1.2.3).

P1.14 Se ha realizado un estudio de la duracion xi en meses de un modulo


de 50 bombillas y ha sido, por intervalos, el que ofrece la tabla adjunta
con sus correspondientes frecuencias fi .

xi fi
[0, 6[ 1
[6, 12[ 1
[12, 18[ 4
[18, 24[ 8
[24, 30[ 16
[30, 36[ 20
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Ejercicios propuestos 47

(a) Hallense las marcas de clase. Construyase una tabla de frecuencias


que incluye las frecuencias acumulada y las columnas que faciliten
el calculo de la media, desviacion media y varianza, atendiendo a
las marcas de clase.
(b) Hallese la media, mediana, cuartiles Q1 y Q3 , la moda M o, inter-
valo intercuartlico, recorrido, desviacion media y desviacion tpica
de los datos, atendiendo a las marcas de clase.
(c) Hallese el intevalo modal, la Mediana y los cuartiles Q1 y Q3
atendiendo a su distribucion agrupada. Hallese el intervalo in-
tercuartlico.

P1.15 En el estudio del ejercicio anterior se ha anadido 3 nuevas bombillas


que se encuentran en los intervalos [18, 24[, [24, 30[ y [30, 36[, constando
ahora la serie de 53 datos. Contestese a los 3 apartados del ejercicio
anterior (a), (b) y (c).

(d) Comparense las diferencias entre medias y entre medianas.


(e) Asimismo comparense las diferencias entre los intervalos intercuar-
tlicos y las desviaciones tpicas.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
48 Estadstica Descriptiva

1.5 Proyecto: Medidas de asimetra y forma


Las medidas de asimetra y de forma, tambien llamadas medidas de dis-
tribucion, nos permiten identicar la forma en que se separan o aglomeran los valores
de una serie de numeros de acuerdo a su representacion graca. Estas medidas tienen
un signicado geometrico relacionado con la forma del histograma.

Medidas de asimetra
Las medidas de asimetra muestran si en la distribucion hay concentracion de
datos en un extremo, superior o inferior.
Consideremos los valores x1 , x2 , . . . , xn , no agrupados, correspondientes a una
variable estadstica X.
En las distribuciones simetricas, la media, la mediana y la moda coinciden y
la distribucion de los valores se separa de la simetra en la medida que la media,
la mediana y la moda dieren entre s. Por ello, la mas comun de las medidas de
asimetra, As,p1 , se basa en la diferencia entre la moda y la media, dado que esta
ultima es la medida mas sensible a los valores extremos.
x Mo
As,p1 =

Cuando la moda no se puede obtener claramente, se puede recurrir a la com-


Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

paracion de la media con la mediana

x Me
As,p2 = 3

Las medidas de asimetra anteriores se conocen como el primer y el segundo
coeciente de Pearson, respectivamente, y su valor es cero en el caso de simetra.
Si la distribucion es asimetrica hacia la derecha, la media sera mayor que la moda y,
por tanto, As,p1 > 0 mientras que si la distribucion es asimetrica hacia la izquierda,
la media sera menor que la moda y, por tanto, As,p1 < 0. Analogamente, para el
segundo coeciente de Pearson, un valor negativo indica asimetra a la izquierda y
un valor positivo, asimetra a la derecha.
Llamaremos coeciente de asimetra de Fisher (As ) al cociente
N
3 1 j=1 (xj x)3
As = 3 = 3 ,
N
donde 3 es el momento (central) de orden 3 denido en la Nota 1.2.13.
Puede demostrarse que el coeciente de asimetra puede calcularse a partir de
la siguiente expresion equivalente

N N
3x  2
3
1 j=1 xj
As = 3 x + 2x3
N N j=1 j
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Proyecto: Medidas de asimetra y forma 49

Si la variable X toma los valores distintos x1 , x2 , . . . , xI , con frecuencias ab-


solutas ordinarias, f1 , f2 , . . . , fI , respectivamente, el coeciente de asimetra viene
dado por

 I I
1 fj 3 fj 2
As = 3 xj 3x xj + 2x3
j=1
N j=1
N

Se puede observar que

(a) Si As = 0, la distribucion es simetrica.

(b) Si As < 0 (asimetra negativa), la distribucion esta desviada a la izquierda, es


decir existe mas cantidad de valores a la izquierda de la media o bien la cola
de la izquierda es mas larga que la de la derecha.

(c) Si As > 0 (asimetra positiva), la distribucion esta desviada a la derecha, es


decir existe mas cantidad de valores a la derecha de la media o bien la cola de
la derecha es mas larga que la de la izquierda.
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

1.5.1 Ejemplo
Consideremos la siguiente tabla de distribucion de frecuencias correspondiente
a la serie numerica xi .

xi fi hi Fi Hi
1 10 0.20 10 0.20
2 4 0.08 14 0.28
3 14 0.28 28 0.56
4 8 0.16 36 0.72
5 6 0.12 42 0.84
6 8 0.16 50 1.00

A partir de la tabla anterior, construimos la siguiente:


Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
50 Estadstica Descriptiva

xi fi fi xi x2i fi x2i x3i fi x3i


1 10 10 1 10 1 10
2 4 8 4 16 8 32
3 14 42 9 126 27 378
4 8 32 16 128 64 512
5 6 30 25 150 125 750
6 8 48 36 288 216 1728

= 50 170 718 3410

La media es
10 + 4 2 + 14 3 + 8 4 + 6 5 + 8 6 170
x= = = 3.4
50 50
y la desviacion tpica
  2
718 170
= = 2.80 = 1.67 .
50 50
Por otra parte
I
1  3410
fj x3j = = 68.2 ,
N j=1 50
por lo tanto, el coeciente de asimetra es
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

1 718 0.336
As = (68.2 3 3.4 + 2 3.43 = 0.336) = = 0.072 .
1.63 50 4.66

Medidas de apuntamiento o curtosis


Las medidas de apuntamiento, tambien llamadas de curtosis, determinan
la concentracion de valores alrededor de la media aritmetica. Si se han realizado N
observaciones, x1 , x2 , . . ., xN , de una variable estadstica, X, llamaremos coeciente
de curtosis1 () a
N
1  (xj x)4 4
= 4 3= 4 3
j=1 N
Si > 0, la distribucion se denomina leptocurtica y el histograma corres-
pondiente esta menos aplastado (mas puntiagudo) que la graca correspondiente a
una distribucion teorica denominada normal (que se estudiara en el captulo 6), que
corresponde a la siguiente funcion
1 (xx)2
f (x) = e 22 .
2

P (xj x)4
En libros clasicos se dena curtosis como 14 N
1
j=1 N
= 44 . En una dis-
tribucion normal, este valor sera 3. La sustraccion del 3 al nal de la formula
que damos se explica como una correccion que se hace a la curtosis clasica de
una distribucion normal para que esta sea igual a cero.
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Proyecto: Medidas de asimetra y forma 51

y esto se traduce en mayor concentracion alrededor de la media. Si, por lo contrario,


< 0, la distribucion se denomina platicurtica y el histograma correspondiente
esta mas aplastado (achatado) que la graca, correspondiente a la distribucion nor-
mal, lo cual signica menor concentracion alrededor de la media. Por ultimo, si
el histograma esta aplastado de forma semejante a la graca correspondiente a la
distribucion normal, se dice que la distribucion es mesocurtica y, en este caso, se
cumple que = 0.

Podemos obtener otra medida de apuntalamiento o curtosis basada en los


cuartiles y percentiles, que se denomina coeciente de curtosis percentlico
Q3 Q1
p = 0.5
P90 P10
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

donde Pi son los percentiles.


Para la distribucion de referencia, normal, p toma el valor 0.263 y las distri-
buciones se denen como leptocurtica si p > 0.263 y platicurtica si p < 0.263.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
52 Estadstica Descriptiva

1.6 Proyecto: Diagrama Box-and-whisker


Box-and-whisker se traduce literalmente del ingles como Caja-y-bigote. Mu-
chos paquetes extadsticos generan este diagrama que contiene bastante informacion
sobre la distribucion de datos de caracter cuantitativo correspondientes a una variable
estadstica continua.
Veamos un ejemplo de diagrama de Box-and-wisker y su signicado. En la
siguiente tabla se detalla el numero de pxeles estropeados observados en una muestra
de 11 monitores LCD:

3, 4, 6, 17, 36, 58, 74, 76, 80, 123, 230

El diagrama de Box-and-whisker correspondiente sera:


Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

La caja (de color gris) comprende los valores que se extienden entre el primer
cuartil Q1 (6), y el tercer cuartil, Q3 (80). La lnea vertical del interior corresponde
a la mediana (58) y la cruz corresponde a la media (62.0833). La distancia entre la
mediana y la media aritmetica es un indicador de asimetra.
Los bigotes se extienden desde el mnimo (3) y el maximo (123) de los valores
de la tabla, teniendo en cuenta que se dejan fuera (cuadrado pequeno) los valores
que dieren del cuartil mas proximo mas de 1.5 veces el rango intercuartlico, cuyo
valor en el ejemplo es 80 - 6 = 74. Como 1.5 74 = 111 < 230 - 80 = 150, el valor
230 queda aislado, por lo tanto el diagrama de Box-and-wisker permite detectar y
representar datos atpicos u anomalos.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Captulo 2

Distribuciones
bidimensionales

2.1 Distribuciones bidimensionales


2.1.1 Variable estadstica bidimensional
Hasta ahora hemos estudiado variables estadsticas o aleatorias aten-
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

diendo a un solo caracter. Nos ocuparemos ahora de estudiar para cada


elemento de un colectivo nito = {a1 , a2 , . . . , aN } un par de caracteres
(x, y) (variables estadsticas bidimensionales) que supondremos siem-
pre cuantitativos, por lo que no hay inconveniente alguno en considerar que
se tratan de dos variables aleatorias discretas, resultantes de un experimento
(fenomeno) aleatorio, que da lugar a lo que denominaremos una distribucion
(estadstica) bidimensional .
En el estudio de una distribucion bidimensional pueden suceder tres
casos:

1. Que los dos fenomenos que se estudian esten ntimamente ligados uno
a otro, en cuyo caso se suele encontrar una expresion matematica que
rige el experimento, por ejemplo la presion P y el volumen V de un gas
a temperatura constante, pues se verica que P V es constante (ley de
Boyle-Mariotte). En tal caso se dice que entre las variables x e y existe
una dependencia funcional.

2. Que ambos fenomenos sean totalmente independientes uno de otro, por


ejemplo el numero de letras del nombre de una persona y su edad.

3. Que entre los dos fenomenos considerados haya una relacion mas o
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
54 Distribuciones bidimensionales

menos fuerte. Por ejemplo, la talla y el peso de las personas. En tal


caso se dice que existe correlacion entre las variables x e y.

En este captulo estudiaremos si entre dos variables estadsticas existe


relacion y veremos con cierto detalle el grado de dicha relacion en un caso que
es muy frecuente en la practica: la regresion lineal.

2.1.2 Representacion graca de una distribucion


bidemensional

Para proceder al estudio estadstico de una variable bidimensional (X, Y )


que en N observaciones ha tomado los distintos valores (xi , yi ), i = 1, 2, . . . , m
se elaborara, en primer lugar, con los datos recogidos, una tabla de doble
entrada. Despues, se puede representar la variable bidimensional por un dia-
grama de barras, mediante un diagrama de ejes cartesianos tridimensional
OXY Z, levantando desde el punto (xi , yi , 0) del plano del suelo (z = 0)
una paralela al eje OZ de altura igual a su frecuencia absoluta (o relativa).
No obstante, el sistema de representacion graca mas usado es el dia-
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

grama de dispersion o nube de puntos, que consiste en un sistema carte-


siano de ejes XY , tal que en cada (xi , yi ) se dibuja un punto (o una mancha
proporcional a la frecuencia absoluta), ya que en muchas ocasiones, de su
simple observacion se obtiene una idea bastante exacta de la relacion entre
las variables x e y.

2.1.3 Ejemplo

Supongamos que las siguientes nubes de puntos corresponden a diversas


distribuciones bidimensionales.

Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Distribuciones bidimensionales 55

De su observacion podemos sacar las siguientes conclusiones para el par


de variables estadsticas que cada caso representa:
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

(a) Dependencia funcional (parabolica)


(b) Dependencia funcional (lineal)
(c) Existe correlacion lineal fuerte
(d) Existe correlacion lineal debil
(e) Son variables independientes

2.1.4 Medidas de centralizacion y dispersion


Dada una distribucion de frecuencias bidimensional correspondiente a
una variable (X, Y ) que ha tomado los N valores
(x1 , y1 ), (x2 , y2 ), . . . , (xN , yN )
(puede que se repitan) sabemos calcular la media, la varianza y la desviacion
tpica de cada una de las dos variables:


N 
N
xi yi
x1 + x2 + + xN i=1 y1 + y2 + + yN i=1
x= = y= =
N N N N
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
56 Distribuciones bidimensionales


N 
N
(xi x)2 (yi y)2
x2 = i=1
y2 = i=1
N N
 
N N
 
 (xi x)2  (yi y)2
 i=1  i=1
x = y =
N N
Se denomina covarianza de la distribucion bidimensional al numero
real


N
(xi x)(yi y)
i=1
xy = (2.1)
N
y es facil demostrar que


N
xi yi
i=1
xy = x y (2.2)
N
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

Finalmente, se denomina coeciente de correlacion lineal entre las


variables x e y, al numero real

xy
r= (2.3)
x y
cuyo signicado se explicara en la seccion 2.2.6.

2.1.5 Nota
En el caso de valores agrupados se recurre, como es habitual, a las mar-
cas de clase para poder calcular los anteriores parametros de la distribucion.

2.1.6 Ejemplo
Consideremos las notas x e y de Matematicas y de Fsica, respectiva-
mente, que han obtenido 10 alumnos, como muestra la siguiente tabla de
frecuencias:

x 3 4 6 8 8 6 4 5 4 7
y 3 4 4 7 8 7 3 5 3 6
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Distribuciones bidimensionales 57

En primer lugar observemos, a continuacion, el correspondiente dia-


grama de dispersion que ya nos sugiere la existencia de alguna relacion entre
ambas variables.

Las media de x e y son:


Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

3+4+6+8+8+6+4+5+4+7
x = = 5.5
10
3+4+4+7+8+7+3+5+3+6
y = =5
10

Para preparar los calculos de las medidas de dispersion ampliaremos la


tabla de frecuencias con las columnas que aparecen en la tabla adjunta:

xi yi xi x yi y (xi x)(yi y) (xi x)2 (yi y)2


3 3 2.5 2 5 6.25 4
4 4 1.5 1 1.5 2.25 1
6 4 0.5 1 0.5 0.25 1
8 7 2.5 2 5 6.25 4
8 8 2.5 3 7.5 6.25 9
6 7 0.5 2 1 0.25 4
4 3 1.5 2 3 2.25 4
5 5 0.5 0 0 0.25 0
4 3 1.5 2 3 2.25 4
7 6 1.5 1 1.5 2.25 1

= 55 50 27 28.5 32
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
58 Distribuciones bidimensionales

En consecuencia, se tiene que:


28.5 32
x2 = = 2.85 y2 = = 3.2
10 10
27 2.7
xy = = 2.7 r= 0.89
10 2.85 3.2

2.1.7 Frecuencias marginales


Cuando el numero N de datos es muy grande, puede suceder que
la variable bidimensional (X, Y ) tome muchos valores repetidos. Supon-
gamos en lo que sigue que los N valores que toma la variable (X, Y ) son
(xi , yj ), i = 1, 2, . . . , r, j = 1, 2, . . . , s. En tal caso, es conveniente disponer la
tabla de frecuencias de manera que aparezca la frecuencia absoluta fij de cada
s  r
(xi , yj ), donde obviamente fij = N . Esta tabla se denomina tabla de
j=1 i=1
correlacion. Para el calculo de valores centrales y de dispersion, es intere-
sante considerar la frecuencia de cada xi correspondiente a la totalidad de
valores (xi , yj ), j = 1, 2, . . . , s, que se denomina frecuencia marginal de xi ,
s
y cuyo valor denotaremos fi = fij
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.

j=1

r
Analogamente, la frecuencia marginal de cada yj es fj = fij
i=1
Las expresiones de los valores centrales y de dispersion quedan de la
siguiente forma:

r 
s
xi fi yj fj
i=1 j=1
x= y=
N N


r 
s
(xi x)2 fi (yj y)2 fj
j=1
x2 = i=1
y2 =
N N

s 
r
(xi x)(yj y)fij
j=1 i=1
xy =
N

2.1.8 Ejemplo
Consideremos las notas x e y de Fsica y Qumica, respectivamente, que
han obtenido 20 alumnos, que muestra la siguiente tabla de frecuencias:
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.
Distribuciones bidimensionales 59

x 3 4 8 8 4 5 9 4 7 5 3 4 6 8 8 6 4 5 4 7
y 3 3 7 8 3 5 7 3 8 5 3 4 4 7 8 7 3 5 3 6

La tabla de correlacion para el total de los 20 alumnos es la siguiente:

yj \ xi x1 =3 x2 =4 x3 =5 x4 =6 x5 =7 x6 =8 x7 =9 fj
y1 =3 2 5 0 0 0 0 0 7
y2 =4 0 1 0 0 0 0 0 1
y3 =5 0 0 3 0 0 0 0 3
y4 =6 0 0 0 1 1 0 0 2
y5 =7 0 0 0 1 0 2 1 4
y6 =8 0 0 0 0 1 2 0 3
fi 2 6 3 2 2 4 1 N=20

Se tiene que

7
xi fi
i=1 32+46+53+62+72+84+91
x = = = 5.6
N 20
Copyright 2011. Editorial de la Universidad Politcnica de Valencia. All rights reserved.


6
yj fj
j=1 37+41+53+62+74+83
y = = = 5.2
N 20


7
(xi x)2 fi
x2 = i=1
=
 N
1
= (3 5.6)2 2 + (4 5.6)2 6 + (5 5.6)2 3 + (6 5.6)2 2 +
20

+(7 5.6)2 2 + (8 5.6)2 4 + (9 5.6)2 1 = 3.44


6
(yj y)2 fj
y2 = i=1
=
 N
1
= (3 5.2)2 7 + (4 5.2)2 1 + (5 5.2)2 3 + (6 5.2)2 2 +
20

+(7 5.2)2 4 + (8 5.2)2 3 = 3.66
Estruch, Fuster, Vicente Domingo, et al. Lecciones de estadstica, Editorial de la Universidad Politcnica de Valencia, 2011. ProQuest
Ebook Central, http://ebookcentral.proquest.com/lib/upilotosp/detail.action?docID=3205284.<br>Created from upilotosp on 2017-11-19 07:53:49.

You might also like