Professional Documents
Culture Documents
ESTADSTICA DESCRIPTIVA
1. Introduccin
La Estadstica descriptiva es la rama de las matemticas que comprende la recopilacin,
tabulacin, anlisis e interpretacin de datos cuantitativos y cualitativos, para tomar decisiones
que se requieran a fin de que el comportamiento de los datos se mantenga dentro de los
parmetros de control establecidos.
La Estadstica descriptiva proporciona un criterio para lograr mejoras, debido a que sus
tcnicas se pueden usar para describir y comprender la variabilidad. Por ejemplo,
consideremos en una caldera de vapor la presin del combustible alimentado y la eficiencia de
la caldera, si utilizamos instrumentos de medicin con la resolucin suficiente, encontraremos
que existe variabilidad en esos parmetros, y mediante el uso de tcnicas estadsticas
podemos realizar mejoras para reducir la variacin en rendimiento de la caldera.
Para poder obtener consecuencias y deducciones vlidas de los datos de un estadstico, es
muy til contar con informacin sobre los valores que se agrupan hacia el centro y sobre que
tan distanciados o dispersos estn unos respecto a otros. Comenzaremos por definir estas
medidas:
La estadstica inferencial se refiere a la estimacin de parmetros y pruebas de hiptesis
acerca de las caractersticas de la poblacin en base a los datos obtenidos con una muestra.
2. MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIN PARA DATOS SIMPLES.
Medidas de tendencia central
Pgina 1 de 9
ESTADSTICA DESCRIPTIVA
xi
xi
x
n
n
xi 19
1.73
n 11
~
x
n 2 n 2 1
2
Ejemplo 2: Para el ejemplo anterior cul es la mediana?
Ordenando los datos de mayor a menor se obtiene:
1.60,1.65,1.67,1.67,1.70,1.73,1.74,1.79,1.79,1.82,1.84;
Como tenemos 11 datos el nmero es non por lo que (n+1)/2 = 12/2 = 6, buscando el
nmero que ocupa la sexta posicin en los datos ordenados encontramos el valor de la
mediana
~
x 1.73
Si tomamos la suma de diferencias de cada valor respecto a su media y las sumamos se tiene:
(-2) + (-1) + (0) + (1) +(2) = 0
Por lo que tomando diferencias simples no es posible determinar la dispersin de los datos.
Pgina 2 de 9
ESTADSTICA DESCRIPTIVA
( xi x ) 2
n
s2
( xi x ) 2
n 1
( xi x ) 2
n
( xi x ) 2
s
n 1
s
(100)
X
CVt
12.14
(100) 12.05%
78.7
Pgina 3 de 9
ESTADSTICA DESCRIPTIVA
CVs
2
(100) 20%
10
Por tanto la dispersin de las temperaturas es mayor que la de los tiempos de de respuesta, es
posible comparar estas dispersiones con el CV aunque los dos conjuntos de datos sean
completamente dismbolos.
Ejemplo 4: La resistencia al rompimiento de dos muestras de botellas es la siguiente:
Muestra 1:
Muestra 2:
230
190
250
228
245
305
258
240
265
265
240
260
Muestra 2
x 248
x 248
Suma(Xi -
)2 = 790
n-1=5
Suma(Xi -
)2 = 7510
n-1 = 5
790
5
s=
7510
5
= 12.56
s=
= 38.75
Rango = 305 190 = 115
CV = 38.75/248*100 = 15.625
Pgina 4 de 9
ESTADSTICA DESCRIPTIVA
L p ( n 1)
P
100
Donde:
Lp es el sitio del percentil deseado en una serie ordenada
n es el nmero de observaciones
P es el percentil deseado
Por ejemplo para el conjunto de datos siguiente:
3
4
7
9
10
10
12
14
15
17
19
20
21
25
27
27
29
31
31
34
34
34
36
37
38
38
39
43
45
47
48
48
52
53
56
56
59
62
63
64
67
67
69
72
73
74
74
76
79
80
L35 (50 1)
35
17.85
100
O sea que el percentil 35 est al 85% del trayecto comprendido entre la observacin 17 que es
29 y la observacin 18 que es 31 o sea L35 = 29 + (0.85)(31-29) = 30.7. Por tanto el 35% de
las observaciones estn por debajo de 30.7 y el 65% restante por encima de 30.7.
De la misma forma los percentiles 25, 50 y 75 proporcionan la localizacin de los cuartiles Q1,
Q2 y Q3 respectivamente.
Q1: es el nmero que representa al percentil 25 (hay 25% de los datos por debajo de
este).
Q2 o Mediana: es el nmero que representa al percentil 50 (hay 50% de los datos por
debajo de este).
Q3: es el nmero que representa al percentil 75 (hay 75% de los datos por debajo de
este).
Rango o Recorrido intercuartlico: es la diferencia entre Q1 y Q3.
Ejemplo 6
Pgina 5 de 9
ESTADSTICA DESCRIPTIVA
17.87
18.03
18.69
19.94
20.20
20.31
24.19
28.75
30.36
30.63
31.21
32.44
32.89
33.51
33.76
34.58
35.58
35.93
36.08
36.14
36.80
36.92
37.23
37.31
37.64
38.29
38.65
39.02
39.64
40.41
40.58
40.64
43.61
44.06
44.52
45.01
45.08
45.10
45.37
45.70
45.91
46.50
47.09
47.21
47.56
47.93
48.02
48.31
48.55
48.62
48.98
49.33
49.36
49.95
50.02
50.10
50.10
50.72
51.40
51.41
51.77
52.43
53.22
54.28
54.71
55.08
55.23
55.56
55.87
56.04
56.29
58.18
59.03
59.37
59.61
59.81
60.27
61.30
62.53
62.78
62.98
63.03
64.12
64.29
65.44
66.18
66.56
67.45
67.87
69.09
69.86
70.37
71.05
71.14
72.46
72.77
74.03
74.10
76.26
76.69
77.91
78.24
79.35
80.32
81.21
82.37
82.79
83.31
85.83
88.67
89.28
89.58
94.07
94.47
94.60
94.74
96.78
n
Paso 3: Seleccionar el nmero de columnas, mediante
el histograma se compone de 11 columnas
130 11.4 11
. Por lo cual
Paso 4: Calcular el tamao del intervalo de clase ( C ), dividiendo el rango entre el nmero de
columnas: C =
94.37
8.58 9
11
Paso 5: Calcular los limites de clase de cada intervalo: [0-8], [ 9-17], etc., considerando que el
tamao del intervalo representa la diferencia entre dos lmites de clase adyacentes ya sean
inferiores o superiores.
Paso 6: Contar el nmero de valores que caen en cada intervalo utilizando una hoja de
registro, de esta manera se obtiene la frecuencia para cada intervalo.
Tabla 1.
Columna
1
Intervalo
0 -8
Registro de frecuencias
IIIII
Pgina 6 de 9
ESTADSTICA DESCRIPTIVA
9-17
IIIII
IIII
18-26
IIIII
27-35
IIIII
IIIII
36-44
IIIII
IIIII
II
45-53
IIIII
IIIII
IIIII
IIIII
54-62
IIIII
IIIII
IIIII
III
63-71
IIIII
IIIII
III
72-80
IIIII
IIIII
10
10
81-89
IIIII
III
11
90-98
IIIII
11
17
IIIII
III
28
18
13
Histograma
30
Frecuencia
25
20
15
Frecuencia
10
5
0
9
18
27
36
45
54
63
72
81
90
99
Clase
Xg
fM
n
Donde
f es la frecuencia o nmero de observaciones en cada clase
M es el punto medio de cada clase, se determina como el valor medio entre los lmites de
clase.
n es el tamao de la muestra o la suma de todas las frecuencias de las clases
Ejemplo:
Clase
acumulada
(Presin)
Frecuencia de clase
Frecuencia
(das)
fM
50-59
60-69
70-79
80-89
3
7
18
12
54.5
64.5
74.5
84.5
163.5
451.5
1341.0
1014.0
3
10
28
40
Pgina 7 de 9
ESTADSTICA DESCRIPTIVA
90-99
100-109
Xg
8
2
50
94.5
104.5
756.0
209.0
3935.0
48
50
3935
78.7
50
Primero se identifica la clase donde se encuentra la mediana cuya F es >= n / 2, en este caso
la clase de 70 a 79 con punto central de clase = 74.5.
n/2 F
~
50 / 2 10
Mediana X Lmd
(C ) 70
10 78.33 pasajeros
f
18
md
Donde:
Lmd es el lmite inferior de la clase de la mediana cuya F es >= n / 2 o sean (70)
F es la frecuencia acumulada de la clase que antecede a la clase de la mediana (10)
Fmd es la frecuencia de la clase de la mediana (18)
C es el intervalo de clase de la mediana que es la diferencia entre dos lmites de clase (10)
Moda de datos agrupados:
Primero se halla la clase que tenga la frecuencia ms alta, en este caso la clase 70 a 79.
Da
18 7
(C ) 70
10 76.47
(18 12) (18 7)
Db Da
Moda Lmo
Donde:
Lmo es el lmite inferior de la clase modal con la frecuencia ms alta (70).
Da es la diferencia entre la frecuencia de la clase modal y la clase que la antecede (18 7 =
11)
Db es la diferencia entre la frecuencia de la clase modal y la clase que le sigue (18 12 = 6)
C es el intervalo de la clase modal ( 80 70 = 10 )
Varianza y desviacin estndar de datos agrupados:
fM
nX 2
n 1
s s2
Para los datos anteriores se tiene:
Clase
Frecuencia de clase
(Presin)
(das)
M
50-59
8910.75
60-69
29121.75
70-79
99904.50
80-89
85683.00
fM
M2
54.5
163.5
2790.25
64.5
451.5
4160.25
18
74.5
1341.0
5550.25
12
84.5
1014.0
7140.25
Pgina 8 de 9
fM2
ESTADSTICA DESCRIPTIVA
90-99
71442.00
100-109
21840.50
94.5
756.0
8930.25
104.5
209.0
10920.25
3935.0
3935
78.7
50
316902.50 50(78.7) 2
2
s
147.31 pasajeros
49
s 12.14 pasajeros
Xg
Pgina 9 de 9
316902
.50