Professional Documents
Culture Documents
Ventajas de la media aritmtica:
- Es til cuando los datos estn distribuidos en forma normal o simtrica.
- Es de gran estabilidad porque toma en cuenta todos los datos.
- Nos permite probar parmetros en inferencia estadstica.
Desventajas de la media aritmtica:
Mg. Mara Vallejos Atalaya
68
- Puede ser afectado por valores extremos.
- Cuando los datos agrupados tienen clases abiertas en los extremos, no es recomendable calcular
el promedio.
5.2.2. Mediana (Me)
Es el estadstico que representa el punto medio de los datos en el cual cae el 50% de puntuaciones. Se
obtiene de acuerdo a lo siguiente:
a) Mediana para datos simples (en serie):
Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la serie
es par); del conjunto de datos previamente ordenados en forma creciente.
(*) La mediana se utiliza tambin en variables ordinales
Ej: Se tiene la siguiente informacin sobre el nmero de alumnos repitentes por aos de estudios de la
carrera de contabilidad en la UPeU.
AOS f
i
1
F
i
2
Primero
Segundo
Tercero
Cuarto
Quinto
25
14
6
9
2
25
39
45
54
56
Clase
mediana.
Total 56
Proceso:
1. Se calcula la suma de las frecuencias absolutas simples entre 2 as:
2
n
=
56
28
2 2
f
= =
2. El valor inmediatamente superior o igual a 28 se busca en la columna de la tabla que corresponde
a la frecuencia absoluta acumulada F
i
(en este ejemplo corresponde a 39, porque 25 es menor
que 28).
3. Luego se observa la primera columna donde se encuentra la variable, en la fila donde se observ el
nmero 39, el valor de la variable que se encuentra en esa fila corresponde a la mediana.
Me = Segundo.
Interpretacin: La mitad de los estudiantes repitentes lo hacen como mximo hasta segundo ao,
aproximadamente la otra mitad repiten categoras superiores al segundo ao.
b) Mediana para datos agrupados:
Cuando los datos se encuentran agrupados en una tabla de distribucin de frecuencias, la mediana se
encuentra utilizando la siguiente frmula:
1
inf
2
i
i
n
F
Me L c
f
| |
|
\ .
= +
Donde
1
f
i
: frecuencia absoluta simple
2
F
i
: frecuencia absoluta acumulada.
Mg. Mara Vallejos Atalaya
69
inf
L : Lmite inferior del intervalo que contiene a la mediana
c : Amplitud del intervalo
n : Nmero total de datos
1 i
F
\
|
A + A
A
+ =
2 1
1
inf
c L Mo
Donde
inf
L : Lmite inferior del intervalo que contiene a la moda
Mg. Mara Vallejos Atalaya
70
c : Amplitud del intervalo
con
1 1 i i
f f
A = ;
2 1 i i
f f
+
A =
Ventajas de la moda:
- No est afectada por valores extremos.
- Puede usarse cuando los datos agrupados tienen clases abiertas en los extremos.
- Se usa para variables que pertenecen a la escala nominal.
Desventajas de la moda:
- No es representativa a menos que la distribucin contenga un gran nmero de datos y exista
significativa repeticin de alguno de ellos.
- Muchas veces la serie no tiene moda porque ningn valor se repite, en ese caso se dice que la
informacin es unimodal.
- Cuando la serie tiene 2 modas, se dice que la informacin es bimodal, y si tiene ms de 2 modas,
la informacin es multimodal. En estos casos se hace difcil su interpretacin y comparacin, por lo
tanto, no se considera una medida representativa
Ejemplo:
Correspondiente a datos simple (informacin en serie):
Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de
Ciencias Contables y Administrativas:
Edad :
X
i
: 18, 20, 23, 17, 18, 19, 23, 18
Calcular la media, mediana y moda e interpretar sus resultados.
Solucin:
Media
18 20 23 17 18 19 23 18 156
19.5 20
8 8
x
x
n
+ + + + + + +
= = = = =
Interpretacin
La edad promedio de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas
es de 20 aos.
Mediana
Me: Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la
serie es par); del conjunto de datos previamente ordenados en forma creciente.
En este caso la serie es par, por lo tanto, se procede del siguiente modo:
1 Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23
2 Se particiona la serie por la mitad
17, 18, 18, 18, 19, 20, 23, 23
Mg. Mara Vallejos Atalaya
71
3 la mediana ser la semisuma de los dos valores centrales, por ser la serie par, es decir 8 datos.
18 19
18.5 19
2
Me
+
= = =
Interpretacin:
La mitad de los de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas
tiene como mximo 19 aos, aproximadamente la otra mitad tienen ms de 19 aos.
Moda
Es el valor que ms se repite.
As, en nuestra base de datos.
1 Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23
2 Se toma el valor que ms se repite.
En nuestro ejemplo el 18 se repite 3 veces.
Mo = 18
Interpretacin:
La mayora de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas tiene de
20 aos de edad.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas):
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos la media, mediana y moda para datos agrupados.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmites de
clases
X
i
f
i
F
i
X
i
f
i
X
i
2
fi
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
91
97
103
109
115
121
127
9
6
Mo 11
5
8
3
8
9
15
Me 26
31
39
42
50
819
582
1133
545
920
363
1016
74529
56454
116699
59405
105800
43923
129032
Total 50 5378 585842
Solucin:
La columna de las marcas de clase denotada por Xi, se obtiene por la formula dada anteriormente en la
Unidad 1.
Mg. Mara Vallejos Atalaya
72
La columna de X
i
f
i
: se obtiene multiplicando valor por valor la columna de las marcas de clase
denotada por Xi por las frecuencias absolutas simple denotada por f
i
:
As:
X
1
f
1 =
91 x 9 = 819
X
2
f
2 =
97 x 6 = 582
X
3
f
3 =
103 x 11 = 1133
X
7
f
7 =
127 x 8 = 1016
Observacin: Las sumas de cada columna se encuentran en la fila que corresponde al total (al final de
las columnas).
La clase mediana se ubica con las frecuencias absolutas acumuladas.
La clase modal se ubica con las frecuencias absolutas simples.
Media:
819 582 1133 545 920 363 1016
9 6 11 5 8 3 8
5378
107.56 107
50
i i
i
x f
x
f
+ + + + + +
= =
+ + + + + +
= = =
Interpretacin:
El cociente de inteligencia promedio de los alumnos de la Universidad Peruana Unin es de
aproximadamente 107 puntos.
Mediana:
Proceso:
1. Ubicamos la clase o fila mediana (intervalo que contenga la mediana):
Lugar de Me: n/2= 50/2= 25 (25 avo. lugar)
Analizando, la mediana se encuentra en la 4ta. Clase.
Este valor se ubica en la columna de las frecuencias acumuladas (F
i
) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 25.
2
LCS LCI
Xi
+
=
127
2
130 124
.
.
103
2
106 100
97
2
100 94
91
2
94 88
7
3
2
1
=
+
=
=
+
=
=
+
=
=
+
=
X
X
X
X
Mg. Mara Vallejos Atalaya
73
En nuestro ejemplo corresponde a la cuarta fila, pues su frecuencia acumulada es F
4
= 31 y es el
inmediatamente superior a 25.
La cuarta fila es la clase mediana y de all se considera los datos que van a ser reemplazados en la
frmula.
2. Utilizando la frmula:
1
inf
2
i
i
n
F
Me L c
f
| |
|
\ .
= +
L
inf
: Lmite inferior del intervalo de la clase mediana = 100
n : Nmero total de datos = 50
F
i-1
: Frecuencia absoluta acumulada anterior a la clase mediana = 15
f
i
: Frecuencia absoluta simple de la clase mediana = 11
c : Amplitud intervlica: 6
La mediana ser:
50
15
2
100 6
11
Me
| |
|
\ .
= + = 105.45
Interpretacin:
La mitad de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 105 puntos, aproximadamente la otra mitad tienen ms de 105 puntos.
Moda
Proceso:
1. Se ubica la clase o fila modal (donde se encuentra la moda), ubicando en la columna de las
frecuencias absolutas simples (f
i
) el mayor valor.
En nuestro ejemplo el mayor valor de las frecuencias absolutas simples es f
3
= 11,
En nuestro ejemplo, la clase modal o fila donde se encuentra la moda es la tercera fila porque en
ella se encuentra el mayor valor de las frecuencias absolutas simples.
2. Utilizando la frmula:
|
|
.
|
\
|
A + A
A
+ =
2 1
1
inf
c L Mo
hallando:
1 1 i i
f f
A = = 11- 6= 5
2 1 i i
f f
+
A = = 11-5= 6
Mg. Mara Vallejos Atalaya
74
5
100 6
5 6
Mo
| |
= +
|
+
\ .
= 102.72
Interpretacin:
La mayora de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia de
103 puntos.
Mg. Mara Vallejos Atalaya
75
Sesin N 6
MEDIDAS DE POSICIN
6.1. MEDIDAS DE POSICIN
Son estadgrafos que dividen a una serie de datos en cuatro, diez o cien partes iguales.
Estas medidas son:
- Cuartiles
- Deciles
- Percentiles
6.1.1. Cuartiles (Q
i
)
Son estadgrafos que dividen a la informacin en cuatro partes iguales, donde cada uno de ellos es el
25% de la informacin.
Esquemticamente se tiene:
Q
1
25%
Q
2
25% Q
3
25%
25%
total 100%
Los cuartiles se calculan con la frmula siguiente:
1
inf
( )
4
i
j
i
j n
F
Q L c
f
(
(
= +
(
(
Donde:
j : 1,2 3
L
inf
: Lmite inferior del intervalo de la clase cuartlica.
n : Nmero total de datos.
F
i-1
: Frecuencia absoluta acumulada anterior a la clase cuartlica.
f
i
: Frecuencia absoluta simple de la clase cuartlica.
c : Amplitud intervlica.
6.1.2. Deciles (D
i
)
Son estadgrafos que dividen a la informacin en diez partes iguales, donde cada uno de ellos es el
10% de la informacin.
Mg. Mara Vallejos Atalaya
76
Esquemticamente se tiene:
D
1
10%
10% D
9
. . .
10%
10%
Total 100%
Los deciles se calculan con la frmula siguiente:
1
inf
( )
10
i
j
i
j n
F
D L c
f
(
(
= +
(
(
Donde:
j : 1,2, 3, 9
L
inf
: Lmite inferior del intervalo de la clase declica.
n : Nmero total de datos.
F
i-1
: Frecuencia absoluta acumulada anterior a la clase declica.
f
i
: Frecuencia absoluta simple de la clase declica.
c : Amplitud intervlica.
6.1.3. Percentiles (Pi )
Son estadgrafos que dividen a la informacin en cien partes iguales, donde cada uno de ellos es el 1%
de la informacin.
Esquemticamente se tiene:
P
1
1%
1%
P
99
. . .
1%
1%
total 100%
Los percentiles se calculan con la frmula siguiente:
1
inf
( )
100
i
j
i
j n
F
P L c
f
(
(
= +
(
(
Donde:
D
2
P
2
Mg. Mara Vallejos Atalaya
77
j : 1,2, 3, 99
L
inf
: Lmite inferior del intervalo de la clase percentlica.
n : Nmero total de datos.
F
i-1
: Frecuencia absoluta acumulada anterior a la clase Percentlica.
f
i
: Frecuencia absoluta simple de la clase percentlica.
c : Amplitud intervlica.
Observacin:
Generalmente se calculan las medidas de posicin para datos agrupados, pues se tiene una gran
cantidad de informacin.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas)
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos los cuartiles 1 y 3, los deciles 2 y 8 y los percentiles 10 y 90.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES
DEL CI DE 50 ESTUDIANTES DE LA UPeU
Intervalo de clase Xi fi Fi
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
91
97
103
109
115
121
127
9
6
11
5
8
3
8
9
15
26
31
39
42
50
P10
Q1,D2
Q3,D8
P90
Total 50
Solucin
Cuartil 1 (Q
1
)
Proceso
1. Se ubica la clase o fila cuartlica (donde se encuentra el primer cuartil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.
(1)50
12.5
4 4
i f
= =
2. Este valor se ubica en la columna de las frecuencias acumuladas (F
i
) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 12.5.
En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F
2
= 15 y es el
inmediatamente superior a 12.5.
3. La segunda fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en
la frmula.
1
inf
( )
4
i
j
i
j n
F
Q L c
f
(
(
= +
(
(
Mg. Mara Vallejos Atalaya
78
L
inf
: Lmite inferior del intervalo de la clase cuartlica = 94
n : nmero total de datos = 50
F
i-1
: Frecuencia absoluta acumulada anterior a la clase cuartlica = 9
i
f : Frecuencia absoluta simple de la clase cuartlica = 6
c : amplitud intervlica: = 6
Cuartil 1 ser:
1
(1)50
9
4
94 6 97.5
6
Q
(
(
= + =
(
(
Interpretacin:
El 25% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 98 puntos, aproximadamente el 75% restante tienen ms de 98 puntos.
Cuartil 3 (Q
3
)
Proceso
1. Se ubica la clase o fila cuartlica (donde se encuentra el tercer cuartil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.
( ) (3)50
37.5
4 4
j n
= =
2. Este valor se ubica en la columna de las frecuencias acumuladas (F
i
) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 37.5.
En nuestro ejemplo corresponde a la quinta fila, pues su frecuencia acumulada es F
5
= 39 y es el
inmediatamente superior a 37.5.
3. La quinta fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en la
frmula.
L
inf
: Lmite inferior del intervalo de la clase cuartlica = 112
n : nmero total de datos = 50
F
i-1
: Frecuencia absoluta acumulada anterior a la clase cuartlica = 31
i
f : Frecuencia absoluta simple de la clase cuartlica = 8
c : Amplitud intervlica: = 6
El cuartil 3 ser:
(3)(50)
31
4
3 112 6 116.87
8
Q
(
(
= + =
(
(
Interpretacin:
El 75% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 117 puntos, aproximadamente el 25% restante tienen ms de 117 puntos.
Mg. Mara Vallejos Atalaya
79
Decil 2 (D
2
)
Proceso:
1. Se ubica la clase o fila declica (donde se encuentra el segundo decil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu decil se desea encontrar; ya sea el 1, 2, , 9.
( ) (2)50
10
10 10
j n
= =
2. Este valor se ubica en la columna de las frecuencias acumuladas (F
i
) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 15.
En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F
2
= 15 y es el
inmediatamente superior a 10.
3. La segunda fila es la clase declica y de all se considera los datos que van a ser reemplazados en
la frmula.
L
i
: Lmite inferior del intervalo de la clase declica = 94
n : Nmero total de datos = 50
F
i-1
: Frecuencia absoluta acumulada anterior a la clase declica = 9
i
f : Frecuencia absoluta simple de la clase declica = 6
c : Amplitud intervlica: = 6
El decil 2 ser:
2
(2)(50)
9
10
94 6 95
6
D
(
(
= + =
(
(
Interpretacin:
El 20% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 95 puntos, aproximadamente el 80% restante tienen ms de 95 puntos.
Percentil 10 (P
10
)
Proceso
a. Se ubica la clase o fila percentlica (donde se encuentra el percentil 10), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2, ,
99.
( ) (10)50
5
100 100
j n
= =
b. Este valor se ubica en la columna de las frecuencias acumuladas (F
i
) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 5.
En nuestro ejemplo corresponde a la primera fila, pues su frecuencia acumulada es F
2
= 9 y es el
inmediatamente superior a 5.
c. La primera fila es la clase percentlica y de all se considera los datos que van a ser remplazados
Mg. Mara Vallejos Atalaya
80
en la frmula.
L
i
: Lmite inferior del intervalo de la clase percentlica = 88
n
: Nmero total de datos = 50
F
i-1
: Frecuencia absoluta acumulada anterior a la clase Percentlica = 0
i
f : Frecuencia absoluta simple de la clase percentlica = 9
c : Amplitud intervlica: = 6
El percentil 10 ser:
10
(10)(50)
0
100
88 6 91.3
9
P
(
(
= + =
(
(
Interpretacin:
El 10% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 91.3 puntos, aproximadamente el 90% restante tienen ms de 91.3 puntos.
EJERCICIOS PROPUESTOS
1) Los datos siguientes corresponden al peso en Kg. de 10 alumnos.
40.8 52.5 49.2 40.8 62.2
52.5 58.0 60.0 40.8 52.5
Calcular:
a) La media, la mediana y la moda.
b) Cul de los 3 indicadores (en (a)) miden con mayor precisin el centro de los datos?
2) El nmero de autos vendidos por cada uno de 10 vendedores de una distribuidora de
automviles en un mes particular, dispuestos en orden ascendente es: 2, 4, 7, 10, 10, 10,
12, 12, 14, 15.
Determine e interprete:
a) La media b) La mediana c) La moda
3) La media mnima para aprobar una asignatura es 11. Si un estudiante obtiene la notas 13.5, 14,
9.5, 12, 8.5, 8, 11.5, 10 en los trabajos mensuales de la asignatura en cuestin, el estudiante
fue aprobado?
4) A Continuacin se dan las notas de 50 alumnos.
60 85 33 52 65
77 84 65 74 57
71 35 81 50 35
64 74 47 54 68
80 61 41 91 55
73 59 53 77 45
41 55 78 48 69
85 67 39 60 76
94 98 66 66 73
42 65 94 88 89
Se pide:
Mg. Mara Vallejos Atalaya
81
a) Obtener la distribucin de frecuencias
b) Determinar: la media, mediana y moda
c) Determinar el 3er cuartil, 7mo decil y 55avo percentil.
5) A continuacin tenemos la distribucin del nmero de accidentes por da durante 43 das, en
cierta autopista.
N de accidentes 0 1 2 3 4
N de das 10 15 10 5 3
a) Determinar: la media, mediana y moda
b) Cul es el porcentaje de das en que se tuvo dos o ms accidentes por da?
6) Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en cm)
151 152 154 155 159 159 160 161 161 161 161 162
163 163 164 165 166 165 166 166 166 166 166 167
167 167 167 168 168 168 168 168 168 168 168 168
168 169 169 169 169 169 169 169 169 170 170 170
170 170 170 170 171 171 171 172 172 172 173 173
173 173 174 174 174 175 175 175 176 176 176 176
176 177 177 177 177 178 178 178 179 179 180 180
180 181 181 181 181 182 182 182 183 184 185 186
187 188 189 190
Calcular las medidas de tendencia central, posicin, dispersin y de forma. Interpretar los
resultados.
7) Obtenga la media y la mediana para cada uno de los siguientes conjuntos de nmeros:
1) 1, 5, 9, 13, 17 2) 1, 3, 9, 27, 81 3) 1, 4, 9, 16, 25
a) Para cul de estos conjuntos de datos son iguales la media y la mediana?
b) Cul medida es la misma para los 3 conjuntos?
c) Cul de estos conjuntos tiene una moda?
8) Los siguientes datos representan el nmero de obreros ausentes en cierta empresa
manufacturera, en 10 das consecutivos de trabajo:
5, 3, 0, 4, 3, 1, 4, 2, 20, 0
a) Encontrar la media, la mediana y la moda.
b) Interpretar sus resultados.
9) El siguiente cuadro muestra la distribucin de edades de casos de una cierta enfermedad
reportada durante un ao en una ciudad del estado.
EDAD Nmero de casos
5 - 14
15 - 24
25 - 34
35 - 44
45 - 54
55 - 64
5
10
20
22
13
5
Total 75
a) Determinar e interpretar las medidas de tendencia central: media, mediana, moda.
b) Determinar e interpretar las medidas de Posicin: Cuartiles (Q1 y Q3) Deciles (D3 y D4) y
Percentil (P14 y P94).
Mg. Mara Vallejos Atalaya
82
10) En la tabla siguiente se muestra los puntajes obtenidos por 36 alumnos en una prueba de
razonamiento matemtico:
Y
i-1
- Y
i
fi hi Fi Hi
Yi
42 - 51
51 - 60
60 - 69
69 - 78
78 87
87 - 96
11 0.35
10 0.28
2 0.055
5 0.14
3 0.08
5 0.14
a) Calcular la media aritmtica, mediana y moda e interprete los datos
b) Calcular Q
1
, P
90
, D
9
e interprete
c) Graficar el histograma y polgono de frecuencia
Mg. Mara Vallejos Atalaya
83
Autoevaluacin
CONCEPTUAL
1. Seale con una V si es verdadero o F si es falso en los siguientes
enunciados:
a) ( ) La mediana es una medida de tendencia central.
b) ( ) La moda indica el valor que se repite con mayor frecuencia.
c) ( ) Los cuartiles dividen a la informacin en 10 partes iguales.
d) ( ) La media se calcula sumando todos los valores de la variable.
e) ( ) Los percentiles dividen la informacin en cien partes iguales.
PROCEDIMENTAL
2. Establezca las diferencias entre las medidas de tendencia central: media,
mediana y moda.
3. El nmero de autos vendidos por cada uno de 10 vendedores de una
distribuidora de automviles en un mes particular, dispuestos en orden
ascendente es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15.
Determine e interprete:
a) La media b) La mediana c) La moda
4. La siguiente tabla muestra la distribucin de edades de casos de una cierta
enfermedad informados durante un ao en una provincia.
Edad Nmero de casos
[5 - 15>
[15 - 25>
[25 - 35>
[35 - 45>
[45 - 55>
[55 - 65>
5
10
20
22
13
5
total 75
a) Calcular la media, la mediana, la moda. Interprete.
b) Calcular el Q
1
, Q
3
, D
2
, D
5
, P
8
, P
10
ACTITUDINAL
5. Para conocer la edad ms frecuente de tus compaeros de clase, qu
medida de tendencia central utilizaras?, qu procedimiento efectuaras
para su clculo? y cmo ensearas a tus subordinados para conocer la
edad ms frecuente de los que siempre llegan tarde?
Mg. Mara Vallejos Atalaya
84
Sesin N 7
MEDIDAS DE DISPERSIN
7.1. Medidas de dispersin
Son estadgrafos que cuantifican el grado de concentracin o de dispersin de los valores de la
variable en torno a un promedio o valor central de la distribucin. Las medidas de dispersin se
necesitan para dos propsitos bsicos:
a) Para verificar la confiabilidad de los promedios y
b) Para que sirva como base para el control de la variacin de la misma.
Las principales medidas de dispersin o variabilidad son:
- Varianza
- Desviacin estndar
- Coeficiente de variacin
7.1.1. Varianza (s
2
)
Es una medida que cuantifica el grado de dispersin o de variacin de los valores de una variable
cuantitativa con respecto a su media aritmtica.
Es el promedio de la suma de los cuadrados de las desviaciones de la variable respecto a su media.
Cuando el resultado de la varianza es un valor grande, se dice que los datos se encuentran bastantes
dispersos o alejados de la media aritmtica; si el resultado es bastante pequeo los datos estarn
bastante cercanos o concentrados alrededor de la media aritmtica.
Se obtiene de acuerdo a lo siguiente:
a) Varianza para datos simples (en serie):
2 2
2
( )
1
x n x
s
n
Donde:
=
2
x Cada valor de la muestra se eleva al cuadrado luego se suma todos los valores.
n = Tamao de la muestra. (nmero de datos).
x = Media para datos simples.
b) Varianza para datos agrupados:
2 2
2
( )
1
Y f n Y
s
n
=
Donde:
2
Y f
= Cada marca de clase elevado al cuadrado y multiplicado por su frecuencia absoluta simple,
luego se suman todos los valores.
n = Tamao de la muestra.
Mg. Mara Vallejos Atalaya
85
Y = Media para datos agrupados.
Observacin: La varianza es una medida terica; no tiene interpretacin prctica.
7.1.2. Desviacin estndar (s )
Es la raz cuadrada de la varianza. Esta medida tiene interpretacin prctica.
2
s s =
Es uno de los estadsticos de mayor uso en el cual las unidades de la variable ya no estn elevados al
cuadrado sino estn en unidades originales.
7.1.3. Coeficiente de variacin (c.v. % )
Es el cociente de la desviacin estndar y la media aritmtica, expresado en porcentaje. As:
100 . %
x
s
cv =
- El coeficiente de variacin se usa para saber si un conjunto de datos es homogneo o heterogneo
(concentrados o dispersos). Para esto se utiliza el siguiente criterio:
Si C.V. < 0.33 Datos HOMOGNEOS
Si C.V. 0.33 Datos HETEROGNEOS
- El coeficiente de variacin tambin se utiliza para comparar la variabilidad de 2 ms series de
datos que tengan unidades de medidas diferentes (por ejemplo, peso en kgs. y edad en aos).
Si C.V.A < C.V.B Los datos de la serie A presentan una menor variabilidad con respecto a los
datos de la serie B
Ejemplo:
Correspondiente a datos simples (informacin en serie):
Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de
Ciencias Contables y Administrativas:
Edad:
X
i
: 18, 20, 23, 17, 18, 19, 23, 18
Calcular la varianza, desviacin estndar y coeficiente de variacin e interpretar sus resultados.
Solucin:
La varianza (s
2
) :
Proceso:
18 20 23 17 18 19 23 18 156
19.5
8 8
x
x
n
+ + + + + + +
= = = =
2 2 2 2 2 2 2 2 2
18 20 23 17 18 19 23 18 3080 x = + + + + + + + =
n = 8, pues hay 8 datos.
Mg. Mara Vallejos Atalaya
86
Entonces, la varianza es:
2 2
2
2
( )
3080 8(19.5)
5.43
1 8 1
x n x
s
n
= = =
- No tiene interpretacin prctica, slo se calcula para poder determinar la desviacin estndar.
La desviacin estndar (s):
2 33 . 2 43 . 5
2
= = = = s s
Interpretacin:
Las edades de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas se
dispersan respecto al valor central en aproximadamente 2 aos.
El coeficiente de variacin (cv%):
2.33
% .100 .100 11.95% 12%
19.5
s
cv
x
= = = =
Interpretacin:
Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas):
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos la varianza, desviacin estndar y coeficiente de variacin para datos agrupados.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmites de
clases
X
i
f
i
F
i
X
i
f
i
X
i
2
fi
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
91
97
103
109
115
121
127
9
6
11
5
8
3
8
9
15
26
31
39
42
50
819
582
1133
545
920
363
1016
74529
56454
116699
59405
105800
43923
129032
Total 50 5378 585842
Solucin:
La varianza (s
2
) :
Proceso:
Mg. Mara Vallejos Atalaya
87
Media
819 582 1133 545 920 363 1016
9 6 11 5 8 3 8
5378
107.56 107
50
i i
i
x f
x
f
+ + + + + +
= =
+ + + + + +
= = =
2 2 2 2 2 2
2 2
91 (9) 97 (6) 103 (11) 109 (5) 115 (8)
121 (3) 127 (8) 585842
x f = + + + +
+ + =
Entonces, la varianza es:
2 2
2
2
( )
585842-50(107.56)
150.70
1 50 1
x f n x
s
n
= = =
- No tiene interpretacin prctica, slo se calcula para poder determinar la desviacin estndar.
La desviacin estndar (s):
2
150.70 12.27 s s = = =
Interpretacin:
El cociente de inteligencia de los alumnos de la Universidad Peruana Unin se dispersa respecto al
valor central en aproximadamente 13 puntos.
El coeficiente de variacin (cv%):
12.27
% .100 .100 11.40% 12%
107.56
s
cv
x
= = = =
Interpretacin:
Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.
Mg. Mara Vallejos Atalaya
88
Sesin N 8
MEDIDAS DE FORMA
8.1. Medidas de forma
Son aquellos que permiten identificar la distribucin de la informacin.
8.1.1. Asimetra (As)
Permite identificar hacia dnde se acumula la informacin. Se obtiene mediante la siguiente frmula:
3 1 2
3 1
2
o
Q Q Q x Mo
As As
s Q Q
+
= =
S: As = 0 La distribucin es simtrica
As > 0 La distribucin es positiva
As < 0 La distribucin es negativa
8.1.2. Coeficiente de Kurtosis o apuntamiento (K)
Indica el grado de aplastamiento que tiene la distribucin. De acuerdo a ello se clasifican en:
distribuciones platicrticas (Fig.1), mesocrticas (Fig.2) y leptocrticas (Fig.3).
Para el grado de apuntamiento (deformacin vertical) utilizaremos el coeficiente denotado por:
3 1
90 10
2( )
Q Q
k
P P
Donde: P
90
= percentil 90; Q
1
= primer cuartil
PLATICRTICA
Fig.1
MESOCRTICA
Fig.2
LEPTOCRTICA
Fig.3
Mg. Mara Vallejos Atalaya
89
P
10
= percentil 10; Q
3
= tercer cuartil
Si k = 0,263, diremos que la curva correspondiente a la distribucin de frecuencias es mesocrtica
(tiene igual apuntamiento que la normal o campana de Gauss).
si k < 0,263, diremos que la curva correspondiente a la distribucin de frecuencias es platicrtica.
si k > 0,263, diremos que la curva correspondiente a la distribucin de frecuencias es leptocrtica.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas):
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
cociente intelectual de 50 alumnos. [Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la
UPeU].
Hallaremos la asimetra y el coeficiente de Kurtosis para datos agrupados.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES
DEL CI DE 50 ESTUDIANTES DE LA UPeU
Intervalo de clase Xi fi Fi
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
91
97
103
109
115
121
127
9
6
11
5
8
3
8
9
15
26
31
39
42
50
P
10
Q
1
,D
2
Q
2
Q
3
D
8
P
90
Total 50
Solucin
La Asimetra (As):
Proceso:
Calcular los cuartiles 1, 2 y 3, como se hizo en el ejemplo de las medidas de posicin.
1
(1)50
9
4
94 6 97.5
6
Q
(
(
= + =
(
(
2
(2)(50)
15
4
100 6 105.45
11
Q
(
(
= + =
(
(
Mg. Mara Vallejos Atalaya
90
3
(3)(50)
31
4
112 6 116.87
8
Q
(
(
= + =
(
(
Reemplazar en la frmula de la asimetra, entonces, la Asimetra es:
3 1 2
3 1
2 116.87 97.5 2(105.45)
0.17
116.87 97.5
Q Q Q
As
Q Q
+ +
= = =
Interpretacin:
Como la asimetra tiende a cero, la informacin es simtrica.
El coeficiente de Kurtosis (k):
Proceso:
Calcular los cuartiles 1 y 3 y los percentiles 10 y 90, como se hizo en el ejemplo de las medidas de
posicin
1
(1)50
9
4
94 6 97.5
6
Q
(
(
= + =
(
(
3
(3)(50)
31
4
112 6 116.87
8
Q
(
(
= + =
(
(
10
(10)(50)
0
100
88 6 91.3
9
P
(
(
= + =
(
(
90
(90)(50)
42
100
124 6 126.25
8
P
(
(
= + =
(
(
Reemplazar en la frmula de la asimetra, entonces el coeficiente de Kurtosis es:
3 1
90 10
116.87 97.5
0.27
2( ) 2(126.25 91.3)
Q Q
k
P P
= = =
Interpretacin
Como k es igual 0.27 y este nmero es mayor que 0.263, entonces, la informacin es leptocrtica.
Mg. Mara Vallejos Atalaya
91
EJERCICIOS PROPUESTOS
1) Analizar comparativamente la distribucin de los sueldos de los 45 trabajadores de la empresa
metal mecnica.
s
x
C.V C.V%
Directivos 70 700 0,10 10%
Empleados 60 300 0,20 20%
Obreros 90 250 0,36 36%
2) En una empresa, el salario medio de los hombres es de S/. 4000 con una desviacin estndar de
s/. 1500 y el de las mujeres es un promedio de s/. 3000 con desviacin estndar de s/. 1200.
Hallar el Coeficiente de Variacin de los salarios de los hombres y mujeres. Interprete.
3) Determinar cul de las dos distribuciones A y B, tiene un mayor grado de dispersin
DISTRIBUCIN A
y
j-1
y
j
(0-2| (2-4| (4-6| (6-8|
nj 4 6 5 3
DISTRIBUCION B
y
j-1
y
j
(4-8| (8-12| (12-16| (16-20| (20-24|
nj 10 12 14 20 21
4) Una prueba de conocimiento, A, se calific sobre 20 puntos dando una media de 12 y una
desviacin estndar de 2 puntos. Mientras que una prueba de aptitud, B, se calific sobre 100
puntos, dando una media de 70 y una desviacin estndar de 5.
a) En cul de las dos pruebas los puntajes son ms homogneos?
b) Si Juan tiene 14 en A y Luis 73 en B, quin tiene mejor puntuacin estndar.
5) Multiplicando por 2 cada uno de los valores de la variable X: 3, 2, 0, 5, se obtiene la serie y: 6,
4, 0, 10. Comprobar que ambas series tienen el mismo coeficiente de variacin.
6) Se toman las medidas de 80 personas, las que tiene estatura media de 1,70mt. y desviacin
estndar de 3.4cm. Posteriormente se verific que la medida usada en la medicin tena 4 cm.
menos. Rectifique los estadgrafos mencionados.
7) Conteste lo siguiente:
a) Si la varianza de una distribucin de edades es 19.9809, entonces la desviacin estndar de
dicha distribucin es:
a1) 399.23636 a2) 9.99045
a3) 19.9809 a4) 4.47
b) Calcular el C.V. de: y=5x + 4 sabiendo
x
=240, V(x)=64
b1) 4.0% b2) 3.2% b3) 5.1% b4) 3.0%
8) Si la nota promedio en el curso de matemtica Bsica de la seccin A es 12 puntos y la
desviacin estndar es de 3 puntos y en la seccin B se tiene una nota promedio de 12 punto y
una desviacin estndar de 4 puntos podemos afirmar que:
a) La seccin B tiene mejor promedio
b) La seccin A tiene mejor promedio
c) Las notas de la seccin A son ms homogneas
d) Las notas de la seccin B son ms homogneas
Mg. Mara Vallejos Atalaya
92
Autoevaluacin
CONCEPTUAL
1. Seale con una V si es verdadero o F si es falso en los siguientes
enunciados:
a) ( ) La asimetra es una medida de forma.
b) ( ) El C.V. permite determinar si la informacin es homognea.
c) ( ) Kurtosis indica el grado de aplastamiento que tiene la
distribucin.
d) ( ) La varianza no tiene interpretacin prctica.
PROCEDIMENTAL
2. Un alumno obtuvo como promedio en estadstica 68.70 puntos con una
desviacin estndar de 15.40, y otro alumno obtuvo 50.90 puntos con
una desviacin estndar de 19.60. Diga Ud. cul de los dos alumnos
tiene un rendimiento homogneo.
3. En la siguiente tabla se presenta la distribucin de los salarios en
dlares. De 50 trabajadores de una empresa. La longitud de los
intervalos de clase es constante e igual a 20.
( y
j-1
- y
j
] y
j
n
j
N
j
y
j
n
j
300
400
23 350
17
( 100 - 120] 440
50
a) Completar la tabla de distribucin de frecuencia y los datos que faltan
b) Determine la varianza, la desviacin estndar, el coeficiente de variacin
4. Los siguientes datos muestran los calificativos de 20 personas
sometidos a una prueba de aptitud. Los 20 estudiantes fueron divididos
en dos grupos, al grupo 1 se calific de 0 a 100 y al grupo 2 se calific
de 0 a 20:
Grupo 1: 86, 81, 79, 73, 95, 86, 94, 90, 86, 88
Grupo 2: 16, 19, 13, 20, 14, 16, 19, 18, 17, 15
a) Calcule la media y la desviacin en cada grupo, cul de los grupos
es ms homogneo?
ACTITUDINAL
Mg. Mara Vallejos Atalaya
93
5. En una empresa deseas saber cmo estn dispersos los valores de las
edades, con respecto a la media aritmtica, de todos los trabajadores,
qu medida de resumen utilizaras y porqu?
Mg. Mara Vallejos Atalaya
94