You are on page 1of 8

1.

5 Medidas de dispersin y de posicin




1.5 Medidas de dispersin y de posicin para datos no agrupados (pocos
datos)

La Variabilidad o dispersin es una caracterstica muy importante de los
datos. Por ejemplo, si fabricaras tornillos, una variacin excesiva en el dimetro
del tornillo significara un alto porcentaje de piezas defectuosas. Por el
contrario, si se aplicara un examen para distinguir entre buenos y malos
contadores, tendras un arduo trabajo si las calificaciones del examen variaran
muy poco porque hara ms difcil la discriminacin.

Muchas medidas estadsticas de la variabilidad ayudan a formar una imagen
mental de la dispersin de los datos. Aqu se presentan algunas de las ms
importantes como es el rango, desviacin estndar, varianza y coeficiente de
variacin.

El rango, R , de un conjunto de n mediciones se define como la diferencia
entre la medicin mayor y la menor. . min . max V V R =

1.5.1 Varianza.

La varianza de un conjunto de datos es la media del cuadrado de las
dispersiones de los datos respecto a su media aritmtica. La dispersin de un
dato respecto a su media es la diferencia entre el dato menos la media ( x x
i
).
Se obtiene restando a cada uno de los valores de la muestra o de la poblacin
el valor de la media aritmtica de todo el conjunto de valores, elevado al
cuadrado de cada una de esas diferencias y dividiendo el resultado entre el
total de datos N si se trata de una poblacin, o entre el total de datos menos
uno ) 1 ( n si se trata de una muestra.



















Si
N
x x x ,... ,
2 1
son todos los datos de la poblacin, a la varianza poblacional la
denotamos con
2
o . Se tiene:
N
x
N
i
i
=

=
1
2
2
) (
o
Y si
n
x x x ,... ,
2 1
son los datos de la muestra, la varianza muestral denotada por
2
s es:
1
) (
1
2
2

=

=
n
x x
s
n
i
i

1.5.2 Desviacin estndar.

La raz cuadrada positiva de la varianza se denomina Desviacin Estndar.
Para muchos fines prcticos es una medida de la variabilidad ms til que la
varianza, pues la desviacin estndar se expresa en las mismas unidades que
las de los valores recogidos la varianza se expresa en unidades elevadas al
cuadrado.










Ejemplo 1.5.1
Calcula la varianza y desviacin estndar de la siguiente muestra (seis
mediciones): 5, 7, 1, 3, 2, 6. Considera 4 = x

6 . 5
5
28
5
4 4 1 9 9 1
5
) 4 6 ( ) 4 2 ( ) 4 3 ( ) 4 1 ( ) 4 7 ( ) 4 5 (
1
) (
2 2 2 2 2 2
1
2
2
= =
+ + + + +
=
+ + + + +
=

=

=
n
x x
s
n
i
i




3664 . 2 6 . 5
1
) (
1
2
= =

=

=
n
x x
s
n
i
i




1.5 Medidas de dispersin y de posicin para datos agrupados

1.5.1, 2 Varianza y Desviacin estndar.

Cuando los datos estn acomodados en una tabla de frecuencias, para sacar la varianza
calculamos la dispersin de cada dato o marca de clase diferente, elevamos al cuadrado cada
resultado y lo multiplicamos por su respectiva frecuencia, luego sumamos todas las cantidades
y al resultado de esta suma lo dividimos entre N o n-1 segn el caso, se trate de una poblacin
o una muestra.








La Varianza poblacional la denotamos
por
2
o . Se tiene:
N
f x
N
i
i i
=

=
1
2
2
) (
o

La varianza muestral denotada por
2
s es:
1
) (
1
2
2

=

=
n
f x Mc
s
n
i
i


Las siguientes expresiones de la desviacin estndar son para:

Una poblacin
N
x
N
i
i
=

=
1
2
) (
o Una muestra
1
) (
1
2

=

=
n
x x
s
n
i
i

















Ejemplo 1.5.2
Si retomamos el ejemplo 3.19 calcular la varianza y desviacin estndar. Del
precio de las tortas que venden en los alrededores del colegio.

Categoras Intervalos
I
L
S
L
Limites reales
RI
L
RS
L
Marca de
Clase
Mc
Frecuencia
i
f
Frecuencia
acumulada
ai
F
A 7 11 6.5 11.5 9 4 4
B 12 16 11.5 16.5 14 8 12
C 17 21 16.5 21.5 19 13 25
D 22 26 21.5 25.5 24 10 35
E 27 31 26.5 31.5 29 15 50
F 32 36 31.5 36.5 34 5 55
G 37 41 36.5 41.5 39 2 57
H 42 46 41.5 46.5 44 3 60

Varianza
1
) (
1
2
2

=

=
n
f x Mc
s
n
i
i

8767 . 1180 ) 16 . 24 44 ( 3
4512 . 440 ) 16 . 24 39 ( 2
128 . 484 ) 16 . 24 34 ( 5
384 . 351 ) 16 . 24 29 ( 15
256 . 0 ) 16 . 24 24 ( 10
1328 . 346 ) 16 . 24 19 ( 13
8048 . 825 ) 16 . 24 14 ( 8
3024 . 919 ) 16 . 24 9 ( 4
2
2
2
2
2
2
2
2
=
=
=
=
=
=
=
=


0904 . 77
59
336 . 4548
49
8768 . 1180 4512 . 440 128 . 484 384 . 351 256 . 0 1328 . 346 8048 . 825 3024 . 919
2
= =
+ + + + + + +
= s

Las siguientes expresiones de la desviacin estndar son para:

Una poblacin
N
f x
N
i
i i
=

=
1
2
) (
o Una muestra
1
) (
1
2

=

=
n
f x Mc
s
n
i
i

7801 . 8 0904 . 77
1
) (
1
2
= =

=

=
n
f x Mc
s
n
i
i


Desviacin estndar




1.5.3 Coeficiente de variacin.

Otra medida apropiada para medir la variacin de un conjunto de datos es el
llamado coeficiente de variacin:CV . La formula involucra la media y la
desviacin estndar; casi siempre se expresa como porcentaje; sta es:

) 100 ( =
x
s
CV
Esta medida es til para comparar las variabilidades de dos conjuntos de datos
cuando existe una clara diferencia en la magnitud tanto en la media como en la
desviacin estndar. Otra caracterstica importante del CV es que es
independiente de las unidades de medicin.

Ejemplo 1.5.3
Para comparar la variacin de las estaturas entre un grupo de nios de 5 aos
de edad y otro de 15 aos, se tom una muestra de 25 personas de cada grupo
de edad. Las muestras arrojaron los siguientes resultados: para el primer grupo
se tiene cm x 100
1
= , cm s 6
1
= , para el segundo grupo cm x 150
2
= , cm s 9
2
=
Cul de estos grupos tiene varianza mayor?

Solucin
Ahora es necesario encontrar el coeficiente de variacin de cada grupo. A partir
de la desviacin estndar se observa que hay mayor variacin en el segundo
grupo, pero es necesario recordar que estamos comparando grupos de
personas de diferentes magnitudes debido a su edad. Desde un punto de vista
relativo se ver que las estaturas de ambos grupos estn muy aproximadas. Se
determinaron los coeficientes de variacin para cada grupo:

% 6 100
100
6
1
= = CV y % 6 100
150
9
2
= = CV
Como se ve, ambos coeficientes son iguales, por lo que la dispersin relativa
de ambos grupos es igual.


1.5.4 Cuantiles.

Un conjunto de puntuaciones o mediciones puede dividirse en un cierto nmero
de partes iguales mediante la seleccin de valores que correspondan a una
posicin determinada en dicho conjunto. Por ejemplo, la mediana divide a un
conjunto de valores dados en dos partes iguales, y su posicin es, en
consecuencia, a la mitad del mismo, de manera que 50% de las puntuaciones
quedan a uno u otro lado de dicho valor estadstico.

En general, se llaman cuantiles a estos valores con posicin divisora
determinada. Pueden considerarse los siguientes cuantiles, adems de la
mediana:




Se representan por:
a) Decil ( o decila)---------------------------------
n
D
b) Cuartil (o cuartila)------------------------------
n
Q
c) Centil ( o centila), porcentil (o percentil)----
n
P

Deciles: Son los cuantiles que dividen una distribucin en 10 tantos a
intervalos, por lo que tienen 9 puntos de divisin, los deciles, que originan
los 10 intervalos.
Los deciles, que se representan por
n
D , pueden marcarse en una grfica
como la siguiente:







Cuartiles: son los puntos que dividen a una distribucin de valores en cuatro
porciones iguales o intervalos. Se representan por
3 2 1
, , Q Q Q y se ilustran
en el esquema siguiente:


B Q Q Q A
3 2 1







Ejemplo 1.5.4
En una competencia mundialista, las diferencias en dcimas de segundo de la
corredora que gan con respecto a sus contrincantes en los 400 metros planos
fueron:
15,48, 56, 59, 78, 96, 124
Encontrar la mediana, el primer y tercer cuartil.

Solucin
Primer paso: Ordenar los datos de menor a mayor
Segundo paso: Si el nmero de datos es impar, la median es el valor que se
encuentra en el centro. En este caso la mediana es 59
~
= x
B D D D D D D D D D A
9 8 7 6 5 4 3 2 1

0 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
0 25% 50% 75% 100%
Tercer paso: Para determinar el primer cuartil, se toma la mitad de los datos
inferiores (todos los valores ubicados por debajo de la mediana) y se encuentra
la mediana de stos. En el caso del ejemplo, la mediana de 15, 48 y 56 es el
primer cuartil, esto es: 48
1
= Q
Cuarto paso: De manera anloga, el tercer cuartil es la mitad de los datos
superiores; es decir, todos los valores mayores que la mediana. En el ejemplo
son 78, 96 y 124, donde el tercer cuartil es: 96
3
= Q

Finalmente, cabe destacar los valores mnimo y mximo (15 y 24 en el ejemplo
de la corredora).
Pensando en los cuarteles, stos dividen los datos en cuatro partes. La
mediana divide al conjunto de datos a la mitad, y si tomamos la mitad de una
mitad se obtiene un cuarto; stos son los que deseamos.

Interpretacin
El primer cuartil 48
1
= Q indica que menos del 25% de las corredoras estn por
debajo de ese registro, lo que seala que esas competidoras estuvieron cerca
de la victoria. El valor 96
3
= Q corresponde a 75% de las corredoras y revela
que 25% de las competidoras quedaron lejos del primer lugar. En la prctica
esta situacin sirve de referencia a las competidoras para mejorar sus marcas.

Aprender a calcular un cuartil es importante por que permite ganar un mayor
conocimiento sobre un problema, o tema de inters a travs de la informacin
proporcionada por los datos.


Obtencin de Cuantles en datos agrupados.

Se utiliza el modelo para calcular la mediana en datos agrupados, donde 1 = r

C
f
f
rn
L x
M
aa
M

(
(
(
(


+ =
2 ~
Cuartiles ( Q) C
f
f
rn
L Q
M
aa
M r

(
(
(
(


+ =
4



Donde r =cuartil que se desea calcular, siendo 1, 2, o 3

Ejemplo 1.5.5
Considerando los datos de la siguiente tabla de frecuencias.

Categoras Intervalos
I
L
S
L
Limites
reales
RI
L
RS
L
Marca
de
Clase
Mc
Frecuencia
i
f
Frecuencia
acumulada
ai
F
A 7
11
6.5
11.5
9 4 4
B 12
16
11.5
16.5
14 8 12
C 17
21
16.5
21.5
19 13 25
D 22
26
21.5
25.5
24 10 35
E 27
31
26.5
31.5
29 15 50
F 32
36
31.5
36.5
34 5 55
G 37
41
36.5
41.5
39 2 57
H 42
46
41.5
46.5
44 3 60
5 ~ C


a) Calcular el cuartil 1, 1 = r (el primer 25%)

15
4
) 60 ( 1
4
= =
rn
Este valor se busca en
ai
F de la tabla de frecuencias, en caso
de que no se encuentre se considera el valor inmediato superior. Que en este
caso es el nmero 25.

13
5
12
60
5 . 16
=
=
=
=
=
M
aa
M
f
C
f
n
L



b) Calcular el cuartil 2, 2 = r (el segundo 25%)

30
4
) 60 ( 2
4
= =
rn
Este valor se busca en
ai
F de la tabla de frecuencias, en caso
de que no se encuentre se considera el valor inmediato superior. Que en este
caso es el nmero 35.

10
5
12
60
5 . 16
=
=
=
=
=
M
aa
M
f
C
f
n
L


6538 . 17 5
13
12
4
) 60 ( 1
5 . 16
1
=
(
(
(


+ = Q
24 5
10
25
4
) 60 ( 2
5 . 21
2
=
(
(
(


+ = Q

c) Calcular el cuartil 3, 3 = r (el tercer 25%)

45
4
) 60 ( 3
4
= =
rn
Este valor se busca en
ai
F de la tabla de frecuencias, en caso
de que no se encuentre se considera el valor inmediato superior. Que en este
caso es el nmero 50.

15
5
35
60
5 . 26
=
=
=
=
=
M
aa
M
f
C
f
n
L










Deciles (D)
C
f
f
rn
L D
M
aa
M r

(
(
(
(


+ =
10

Donde r =1, 2, 3, 9


Ejemplo 1.5.6

Calcular el decil 9, es decir, el 90%

54
10
) 60 ( 9
10
= =
rn
, Este valor se busca en
ai
F de la tabla de frecuencias, en caso
de que no se encuentre se considera el valor inmediato superior. Que en este
caso es el nmero 55.

5
5
50
60
5 . 31
=
=
=
=
=
M
aa
M
f
C
f
n
L


83 . 29 5
15
35
4
) 60 ( 3
5 . 26
3
=
(
(
(


+ = Q

5 . 35 5
5
50
10
) 60 ( 9
5 . 31
9
=
(
(
(


+ = D

You might also like