Professional Documents
Culture Documents
Y
20
30
50
60
X 40
Y 40
En el ejemplo, una simple observacin permite verificar que si bien las medias
aritmticas de ambas variables son idnticas, provienen de conjuntos de datos completamente
diferentes. Esto significa:
a) que las medidas de posicin por s solas no son suficientes para determinar las
caractersticas de un conjunto de datos.
b) que se requiere de una medida adicional que permita calcular el alejamiento de los
valores de la variable respecto de algn valor de referencia.
As surge la necesidad de calcular las medidas de dispersin para ampliar
adecuadamente la informacin referida al conjunto de datos bajo estudio.
2 - DIFERENTES MEDIDAS DE DISPERSION:
Existen varias Medidas de dispersin. Ellas son:
a) Rango (R): esta medida fue presentada originalmente en el tema Distribucin de
Frecuencias y se defini como la diferencia entre los valores extremos del conjunto de datos
luego de ordenados estos. Es decir que R x M xm .
El Rango es muy sencillo de calcular, lo cual constituye una ventaja, pero a su vez tiene
dos desventajas que lo hacen desaconsejable como medida de dispersin:
Para calcularlo no se toma como referencia ningn valor considerado central.
No es factible su clculo en una distribucin de frecuencias.
Ejemplos: Tomando como base el cuadro que se presenta ms arriba con las variables X
e Y, el clculo del Rango en ese caso es:
Rx = 40 - 40 = 0
Ry = 60 - 20 = 40
b) Desvo medio (DM): Una de las posibilidades ms interesantes para medir la
dispersin surge cuando se piensa en que se podra aprovechar los desvos de cada una de las
variables respecto de la media aritmtica para construir una medida, en especial porque los
desvos constituyen una manera natural de medir el alejamiento de los valores de la variable
respecto de un valor central. Sin embargo, la segunda propiedad de la media aritmtica dice que
-------------------------------Probabilidades y Estadstica Ao 2005
26
x x
DM
1
xi x
n
en la cual se observa que con el procedimiento de clculo aplicado (sumar el valor absoluto de
los desvos) se evita que el resultado final se anule y se obtiene esta nueva medida, que tiene una
ventaja:
toma como referencia un valor central, en este caso la media aritmtica,
y una desventaja:
las barras de valor absoluto incorporadas en la frmula complican su
manejo algebraico.
Ejemplo: En el ejemplo de las variables X e Y, los desvos medios son:
DM x 0 (ya que la media es igual a 40)
DM y
20 40 30 40 50 40 60 40
4
60
15
4
d) Variancia (Sx2) : El Desvo Medio DM considera al desvo como base para sus
clculos, pero cuenta con la desventaja de poseer barras de valor absoluto que dificultan
notoriamente el trabajo algebraico. Para corregir esta situacin existe otra alternativa que
tambin aprovecha los desvos para construir una medida pero que evita la utilizacin de las
barras de valor absoluto.
2
Sx2 1 xi x
Puede verse claramente que, en este caso, si bien los desvos continan siendo los
elementos bsicos para el clculo de la medida de dispersin, se ha utilizado el artificio de
elevarlos al cuadrado, por lo que todos se convierten en positivos y su suma ya no se anula.
Ejemplo: continuando con los clculos de las diferentes medidas para el caso del cuadro
inicial que contiene las variables X e Y, el valor de la variancia en ambos casos es:
20 40 2 30 40 2 50 40 2 60 40 2
4
1000
250
4
27
n
fi
Ejemplo: en el caso de las variables X e Y para las cuales se calcularon todas las
medidas de dispersin presentadas, los desvos estndar son:
Sx 0
S y 250 1581
,
x fi
1
=
fi
x f
2
i i
i
2
xi2 2 xi x x f i
x f 2 x xi fi x fi
x f
f
x f
x f
2
i i
2x x x
2
i i
2x x
2
i i
2x
xi2 f i 2 xi x f i x f i
x f
f
i
2
i i
i
i
Luego, las frmulas de trabajo para las formas ponderada y simple, son:
Sx2
f
f
c) Propiedades de la variancia:
-------------------------------Probabilidades y Estadstica Ao 2005
28
Puede verse que esta propiedad se verific empricamente cuando se calcularon las
medidas de dispersin (la variancia entre ellas) de la variable X que se present en un
cuadro al inicio de este captulo, y que por tener todos sus valores iguales a 40, constituye
una constante.
3) La variancia es una medida mnima si se la compara con cualquier otra similar
que se calcule tomando como referencia alguna medida de posicin diferente de la
media aritmtica. Esta propiedad no requerira demostracin alguna en tanto se tenga
presente la tercera propiedad de la media aritmtica, que demostr que la sumatoria de los
desvos al cuadrado entre los valores de la variable y la media aritmtica es un mnimo, lo
cual equivale a decir que si los desvos se calcularan respecto de cualquier otro valor que
no fuera la media aritmtica, la sumatoria de ellos al cuadrado dara un resultado mayor.
4) Variancia de variables transformadas algebraicamente:
a) Si a todos los valores de una variable les sumamos (o restamos) un valor
constante y arbitrario A, obtenemos una nueva variable cuya variancia ser igual a
la de la variable original.
Sea xi una variable que tiene una media x y una variancia Sx2, y sea A un valor arbitrario.
Construimos la variable di xi A , y recordando que d x A , se obtiene
Sd2 1 di d
n
1 xi A x A
1
xi A x A
n
1 xi x
n
S x2
1
di d
n
1
cxi cx
n
1 c2 xi x
n
c2
1
xi x
n
c2 Sx2
c) Una transformacin algebraica que combina los casos a) y b), parte de una
variable xi que tiene una media x y una variancia Sx2, y de dos valores arbitrarios, A y c.
x A
x A
Se construye una variable di i
, y recordando que d
, se tiene que
c
c
Sd2
2
1
1 x A
di d i
n
n c
x A
c
2
2
1 1
1 1
1 2
x A x A
x x
Sx
2 i
2 i
c n
c n
c2
29
xi yi x y xi x yi y
di d
n
n
n
2
2
1
xi x yi y 2 xi x yi y
n
2
2
1
xi x yi y 2 xi x yi y
Sd2
1
xi x
n
1
yi y
n
1
x i x y i y S x2 S y2 2S xy
n
V x V y 2 Cov x, y
1
xi x yi y
n
La covariancia mide la relacin promedio existente entre dos variables xi e yi, a travs
de la suma de los productos de los desvos de ambas variables entre s y es una
consecuencia de la demostracin de la variancia de la suma de dos variables. Ms
abajo se hace un anlisis ms detallado de este nuevo trmino.
b) Caso de la diferencia: Partiendo de la existencia de dos variables xi e yi, cuyas
medias y variancias son conocidas, se construye la variable diferencia di xi yi . Si
ahora se calcula la variancia de di
2
2
1
1
1
xi yi x y xi x
di d
n
n
n
2
2
1
xi x yi y 2 xi x yi y
Sd2
yi y
2
2
1
xi x yi y 2 xi x yi y
n
1
1
1
xi x yi y 2 xi x yi y S x2 S y2 2 S xy
n
n
n
V x V y 2 Cov x , y con lo cual se verifica que la variancia de la
30
1
1
xi x yi y
xi yi xyi xi y x y
n
n
1
1
xi yi x 1 yi y 1 xi x y
n
n
n
n
x
y
1
i i
xy yx nxy
n
n
Cov x, y
Cov x , y
xi yi x y
n
31
1) S x2
xi fi
fi
1
4
7
6
2
20
Xi
3,5
9,5
15,5
21,5
27,5
3,5
38,0
108,5
129,0
55,0
334,0
xi2 fi
12,25
361,00
1.681,75
2.773,50
1.512,50
6.341,00
6.341
2
16,7 38,16
20
S x 38,16 6,18
S x2
32
Ejemplos:
El siguiente es un ejemplo sencillo que permite el clculo del coeficiente de variacin
y su aplicacin concreta. Sean dos variables, xi e yi, con las siguientes medias y
variancias:
x 50
S x2 100
y 200
S y2 200
973,39
100 36,7%
2.650
7 - VARIABLE ESTANDARIZADA
La variable estandarizada es una variable que se obtiene a partir de una
x A
transformacin algebraica muy particular, ya que adopta la forma ui i
donde
c
A x y c S x , por lo que finalmente zi
xi x
(tradicionalmente se reserva el smbolo zi para
Sx
zi
1 1
n
n
n Sx
igual a cero (por la segunda propiedad de la media aritmtica), resulta ser z 0 .
Para calcular la variancia de zi, se procede del siguiente modo
S z2
1
zi z
n
x x
1
i
n
S x
1 1
xi x
Sx2 n
1 2
Sx 1
Sx2
9 - ASIMETRIA:
33
x Mo
, o bien
Sx
3 x Me
Sx
34
M e d i d a s d e d i s p e rs i n
R ango
R a n g o s e m i n te rc u a rtl i c o
D e s vo m e d i o
V a ri a n z a
D e s vo e s t n d a r
a) V1 > V2
b) V1 < V2
c) V1 = V2
BIBLIOGRAFIA CONSULTADA:
Berenson Levine
Estadstica bsica en Administracin
Editorial Prentice Hall - 6 Edicin
Kazmier L. Daz Matta A.
Estadstica Aplicada a Administracin y Economa
Editorial McGraw Hill - 2 Edicin
Levin Rubin
Estadstica para Administradores
Editorial Prentice Hall - 6 Edicin
Mendenhall Reinmuth
Estadstica para Administracin y Economa
Grupo Editorial Iberoamrica - Ao 1993
-------------------------------Probabilidades y Estadstica Ao 2005
35