You are on page 1of 11

25

U.T.N.-F.R.R.- Ao 2005ESTADISTICA DESCRIPTIVA


RESUMEN DE LA INFORMACION
Unidad 4 - MEDIDAS DE DISPERSION
Profesor Titular: E Mario J. Garber
1- INTRODUCCION:
Para comprender cul es la utilidad de las Medidas de Dispersin se presenta un ejemplo
sumamente sencillo. Sean dos variables, X e Y, para las cuales se dispone de los siguientes datos:
X
40
40
40
40

Y
20
30
50
60

X 40

Y 40

En el ejemplo, una simple observacin permite verificar que si bien las medias
aritmticas de ambas variables son idnticas, provienen de conjuntos de datos completamente
diferentes. Esto significa:
a) que las medidas de posicin por s solas no son suficientes para determinar las
caractersticas de un conjunto de datos.
b) que se requiere de una medida adicional que permita calcular el alejamiento de los
valores de la variable respecto de algn valor de referencia.
As surge la necesidad de calcular las medidas de dispersin para ampliar
adecuadamente la informacin referida al conjunto de datos bajo estudio.
2 - DIFERENTES MEDIDAS DE DISPERSION:
Existen varias Medidas de dispersin. Ellas son:
a) Rango (R): esta medida fue presentada originalmente en el tema Distribucin de
Frecuencias y se defini como la diferencia entre los valores extremos del conjunto de datos
luego de ordenados estos. Es decir que R x M xm .
El Rango es muy sencillo de calcular, lo cual constituye una ventaja, pero a su vez tiene
dos desventajas que lo hacen desaconsejable como medida de dispersin:
Para calcularlo no se toma como referencia ningn valor considerado central.
No es factible su clculo en una distribucin de frecuencias.
Ejemplos: Tomando como base el cuadro que se presenta ms arriba con las variables X
e Y, el clculo del Rango en ese caso es:
Rx = 40 - 40 = 0
Ry = 60 - 20 = 40
b) Desvo medio (DM): Una de las posibilidades ms interesantes para medir la
dispersin surge cuando se piensa en que se podra aprovechar los desvos de cada una de las
variables respecto de la media aritmtica para construir una medida, en especial porque los
desvos constituyen una manera natural de medir el alejamiento de los valores de la variable
respecto de un valor central. Sin embargo, la segunda propiedad de la media aritmtica dice que
-------------------------------Probabilidades y Estadstica Ao 2005

26

x x

la suma de los desvos se anula, esto es,


, lo cual prcticamente inhibe al desvo
como herramienta apropiada para medir la dispersin a menos que se encuentre una forma
apropiada de evitar esa nulidad. El Desvo Medio aparece como una de esas alternativas y su
frmula es

DM

1
xi x
n

en la cual se observa que con el procedimiento de clculo aplicado (sumar el valor absoluto de
los desvos) se evita que el resultado final se anule y se obtiene esta nueva medida, que tiene una
ventaja:
toma como referencia un valor central, en este caso la media aritmtica,
y una desventaja:
las barras de valor absoluto incorporadas en la frmula complican su
manejo algebraico.
Ejemplo: En el ejemplo de las variables X e Y, los desvos medios son:
DM x 0 (ya que la media es igual a 40)
DM y

20 40 30 40 50 40 60 40
4

60
15
4

d) Variancia (Sx2) : El Desvo Medio DM considera al desvo como base para sus
clculos, pero cuenta con la desventaja de poseer barras de valor absoluto que dificultan
notoriamente el trabajo algebraico. Para corregir esta situacin existe otra alternativa que
tambin aprovecha los desvos para construir una medida pero que evita la utilizacin de las
barras de valor absoluto.
2

Recordando la tercera propiedad de la media aritmtica xi x , se construye la


cuarta medida de dispersin, denominada Variancia, cuya frmula ponderada es la siguiente:
2
Sx2 1 xi x f i ,
fi
que se convierte en la frmula simple si todas las fi son iguales a la unidad, por lo que

Sx2 1 xi x

Puede verse claramente que, en este caso, si bien los desvos continan siendo los
elementos bsicos para el clculo de la medida de dispersin, se ha utilizado el artificio de
elevarlos al cuadrado, por lo que todos se convierten en positivos y su suma ya no se anula.
Ejemplo: continuando con los clculos de las diferentes medidas para el caso del cuadro
inicial que contiene las variables X e Y, el valor de la variancia en ambos casos es:

Sx2 0 , mientras que Sy2

20 40 2 30 40 2 50 40 2 60 40 2
4

1000
250
4

con lo cual se verifican dos cosas:


en el caso de la variable X, todas las medidas de dispersin calculadas dieron un
resultado igual a cero.
en el caso de la variable Y, la variancia da un resultado excesivo respecto del de las
anteriores medidas de dispersin, y eso se debe a que el artificio de elevar al cuadrado
los desvos modifica su escala de trabajo. Como consecuencia, aparece necesario
-------------------------------Probabilidades y Estadstica Ao 2005

27

quitarle al resultado obtenido esa distorsin mediante la extraccin de la raz cuadrada.


La medida as obtenida se denomina Desvo o desviacin estndar (o tpica) (Sx):
2
2
1
x x f 1
x x
S x2 S x
i
i

n
fi

Ejemplo: en el caso de las variables X e Y para las cuales se calcularon todas las
medidas de dispersin presentadas, los desvos estndar son:
Sx 0

S y 250 1581
,

Nota importante: La unidad de medida de la variancia es la misma unidad que


corresponde a la variable bajo estudio, elevada al cuadrado, mientras que la unidad de
medida del desvo estndar es la misma que la de la variable (y que la de la media
aritmtica).
3 - VARIANCIA - DESARROLLO TEORICO Y CONCEPTUAL:
a) Variancia poblacional y variancia muestral - Simbologa:
Un smbolo general para indicar a la variancia es la letra V. De modo que, por ejemplo, el
smbolo V(x) indica la variancia de la variable xi. Asimismo, los smbolos para las variancias
poblacional y muestral varan entre s del mismo modo que varan los smbolos para las medias.
En este caso los smbolos Sx2 y Sx se reservan para la variancia y el desvo estndar muestrales,
mientras que para los smbolos poblacionales se utiliza la letra griega sigma, que sealan,
respectivamente, a la variancia (x2) y al desvo estndar (x).
b) Frmula de trabajo de la variancia: La frmula de trabajo se obtiene mediante un
conjunto de procesos algebraicos y permite encontrar un procedimiento diferente, y en algunos
casos ms conveniente, para calcular la variancia. Se parte de la frmula inicial (utilizando la
frmula ponderada) y se desarrolla el cuadrado del binomio que se encuentra entre parntesis,
con el siguiente resultado:
S x2

x fi

1
=
fi

x f

2
i i
i

2
xi2 2 xi x x f i

x f 2 x xi fi x fi

x f
f

x f

x f

2
i i

2x x x

2
i i

2x x

2
i i

2x

xi2 f i 2 xi x f i x f i

x f
f
i

2
i i

por lo que fcilmente se deduce que es S x2

i
i

Luego, las frmulas de trabajo para las formas ponderada y simple, son:
Sx2

f
f

xi2 f i x 2 para la forma ponderada,


fi

xi2 x 2 para la forma simple.


n

c) Propiedades de la variancia:
-------------------------------Probabilidades y Estadstica Ao 2005

28

1) La variancia de un conjunto definido de datos es un valor constante mayor o


igual a cero. Esta propiedad, por un lado, tiene similar connotacin y objetivo que la
primera propiedad de la media aritmtica, y por el otro, es fcilmente comprensible si se
observa la frmula de la variancia que est compuesta por la sumatoria de valores
elevados al cuadrado.
2) La variancia de una constante es igual a cero. Esta propiedad se demuestra de la
siguiente manera: sea una constante a cuya media a a. Si se desea calcular la variancia
de a, se aplica la frmula correspondiente:
2
Sa2 1 a a 1 a a 2 0
n
n

Puede verse que esta propiedad se verific empricamente cuando se calcularon las
medidas de dispersin (la variancia entre ellas) de la variable X que se present en un
cuadro al inicio de este captulo, y que por tener todos sus valores iguales a 40, constituye
una constante.
3) La variancia es una medida mnima si se la compara con cualquier otra similar
que se calcule tomando como referencia alguna medida de posicin diferente de la
media aritmtica. Esta propiedad no requerira demostracin alguna en tanto se tenga
presente la tercera propiedad de la media aritmtica, que demostr que la sumatoria de los
desvos al cuadrado entre los valores de la variable y la media aritmtica es un mnimo, lo
cual equivale a decir que si los desvos se calcularan respecto de cualquier otro valor que
no fuera la media aritmtica, la sumatoria de ellos al cuadrado dara un resultado mayor.
4) Variancia de variables transformadas algebraicamente:
a) Si a todos los valores de una variable les sumamos (o restamos) un valor
constante y arbitrario A, obtenemos una nueva variable cuya variancia ser igual a
la de la variable original.
Sea xi una variable que tiene una media x y una variancia Sx2, y sea A un valor arbitrario.
Construimos la variable di xi A , y recordando que d x A , se obtiene
Sd2 1 di d
n

1 xi A x A

1
xi A x A
n

1 xi x
n

S x2

b) Si a todos los valores de una variable los multiplicamos (o dividimos) por


un valor constante y arbitrario c, obtenemos una nueva variable cuya variancia ser
igual a la de la variable original multiplicada o dividida por c al cuadrado.
Sea xi una variable que tiene una media x y una variancia Sx2, y sea c un valor arbitrario.
Construimos la variable di c xi (en este caso resolvemos la propiedad slo aplicando el
caso del producto, pero resulta sencillo ver que la demostracin es equivalente si
aplicramos el caso del cociente), y recordando que d c x , se obtiene
Sd2

1
di d
n

1
cxi cx
n

1 c2 xi x
n

c2

1
xi x
n

c2 Sx2

c) Una transformacin algebraica que combina los casos a) y b), parte de una
variable xi que tiene una media x y una variancia Sx2, y de dos valores arbitrarios, A y c.
x A
x A
Se construye una variable di i
, y recordando que d
, se tiene que
c
c

Sd2

2
1
1 x A
di d i

n
n c

x A
c

2
2
1 1
1 1
1 2
x A x A
x x
Sx

2 i
2 i
c n
c n
c2

-------------------------------Probabilidades y Estadstica Ao 2005

29

5) Variancia de la suma o de la diferencia de dos variables:


a) Caso de la suma: Supongamos la existencia de dos variables, xi e yi, ambas con
sus medias ( x e y ) y sus variancias (Sx2 y Sy2) conocidas, y construyamos con ellas la
variable suma di xi yi . Recordando que d x y , se busca calcular la variancia de di.
2
2
1
1
1

xi yi x y xi x yi y
di d

n
n
n
2
2
1
xi x yi y 2 xi x yi y

n
2
2
1
xi x yi y 2 xi x yi y

Sd2

1
xi x
n

1
yi y
n

1
x i x y i y S x2 S y2 2S xy
n

V x V y 2 Cov x, y

Como resultado de esta ltima demostracin se verifica que la variancia de la suma de


dos variables es igual a la suma de sus variancias ms dos veces Cov(x,y), smbolo de
la covariancia entre x e y (tambin simbolizado con Sxy). Luego
Cov x, y Sxy

1
xi x yi y
n

La covariancia mide la relacin promedio existente entre dos variables xi e yi, a travs
de la suma de los productos de los desvos de ambas variables entre s y es una
consecuencia de la demostracin de la variancia de la suma de dos variables. Ms
abajo se hace un anlisis ms detallado de este nuevo trmino.
b) Caso de la diferencia: Partiendo de la existencia de dos variables xi e yi, cuyas
medias y variancias son conocidas, se construye la variable diferencia di xi yi . Si
ahora se calcula la variancia de di
2
2
1
1
1

xi yi x y xi x
di d

n
n
n
2
2

1
xi x yi y 2 xi x yi y

Sd2

yi y

2
2

1
xi x yi y 2 xi x yi y

n
1
1
1
xi x yi y 2 xi x yi y S x2 S y2 2 S xy
n
n
n
V x V y 2 Cov x , y con lo cual se verifica que la variancia de la

diferencia de dos variables es la suma de sus variancias (como en el caso de la


variancia de la suma de dos variables) menos dos veces la covariancia entre las
variables.
4 -FORMULA DE TRABAJO DE LA COVARIANCIA:
Se ha indicado ms arriba que la covariancia aparece cuando se obtiene la expresin de la
variancia de la suma o de la diferencia de dos variables. As como ocurri en el caso de la
variancia, tambin en la covariancia se puede obtener una frmula de trabajo de acuerdo con el
siguiente procedimiento:
-------------------------------Probabilidades y Estadstica Ao 2005

30

1
1


xi x yi y
xi yi xyi xi y x y

n
n
1
1
xi yi x 1 yi y 1 xi x y
n
n
n
n
x
y
1
i i

xy yx nxy
n
n

Cov x, y

Cov x , y

xi yi x y
n

5 - CALCULO DE LA VARIANCIA EN DISTRIBUCIONES DE


FRECUENCIA:
Sobre la base de los ejercicios para variables continuas cuyas medias aritmticas fueron
calculadas anteriormente, se presentarn los clculos de las variancias, para lo cual se aplicar la
frmula de trabajo. Como en el caso del clculo de la media aritmtica, los puntos medios de los
intervalos de clase hacen las veces de valores de la variable, con los cuales se construye la
columna xi2fi, cuya suma permite obtener uno de los datos necesarios para el clculo de la
variancia:
Ejemplo 1) para ISI:
Ingreso
($)
fi
xi
xi fi
xi2 fi
0 999,99
5
500
2.500
1.250.000
1000 1999,99 18
1500
27.000
40.500.000
2000 2999,99 42
2500
105.000
262.500.000
3000 3999,99
27
3500
94.500
330.750.000
4000 4999,99
8
4500
36.000
162.000.000
100
265.000
797.000.000
Ejemplo 2) para ISI-IQ:
Acidez
(pH)
fi
xi
xi fi
xi2 fi
1,00 1,49
5
1,25
7,25
7,8125
1,50 1,99
18
1,75
31,50
55,1250
2,00 2,49
42
2,25
94,50
212,6250
2,50 2,99
27
3,25
87,75
285,1875
3,00 3,49
8
3,75
30,00
112,5000
100
251,00
673,25
Ejemplo 3) para IEM:
Consumo
(Kwh)
fi
xi
xi fi
xi2 fi
5,00 9,99
5
7,50
38,50
281,25
10,00 14,99
18
12,50
225,00
2.812,50
15,00 19,99
42
17,50
735,00
12.862,50
20,00 24,99
27
22,50
607,50
13.068,00
25,00 29,99
8
27,50
220,00
6.050,00
100
1826,00
35.074,25
-------------------------------Probabilidades y Estadstica Ao 2005

31

Aplicando la frmula indicada se obtiene los siguientes resultados:


797.000.000
2
2.650 947.500
100
673
,
25
2,51 2 0,4324
2) S x2
100
35074,25
18,26 2 17,3149
3) S x2
100

1) S x2

El desvo estndar se calcula obteniendo la raz cuadrada de la variancia:


1) S x 947.500 973,39
2) S x 0,4324 0,6575
3) S x 17,3149 4,161
En el caso del ejemplo referido a variable discreta nmero de expedientes iniciados en
una oficina cuya media aritmtica dio un resultado de 16,7 expedientes, la variancia se obtiene
haciendo:
N de
Exped.
1-6
7-12
13-18
19-24
25-30

xi fi
fi
1
4
7
6
2
20

Xi
3,5
9,5
15,5
21,5
27,5

3,5
38,0
108,5
129,0
55,0
334,0

xi2 fi
12,25
361,00
1.681,75
2.773,50
1.512,50
6.341,00

6.341
2
16,7 38,16
20
S x 38,16 6,18

S x2

6 - DISPERSION RELATIVA: COEFICIENTE DE VARIACION


La variancia (o el desvo estndar) es una medida de dispersin que indica de qu modo
se alejan, en promedio, los valores de una variable respecto de una medida de posicin
convencional, en este caso la media aritmtica. Sirve para medir el alejamiento interno
promedio de los valores de una variable respecto de su propia medida de posicin. En ese
sentido, por lo indicado, resulta ser una medida de dispersin absoluta.
Pero si deseamos comparar las dispersiones de dos (o ms) distribuciones, la variancia y
el desvo estndar no resultan ser medidas apropiadas, por lo sealado en el prrafo anterior.
Por consiguiente, para efectuar comparaciones respecto de la dispersin de varias
distribuciones de frecuencias, aparece como necesario la propuesta de calcular una medida de
dispersin relativa, cuyo nombre es Coeficiente de Variacin (CV) y cuya expresin
matemtica es
S
CVx x 100 (que se expresa en forma porcentual)
x
medida sta que se encuentra desprovista de unidades porque relaciona el desvo estndar con la
media aritmtica y ambas tienen la misma unidad de medida, que, de esa forma, se simplifica.
Resulta sencillo verificar que el Coeficiente de Variacin es una medida de la dispersin de un
conjunto de datos expresada como porcentaje de su media aritmtica.
-------------------------------Probabilidades y Estadstica Ao 2005

32

Ejemplos:
El siguiente es un ejemplo sencillo que permite el clculo del coeficiente de variacin
y su aplicacin concreta. Sean dos variables, xi e yi, con las siguientes medias y
variancias:
x 50
S x2 100

y 200
S y2 200

Con esos datos se calculan ambos coeficientes de variacin:


10
CVx 100 20%
50
14,145
CV y
100 7%
200
Los resultados obtenidos permiten sealar que si bien la variable xi tiene menor
dispersin absoluta que la variable yi, (porque la variancia de x es menor que la de y), tiene
mayor dispersin relativa (porque CVx es mayor que CVy).
Ejemplo: En el caso de la distribucin de frecuencias relativa al ingreso de un grupo de
personas, el Coeficiente de variacin se calcula aplicando los resultados obtenidos en pginas
anteriores para el desvo estndar y la media aritmtica:
CVx

973,39
100 36,7%
2.650

7 - VARIABLE ESTANDARIZADA
La variable estandarizada es una variable que se obtiene a partir de una
x A
transformacin algebraica muy particular, ya que adopta la forma ui i
donde
c
A x y c S x , por lo que finalmente zi

xi x
(tradicionalmente se reserva el smbolo zi para
Sx

la variable estandarizada). La transformacin se califica como muy particular porque sin


importar cunto valen tanto los valores de la variable xi como su media aritmtica y su desvo
estndar, la media y la variancia de zi sern siempre iguales a cero y a uno, respectivamente.
Para obtener la media de zi hacemos
x x
i

zi
1 1

. Como esta ltima expresin es


xi x
z

n
n
n Sx
igual a cero (por la segunda propiedad de la media aritmtica), resulta ser z 0 .
Para calcular la variancia de zi, se procede del siguiente modo
S z2

1
zi z
n


x x
1
i


n
S x

1 1
xi x
Sx2 n

1 2
Sx 1
Sx2

9 - ASIMETRIA:

-------------------------------Probabilidades y Estadstica Ao 2005

33

a) Definicin y forma de clculo: La asimetra es el grado de desviacin hacia la


derecha o hacia la izquierda que posee una distribucin, lo que puede verificarse fcilmente
mediante una observacin del histograma o del polgono de frecuencias.
En el punto Relaciones entre las medidas de posicin desarrollado en el Captulo
Medidas de posicin, se mencion tanto este tema como la existencia de una frmula emprica
atribuida a Pearson que permite relacionar entre s la Media aritmtica, la Mediana y el Modo, y
que tiene la forma x Mo 3 x Me . En el anlisis efectuado en aquel momento, se seal
que, al coincidir las tres medidas de posicin en el mismo valor de la variable, existe una
situacin de simetra perfecta, mientras que si hay diferencias entre la media aritmtica y las
otras dos, se pueden presentar dos situaciones diferentes de asimetra: una, cuando la media
aritmtica es menor tanto de la mediana como del modo, denominada asimetra hacia la
izquierda; y la otra cuando la media aritmtica es mayor que la mediana y el modo, definida
como asimetra hacia la derecha.
A partir de la relacin de Pearson, es posible construir una forma de evaluar el grado de
asimetra de una distribucin por medio de una de las siguientes medidas:
As1
As2

x Mo
, o bien
Sx
3 x Me
Sx

Diferentes resultados de las medidas de asimetra presentadas precedentemente conducen


al siguiente anlisis:
Si en una distribucin de frecuencias en particular las medidas de posicin
coinciden, los valores que corresponden a As1 y As2 son iguales a cero por lo
que el grado de asimetra de esa distribucin es nulo y, por ende, la
distribucin es perfectamente simtrica.
En una distribucin diferente, si la media aritmtica fuera menor que la
mediana o que el modo, tendramos una asimetra hacia la izquierda. En ese
caso el resultado particular de las medidas As1 y As2 es negativo y por
consiguiente se dice que la asimetra es hacia la izquierda o negativa.
Si, en cambio, la media aritmtica es mayor que la mediana o que el modo, el
resultado particular de As1 y As2 ser positivo, y diremos que la distribucin
tiene una asimetra hacia la derecha o positiva.
b) Utilidad de las medidas de asimetra: En el Captulo Medidas de posicin se
present el punto 6 titulado Conveniencia de las medidas de posicin, en el que se presentaron
algunos casos en los cuales es preferible elegir una determinada medida de posicin en lugar de
las restantes. En particular, en el caso de distribuciones asimtricas y atento a las propiedades
oportunamente demostradas para todas las medidas, se mencion que resultaba ms conveniente
calcular la Mediana o el Modo que la Media aritmtica.
Si bien no pueden establecerse en forma dogmtica lmites para las medidas de asimetra,
una manera de orientar a quienes trabajan en el tema, es mediante las siguientes sugerencias:
si 0,20 As 0,20 conviene utilizar la media aritmtica.
si As 0,20 no conviene utilizar la media aritmtica.
CUADRO SINOPTICO SOBRE MEDIDAS DE DISPERSION
-------------------------------Probabilidades y Estadstica Ao 2005

34

Colaboracin de la Profesora Mara de los Arcos Martnez

M e d i d a s d e d i s p e rs i n
R ango

R a n g o s e m i n te rc u a rtl i c o

D e s vo m e d i o

V a ri a n z a

D e s vo e s t n d a r

PREGUNTAS TEORICAS SOBRE MEDIDAS DE DISPERSION:


1) En una serie de diferentes valores que tienen signo negativo Cmo es la variancia?
a) mayor que cero
b) menor que cero
c) igual a cero
2) Un aumento en el coeficiente de variacin, a qu puede deberse?
a) a un aumento en el valor de la variancia
b) a un aumento en el valor de la media aritmtica
c) a una disminucin en el valor de la variancia
3) Observe las variancias siguientes e indique cmo son entre s en trminos generales
2
V1 1 xi x
n
2
V2 1 xi Mo
n

a) V1 > V2
b) V1 < V2
c) V1 = V2
BIBLIOGRAFIA CONSULTADA:
Berenson Levine
Estadstica bsica en Administracin
Editorial Prentice Hall - 6 Edicin
Kazmier L. Daz Matta A.
Estadstica Aplicada a Administracin y Economa
Editorial McGraw Hill - 2 Edicin
Levin Rubin
Estadstica para Administradores
Editorial Prentice Hall - 6 Edicin
Mendenhall Reinmuth
Estadstica para Administracin y Economa
Grupo Editorial Iberoamrica - Ao 1993
-------------------------------Probabilidades y Estadstica Ao 2005

35

Montiel Ros Barn


Elementos Bsicos de Estadstica Econmica y Empresarial
Editorial Prentice Hall Ao 1996
Spiegel M. Teora y Problemas de Estadstica Editorial Shaum

-------------------------------Probabilidades y Estadstica Ao 2005

You might also like