You are on page 1of 33

ESTADSTICA GENERAL

MEDIDAS S DE RESUMEN SU N II
Dr. Francisco Surez Aranda
2013 2

MEDIDAS DE VARIABILIDAD
Las medidas de variabilidad o dispersin miden el grado de concentracin de las observaciones en t torno a una medida did d de t d tendencia i central t l (generalmente la media aritmtica) aritmtica). . Una distribucin de frecuencias ser homognea o poco variable, si los valores de las observaciones difieren poco entre s, y por tanto, se concentran t en torno t a la l indicada i di d medida did (su ( media aritmtica) aritmtica). . Por el contrario, contrario una distribucin de valores ser heterognea o muy variable si los datos se dispersan mucho entre s y por tanto tambin, respecto t a su media. media di .
Dr. Francisco Surez Aranda

Las medidas de variabilidad o dispersin permiten evaluar la representatividad de una medida de tendencia central, mediante la cuantificacin de las distancias de los diversos valores de la variable respecto t a dicha di h medida medida. did . Esta E t di t distancia i en trminos estadsticos, es denominada variabilidad o dispersin de la distribucin distribucin. . Es decir, a la mayor o menor separacin de los p a la media valores de una distribucin respecto aritmtica por ejemplo (que se pretenda sea su medida de resumen), se le llama variabilidad o dispersin. dispersin . Por lo cual, cual ser ms representativa la media aritmtica de una variable cuanto ms agrupados en torno a ella estn los valores promediados. promediados .
Dr. Francisco Surez Aranda

En ciertas ocasiones, la variabilidad de las observaciones es la cuestin central en una investigacin. investigacin . L finalidad La fi lid d de d las l medidas did d variabilidad de i bilid d es estudiar hasta que punto, las medidas de tendencia central son representativas p como sntesis del conjunto de datos. datos. Medir esta representatividad equivale a cuantificar la separacin de los valores de la distribucin respecto a dicha medida medida. . As, si se desea estudiar el grado en que una media aritmtica it ti i di indica l tendencia la t d i central t l de d todo t d el l conjunto de datos, se analizar la separacin o desviacin de cada valor respecto p a la media media. .
Dr. Francisco Surez Aranda

Si todos los valores estn cerca de la media aritmtica, sta, ser representativa de ellos ellos. . Por el contrario, una gran medida de dispersin indicar que la media aritmtica no es muy representativa de los datos datos. . La variabilidad es un concepto cuantitativo cuantitativo, , de tal manera que nada de esto se aplica a las distribuciones de datos cualitativos. cualitativos. Son varias las medidas de dispersin p intuitivamente atractivas, pero poco usadas, como el rango y la desviacin media media. . Las medidas de dispersin ms utilizadas son las que tienen que ver cmo se dispersan los datos respecto a la media aritmtica, aritmtica, como es el caso de la varianza y desviacin estndar. estndar.
Dr. Francisco Surez Aranda

Calificaciones obtenidas por estudiantes en el curso de matemtica: matemtica:


ESTUDIANTE Daniela Milagros Iris Bertha 15 17 20 20 15 13 18 20 NOTAS 15 15 19 19 15 13 18 00 15 17 00 16 MEDIA 15 15 15 15

La calificaciones de Daniela no variaron. variaron. Las calificaciones de Milagros variaron menos que las de Iris (la dispersin de las calificaciones de Milagros es menor que las de Iris) Iris). . Las calificaciones de Bertha variaron ms que (la dispersin p de las de las dems estudiantes ( las calificaciones de Bertha es mayor). mayor).
Dr. Francisco Surez Aranda

1. RANGO, AMPLITUD O RECORRIDO (R o A)


Es la diferencia entre el mayor valor y el menor valor de un conjunto de observaciones. observaciones. Tiene Ti l ventaja la t j de d que su clculo l l en un conjunto de observaciones es fcil de determinar y adems, su interpretacin es simple. simple . No obstante, , tiene limitaciones similares a la moda y adems, no siempre capta ciertas diferencias; diferencias ; as, en el ejemplo de las calificaciones no detecta que las calificaciones calificaciones, de Bertha variaron ms que las de Iris, pues en ambos casos el rango es 20 20. .
Dr. Francisco Surez Aranda

Esta desventaja se debe a que en clculo del rango slo l se toman t en consideracin id i los l valores l extremos. extremos . Adems el rango es muy sensible a los valores Adems, extremos y nada sensible a los intermedios, pudiendo carecer de toda representatividad. representatividad. Otro inconveniente se relaciona al tamao de la muestra, as, si se quiere comparar la variabilidad de la dispersin de dos conjuntos de datos de tamao marcadamente distinto, es probable que la muestra de mayor y tamao p presente una mayor y amplitud aunque las poblaciones de referencia tengan la misma variabilidad variabilidad. .

Dr. Francisco Surez Aranda

Ejemplo
Calificaciones obtenidas por Milagros: Milagros: 17 Valor mximo: mximo: 17 Valor mnimo mnimo: : 13 R = xmax xmin i R = 17 13 = 4 13 15 13 17

Dr. Francisco Surez Aranda

2. VARIANZA
D todas De d las l medidas did de d dispersin di i respecto a la l media aritmtica, la varianza y su raz cuadrada (desviacin estndar) estndar), , son las ms importantes importantes. . Si en vez de considerar los valores absolutos de las desviaciones respecto a la media aritmtica consideramos sus cuadrados y se divide entre el nmero de observaciones, , tendremos una nueva medida de dispersin que nos conducir a la denominada VARIANZA VARIANZA, , que se puede definir como la l media di aritmtica it ti d los de l cuadrados d d d de las desviaciones de los valores de la variable respecto a su media aritmtica aritmtica. .
Dr. Francisco Surez Aranda

La varianza es una de las ms importantes medidas de variabilidad, variabilidad pero su resultado constituye una magnitud que no tiene sentido por si misma, puesto que es un valor cuadrtico cuadrtico. . Su significado cobra relevancia al comparar el grado de variabilidad de dos distribuciones distribuciones. . Cuanto ms se aproxima a cero, ms concentrado estn los valores alrededor de su media aritmtica. aritmtica . Por el contrario, cuanto mayor sea la varianza, ms dispersos estn los valores en relacin a su media aritmtica.
Dr. Francisco Surez Aranda

PROPIEDADES DE LA VARIANZA
a) La varianza puede ser cero o un valor positivo, positivo no puede ser negativa, negativa, porque para su clculo se suman valores cuadrticos, imposibilitando la obtencin de un valor negativo negativo. . b) Es sensible a valores aberrantes. aberrantes. c) La varianza de una constante k es cero cero. . d) Si a todos los valores de la variable se le suma o resta una constante k, la varianza no vara (un cambio de origen en la variable no afecta a la varianza) varianza). . e) Si a todos los valores de la variable se le multiplica una constante k, la varianza queda multiplicada por el cuadrado de la constante y la desviacin estndar por el valor absoluto de esa constante constante. .
Dr. Francisco Surez Aranda

2. VARIANZA
Varianza poblacional ( 2 ) (xi )2 2 = N x2i (xi)2/N 2 = N

Varianza muestral o cuasivarianza ( s2 ) (xi x)2 s2 = n1


_

x2i (xi)2/n s2 = n1
Dr. Francisco Surez Aranda

PARA DATOS AGRUPADOS


Varianza poblacional ( 2 ) fi(xi )2 2 = N fix2i (fixi)2/N 2 = N

Varianza muestral o cuasivarianza ( s2 ) fi(xi x)2 s2 = n1


_

fix2i (fixi)2/n s2 = n1
Dr. Francisco Surez Aranda

En el ejemplo de las calificaciones obtenidas por Milagros: Milagros : xi = 17 Si es una poblacin: poblacin bl i : = 15
2 ( x ) i 2 = N

13

15

13

17

2 =
5 2 16 = = 3.2 5
Dr. Francisco Surez Aranda

(17 15 15) )2 + (13 15 15) )2 + (15 15 15) )2 + (13 15 15) )2 + (17 15 15) )2

Si es una muestra: muestra: x = 15


2 ( x x) i s2 = n1

(17 15 15) )2 + (13 15 15) )2 + (15 15 15) )2 + (13 15 15) )2 + (17 15 15) )2 s2 = 51 16 = = 4 4
Dr. Francisco Surez Aranda

s2

VARIANZA PONDERADA
Cuando se tienen dos o ms muestras y se necesita contar con una varianza combinada, , requiere ponderarse las varianzas. varianzas. En este caso el peso que se le otorga a cada varianza est relacionado l i d a sus grados d de d libertad lib t d (n ( 1). La frmula es la siguiente siguiente: :

s2i (ni 1) s2p = (ni 1)

Dr. Francisco Surez Aranda

Ejemplo
La UCSur adquiri 20 ordenadores para el Centro de Cmputo. Cmputo . El distribuidor Blanco y Negro que estaba en promocin le vendi 15 ordenadores de dif diferentes t marcas, mientras i t que los l otros t cinco i ordenadores tambin de diferentes marcas los adquiri q al distribuidor Buena vista, , siendo los montos pagados (en dlares) los siguientes (considere los datos como muestras) muestras): : P Precio i medio di V i Varianza Blanco y Negro Negro: : 1600 120 Buena Buena vista vista : 1900 160 El Rector desea saber el precio medio de los ordenadores y su varianza varianza. .
Dr. Francisco Surez Aranda

MEDIA PONDERADA
wi xi xp= wi
_

(15 x 1600 1600) ) + (5 x 1900 1900) ) xp= 15 + 5


_

33500 xp= = 1675 dlares 20


_

Dr. Francisco Surez Aranda

VARIANZA PONDERADA
2 ( s i (ni 1) 2 s p= (ni 1)

s2p=

120(15 1) + 160 120( 160( (5 1) (15 5 1) + (5 1) 2320 = 128 128. .89 18

s2p=

Dr. Francisco Surez Aranda

3. DESVIACIN ESTNDAR
Es la raz cuadrada de la varianza varianza. . Su valor se expresa en las mismas unidades que se emplean l para medir di las l observaciones observaciones. b i . Su valor indica como se desvan en promedio, l valores los l d las de l observaciones b i respecto t a su media. media .
ESTUDIANTE Daniela Milagros Iris Bertha MEDIA ARITMTICA 15 15 15 15 DESVIACIN ESTNDAR 0.00 1 79 1.79 7.54 7.64

Dr. Francisco Surez Aranda

4. COEFICIENTE DE VARIACIN
Las medidas de dispersin p anteriores miden la variacin absoluta de los valores de la variable, mientras que el coeficiente de variacin relaciona la desviacin estndar con la media, media brindando una medida de dispersin relativa relativa. . Es la razn entre la desviacin estndar y la media y generalmente se expresa como porcentaje porcentaje. . Expresa p la desviacin estndar como un porcentaje de la media media. . Es una cantidad adimensional (independiente de l las unidades id d d medida) de did ) por lo l que es muy til para comparar la variabilidad de distribuciones que tengan unidades diferentes o cuando las medias son muy diferentes diferentes. .
Dr. Francisco Surez Aranda

Por tanto, es til cuando se desea comparar la variabilidad de datos expresados en diferentes unidades de medida; medida; por ejemplo, peso de madres gestantes (kilos) y nivel de colesterol en la sangre (ml/ (ml/100 100cc) cc) o cuando la medida es la misma, pero en diferentes unidades; unidades; por ejemplo, peso de ratones (g p (gramos) ) y p peso de p personas (kilos). (kilos) . s

CV = _ x 100 x

Hay que tener presente que no es un verdadero porcentaje, porcentaje , por que puede valer ms de 100 100% %. Cuanto mayor es el coeficiente de variacin, variacin, menos e os representativa ep ese tat a es la a media ed a a aritmtica. aritmtica t t ca.
Dr. Francisco Surez Aranda

Ejemplo
Los siguientes datos corresponden a una muestra de estudiantes de la UCSur. UCSur. Calificaciones C Calificaciones: lifi i : 11 19 Estaturas (cm) (cm): : 165 182
VARIABLE Calificaciones Estatura

19

13

14

170
MEDIA 15.2 172.8

172

175
C. V. 23.88 3.65

DES. ESTNDAR 3.63 6.30

Dr. Francisco Surez Aranda

INTERPRETACIN DEL COEFICIENTE DE VARIACIN


C.V. 10 10% % 10% 10 % < C.V. 33 33% % 33% 33 % < C.V. 50 50% % C.V. > 50 50% % DISPERSIN ESCASA DISPERSIN ACEPTABLE DISPERSIN GRANDE DISPERSIN EXCESIVA

Dr. Francisco Surez Aranda

MEDIDAS DE ASIMETRA
El grado de asimetra de una distribucin se refiere al grado en que los valores de las observaciones se reparten p equilibradamente q por p debajo y por encima del valor de medida de tendencia central. central. G f Grficamente la distribucin de un conjunto de datos es simtrica si la mitad izquierda de su distribucin es la imagen especular de su mitad derecha. derecha . La idea de asimetra es de fcil comprensin p mediante la representacin grfica; grfica; sin embargo, es conveniente cuantificar la asimetra de una distribucin. distribucin .
Dr. Francisco Surez Aranda

Existe simetra perfecta cuando al doblar la representacin p grfica p g por una vertical trazada sobre la media, las dos mitades se superponen perfectamente. perfectamente . En una distribucin simtrica y siempre y cuando sea unimodal unimodal, , las tres medidas de tendencia central (media aritmtica, aritmtica mediana y moda) coinciden en el centro de la distribucin distribucin. . Sin embargo, g , hay y ocasiones en las q que necesitamos analizar variables cuya distribucin escapa a la distribucin simtrica (salarios) (salarios). . En caso de asimetra las medidas de tendencia central se separan, quedando generalmente la mediana entre la media y la moda moda. .
Dr. Francisco Surez Aranda

Las discrepancias entre las medidas tendencia central indican la presencia asimetra. asimetra .

de de

La asimetra es positiva o negativa en funcin del lado en que se ubica la cola de la distribucin distribucin. . La media aritmtica tiende a desplazarse hacia las valores extremos (colas) (colas). . Cuando la media es mayor que la moda moda, , la distribucin tiene una cola hacia la derecha y hay asimetra positiva positiva. . Las distribuciones asimtricas positivas son tpicas de pruebas, tareas o tests difciles en las que la mayora de las calificaciones son bajas. bajas.
Dr. Francisco Surez Aranda

Por el contrario, cuando la media es menor que la moda, moda d , la l cola l queda d h i hacia l la i izquierda i d observndose una asimetra negativa negativa. . Las distribuciones con asimetra negativa son propias de las pruebas, tareas o tests fciles, en las que la mayora de las calificaciones son altas altas. . Las medidas de asimetra permiten conocer la forma de la distribucin de conjuntos de datos datos. .

Dr. Francisco Surez Aranda

Asimetra positiva

MODA MEDIANA

MEDIA

A i t negativa Asimetra ti

MEDIA MEDIANA

MODA

Dr. Francisco Surez Aranda

COEFICIENTE DE ASIMETRA DE PEARSON


Se fundamenta en la relacin que existe entre la media y la moda en distribuciones simtricas y asimtricas. asimtricas . Se define como la distancia entre la media y la moda, medida en desviaciones estndar. estndar .

x Mo Ap = s
Si la media aritmtica y la moda son iguales, iguales la distribucin es simtrica simtrica, , por lo tanto, Ap es igual a CERO CERO. .
Dr. Francisco Surez Aranda

Si la media aritmtica es mayor que la moda, el coeficiente ser positivo (Ap es mayor que CERO), CERO) , siendo la distribucin asimtrica positiva. positiva . Si la media aritmtica es menor q que la moda, , el coeficiente ser negativo (Ap es menor que CERO), CERO) , siendo la distribucin asimtrica negativa. negativa ti . El coeficiente de asimetra de Pearson tiene la dificultad de que slo se puede calcular en distribuciones unimodales. unimodales.
Dr. Francisco Surez Aranda

Nunca sabrs quines son vuestros amigos i h t que caigas hasta i en desgracia". d desgracia" i ". Napolen Bonaparte

Dr. Francisco Surez Aranda

You might also like