Professional Documents
Culture Documents
Clase dictada por Ana Vigna Aspirante a Estadstica Licenciatura en Relaciones Internacionales 8 de noviembre de 2010
Contenidos de la clase:
|
Medidas de dispersin:
z z
qu son? en qu q se diferencian y cmo se relacionan con las medidas de tendencia central? Rango o recorrido R id Rango o recorrido intercuartlico Varianza Desvo estndar o tpico Coeficiente de variacin
Frmulas Frmulas para datos originales y agrupados Ventajas y desventajas
Medidas:
z z z z z
Ejercicios de aplicacin
Medidas de dispersin
|
Indican si las p puntuaciones nt aciones son m muy parecidas o m muy distintas entre s. Las siguientes distribuciones tienen todas una media de 4. Qu las diferencia? 7, 6, 3, 3, 1 3, 4, 4, 5, 4 4, 4, 4, 4, 4 Existen dos procedimientos:
z z
Considerar C id el l recorrido id o amplitud lit d d de l la escala l en l la que se distribuyen las puntuaciones; Describir la variacin por medio de las diferencias que se producen entre todas las puntuaciones y un ndice de tendencia central.
Medidas de dispersin
|
Mientras las medidas de tendencia central nos indican dnde se concentra un grupo de puntuaciones puntuaciones, las medidas de dispersin refieren a la homogeneidad / heterogeneidad de una distribucin.
Son complementarias Para calcular algunas medidas de dispersin es necesario conocer los valores de otras medidas Ambos tipos de medidas son necesarias para una descripcin acabada de una distribucin
Rango o recorrido
Se calcula S l l restndole t d l al l valor l ms alto lt d de una distribucin, el valor ms bajo | Se aplica tanto a distribuciones de datos originales, como a distribuciones de datos agrupados. d
|
Xc 2,5 7,5 15 31
fi 14 8 3 3 28
fr (%) 50 28 11 11 100
Fi 14 22 25 28
Fr(%) 50 78 89 100
Ai 5 5 10 22
Entre el pas con mayor porcentaje de analfabetismo y el pas con menor porcentaje, hay una diferencia de 42 puntos porcentuales
Fuente: Elaboracin propia en base a datos de CEPAL: Anuario estadstico de Amrica Latina y el Caribe, 2009
MEDIDA
VENTAJAS
DESVENTAJAS Es muy general, tan slo nos da una idea de cun amplia p es la variacin entre puntajes extremos. No toma en cuenta los valores intermedios de la distribucin distribucin.
Rango o recorrido
Es la diferencia entre el Q1 y el Q3 Nos indica la dispersin en el 50% central de la distribucin Es ms sensible a la concentracin de los datos que el recorrido ordinario Su clculo es indistinto para datos originales como para datos agrupados.
RI = Q3 Q1
Q3
25%
RI = Q3 Q1
| |
Datos originales g 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
Q1 = 1/ 4n = 0,25 * 12 = 3
Q3 = 3 / 4n = 0,75* 12 = 9
18, 20, 20, 24, 32, 32, 32, 48, 49, 53, 59, 63
Q1 =(20+24)/2 =22 Q3 =(49+53)/2 =51
RI = 51 22 = 29.aos
RI = Q3 Q1
|
L.Inf. L.Sup Xc fi fr (%) Fi Fr(%) Ai 0a5 2,5 14 50 14 50 5 Lmite inferior del 5a10 7,5 8 28 22 78 5 que contiene intervalo q 10a20 15 3 11 25 89 10 al primer cuartil (Fr% 20a42 31 3 11 28 100 22 supera al 25%) n(total) 28 100 Total de casos Frecuencia acumulada absoluta de la clase anterior a la que contiene al primer cuartil
Datos agrupados
Distribucindepasessegnporcentajedelapoblacinde15yms aos a osdeedada analfabeta, a abeta,Amrica caLatina at ayel e Caribe. Ca be.Ao o2010 0 0
(1/ 4N Fi 1) Q1 = L.Inf . + * Ai fi
frecuencia absoluta simple de la clase que contiene al Amplitud del intervalo que primer cuartil contiene al primer cuartil
MEDIDA
VENTAJAS
DESVENTAJAS Es muy general, tan slo nos da una idea de cun amplia es la variacin entre puntajes extremos. No toma en cuenta los valores i intermedios di d de l la di distribucin. ib i Solo mide la dispersin en el centro de la distribucin Solo mide la distancia entre el Q1 y Q3, y no la forma en que los datos estn distribuidos
Rango o recorrido
Rango g intercuartlico
Varianza
|
Se basa en las diferencias entre la media aritmtica y cada una de las puntuaciones Es el promedio de los cuadrados de las distancias de las observaciones a partir de la media (su valor nunca ser negativo). La frmula del clculo depender si la distribucin es de datos originales o agr agrupados, pados as como de si se trabaja con poblaciones (se usa en el denominador N) o con una muestra (se usa n-1).
2 ( X X ) i i =1 N 2 X n X i 2 i =1 N
Datos originales:
S2 =
n 1
n 1
Varianza
|
Se basa en las diferencias entre la media aritmtica y cada una de las puntuaciones Es el promedio de los cuadrados de las distancias de las observaciones a partir de la media (su valor nunca ser negativo). La frmula del clculo depender si la distribucin es de datos originales o agr agrupados, pados as como de si se trabaja con poblaciones (se usa en el denominador N) o con una muestra (se usa n-1).
( X i X ) * fi
2 i =1
n 1
2 X fi n X i 2 i =1
n 1
Varianza
|
Se basa en las diferencias entre la media aritmtica y cada una de las puntuaciones Es el promedio de los cuadrados de las distancias de las observaciones a partir de la media (su valor nunca ser negativo). La frmula del clculo depender si la distribucin es de datos originales o agr agrupados, pados as como de si se trabaja con poblaciones (se usa en el denominador N) o con una muestra (se usa n-1).
S2 =
( Xci X ) * fi
2 i =1
n 1
2 Xc fi n X i 2 i =1
n 1
S2 =
| |
( X i X ) * fi
2 i =1
n 1
2 X fi n X i 2 i =1
n 1
Datos originales 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
x=
20 + 49 + 59 + 18 + 32 + 32 + 63 + 24 + 20 + 32 + 53 + 48 450 = = 37,5.aos 12 12
Edad 18 20 24 32 48 49 53 59 63 n(Total)
fi 1 2 1 3 1 1 1 1 1 12
Xi2 Xi2*fi 324 324 400 800 576 576 1024 3072 2304 2304 2401 2401 2809 2809 3481 3481 3969 3969 (Xi2 *fi)= 19736
X 2 = 1406,25
19736 12 * 1406,25 = 260,1 11
S2 =
S2 =
2 ( Xc X ) * fi i i =1
2 Xc fi n X i 2 i =1
x=
233 = 8,32.puntos.porcentuales 28
Xc 2,5 7,5 15 31
fi (Xc*fi) Xc2 Xc2*fi 14 35 6 87,5 8 60 56 450 3 45 225 675 3 93 961 2883 (Xc*fi) (Xc2*fi) 28 =233 =4095 4095,5 5
MEDIDA
VENTAJAS
DESVENTAJAS Es muy general, tan slo nos da una idea de cun amplia es la variacin entre puntajes extremos. No toma en cuenta los valores intermedios de la distribucin. Solo mide la dispersin en el centro de la distribucin Solo mide la distancia entre el Q1 y Q3, y no la forma en que los datos estn distribuidos Al expresarse en el cuadrado de las unidades de los datos, es de difcil interpretacin.
Rango o recorrido
Rango intercuartlico
Fcil de calcular No sufre la influencia de los valores extremos Considera todos los valores d la de l di distribucin t ib i
Varianza
Es la medida ms frecuentemente usada de variabilidad, , y se calcula como la raz cuadrada de la varianza. Expresa la cantidad de variabilidad promedio en una di t ib i distribucin. Nos permite determinar cmo se distribuyen los valores en relacin con la media Su frmula es indistinta para distribuciones de datos originales o agrupados.
2 ( X X ) i i =1 N
S=
= S2
S= S
| |
Datos originales 20, 49, 59, 18, 32, 32, 63, 24, 20, 32, 53, 48
S 2 = 77,1
S = 77,1 = 8,8.puntos.porcentual es
MEDIDA
VENTAJAS
DESVENTAJAS Es muy general, tan slo nos da una idea de cun amplia es la variacin entre puntajes extremos. No toma en cuenta los valores intermedios de la distribucin. Solo mide la dispersin en el centro de la distribucin Solo S l mide id l la di distancia i entre el l Q1 y Q3, y no la forma en que los datos estn distribuidos Al expresarse en el cuadrado de las unidades de los datos, es de difcil interpretacin. Es sensible a las unidades de medida
Rango o recorrido
Rango intercuartlico
Fcil de calcular No N sufre f l la i influencia fl i d de l los valores extremos Considera todos los valores de la distribucin Se expresa en las unidades originales de la variable
Coeficiente de variacin
|
Hace referencia a la variabilidad relativa, , relaciona la media con el desvo Nos indica el porcentaje de variacin que existe con respecto t al l valor l promedio di d de l la di distribucin. t ib i Su frmula es igual para datos originales que para datos agrupados.
S CV = * 100 X
S CV = * 100 X
|
Datos originales g
MEDIDA
VENTAJAS
DESVENTAJAS Es muy general, tan slo nos da una idea de cun amplia es la variacin entre puntajes extremos. No toma en cuenta los valores intermedios de la distribucin. Solo mide la dispersin en el centro de la distribucin Solo S l mide id l la di distancia t i entre t el l Q1 y Q3, y no la forma en que los datos estn distribuidos Al expresarse en el cuadrado de las unidades de los datos, es de difcil interpretacin. Es E sensible ibl a l las unidades id d d de medida Arrastra las limitaciones que tiene la media como medida de tendencia central
Rango o recorrido
Rango intercuartlico
Fcil de calcular No N sufre f l la i influencia fl i d de l los valores extremos Considera todos los valores de la distribucin Se S expresa en las l unidades id d originales de la variable
Es til para comparar la Coeficiente de variabilidad entre conjuntos variacin de datos (de diferentes o iguales unidades de medida)
Bibliografa
z
Garca Ferrando, M. Socioestadstica Socioestadstica. . Introduccin a la estadstica en sociologa Lind, Marchal, Lind, Marchal, Mason: Estadstica para Administracin y Economa Repetto, D. Material de apoyo para el curso de Estadstica de Relaciones Internacionales