Professional Documents
Culture Documents
1
1
1
...
Cuando la variable presenta valores
extremos anormalmente altos o bajos,
puede resultar poco representativa.
Frmula :
Ejemplo de Media Aritmtica
Se registra la cantidad anual de desenbarques de
recursos martimos en los ltimos 7 aos (en TM) :
54,527 124,849 59,416 57,420
49,748 35,706 34,533
El promedio de desembarques de recursos martimos es:
= (54527 + 124849 + 59416 + .....+ 34533) / 7 = 59,417 T.M.
El dato 124,849 difiere en su valor con los dems valores.
Sin este dato el nuevo promedio es:
= 291,350 / 6 = 48,558 T.M.
x
x
Media Artimtica Ponderada
x w x
i i
i
k
=
=
1
w
i
=
1 con:
en donde: Wi es un peso o ponderacin
que indica la importancia relativa de la i-sima
observacin.
A veces asociamos con los nmeros X
1
, X
2
, .... , X
K
,
ciertos factores o pesos W
1
, W
2
, ..., W
K
, dependientes de
la relevancia asignada a cada valor.
En tal caso, surge la definicin de Media Aritmtica
Ponderada.
Media aritmtica calculada a partir de una Tabla
de frecuencias
Si los datos estn agrupados en intervalos
de clase, la media aritmtica se aproxima
usando las marcas de clase :
=
'
~
k
i
i i
n x
n
x
1
1
Frmula:
Donde: son las marcas de clase o puntos medios.
Es la frecuencia absoluta de la clase i.
i
n
X
i
Ejemplo1: Clculo del Ingreso Promedio
Mensual de 30 familias
[Ingreso
Mensual)
Ingreso
Medio
(X
i
)
# de Hogares Total
Ingresos
[0 1000) 500 9 4500
[1000 2000) 1500 12 18000
[2000 3000) 2500 9 22500
Total ------ 30 45000
El Ingreso promedio es: 45000 / 30 = 1500 nuevos soles
Ejemplo2: Gasto Medio Mensual de consumo
de agua de 100 familias
[Gasto Mensual
Agua)
Gasto medio # de
Hogares
Gasto Total
0 40 20 68 1360
40 - 80 60 21 1260
80 - 120 100 6 600
120 - 160 140 2 280
160 - 200 180 3 540
Total ---- 100 4040
El Gasto Promedio Mensual de Agua es 4040 / 100 = 40.40 soles.
Ejemplo 3: Gasto Promedio Ponderado en Alimentos donados
(Programas Sociales): S/.105.03
Estrato # de hogares Gasto medio (S/.) Gasto total
(S/.)
Sierra Centro
452 80.54 36404.08
Sierra Sur
394 73.12 28809.28
Sierra Norte
318 70.37 22377.66
Selva
711 187.16 133070.76
Costa Norte
426 100.25 42706.50
Costa Centro
334 109.41 36542.94
Costa Sur
180 76.18 13712.40
Lima Met.
318 48.57 15445.26
Total 3133 ---- 329,068.88
MEDIANA (Me)
Es el valor que divide al conjunto de datos en dos
partes iguales, donde aproximadamente 50% son
menores y los otros 50% son mayores que ese valor.
Se obtiene:
n = nmero de observaciones
Si n es impar : Me = X
((n+1)/2)
Donde: X
((n+1)/2)
= valor de la observacin en el lugar (n+1)/2
(valor central)
Si n es par : Me = [X
(n/2)
+ X
((n/2) +1)
]/2
x
(n/2)
Valor central x
((n/2)+1)
MODA (Mo)
Valor que se repite con ms frecuencia en un
conjunto de datos, o
Ejemplo:
Hallar la moda de los siguientes nmeros:
3, 3, 3, 3, 5, 6, 8, 4, 20, 37, 37, 50, 50, 50
En este caso la moda es:
Mo = 3 (se repite cuatro veces)
PERCENTILES
DECILES
CUARTILES
QUINTILES
CENTILES
Son valores que dividen a un conjunto de datos ordenados en
forma ascendente o descendente en cuatro partes iguales.
Q1 Q2 Q3
Son valores que dividen a un conjunto de datos ordenados en
forma ascendente o descendente en cinco partes iguales.
q1 q2 q3 q4
Son los valores que dividen a un conjunto da datos
ordenados en forma ascendente o descendente en 10 partes
iguales.
D1 D9
Son valores que dividen a un conjunto de datos ordenados en
forma ascendente o descendente en cien partes iguales.
C1 ....... C99
Dada una distribucin de valores de cierta
variable X, tales como x
1
, x
2
, x
3
,............, x
n,
se
define amplitud o rango (recorrido) de la variable
X, a la diferencia entre el mayor valor y el menor
valor observado, es decir:
x
mx
: mayor valor de la variable X.
x
mn
: menor valor de la variable X.
Rango = x
mx
x
mn
AMPLITUD O RANGO
Varianza y desviacin estndar poblacional:
Varianza : o
2
= E (X
i
- )
2
/N
Desviacin estndar: o = \ o
2
= Media poblacional
N = Tamao de la poblacin
Varianza y desviacin estndar muestral
Varianza : S
2
= E (X
i
- x)
2
/ (n - 1)
Desviacin estndar: s = \ s
2
x = Media muestral
n = Tamao de la muestra
VARIANZA Y DESVIACION ESTANDAR
Ingreso Punto medio Nmero de x-x (x-x)
2
n
i
(x - x )
2
(S/.) de clase trabajadores
(X) (n
i
)
2400-2599 2499.5 7 -450 202500 1417500
2600-2799 2699.5 20 -250 62500 1250000
2800-2999 2899.5 33 -50 2500 82500
3000-3199 3099.5 25 150 22500 562500
3200-3399 3299.5 11 350 122500 1347500
3400-3599 3499.5 4 550 302500 1210000
E 100 5870,000
MEDIA ARITMETICA : X = 2949.5
VARIANZA : S
2
= 5870,000 / 99 = 59292.93
DESVIACION ESTANDAR : S = \ 59292.93 = 243.5
CALCULO DE LA VARIANZA Y LA
DESVIACION ESTANDAR
EJERCICIO: Calcular la media aritmtica, mediana, moda, varianza y
desviacin estndar, de los siguientes datos:
43, 51, 37, 39, 19, 24, 27 donde n = impar
Media aritmtica : x = (43+51+37+39+19+24+27)/7 = 34.3
Mediana: Se ordenan previamente los datos de menor a mayor:
19, 24, 27, 37, 39, 43, 51
Me = 37 (valor central)
Moda: Valor que se repite con ms frecuencia.
En este caso no hay moda.
Varianza: ((43-34.3)
2
+(51-34.3)
2
+(37-34.3)
2
+(39-34.3)
2
+(19-34.3)
2
+
(24-34.3)
2
+(27-34.3)
2
))/ (7-1) = 777.43/ 6 = 129.57
Desviacin estndar: \ 129.57 = 11.38
EJERCICIO: Calcular la media aritmtica, mediana, moda,
varianza y desviacin estndar, de los siguientes datos:
43, 51, 37, 39, 19, 24, 27, 62 donde n=par
Media aritmtica : x = (43+51+37+39+19+24+27+62)/8 = 37.75
Mediana: Se ordenan previamente los datos de menor a mayor:
19, 24, 27, 37, 39, 43, 51,62
Me = (37 + 39)/ 2 = 38 (valor central)
Moda : Valor que se repite con ms frecuencia.
En este caso no hay moda.
Varianza: ((43-37.75)
2
+(51-37.75)
2
+......+(62-37.75)
2
)/(8-1)=207.07
Desviacin estndar: \ 207.07 = 14.39
MEDIDAS DE FORMA
Las medidas de forma permiten conocer que
forma tiene la curva que representa la serie de
datos de la muestra.
a) Asimetra: mide si la curva tiene una
forma simtrica, es decir, si respecto al centro de la
misma (centro de simetra) los segmentos de curva
que quedan a derecha e izquierda son similares.
b) Curtosis: mide si los valores de la
distribucin estn ms o menos concentrados
alrededor de los valores medios de la muestra.
Asimetra, se refiere a si la curva que forman los valores
de la serie presenta la misma forma, a izquierda y
derecha de un valor central (media aritmtica)
ASIMETRIA
CURTOSIS
El Coeficiente de Curtosis analiza el grado de
concentracin que presentan los valores alrededor de la
zona central de la distribucin.
Se definen 3 tipos de distribuciones segn su grado de curtosis:
Distribucin mesocrtica: presenta un grado de
concentracin medio alrededor de los valores centrales de la
variable (el mismo que presenta una distribucin normal).
Distribucin leptocrtica: presenta un elevado
grado de concentracin alrededor de los valores centrales de la
variable.
Distribucin platicrtica: presenta un reducido
grado de concentracin alrededor de los valores centrales de la
variable.