You are on page 1of 51

MEDIDAS DE RESUMEN

 MEDIDAS DE TENDENCIA CENTRAL: Expresan el valor al cual tienden los datos .


- Media Aritmética ( X A )
- Media Armónica ( X H )
- Media Geométrica ( X G )

 MEDIDAS DE POSICION: Expresan un lugar en la distribución empírica de una variable.


- Mediana (Me)
- Moda (Mo)
- Cuartil (Qr)
- Decil (Dr)
- Percentil (Pr)

 MEDIDAS DE DISPERSION: expresan el grado de alejamiento de los datos respecto a una medida de tendencia
central.
- Rango (R)
- Rango intercuartil
- Varianza ( X )
2

- Desviación estándar ( X )
- Coeficiente de Variación (Cv)
Tipos de Mediciones
Medidas de Tendencia Central

La mayoría de los levantamientos de encuestas


mantienen una tendencia bien definida a agruparse o
aglomerarse alrededor de cierto punto central.

Siempre se puede obtener un valor típico que representa


o describe a todos los demás datos de la muestra.

2-2008 3
Media Aritmética

Es la medida de tendencia central más


utilizada, también se le conoce con el
nombre de Promedio.

Para calcular la media aritmética, se


suman todos los datos de la muestra y el
resultado se divide entre el total de datos.
2-2008
4
Media aritmética

Media muestral : X
Media Poblacional : 
MEDIA ARITMETICA
PARA DATOS NO
AGRUPADOS
Media Aritmética para datos no
agrupados
b) DATOS NO AGRUPADOS EN TABLAS
El símbolo que representa a la media aritmética
es una letra X con una barra sobre ella.
n

x i
X  i 1

n
La letra x significa uno de los datos de la muestra y la i es el
conteo de los datos específicos
2-2008
7
Media Aritmética

La fórmula en su esquema de desarrollo


se presenta de la siguiente manera:

x1  x2  x3  x4  ... xn
X
n

2-2008
8
Ejemplo
Los sueldos semanales de 5 trabajadores de
una obra de construcción civil son los
siguientes : 500, 550, 600, 700 y 800 nuevos
soles . Por lo tanto el sueldo promedio de los
5 trabajadores es :
Desarrollo
DATOS:
500, 550, 600 , 700, 800
5

x i
XA  i 1

5
500  550  600  700  800
XA 
5
3150
XA  El sueldo promedio semanal que recibe
5 cada trabajador de construcción civil
es aproximadamente 630 nuevos soles.
X A  630
10
Media Geométrica
 Es la raíz enésima del producto de los n valores de una
serie. Esto es, dado los n valores X 1 , , X n

X G  n X1 ,, X n

 La media geométrica o promedio geométrico se usa


cuando hay que promediar razones, proporciones o
tasas de crecimiento.
Ejemplo de Media geométrica
 La producción anual de baterías de una fabrica, ha tenido el
siguiente crecimiento:
1990 a 1991 la producción aumento de 800 a 1000 baterías. (25%)
1991 a 1992 la producción aumento de 1000 a 15000 baterias (50%)
1992 a 1993 la producción aumento de 1500 a 3300 (120%)
Cada año fue el aumento fue de 25%, 50% y 120%,
respectivamente. ¿Cuál fue el aumento promedio anual de la
producción?

R: 53,1%
Media Armónica
 La media armónica se designa por X H

n
XH  n
1

i 1 xi

 La media armonica de un conjunto de valores X1 ,, X n


 Es el inverso de la media aritmetica de los inversos de
los valores considerados.
Ejemplo de media armónica.
 Un equipo de trabajadores textiles tienen que
producir 180 metros de casimir; de los cuales
elaboran los primeros 90 metros con una
productividad de 15 metros diarios , y los 90 metros
restantes lo hacen a razon de 20 metros por día
¿Cuál es la productividad diaria durante todo el
trabajo ?
R: 17,14 metros diarios.
MEDIA ARITMETICA
PARA DATOS
AGRUPADOS EN
TABLAS
Ejemplo
 En una muestra de presupuestos familiares, se ha obtenido la
siguiente información respecto al número de hijos de 21 familias

3 2 2 2 1 1 4 1 2 1 2 3 3 3 3 0 2 3 1 3 2 3

La variable es el numero de Hijos por familias, es decir


Xi= Nº de hijos/ familia, donde los 21 valores de la variable
serian X1, X2 ... X21
21

 Xi  44
i 1
21

 Xi 44
X  i 1
  2.095
21 21
b) DATOS AGRUPADOS EN TABLAS
 Los datos se pueden presentar o agrupar en tablas sin
intervalos y en tablas con intervalos , en ambos casos se
usa la Media Aritmética Pondera.
Tablas sin Intervalo (Ejemplo)
w

y f i i Nº hijos
Nº de
Xi*fi
Y  i 1 familias
Xi
fi
n 0 1 0
w

 yi fi 44
1
2
5
7
5
14
Y i 1
  2.095
n 21 3 7 21
Redondeando por se variable discreta, se 4 1 4
tiene que el número de hijos promedio por TOTAL 21 44
familia es = 2
TABLAS CON INTERVALOS
 El calculo de la media es a partir del uso de la “marca de
clase” Yi para representar el valor de cada elemento
incluido en su respectivo intervalo.
Marca Nº de
Nº de Nº de
de trabajadores
Trabajadores empresas
clase ponderados w
(Y i-1 - Y i] yi fi yifi y f i i
23 26 24,5 5 122,5 Y  i 1

26 29 27,5 40 1100 n
2685.00
29 32 30,5 27 823,5
 29.8
32 35 33,5 11 368,5 90
35 38 36,5 3 109,5 El número promedio de
trabajadores por empresa es
38 41 39,5 3 118,5
30
41 44 42,5 1 42,5
total 90 2685
Observación:
 Para un mismo conjunto de datos se obtiene
valores ligeramente diferentes para su media; hay
que tener presente que toda agrupación de
intervalos siempre produce sesgos, y ésta es una
característica del trabajo estadístico. Los
estadígrafos no son valores exactos, pero si son
representativos de una realidad.
MEDIANA (Me)

Para un conjunto de datos ORDENADOS de mayor a


menor, la mitad de los valores serán menores o iguales a
la MEDIANA mientras que la mitad restante será
mayor o igual a la MEDIANA

50% 50%

X mín X máx
Me

La mediana divide una distribución de


frecuencia en 2 mitades
Para datos no agrupados
El número de horas de trabajo acumulado en
tres semanas de 9 trabajadores es: 154-125-
120-150-150-40-136-120-150
40-120-120-125-136-150-150-150-154

El número de horas de trabajo acumulado en


tres semanas de 10 ptrabajadores es: 154-150-
125-120-150-150-40-136-120-150
40-120-120-125-136-150-150-150-150-154
xn  xn1
Me   143
2
PARA DATOS AGRUPADOS SIN INTERVAOS

Es aquel valor de la variable cuya frecuencia absoluta


acumulada es inmediatamente mayor a la mitad de las
observaciones
El número de hijos en 80
familias se distribuye de la
Nº de hijos fi Fi
siguiente forma:
0 5 5

1 8
2 10
N 80
3 12   40
2 2
4 15
5 13
6 10
7 7 Me = 4 hijos
80
PARA DATOS AGRUPADOS EN INTERVALOS

Para calcular la mediana se usa la siguiente fórmula:


 n 
 2  F j 1 
Me  Li  c *  
F
 j  F j 1 
 
Donde:
Li = Límite inferior del intervalo que contiene a la mediana

Fj-1 = Frecuencia absoluta acumulada inferior a n/2


Fj = Frecuencia absoluta acumulada superior a n/2

n = número de observaciones
c = Amplitud del intervalo que contiene a la mediana
Ejemplo : Una empresa de transportes recibió en
un día 58 paquetes , cuyos pesos en kg. son:

n 
2  F j 1 
Me  Li  C   
F
 j  F j 1 
PESO DE NUMERO Fi
LOS DE
 
PAQUETES PAQUETES  58 
fi   22 
Me  39,5  5   2   41.25
 42  22 
29.5 – 34.5 8 8  
34.5 – 39.5 14 22
39.5 – 44.5 20 42 El 50% de los paquetes tienen
44.5 – 49.5 12 54 pesos menores e iguales a 41,25
49.5 – 54.5 4 58
kg. y el 50% de los paquetes
restantes pesan más de 41,25kg.
TOTAL 58
MODA

 Se refiere al valor de la variable que más se


repite en una distribución de frecuencia, o el
valor que está representado por el mayor
número de observaciones
 En un gráfico de barra o histograma la moda
corresponde al valor en que la distribución
alcanza el máximo
MODA PARA DATOS AGRUPADOS

Nº de hijos fi
0 5
1 8
2 10 La Moda son 4 hijos
3 12
4 15
5 13
6 10
7 7
80
Si la distribución es un histograma existe la
Intervalo (CLASE) MODAL

10
Frecuencia

150 155 160 165 170 175 180 185 190

Altura (cm)

la MODA es la marca de clase del


intervalo que contiene la mayor frecuencia
Dependiendo del número de modas que tenga la
distribución de frecuencias se hablará de una
distribución ...

 Un Máximo = Unimodal
 Dos Máximos = Bimodal
 Más de 2 máximos = Multimodal
b) Moda para datos agrupados en tablas:
Para calcular la moda se usa la siguiente fórmula:

 d1 
Mo  Li  c  
 1
d  d 2 i

Donde:
Li = Límite inferior del intervalo que contiene a la moda.

fj = Mayor frecuencia absoluta simple


fi+1 = Frecuencia absoluta inmediata superior
d1= fj – fi-1
d2= fj – fi+1

c = Amplitud del intervalo que contiene a la mediana


A
B
Agrupando en 6 clases Agrupando en 5 clases
Intervalos Frecuencias Intervalos Frecuencias
13.5 - 16.5 2 12.5 - 16.5 2
16.5 - 19.5 9 16.5 - 20.5 13
19.5 - 22.5 13 20.5 - 24.5 16
22.5 - 25.5 9 24.5 - 28.5 11
25.5 - 28.5 9 28.5 - 32.5 1
28.5 - 31.5 1 TOTAL 43
TOTAL 43

Clase Modal = 19.5-22.5 Clase Modal = 20.5-24.5

Moda = ? Moda = ?

En el caso de frecuencias agrupadas, la


MODA varía según la forma de agrupar
Cuartil : Divide al conjunto de observaciones en
cuatro partes iguales

Para calcular el Cuartil-r se usa la siguiente fórmula:


 nr 
  F j 1 
Qr  Li  c *  4 
F
 j  F j 1 
 
Donde:
Li = Límite inferior del intervalo que contiene al cuartil

Fj-1 = Frecuencia absoluta acumulada inferior a nr/4


Fj = Frecuencia absoluta acumulada superior a nr/4

n = número de observaciones
c = Amplitud del intervalo que contiene al cuartil
Decil : Divide al conjunto de observaciones en diez
partes iguales

Para calcular el Decil-r se usa la siguiente fórmula:


 nr 
  F j 1 
Dr  Li  c *  10 
F
 j  F j 1 
 
Donde:
Li = Límite inferior del intervalo que contiene al decil-r

Fj-1 = Frecuencia absoluta acumulada inferior a nr/10


Fj = Frecuencia absoluta acumulada superior a nr/10

n = número de observaciones
c = Amplitud del intervalo que contiene al decil-ril
Percentil : Divide al conjunto de observaciones en
cien partes iguales

Para calcular el Percentil-r se usa la siguiente


fórmula:
 nr 
  F j 1 
Pr  Li  c *  100 
 F  F  
Donde:
j j 1
 

Li = Límite inferior del intervalo que contiene al percentil-r

Fj-1 = Frecuencia absoluta acumulada inferior a nr/100


Fj = Frecuencia absoluta acumulada superior a nr/100

n = número de observaciones
c = Amplitud del intervalo que contiene al percentil-r
DISTRIBUCIONES SIMETRICAS -
ASIMETRICAS

Si Md<Me<Y : Asmétrica Positiva


MEDIDAS DE POSICIÓN
LOS CUANTILES
Son valores que dividen a la distribución en partes
iguales, es decir, en intervalos que comprenden el
mismo número de observaciones. Los que más se
utilizan son: los CUARTILES, DECILES Y PERCENTILES.

Los CUARTILES son 3 valores que dividen a la distribución en 4


partes iguales, cada una de las cuales contienen el 25% de las
observaciones.

Los DECILES (PERCENTILES) son 9 (99) valores que dividen a la


distribución en 10 (100) partes iguales, cada una de las cuales
contiene el 10% (1%) de las observaciones.
Recorrido (Rango)

Cuanto mayor es el recorrido mayor es la dispersión de la


distribución de la variable en estudio
Ejemplo:
Se tiene los siguientes costos de producción de cierto
producto: 50, 60, 80, 120
Desarrollo:
 El rango de los costos es igual a 120 – 50 = 70.
 El 100% de los costos se encuentran distribuidos a una
distancia de 70 nuevos soles
Varianza
Varianza para datos no agrupados
w

 i
( y  y ) 2

S2  i 1

n 1
Varianza para datos agrupados
w

(y i  y ) fi
2

S2  i 1

n 1
Desviación estándar

Desviación estándar para datos no agrupados


w

 i
( y  y ) 2

S i 1

n 1
Desviación estándar para datos agrupados

(y i  y ) fi
2

S i 1

n 1
Desviación Estándar para
datos no agrupados
1 w
S  i
n  1 i 1
( y  y ) 2

1 n 2

2
S yi  n y
n  1 i 1

Representa la dispersión promedio de cada uno de los datos con respecto a


la media aritmética, así:
podemos tener dos muestras que tienen la misma media, pero que tienen
diferente Desviación Estándar
Desviación Estándar
para datos agrupados
1 w
S 
n  1 i 1
( yi  y ) 2
fi

1 n 2

2
S yi f i  n y
n  1 i 1

Representa la dispersión promedio de cada uno de los datos con respecto a


la media aritmética, así:
podemos tener dos muestras que tienen la misma media, pero que tienen
diferente Desviación Estándar
El Coeficiente de Variación

S
CV  100%
x
Nos permite la comparación entre distintas variables y poblaciones.
Mide el grado de homogeneidad o heterogeneidad en una o más poblaciones.
Su principal característica es estar desprovisto de unidades.
El valor se puede expresar en términos porcentuales
Ejemplo:
Suponga que se desea determinar la varianza,
desviación estándar y coeficiente de variabilidad de los
ingresos mensuales por venta de 6tiendas elegidas
aleatoriamente:
200, 500, 800, 900, 1200, 400
Determine :
Varianza =
Desviación estándar =
Promedio =
Coeficiente de variabilidad=
Ejemplo:
Suponga que se desea determinar la varianza,
desviación estándar y coeficiente de variabilidad de los
ingresos mensuales por venta de 5 tiendas elegidas
aleatoriamente:
200, 500, 800, 900, 1200, 400
Verifique las medidas:
Varianza = 147000
Desviación estándar= 383,4057903
Promedio =720
Coeficiente de variabilidad= 53,2508042
El Coeficiente de Variación

S
CV  100%
x
Nos permite la comparación entre distintas variables y poblaciones.
Mide el grado de homogeneidad o heterogeneidad en una o más poblaciones.
Su principal característica es estar desprovisto de unidades.
El valor se puede expresar en términos porcentuales
MEDIDAS DE FORMA
Asimetría o Sesgo
 Una distribución es simétrica si la
mitad izquierda de su distribución
es la imagen especular de su mitad
derecha.

 En las distribuciones simétricas


media y mediana coinciden. Si sólo
hay una moda también coincide

 La asimetría es positiva o negativa


en función de a qué lado se
encuentra la cola de la distribución.

 La media tiende a desplazarse hacia


las valores extremos (colas).

 Las discrepancias entre las medidas


de centralización son indicación de
asimetría.
Asimetría : Mide la deformación horizontal
respecto a su promedio o valor central

 Si el As>o : tiene asimetría positiva. La distribución


extiende la cola hacia los valores grandes de la variable.
 Si el As<o : tiene asimetría negativa. La distribución
extiende la cola hacia los valores pequeños de la
variable.
 Si el As  o : se trata de una distribución simétrica.
Coeficientes de karl Pearson
Coeficientes de Asimetria
 Coeficientes de karl  Coeficiente de Arthur
Pearson Boeley

y  Mo
As  Q3  2Q2  Q1
s
As 
As 

3 y  Me  Q3  Q1
s
Apuntamiento o Kurtosis 160

La Kurtosis nos indica el grado de apuntamiento 140

(aplastamiento) de una distribución con respecto a la 120

distribución normal o gaussiana. Es adimensional.


100

Platicúrtica: curtosis < 0 80

Frecuencia
60
Mesocúrtica: curtosis = 0
40
45 48 51 54 57 60 63 66 69 72 75 78 81 84

Leptocúrtica: curtosis > 0 Platicúrtica

400
300

Los gráficos que veis poseen la 300


200

misma media y desviación típica,


pero con diferente grado de 200
100

apuntamiento.

Frecuencia
En el curso serán de especial 100
Frecuencia

interés las mesocúrticas y 27


32
37
41
45
49
53
57
61
65
69
73
77
81
85
89
93
99

simétricas (parecidas a la normal). 0


Mesocúrtica

3 27 37 47 57 67 77 87 97 108
16 32 42 52 62 72 82 92 102 138

Leptocúrtica
Kurtosis: mide el grado de elevación o
apuntamiento de una distribución
 Leptokurtica, Si k>0,263, es decir, es más apuntada que
la normal
 Mesocrática, Si k= 0,263, es decir es tan apuntada como
la normal
 Platikurtica, Si k< 0,263, es decir, es menos apuntada que
la normal
Q3  Q1
K
2  P90  P10 

You might also like