You are on page 1of 12

1 Medidas

El siguiente paso que debe dar el analista de la informacin es resumir la in-


formacin que tiene disponible una vez que la ha organizado y representado
mediante la tabulacin y los grcos. Para resumir la informacin dispone de
las siguientes medidas que son distintas funciones de la variable:
Medidas de tendencia central.
Medidas de dispersin
Medidas de posicin.
1.1 Medidas de tendencia central
Estas medidas pretenden caracterizar la distribucin de la variable/s que esta-
mos analizando por los valores del centro. Es decir, son valores representativos
de todos los valores que toma la variable.
Media aritmtica:
Representa el centro de gravedad de una distribucin y se dene como la
suma ponderada de los valores de la variable por sus frecuenci as relativas y lo
denotaremos por X y se calcula mediante la expresin:
X =
n
X
i=1
c
i
+ f
i
=
n
X
i=1
c
i
+ n
i
N
dnde x
i
representa el valor de la variable en distribuciones no agrupadas o
la marca de clase en distribuciones agrupadas. Es decir, en este ltimo caso, se
hace el supuesto que la frecuencia del intervalo est agrupada en la marca de
clase.
El inconveniente de la media aritmtica es que es muy sensible a los valores
extremos de una di stribucin.
Ejemplos:
1
1. Calcular la media de una distribucin estadstica que viene dada por la
siguiente tabla:
c
i
n
i
c
i
+ n
i
61 5 305
64 18 1152
67 42 2814
71 27 1890
73 8 584
100 7645
X =
n
P
i=1
cini
N
=
7645
100
2. Calcular la media aritmtica:
estatura
N
o
Personas
n
i
M:Clase
c
i
n
i
c
i
[140 150) 20 145 2900
[150 160) 100 155 15500
[160 180) 80 170 13600
[180 200) 10 190 1900
n = 210 33900
Media : X =
n
X
i=1
c
i
+ n
i
N
=
33900
210
= 161:42
Mediana:
La mediana es el valor central de la variable, es decir, supuesta la muestra
ordenada en orden creciente o decreciente, el valor que divide en dos partes la
muestra. Para calcular la mediana debemos tener en cuenta si la variable es
discreta o continua.
Variables Discretas
2
- Datos en serie:
1. N

impar de observaciones: Ejemplo:


2; 2; 2; 3; (5) ; 6; 7; 7; 8 Me = 5
2. N
o
par de observaciones: Ejemplo:
4; 6; 6; 6; [7 ; 8; 8; 9 Me = 6 7
Indeterminado entre 6 y 7
- Datos en tabla:
Para determinar el intervalo en el que se encuentra la mediana se acumulan
las frecuencias y el primer intervalo cuya frecuencia
acumulada (N
i
) sea mayor o igual a
N
2
es el intervalo que contiene la
mediana. Si llamamos L
i
y L
i+1
a los lmites del intervalo que contiene la
mediana, n
i
a la frecuencia ordinaria de dicho intervalo, N
i
a la frecuencia
acumulada, N
i1
la frecuencia acumulada hasta el intervalo anterior y A
i
la
amplitud del inter valo entonces la frmula es la siguiente:
Me = L
i
+
N
2
N
i1
n
i
A
i
Ejemplo:
clase
frecuencia
absoluta
frecuencia
absoluta
acumulada
[49; 5 59; 5) 3 3
[59; 5 69; 5) 7 10
[69; 5 79; 5) 18 28
[79; 5 89; 5) 12 40
[89; 5 99; 5) 8 48
[99; 5 109; 5) 2 50
si N = 50 entonces
N
2
= 25; por lo tanto la frecuencia acumulada que
ms se acerca es el intervalo [69; 5 79; 5) por que su frecuencia acumulada es
de 28:
3
Me = L
i
+
N
2
N
i1
n
i
A
i
= 69; 5 +
25 10
18
10 = 77; 83
Moda
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la
que ms se repite, es la nica medida de centralizacin que tiene sentido estudiar
en una variable cualitativa, pues no precisa la realizacin de ningn clculo.
Por su propia denicin, la moda no es nica, pues puede haber dos o ms
valores de la variable que tengan la misma frecuencia siendo esta mxima. En
cuyo caso tendremos una distribucin bimodal o polimodal segn el caso.
Variables discretas
- Datos en serie
2; 2; 3; 3; 3; 3; 5; 6; 7 Mo = 3
- Datos en tabla
X
i
n
i
1 34
2 36
3 45
4 22
5 17
por lo tanto Mo = 3
Variables continuas
Mo = L
i
+
(n
i
n
i1
)
(n
i
n
i1
) + (n
i
n
i+1
)
A
i
Tambin se utiliza otra frmula de la moda que da un valor aproximado de
sta:
Mo = L
i
+
(n
i+1
)
(n
i1
) + (n
i+1
)
A
i
4
Ejemplo: Calcular la moda de una distribucin estadstica que viene dada
por la siguiente tabla:
n
i
60 63 5
63 66 18
66 69 42
69 72 27
72 75 8
100
Mo = 66 +
(42 18)
(42 18) + (42 27)
3 = 67; 846
Mo = 66 +
27
18 + 27
3 = 67; 8
1.2 Medidas de dispersin
Hasta el momento hemos estudiado los valores centrales de la distribucin, pero
tambin es importante conocer si los valores en general estn cerca o alejados
de estos valores centrales, para ver si estos valores son o no son representativos.
Es por esto por lo que surge la necesidad de estudiar medidas de dispersin.
Rango o recorrido
El rango o recorrido intercuartlico es la diferencia entre el valor mximo y
el valor mnimo en un grupo de nmeros aleatorios. Se le suele simbolizar con
R
Rango = (Max Min)
Varianza
5
La varianza es la media aritmtica del cuadrado de las desviaciones respecto
a la media de una distribucin estadstica.
La varianza se representa por signo
2
:

2
=

X
1
X

2
+

X
2
X

2
+ ::: +

X
n
X

2
N
=
P
n
i=1

X
i
X

2
N
- varianza para datos agrupados

2
=
n
X
i=1
c
2
i
n
i
N
X
2
Ejemplos: Calcular la varianza de la distribucin:
9; 3; 8; 8; 9; 8; 9; 18
X =
9+3+8+8+9+8+9+18
8
= 9

2
=
(X1X)
2
+(X2X)
2
+:::+(XnX)
2
N
=
(99)
2
+(39)
2
+(89)
2
+(89)
2
+(99)
2
+(89)
2
+(99)
2
+(189)
2
8
=
15
Calcular la varianza de la distribucin de la tabla:
c
i
n
i
c
i
:n
i
c
2
i
:n
i
[10; 20) 15 1 15 225
[20; 30) 25 8 200 5000
[30; 40) 35 10 350 12250
[40; 50) 45 9 405 18225
[50; 60) 55 8 440 24200
[60; 70) 65 4 260 16900
[70; 80) 75 2 150 11250
42 1820 88050
X =
1820
42
= 43; 33
6

2
=
P
n
i=1
c
2
i
ni
N
X
2
=
88050
42
43; 33
2
= 218; 94
Propiedades de la varianza
1. La varianza ser siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
2. Si a todos los valores de la variable se les suma un nmero la varianza
no vara.
3. Si todos los valores de la variable se multiplican por un nmero la varianza
queda multiplicada por el cuadrado de dicho nmero.
4. Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas varianzas se puede calcular la varianza total
Desviacin tpica
La desviacin tpica es la raz cuadrada de la varianza. Es decir, la raz
cuadrada de la media de los cuadrados de las puntuaciones de desviacin. La
desviacin tpica se representa por :
=
s

X
1
X

2
+

X
2
X

2
+ ::: +

X
n
X

2
N
=
s
P
n
i=1

X
i
X

2
N
- Desviacin tpica para datos agrupados
=
v
u
u
t
n
X
i=1
c
2
i
n
i
N
X
2
Ambas medidas, tanto la varianza como la desviacin tpica siempre son
positivas.
La desviacin tpica es la mejor medida de dispersin y la ms empleada.
Cuando las distribuciones de frecuencias se aproximan a una distribucin simtrica
o normal entonces se verica una propiedad muy importante.
7
Ejemplos:
- Calcular la desviacin tpica de la distribucin:
9; 3; 8; 8; 9; 8; 9; 18
X =
9+3+8+8+9+8+9+18
8
= 9
=
r
(X1X)
2
+(X2X)
2
+:::+(XnX)
2
N
=
q
(99)
2
+(39)
2
+(89)
2
+(89)
2
+(99)
2
+(89)
2
+(99)
2
+(189)
2
8
=
3; 87
- Calcular la desviacin tpica de la distribucin de la tabla: (utilizamos el
ejercicio anterior)
X =
1820
42
= 43; 33
=
q
P
n
i=1
c
2
i
ni
N
X
2
=
q
88050
42
43; 33
2
=
_
218; 94 = 14; 796
Propiedades de la desviacin tpica
1. La desviacin tpica ser siempre un valor positivo o cero, en el caso de
que las puntuaciones sean iguales.
2. Si a todos los valores de la variable se les suma un nmero la desviacin
tpica no vara.
3. Si todos los valores de la variable se multiplican por un nmero la
desviacin tpica queda multiplicada por dicho nmero.
4. Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas desviaciones tpicas se puede calcular la desviacin tpica total.
Coeciente de variacin
El coeciente de variacin es la relacin entre la desviacin tpica de una
muestra y su media.
Cv =

X
8
El coeciente de variacin se suele expresar en porcentajes:
Cv =

X
:100
El coeciente de variacin permite comparar las dispersiones de dos distribu-
ciones distintas, siempre que sus medias sean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen
se comparan entre s. La mayor dispersin corresponder al valor del coeciente
de variacin mayor.
Una distribucin tiene X = 140 y = 28:28 y otra X = 150 y = 24.
Cul de las dos presenta mayor dispersin?
Cv =

X
:100 =
28; 28
140
:100 = 20; 2%
Cv =

X
:100 =
24
150
:100 = 16%
La primera distribucin presenta mayor dispersin.
2 Medidas de posicin (Cuantiles)
Estas medidas dividen a la poblacin en partes iguales y sirven para clasicar a
un individuo dentro de una determinada muestra o poblacin (mismo concepto
que la mediana)
Cuartiles
Medidas de localizacin que divide a la poblacin en cuatro partes iguales
(C
1
; C
2
y C
3
).
C
1
: Valor de la distribucin que deja el 75% de los valores por encima
C
2
: Valor de la variable que deja el 50% de los valores de la variable por
encima (coincide con la mediana)
9
C
3
: Valor de la variable que deja el 25% de los valores de la variable por
encima
C
t
= L
i1
+
N:K
4
N
i1
n
i
A
i
Ejemplos: Calcular los cuartiles las series estadsticas:
(a) 3; 5; 2; 7; 6; 4; 9:
2 3 4 5 6 7 9
| | |
Q
1
Me Q
3
(b) 3; 5; 2; 7; 6; 4; 9; 1
1 2 3 3 5 6 7 9
2; 5 4; 5 6; 5
| | |
Q
1
Me Q
3
Una distribucin estadstica viene dada por la siguiente tabla:
Hallar los cuartiles 1
o
y 3
o
.
c
i
n
i
N
i
[10; 15) 12; 5 3 3
[15; 20) 17; 5 5 8
[20; 25) 22; 5 7 15
[25; 30) 27; 5 4 19
[30; 35) 32; 5 2 21
21
21

25
100

= 5; 25 C
1
= L
i1
+
N:K
4
Ni1
ni
A
i
= 15+
5;253
5
5 = 17; 25
21

75
100

= 15; 75 C
3
= L
i1
+
N:K
4
Ni1
ni
A
i
= 25+
515;7515
4
5 =
25; 9375
10
Deciles
Medidas de localizacin que divide a la poblacin en diez partes iguales dk =
Decil k-simo es aquel valor de la variable que deja a su izquierda el k10% de
la distribucin.
D
t
= L
i1
+
N:K
10
N
i1
n
i
A
i
Ejemplos:
1. Dadas las series estadstica: 3; 5; 2; 7; 6; 4; 9:
Calcular: Los deciles 2
o
y 7
o
.
Nmero de elementos: 8
Clculo del segundo decil:
8

2
10

= 1; 6 D
2
= 2
Clculo del sptimo decil:
8

7
10

= 5; 6 D
2
= 6
2, Calcular los deciles de la distribucin de la tabla:
n
i
N
i
[50; 60) 8 8
[60; 70) 10 18
[70; 80) 16 34
[80; 90) 14 48
[90; 100) 10 58
[100; 110) 5 63
[110; 120) 2 65
65
Clculo del primer decil
65

1
10

= 6; 5 D
1
= 50 +
6;50
8
10 = 58; 12
Clculo del segundo decil
65

2
10

= 13 D
2
= 60 +
138
10
10 = 65
11
Clculo del noveno decil
65

9
10

= 58; 5 D
9
= 100 +
58;558
5
10 = 101
Percentiles
Medidas de localizacin que divide a la poblacin en cien partes iguales. El
primer percentil supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.
Pk = Percentil k-simo es aquel valor que deja a su izquierda el K + 1% de
la distribucin
P
t
= L
i1
+
N:K
100
N
i1
n
i
A
i
Quintiles
Los QUINTILES dividen a la poblacin en cinco partes iguales, cada una
de ellas contiene al 20% de los datos de la poblacin. Existen 4 quintiles que se
denotan por Q
1
; Q
2
; Q
3
; Q
4
:
Q
t
= L
i1
+
N:K
5
N
i1
n
i
A
i
12

You might also like