You are on page 1of 17

UNIDAD DOS

MEDIDAS ESTADSTICAS

La estadstica es una ciencia que demuestra que si mi vecino tiene


dos coches y yo ninguno, los dos tenemos uno.
Frase de George Bernard Shaw

PALABRAS CLAVE

Datos originales o datos sin agrupar, datos agrupados, Media o


promedio, Mediana, Moda, Cuartil, Percentil, Varianza,
Desviacin estndar.

2.1 Objetivos Especficos de la Unidad


1. Calcular la media aritmtica, la mediana, la moda en datos originales y en
datos agrupados
2. Interpretar cada una de estas medidas y comprender sus aplicaciones.
3. Explicar que indican las medidas de dispersin con respecto al valor
promedio
4. Calcular la varianza, desviacin estndar en datos originales y datos
agrupados
5. Interpretar la desviacin estndar y comprender su aplicacin.
6. Calcular e interpretar las medidas de localizacin

2.2 COMPETENCIAS
El estudiante identifica y aplica la medida apropiada para caracterizar
la informacin e interpreta los resultados obtenidos a partir del uso
correcto de las formulas.

2.3 DESARROLLO TEMATICO


2.3.1 MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de observaciones, con frecuencia se desea describir el grupo
con un solo nmero. Para tal fin, desde luego, no se usar el valor ms elevado ni
el valor ms pequeo como nico representante, ya que solo representan los
extremos ms bien que valores tpicos. Entonces sera ms adecuado buscar un
valor central. Las medidas que describen un valor tpico en un grupo de
observaciones suelen llamarse medidas de tendencia central. Es importante tener
en cuenta que estas medidas se aplican a grupos ms bien que a individuos. Un
promedio es una caracterstica de grupo, no individual.
Todas las medidas tanto de tendencia central como de dispersin se estudian bajo
la ptica de datos originales o sin agrupar o datos agrupados (los que aparecen en
tablas de frecuencias), aunque el concepto de la medida es el mismo bajo las dos
formas.

2.4.1.1 LA MEDIA ARITMETICA


Es la medida de tendencia central ms conocida, es fcil de calcular, sus formulas
permiten tratamiento algebraico. Para representarla utilizamos un smbolo que la
diferencia de acuerdo a si se trabaja en una poblacin o en una muestra, aunque
la formula que se aplica es igual en los dos casos.
SIMBOLO

MEDIA MUESTRAL
MEDIA POBLACIONAL

2.4.1.1.1 Datos sin agrupar


La media aritmtica se define como la suma de todos los valores observados
dividida por el nmero de observaciones (n).
La formula para datos no agrupados es:

Ejemplo: se pregunta a un grupo de personas sobre la edad y se obtienen los


siguientes resultados:
X: Edad (aos)
La media es:

17

18

19

20

21 22 23

Se Interpreta diciendo que la edad promedio es de 20 aos.


En muchas ocasiones se habla en trminos del valor promedio, por ejemplo se
dice hay un grupo de personas que tienen una edad promedio de 20 aos, se
puede pensar que las personas son las del grupo anterior, pero cuando se observa
el grupo las edades son:
4 5 6 65

El promedio de estos datos es:

En este ejemplo se puede ver que esta medida presenta el inconveniente de ser
muy sensible a los valores extremos, cuando estos son demasiados bajos o
demasiado altos.

2.4.1.1.2 Datos agrupados


Es claro que la media aritmtica es la sumatoria de los datos dividida entre el
numero total de datos, sin embargo cuando se tiene una tabla de frecuencias o
datos agrupados para efectuar ese proceso se debe recordar que la marca de
clase es el valor representativo o caracterstico del grupo y que la frecuencia
absoluta es el nmero de datos que pertenecen a la respectiva clase.
Para las distribuciones con datos agrupados, existe una formula, tambin fcil de
aplicar:

en donde ni corresponde a las frecuencias y Xi al valor de marca de clase


Ejemplo
La distribucin sobre la edad de un grupo de personas se presenta en la siguiente
tabla:

Intervalos

Xi

ni

Xi*ni

Marca de frecuencias
clase
30 34

32

128

34 38

36

252

38 42

40

320

42 46

44

264

46 50

48

240

Total

n =30

1204

(Recuerde que la marca de clase es el punto medio de cada intervalo. Para


obtenerla se suman los lmites en cada intervalo y se divide entre dos).

X =

12045=
40.13

30

Observe que por facilidad para el manejo de esta medida se ha abierto una
columna adicional en la tabla marcada como Xi*ni (la multiplicacin de las dos
columnas).
La media aritmtica solo se puede calcular con valores numricos, es decir que
estn en escala de intervalos o de razn

2.4.1.1.3 Media ponderada:


La media ponderada es un caso especial de la media aritmtica, se presenta
cuando cada uno de los valores de la variable tiene un peso o una importancia
diferente y esto se ve reflejado en el clculo de la media.
La media ponderada se obtiene multiplicando cada valor de la variable por su
peso o ponderacin correspondiente.
Ejemplo
Un curso se evala con un primer parcial que tiene un valor del 20%, un segundo
parcial con un valor del 50% y un taller con un valor del 30%. Si un estudiante
obtiene una nota de 3,5 en el primer parcial, 2,8 en el segundo parcial y 4,2 en el
taller Cul es la nota promedio?

Valor

ponderacin

Xi

Wi

3,5

20

2,8

50

4,2

30

En formula la media ponderada se escribe de la siguiente forma:


Xi : Valor de la variable
Wi: Peso o ponderacin

La formula se presenta como

Observe la similitud que tiene con la media para datos agrupados.

2.4.1.2 LA MEDIANA

SIMBOLO

Me:

2.4.1.2.1 Datos sin agrupar

MEDIANA

La mediana se define como la medida de tendencia central que divide a cualquier


distribucin en dos partes iguales, es decir es el valor que ocupa la posicin
central de los datos ordenados.
En la siguiente distribucin:

7, 8, 8, 9, 12, 15, 18, 18, 20, 21, 23

La mediana es 15, porque se sita en el punto que divide la distribucin en dos


partes iguales. Hay el mismo nmero de casos antes y despus de 15.
La mediana se usa en variables medidas en escala ordinal, intervalo o de razn.
Para interpretar esta medida se tiene en cuenta que cuando se tienen todos los
datos se habla del 100% de la informacin:
50%

50%

------------------------------------------------*----------------------------------------------------7

15

23

La mediana al quedar en el centro de los datos los divide en dos grupos. Para el
grupo de la izquierda la mediana es el valor mximo del 50% de los datos ms
pequeos. Para el grupo de la derecha se convierte en el mnimo del 50% de los
datos ms grandes.
Cuando hay una distribucin con un nmero par de casos,(n es par) la mediana es
el promedio de los dos valores medios. As, en la siguiente distribucin:

78, 95, 86, 73, 52, 90, 89, 84, 76, 92

n = 10 (par)
El valor de la mediana es 85, porque, primero al ordenar la distribucin de menor
a mayor queda:
52, 73, 76, 78, 84, 86, 89, 90, 92, 95

Siendo 10 el total de datos, los que aparecen en la posicin quinta y sexta estn
en la mitad de la distribucin, entonces la mediana ser:

Este resultado indica que el 50% de los valores ms bajos tienen un valor mximo
de 85.
2.4.1.2.2 Datos agrupados
Cuando se tiene informacin agrupada, la mediana se define como el valor del
intervalo que divide la distribucin en dos partes iguales.

Variable Discreta
Cuando la variable es discreta como en el siguiente ejemplo sobre el nmero de
hijos de un grupo de familias:
X: Nmero de hijos por familia
Xi

ni

Ni

12

12

15

27

35

40

42

n = 42
Para ubicar el valor central:
1. Calcule las frecuencias absolutas acumuladas.

2. Se calcula el valor n/2


3. Se compara n/2 con las frecuencias absolutas acumuladas Ni hasta
encontrar la menor frecuencia acumulada que contiene el valor n/2
4. La mediana es el valor de la variable en donde esta contenido n/2

En la tabla anterior

21 se compara con las Ni y se encuentra contenido en Ni=27 (menor frecuencia


que lo contiene), por lo tanto la mediana es 2.

Variable Continua

Los pasos a seguir en el clculo de la mediana son:


1. Encuentre las frecuencias absolutas acumuladas.
2. Con base en la frecuencia absoluta acumulada ubique el intervalo donde
quede la frecuencia correspondiente a la mitad del tamao de la muestra
es decir n/2
3. Compare el valor de n/2 con la frecuencia absoluta acumulada hasta
obtener la menor frecuencia acumulada que lo contiene.
4. Aplique la siguiente formula:
5.

en donde:

Li = Limite inferior del grupo en donde se ubica n/2


N i-1= Frecuencia absoluta acumulada en el grupo anterior a donde esta ubicado
n/2
ni = Frecuencia del intervalo donde esta n/2
C = Amplitud del intervalo

Ejemplo
Los siguientes datos representan los puntajes obtenidos por un grupo de
estudiantes en una prueba de aptitud.

Puntaje

No estudiantes

Ni

ni
20

30

30

40

13

Ni-1

40

50

19

32

grupo mediana

50

60

39

60

70

45

70

80

50

Me = 46.32
El 50% de los estudiantes con menores puntajes obtienen un valor mximo de
46,32

2.4.1.3 La moda

SIMBOLO

Md:

MODA

10

2.4.1.3.1 Datos sin agrupar


La moda de una distribucin se define como el valor que presenta la mayor
frecuencia. Se usa con mediciones de escala nominal, ordinal, de intervalo y de
razn.
Es comnmente utilizada como una medida de popularidad, que refleja la
tendencia de una opinin.

Para los datos: 5

10

La moda es 7
En algunas distribuciones solo hay una moda, pero en otras puede haber dos o
mas modas.
Si tomamos los siguientes datos:
1, 4, 4, 4, 2, 5, 5, 8, 6, 3, 5,
Se observa que tanto el cuatro como el cinco aparecen con mas frecuencia y en
tres ocasiones. Es decir, hay dos modas y la distribucin es bimodal.
Puede existir el caso en el que todos los datos se repiten con la misma frecuencia,
en este caso se dice que no hay moda, por ejemplo:
3

Md = No hay
O como en el siguiente caso:
2

3 3

Los datos se repiten el mismo nmero de veces por lo tanto no hay moda.
2.4.1.3.2 Datos agrupados

Variable Continua
Cuando se trabaja con datos agrupados, la moda se puede calcular con la
siguiente formula:

11

en donde:
Li = Limite inferior del grupo en donde se ubica la mayor frecuencia absoluta
ni= Frecuencia absoluta del grupo de la moda
ni-1 = Frecuencia absoluta en el grupo anterior al de la moda
ni+1 = Frecuencia absoluta del grupo posterior al de la moda
Ci = Amplitud del intervalo de la moda
El grupo de la moda es el que tiene la mayor frecuencia.
La siguiente tabla muestra la distribucin obtenida al estudiar los puntajes
obtenidos por 50 estudiantes como calificacin en un curso de estadstica
Puntaje

No estudiantes

20 30

30

40

ni-1

40

50

19

ni

50

60

ni+1

60

70

70

80

El intervalo que contiene el mayor nmero de casos o mayor frecuencia es


40 50. Con este intervalo se aplica la formula de la moda:

12

Moda = 44.54
Se interpreta diciendo que la mayora de las personas obtienen un puntaje de
44,54 (se deja en valor decimal, no se aproxima porque la variable es continua).

2.4.1.4 Propiedades de la media, mediana y moda


Propiedades de la media aritmtica
1. Puede ser calculada en distribuciones con escala de razn o de intervalo.
2. Todos los valores son incluidos en el cmputo de la media.
3. Una serie de datos solo tiene una media.
4. Es una medida muy til para comparar dos o ms poblaciones.
Desventajas de la media aritmtica
Si alguno de los valores es extremadamente grande o extremadamente pequeo,
la media no es el promedio apropiado para representar la serie de datos.
Propiedades de la mediana
1. Hay solo una mediana en una serie de datos.
2. No es afectada por los valores extremos (altos o bajos)
3. Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si
no se encuentra en el intervalo abierto.
Propiedades de la moda
1. La moda se puede determinar en todos los tipos de mediciones (nominal,
ordinal, de intervalo, y de razn).
2. La moda tiene la ventaja de no ser afectada por valores extremos.
3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos
abiertos.

13

Desventajas de la moda
En muchas series de datos no hay moda porque ningn valor aparece ms de una
vez.
En algunas series de datos hay ms de una moda, en este caso uno podra
preguntarse cul es el valor representativo de la serie de datos?

EJEMPLO 3
Los siguientes datos representan el tiempo (en minutos) que se toman cada uno
de los nueve empleados de una entidad financiera en atender a un cliente
1

a. Cul es la moda?
b. Cul es la media?
c. Cul es la mediana?
SOLUCIN
a. Moda = 2 y 3 los datos son bimodales
La mayora de los empleados gastan 2 o 3 minutos en atender los clientes
b. Media:

Entonces

El tiempo promedio de atencin es de 2 minutos por cliente.


c. Para calcular la mediana primero se ordenan los datos de menor a mayor:
1 1

Se halla el valor ubicado en el centro de los datos


Me = 2
El 50% de los empleados que menos tiempo gastan en atender a los clientes
tienen un tiempo mximo de 2 minutos.

14

Se puede interpretar tambin: el 50% de los empleados que ms tiempo gastan


en atender a los clientes tienen un tiempo mnimo de 2 minutos.

EJEMPLO 4
Como parte de un plan de desarrollo y apertura de planes de ahorro y vivienda, la
asociacin de entidades financieras necesita conocer el nivel de ahorro mensual
de sus clientes. Para ello seleccion muestras en dos de sus filiales: Bancos, y
Fondos de Ahorro. Los datos obtenidos fueron los siguientes expresados en miles
de pesos al mes.
En Bancos se obtuvieron los siguientes registros:
50, 72, 25, 20, 75, 85, 40, 30, 98, 50

Y de los Fondos de Ahorro se obtuvo la siguiente distribucin del Ahorro.


AHORRO

Nro. De Clientes

15

23

16

23

31

31

39

21

39

47

14

47

55

10

a) Identificar: Poblacin, muestra, variable, tipo de variable, escala de


medida.
b) Calcular e interpretar el ahorro promedio de los clientes en cada una de las
dos filiales.
c) Calcular e interpretar el ahorro promedio de los clientes en las dos filiales
en conjunto.

SOLUCION
a) Poblacin:

Clientes que ahorran en las entidades financieras

Muestra: 80 clientes seleccionados (10 de bancos y 70 de Fondos de Ahorro)


Variable: Ahorro mensual en miles de pesos

15

Tipo de variable: Cuantitativa continua


Escala de medida: De razn
b) Ahorro promedio en Bancos:
Se utiliza la formula de la media para datos sin agrupar:

En bancos el ahorro promedio es de $54.500 por cliente

En fondos de ahorro se utiliza la frmula para datos agrupados:

AHORRO

Nro. De
Clientes

15

23

ni
16

23

31

31

39

21

39

47

14

47

55

10
70

Xi

X in i

19

304

27

243

35

735

43

602

51

510
2394

En fondos el ahorro promedio es de $34.200 por cliente


c) Para calcular el ahorro promedio de las dos filiales en conjunto se tiene en
cuenta que:
Bancos

nmero de clientes n = 10

16

Fondos de ahorro

nmero de clientes n = 70

El ahorro promedio de los clientes en las dos filiales en conjunto es de $36.740

2.5 BIBLIOGRAFA
(1) Martnez B. C., Estadstica y Muestreo. 11 ed., ECOE, 2002.
(2) Lind D.A., Marchall W.G, Wathen S.A. Estadstica para Administracin y Economa,
Decimotercera edicin .Mc Graw Hill 2008
(3) Lincoln L.CH.,Estadstica para las Ciencias Administativas, 3 ed. Mc. Graw Hill 1993.
(4) Webster A. L., Estadstica aplicada a los negocios y la economa 3 ed. Mc. Graw
Hill,2000
(5) NEWBOLD Paul, Estadstica para los Negocios y la Economa. Ed. Prentice Hall.
(6) Montiel A.M.,Rius F.,Barn F.J., Elementos Bsicos de Estadstica Econmica y
Empresarial, 1 ed. Prentice Hall, 1997.

17

You might also like