You are on page 1of 16

1

Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs


Estadstica Inferencial Dra. Anglica Urquizo Mgs.

UNIDAD 1: Revisin de Estadstica Descriptiva.

La Estadstica descriptiva proporciona herramientas para organizar y
presentar datos, su objetivo es describir sus caractersticas. Estos se
pueden manejar en forma no agrupada (datos simples) y en forma
agrupada (organizando grupos o clases). A continuacin
estudiaremos las principales formas de presentar datos, medidas
de centralizacin, dispersin tanto para datos no agrupados como
para agrupados.

1.1 Variables
Una variable es una propiedad o caracterstica que puede variar y esta variacin es
susceptible de medicin.

Las variables puedes ser cuantitativas y cualitativas.
Se llaman cuantitativas, cuando se pueden expresar numricamente. Las cuantitativas
pueden ser a la vez discretas; cuando se pueden expresar mediante nmeros enteros, y
continuas cuando se expresan por nmeros reales.

Las variables cualitativas son aquellas que no se expresan numricamente, o en las que
un nmero no representa cantidad sino cualidad. A su vez pueden ser nominales u
ordinales. Las variables cualitativas ordinales, son aquellas que se pueden ordenar de
forma lgica ascendente o descendentemente. Las nominales en las que no reflejan un
orden.

Ejemplo 1


Variable Tipo
Nmero de hijos por familia

Cuantitativa discreta
Tiempo que demora un cliente de un banco en realizar una
transaccin bancaria

Cuantitativa continua
Religin Cualitativa nominal.
Calidad de un producto ( Malo, regular, bueno) Cualitativa ordinal.




2
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

Datos:

Un dato es el resultado de observar, contar o medir una caracterstica especfica de
inters (variable).

1.2 Distribucin de frecuencias, medidas de centralizacin y
dispersin para datos no agrupados:

1.2.1 Frecuencias de datos no agrupados:

La frecuencia absoluta de un dato, es el nmero de veces que aparece. La frecuencia
porcentual, es la relacin que existe entre la frecuencia absoluta del dato respecto al
total, expresada en porcentaje. La suma de las frecuencias absolutas de todos los datos,
debe ser igual al nmero total de datos, y la suma de las frecuencias porcentuales de
todos los datos debe ser igual a 100. La frecuencia porcentual se obtiene dividiendo la
frecuencia absoluta (f.i) de cada dato para el nmero total de datos (n) y multiplicado
por 100.
f.% = 100
.

n
i f


Ejemplo 2: Construir la tabla de frecuencias para los datos: 2, 3, 3, 4, 5, 5, 5, 6


Dato Frec.
Absoluta
(f.i)
Frec,
Porcentual
(f..%)
2 1 12-5%
3 2 25%
4 1 12.5%
5 3 37.5%
6 1 12.5%
Total 8 100%

1.2.2 Medidas de centralizacin

En un conjunto de datos es importante localizar su centro y su variabilidad.

La tendencia central de un conjunto de datos es la disposicin de stos para agruparse
alrededor del centro.

Entre las principales medidas de centralizacin tenemos: Media aritmtica, media
geomtrica , media armnica, mediana, modo.


a) Media aritmtica: Es el promedio de un conjunto de datos; es una buena medida de
tendencia central siempre que no se presenten valores extremos.
3
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

Se calcula sumando todos los datos y dividiendo para el nmero de datos:

Ejemplo 3: Calcule la media aritmtica de los siguientes datos: 3,4,5,6,6,7,8,9,10.

Desarrollo
a)
n
x
X
n
1 j
j
=
= = 6.44
9
58
9
10 9 8 7 6 6 5 4 3
= =
+ + + + + + + +


c) Mediana: Es el valor central de un conjunto de datos. Para calcularla en primer lugar
es necesario ordenar los datos ya sea en forma ascendente o descendente. Para calcular
la mediana se debe tomar en cuenta dos casos:
a) Si el nmero de datos es par: Se debe ubicar los dos datos centrales, lo cual se
consigue dividiendo el nmero de datos para 2, se toma el dato que est en esa
posicin y el siguiente. La mediana ser el promedio de los datos centrales.

Ejemplo 4: Calcular la mediana de: 5, 3, 6, 7, 5 ,1.
El primer paso es ordenar los datos: 1, 3, 5, 5, 6, 7
Como son 6 datos, la mitad es 3, entonces debemos tomar el dato que ocupa el
tercer lugar y el siguiente, que en este caso ser el que ocupa el cuarto lugar:
estos datos son 5 y 5, el promedio de los dos es 5, por lo tanto Md = 5.

b) Si el nmero de datos es impar: Se debe ubicar el dato central, y ese ser el
valor de la mediana. Para ello dividimos igual el nmero de datos para dos y
aproximamos ese valor, as obtendremos la posicin de la mediana.

Ejemplo 5: Calcular la mediana de: 4, 2, 5, 6, 7 .
El primer paso es ordenar los datos: 2, 4, 5, 6, 7
Como son 5 datos, al dividir para 2 sale 2.5, aproximando tenemos 3, luego el
tercer dato es la mediana, entonces Md = 5.


d) Moda: La moda de un conjunto de datos es el dato que mayor frecuencia tiene.

Ejemplo 6: Encuentre la moda de los siguientes datos: 2, 3, 3, 4, 5, 5, 5, 6

Primero construiremos la tabla de frecuencias para datos no agrupados.

Dato Frec.
Absoluta
(f.i)
2 1
3 2
4 1
5 3
6 1

4
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

Ahora buscamos el dato de mayor frecuencia, vemos que tanto en la frecuencia absoluta
como porcentual el dato que buscamos es el 5, por lo tanto la moda Mo = 5.
Ejemplo 7:

Con los siguientes datos: 3,4,5,6,6,7,8,9,10. Halle: a) la media aritmtica, b) mediana y
c) modo.
Desarrollo
a)
n
x
X
n
1 j
j
=
= = 6.44
9
58
9
10 9 8 7 6 6 5 4 3
= =
+ + + + + + + +

b) Md = 6, como son 9 datos, y 9 es impar tiene un dato central que se encuentra en la
quinta posicin , por lo tanto si contamos hasta el quinto dato, tenemos el 6.

c) Mo = 6, pues es el dato que ms se repite.

1.2.3 Medidas de dispersin:

Las medidas de dispersin indican cmo estn distribuidos los datos al rededor de las
medidas centrales; esto es, si los valores son muy pequeos los datos estn concentrados
alrededor del centro (poco dispersos), si son grandes, los datos estn alejados del centro
(muy dispersos).

Entre las principales medidas de dispersin tenemos: varianza, desviacin estndar,
coeficiente de variacin.

a) Varianza, desviacin estndar:
La varianza se obtiene sumando los cuadrados de las diferencias entre cada dato y la
media aritmtica (desviaciones) y dividiendo para el nmero total de datos menos 1:
1 - n
) X (x
s
n
1 i
2
i
2

=

=

Algunos autores trabajan con n-1 si el nmero de datos es pequeo, caso contrario con
n. La desviacin Estndar no es ms que la raz cuadrada de la varianza:
s =
2
s =
1 - n
) X (x
n
1 i
2
i
=


Ejemplo 8: Calcular la varianza y desviacin Estndar de 1, 4, 4, 5, 6.

Primero calculamos la media aritmtica x = (4+4+5+7)/4 = 5.
1 - n
) X (x
s
n
1 i
2
i
2

=

= =
3
) 5 7 ( ) 5 5 ( ) 5 4 ( ) 5 4 (
2 2 2 2
+ + +
=
3
6
= 2

5
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.


s = 2 = 1.41.

b) Rango

- El rango de una serie de datos discretos (enteros) se calcula as: Rango = mximo -
mnimo +1. Si los datos no son discretos: Rango = mximo - mnimo

NOTA. El rango puede ser afectado por el tamao de la muestra.

1.3 Distribucin de frecuencias, medidas de centralizacin y
dispersin para datos agrupados:

1.3.1. Frecuencias de datos agrupados:

Una tabla de frecuencias para datos agrupados consta de clases, lmites reales,
frecuencias absolutas, porcentuales, acumuladas, puntos medios.

Para determinar estos elementos, cuando el nmero de datos es relativamente grande, se
aconseja seguir el siguiente algoritmo:

- Se calcula la amplitud o rango: Amplitud = Mximo - mnimo (en datos discretos
Mximo - mnimo +1)

- El nmero de clases C debe estar en lo posible entre 5 y 20; una frmula que se
utiliza es la siguiente:
C = 1+3.33*
n
10
log , siendo n el nmero total de datos
- El ancho del intervalo c se calcula as (cuando todas las clases van a tener el mismo
ancho):
C
Amplitud
c = , donde C es el nmero de clases
- En cada clase se colocan los lmites inferiores y superiores (simples o absolutos)
- En cada clase se colocan los lmites reales inferiores y superiores (el lmite real
inferior es 0.5 menos del lmite inferior simple, y el lmite real superior es 0.5 ms
del lmite superior simple, siempre que stos sean enteros. Si stos tienen un decimal
el lmite real inferior es 0.05 menos del lmite inferior simple, y el lmite real
superior es 0.05 ms del lmite superior simple, y as sucesivamente)
- Se ponen los puntos medios de cada clase que son la semisuma de los lmites reales
correspondientes.
- Se colocan las frecuencias (absolutas o simples) de cada clase, que son el nmero de
observaciones que corresponden a cada clase.
- Se pueden colocar las frecuencias acumuladas. La frecuencia acumulada de cada
clase es la suma de todas las frecuencias inferiores incluida la de la clase.
- Se pueden colocar las frecuencias relativas que son las frecuencias absolutas o
simples de cada clase divididas para n. Se pueden colocar tambin las frecuencias
relativas acumuladas.
6
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

- En fin, se colocan las desviaciones o cualesquiera otros datos segn los estadgrafos
que vayamos a calcular.


Ejemplo 9:

Construir una tabla de frecuencias para datos agrupados con:

22 23 14 26 11 18 21 20 22 19 14 19 21 26 27 24 23 21
12 25 20 15 11 17 20 19 24 21 17 21 23 24 26 25 25 22
13 15 10 18 16 15 19 28 23 18 27 25 22 20 17 16 13 20
16 17 19 22 29 24 18 13 16 30 26

Primero se debe conocer el nmero de clases y el ancho convenientes:

Nmero de clases: 1+3.33log
10
65 = 7,04 que se aproxima a 7.

Ancho de clases: 20 / 7 = 2, 86 que se aproxima a 3.

Es decir que tendremos 7 clases de ancho 3.

Limites
reales
Clases F.i. F.% Puntos
medios
(C.i)
F.% acm
9.5 - 12.5 10-12 4 6,2 11 6,2
12.5 - 15.5 13-15 8 12,3 14 18,5
15.5 - 18.5 16-18 12 18,5 17 36,9
18.5 - 21.5 19-21 15 23,1 20 60,0
21.5 - 24.5 22-24 13 20,0 23 80,0
24.5 - 27.5 25-27 10 15,4 26 95,4
27.5 - 30.5 28-30 3 4,6 29 100,0
Total 65 100,0
1.3.2 Medidas de centralizacin

a) Media aritmtica: Para calcular la media aritmtica se debe multiplicar el punto
medio de cada clase por la frecuencia absoluta de la misma, luego se suman todos los
productos y se divide para el nmero total de datos:

n
fx
f
x f
x
k
1 i
i
k
1 i
i i

= =
=
=


Ejemplo 10: Calcule la media de los datos agrupados del Ejemplo 3.

Clases F.i. Puntos
medios
(x
i
.)
F.i *x
i
.
10-12 4 11 44
13-15 8 14 112
16-18 12 17 204
7
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

19-21 15 20 300
22-24 13 23 299
25-27 10 26 260
28-30 3 29 87
Total 65 = 1306

= =

=
n
x f
X
k
1 i
i i
=
65
1306
20.09


c) Mediana: Para calcular la mediana de datos agrupados, necesitamos primero
localizar la clase mediana o tambin llamado intervalo mediano. El intervalo mediano
contiene a la primera frecuencia acumulada mayor o igual a 2
n
. Luego se aplica la
siguiente frmula:
c
fmd
2
n
L Md
1
i
|
|
|
|
.
|

\
|

+ =

a
f

Donde:

i
L = lmite real inferior de la clase mediana.
n = nmero total de datos
1
a
f = frecuencia acumulada anterior a la del intervalo mediano.
fmd = frecuencia de la clase mediana
c = ancho del intervalo

Ejemplo 11 : Calcule la mediana de los datos agrupados del ejemplo 9


Limites
reales
Clases F.i. F.% Puntos
medios
(C.i)
F.i acm
9.5 - 12.5 10-12 4 6,2 11 4
12.5 - 15.5 13-15 8 12,3 14 12
15.5 - 18.5 16-18 12 18,5 17 24
Clase Md 18.5 - 21.5 19-21 15 23,1 20 39
21.5 - 24.5 22-24 13 20,0 23 52
24.5 - 27.5 25-27 10 15,4 26 62
27.5 - 30.5 28-30 3 4,6 29 65
Total 65 100,0

El intervalo mediano es el cuarto, porque la cuarta frecuencia acumulada 39 es la
mnima mayor o igual a 32.5
2
65
2
n
= = ; adems:
i
L = 18.5,
1
a
f = 24, fmd = 15, c = 3. Luego, el valor calculado de la mediana es:
8
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

c
fmd
f
2
n
L Md
1
i
a
|
|
|
|
.
|

\
|

+ =

= 20.2 3
15
24
2
65
18.5 =
|
|
|
|
.
|

\
|

+

d) Moda: Para calcular la moda de datos agrupados, debemos localizar la clase modal,
que es la que tiene mayor frecuencia absoluta. Luego aplicamos la frmula:

c
d d
d
L Mo
2 1
1
i
|
|
.
|

\
|
+
+ =
Donde:

1
d = frecuencia absoluta de la clase modal - frecuencia absoluta de la clase inferior
2
d = frecuencia absoluta de la clase modal frecuencia absoluta de la clase superior
c = ancho del intervalo de clase.

Si hay dos frecuencias ms altas la distribucin es bimodal.

Ejemplo 12: Calcule la moda de los datos agrupados del ejemplo 9

Limites
reales
Clases F.i.
9.5 - 12.5 10-12 4
12.5 - 15.5 13-15 8
15.5 - 18.5 16-18 12
Clase Modal 18.5 - 21.5 19-21 15
21.5 - 24.5 22-24 13
24.5 - 27.5 25-27 10
27.5 - 30.5 28-30 3
Total 65

La clase de mayor frecuencia es la cuarta, por lo tanto es la clase modal.
i
L = 18.5,
1
d = 15-12= 3 ,
2
d = 15-13 = 2, c = 3. Luego, el valor calculado de la moda
es:
c L Mo
2 1
1
i
|
|
.
|

\
|
+
+ =
d d
d
= 20.3 3
2 3
3
18.5 = |
.
|

\
|
+
+
Ejemplo 13:

Construir una tabla de frecuencias para datos agrupados con:

22 23 14 26 11 18 21 20 22 19 14 19 21 26 27 24 23 21
12 25 20 15 11 17 20 19 24 21 17 21 23 24 26 25 25 22
13 15 10 18 16 15 19 28 23 18 27 25 22 20 17 16 13 20
16 17 19 22 29 24 18 13 16 30 26

Primero se debe conocer el nmero de clases y el ancho convenientes:

Nmero de clases: 1+3.33log
10
65 = 7,04 que se aproxima a 7.

9
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

Ancho de clases: 20 / 7 = 2, 86 que se aproxima a 3.

Es decir que tendremos 7 clases de ancho 3. Es as como aparece:





Frequency Percent Valid
Percent
Cumulativ
e Percent

Valid 10-12 4 6,2 6,2 6,2
13-15 8 12,3 12,3 18,5
16-18 12 18,5 18,5 36,9
19-21 15 23,1 23,1 60,0
22-24 13 20,0 20,0 80,0
25-27 10 15,4 15,4 95,4
28-30 3 4,6 4,6 100,0
Total 65 100,0 100,0

La distribucin de frecuencias y los estadsticos anteriores fueron hechos en el
computador. Ahora calculemos los estadsticos utilizando las frmulas correspondientes
para datos agrupados en una distribucin de frecuencias:
a) Media aritmtica (promedio) = =

=
n
x f
X
k
1 i
i i
=
65
1306
20.09
b) Mediana: El intervalo mediano es el cuarto, porque la cuarta frecuencia acumulada
39 es la mnima mayor o igual a 32.5
2
65
2
n
= = ; adems:
i
L = 18.5,
1
a
f = 24, fmd = 15, c = 3. Luego, el valor calculado de la mediana es:
c
fmd
f
2
n
L Md
1
i
a
|
|
|
|
.
|

\
|

+ =

= 20.2 3
15
24
2
65
18.5 =
|
|
|
|
.
|

\
|

+
c) Moda

El intervalo modal es el cuarto, porque contiene a la mayor frecuencia absoluta; adems:

i
L = 18.5,
1
d = 3 ,
2
d = 2, c = 3. Luego, el valor calculado de la moda es:

c L Mo
2 1
1
i
|
|
.
|

\
|
+
+ =
d d
d
= 20.3 3
2 3
3
18.5 = |
.
|

\
|
+
+

10
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

1.3.2 Medidas de dispersin

a) Varianza y desviacin estndar

Aplicamos la siguiente frmula para la varianza:
1 - n
) X (x f
s
k
1 i
2
i i
2

=

=
Donde:
f
i
= frecuencia absoluta de la clase i
x
i
= punto medio de la clase i

De igual manera la desviacin estndar se calcula obteniendo la raz cuadrada de la
varianza.

Ejemplo 14 : Calcule la varianza y desviacin estndar de los datos agrupados del
apartado 1.2.2
Varianza =
1 - n
) X (x f
s
k
1 i
2
i i
2

=

= = 22.491
64
1439.447
=
Desviacin estndar = s =
2
s = 743 . 4 22.491 =


b) Coeficiente de variacin

En cualquiera de los dos casos, sean datos agrupados o no, el coeficiente de variacin
es el cociente entre la desviacin estndar y la media aritmtica, expresado en
porcentaje.
X
s
C.V =
Es til cuando:
a) Los datos estn en unidades diferentes.
b) Los datos estn en las mismas unidades pero las medias son muy distantes.

Ejemplo 15: Se desea comparar la variacin de los ingresos anuales de ejecutivos con
la variacin de los ingresos de trabajadores no calificados. Se sabe que para una grupo
de ejecutivos la media es de $500 000 y la desviacin estndar de $50 000, en cambio
para los empleados no calificados la media es de $22 000 y la desviacin estndar de
$2 200.

A simple vista se podra decir que existe ms dispersin en los sueldos de los
ejecutivos, pero calculemos los dos coeficientes de variacin:

C.V.
e
=
X
s
=
500000
50000
= 0.1 para transformar a porcentaje multiplicamos por 100%,
luego C.V.
e
= 10%.
11
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

C.V.
t
=
X
s
=
22000
2200
= 0.1 para transformar a porcentaje multiplicamos por 100%,
luego C.V.
t
= 10%. Por lo tanto no existe diferencia en la dispersin de los dos grupos.

1.4 Medidas de Posicin

1.4.1 Cuartiles, deciles y centiles (o percentiles)

Cuando una serie de datos se ordenan ascendentemente, puede interesar conocer por
ejemplo datos que se ubiquen en la cuarta parte, las dos cuartas y las tres curtas partes
de la distribucin; en este caso estamos hablando de los CUARTILES Q
1
, Q
2
, Q
3
. Si
queremos conocer datos ubicados en el primer dcimo, en los dos dcimos, ... estamos
hablando de los DECILES D
1
, D
2
, ....; as tambin, si queremos conocer datos ubicados
en la centsima parte, las dos centsimas; etc, estamos hablando de los CENTILES (o
percentiles) P
1
, P
2
, ... .

Generalmente estas medidas de dispersin interesan calcularse en datos agrupados, es
decir, cuando tenemos una tabla de distribucin de frecuencias. Entonces habr que
hablar de dos aspectos: a) de la posicin en un intervalo, y, b) de su valor calculado.

a) La posicin de estos estadsticos en el intervalo correspondiente se encuentra
utilizando por ejemplo las siguientes frmulas:
Posicin de Q
i
=
4
n . i
; as por ejemplo Posicin de Q
1
=
4
n

Posicin de D
i
=
10
n . i
; as por ejemplo Posicin de D
7
=
10
n 7

Posicin de P
i
=
100
n . i
; as por ejemplo Posicin de P
5
=
100
n 5


NOTA. Si n es pequeo es preferible poner n+1 en vez de n
El intervalo posicin I
i
correspondiente es el que contiene a la primera frecuencia
acumulada mayor o igual al valor de la posicin.

b) Clculo de los valores de los cuartiles, deciles y centiles (o percentiles)

Las siguientes frmulas se utilizan generalmente para calcular los cuartiles:
c
f
f
4
n
L Q
1
Q
1
i 1
a
|
|
|
|
.
|

\
|

+ =

, c
f
f
2
n
L Q
2
Q
1
i 2
a
|
|
|
|
.
|

\
|

+ =

, c
f
f
4
3n
L Q
3
Q
1
i 3
a
|
|
|
|
.
|

\
|

+ =


donde:
L
i
es el lmite real inferior de la clase que contiene a dicho cuartil.
1
a
f

es la frecuencia acumulada del intervalo inmediato anterior al intervalo que


contiene al cuartil.
f
1
Q
, f
2
Q
,
3
Q
f son las frecuencias de los intervalos de los cuartiles uno, dos y tres
respectivamente.
12
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

c es el ancho del intervalo que contiene al cuartil correspondiente, es la diferencia de los
lmites reales del intervalo.

Para calcular los deciles, puede utilizarse las frmulas:
c
f
f
10
n
L D
1
D
1
i 1
a
|
|
|
|
.
|

\
|

+ =

,
c
f
f
10
2n
L D
2
D
1
i 2
a
|
|
|
|
.
|

\
|

+ =

,... , c
f
f
10
kn
L D
Dk
1
i k
a
|
|
|
|
.
|

\
|

+ =

; etc.
donde:
L
i
es el lmite real inferior de la clase que contiene a dicho decil.
1
a
f

es la frecuencia acumulada del intervalo inmediato anterior al intervalo que


contiene al decil. f
1
D
, f
2
D
,...,
Dk
f , . . . son las frecuencias de los intervalos de los
deciles uno, dos,..., k respectivamente. c es el ancho del intervalo que contiene al decil
correspondiente.

Para calcular los percentiles (o centiles), puede utilizarse las frmulas:
c
f
f
100
n
L P
1
P
1
i 1
a
|
|
|
|
.
|

\
|

+ =

, c
f
f
100
2n
L P
2
P
1
i 2
a
|
|
|
|
.
|

\
|

+ =

,..., c
f
f
100
kn
L P
k
1
i k
P
a
|
|
|
|
.
|

\
|

+ =

; etc.
donde:
L
i
es el lmite real inferior de la clase que contiene a dicho percentil.
1
a
f

es la frecuencia acumulada del intervalo inmediato anterior al intervalo que


contiene al percentil.
f
1
P
, f
2
P
,..., f
k
P
son las frecuencias de los intervalos de los percentiles uno, dos,..., k
respectivamente.
c es el ancho del intervalo que contiene al percentil correspondiente.
13
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

1.5 Grficos: Diagramas de barras, grfico de lneas, circular o
de pastel, histogramas y polgonos de frecuencias

Los diagramas de barras, los histogramas y polgonos de frecuencias tienen como
abscisas los puntajes (o puntos medios en datos agrupados) y como ordenadas las
frecuencias absolutas; se hacen tambin grficos de distribucin de frecuencias relativas
(
n
f
r
f = ), frecuencias acumuladas (ojivas), frecuencias relativas acumuladas (ojivas
porcentuales).

Los grficos de pastel son grficos circulares cuyas reas son proporcionales a las
frecuencias; as 360 grados equivale a n que es el nmero de casos o al porcentaje, los
grados del sector circular de cada frecuencia se obtiene con la frmulas
n
f(360)
.
Ejemplo 16:

A continuacin se presentan grficos de barras, de lneas y de pastel que se realizaron
en el SPSS 8.0


Diagrama de barras
20,00 18,00 17,00 14,00 13,00 9,00
C
o
u
n
t
3,5
3,0
2,5
2,0
1,5
1,0
,5


Grfico de lneas
20,00 18,00 17,00 14,00 13,00 9,00
C
o
u
n
t
3,5
3,0
2,5
2,0
1,5
1,0
,5


Histograma
7,0 6,0 5,0 4,0 3,0 2,0 1,0
16
14
12
10
8
6
4
2
0

Grfico pastel
4,6%
15,4%
20,0%
23,1%
18,5%
12,3%
6,2%
28-30
25-27
22-24
19-21
16-18
13-15
10-12
14
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.


Cuadro Resumen 1:

PRINCIPALES MEDIDAS DE CENTRALIZACIN EN DATOS NO AGRUPADOS
Y AGRUPADOS

* Datos no
agrupados
Datos agrupados
MEDIA ARITMTICA. Es el
promedio de un conjunto de
datos; es una buena medida de
tendencia central siempre que
no se presenten valores
extremos.
k = nmero de clases
i
x = punto medio de la clase i
n
x
x
n
1 j
j
=
=
n
fx
f
x f
x
k
1 i
i
k
1 i
i i

= =
=
=



MEDIANA. Es el valor
central de un conjunto
ordenado de datos. Se
prefiere cuando la
distribucin es asimtrica.
Primero se
ordenan los datos,
luego si el nmero
de datos es impar
es el dato central.
Si el nmero de
datos es par, es el
promedio de los
datos centrales.

c
fmd
2
n
L Md
1
i
|
|
|
|
.
|

\
|

+ =

a
f

El intervalo mediano contiene a la primera
frecuencia acumulada mayor o igual a
2
n

i
L = lmite real inferior de la
clase mediana.
n = nmero total de datos
1
a
f = frecuencia acumulada anterior a la del
intervalo mediano.
fmd = frecuencia de la clase mediana
c = ancho del intervalo




MODA. Es el dato de mayor
frecuencia
.






Dato que ms se repite


c
d d
d
L Mo
2 1
1
i
|
|
.
|

\
|
+
+ =
1
d = frecuencia de la clase modal
-frecuencia de la clase inferior
2
d = frecuencia de la clase modal
-frecuencia de la clase superior
c = ancho del intervalo de clase.
La moda puede calcularse inclusive con
variables categricas.
La clase modal es la clase que contiene a la
mayor frecuencia. Si hay dos frecuencias
iguales la distribucin es BIMODAL

15
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

Cuadro Resumen 2: PRINCIPALES MEDIDAS DE DISPERSIN
PARA DATOS AGRUPADOS Y NO AGRUPADOS.


Datos no agrupados Datos agrupados
2
s = VARIANZA (o
desviacin cuadrtica media)
. Es la media de los
cuadrados de las
desviaciones
si n es pequeo se pone n-1
en vez de n, aproxima mejor.


1 - n
) X (x
s
n
1 i
2
i
2

=

=

1 - n
) X (x f
s
k
1 i
2
i i
2

=

=
s = DESVIACIN TPICA
O ESTANDAR. Es la raz
cuadrada de la varianza.
s para la muestra
para la poblacin

s =
1 - n
) X (x
n
1 i
2
i
=


1 - n
) X (x f
k
1 i
2
i i
=

= s
CV = COEFICIENTE DE
VARIACIN. Es el cociente entre
la desviacin estndar y la media
aritmtica.
Mide el grado de
homogeneidad de los datos,
si C.V < 33% los datos son
homogneos, si C.V>33%
los datos son heterogneos
(dispersos)

X
s
C.V =


16
Maestra en Educacin Matemtica Dr. Angel Urquizo Mgs
Estadstica Inferencial Dra. Anglica Urquizo Mgs.

Actividad 1:

EJERCICIO 1: Con los siguientes datos: 1,2,3,5,5,6,6,6,7,8,10,10. Halle: a) media
aritmtica, b) mediana, y c) modo.

EJERCICIO 2: Con los siguientes datos:

12,4,6,10,1,9,8,11,12,3,7,4,5,6,9,8,9,12,8,9,7,7,11,13,13,11,13,4,8,9,14,5,6,4,7,15,6,11,
10,17,7,10,12,10,14,10,12,13,20,14,11,9,13,16,14,16,16,19,17,14,15,16,15,17,20.

a) Agrupe los datos utilizando la hoja Excel.
b) Tomando como base el cuadro anterior, elabore un cuadro de distribucin de
frecuencias con: Lmites, lmites reales, frecuencias absolutas, porcentuales y
puntos medios.
c) Utilizando las frmulas correspondientes para datos agrupados en una
distribucin de frecuencias calcule: promedio, mediana, moda.

EJERCICIO 3

a) Con los siguientes datos: 24, 22, 24, 27, 22, 24, 24, 21, 20, 24 elabore el diagrama
de barras y de lneas en Excel.
b) Con los datos agrupados del Ejercicio 2, elabore: histograma y diagrama pastel en
excel.

EJERCICIO 4: Con los datos no agrupados del EJERCICIO 2. Hallle: a) los 3 cuartiles,
b) los deciles 1 y 9, c) los centiles 10 y 95, d) varianza, desviacin estndar.


Auto evaluacin 1

Diga si son verdaderas o falsas los siguientes enunciados:

a) La media de un conjunto de datos es el dato que ms se repite.( )
b) La desviacin estndar se calcula sacando la raz cuadrada de la varianza.( )
c) Los cuartiles dividen a los datos en 3 partes iguales.( )
d) El histograma se construye con los datos y las frecuencias acumuladas. ( )
e) La frecuencia porcentual es la semisuma de los lmites de clase cuando se
agrupan los datos.( )

You might also like