You are on page 1of 26

Pedro Castro Ortega

Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Tema 8: Estadstica en una variable (unidimensional)


1. Introduccin
Se desconocen con exactitud los orgenes de la Estadstica. Parece que fueron los
chinos, en el 2200 a. C., los primeros en efectuar recuentos de su poblacin. Tanto los
egipcios como los griegos y los romanos prevean sus cosechas por medios que
podramos llamar estadsticos y efectuaban censos de poblacin.
En los siglos XVI y XVII la Estadstica pasa a tener como principal objetivo el estudio
de los asuntos de Estado, de donde deriva el sentido etimolgico de la palabra. Desde
entonces experimenta una evolucin que pasa por varias fases. Inicialmente, la
preocupacin fundamental era la recogida, clasificacin y representacin de los datos;
ms tarde se pas a la fase de anlisis e interpretacin de los mismos.
En una primera aproximacin, usamos la palabra estadstica para designar colecciones
de datos numricos de la misma naturaleza, relativos a un determinado fenmeno:
estadstica de los automviles vendidos, estadstica de las importaciones, estadstica de
los divorcios, etc. En un sentido ms riguroso, la Estadstica es un mtodo cientfico
que, a partir del conocimiento de diversos hechos recogidos, hace inferencias que
permiten la previsin de nuevos acontecimientos.
Para hablar del objeto de la Estadstica, hemos de comenzar por distinguir fenmenos
deterministas y aleatorios.

Fenmenos deterministas (o causales) son los que al repetirlos en idnticas


condiciones producen el mismo resultado. Por ejemplo, el tiempo que tarda un
mvil, a velocidad constante, en recorrer una distancia dada.

Fenmenos aleatorios (de azar o estadsticos) son los que al repetirlos un gran
nmero de veces, en idnticas condiciones, presentan resultados diferentes, siendo
imposible predecir el resultado de cada prueba particular. Por ejemplo, los
resultados del lanzamiento de un dado.

El mtodo de trabajo de la Estadstica tiene tres vertientes:

Descripcin de los datos observados (Estadstica Descriptiva).

Modelizacin del comportamiento (Clculo de Probabilidades).

Estimacin de lo desconocido y generalizacin (Teora de Muestras e Inferencia


Estadstica).

Teniendo en cuenta los mtodos de trabajo de la Estadstica encontramos sus


aplicaciones:

Descripcin.

Anlisis.

Prediccin.

Una clasificacin ms general presenta las tcnicas estadsticas en dos grupos con
funciones distintas:

Estadstica Descriptiva.
o Reduccin y descripcin de informaciones voluminosas.
123

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

o Recuento, ordenacin y clasificacin de datos observados.


o Presentacin de datos en forma resumida y manejable:

Tablas.

Grficas.

Clculo de parmetros estadsticos que caracterizan la distribucin de


los datos: medias, medianas, cuartiles, percentiles, varianza,
desviacin tpica, ...

o No utiliza el Clculo de Probabilidades.

Estadstica Inferencial.
o Se apoya en el Clculo de Probabilidades.
o Maneja resultados de la Estadstica Descriptiva.
o Plantea y resuelve el problema de establecer previsiones y conclusiones
generales sobre una poblacin o colectivo.

Tanto en esta tema como en el siguiente se trabajar la Estadstica Descriptiva en una


variable (unidimensional) y en dos variables (bidimensional).

2. Primeras definiciones
2.1. Poblacin y muestra
La poblacin o universo estadstico es el conjunto de elementos que poseen al menos
una caracterstica comn y sobre los cuales va a incidir el anlisis estadstico. El nmero
de elementos de una poblacin es su tamao (que puede ser finito o no). Si la poblacin
es finita lo representaremos por N.
No siempre es posible efectuar el estudio de todos los elementos de una poblacin. En
este caso, el estudio se puede limitar a una parte de ese todo: a una muestra. As, una
muestra es un subconjunto de la poblacin.
Los elementos de la poblacin se llaman individuos o unidades estadsticas.

Ejemplos

Estudiando muestras finitas representativas se obtienen conclusiones que se pueden


aplicar a toda la poblacin. Para que una muestra sea representativa de la poblacin es
preciso que el muestreo sea aleatorio, es decir, que cualquier individuo de la poblacin
tenga la misma probabilidad de pertenecer a la muestra, en cuyo caso se habla de
muestra aleatoria.
a) En un sondeo de opinin realizado por una empresa para conocer la intencin
de voto de los habitantes de una ciudad, la poblacin est formada por el
conjunto de todos los individuos con derecho a voto. De ella se extraer un
conjunto de personas a las que se entrevistar: stas forman la muestra.
b) Para estudiar la proporcin de tornillos defectuosos que produce una fbrica
en una semana, se eligen al azar 1000 tornillos. La poblacin la constituyen
todos los tornillos fabricados en la semana. La muestra la forman los 1000
tornillos seleccionados.

124

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

2.2. Caracteres y modalidades

Ejemplo

En relacin con cada unidad estadstica pueden ser observadas distintas propiedades que
permiten clasificar a los individuos de la poblacin: estas propiedades se llaman
caracteres o caractersticas estadsticas.
Consideremos una poblacin formada por N estudiantes. Cada estudiante es un
individuo de la poblacin que puede ser estudiado atendiendo a distintos
caracteres: sexo, edad, estatura, lugar de nacimiento, nota obtenida en el ltimo
examen, color del pelo, ...

Para cada caracterstica, deben estar definidas todas las situaciones posibles en que se
puede encontrar una unidad estadstica: stas son las modalidades. En cuanto a las
modalidades, hemos de cuidarnos no slo de enumerarlas sino que han de estar bien
definidas, de modo que cada individuo pueda pertenecer a una y slo una de ellas: las
modalidades han de ser incompatibles (mutuamente excluyentes) y exhaustivas (cubrir
toda la poblacin).

Ejemplo

Es posible clasificar los caracteres en cuantitativos (o variables estadsticas), si son


susceptibles de representacin numrica, y cualitativos (o atributos), en caso contrario.
Consideremos la poblacin formada por todos los alumnos de un Instituto y los
siguientes caracteres: sexo, edad, curso y estatura:

El carcter sexo tiene dos modalidades: hombre y mujer. Este carcter es


por tanto cualitativo.

El carcter edad tiene las siguientes modalidades: {12, 13, 14, 15, 16, 17,
18} si entendemos que la edad se describe por aos cumplidos. Este
carcter es por tanto cuantitativo y podremos hablar de la variable
estadstica edad.

El curso tiene las modalidades 1 ESO, 2 ESO, 3 ESO, 4 ESO,


1 Bachillerato y 2 Bachillerato y por tanto es cualitativo.

Por ltimo el carcter estatura se puede dividir, por ejemplo, en las


siguientes modalidades: {( , 160], (160, 170], (170, 180], (180, + )},
donde se est adoptando como unidad de medida los centmetros. Se
puede hablar por tanto de la variable estadstica estatura.

2.3. Variables estadsticas discretas y continuas


Con respecto a cada unidad estadstica o individuo de una poblacin podemos
determinar varios caracteres que pueden se cuantitativos o cualitativos, como se ha visto
anteriormente. Cada carcter cuantitativo es una variable estadstica; dicho de otro
modo, una variable estadstica es un aspecto medible de la unidad estadstica. La
medicin de la variable de cada individuo de la poblacin permitir clasificar sus
elementos en modalidades.
Las variables suelen representarse por letras maysculas: X, Y, ..., y los valores que
toma cada una de ellas con las mismas letras que la variable, pero en minscula y con
subndices: x1, x2, x3, ..., xk, ..., si nos referimos a la variable X; y1, y2, y3, ..., yk, ..., si
nos referimos a la variable Y.
125

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Diremos que una variable estadstica es discreta si su campo de variacin, esto es, el
conjunto de valores que toma la variable, est formado por puntos aislados (en nmero
finito o infinito numerable).

Ejemplo

Diremos que una variable estadstica es continua si su campo de variacin es, al menos
tericamente, un intervalo de la recta real. Dados dos valores cualesquiera de los que
toma la variable, siempre existe entre ellos una infinidad de valores que puede tomar.
Son variables estadsticas discretas:

El nmero de coches fabricados en un ao.

El nmero de pacientes atendidos cierto da en un Centro de Salud.

El nmero de ordenadores en cada Instituto de la provincia.

Son variables estadsticas continuas:

El peso de los alumnos de un Instituto.

La estatura de los mismos alumnos.

Las temperaturas registradas en un observatorio cada hora.

En la prctica, aunque una variable sea continua, cuando la medimos la estamos


haciendo discreta, dada la limitacin de los instrumentos de medida. No obstante, al
clasificar las variables lo que hacemos es atender a su naturaleza, y no a los resultados
obtenidos de la medicin.
Atendiendo al nmero de caracteres cuantitativos que observamos en cada individuo, las
variables pueden ser unidimensionales, bidimensionales, tridimensionales, ..., segn se
estudie en cada individuo de la poblacin uno, dos, tres, ..., caracteres, respectivamente.
En este tema nos dedicaremos al estudio de las variables estadsticas unidimensionales
y, en el siguiente, a las bidimensionales.
En el siguiente esquema se resumen los conceptos anteriores:
Discretas: valores aislados
Caracteres Estadsticos

Cuantitativos
(Variables Estadsticas)

Continuas: valores en un
intervalo de la recta real.

Cualitativos (Atributos)

3. Frecuencias y tablas de frecuencias


Consideremos una poblacin o muestra que consta de N individuos. Sea k el nmero de
modalidades definidas para un determinado carcter. Tendremos entonces las
modalidades M1, M2, ..., Mk.
Se llama frecuencia absoluta, ni, de la modalidad Mi, al nmero de individuos de la
poblacin que pertenecen a dicha modalidad (el nmero de veces que se repite). Como
n

las modalidades son incompatibles y exhaustivas, se tiene que

ni = N
i 1

126

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Se llama frecuencia relativa, fi, de la modalidad Mi, a la proporcin de individuos de la


poblacin que presentan dicha modalidad. Es decir, si el nmero total de individuos es
n
N, entonces: fi i y por tanto 0 fi 1
N
Llamaremos frecuencia absoluta acumulada, Ni, de la modalidad Mi, a la suma de las
frecuencias absolutas hasta la i-sima modalidad. Es decir:
i

Ni = n1 + n2 + ... + ni =

nr
r 1

Llamaremos frecuencia relativa acumulada, Fi, de la modalidad Mi, a la suma de las


frecuencias relativas hasta la de la i-sima modalidad. Es decir:
i

Fi = f1 + f2 + ... + fi =

fr
r 1

Los datos observados de una poblacin se muestran clasificados y ordenados para dar
mayor claridad y ofrecer una visin global del conjunto, que sea interpretable. Las dos
formas de representacin, que suponen los dos primeros pasos que hay que dar en el
tratamiento estadstico de la informacin, son las tablas estadsticas y las
representaciones grficas.
Las tablas ms simples son las que constan de una primera columna en la que se reflejan
las distintas modalidades que presenta el carcter en estudio. Se aaden una o ms
columnas a su derecha en las que se anotan las respectivas frecuencias y otras ms para
clculos posteriores.
El aspecto general de una tabla simple, para un carcter con k modalidades, es la
siguiente:
Modalidades
Mi
M1
M2
...
Mi
...
Mk

Frecuencias
absolutas
ordinarias
ni
n1
n2
...
ni
...
nk
N

Frecuencias
absolutas
acumuladas
Ni
N1
N2
...
Ni

Nk = N

Frecuencias
relativas
ordinarias
fi
f1
f2
...
fi

fk
1

Frecuencias
relativas
acumuladas
Fi
F1
F2
...
F1

Fk = 1

Observemos que:

La suma de todas las frecuencias absolutas ordinarias ha de coincidir con el nmero


n

total de individuos de la poblacin, es decir, con el tamao N:

ni = N
i 1

La suma de todas las frecuencias relativas ordinarias ha de ser 1, ya que representa


n

la suma de todas las proporciones:

fi = 1
i 1

127

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

La ltima frecuencia absoluta acumulada ha de ser el tamao, N: Nk = N

La ltima frecuencia relativa acumulada ha de ser 1: Fk = 1

4. Distribuciones de frecuencias
Consideremos una poblacin de tamao N estudiada segn un carcter C que puede ser
clasificado en k modalidades M1, M2, ..., Mi, ..., Mk
Llamamos distribucin de frecuencias al conjunto de pares ordenados:
{(M1, n1), (M2, n2), ..., (Mi, ni), ..., (Mk, nk)} (distribucin de frecuencias absolutas)
o bien al conjunto :
{(M1, f1), (M2, f2), ..., (Mi, fi), ..., (Mk, fk)} (distribucin de frecuencias relativas)
En el caso discreto, las modalidades son los valores numricos aislados que toma la
variable estadstica. Entonces, la distribucin de frecuencias es:
{(x1, n1), (x2, n2), ..., (xi, ni), ..., (xk, nk)} (en el caso de frecuencias absolutas)
o bien:
{(x1, f1), (x2, f2), ..., (xi, fi), ..., (xk, fk)} (en el caso de frecuencias relativas)
4.1. Ejemplo
Un profesor tiene anotadas las calificaciones de los 30 alumnos de un grupo:
5

Construir la tabla de frecuencias absolutas, absolutas acumuladas, relativas y relativas


acumuladas.
xi
0
1
2
3
4
5
6
7
8
9
10

ni
2
3
1
1
1
3
2
5
7
5
0
30

Ni
2
5
6
7
8
11
13
18
25
30
30

Se trata de una variable estadstica discreta.

128

fi
2/30
3/30
1/30
1/30
1/30
3/30
2/30
5/30
7/30
5/30
0
1

Fi
2/30
5/30
6/30
7/30
8/30
11/30
13/30
18/30
25/30
30/30
30/30 = 1

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

4.2. Caso continuo


En el caso continuo, o en el discreto con un gran nmero de datos, la poblacin se
particiona en clases o intervalos. Es decir, los datos se clasifican en intervalos de la
recta real (El nmero de clases debe ser aproximadamente igual a la raz cuadrada
del nmero de datos), dando lugar a datos agrupados en intervalos:
(e0, e1]

(e1, e2]

...

(ei1, ei]

...

(ek1, ek]

Clase 1

Clase 2

...

Clase i-sima

...

Clase ltima
(k-sima)

En las clases o intervalos tendremos en cuenta los siguientes conceptos:

Extremos de clase: dada la clase i-sima (ei1, ei], a ei1 lo llamaremos lmite inferior
y a ei lmite superior.

Amplitud de clase: llamaremos amplitud de la clase i-sima (ei1, ei] a la longitud del
intervalo, es decir, al nmero ai = ei ei1

Marcas de clase: son los puntos medios de las clases o intervalos. En el caso de la
e e
clase i-sima (ei1, ei], la marca de clase es xi = i 1 i
2

Hemos de tener en cuenta las siguientes observaciones:

Las amplitudes de las clases no tienen por qu ser iguales. No obstante, si podemos
elegir, es cmodo tomar todas las clases con la misma amplitud. Esto habr que
tenerlo muy en cuenta a la hora delas representaciones grficas: histogramas de
frecuencias.

Ms an, las clases primera y ltima pueden ser intervalos no acotados, de amplitud
infinita. Lo que se pretende con esto es recoger los casos muy extremos, raros,
que se pudieran dar.

En resumen, en el caso de las variables estadsticas continuas, o discretas con datos


agrupados (tratamiento continuo por ser muy grande el nmero de datos), la distribucin
de frecuencias es un conjunto de la forma:
{(I1, n1), (I2, n2), ..., (Ii, ni), ..., (Ik, nk)} (en el caso de frecuencias absolutas)
o bien:
{(I1, f1), (I2, f2), ..., (Ii, fi), ..., (Ik, fk)} (en el caso de frecuencias relativas)
donde:

Ii = (ei1, ei] = {xi / ei1 < x ei} es la clase i-sima.

Las clases primera y ltima pueden ser de la forma:


o I1 = (, e1] = {x / x e1}
o Ik = (ek1, +) = {x / ek1 < x}

129

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

4.3. Ejemplo
Las edades de las personas que acuden a un mdico a lo largo de un mes son:
3

11

13

27

15

21

14

29

13

17

13

12

26

Construir la correspondiente tabla de frecuencias agrupando los datos en clases o


intervalos de amplitud 5.
Clases
Ii
(0, 5]
(5, 10]
(10, 15]
(15, 20]
(20, 25]
(25, 30]

Marcas de
clase
xi
2,5
7,5
12,5
17,5
22,5
27,5

ni

Ni

fi

Fi

17
7
7
1
1
3
N = 36

17
24
31
32
33
36

17/36
7/36
7/36
1/36
1/36
3/36

17/36
24/36
31/36
32/36
33/36
36/36=1

Observemos que se trata de una variable estadstica discreta a la que, por haber un
nmero grande de datos, se trata como continua agrupando los datos en intervalos.

5. Representaciones grficas
Aunque las tablas de frecuencias contienen informacin suficiente para permitir el
anlisis de los datos, comnmente se recurre a su representacin grfica con el objetivo
de obtener una mejor idea del comportamiento de los datos.
Segn sea el carcter estudiado, se emplean distintos tipos de representaciones grficas
o diagramas:

Carcter cualitativo
(atributo)

Diagrama rectangular.
Diagrama de sectores.
Pictogramas.
Cartogramas.
Pirmides de poblacin.
Variable discreta

Diagrama de barras.
Funcin de distribucin.

Variable continua

Histograma.
Funcin de distribucin.

Carcter cuantitativo
(variable estadstica)

En este tema veremos los diagramas rectangulares y de sectores para caracteres


cualitativos y los diagramas de barras e histogramas para los cuantitativos.

130

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

5.1. Diagrama rectangular (carcter cualitativo)


Estn constituidos por varios rectngulos de base constante, una por cada modalidad, y
con altura proporcional a la frecuencia absoluta (sin ms que cambiar la escala del eje
de ordenadas se tendra la misma grfica para las frecuencias relativas.
Por ejemplo, consideremos que las calificaciones obtenidas por los 32 alumnos de una
clase en la asignatura de matemticas vienen dadas en la siguiente tabla:
Mi
Muy Deficiente
Insuficiente
Suficiente
Bien
Notable
Sobresaliente

ni
0
5
6
4
12
5
N = 32

Ni
0
5
11
15
27
32

fi
Fi
0/32
0/32
5/32
5/32
6/32
11/32
4/32
15/32
12/32
27/32
5/32
32/32 = 1
32/32 = 1

Un diagrama rectangular sera el siguiente:

Frecuencias absolutas

DIAGRAMA RECTANGULAR
(Carcter cualitativo-ordinal)
14
12
10
8
6
4
2
0
MDF

INS

SUF

BIEN

NOT

SOB

Calificacin

5.2. Diagrama de sectores (carcter cualitativo)


Consiste en hacer corresponder un crculo a la frecuencia total (preferentemente
relativa, expresada en trminos porcentuales) y hacer corresponder a cada modalidad Mi
un sector circular de amplitud proporcional a la frecuencia correspondiente. Para ello se
recurre a cualquiera de las reglas de tres simples que tienes a continuacin:
N 360
ni i
N 360

ni
i

1 360
fi i
1 360

fi
i

100 360
pi (100fi) i
100 360

pi
i

De donde:

ni
360
N
Para el ejemplo anterior se tendra:

i fi 360

131

pi
360
100

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

Mi
Muy Deficiente
Insuficiente
Suficiente
Bien
Notable
Sobresaliente

ni
0
5
6
4
12
5
N = 32

lasmatematicas.eu
Tema 8: Estadstica en una variable

fi
0/32 = 0,0000
5/32 = 0,15625
6/32 = 0,1875
4/32 = 0,1250
12/32 = 0,3750
5/32 = 0,15625
32/32 = 1

pi (%)
0,00
15,625
18,75
12,50
37,50
15,625
100,00

i ()
0,00
56,25
67,50
45,00
135,00
56,25
360,00

DIAGRAMA DE SECTORES
(Carcter cualitativo-ordinal)
MDF
0%
SOB
16%

INS
16%

SUF
19%

NOT
37%
BIEN
12%

5.3. Diagrama de barras (variable estadstica discreta)


Se llama as la representacin grfica de frecuencias de una variable estadstica discreta
(carcter cuantitativo discreto) obtenida de la forma siguiente:

Sobre el eje de abscisas se marca cada uno de los valores de la variable en una
escala aritmtica (divisiones iguales).

Sobre el eje de ordenadas se lleva a cabo una graduacin aritmtica que permita
representar las frecuencias absolutas o relativas (si se van a hacer comparaciones
mejor relativas).

Sobre cada punto del eje de abscisas, correspondiente a un valor de la variable, se


levanta una barra de altura proporcional a la frecuencia de dicho valor.

Es un diagrama similar al diagrama rectangular para caracteres cualitativos.


Por ejemplo, consideremos una poblacin formada por 1000 lotes de ciertas piezas
mecnicas. El carcter (cuantitativo) que se observa en cada unidad estadstica es el
nmero de piezas defectuosas que contiene: 0, 1, 2, 3, 4, 5 6 (estas son las
modalidades, los valores de la variable discreta en cuestin).

132

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Las frecuencias vienen dadas en la siguiente tabla:


Nmero de piezas
defectuosas por lote
Nmero de lotes con
xi piezas defectuosas
Frecuencias
acumuladas

xi

ni

300

365

214

83

23

Ni

300

665

879

962

985

992

1000

1000

DIAGRAMA DE BARRAS
(Variable estadstica discreta)

ni: frecuencias absolutas

400
350
300
250
200
150
100
50
0
1

xi: nmero de piezas defectuosas

Cambiando frecuencias absolutas ordinarias, ni, por frecuencias absolutas acumuladas


Ni, tendramos el diagrama de barras acumulativo.

Ni: frecuencias absolutas acumuladas

DIAGRAMA DE BARRAS ACUMULATIVO


(Variable estadstica discreta)
1200
1000
800
600
400
200
0
1

xi: nmero de piezas defectuosas

133

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

5.4. Histograma de frecuencias (variable continua)


Se llama histograma a la representacin grfica de las frecuencias de una distribucin
estadstica de una variable continua cuyas observaciones estn agrupadas en clases. Se
construye de la forma siguientes:

Sobre el eje de abscisas, graduado segn una escala aritmtica, se marcan los
extremos de las clases sucesivas.

Sobre el eje de ordenadas se marcarn las frecuencias.

Sobre cada intervalo o clase se dibuja un rectngulo de modo que las reas de loas
rectngulos sean proporcionales a las frecuencias.

Por ejemplo, consideremos un parque automovilstico de 2478 coches clasificados


segn el nmero de kilmetros recorridos en un ao:
Kilometraje anual
(en miles de
kilmetros)
(ei1, ei]
(0, 4]
(4, 8]
(8, 12]
(12, 16]
(16, 20]
(20, 24]

Nmero de vehculos
ni
228
634
821
475
233
87
N = 2478

HISTOGRAMA DE FRECUENCIAS ABSOLUTAS


Variable continua (amplitudes iguales)

Frecuencias absolutas (ni)

900
800
700
600
500
400
300
200
100
0
(0, 4]

(4, 8]

(8, 12]

(12, 16]

(16, 20]

(20, 24]

Recorrido anual (en miles de Km)

Observemos que todos los intervalos tienen la misma amplitud. Entonces, para la
construccin del histograma, podemos asignar como altura de cada rectngulo la
frecuencia absoluta del intervalo correspondiente.

134

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Uniendo el vrtice superior izquierdo o los puntos medios de los techos de los
rectngulos, se obtiene una lnea poligonal que encierra sobre el eje X un rea igual a la
que encierran los rectngulos. Tal lnea es el polgono de frecuencias.
POLGONO DE FRECUENCIAS
Variable continua (amplitudes iguales)

Frecuencias absolutas (ni)

900
800
700
600
500
400
300
200
100
0
(0, 4]

(4, 8]

(8, 12]

(12, 16]

(16, 20]

(20, 24]

Recorrido anual (en miles de Km)

6. Reduccin numrica de los datos


Hasta ahora hemos tratado y representado grficamente las distribuciones de frecuencias
segn un carcter. Con ello tenemos una primera aproximacin al conocimiento de las
mismas.
Ahora daremos un conjunto de medidas descriptivas que resuman cuantitativamente, de
modo sucinto y significativo, las caractersticas ms importantes de una distribucin.
Esto nos permitir comparar distintas distribuciones.
Por ejemplo, si se desea comparar las temperaturas de Granada y Ciudad Real a lo largo
de un ao, sera mejor disponer de unos pocos nmeros que representaran de forma
resumida a cada una de las provincias que comparar las temperaturas de todos y cada
uno de los das del ao. Lo nico que hay que hacer es tomar esos nmeros de modo
que sean representativos de todo el grupo; es decir, unos valores que representen o
resuman a toda la poblacin. Estos nmeros se llaman parmetros estadsticos o,
simplemente, estadsticos. En nuestro ejemplo se suele recurrir a la temperatura media
de las mximas y a la temperatura media de las mnimas.
6.1. Medidas de centralizacin
Las medidas o estadsticos de centralizacin, o de tendencia central, nos indican los
punto en torno a los cuales se encuentran los valores de la variable estadstica en
estudio; es decir, nos indican los puntos centrales de una distribucin. Representan el
conjunto de los datos mediante un solo valor numrico, tratando de resumir y sintetizar
la distribucin de frecuencias. Las medidas de posicin central ms utilizadas son la
mediana, la moda y la media aritmtica.

135

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Mediana

Sea X una variable estadstica (carcter cuantitativo) de una poblacin o muestra con N
individuos.
Se llama mediana a un valor, representado por Me, tal que, ordenados los N valores de
X en orden creciente, el 50% de ellos son menores o iguales que Me y el 50% restante
son mayores o iguales que Me.
Para determinar la mediana los haremos en el caso discreto y continuo.
Caso discreto
Consideraremos la siguiente distribucin de frecuencias que nos servir de ejemplo:
xi
3
4
5
6
7
8
9
10

ni
1
2
1
1
3
0
0
1
N=9

Ni
1
3
4
5
8
8
8
9

fi
1/9
2/9
1/9
1/9
3/9
0
0
1/9
1

Fi
1/9
3/9
4/9
5/9
8/9
8/9
8/9
9/9 = 1

Podemos proceder de dos formas:


Directamente sobre los datos: ordenamos los datos sin agrupar; es decir,
repitiendo cada uno tantas veces como indique su frecuencias absoluta.
3

6
Me

10

En este caso, N = 9 es impar y la mediana es el valor central: Me = 6 deja a la


mitad de individuos por encima y a la otra mitad por debajo.
A partir de la tabla de frecuencias: observamos en la columna de las
frecuencias absolutas acumuladas donde se encuentra el valor N/2. Este
dejar por encima la frecuencia absoluta acumulada Ni y por debajo la
frecuencia absoluta acumulada Ni+1. La mediana es el valor de la variable que
se encuentra inmediatamente por debajo de esta posicin, es decir, x i+1. En
nuestro ejemplo N/2 = 4,5 y por tanto Me = 6. Observa la tabla:

N/2
Me = xi+1

xi
3
4
5 = xi

ni
1
2
1

6
7
8
9
10

1
3
0
0
1
N=9
136

Ni
1
3
4 = Ni
4,5
5 = Ni+1
8
8
8
9

fi
1/9
2/9
1/9

Fi
1/9
3/9
4/9

1/9
3/9
0
0
1/9
1

5/9
8/9
8/9
8/9
9/9 = 1

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Puede ocurrir que N/2 coincida con algn valor de Ni. Entonces la mediana es el
x x i 1
valor medio entre xi y xi+1: Me = i
2
Por ejemplo, consideremos ahora la siguiente distribucin de frecuencias. En este
x x i 1
caso N/2 = 5, que coincide con uno de los valores de Ni. Por tanto Me = i
=
2
67
= 6,5.
N/2
2

Me =

xi
3
4
5
6
7
8
9
10

67
= 6,5
2

ni
1
2
1
1
3
0
0
2
N = 10

Ni
1
3
4
5
8
8
8
10

fi
1/10
2/10
1/10
1/10
3/10
0
0
2/10
1

Fi
1/10
3/10
4/10
5/10
8/10
8/10
8/10
10/10 = 1

Observa que si calculamos la mediana directamente sobre los datos, al ser ahora N
par, quedan dos valores centrales. La mediana es el valor medio de estos:
3

Me =

67
= 6,5
2

10

10

Caso continuo
Para este caso tomaremos el ejemplo de clases de igual amplitud de la pgina 134:
consideremos un parque automovilstico de 2478 coches clasificados segn el nmero
de kilmetros recorridos en un ao:
Kilometraje anual
(en miles de
kilmetros)
(ei1, ei]
(0, 4]
(4, 8]
N/2
Intervalo mediano

(8, 12]
(12, 16]
(16, 20]
(20, 24]

Nmero de
vehculos
ni
228
634
1239
821
475
233
87
N = 2478

Frecuencias
absolutas
acumuladas
Ni
228
862
1683
2158
2391
2478

En este caso, la primera clase cuya frecuencia absoluta acumulada es mayor o igual que
N/2 es el intervalo mediano o clase mediana de la distribucin: que los llamaremos
Ii = (ei1, ei] En nuestro ejemplo Ii = (8, 12]. Para obtener la mediana se recurre a la
siguiente frmula:
137

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

N
Ni 1
Me = ei 1 2
ai
Ni Ni 1

donde ei1 es el lmite inferior del intervalo mediano, ai es la amplitud del intervalo
mediano, Ni1 es la frecuencia absoluta acumulada que se encuentra inmediatamente por
encima del intervalo mediano, Ni es la frecuencia absoluta acumulada correspondiente
al intervalo mediano y N es el nmero de individuos de la poblacin.
N
2478
862
Ni 1
En nuestro ejemplo: Me = ei 1 2
ai = 8 + 2
4 = 9,84
Ni Ni 1
1683 862

Moda

Caso discreto
Dada una variable estadstica discreta X con distribucin de frecuencias
{(x1, n1), (x2, n2), ..., (xi, ni), ..., (xk, nk)}
se llama moda, y se representa por Mo, a la modalidad que presenta una frecuencia
mxima. En el diagrama de barras es la modalidad a la que corresponde la barra ms
alta. Una distribucin puede tener, pues, ms de una moda, en el caso de que la
frecuencia ms alta corresponda a ms de una modalidad.
Si consideramos el ejemplo de las pginas 132 y 133:
Nmero de piezas
defectuosas por lote
Nmero de lotes con
xi piezas defectuosas

xi

ni

300

365

214

83

23

1000

El valor que se presenta con ms frecuencia es el 1 (365 veces). Por tanto Mo = 1.


Caso continuo
Dada una variable estadstica continua X con distribucin de frecuencias
{(I1, n1), (I2, n2), ..., (Ii, ni), ..., (Ik, nk)}
se llama clase o intervalo modal al intervalo que presenta una mayor densidad de
frecuencia. En el histograma es al que le corresponde el rectngulo de mayor altura.
En el ejemplo de la pgina 134:
Kilometraje anual
(en miles de
kilmetros)
(ei1, ei]
(0, 4]
(4, 8]
(8, 12]
(12, 16]
(16, 20]
(20, 24]

Nmero de vehculos
ni
228
634
821
475
233
87
N = 2478
138

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

La clase o intervalo modal es, en este caso, (8, 12] pues es la que se presenta en un
mayor nmero de ocasiones (821).
Si queremos especificar ms concretamente a que valor de la variable le atribuimos el
papel de moda, aplicaremos la siguiente frmula:
Mo = ei 1

n i n i 1
ai
(n i n i 1 ) (n i n i 1 )

donde ei1 es el lmite inferior de la clase modal, ni es la frecuencia absoluta


correspondiente al intervalo modal, ni1 es la frecuencia absoluta inmediatamente
anterior a ni, ni+1 es la frecuencia absoluta inmediatamente posterior a ni y ai es la
amplitud de la clase modal.
En nuestro ejemplo Mo = 8 +

821 634
4 = 9,04
(821 634) (821 475)

Si llamamos 1 = ni ni1 (exceso de la clase modal sobre la clase contigua anterior) y


2 = ni ni+1 (exceso de la clase modal sobre la clase contigua posterior), la frmula
anterior se convierte en:
Mo = ei 1

1
ai
1 2

En el ejemplo 1 = 821 634 = 187 y 2 = 821 475 = 346, y entonces se tiene que
187
Mo = 8 +
4 = 9,04
187 346
Observaciones:
Cuando una distribucin presenta varios mximos locales, bien en el
diagrama de barras (caso discreto) o bien en el histograma (caso continuo), se
habla de una distribucin multimodal.
Cuando la clase modal sea una clase extrema, la primera o la ltima, se
supone que la clase anterior o la posterior, respectivamente, es de frecuencia
nula.

Media aritmtica

Caso discreto
Sea X una variable estadstica discreta de una poblacin finita de tamao N y sean x 1,
x2, ..., xN los N valores observados de X.
La media aritmtica, o simplemente media, de esos N valores es:
N

xi
x1 x 2 ... x N i1

x =
N
N
Si de esos N valores slo hay k distintos x1, x2, ..., xk, que se repiten, respectivamente,
n1, n2, ..., nk veces (sus frecuencias absolutas), entonces podemos escribir:

139

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

n x n 2 x 2 ... n k x k

x = 1 1
N

ni xi
i 1

o bien, si empleamos frecuencias relativas:


k

x = f1x1 f 2 x 2 ... f k x k fi xi
i 1

Usemos uno de los ejemplos anteriores para ver cmo se ordenan los clculos:
xi
3
4
5
6
7
8
9
10

ni
1
2
1
1
3
0
0
2
ni = N = 10

nixi
3
8
5
6
21
0
0
20
nixi = 63

fi
1/10
2/10
1/10
1/10
3/10
0
0
2/10
fi = 1

fixi
3/10
8/10
5/10
6/10
21/10
0
0
20/10
fixi = 63/10

ni xi
x =

i 1

63
= 6,3
10

o bien, si preferimos trabajar con frecuencias relativas:


8

x =

63

fi x i = 10

= 6,3

i 1

Caso continuo
En este caso, reemplazamos las clases por sus marcas xi (lo que equivale a suponer que
todos los puntos del intervalo estn concentrados en su punto medio). Se trata de una
especie de discretizacin de la variable. Las frmulas para el calculo de la media son
las mismas de antes.
Por ejemplo:
Clase
(ei1, ei]
(0, 150]
(150, 300]
(300, 350]
(350, 400]
(400, 500]
(500, )

Marca de
clase
xi
75
225
325
375
450
550

140

Frecuencias
absolutas
ni
120
159
89
78
66
52
N = 564

xini
9000
35775
28925
29250
29700
28600
161250

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Para la clase extrema (500, ) se podran adoptar diversos convenios. Hemos adoptado
el de asignarle la misma amplitud que a la anterior.
6

ni xi
La media es, por tanto: x =

i 1

161250
= 285,9
564

6.2. Medidas de posicin


Son una generalizacin de la mediana. En general, sirven para determinar en qu
posicin de la distribucin se encuentra un individuo, supuestos ordenas en orden
creciente.
Sea X una variable estadstica (discreta o continua) sobre una poblacin finita de
tamao N, y sea t un nmero real tal que 0 < t < 1.
Se llama cuantil de orden t al valor Ct tal que tN individuos de la poblacin son tales
que X Ct y los (1 t)N individuos restantes son tales que X Ct. Dicho de otro
modo, el 100t % de los individuos se encuentra por debajo del cuantil Ct y el
100(1 t) % de individuos restante se encuentra por encima del cuantil Ct.
Si t = 0,5, entonces C0,5 = Me (la mediana). Si para un individuo ocurre que X Me, tal
individuo est en la primera mitad de la poblacin ordenada.
La interpretacin de los cuantiles y las circunstancias que se pueden dar en su
determinacin, segn los casos, son exactamente las mismas que para la mediana.
En el caso discreto, bien a partir de los datos sin agrupar o bien a partir de la
distribucin de frecuencias absolutas tomando como referencia el valor tN para mirar en
la columna de frecuencias absolutas acumuladas. En el ejemplo de variable discreta al
final de este apartado se ver con toda claridad.
Para el caso continuo, con los datos agrupados en intervalos, existe una frmula anloga
a la de la mediana para el cuantil de orden t:
Ct = ei 1

tN Ni 1
ai
Ni Ni 1

Los cuantiles se estudian en grupos que dividen a la poblacin en un cierto nmero de


partes iguales, ordenados los individuos por el valor de la variable en orden creciente.
Segn el nmero de partes en que dividen a la poblacin reciben distintos nombre:

Cuartiles

Dividen a la poblacin en cuatro partes, cada una de las cuales contiene al 25% de las
observaciones. Los cuartiles son:
Primer cuartil:

Q1 = C1/4

(t = 1/4 = 0,25)

Segundo cuartil: Q2 = C1/2 = Me

(t = 1/2 = 0,5)

Tercer cuartil:

(t = 3/4 = 0,75)

Q3 = C3/4

En el caso continuo, una vez determinado el intervalo (ei1, ei] que contiene a Qk, de
frecuencia absoluta acumulada Nk, las frmulas para los tres cuartiles son:

141

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

1
N Ni 1
Q1 = ei 1 4
ai
Ni Ni 1
1
N Ni 1
Q2 = ei 1 2
a i = Me
Ni Ni 1
3
N Ni 1
Q3 = ei 1 4
ai
Ni Ni 1

Es conveniente observar que los cuartiles no tienen por qu estar unos a la misma
distancia de otros: lo que han de verificar es que entre cada dos consecutivos est el
25% de la poblacin:
25 %
e0

25 %
Q1

25 %

25 %

Q2 = Me

Q3

ek

Deciles

Dividen a la poblacin en diez partes, cada una de las cuales contiene al 10% de las
observaciones. Los deciles son:
Primer decil:

D1 = C1/10

(t = 0,10)

Segundo decil: D2 = C2/10


(t = 0,20)

Quinto decil:
D5 = C5/10 = Q2 = Me (t = 0,50)

Noveno decil: D9 = C9/10


(t = 0,90)
La forma de calcularlos es la misma de antes:

N Ni 1
D = ei 1 10
ai
Ni Ni 1

Centiles o percentiles

Dividen a la poblacin en cien partes, cada una de las cuales contiene al 1% de ella. Los
percentiles son:
P1 = C1/100
(t = 0,01)
..
P25 = C25/100 = Q1
(t = 0,25)
..
P50 = C50/100 = Q2 = Me
(t = 0,50)
..
P75 = C75/100 = Q3
(t = 0,75)
..
P99 = C99/100
(t = 0,99)

142

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Veamos dos ejemplos (uno de variable discreta y otro de variable continua) en los que
se aprecie el clculo de los distintos parmetros:
Ejemplo 1: consideremos el ejemplo de las pginas 132 y 133: una poblacin
formada por 1000 lotes de ciertas piezas mecnicas. El carcter que se observa es el
nmero de piezas defectuosas que contiene: 0, 1, 2, 3, 4, 5 6.
Las frecuencias vienen dadas en la siguiente tabla:
xi
ni
Ni
nixi

0
300
300
0

1
365
665
365

2
214
879
428

3
83
962
249

4
23
985
92

5
7
992
35

6
8
1000
1000
48 1217

Calcular la media, la moda, la mediana, los tres cuartiles, los deciles sexto y sptimo, y
los percentiles P40 y P95
1217
= 1,217 y que Mo = 1. Para determinar los dems parmetros
1000
miraremos en la fila de frecuencias absolutas acumuladas.

Es claro que x =

Mediana: la primera frecuencia absoluta acumulada que es mayor que N/2 = 500 es
N2 = 665. Por tanto Me = 1
Cuartiles: la primera frecuencia absoluta acumulada que es mayor o igual que
N/4 = 250 es N1 = 300. Entonces Q1 = 0 (el primer 25% de los lotes observados,
ordenados por orden creciente de piezas defectuosas, tiene 0 piezas defectuosas).
Por otro lado Q2 = Me = 1 (el segundo 25% de los lotes observados tienen 0 1
pieza defectuosas). Por ltimo, la primera frecuencia absoluta acumulada que es
mayor que 3N/4 = 750 es N3 = 879. Entonces Q3 = 2 (el tercer 25% de la poblacin
tiene 0, 1 2 piezas defectuosas).
Sexto y sptimo deciles: la primera frecuencia absoluta acumulada que es mayor
que 6N/10 = 600 es N2 = 665. Por tanto D6 = 1 (es decir, el primer 60% de los lotes
observados tienen 0 1 piezas defectuosas). De forma similar, como 7N/10 = 700,
la primera frecuencia acumulada que es mayor que tal valor es N3 = 879 y entonces
D7 = 2 (lo que quiere decir que el 70% de los lotes tienen 0, 1 2 piezas
defectuosas).
Percentiles P40 y P95: la primera frecuencia absoluta acumulada que es mayor que
40N/100 = 400 es N2 = 665. Entonces P40 = 1 (el 40% de los lotes tiene 0 1 pieza
defectuosa). Finalmente, como la primera frecuencia absoluta acumulada que es
mayor que 95N/100 = 950 es N4 = 962, tenemos que P95 = 3 (el 95% de los lotes
tienen 0, ,1, 2 3 piezas defectuosas).

Ejemplo 2: los pesos en kg. de 100 alumnos de un colegio vienen dados por la tabla
Ii
(40, 48]
(48, 56]
(56, 64]
(64, 72]
(72, 80]

ni
8
22
29
21
20
100

xi
44
52
60
68
76

Ni
8
30
59
80
100

nixi
352
1144
1740
1428
1520
6184

Calcular la media, la moda, la mediana, los el tercer cuartil y el percentil P35


143

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

Media: x =

lasmatematicas.eu
Tema 8: Estadstica en una variable

6184
= 61,84
100

Moda: el intervalo modal es (56, 64], y entonces Mo = ei 1


= 56 +

1
ai =
1 2

7
8 = 59,73
78

Mediana: el primer intervalo cuya frecuencia absoluta acumulada es mayor que


N
Ni 1
50 30
2
N/2 = 50 es (56, 64]. Por tanto Me = ei 1
a i = 56 +
8 = 61,52
59 30
Ni Ni 1
Q3: el primer intervalo cuya frecuencia absoluta acumulada es mayor que 3N/4 = 75
3
N Ni 1
75 59
4
es (64, 72]. Por tanto Q3 = ei 1
a i = 64 +
8 = 70,095. Esto
80 59
Ni Ni 1
quiere decir que el 75% de los alumnos tienen un peso inferior a 70,095 kg.
P35: el primer intervalo cuya frecuencia absoluta acumulada es mayor que
35
N Ni 1
35 30
35N/100 = 35 es (56, 64]. Entonces P35 = ei 1 100
a i = 56 +
8 =
59 30
Ni Ni 1
= 57,38. Es decir, el 35% de los alumnos tienen un peso inferior a 57,38 kg.
6.3. Medidas de dispersin
Las medidas de centralizacin sintetizan la informacin: representan la totalidad del
conjunto de datos mediante unos valores centrales. Sin embargo, un promedio no es
suficiente. Es preciso aadir tambin una medida de cmo de representativo es dicho
promedio.
Consideremos las siguientes distribuciones:
A:

20

22

24

26

28

B:

10

10

20

35

45

que podran representar los pesos de dos grupos de nios. Observamos que los dos
grupos tienen el mismo peso medio: x = 24, siendo, no obstante, muy diferentes en
cuanto a concentracin-dispersin de sus valores. En el grupo A los valores se
encuentran prximos a la media, luego tienen poca dispersin. En el grupo B, los
valores estn alejados de la media, estando formado por valores ms dispersos.
Al grado en que los datos numricos tienden a extenderse alrededor de un valor
promedio (estadstico de centralizacin como la media o mediana, por ejemplo) se le
llama variacin o dispersin de los datos.
Se utilizan distintas medidas de dispersin. Las ms empleadas son: rango o recorrido,
recorrido intercuartlico, desviacin absoluta media, varianza, desviacin tpica y
coeficiente de variacin. Nosotros nos ceiremos a las ms importantes: varianza,
desviacin tpica y coeficiente de variacin.

144

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Varianza y desviacin tpica

La ms empleada de las medidas de dispersin es la varianza, que se define como la


media de los cuadrados de las desviaciones respecto a la media; esto es, la media de la
variable : X X :
2

Var(X) = 2 = X X
2

ni (xi x)2
i 1

fi (x i x) 2
i 1

Puesto que la varianza de X no viene dada en las mismas unidades de X (si, por
ejemplo, la variable viene dada en metros, la varianza resulta en metros cuadrados), en
su lugar se emplea la desviacin tpica, , definida como
= + Var(X) = + 2
En la medida en que la varianza o la desviacin tpica tomen valores ms o menos
grandes, esto indicar el grado de dispersin o alejamiento de los datos respecto de la
media. En el caso trivial de que todos los valores de la variable estn concentrados en
un punto (que coincidir con la media), estos estadsticos de dispersin se anularn.
Hay una frmula que se obtiene del desarrollo de la expresin de la varianza que
permite calcular sta de manera simplificada. Es la siguiente:
k

Var(X) = 2 =

ni xi2
i 1

x 2

Coeficiente de variacin

Las medidas de dispersin estudiadas hasta ahora se expresan en la misma unidad de


medida que la variable estadstica, designando medidas de dispersin absoluta. Esto
presenta algunos problemas tcnicos:
Cmo hacer comparaciones entre dos distribuciones de naturaleza diferente
(alturas y pesos) o, aun siendo de la misma naturaleza, expresadas en unidades
diferentes (metros y pulgadas)?
Por otro lado, una variacin de 100 en una serie de compras cuyo precio medio
es de 1000 tiene una repercusin muy diferente que la misma variacin de 100
en una serie de compras cuyo precio medio es de 1000000 .
Para resolver estos problemas recurrimos a una medida de dispersin relativa, que
recibe el nombre de coeficiente de dispersin o de variacin de Pearson:
CV =

Esta es una medida abstracta que no tiene dimensiones. Tiene las siguientes
propiedades:
Suele expresarse en %: CV =

100
x

145

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Cuanto menor es el coeficiente de variacin ms homognea respecto a la media


es la distribucin.
Cuanto ms cerca de 0 est, ms representativa de la distribucin es la media.
A medida que se aleja de 0, la media es menos representativa.
Al ser una medida relativa, permite comparar distribuciones del mismo tipo
aunque tengan distinto tamao.
Tiene el inconveniente de que deja de ser til cuando x est prxima a 0.
Es independiente de las unidades utilizadas.
Ejemplo: volvamos sobre el ejemplo de la pgina 143 en el que se daban los pesos
en kg. de 100 alumnos de un colegio. Calculemos la varianza, la desviacin tpica y el
coeficiente de variacin. Para ello vamos a disear la tabla de manera que nos sea til
para realizar los clculos
Ii
(40, 48]
(48, 56]
(56, 64]
(64, 72]
(72, 80]

ni
8
22
29
21
20
100

Recordemos que x =

xi2
1936
2704
3600
4624
5776

xi
44
52
60
68
76

nixi
352
1144
1740
1428
1520
6184

nixi2
15488
59488
104400
97104
115520
392000

6184
= 61,84. Calcularemos la varianza con la frmula
100

simplificada: 2 =

ni xi2
i 1

x 2 =

392000
61,842 = 95,8144. Por tanto la desviacin
100

tpica ser: = + 2 = + 95,8144 9,788.

9, 788

=
0,158, es decir la desviacin
61,84
x
tpica es el 16,2 % de la media; por tanto, la media es muy representativa de la
poblacin.
El coeficiente de variacin es pues: CV =

146

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

Ejercicios y problemas
1. Completar los datos que faltan en la siguiente tabla estadstica, donde (como se debe
saber) ni, Ni, fi y Fi son las frecuencias absolutas, absolutas acumuladas, relativas y
relativas acumuladas.
xi
1
2
3
4
5
6
7
8

ni
4
4
7
5

Ni

fi
0,08

16

0,16
0,14

28
38
45

Fi

xi2

nixi

nixi2

0,14

N=
Calcular la moda, media, varianza y desviacin tpica. Calcular el coeficiente de
variacin e interpretarlo. Calcular la mediana y los cuartiles.
2. Las puntuaciones obtenidas por 20 personas en una prueba quedan reflejadas en el
siguiente histograma de frecuencias absolutas. Calcular la moda, media, varianza y
desviacin tpica. Calcular el coeficiente de variacin e interpretarlo.
9
8
7

ni

6
5
4
3
2
1
0
(0, 2]

(2, 4]

(4, 6]

(6, 8]

(8, 10]

3. Las calificaciones de dos grupos de diez alumnos en la Primera Evaluacin en una


cierta asignatura se recogen en la siguiente tabla:
Grupo A

Grupo B

Contestar razonadamente a las siguientes cuestiones:


a) Cul de los dos grupos obtuvo mejores resultados?
b) Qu grupo es ms homogneo?

147

Pedro Castro Ortega


Matemticas aplicadas a las Ciencias Sociales I

lasmatematicas.eu
Tema 8: Estadstica en una variable

4. La siguiente tabla recoge los minutos de retraso en la incorporacin al trabajo de los


empleados de una empresa:
Retraso en minutos

(0, 4]

(4, 8]

Nmero de empleados

15

(8, 12] (12, 16] (16, 20]


18

10

a) Representar los datos mediante un histograma.


b) Calcular el retraso medio y la desviacin tpica.
c) Calcular la mediana y los cuartiles y explicar qu miden estos parmetros.
5. En un estudio sobre el sueldo en euros de 50 personas se han obtenido los siguientes
datos:
Sueldo

(500, 700]

(700, 900]

N de
personas

10

10

(900, 1300] (1300, 1500] (1500, 2100]


20

a) Construir el histograma (ntese que las clases tienen amplitudes desiguales).


b) Calcular la media, la varianza, la desviacin tpica y el coeficiente de variacin y
explicar el significado de estos parmetros.
6. Los pesos en kilogramos de 50 personas vienen dados por la tabla:
Peso

(50, 60]

(60, 70]

(70, 80]

Nmero de empleados

10

15

20

(80, 90] (90, 100]


4

Calcular el peso medio, los cuartiles y la desviacin tpica. Interpreta los resultados.
Se puede decir que es un grupo homogneo?
7. La tabla de frecuencias que se da a continuacin corresponde a la variable
estadstica X = Posicin en la liga de un cierto equipo, medida durante quince
aos consecutivos:
X

5 o peor

Nmero de veces

a) Indicar de qu tipo de variable se trata.


b) Representar grficamente la distribucin en diagramas rectangular y en otro de
sectores.
c) Dar una medida de posicin central y otra de dispersin adecuadas al
experimento. Explicar por qu lo son, as como su significado.
8. Hacer un estudio estadstico completo (diagramas, medidas de centralizacin, de
posicin, de dispersin e interpretacin de los resultados) del ejemplo 4.1 de la
pgina 128 y del ejemplo 4.3 de la pgina 130.

148

You might also like