Professional Documents
Culture Documents
lasmatematicas.eu
Tema 8: Estadstica en una variable
Fenmenos aleatorios (de azar o estadsticos) son los que al repetirlos un gran
nmero de veces, en idnticas condiciones, presentan resultados diferentes, siendo
imposible predecir el resultado de cada prueba particular. Por ejemplo, los
resultados del lanzamiento de un dado.
Descripcin.
Anlisis.
Prediccin.
Una clasificacin ms general presenta las tcnicas estadsticas en dos grupos con
funciones distintas:
Estadstica Descriptiva.
o Reduccin y descripcin de informaciones voluminosas.
123
lasmatematicas.eu
Tema 8: Estadstica en una variable
Tablas.
Grficas.
Estadstica Inferencial.
o Se apoya en el Clculo de Probabilidades.
o Maneja resultados de la Estadstica Descriptiva.
o Plantea y resuelve el problema de establecer previsiones y conclusiones
generales sobre una poblacin o colectivo.
2. Primeras definiciones
2.1. Poblacin y muestra
La poblacin o universo estadstico es el conjunto de elementos que poseen al menos
una caracterstica comn y sobre los cuales va a incidir el anlisis estadstico. El nmero
de elementos de una poblacin es su tamao (que puede ser finito o no). Si la poblacin
es finita lo representaremos por N.
No siempre es posible efectuar el estudio de todos los elementos de una poblacin. En
este caso, el estudio se puede limitar a una parte de ese todo: a una muestra. As, una
muestra es un subconjunto de la poblacin.
Los elementos de la poblacin se llaman individuos o unidades estadsticas.
Ejemplos
124
lasmatematicas.eu
Tema 8: Estadstica en una variable
Ejemplo
En relacin con cada unidad estadstica pueden ser observadas distintas propiedades que
permiten clasificar a los individuos de la poblacin: estas propiedades se llaman
caracteres o caractersticas estadsticas.
Consideremos una poblacin formada por N estudiantes. Cada estudiante es un
individuo de la poblacin que puede ser estudiado atendiendo a distintos
caracteres: sexo, edad, estatura, lugar de nacimiento, nota obtenida en el ltimo
examen, color del pelo, ...
Para cada caracterstica, deben estar definidas todas las situaciones posibles en que se
puede encontrar una unidad estadstica: stas son las modalidades. En cuanto a las
modalidades, hemos de cuidarnos no slo de enumerarlas sino que han de estar bien
definidas, de modo que cada individuo pueda pertenecer a una y slo una de ellas: las
modalidades han de ser incompatibles (mutuamente excluyentes) y exhaustivas (cubrir
toda la poblacin).
Ejemplo
El carcter edad tiene las siguientes modalidades: {12, 13, 14, 15, 16, 17,
18} si entendemos que la edad se describe por aos cumplidos. Este
carcter es por tanto cuantitativo y podremos hablar de la variable
estadstica edad.
lasmatematicas.eu
Tema 8: Estadstica en una variable
Diremos que una variable estadstica es discreta si su campo de variacin, esto es, el
conjunto de valores que toma la variable, est formado por puntos aislados (en nmero
finito o infinito numerable).
Ejemplo
Diremos que una variable estadstica es continua si su campo de variacin es, al menos
tericamente, un intervalo de la recta real. Dados dos valores cualesquiera de los que
toma la variable, siempre existe entre ellos una infinidad de valores que puede tomar.
Son variables estadsticas discretas:
Cuantitativos
(Variables Estadsticas)
Continuas: valores en un
intervalo de la recta real.
Cualitativos (Atributos)
ni = N
i 1
126
lasmatematicas.eu
Tema 8: Estadstica en una variable
Ni = n1 + n2 + ... + ni =
nr
r 1
Fi = f1 + f2 + ... + fi =
fr
r 1
Los datos observados de una poblacin se muestran clasificados y ordenados para dar
mayor claridad y ofrecer una visin global del conjunto, que sea interpretable. Las dos
formas de representacin, que suponen los dos primeros pasos que hay que dar en el
tratamiento estadstico de la informacin, son las tablas estadsticas y las
representaciones grficas.
Las tablas ms simples son las que constan de una primera columna en la que se reflejan
las distintas modalidades que presenta el carcter en estudio. Se aaden una o ms
columnas a su derecha en las que se anotan las respectivas frecuencias y otras ms para
clculos posteriores.
El aspecto general de una tabla simple, para un carcter con k modalidades, es la
siguiente:
Modalidades
Mi
M1
M2
...
Mi
...
Mk
Frecuencias
absolutas
ordinarias
ni
n1
n2
...
ni
...
nk
N
Frecuencias
absolutas
acumuladas
Ni
N1
N2
...
Ni
Nk = N
Frecuencias
relativas
ordinarias
fi
f1
f2
...
fi
fk
1
Frecuencias
relativas
acumuladas
Fi
F1
F2
...
F1
Fk = 1
Observemos que:
ni = N
i 1
fi = 1
i 1
127
lasmatematicas.eu
Tema 8: Estadstica en una variable
4. Distribuciones de frecuencias
Consideremos una poblacin de tamao N estudiada segn un carcter C que puede ser
clasificado en k modalidades M1, M2, ..., Mi, ..., Mk
Llamamos distribucin de frecuencias al conjunto de pares ordenados:
{(M1, n1), (M2, n2), ..., (Mi, ni), ..., (Mk, nk)} (distribucin de frecuencias absolutas)
o bien al conjunto :
{(M1, f1), (M2, f2), ..., (Mi, fi), ..., (Mk, fk)} (distribucin de frecuencias relativas)
En el caso discreto, las modalidades son los valores numricos aislados que toma la
variable estadstica. Entonces, la distribucin de frecuencias es:
{(x1, n1), (x2, n2), ..., (xi, ni), ..., (xk, nk)} (en el caso de frecuencias absolutas)
o bien:
{(x1, f1), (x2, f2), ..., (xi, fi), ..., (xk, fk)} (en el caso de frecuencias relativas)
4.1. Ejemplo
Un profesor tiene anotadas las calificaciones de los 30 alumnos de un grupo:
5
ni
2
3
1
1
1
3
2
5
7
5
0
30
Ni
2
5
6
7
8
11
13
18
25
30
30
128
fi
2/30
3/30
1/30
1/30
1/30
3/30
2/30
5/30
7/30
5/30
0
1
Fi
2/30
5/30
6/30
7/30
8/30
11/30
13/30
18/30
25/30
30/30
30/30 = 1
lasmatematicas.eu
Tema 8: Estadstica en una variable
(e1, e2]
...
(ei1, ei]
...
(ek1, ek]
Clase 1
Clase 2
...
Clase i-sima
...
Clase ltima
(k-sima)
Extremos de clase: dada la clase i-sima (ei1, ei], a ei1 lo llamaremos lmite inferior
y a ei lmite superior.
Amplitud de clase: llamaremos amplitud de la clase i-sima (ei1, ei] a la longitud del
intervalo, es decir, al nmero ai = ei ei1
Marcas de clase: son los puntos medios de las clases o intervalos. En el caso de la
e e
clase i-sima (ei1, ei], la marca de clase es xi = i 1 i
2
Las amplitudes de las clases no tienen por qu ser iguales. No obstante, si podemos
elegir, es cmodo tomar todas las clases con la misma amplitud. Esto habr que
tenerlo muy en cuenta a la hora delas representaciones grficas: histogramas de
frecuencias.
Ms an, las clases primera y ltima pueden ser intervalos no acotados, de amplitud
infinita. Lo que se pretende con esto es recoger los casos muy extremos, raros,
que se pudieran dar.
129
lasmatematicas.eu
Tema 8: Estadstica en una variable
4.3. Ejemplo
Las edades de las personas que acuden a un mdico a lo largo de un mes son:
3
11
13
27
15
21
14
29
13
17
13
12
26
Marcas de
clase
xi
2,5
7,5
12,5
17,5
22,5
27,5
ni
Ni
fi
Fi
17
7
7
1
1
3
N = 36
17
24
31
32
33
36
17/36
7/36
7/36
1/36
1/36
3/36
17/36
24/36
31/36
32/36
33/36
36/36=1
Observemos que se trata de una variable estadstica discreta a la que, por haber un
nmero grande de datos, se trata como continua agrupando los datos en intervalos.
5. Representaciones grficas
Aunque las tablas de frecuencias contienen informacin suficiente para permitir el
anlisis de los datos, comnmente se recurre a su representacin grfica con el objetivo
de obtener una mejor idea del comportamiento de los datos.
Segn sea el carcter estudiado, se emplean distintos tipos de representaciones grficas
o diagramas:
Carcter cualitativo
(atributo)
Diagrama rectangular.
Diagrama de sectores.
Pictogramas.
Cartogramas.
Pirmides de poblacin.
Variable discreta
Diagrama de barras.
Funcin de distribucin.
Variable continua
Histograma.
Funcin de distribucin.
Carcter cuantitativo
(variable estadstica)
130
lasmatematicas.eu
Tema 8: Estadstica en una variable
ni
0
5
6
4
12
5
N = 32
Ni
0
5
11
15
27
32
fi
Fi
0/32
0/32
5/32
5/32
6/32
11/32
4/32
15/32
12/32
27/32
5/32
32/32 = 1
32/32 = 1
Frecuencias absolutas
DIAGRAMA RECTANGULAR
(Carcter cualitativo-ordinal)
14
12
10
8
6
4
2
0
MDF
INS
SUF
BIEN
NOT
SOB
Calificacin
ni
i
1 360
fi i
1 360
fi
i
100 360
pi (100fi) i
100 360
pi
i
De donde:
ni
360
N
Para el ejemplo anterior se tendra:
i fi 360
131
pi
360
100
Mi
Muy Deficiente
Insuficiente
Suficiente
Bien
Notable
Sobresaliente
ni
0
5
6
4
12
5
N = 32
lasmatematicas.eu
Tema 8: Estadstica en una variable
fi
0/32 = 0,0000
5/32 = 0,15625
6/32 = 0,1875
4/32 = 0,1250
12/32 = 0,3750
5/32 = 0,15625
32/32 = 1
pi (%)
0,00
15,625
18,75
12,50
37,50
15,625
100,00
i ()
0,00
56,25
67,50
45,00
135,00
56,25
360,00
DIAGRAMA DE SECTORES
(Carcter cualitativo-ordinal)
MDF
0%
SOB
16%
INS
16%
SUF
19%
NOT
37%
BIEN
12%
Sobre el eje de abscisas se marca cada uno de los valores de la variable en una
escala aritmtica (divisiones iguales).
Sobre el eje de ordenadas se lleva a cabo una graduacin aritmtica que permita
representar las frecuencias absolutas o relativas (si se van a hacer comparaciones
mejor relativas).
132
lasmatematicas.eu
Tema 8: Estadstica en una variable
xi
ni
300
365
214
83
23
Ni
300
665
879
962
985
992
1000
1000
DIAGRAMA DE BARRAS
(Variable estadstica discreta)
400
350
300
250
200
150
100
50
0
1
133
lasmatematicas.eu
Tema 8: Estadstica en una variable
Sobre el eje de abscisas, graduado segn una escala aritmtica, se marcan los
extremos de las clases sucesivas.
Sobre cada intervalo o clase se dibuja un rectngulo de modo que las reas de loas
rectngulos sean proporcionales a las frecuencias.
Nmero de vehculos
ni
228
634
821
475
233
87
N = 2478
900
800
700
600
500
400
300
200
100
0
(0, 4]
(4, 8]
(8, 12]
(12, 16]
(16, 20]
(20, 24]
Observemos que todos los intervalos tienen la misma amplitud. Entonces, para la
construccin del histograma, podemos asignar como altura de cada rectngulo la
frecuencia absoluta del intervalo correspondiente.
134
lasmatematicas.eu
Tema 8: Estadstica en una variable
Uniendo el vrtice superior izquierdo o los puntos medios de los techos de los
rectngulos, se obtiene una lnea poligonal que encierra sobre el eje X un rea igual a la
que encierran los rectngulos. Tal lnea es el polgono de frecuencias.
POLGONO DE FRECUENCIAS
Variable continua (amplitudes iguales)
900
800
700
600
500
400
300
200
100
0
(0, 4]
(4, 8]
(8, 12]
(12, 16]
(16, 20]
(20, 24]
135
lasmatematicas.eu
Tema 8: Estadstica en una variable
Mediana
Sea X una variable estadstica (carcter cuantitativo) de una poblacin o muestra con N
individuos.
Se llama mediana a un valor, representado por Me, tal que, ordenados los N valores de
X en orden creciente, el 50% de ellos son menores o iguales que Me y el 50% restante
son mayores o iguales que Me.
Para determinar la mediana los haremos en el caso discreto y continuo.
Caso discreto
Consideraremos la siguiente distribucin de frecuencias que nos servir de ejemplo:
xi
3
4
5
6
7
8
9
10
ni
1
2
1
1
3
0
0
1
N=9
Ni
1
3
4
5
8
8
8
9
fi
1/9
2/9
1/9
1/9
3/9
0
0
1/9
1
Fi
1/9
3/9
4/9
5/9
8/9
8/9
8/9
9/9 = 1
6
Me
10
N/2
Me = xi+1
xi
3
4
5 = xi
ni
1
2
1
6
7
8
9
10
1
3
0
0
1
N=9
136
Ni
1
3
4 = Ni
4,5
5 = Ni+1
8
8
8
9
fi
1/9
2/9
1/9
Fi
1/9
3/9
4/9
1/9
3/9
0
0
1/9
1
5/9
8/9
8/9
8/9
9/9 = 1
lasmatematicas.eu
Tema 8: Estadstica en una variable
Puede ocurrir que N/2 coincida con algn valor de Ni. Entonces la mediana es el
x x i 1
valor medio entre xi y xi+1: Me = i
2
Por ejemplo, consideremos ahora la siguiente distribucin de frecuencias. En este
x x i 1
caso N/2 = 5, que coincide con uno de los valores de Ni. Por tanto Me = i
=
2
67
= 6,5.
N/2
2
Me =
xi
3
4
5
6
7
8
9
10
67
= 6,5
2
ni
1
2
1
1
3
0
0
2
N = 10
Ni
1
3
4
5
8
8
8
10
fi
1/10
2/10
1/10
1/10
3/10
0
0
2/10
1
Fi
1/10
3/10
4/10
5/10
8/10
8/10
8/10
10/10 = 1
Observa que si calculamos la mediana directamente sobre los datos, al ser ahora N
par, quedan dos valores centrales. La mediana es el valor medio de estos:
3
Me =
67
= 6,5
2
10
10
Caso continuo
Para este caso tomaremos el ejemplo de clases de igual amplitud de la pgina 134:
consideremos un parque automovilstico de 2478 coches clasificados segn el nmero
de kilmetros recorridos en un ao:
Kilometraje anual
(en miles de
kilmetros)
(ei1, ei]
(0, 4]
(4, 8]
N/2
Intervalo mediano
(8, 12]
(12, 16]
(16, 20]
(20, 24]
Nmero de
vehculos
ni
228
634
1239
821
475
233
87
N = 2478
Frecuencias
absolutas
acumuladas
Ni
228
862
1683
2158
2391
2478
En este caso, la primera clase cuya frecuencia absoluta acumulada es mayor o igual que
N/2 es el intervalo mediano o clase mediana de la distribucin: que los llamaremos
Ii = (ei1, ei] En nuestro ejemplo Ii = (8, 12]. Para obtener la mediana se recurre a la
siguiente frmula:
137
lasmatematicas.eu
Tema 8: Estadstica en una variable
N
Ni 1
Me = ei 1 2
ai
Ni Ni 1
donde ei1 es el lmite inferior del intervalo mediano, ai es la amplitud del intervalo
mediano, Ni1 es la frecuencia absoluta acumulada que se encuentra inmediatamente por
encima del intervalo mediano, Ni es la frecuencia absoluta acumulada correspondiente
al intervalo mediano y N es el nmero de individuos de la poblacin.
N
2478
862
Ni 1
En nuestro ejemplo: Me = ei 1 2
ai = 8 + 2
4 = 9,84
Ni Ni 1
1683 862
Moda
Caso discreto
Dada una variable estadstica discreta X con distribucin de frecuencias
{(x1, n1), (x2, n2), ..., (xi, ni), ..., (xk, nk)}
se llama moda, y se representa por Mo, a la modalidad que presenta una frecuencia
mxima. En el diagrama de barras es la modalidad a la que corresponde la barra ms
alta. Una distribucin puede tener, pues, ms de una moda, en el caso de que la
frecuencia ms alta corresponda a ms de una modalidad.
Si consideramos el ejemplo de las pginas 132 y 133:
Nmero de piezas
defectuosas por lote
Nmero de lotes con
xi piezas defectuosas
xi
ni
300
365
214
83
23
1000
Nmero de vehculos
ni
228
634
821
475
233
87
N = 2478
138
lasmatematicas.eu
Tema 8: Estadstica en una variable
La clase o intervalo modal es, en este caso, (8, 12] pues es la que se presenta en un
mayor nmero de ocasiones (821).
Si queremos especificar ms concretamente a que valor de la variable le atribuimos el
papel de moda, aplicaremos la siguiente frmula:
Mo = ei 1
n i n i 1
ai
(n i n i 1 ) (n i n i 1 )
821 634
4 = 9,04
(821 634) (821 475)
1
ai
1 2
En el ejemplo 1 = 821 634 = 187 y 2 = 821 475 = 346, y entonces se tiene que
187
Mo = 8 +
4 = 9,04
187 346
Observaciones:
Cuando una distribucin presenta varios mximos locales, bien en el
diagrama de barras (caso discreto) o bien en el histograma (caso continuo), se
habla de una distribucin multimodal.
Cuando la clase modal sea una clase extrema, la primera o la ltima, se
supone que la clase anterior o la posterior, respectivamente, es de frecuencia
nula.
Media aritmtica
Caso discreto
Sea X una variable estadstica discreta de una poblacin finita de tamao N y sean x 1,
x2, ..., xN los N valores observados de X.
La media aritmtica, o simplemente media, de esos N valores es:
N
xi
x1 x 2 ... x N i1
x =
N
N
Si de esos N valores slo hay k distintos x1, x2, ..., xk, que se repiten, respectivamente,
n1, n2, ..., nk veces (sus frecuencias absolutas), entonces podemos escribir:
139
lasmatematicas.eu
Tema 8: Estadstica en una variable
n x n 2 x 2 ... n k x k
x = 1 1
N
ni xi
i 1
x = f1x1 f 2 x 2 ... f k x k fi xi
i 1
Usemos uno de los ejemplos anteriores para ver cmo se ordenan los clculos:
xi
3
4
5
6
7
8
9
10
ni
1
2
1
1
3
0
0
2
ni = N = 10
nixi
3
8
5
6
21
0
0
20
nixi = 63
fi
1/10
2/10
1/10
1/10
3/10
0
0
2/10
fi = 1
fixi
3/10
8/10
5/10
6/10
21/10
0
0
20/10
fixi = 63/10
ni xi
x =
i 1
63
= 6,3
10
x =
63
fi x i = 10
= 6,3
i 1
Caso continuo
En este caso, reemplazamos las clases por sus marcas xi (lo que equivale a suponer que
todos los puntos del intervalo estn concentrados en su punto medio). Se trata de una
especie de discretizacin de la variable. Las frmulas para el calculo de la media son
las mismas de antes.
Por ejemplo:
Clase
(ei1, ei]
(0, 150]
(150, 300]
(300, 350]
(350, 400]
(400, 500]
(500, )
Marca de
clase
xi
75
225
325
375
450
550
140
Frecuencias
absolutas
ni
120
159
89
78
66
52
N = 564
xini
9000
35775
28925
29250
29700
28600
161250
lasmatematicas.eu
Tema 8: Estadstica en una variable
Para la clase extrema (500, ) se podran adoptar diversos convenios. Hemos adoptado
el de asignarle la misma amplitud que a la anterior.
6
ni xi
La media es, por tanto: x =
i 1
161250
= 285,9
564
tN Ni 1
ai
Ni Ni 1
Cuartiles
Dividen a la poblacin en cuatro partes, cada una de las cuales contiene al 25% de las
observaciones. Los cuartiles son:
Primer cuartil:
Q1 = C1/4
(t = 1/4 = 0,25)
(t = 1/2 = 0,5)
Tercer cuartil:
(t = 3/4 = 0,75)
Q3 = C3/4
En el caso continuo, una vez determinado el intervalo (ei1, ei] que contiene a Qk, de
frecuencia absoluta acumulada Nk, las frmulas para los tres cuartiles son:
141
lasmatematicas.eu
Tema 8: Estadstica en una variable
1
N Ni 1
Q1 = ei 1 4
ai
Ni Ni 1
1
N Ni 1
Q2 = ei 1 2
a i = Me
Ni Ni 1
3
N Ni 1
Q3 = ei 1 4
ai
Ni Ni 1
Es conveniente observar que los cuartiles no tienen por qu estar unos a la misma
distancia de otros: lo que han de verificar es que entre cada dos consecutivos est el
25% de la poblacin:
25 %
e0
25 %
Q1
25 %
25 %
Q2 = Me
Q3
ek
Deciles
Dividen a la poblacin en diez partes, cada una de las cuales contiene al 10% de las
observaciones. Los deciles son:
Primer decil:
D1 = C1/10
(t = 0,10)
Quinto decil:
D5 = C5/10 = Q2 = Me (t = 0,50)
N Ni 1
D = ei 1 10
ai
Ni Ni 1
Centiles o percentiles
Dividen a la poblacin en cien partes, cada una de las cuales contiene al 1% de ella. Los
percentiles son:
P1 = C1/100
(t = 0,01)
..
P25 = C25/100 = Q1
(t = 0,25)
..
P50 = C50/100 = Q2 = Me
(t = 0,50)
..
P75 = C75/100 = Q3
(t = 0,75)
..
P99 = C99/100
(t = 0,99)
142
lasmatematicas.eu
Tema 8: Estadstica en una variable
Veamos dos ejemplos (uno de variable discreta y otro de variable continua) en los que
se aprecie el clculo de los distintos parmetros:
Ejemplo 1: consideremos el ejemplo de las pginas 132 y 133: una poblacin
formada por 1000 lotes de ciertas piezas mecnicas. El carcter que se observa es el
nmero de piezas defectuosas que contiene: 0, 1, 2, 3, 4, 5 6.
Las frecuencias vienen dadas en la siguiente tabla:
xi
ni
Ni
nixi
0
300
300
0
1
365
665
365
2
214
879
428
3
83
962
249
4
23
985
92
5
7
992
35
6
8
1000
1000
48 1217
Calcular la media, la moda, la mediana, los tres cuartiles, los deciles sexto y sptimo, y
los percentiles P40 y P95
1217
= 1,217 y que Mo = 1. Para determinar los dems parmetros
1000
miraremos en la fila de frecuencias absolutas acumuladas.
Es claro que x =
Mediana: la primera frecuencia absoluta acumulada que es mayor que N/2 = 500 es
N2 = 665. Por tanto Me = 1
Cuartiles: la primera frecuencia absoluta acumulada que es mayor o igual que
N/4 = 250 es N1 = 300. Entonces Q1 = 0 (el primer 25% de los lotes observados,
ordenados por orden creciente de piezas defectuosas, tiene 0 piezas defectuosas).
Por otro lado Q2 = Me = 1 (el segundo 25% de los lotes observados tienen 0 1
pieza defectuosas). Por ltimo, la primera frecuencia absoluta acumulada que es
mayor que 3N/4 = 750 es N3 = 879. Entonces Q3 = 2 (el tercer 25% de la poblacin
tiene 0, 1 2 piezas defectuosas).
Sexto y sptimo deciles: la primera frecuencia absoluta acumulada que es mayor
que 6N/10 = 600 es N2 = 665. Por tanto D6 = 1 (es decir, el primer 60% de los lotes
observados tienen 0 1 piezas defectuosas). De forma similar, como 7N/10 = 700,
la primera frecuencia acumulada que es mayor que tal valor es N3 = 879 y entonces
D7 = 2 (lo que quiere decir que el 70% de los lotes tienen 0, 1 2 piezas
defectuosas).
Percentiles P40 y P95: la primera frecuencia absoluta acumulada que es mayor que
40N/100 = 400 es N2 = 665. Entonces P40 = 1 (el 40% de los lotes tiene 0 1 pieza
defectuosa). Finalmente, como la primera frecuencia absoluta acumulada que es
mayor que 95N/100 = 950 es N4 = 962, tenemos que P95 = 3 (el 95% de los lotes
tienen 0, ,1, 2 3 piezas defectuosas).
Ejemplo 2: los pesos en kg. de 100 alumnos de un colegio vienen dados por la tabla
Ii
(40, 48]
(48, 56]
(56, 64]
(64, 72]
(72, 80]
ni
8
22
29
21
20
100
xi
44
52
60
68
76
Ni
8
30
59
80
100
nixi
352
1144
1740
1428
1520
6184
Media: x =
lasmatematicas.eu
Tema 8: Estadstica en una variable
6184
= 61,84
100
1
ai =
1 2
7
8 = 59,73
78
20
22
24
26
28
B:
10
10
20
35
45
que podran representar los pesos de dos grupos de nios. Observamos que los dos
grupos tienen el mismo peso medio: x = 24, siendo, no obstante, muy diferentes en
cuanto a concentracin-dispersin de sus valores. En el grupo A los valores se
encuentran prximos a la media, luego tienen poca dispersin. En el grupo B, los
valores estn alejados de la media, estando formado por valores ms dispersos.
Al grado en que los datos numricos tienden a extenderse alrededor de un valor
promedio (estadstico de centralizacin como la media o mediana, por ejemplo) se le
llama variacin o dispersin de los datos.
Se utilizan distintas medidas de dispersin. Las ms empleadas son: rango o recorrido,
recorrido intercuartlico, desviacin absoluta media, varianza, desviacin tpica y
coeficiente de variacin. Nosotros nos ceiremos a las ms importantes: varianza,
desviacin tpica y coeficiente de variacin.
144
lasmatematicas.eu
Tema 8: Estadstica en una variable
Var(X) = 2 = X X
2
ni (xi x)2
i 1
fi (x i x) 2
i 1
Puesto que la varianza de X no viene dada en las mismas unidades de X (si, por
ejemplo, la variable viene dada en metros, la varianza resulta en metros cuadrados), en
su lugar se emplea la desviacin tpica, , definida como
= + Var(X) = + 2
En la medida en que la varianza o la desviacin tpica tomen valores ms o menos
grandes, esto indicar el grado de dispersin o alejamiento de los datos respecto de la
media. En el caso trivial de que todos los valores de la variable estn concentrados en
un punto (que coincidir con la media), estos estadsticos de dispersin se anularn.
Hay una frmula que se obtiene del desarrollo de la expresin de la varianza que
permite calcular sta de manera simplificada. Es la siguiente:
k
Var(X) = 2 =
ni xi2
i 1
x 2
Coeficiente de variacin
Esta es una medida abstracta que no tiene dimensiones. Tiene las siguientes
propiedades:
Suele expresarse en %: CV =
100
x
145
lasmatematicas.eu
Tema 8: Estadstica en una variable
ni
8
22
29
21
20
100
Recordemos que x =
xi2
1936
2704
3600
4624
5776
xi
44
52
60
68
76
nixi
352
1144
1740
1428
1520
6184
nixi2
15488
59488
104400
97104
115520
392000
6184
= 61,84. Calcularemos la varianza con la frmula
100
simplificada: 2 =
ni xi2
i 1
x 2 =
392000
61,842 = 95,8144. Por tanto la desviacin
100
9, 788
=
0,158, es decir la desviacin
61,84
x
tpica es el 16,2 % de la media; por tanto, la media es muy representativa de la
poblacin.
El coeficiente de variacin es pues: CV =
146
lasmatematicas.eu
Tema 8: Estadstica en una variable
Ejercicios y problemas
1. Completar los datos que faltan en la siguiente tabla estadstica, donde (como se debe
saber) ni, Ni, fi y Fi son las frecuencias absolutas, absolutas acumuladas, relativas y
relativas acumuladas.
xi
1
2
3
4
5
6
7
8
ni
4
4
7
5
Ni
fi
0,08
16
0,16
0,14
28
38
45
Fi
xi2
nixi
nixi2
0,14
N=
Calcular la moda, media, varianza y desviacin tpica. Calcular el coeficiente de
variacin e interpretarlo. Calcular la mediana y los cuartiles.
2. Las puntuaciones obtenidas por 20 personas en una prueba quedan reflejadas en el
siguiente histograma de frecuencias absolutas. Calcular la moda, media, varianza y
desviacin tpica. Calcular el coeficiente de variacin e interpretarlo.
9
8
7
ni
6
5
4
3
2
1
0
(0, 2]
(2, 4]
(4, 6]
(6, 8]
(8, 10]
Grupo B
147
lasmatematicas.eu
Tema 8: Estadstica en una variable
(0, 4]
(4, 8]
Nmero de empleados
15
10
(500, 700]
(700, 900]
N de
personas
10
10
(50, 60]
(60, 70]
(70, 80]
Nmero de empleados
10
15
20
Calcular el peso medio, los cuartiles y la desviacin tpica. Interpreta los resultados.
Se puede decir que es un grupo homogneo?
7. La tabla de frecuencias que se da a continuacin corresponde a la variable
estadstica X = Posicin en la liga de un cierto equipo, medida durante quince
aos consecutivos:
X
5 o peor
Nmero de veces
148