You are on page 1of 5

3.

4 Cuantiles: Cuartiles y percentiles


Los cuantiles son aquellos valores de la variable estadstica que dividen a los
valores de la variable (supuestos ordenados de forma creciente) en intervalos con
igual numero de observaciones. Se clasifican en distintos tipos dependiendo del
numero de intervalos en que dividan a los valores: cuartiles, deciles y percentiles.
Sea X una variable estadstica y sea un numero real tal que 0 < < 1.
En general, un cuantil de orden de la variable X, divide a la poblacion en dos
partes, de tal manera que una proporcion de la poblacion es menor que dicho
valor y el resto mayor.

Cuartiles
Son tres valores que distribuyen la serie de datos, ordenada de forma creciente,
en cuatro tramos iguales, en los que cada uno de ellos contiene el 25% de las
observaciones. Se denotan por Q1 , Q2 y Q3 . El primer cuartil, Q1 , es el que
deja a su izquierda la cuarta parte ( = 0.25) de la poblacion que es menor
que el; el segundo cuartil, Q2 , coincide con la mediana dejando, por tanto, a
su izquierda a la mitad de poblacion y el tercero, Q3 , deja a su izquierda tres
cuartas partes de la poblacion ( = 0.75) que son menores que el.

Deciles
Son nueve valores que distribuyen la serie de datos, ordenada de forma creciente,
en diez tramos iguales, en los que cada uno de ellos contiene el 10% de las
observaciones. Se denotan por: D1 , D2 , . . . , D9 . Esta claro que D5 = M e. En
general, el decil de orden n, Dn , divide a la poblacion en dos partes de tal forma
que una proporcion = n/10 de la poblacion es menor que el y el resto mayor.

Percentiles
Son noventa y nueve valores que distribuyen la serie de datos, ordenada de forma
creciente, en cien tramos iguales, en los que cada uno de ellos contiene el 1% de
las observaciones. Se denotan por: P1 , P2 , . . . , P99 . El percentil de orden n, Pn ,
divide a la poblacion en dos partes de tal forma que una proporcion = n/100
de la poblacion es menor que el y el resto mayor.

Calculo de un cuantil
Para calcular un cuantil C() se razona de manera analoga al calculo de la
mediana, pero ahora se supone que se esta interesado en calcular el valor que
deja por debajo al 100 % de la distribucion.

1. Caso discreto
Sean {x1 , . . . , xk } los valores de la variable estadstica discreta X.

1
(a) Si no existe un valor xi con frecuencia relativa acumulada igual a
(Fi = ), entonces el cuantil de orden es el primer valor de la
variable tal que Fi > .
(b) Si existe un valor de la variable xi que verifique Fi = , entonces el
cuantil de orden sera
xi + xi+1
C() = .
2
2. Caso continuo

(a) Si existe algun intervalo Ii = (ei1 , ei ], tal que Fi = , entonces


C() = ei .

(b) Si no existe un intervalo Ii = (ei1 , ei ], tal que Fi = , se selecciona


el primer intervalo en el que la frecuencia relativa acumulada supere
el valor . Dicho intervalo contiene el cuantil de orden .
Para determinar con exactitud en que valor se cumple que Fi = ,
se utiliza la interpolacion.

Fi1
C() = ei1 + ai (1)
fi
Y en terminos de frecuencias absolutas,
N Ni1
C() = ei1 + ai (2)
ni

Ejemplo 1: Calculo de cuantiles en una variable estadstica discreta

La siguiente tabla incluye el no de alumnos por edades que empiezan el grado


de Ingeniera Informatica en el presente curso:

Edad Numero de alumnos


17 15
18 42
19 19
20 6
21 3

Calcular el primer cuartil, tercer cuartil y el percentil 40.

Solucion: Para el calculo de cuantiles, en general, se obtienen, en primer


lugar, las frecuencias relativas y relativas acumuladas correspondientes a cada
valor.

2
xi ni fi Fi
17 15 0.1765 0.1765
18 42 0.4941 0.6706
19 19 0.2235 0.8941
20 6 0.0706 0.9647
21 3 0.0353 1
85 1

Primer cuartil: Q1
Para calcular el primer cuartil, buscamos el primer valor de la variable
cuya frecuencia relativa acumulada es igual o mayor que 0.25. En este
caso, Q1 = 18 anos, cuya frecuencia relativa acumulada es 0.6706.
El 25% de los alumnos que empiezan el grado de Ingeniera Informatica
tienen 18 o menos anos.
Tercer cuartil: Q3
Para calcular el tercer cuartil, buscamos el primer valor de la variable
cuya frecuencia relativa acumulada es igual o mayor que 0.75. En este
caso, Q3 = 19 anos, cuya frecuencia relativa acumulada es 0.8941.
El 75% de los alumnos que empiezan el grado de Ingeniera Informatica
tienen 19 o menos anos.
Para calcular el percentil 40, buscamos el primer valor de la variable cuya
frecuencia relativa acumulada es igual o mayor que 0.40. En este caso,
P40 = 18 anos, cuya frecuencia relativa acumulada es 0.6706.
El 40% de los alumnos que empiezan el grado de Ingeniera Informatica
tienen 18 o menos anos.

Ejemplo : Calculo de la media en una variable estadstica continua

Los siguientes datos se refieren al numero de vctimas de violencia de genero


por grupos de edad en el ano 2011 (Fuente: Instituto Nacional de Estadstica)1 .
1 En la tabla se han eliminado los datos correspondientes a las vctimas de menos de 18

anos y en el ultimo grupo se ha elegido una amplitud identica al intervalo anterior.

3
Edad Numero de vctimas
[18, 19] 1.055
(19, 24] 4.115
(24, 29] 5.074
(29, 34] 5.813
(34, 39] 5.477
(40, 44] 4.249
(44, 49] 2.737
(49, 54] 1.476
(54, 59] 700
(59, 64] 396
(64, 69] 270
(69, 74] 146
(74, 79] 163

Obtener el decil 2, tercer cuartil y percentil 95.

Solucion: Para el calculo de la mediana se obtienen, en primer lugar, las


frecuencias relativas y relativas acumuladas correspondientes a cada intervalo.
Se anade, ademas, una columna con las amplitudes de cada intervalo.

(ei1 , ei ] ni fi Fi ai
[18, 19] 1.055 0.0333 0.0333 1
(19, 24] 4.115 0.1299 0.1632 5
(24, 29] 5.074 0.1602 0.3234 5
(29, 34] 5.813 0.1835 0.5069 5
(34, 39] 5.477 0.1729 0.6798 5
(40, 44] 4.249 0.1342 0.8140 5
(44, 49] 2.737 0.0864 0.9004 5
(49, 54] 1.476 0.0466 0.9470 5
(54, 59] 700 0.0221 0.9691 5
(59, 64] 396 0.0125 0.9816 5
(64, 69] 270 0.0085 0.9901 5
(69, 74] 146 0.0046 0.9947 5
(74, 79] 163 0.0051 1 5
31671 1

Decil 2
En primer lugar buscamos el intervalo que contiene el decil 2, para ello
elegimos aquel cuya frecuencia relativa acumula es igual a superior a 0.2.
En este caso, el D2 (24, 29] cuya frecuencia relativa acumulada es 0.3234.
El valor exacto del decil 2 lo obtenemos aplicando la formula:

0.2 Fi1 0.2 0.1632


D2 = ei1 + ai = 24 + 5 = 25.1486
fi 0.1602

4
El 20% de las vctimas de violencia de genero durante el ano 2011 tena
menos de 25 anos.
Tercer cuartil
En primer lugar buscamos el intervalo que contiene el tercer cuartil, para
ello elegimos aquel cuya frecuencia relativa acumula es igual a superior a
0.75. En este caso, el Q3 (40, 44] cuya frecuencia relativa acumulada es
0.8140.
El valor exacto del tercer cuartil lo obtenemos aplicando la formula:

0.75 Fi1 0.75 0.6798


Q3 = ei1 + ai = 40 + 5 = 42.6155
fi 0.1342

El 75% de las vctimas de violencia de genero durante el ano 2011 tena


menos de 42 anos.
Percentil 95
En primer lugar buscamos el intervalo que contiene el percentil 95, para
ello elegimos aquel cuya frecuencia relativa acumula es igual a superior a
0.8. En este caso, el P95 (54, 59] cuya frecuencia relativa acumulada es
0.9691.
El valor exacto del percentil 95 lo obtenemos aplicando la formula:

0.95 Fi1 0.95 0.9470


P95 = ei1 + ai = 54 + 5 = 54.6787
fi 0.0221

El 95% de las vctimas de violencia de genero durante el ano 2011 tena


menos de 54 anos.

You might also like