You are on page 1of 6

Facultad de Ingeniería

Estadística 1
Ing. Edwin Bracamonte Orozco

Distribución de Frecuencias
El término Distribución de Frecuencias esta asociado con la agrupación de los datos observados, en grupos o clases. El objeto de la agrupación es
resumir la información para ser presentada de forma tabular, por lo que es importante tomar en cuenta que la cantidad ideal de grupos o clases no
sea menor de 5 y ni mayor de 15, lo cual dependerá de la cantidad de datos, y la amplitud de los mismos.

Cabe destacar que en muchos casos de acuerdo a la naturaleza de los datos se pueden utilizar distribuciones de frecuencias ya establecidas, como
por ejemplo, si los datos corresponden a edad, calificaciones, ingresos mensuales.

Cuando se desea determinar el número de clases para agrupar una serie de datos se puede utilizar, la conocida formula de STURGES:

k = 1 + 3.3(log (n)

o bien de manera alternativa, se puede utilizar √𝑛, lo que es válido si n<100.

Este valor de k nos proporciona una cantidad aproximada del número requerido de grupos, el cual nos sirve de base para el calculo de la amplitud
de cada clase o tamaño del intervalo al dividirla entre el rango de los datos, el valor mayor menos el valor menor.

𝑅 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟


𝑖= =
𝑘 𝑘

A modo de ejemplo se cuenta con la siguiente información referente a 125 lecturas obtenidas en un hospital por un analista de tiempos y
movimientos, quién realizó cinco lecturas al día, durante 25 días.

Día Lectura 1 Lectura 2 Lectura 3 Lectura 4 Lectura 5


1.00 1.90 1.93 1.95 2.05 2.20
2.00 1.76 1.81 1.81 1.83 2.01
3.00 1.80 1.87 1.95 1.97 2.07
4.00 1.77 1.83 1.87 1.90 1.93
5.00 1.93 1.95 2.03 2.05 2.14
6.00 1.76 1.88 1.95 1.97 2.00
7.00 1.87 2.00 2.00 2.03 2.10
8.00 1.91 1.92 1.94 1.97 2.05
9.00 1.90 1.91 1.95 2.01 2.05
10.00 1.79 1.91 1.93 1.94 2.10
11.00 1.90 1.97 2.00 2.06 2.28
12.00 1.80 1.82 1.89 1.91 1.99
13.00 1.75 1.83 1.92 1.95 2.04
14.00 1.87 1.90 1.98 2.00 2.08
15.00 1.90 1.95 1.95 1.97 2.03
16.00 1.82 1.99 2.01 2.06 2.06
17.00 1.90 1.95 1.95 2.00 2.10
18.00 1.81 1.90 1.94 1.97 1.99
19.00 1.87 1.89 1.98 2.01 2.15
20.00 1.72 1.78 1.96 2.00 2.05
21.00 1.87 1.89 1.91 1.91 2.00
22.00 1.76 1.80 1.91 2.06 2.12
23.00 1.95 1.96 1.97 2.00 2.00

1
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

24.00 1.92 1.94 1.97 1.99 2.00


25.00 1.85 1.90 1.90 1.92 1.92

Con los datos anteriores se cuenta con n=125 datos, con valor máximo de 2.28 min y un valor mínimo de 1.72 min, los cuales agruparemos en:
k = 1 + 3.3(log (125) = 7.91 ≅ 8

la amplitud del intervalo sería igual a:

2.28 − 1.72
𝑖= = 0.07
7.91
ordenando los datos de menor a mayor se tiene:

Día Lectura 1 Lectura 1 Lectura 1 Lectura 1 Lectura 1


1 1.72 1.87 1.92 1.97 2.01
2 1.75 1.88 1.92 1.97 2.01
3 1.76 1.89 1.93 1.97 2.03
4 1.76 1.89 1.93 1.97 2.03
5 1.76 1.89 1.93 1.97 2.03
6 1.77 1.90 1.93 1.97 2.04
7 1.78 1.90 1.94 1.98 2.05
8 1.79 1.90 1.94 1.98 2.05
9 1.80 1.90 1.94 1.99 2.05
10 1.80 1.90 1.94 1.99 2.05
11 1.80 1.90 1.95 1.99 2.05
12 1.81 1.90 1.95 1.99 2.06
13 1.81 1.90 1.95 2.00 2.06
14 1.81 1.90 1.95 2.00 2.06
15 1.82 1.90 1.95 2.00 2.06
16 1.82 1.91 1.95 2.00 2.07
17 1.83 1.91 1.95 2.00 2.08
18 1.83 1.91 1.95 2.00 2.10
19 1.83 1.91 1.95 2.00 2.10
20 1.85 1.91 1.95 2.00 2.10
21 1.87 1.91 1.95 2.00 2.12
22 1.87 1.91 1.96 2.00 2.14
23 1.87 1.92 1.96 2.00 2.15
24 1.87 1.92 1.97 2.01 2.20
25 1.87 1.92 1.97 2.01 2.28

Se pueden agrupar los datos en las siguientes clases:

Límites aparentes Total (𝑓𝑖 )


1.70 1.76 5
1.77 1.83 14
1.84 1.90 21

2
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

1.91 1.97 41
1.98 2.04 25
2.05 2.11 14
2.12 2.18 3
2.19 2.25 1
2.26 2.32 1
125

Como podemos ver logramos agrupar los 125 datos en 9 clases. El total en cada clase corresponde a la frecuencia absoluta “𝑓𝑖 ” de la misma.

Límites reales
Los límites reales nos sirven para darle continuidad a la distribución de frecuencias, para definirlos el límite inferior de la primera clase comienza
con un medio menos de la unidad que diferencia al límite aparente superior de la clase anterior con el limite aparente inferior de la clase siguiente,
y por lo tanto, el límite superior termina con un medio más, es decir, si la diferencia es:

a. 1 restar 0.5 al límite inferior y sumar 0.5 al límite superior de la clase.


b. 0.1 restar 0.05 al límite inferior y sumar 0.05 al límite superior de la clase.
c. 0.01 restar 0.005 al límite y sumar 0.005 al límite superior inferior de la clase.

En nuestro ejemplo, los límites aparentes se presentan con dos decimales debemos restar a los limites inferiores 0.005 y a los límites superiores
sumar 0.005.

Límites reales Total (𝑓𝑖 )


1.695 1.765 5
1.765 1.835 14
1.835 1.905 21
1.905 1.975 41
1.975 2.045 25
2.045 2.115 14
2.115 2.185 3
2.185 2.255 1
2.255 2.325 1
Sumatoria 125

Frecuencia acumulada
La frecuencia acumulada “𝐹𝑖 ”, permite obtener la distribución acumulada de las frecuencias, tiene como finalidad señalar el número de casos que se
son menores o iguales a un determinado valor. Para obtener la frecuencia acumuladas se suman las frecuencias absolutas de las clases, teniendo en
la primera clase la correspondiente a la frecuencia absoluta y en la última clase el total de datos o suma de frecuencias absolutas

Frecuencia relativa
Nos permite representar la frecuencia absoluta de manera relativa, se obtiene dividiendo la frecuencia de cada clase entre la sumatoria de
𝑓
frecuencias 𝑓𝑟 = ∑ 𝑖 , al multiplicarla por 100 se obtiene en términos porcentuales.
𝑓𝑖

Punto medio o marca de clase


Debido a que al agrupar los datos en las diferentes clases no es posible reconocer que valores se tienen en la misma y solo suponemos que se tiene
dentro de la clase una distribución uniforme de todos los datos registrados en la misma, determinar el punto medio Xi nos ayuda a tener una
representación de cada clase dentro de la distribución, y lo determinamos de la siguientes forma:

3
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 + 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟


𝑋𝑖 =
2

𝑋𝑖
Límites Reales 𝑓𝑖 𝐹𝑖 𝑓𝑟
1.695 1.765 5 5 0.0400 1.73
1.765 1.835 14 19 0.1120 1.80
1.835 1.905 21 40 0.1680 1.87
1.905 1.975 41 81 0.3280 1.94
1.975 2.045 25 106 0.2000 2.01
2.045 2.115 14 120 0.1120 2.08
2.115 2.185 3 123 0.0240 2.15
2.185 2.255 1 124 0.0080 2.22
2.255 2.325 1 125 0.0080 2.29
Sumatorias 125 1.0000

Gráficas de una distribución de frecuencias

Histograma.
Es un diagrama de área, se supone que en cada rectángulo la superficie es igual a la frecuencia de la clase, correspondiente al producto de una base
unitaria (el intervalo de la clase) por la frecuencia de la clase, siendo el área total bajo el histograma igual a ∑ 𝑓𝑖 .

En la gráfica No. 1, se presenta la distribución de frecuencias en un histograma, para lo cual en el eje de las ordenadas (Y) colocamos la frecuencia
absoluta 𝑓𝑖 y en el eje de las abscisas (X) los límites reales.

Histograma
60
Frecuencia absoluta fi

40
20
0
1.695 - 1.765 - 1.835 - 1.905 - 1.975 - 2.045 - 2.115 - 2.185 - 2.255 -
1.765 1.835 1.905 1.975 2.045 2.115 2.185 2.255 2.325
Límites Reales

Gráfica No. 1. Histograma Distribución de frecuencias de lecturas de tiempos en minutos.

Podemos observar que la tendencia de la gráfica es de un sesgo (asimetría) hacia los valores inferiores de tiempo, lo cual podremos confirmarlo al
calcular las medidas de tendencia central: promedio aritmético, mediana y moda, es decir, se esperaría que los resultados se presenten de la
siguiente forma:

𝑋̅ ≤ 𝑀𝑒 ≤ 𝑀𝑜

Polígono de frecuencias
Otra forma de representar una distribución de frecuencias es utilizando el polígono, para lo cual se utilizan los puntos medios de clase sobre el
histograma y luego se unen con segmentos de recta, debiendo agregar media clase antes de la primera y media clase después de la última con
frecuencia cero.

4
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco
En la Gráfica No. 2, se presenta el polígono de frecuencias y podemos observar con mayor claridad la tendencia de los datos hacia los valores
inferiores de tiempo.

Polígono de frecuencias
50
Frecuencia absoluta fi

40
30
20
10
0
1.66 1.730 1.800 1.870 1.940 2.010 2.080 2.150 2.220 2.290 2.360
Puntoa mwdios

Gráfica No. 2. Histograma Distribución de frecuencias de lecturas de tiempos en minutos.

Curva de frecuencias:
De igual manera que con el polígono podemos representar una distribución de frecuencias utilizando la curva de frecuencias, para lo cual se traza
sobre el histograma una curva a mano alzada que nos permite observar la tendencia de la distribución.

Es importante señalar que la curva de frecuencias es más útil cuando se tiene un número muy grande datos y el intervalo de clase puede ser mas
pequeño, lo que permite percibir una variación suave de la frecuencia de una clase a otra, o cuando se establece un modelo matemático adecuado
para describir la variación mostrada por la distribución de frecuencias.

En la Gráfica No. 3, se presenta la curva de frecuencias y podemos observar la tendencia de los datos hacia los valores inferiores de tiempo.

Ojiva:
Se utiliza para representar la distribución de frecuencias acumulada, se construye colocando en el eje de las ordenadas la frecuencia acumulada,
(puede ser la relativa acumulada) y en el eje de las abscisas los límites reales, en la Gráfica No 4., se presenta la distribución acumulada.

5
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

Curva de frecuencias
45
40
Frecuencia absoluta fi

35
30
25
20
15
10
5
0
1.695 1.765 1.835 1.905 1.975 2.045 2.115 2.185 2.255 2.325 2.395
Límites Reales

Gráfica No. 3. Curva de la distribución de frecuencias de lecturas de tiempos en minutos.


Gráfica No. 4. Ojiva de la distribución de frecuencias de lecturas de tiempos en minutos

Ojiva
140

120
Frecuencia acumulada Fi

100

80

60

40

20

0
1.695 1.765 1.835 1.905 1.975 2.045 2.115 2.185 2.255 2.325
Límites reales

You might also like