You are on page 1of 10

UNIVERSIDAD CATÓLICA SEDES SAPIENTIAE

ESTADÍSTICA GENERAL TEMA Nº 2

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS


Profesor: Tito Navarro Guerrero

TABLA DE FRECUENCIAS: VARIABLES CATEGÓRICAS


Cuando la variable es de tipo categórico o cualitativo, la organización y presentación de los
datos, comúnmente aceptada, se hace mediante tres columnas de la siguiente manera:
1º) En la primera columna se escriben los nombres diferentes de las clases que la variable
presenta en el conjunto de datos recolectados; es decir, los nombres de los valores
diferentes de los datos recolectados.
2º) En la segunda columna se escriben las frecuencias absolutas simples (f) para cada clase,
es decir, el número de veces que se presenta o repite cada clase de la variable.
3º) En la tercera y última columna se escriben las frecuencias porcentuales simples (%)
𝐟
para cada clase, las cuales se obtienen mediante la expresión (𝐧) 𝐱𝟏𝟎𝟎, donde n es el
𝐟
número total de datos recopilados llamado tamaño de la muestra y 𝐧 es llamada
frecuencia relativa simple. Estas frecuencias porcentuales simples, por lo general, se
acostumbran a aproximar con una cifra decimal.
En el siguiente cuadro se presenta la tabla de frecuencias de los resultados de un estudio de
mercado a 150 personas adultas del distrito de San Borja para conocer su estado civil, con el
respectivo título del cuadro a presentar.
Cuadro 1. Estado civil de personas adultas del distrito de San Borja

Estado civil Número de Porcentaje de


personas personas

Soltero 25 16.7

Casado 42 28.0

Conviviente 18 12.0

Viudo 50 33.3

Divorciado 15 10.0

Total 150 100.0

1
Aparte de los dos tipos de frecuencias presentadas en la tabla (frecuencias absolutas simples
y las frecuencias porcentuales simples), se utilizan otros tipos de frecuencias que se irán
definiendo en su momento. Estas otras frecuencias son llamadas frecuencias absolutas
acumuladas, frecuencias relativas simples, frecuencias relativas acumuladas y
frecuencias porcentuales acumuladas.
GRÁFICA DE LAS VARIABLES CATEGÓRICAS
Para representar gráficamente un conjunto de datos estadísticos referidos a variables de tipo
categórico se utilizan diferentes formas gráficas, siendo las más usadas: el gráfico de barras
y el gráfico de sectores circulares.
El gráfico de barras son rectángulos, separados unos de otros, donde cada uno representa
una clase que toma la variable y cuya altura corresponde a las frecuencias (absolutas o
relativas) de dicha clase. Estos gráficos pueden ser: de barras simples, de barras
compuestas y de barras múltiples (dobles, triples, etc.).
El gráfico de sectores circulares son círculos, enteros o entrecortados, donde las categorías o
clases que toma la variable están representadas por un sector circular que es un área circular
igual al área total del círculo multiplicada por la frecuencia relativa de la clase que toma la
variable. Cuando este tipo de gráfica se representa en un espacio tridimensional se le llama de
pastel.
En la práctica, estos gráficos de sectores circulares se obtienen dividiendo el círculo, desde su
centro, en un número de sectores circulares igual al número de clases que toma la variable, y
en donde cada sector circular es el valor del ángulo central del círculo que se obtiene
𝐟
mediante la siguiente fórmula: xº = 360º ⦋(𝐧) 𝐱𝟏𝟎𝟎⦌, ∀ i, redondeando cada valor de x° al
entero más próximo, excepto el último que se hace por diferencia de los 360° menos la suma
𝐟
de los anteriores valores obtenidos. La expresión (𝐧) 𝐱𝟏𝟎𝟎 es la frecuencia porcentual simple
respectiva de cada clase. A continuación se dan algunos ejemplos de estos gráficos.

2
Gráfico 1. Barras simples

Estado civil de personas adultas del distrito de San Borja


60

50

40

30

20

10

0
Soltero Casado Conviviente Viudo Divorciado

Gráfico 2. Barras dobles


Tipo de aceites consumidos en el año 2007 y 2008
60%
40%
20%

2007 2008

Leyenda: Aceite vegetal:


Aceite compuesto:
Gráfico 3. Barras compuestas
Tipo de aceites consumidos en el año 2007 y 2008
100%

50%

2007 2008
Leyenda: Aceite vegetal:
Aceite compuesto:

3
Gráfico 4. Gráfico circular

Estado civil de personas adultas del distrito de San Borja


Divorciado
10% Soltero
16.7%

Viudo
33,3%
Casado
28%

Conviviente
12%
Soltero Casado Conviviente Viudo Divorciado

TABLA DE FRECUENCIAS: VARIABLES CUANTITATIVAS DISCRETAS


La forma más simple de organizar las observaciones de una variable discreta, cuando algunas
o todas de ellas se repiten, consiste en ordenar los valores diferentes que toma la variable en
forma ascendente y luego proceder a construir una tabla de distribución de frecuencias de
tales observaciones. Las frecuencias que se obtienen son como las obtenidas en la tabla de
frecuencias para las variables categóricas, es decir, las frecuencias absolutas simples y las
frecuencias porcentuales simples.
En el siguiente cuadro se presenta una tabla de distribución de frecuencias de los resultados de
un estudio a 200 hogares del Callao para ver el número de celulares que tienen.

Cuadro 2. Número de celulares que hay en los hogares del Callao


Número Número Porcentaje
de de de
celulares hogares celulares

0 30 15

1 90 45

2 50 25

3 30 15

Total 200 100

4
GRÁFICA DE VARIABLES CUANTITATIVAS DISCRETAS
Un conjunto de datos estadísticos referidos a variables de tipo discreto se representan
gráficamente mediante una gráfica de líneas cuyo eje horizontal corresponde a los diferentes
valores de la variable y el eje vertical a las frecuencias correspondientes de dichos valores
diferentes, la cual se representa por un segmento vertical levantado desde cada valor
diferente; tal como se muestra a continuación.

Gráfico 5. Número de celulares que hay en los hogares del Callao


Hogares
100
75
50
25

0 1 2 3 (Celulares)
TABLA DE FRECUENCIAS: VARIABLES CUANTITATIVAS CONTINUAS
El procedimiento para construir una tabla de distribución de frecuencias cuando la variable es
de tipo continuo es el siguiente:
1º) Se determina el rango o recorrido R de la variable, el cual es la diferencia del valor
máximo de los datos con el valor mínimo de los mismos; es decir:

R = xmáx - xmín
2º) Se determinar el número K de intervalos o clases, el cual se obtiene aplicando por lo
general la regla de Sturges que está dada por:

K = 1 + 3.3 log n
donde K es el número de intervalos y n es el total de las observaciones, redondeando el
valor al entero más cercano y log n es el logaritmo de n en la base 10.
Este número K debe redondearse al entero más próximo.
3º) Se determinar el tamaño o amplitud A de los intervalos, el cual es la longitud del
intervalo de clase y se obtiene como el cociente del rango entre el número de intervalos;
es decir:
𝑹
A =
𝑲
Si el número A resultante no es exacto se debe redondear al valor superior siguiente
según las cifras decimales con que han sido recolectados los datos. (Aquí no se aplica el
redondeo al valor entero más cercano como en el caso del número K. Aquí se debe
redondear A según el número de cifras decimales que tienen los datos recolectados y se

5
debe aproximar tomando siempre la siguiente cifra decimal del número A en la posición
en que está la última cifra decimal que tienen los datos recolectados).
4º) Determinar los límites de cada intervalo, donde el límite inferior del primer intervalo es el
valor mínimo de los valores observados y el límite superior de este primer intervalo se
obtiene sumando la amplitud del intervalo a dicho valor mínimo; este valor será a su vez
el límite inferior de la clase siguiente y así se obtienen los demás límites superiores e
inferiores como se obtuvo el primero. (Aquí en el último intervalo el máximo valor puede
estar dentro o en el extremo de dicho intervalo. Este se debe al redondeo de la amplitud A
al valor superior más cercano).
Se usa preferentemente la notación de intervalos cerrados por la izquierda y abiertos por
la derecha, excepto el último que se considerará cerrado tanto por la izquierda como por
la derecha.
5º) Finalmente, se procede al conteo y registro de los datos para así construir la tabla de
distribución de frecuencias respectiva tal como se hizo con los tipos anteriores de tablas.
Cuando los datos cuantitativos discretos presentan una gran dispersión que haría utilizar un
gran número de clases, se prefiere procesarlos como datos cuantitativos continuos.

GRÁFICA DE VARIABLES CUANTITATIVAS CONTINUAS


El gráfico comúnmente más utilizado en este tipo de variable es el llamado Histograma de
frecuencias, que viene a ser una representación gráfica mediante rectángulos adyacentes
donde en el eje horizontal se representan los intervalos de clase y en el eje vertical se
representa los valores de las frecuencias (absolutas o porcentuales). Más se utilizan las de las
frecuencias absolutas.
Además de ese tipo de gráfico se utilizan otros, como el llamado Polígono de frecuencias, el
cual es un polígono asociado a las frecuencias absolutas que se forma uniendo los puntos
medios de los rectángulos del histograma de frecuencias, incluyendo los dos intervalos
adicionales a los intervalos extremos, uno en el lado izquierdo y el otro en el lado derecho.
Más se utilizan las de las frecuencias absolutas y el llamado Ojiva, el cual es una línea
quebrada asociada a las frecuencias absolutas acumuladas o relativas acumuladas que se
forma de manera análoga a la del polígono de frecuencias.
A continuación se muestran ejemplos de lo anteriormente expuesto:

6
Cuadro 3. Ingreso anual (en miles de soles) de trabajadores del Sector Salud
Ingreso anual Número de Porcentaje de
trabajadores trabajadores
(en miles de soles)

[22 – 27[ 5 14.3

[27 – 32[ 7 20.0

[32 – 37[ 12 34.3

[37 – 42[ 7 20.0

[42 – 47[ 3 9.6

[47 - 52] 1 2.8

Total 35 100.0

Gráfico 6. Ingreso anual (en miles de soles) de trabajadores del Sector Salud

10

22 27 32 37 42 47 52

Gráfico 7. Ingreso anual (en miles de soles) de trabajadores del Sector Salud

10

17 22 27 32 37 42 47 52 57

7
Gráfico 8. Ingreso anual (en miles de soles) de trabajadores del Sector Salud

40
30
20
10

17 22 27 32 37 42 47 52
Observaciones:
1) Cuando el tamaño de la muestra n es mayor o igual a 30 (n ≥ 30), las frecuencias
𝐟
relativas (h = 𝐧), no consideradas comúnmente en todos estos tipos de tablas de
frecuencias, se pueden tomar como aproximaciones de las probabilidades de que un valor
de la variable considerada en la población sea de la clase de la variable categórica o sea
del valor de la variable discreta o bien pertenezca al intervalo de clase de la variable
continua respectivamente donde esté dicha frecuencia relativa. Matemáticamente, esto
quiere decir que:

h ≅ P (a = C) ó bien h ≅ P(b = X) ó bien h ≅ P(c є [xi-1, xi])

donde a es el valor de la clase C de la variable categórica, b es el valor X de la variable


cuantitativa discreta y c es un valor que está en el intervalo [xi-1, xi] de la variable
cuantitativa continua.
2) El área total que determinan los rectángulos del histograma de frecuencias es igual al área
que está bajo el polígono de frecuencias en las variables cuantitativas continuas.

PRÁCTICA DIRIGIDA Nº 2
1. Se realizó un estudio a 180 hogares del distrito de Lince para conocer la marca de pasta
dental que usan. Los resultados fueron los siguientes:
Colgate 41, Kolynos 70, Dento 35, Splendid 20, Otros 14.

a) Construya una tabla de frecuencias de la información obtenida.


b) Construya el gráfico de barras.
c) Construya un gráfico circular.
2. Se hizo una encuesta a 26 trabajadores de una empresa de manufactura para conocer su
nivel educativo: primaria incompleta (PI), primaria completa (PC), secundaria incompleta
(SEI), secundaria completa (SEC), superior incompleta (SUI), superior completa (SUC).
Los resultados fueron los siguientes: PI, SEI, SEI, PC, SUC, SUI, SUI, SUI, PI, PI,
SEI, SEC, SEC, SEI, PI, PI, PC, PC, PI, SEC, SEI, SUC, SUI, SEC, PC, SEI.

8
a) Construya una tabla de distribución de frecuencias de la información obtenida.
b) Construya un gráfico de barras.
c) Construya un gráfico circular.
3. Se hizo un estudio para conocer el nivel de depresión de Hamilton de 50 trabajadores de
la Compañía Minera Buenaventura: no deprimido (N), depresión ligera (DL), depresión
moderada (DM), depresión severa (DS), depresión muy severa (DMS). Los resultados
fueron los siguientes:

DS DM DL DMS DS DS DM DMS DMS DMS


DMS DM DMS DS DL DS DL DL DS DMS
DM DS DMS DMS DMS DL DS DL DMS DM
DM DM DM DL DMS DM DMS DMS DMS DS
DM DL DL DL DMS DMS DM DMS DM DS

a) Construya una tabla de distribución de frecuencias de la información obtenida.


b) Construya el gráfico circular correspondiente.

4. Se realizó una encuesta en 30 viviendas que dan alojamiento en el Cuzco sobre el número
de habitaciones por vivienda, y se obtuvo la siguiente información:

2 3 4 3 2 3 4 2 3 3
3 2 2 3 2 4 4 2 3 3
5 3 4 5 2 3 4 2 3 5

a) Construya una tabla de distribución de frecuencias de la información obtenida.


b) Construya el gráfico de líneas.
c) ¿Cuántas viviendas tienen más de una habitación?
d) ¿Qué porcentaje de viviendas poseen hasta dos habitaciones?
e) ¿Qué porcentaje de viviendas poseen de una a tres habitaciones?

5. Los siguientes datos son el número de accidentes automovilísticos que ocurren en 35


cruces más transitados de Lima Metropolitana durante el último fin de semana del mes de
Noviembre del 2002:

4, 0, 1, 6, 1, 2, 5, 7, 2, 8, 5, 5, 6, 4, 7, 4, 6, 8, 6, 7, 5, 4, 8, 6, 8, 5, 6, 5, 6, 5, 4, 6, 5, 7, 3.
a) Construya una tabla de distribución de frecuencias de la información obtenida.
b) Construya el gráfico de líneas.
c) ¿Cuántos cruces más transitados han tenido más de 5 accidentes?
d) ¿Qué porcentaje de cruces más transitados han tenido menos de 4 accidentes?
e) ¿Qué porcentaje de cruces más transitados han tenido a lo más 2 accidentes?

6. Los siguientes datos muestran el contenido de Ácido ascórbico (en mg/100 mg), después
de cierto período especificado, de 50 empaques de cierto alimento congelado.

9
21.3 17.9 11.2 30.2 21.3 20.5 15.5 28.9 30.1 34.2
25.1 15.3 26.8 22.7 11.2 21.9 13.4 12.1 20.3 29.3
14.3 20.1 33.2 24.3 23.1 8.3 22.3 12.2 24.6 16.2
15.8 15.1 14.7 12.5 35.2 15.9 25.2 32.3 26.3 22.4
18.4 12.3 11.2 12.3 25.3 26.3 15.8 26.4 18.2 22.7

a) Construya una tabla de distribución de frecuencias de la información obtenida.


b) Grafique el histograma de frecuencias.
7. Una agencia de empleos temporales registró el salario neto semanal (en dólares) de
cincuenta trabajadores obteniendo los siguientes valores:
68.10 26.15 63.70 34.10 71.75 48.66 79.51 35.18 28.10 49.24
38.18 32.15 29.90 60.12 47.11 53.33 40.26 31.17 29.66 35.01
58.56 31.24 52.02 41.63 39.54 69.54 69.40 33.09 32.05 26.70
44.40 83.74 37.20 25.65 46.42 45.89 47.29 30.09 33.81 40.10
73.78 30.33 50.12 59.39 33.55 39.19 38.70 48.62 38.69 55.17
a) Construya una tabla de distribución de frecuencias de la información obtenida.
b) Grafique el histograma de frecuencias.
8. El consumo de agua, en metros cúbicos, de 30 viviendas del distrito de Los Olivos en el
mes de Enero fue como sigue:
4.3 7.8 6.1 15.7 12.8 17.2 3.5 16.1 12.4 6.9 18.0 11.5 13.4 6.5 5.9
8.7 13.0 9.2 12.8 3.0 4.2 11.2 16.2 7.0 4.5 7.8 15.9 16.5 8.4 14.3
a) Construya una tabla de distribución de frecuencias de la información obtenida.
b) Construya el histograma de frecuencias
9. El peso en onzas de tumores malignos extirpados del abdomen de 40 personas fueron:

10 88 89 20 12 95 96 12 15 93
15 78 79 25 18 80 82 19 19 83
21 60 63 16 26 65 69 14 13 72
15 45 48 12 28 49 55 29 30 59

a) Construya la tabla de distribución de frecuencias de la información obtenida.


b) Construya el histograma de frecuencias.
10. Los siguientes valores muestran el peso en kilogramos de 50 animales experimentales
sometidos a una operación quirúrgica.

35.6 29.3 22.5 34.2 20.5 31.1 28.1 32.1 27.5 21.9
31.5 34.2 32.7 12.1 31.6 33.7 28.6 30.4 30.1 13.4
28.5 29.8 20.3 28.7 30.5 31.2 30.3 15.5 30.5 29.5
28.7 30.1 31.3 26.8 28.7 31.3 28.9 33.5 24.9 27.9
29.3 30.5 35.1 30.1 29.6 34.2 27.9 30.6 29.9 33.2

a) Construya la tabla de distribución de frecuencias de la información obtenida.


b) Construya el histograma de frecuencias.

10

You might also like