You are on page 1of 16

Estadística básica

Unidad 2. Representación numérica y gráfica de datos


ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano

Contenido

I. Presentación de la unidad..............................................................2

II. Organización de datos y distribución de frecuencias.....................3

a. Introducción.....................................................................................3

b. Frecuencias......................................................................................3

i. Frecuencia o Frecuencia absoluta.................................................4

ii. Frecuencia absoluta acumulada....................................................4

iii. Frecuencia Relativa.......................................................................4

iv. Frecuencia Relativa Acumulada....................................................5

v. Ejemplo de organización de frecuencias.......................................6

c. Intervalos.........................................................................................7

d. Construcción de una tabla con intervalos de clase..........................7

e. Tablas de datos................................................................................9

f. Tablas de frecuencias....................................................................10

g. Tablas por intervalos de clase........................................................10

h. Tablas de doble entrada.................................................................11

III. Representación gráfica de los datos..........................................12

a. Introducción...................................................................................12

b. Histograma.....................................................................................12

c. Gráfica de barras............................................................................12

d. Gráfica de líneas............................................................................13

e. Gráfica de áreas o de pastel..........................................................13

Gráfica de áreas o de pastel

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano

Representación numérica
y gráfica de datos
I. Presentación de la unidad
Cuando se realiza un trabajo que requiere a la estadística, se diseñan instrumentos para
obtener los datos deseados. Existen muchos métodos para recolectar información, pero
los más frecuentes son:

Otra de las técnicas más recurridas en estadística para recolectar información son
los experimentos, revisa en qué consisten.

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano
Un experimento es una prueba que se realiza para determinar las características
o comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido
del gusto, qué alimentos te parecen más salados.
También, experimento se define como el proceso que se realiza para verificar una serie de hipótesis
relacionadas con un determinado fenómeno, en el cual se determinan las características o comportamientos
del fenómeno que se analiza.
La diferencia entre la primera y la segunda definición es que en la segunda se parte de una hipótesis mientras
que en la primera no necesariamente. En el primer ejemplo, experimentas los sabores de los alimentos sin
antes predecir cuál será más salado. En el segundo ejemplo, la hipótesis, a partir de estudios anteriores, es que
la velocidad de la luz en el vacío es de 300 000 km/seg.

Por lo tanto, el experimento verifica si esta hipótesis es cierta o no y en él cabe un margen de error
experimental.

Los datos que se recopilan, usando alguna técnica de las que acabamos de describir u otra, son organizados de
acuerdo a los parámetros de la estadística descriptiva que estudiarás en esta unidad.

II. Organización de datos y distribución de


frecuencias

a. Introducción
La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Esta área sólo
describe, resume, organiza y representa los datos obtenidos de una población o muestra de la población, sin
elaborar inferencias ni obtener conclusiones.
La organización de datos se realiza a través de tablas que se utilizan para simplificar la presentación y
distribución de estos datos.
A continuación, conocerás que existen diferentes tipos de presentación de datos y con base en ellos, distintas
clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta.

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano
b. Frecuencias

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano

i. Frecuencia o Frecuencia absoluta

La frecuencia o frecuencia absoluta es el número de veces que se repite un valor dentro


de un conjunto de datos, se denota como fi. Por ejemplo, supongamos que tienes la
siguiente serie de datos: 3, 2, 5, 7, 3, 7, 7, 5, 2, 7, 3. Si los organizas en una tabla, tendrías:
Dato Frecuencia
2 2 (porque se repite 2 veces)
3 3 (porque se repite 3 veces)
4 2 (porque se repite 2 veces)
5 4 (porque se repite 4 veces)
Total de datos (N) 11

ii.Frecuencia absoluta acumulada

La frecuencia absoluta acumulada es la suma de las frecuencias de las variables hasta el


renglón i, se representa como Fi. También es conocida como frecuencia acumulada.
Siguiendo con el ejemplo anterior:
Dato Frecuencia Frecuencia acumulada
2 2 2 (hasta aquí tienes 2 datos
5 (la suma de la frecuencia del primer dato con la
3 3
del segundo dato 2+3)
5 2 7 (frecuencia de 2+frecuencia de 3+frecuencia de 5)
11 (frecuencia de 2+frecuencia de 3+frecuencia de 5
7 4
frecuencia de 7)
Total de
11
datos (N)

iii.Frecuencia Relativa

La frecuencia relativa es el resultado de dividir la frecuencia de cada dato entre el número


total de datos (N). La suma de esta columna da 1 (excepto cuando el resultado de las
divisiones se redondea). Este dato también puede verse como un porcentaje, se representa
como hi. Siguiendo con el ejemplo anterior:

Frecuencia Frecuancia
Dato Frecuencia
acumulada relativa
2 2 2 0.181 (se divide 2/11)
3 3 5 0.272 (se divide 3/11)
4 2 7 0.181 (se divide 2/11)
5 4 11 0.363 (se divide 4/11)

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano
Total de
11
datos (N)

iv.Frecuencia Relativa Acumulada

La frecuencia relativa acumulada es la suma de las frecuencias relativas hasta el renglón


i. Se representa como Hi, observa el ejemplo:
Frecuenci Frecuencia Frecuencia Frecuencia
Dato
a acumulada relativa relativa acumulada
0.1818 (hasta este
2 2 2 0.1818 renglón sólo tienes esta
frecuencia relativa)
0.4545 (se suma la
frecuencia relativa del
3 3 5 0.2727 primer dato con la del
segundo dato
0.1818+0.2727)
0.6363 (la frecuencia
relativa de 2+la
5 2 7 0.1818 frecuencia relativa de
3+la frecuencia relativa
de 5)
0.9999 (la frecuencia
relativa de 2+la
frecuencia relativa de
7 4 11 0.3636
3+la frecuencia relativa
de 5+la frecuencia
relativa de 7)
Total de
11
datos (N)

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano

v.Ejemplo de organización de frecuencias

En la siguiente pantalla observarás una tabla con la organización de frecuencias, los datos
presentados son los siguientes:
18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23,
47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52,
23.

Datos
Frecuencia Frecuencia Relativa
No. obtenidos Frecuencia Frecuencia Relativa
Acumulada Acumulada
Renglón de la fi hi
Fi Hi
variable

f1 = F1 = h1=f1/N=0.062
1 7 f1 = 2 h1=H1=0.0625
2 5

f1 +f2 = h2=f2/N=0.187 h1+h2=H2=


2 18 f2 = 6
F2 =8 5 0.2500

f1 +f2 +f3
h3=f3/N=0.250 h1+h2+h3=
3 23 f3 = 8 =
0 H3=0.5000
F3 = 16

h4=f4/N=0.125 h1+h2+h3+h4
4 41 f4 = 4 F4 = 20
0 =H4=0.6250

h1+h2+h3+
h5=f5/N=0.218
5 47 f5 = 7 F5 = 27 h4+h5=H5=0.843
7
0

h1+h2+h3+
h6=f6/N=0.156
6 52 f6 = 5 F6 = 32 h4+h5+h6=
3
H6=1.0000

Total N=32

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano

a. Intervalos

Otro concepto muy utilizado en estadística descriptiva es el de intervalo.


Conoce qué es y los demás conceptos asociados.

Intervalos
Conjunto de valores agrupados entre dos números, conocidos como límites, en este
caso, límites del intervalo.
Intervalo de clase
Se llama intervalo de clase a la expresión que denota un intervalo.
Amplitud del intervalo
La amplitud del intervalo es la distancia que hay entre los límites superior e inferior del
intervalo. Se calcula restando el valor del límite inferior al valor del límite superior.
Frontera de clase
Son los puntos medios entre los límites de intervalos consecutivos. Las fronteras de
clase se utilizan para recuperar los datos entre el límite superior de un intervalo y el
límite inferior del siguiente.
Marca de Clase
También conocida como punto medio de clase, es el resultado de la suma de los límites
inferior y superior del intervalo, dividido entre dos

b. Construcción de una tabla con intervalos de clase


• Datos
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26,
20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

• Se acomodan los datos de menor a mayor:


3, 7, 11, 13, 13, 15, 15, 17, 20, 22, 24, 25, 26, 27, 28, 28, 29, 31, 32, 32, 33, 34,
34, 34, 35, 35, 36, 36, 37, 38, 38, 38, 39, 39, 41, 42, 43, 44, 47, 48

• Calculamos el rango primero se localizan los valores mayor y


menor de la distribución
En este caso son: 3 y 48

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano

• Ahora se restan y se busca un número entero un poco mayor que


la diferencia y que sea divisible por el número de intervalos de
queramos poner.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso son: 48 – 3 = 45, el rango es 45.
Si queremos 10 intervalos o clases, incrementamos el número hasta 50 (que es un
múltiplo de 10) y dividimos el nuevo rango entre el número de clases 50 /10 = 5.
Esta es la amplitud del intervalo. Se simboliza con k = 5.
Otra forma es redondear al final el número. Es decir, tomamos el 45, en lugar de
incrementar a 50; dividimos el rango original 45/10 = 4.5.
Si hacemos k = 4 entonces no serán suficientes las clases para nuestros datos
ya que 4*10 =40 y el dato mayor es 48, por tanto redondeamos y nuevamente
obtenemos k=5.
• Se forman los intervalos teniendo presente que el límite inferior de
una clase pertenece al intervalo, pero el límite superior no
pertenece intervalo, se cuenta en el siguiente intervalo.
Identificamos el límite que pertenece con un corchete [ y al que no con un
paréntesis ). Los intervalos quedan de la siguiente forma:

[0,5); [5,10); [10,15); [15,20); [20,25); [25,30); [30,35); [35,40); [40,45); [45,50)

O bien se pueden escribir de la siguiente manera sin ser tan formales en cuanto al
lenguaje matemático

0-4; 5-9; 10-14; 15-19; 20-24; 25-29; 30-34; 35-39; 40-44; 45-49.

Como se puede observar al restar el límite superior menos el límite inferior


(Ls – Li) en todos los casos obtenemos 5 que es la longitud o amplitud del
intervalo.

• En la siguiente tabla se muestran los intervalos; los límites de la


clase inferior (Li) y superior (Ls); las fronteras de las clases o
límites reales de clase (Lr) y los representantes de clase o marca
de clase o punto medio de clase (Ci).

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano

Intervalo Li Ls Lr Ci

(4+5)/2=
0-4 0 4 (0+4)/2= 2
4.5

(9+10)/2=
5-9 5 9 (5+9)/2= 7
9.5

(14+15)/2= (10+14)/2=
10-14 10 14
14.5 12

(19+20)/2= (14+19)/2=
15-19 15 19
19.5 17

(24+25)/2= (20+24)/2=
20-24 20 24
24.5 22

(29+30)/2= (25+29)/2=
25-29 25 29
29.5 27

(34+35)/2= (30+34)/2=
30-34 30 34
34.5 32

(39+40)/2= (35+39)/2=
35-39 35 39
40.5 37

(44+45)/2= (40+44)/2=
40-44 40 44
44.5 42

(45+49)/2=
45-49 45 49
47

a. Tablas de datos
Existen diferentes tipos de tablas para presentar datos, las más utilizadas son: Tabla de
datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada.
Conoce en qué consiste cada una:

Tablas de datos
Una tabla de datos es la forma más sencilla de organizar un conjunto de datos y se utiliza
cuando la información que necesitas son los datos mismos. Se organizan en columnas o
renglones y se registran las mediciones o datos obtenidos.

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano
Ejemplo:
Imagina que la medición de temperatura a lo largo del día da como resultado los siguientes
valores (en grados Celsius): 20.4°, 21.2°, 22.1°, 23.9°, 25.3°, 26.9°, 27.7°

A partir de estos valores construyes la siguiente tabla:

b. Tablas de frecuencias
Las tablas de frecuencia aportan mayor información que las tablas de datos, ya que están
construidas con las categorías de la variable que se está midiendo y su frecuencia.

Ejemplo:

Un experimento da como resultado los


siguientes valores:
1, 2, 2, 2, 1, 1, 5, 4, 3, 2, 2, 1, 3, 4, 5, 6, 2,
3, 4, 5, 5, 4, 3, 3, 2
Si agrupas los datos por categorías, según
la frecuencia o número de veces que
aparece cada dato, tendrías la siguiente
tabla:

Las tablas de frecuencias pueden construirse anexando las columnas correspondientes a la


frecuencia acumulada, la frecuencia relativa y frecuencia relativa acumulada.

c. Tablas por intervalos de clase

En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores
correspondientes a cada variable.
Ejemplo: En una encuesta sobre el desempleo en el área metropolitana de la ciudad de
México, se organizan los datos por grupos de edades (intervalos de clase) y se presenta la
frecuencia de cada intervalo, teniendo un total de 23,700 desempleados.

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano

d. Tablas de doble entrada

Estas tablas proporcionan información referente a dos variables o eventos relacionados


entre sí. La información se distribuye poniendo en los renglones de la tabla la información
de una de las variables y en las columnas la información de la otra variable.
Ejemplo: Se cuenta el número de cirugías realizadas por edades en una muestra de 100
personas, los resultados son los siguientes:

Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las
variables relacionadas son los rangos contra el valor de las variables en dicho rango. Por
ejemplo, imagina que mides la temperatura de un líquido con respecto al tiempo de
calentamiento. En el renglón colocas los tiempos y en las columnas la temperatura
obtenida. Puedes considerar la tabla como una tabla de frecuencias o como una tabla de
doble entrada:

1 En el ejemplo las variables relacionadas son la edad y el número de cirugías.

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano
II. Representación gráfica de los datos

a. Introducción
Las gráficas son representaciones visuales de los datos que se muestran en una tabla.
Existen diferentes tipos de gráficas, cada una de ellas se elabora con base en el tipo de
información que se quiere representar.

b. Histograma

El histograma es la representación gráfica de


una variable continua. Se elabora en un sistema
de coordenadas rectangulares. El eje horizontal
se utiliza para representar la variable
independiente, es decir, la escala de medición o
fronteras de clase. El eje vertical representa la
escala de frecuencias. Si los intervalos de clase
tienen el mismo ancho, las alturas de las barras
serán proporcionales a las frecuencias.
El histograma permite apreciar visualmente la
distribución y dispersión de las mediciones.

c. Gráfica de barras
Este tipo de gráfica se utiliza para datos de tipo ordinal, nominal y discreto. En éstas se
muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por
el área de la barra. Esta gráfica muestra las discontinuidades en las mediciones por medio
de espacios vacios entre las barras.
La gráfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

Importante: Un histograma y una gráfica de barras son muy semejantes, la diferencia


radica en que el histograma no presenta separación entre las barras.

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano
d. Gráfica de líneas

Una gráfica de líneas también se construye en un sistema coordenado rectangular y muestra


la relación entre las variables mediante puntos conectados por líneas continuas. La
frecuencia de cada valor medido es representada por la altura del punto.
En el eje horizontal se representa la variable y en el eje vertical, la frecuencia. Se
determinan los puntos de corte del valor de la variable con su frecuencia y se unen,
obteniéndose la gráfica de línea.

e. Gráfica de áreas o de pastel

Una forma de representar datos u


observaciones de una variable cualitativa es
mediante un diagrama circular. Esta gráfica
muestra la relación entre las variables
dividiendo un círculo (o pastel) en sectores
(o rebanadas). También, se utilizan para
representar la distribución de frecuencias,
pero es el área de cada sector la
proporcional a los valores medidos.
Para trazar la gráfica, se hace una
distribución proporcional de las frecuencias
del problema con respecto a la
circunferencia, determinando sectores
circulares para cada categoría.

Ejemplo

Datos
Frecuencia
Medición en cm Frecuecia Porcentaje
Acumulada

30 3 3 3%

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano
30.1 7 10 6%

30.2 12 22 10 %

30.3 18 40 15 %

30.4 23 63 19 %

30.5 21 84 18 %

30.6 17 101 14 %

30.7 11 112 9%

30.8 5 117 4%

30.9 1 118 1%

Histograma
En esta figura se muestra el histograma de las mediciones en cm vs la frecuencia, nota
como el ancho de las clases es el mismo.

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i
Estadística básica
Unidad 2. Representación numérica y gráfica de datos
ESAD
Unidad 1. La libertad: facultad inherente a todo ser humano

Gráfica de pastel
En la gráfica de pastel se muestra dentro de cada “rebanada” la medición en cm y el
porcentaje que corresponde a la frecuencia relativa.

Gráfica de línea
En esta figura se muestra la frecuencia acumulada mediante una gráfica de línea.

Página R o d r i g o J e s ú s R a m í r e z T o m a s i n i

You might also like