You are on page 1of 29

Estadística

Estadística
Descriptiva
Lic. Est. Sandra Loaiza Chumacero
Estadística Descriptiva

2.2.- Organización y presentación de los datos

La organización de los datos constituye la primera etapa de su tratamiento, pues,


facilita los cálculos posteriores y evita posibles confusiones. Realmente, la
organización de la información tiene una raíz histórica y aunque actualmente con
el desarrollo de los medios informáticos deja de tener importancia desde un punto
de vista aplicado, desde la perspectiva de la enseñanza de la Estadística tiene un
gran valor conceptual.
La organización va a depender del número de observaciones distintas que se
tengan y de las veces que se repitan cada una de ellas. La descripción consiste en
facilitar el entendimiento de tendencias, similitudes y diferencias de los datos
recolectados. También son importantes las mediciones de resumen, variabilidad y
de frecuencia.

2 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

2.2.1.- Tablas de distribución de frecuencias


En el trabajo estadístico, lo que se tiene disponible en un primer momento es un
material numérico o cualitativo, producto de la recopilación de datos, que son
categorizados ordenados, procesados y presentados en cuadros o gráficos.

A. Distribución de frecuencias datos cualitativos


Una distribución de frecuencias es una tabla que resume los datos mostrando la
frecuencia o número de elementos que dentro de cada una de las clases, que
deben ser mutuamente excluyentes y colectivamente exhaustivas. El objetivo es
proveer información acerca del conjunto de datos que no podría obtenerse
rápidamente por simple observación de los datos originales. La mejor manera de
examinar los datos categóricos o cualitativos, implica organizar y presentar un
conjunto de datos en forma tabular y gráfica. No obstante, con frecuencia esos
datos son categóricos, no numéricos.

Un punto que es necesario resaltar es la elección del título apropiado para cada
cuadro, tabla o grafico. Debe evitarse incluir palabras o frases que distorsionan el
mensaje que proporcionan y que de alguna manera, inducen a establecer una
relación con una situación específica.

Ejemplo 01:

Tabla Nº 01
Actividades que realizan las mujeres. Chiclayo Diciembre 2012.
Frecuencia Frecuencia
Número de
relativa relativa
Actividad que realiza mujeres
simple simple %
ni hi hi%
Estudiante 79 0.56 56.43
Trabaja 23 0.16 16.43
Estudia y trabaja 31 0.22 22.14
Ama de casa 7 0.05 5.00
TOTAL 140 1.00 100.00

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre

3 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

la preferencia de consumo de productos cosméticos. Dic. 2012.

1. Frecuencia absoluta simple (ni): Resulta del conteo de cada una de las
categorías de la variable.

Interpretación de las frecuencias absolutas observadas n i:


n1= 79 mujeres manifestaron que la actividad que realizan es ser ama de
casa.
n2= 23 mujeres manifestaron que la actividad que realizan es trabajar.

2. La frecuencia relativa simple (hi): Permite mostrar la porción o fracción del número
total de observaciones en cada clase. Para convertir una distribución de frecuencia
a una distribución de frecuencias relativas, cada una de las frecuencias de clase se
divide entre el número total de frecuencias
n
hi  i
n
n1 79 n 23
h1    0.56 h2  2   0.16
n 140 n 140

h1= 0.56, se interpreta como la proporción de mujeres que manifestaron ser


amas de casa.
h4 = 0.16, se interpreta como la proporción de mujeres que manifestaron
que trabajan.

3. La frecuencia relativa porcentual: hi% , hi (100) ó % : resulta de multiplicar la


frecuencia relativa h; por 100 así:

h 1 %= 0.56*100=56.43 h 2 %=0.16*100=16.43

h 1 %=56.43%, porcentaje de mujeres que manifestaron ser amas de


casa.
h 2 %=16.43% porcentaje de mujeres que manifestaron que trabajan.

4 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Ejemplo 02:

Tabla N° 02

Tipo de contrato de las enfermeras del HAAA. Chiclayo 2011.

Número de Frecuencia relativa Frecuencia relativa


Tipo de contrato enfermeras simple simple%
ni hi hi%
Contratado 28 0.61 60.87
Nombrado 18 0.39 39.13
Total 46 1.00 100

Fuente: encuesta aplicada a las enfermeras de HNAAA. Chiclayo 2010.

Gráficos

Los gráficos de dos variables, se construye en el plano rectangular o de coordenadas


cartesianas, donde hay dos ejes, X e Y. En el eje Y (ordenada) se colocan los valores de
la variable dependiente y en X (abcisa) la variable independiente, siendo y =f(x).

2.- Principales partes de un gráfico

1.- Titulo: Expresa el contenido del grafico y por lo general, es igual o parecido al
título del cuadro estadístico que sirvió de referencia, debe indicar claramente la
naturaleza del fenómeno representado.

2.- Escalas: Para graficar se utiliza el sistema cartesiano, compuesto por dos ejes:
uno horizontal llamado abscisa; y el otro vertical llamado ordenada. Ambos ejes
se cortan en un punto llamado origen.
Las escalas vienen a ser la graduación de ambos ejes, según la naturaleza de las
variables y frecuencias correspondientes.

3.- Cuerpo: Es el grafico en sí, y constituye la representación en dibujo de los datos.

4.- Fuente: Indica el origen de los datos estadísticos que se está representando en
el gráfico.

5 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Gráfico de barras

Son gráficos de barras rectangulares cuya altura es proporcional al porcentaje que de


casos en cada categoría o nivel de la variable. Si la variable tiene muchas categorías, una
alternativa es hacer el gráfico con barras horizontales en vez de verticales.

Gráfico de barras simples


Para su elaboración se debe contar con una tabla de entrada simple.

Gráfico N° 01

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre la preferencia de


consumo de productos cosméticos. Dic. 2012.

Gráfico N° 02

Fuente: encuesta aplicada a las enfermeras de HNAAA. Chiclayo 2010.

6 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Gráfico de Sectores

También llamado Gráfico Sectorial o Torta, es un círculo dividido en porciones


proporcionales al porcentaje de cada nivel respecto al total de datos. Cada porción se
obtiene multiplicando las frecuencias relativas por 360°, obteniéndose los grados para
cada porción de la torta.

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre


la preferencia de consumo de productos cosméticos. Dic. 2012.

Fuente: encuesta aplicada a las enfermeras de HNAAA. Chiclayo 2010.

7 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Nota: También se pueden utilizar efectos tridimensionales para lograr una mejor
presentación.

Ejemplo 3: En relación con el ejemplo anterior del estudio de las preferencias de los
productos cosméticos también se analizo la actividad que realizan según el uso habitual de
los productos.

Tabla N° 03

Actividad que realiza según el uso de cosméticos en las mujeres de la


ciudad de Chiclayo. Dic. 2012.

Usas cosméticos habitualmente


Si No
Actividad que Frecuencia Frecuencia Frecuencia Frecuencia
Número de Número de
realiza relativa relativa relativa relativa
mujeres mujeres
simple simple % simple simple %
ni hi hi% ni hi hi%
Estudiante 66 0.57 56.90 13 0.54 54.17
Trabajo 18 0.16 15.52 5 0.21 20.83
Estudia y trabaja 26 0.22 22.41 5 0.21 20.83
Ama de casa 6 0.05 5.17 1 0.04 4.17
Total 116 1.00 100.00 24 1.00 100

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre la preferencia de consumo de productos
cosméticos. Dic. 2012.

Las frecuencias de este cuadro se obtienen de manera similar a lo explicado


anteriormente, con la diferencia de que las frecuencias relativas y porcentuales referidas a
las categorías Si y No se obtienen considerando a 116 mujeres para el primer caso y 24
mujeres para el segundo.

8 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Gráfico N° 03

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre


la preferencia de consumo de productos cosméticos. Dic. 2012.

En este caso se puede apreciar, es conveniente adicionar una leyenda para indicar el color
que representa a cierta información. Por otro lado, también puede observarse que existe
una separación entre cada grupo de barras verticales equivalente a la mitad del ancho de
cada grupo se debe tener en cuenta que si los nombres o etiquetas de las categorías son
grandes es preferible utilizar el gráfico de barras horizontales, cuya construcción es similar
a lo indicado anteriormente. Del mismo modo se pueden presentar gráficos en tres
dimensiones.

Gráfico N° 04 : Actividad que realiza según el uso de cosméticos en las mujeres de la


ciudad de Chiclayo. Dic. 2012.

Fuente: Encuesta aplicada a las mujeres de la ciudad de Chiclayo sobre


la preferencia de consumo de productos cosméticos. Dic. 2012.

9 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

B. Distribución de frecuencias variables cuantitativos discretos

Cuando se tiene datos cuantitativos discretos cuyo número de resultados no es grande


(no mayor de 12 datos), la información puede ser clasificada y presentada
directamente, es decir cada valor de la variable constituye una clase o una categoría.

En primer lugar se ordena los valores de la variable discreta de menor a mayor, a


continuación se obtienen las frecuencias absolutas, ósea el número de veces que se
repite un valor de la variable. Las otras frecuencias que se hallan son las siguientes:

Frecuencia absoluta: frecuencia absoluta del valor Y i al número de veces que


aparece este valor en el conjunto de observaciones y se representa por ni
donde i =1,2,3,……m.

Frecuencia relativa: indica la proporción con que se repite un valor. Se obtiene


dividiendo la frecuencia absoluta ante el tamaño de la muestra. Para una mejor
interpretación es más conveniente multiplicarla por 100 para trabajar con una
frecuencia relativa porcentual.

Frecuencia absoluta acumulada: indica el número de valores que son menores o


iguales que el valor dado.

Frecuencia relativa porcentual acumulada: Indica el porcentaje de datos que son


menores o iguales que el valor dado.

Ejemplo de tabla de frecuencia de datos cuantitativos discretos

Suponga que en un estudio socioeconómico se observó, entre otras variables, el


número de de trabajadores eventuales que tienen las empresas comerciales en la
región de la ciudad de Chiclayo. Mediante una muestra de 40 empresas, se
encontraron los siguientes resultados

Número de trabajadores
4 5 7 7 7 8 8 7 7 7
10 10 8 9 5 6 7 5 8 8
5 6 6 6 9 7 8 9 5 6
8 10 9 8 7 10 9 4 8 9
a) Construya una tabla de distribución de frecuencias absolutas para estos datos.
b) Interprete cada frecuencia absoluta.

10 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Solución:

1.- En primer lugar se observa que el conjunto de observaciones es de tamaño 40, luego

n = 40.

2.- En segundo lugar, identificamos el numero de categorías observaciones m= 5

Y1 = 4 , Y2= 5, Y3 = 6, Y4= 7, Y5= 8, Y6= 9, Y7= 10

3.- Elaboración de la tabla con sus frecuencias absolutas.

Frecuencia absoluta
Número de trabajadores simple
eventuales
ni
4 2
5 5
6 5
7 9
8 9
9 6
10 4
Total 40

Interpretación de las frecuencias absolutas observadas n i:


n1 = en 2 empresas se observó que el número de trabajadores eventuales fue igual
a 4.
n2= en 5 empresas se observó que el número de trabajadores eventuales fue igual
a 5.

La tabla de distribución de frecuencias, se puede construir no solo con respecto a


las frecuencias absolutas, sino también con respecto a otro tipo de frecuencias,
tales como: las relativas, las absolutas acumuladas, las relativas acumuladas, etc.
Las cuales se definen como sigue:

2.- La frecuencia acumulada : Ni se obtiene sumando iterativamente las frecuencias


absolutas.
N 1 = 2, N 2 =n 1 + n 2 = 2 + 5 = 7

La ultima frecuencia acumulada es igual al tamaño de la muestra, las frecuencias


acumuladas se usan para construir la ojiva o polígono acumulativo.
11 Lic. Est. Sandra Cecilia Loaiza Chumacero
Estadística Descriptiva

N2 =7, significa que en 7 empresas se observó que el número de trabajadores


eventuales fue de 5 o menos trabajadores.

3.- La frecuencia relativa simple: hi , se obtiene por división de ni/n así:


n 2 n 5
h1  1   0.050 h2  2   0.125
n 40 n 40

h1= 0.050, se interpreta como la proporción de empresas que tienen 4


trabajadores eventuales.

h2 = 0.125, se interpreta como la proporción de empresas que tienen 5


trabajadores eventuales.

4.- La frecuencia relativa acumulada: Hi , se obtiene sumando iterativamente las


frecuencias relativas simple.

H1 = h1 = 0.050 H2 = h1 + h2 = 0.050 + 0.125 = 0.175

H2 = 0.175, es la proporción de empresas que tienen 5 o menos trabajadores


eventuales.

5.- La frecuencia relativa porcentual: hi% , hi (100) ó % : resulta de multiplicar la


frecuencia relativa h; por 100 así:

h 1 %= 0.050 *100 = 5.00 h 2 %=0.125*100=12.5

h 1 %=5%, de empresas se observó que el número de trabajadores


eventuales fue igual a 4.

h 2 %=12.5% de empresas se observó que el número de trabajadores


eventuales fue igual a 5.

6.- La frecuencia relativa porcentual acumulada: Hi%, se obtiene sumando iterativamente


las frecuencias relativas porcentual.

H1% =h1% = 5 H2%= h1% + h2% =17.5

H2%= 17.5 %, de empresas de empresas se observó que el número de


trabajadores eventuales fue de 5 o menos trabajadores.

12 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Tabla N° 04

Distribución del número de trabajadores eventuales en Empresas Comerciales.


Chiclayo 2013.

Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


Número de Frecuencia
absoluta absoluta relativa relativa relativa
trabajadores relativa simple
simple acumulada acumulada simple% acumulada%
eventuales
ni Ni Hi Hi hi% Hi%

4 2 2 0.050 0.050 5.000 5.000


5 5 7 0.125 0.175 12.500 17.500
6 5 12 0.125 0.300 12.500 30.000
7 9 21 0.225 0.525 22.500 52.500
8 9 30 0.225 0.750 22.500 75.000
9 6 36 0.150 0.900 15.000 90.000
10 4 40 0.100 1.000 10.000 100.000
Total 40 1.000 100.000

Fuente: Encuesta aplicada a las empresas comerciales. Chiclayo Enero 2013.

Gráficos para Variables Cuantitativas Discretas

Diagrama de Barras

Es un gráfico utilizado para representar la distribución de frecuencias de una variable


cualitativa y cuantitativa discreta. Puede graficarse en forma horizontal o vertical.

Fuente: Encuesta aplicada a las empresas comerciales. Chiclayo Enero 2013.

13 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Diagrama de bastones (ESPECTRO).- Es un gráfico utilizado para representar una


distribución de frecuencias o frecuencias relativas de una variable numérica (en general
discreta) sin agrupar.

Diagrama en escalera.- Es un gráfico utilizado para representar la distribución de


frecuencias acumuladas de una variable discreta numérica.

14 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

C.- DISTRIBUCIÓN DE FRECUENCIAS VARIABLES CUANTITATIVAS CONTINUA.

Cuando se tiene información para una variable cuantitativa continua, las


observaciones son usualmente diferentes entre s, lo cual hace que la evaluación
descriptiva a través de los valores individuales sea compleja. Con el propósito de
simplificar el análisis descriptivo, los datos son clasificados de acuerdo a ciertos
rangos o intervalos mutuamente excluyentes llamados “intervalos de clase”, para lo
cual es necesario tener en cuenta la amplitud o rango de cada intervalo y el número
de intervalos que se deben generar.

Cuando se utilizan intervalos de igual amplitud, el proceso de generación de tales


intervalos es el siguiente:

1.- En primer lugar, debe establecerse el número de intervalos que se va a utilizar. Es


recomendable que dicho número este entre 5 y 15. No existe una regla fija para
determinar el número óptimo de intervalos. El criterio del investigador cumple un
papel muy importante en la determinación del mismo. Es conveniente tener presente
que con pocos intervalos no se presentaran detalles significativos para el análisis; por
otro lado, con un número elevado de intervalos aparecerán demasiados detalles que
difícilmente seremos capaces de captar.

Como referencia, se puede utilizar la regla de Sturges, la cual indica que el número de
intervalos es dado por m= 1+3.3*log n, donde n es el número de observaciones.

El valor de m debe ser redondeado al entero más cercano.

2.- Determinar el valor del rango o amplitud de los datos, es decir, determinar:

R = X max - Xmin

Xmax : valor de la observación máxima

Xmin : valor de la observación mínima

3.- Determinar el tamaño de cada intervalo de clase, Amplitud interválica.

R
A
m

Cuando el valor de la amplitud no es exacto, el valor debe ser redondeado al valor


superior más cercano, según las cifras decimales de los datos.

15 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

4.- Generar los límites de los intervalos. Para el primer intervalo se considera límite
inferior al valor de la observación de menor magnitud, es decir, Linf.(1)= Xmin

Los límites inferiores y superiores de los otros intervalos se obtienen hallando:

Linf.(1)= Xmin

Lsup.(1) = Linf.(1) + A para i =1,2,3,……,m

5.- Cada uno de los intervalos (L inf, Lsup) se considera cerrado a la izquierda y abierto a la
derecha, es decir, se considera desde L inf a menos de L sup.

Esta regla no se aplica necesariamente para el ultimo intervalo superior tiene el mismo
valor que la observación de mayor magnitud, deberá considerarse cerrado en ambos
extremos, es decir, se considera desde L inf(K) hasta L sup(K).

Una vez que se han definido los intervalos de clase, el paso siguiente consiste en
determinar las frecuencias absolutas, es decir, el número de observaciones que está
dentro de cada intervalo.

A partir de estas frecuencias absolutas se obtienen, como ya se ha señalado


anteriormente, las frecuencias relativas y los porcentajes correspondientes a cada
intervalo.

Adicionalmente, cuando se dispone de datos cuantitativos continuos es conveniente


obtener las frecuencias acumuladas, para lo cual se procede de la siguiente manera:

Frecuencia acumulada: Ni se obtiene sumando iterativamente las frecuencias absolutas.

i
N i   n j  n1  n2  n3  n4  ..........  ni  N i1  ni
j 1

Frecuencia relativa simple: hi , se obtiene por división de ni/n así:

ni
hi 
n

Frecuencia relativa acumulada: Hi se obtiene sumando iterativamente las frecuencias relativas


simples.

i
H i   h j  h1  h2  h3  h4  ..........  hi  H i1  hi
j 1

16 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

La frecuencia relativa porcentual: hi% , hi (100) ó % : resulta de mult iplicar la


frecuencia relativa h; por 100 así

Ejemplo:

Los datos mostrados a continuación representan el costo de energía eléctrica


durante el mes de diciembre del 2009, para una muestra aleatoria de 50 viviendas de la
ciudad de Chiclayo.

96 171 202 178 147 102 153 197 127 82


157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
95 163 150 154 130 143 187 166 139 149
108 119 183 151 114 135 191 137 129 158

Proceso de la elaboración de la distribución (tabla) de frecuencias

1. Rango:

R = X’max –X’min

Donde:

X’max = Xmax + C = 213 + 1 = 214

X’min = Xmin - C = 82 – 1= 81

C = constante = 1

Constante que puede tomar valores 1, 0.1, 0.01, 0.001, ………………..,etc

2. Numero de intervalos:

4 4
a) m = 2.5 n = 2.5 50 = 2.5 * 2.6591 =6.6478 = 7

b) m = 1+3.3log 30 = 6.60 = 7

3. Amplitud de intervalos: A =R/m =133/7 =19

Los intervalos de clase (Y'j-1 Y'´j]

4. El primer intervalo: Del límite inferior de la variable, al Límite inferior mas la amplitud del
intervalo, de 82 a 8 2 + 1 9 = 1 0 1 es decir de 8 2 a 1 0 1 .
17 Lic. Est. Sandra Cecilia Loaiza Chumacero
Estadística Descriptiva

El segundo intervalo de 101 a 101 + 19, es decir de 101 a 120 y así en forma
sucesiva hasta obtener el intervalo que contenga el límite superior de la
variable en estudio.

Y' j-1 = Limite inferior del intervalo j .

Y'1_1 = Limite inferior del primer intervalo = 82

Y'j =. Limite superior del intervalo j.

Y'2 = Limite superior del segundo intervalo =120

Tabla Nº 02: Distribución del costo mensual por energía eléctrica de las viviendas
de la ciudad de Chiclayo. Enero 2010.

Costo de energía Frecuencia Frecuencia Frecuencia


Frecuencias Frecuencia relativa relativa relativa
Limite Limite Marca de Frecuencias absolutas relativa simple simple acumulada
inferior superior clase absolutas acumulada simple acumulada porcentual porcentual

[Yj-1 Yj ) Yi ni Ni hi Hi hi% Hi%


82 < 101 92 4 4 0.08 0.08 8 8
101 < 120 111 7 11 0.14 0.22 14 22
120 < 139 130 8 19 0.16 0.38 16 38
139 < 158 149 13 32 0.26 0.64 26 64
158 < 177 168 9 41 0.18 0.82 18 82
177 < 196 187 5 46 0.10 0.92 10 92
196  215 206 4 50 0.08 1 8 100
Total 50 1.00 100

5 . La marca de clase Y;: se obtiene sumando los límites del intervalo y dividiendo entre
2,(82+101)/2=91.5 sirve para graficar el polígono de frecuencias.

6. La frecuencia absoluta n;: la frecuencia absoluta se obtiene contando los valores de la


variable en ese intervalo incluyendo el valor igual al límite superior de cada intervalo así:

n1 = 4, viviendas gastan por el costo de energía eléctrica mayor o igual de 82 soles


pero menos de 101 soles.

18 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

n2= 7, viviendas gastan por el costo de energía mayor o igual de 101 soles pero menos de 120
soles, para este conteo no se toma en cuenta 120 por que ya se considera para el
próximo intervalo.

7. La frecuencia acumulada: Ni se obtiene sumando iterativamente las frecuencias


absolutas.

N1= 4, N 2 =n 1 + n 2 = 4 + 7 = 1 1

La ultima frecuencia acumulada es igual al tamaño de la muestra, las frecuencias acumuladas se


usan para construir la ojiva o polígono acumulativo.

N2 =11, significa que en la encuesta hay 11 viviendas que pagan por energía eléctrica
un costo mayor o igual de 101 pero menos de 120 soles mensuales.

8.- La frecuencia relativa simple: hi , se obtiene por división de ni/n así:

n1 4 n2 7
h1    0.08 h2    0.14
n 50 n 50

h1= 0.08, se interpreta como la proporción de viviendas que pagan por


energía eléctrica un costo mayor o igual de 82 soles pero menos de 101 soles.

h2 = 0.14,

9.- La frecuencia relativa acumulada: Hi , se obtiene sumando iterativamente las frecuencias


relativas simple.

H1 = h1 = 0.08 H2 = h1 + h2 = 0.08 + 0.14 = 0.22

H2 = 0.22, es la proporción de viviendas que pagan por el consumo de energía eléctrica un costo
mayor o igual de 101 pero menos de 120 soles.

10.- La frecuencia relativa porcentual: hi% , hi (100) ó % : resulta de multiplicar la


frecuencia relativa h; por 100 así:

h 1 %= 0.08*100=8 h 2 %=0.14*100=14

h 1 %=8%, porcentaje de viviendas que pagan por el costo de energía eléctrica un


costo menor o igual de 82 pero menos de 101 soles.

h 2 %=14%

19 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

11. La frecuencia relativa porcentual acumulada: Hi%, se obtiene sumando iterativamente las
frecuencias relativas porcentual.

H1% =h1% = 8 H2%= h1% + h2% = 22

H2%= 22%, porcentaje de viviendas que pagan por el costo de energía eléctrica un
costo menor o igual de 82 pero menos de 101 soles.

Gráficos para variables cuantitativas


1.- Histograma

Es un gráfico que se utiliza para representar la distribución de frecuencias absolutas o relativas


simples. Consiste en un grupo de rectángulos adyacentes que tienen sus bases en el eje de las
abscisas (donde se representan los intervalos de clase de la variable) y la altura igual a las
frecuencias de cada clase.
Gráfico Nº 02: Costo mensual por energía eléctrica de las viviendas
de la ciudad de Chiclayo. Enero 2010.

Fuente: tabla Nº 02

2.- Polígono de frecuencias

El polígono de frecuencias revela el modelo de variación de la variable de estudio. Se construye


con las marcas de clase uniéndolas en los extremos superiores de las barras del histograma.
Se pueden trazar más de un polígono de frecuencias sobre la misma base para comparar
distribuciones.

20 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Gráfico Nº 03: Costo mensual por energía eléctrica de las viviendas


de la ciudad de Chiclayo. Enero 2010.

Fuente: Tabla Nº 02.

3.- Polígono de frecuencias acumuladas

Ojiva porcentual: es la representación gráfica de una distribución de frecuencias relativas


acumuladas porcentual.

Gráfico Nº 04: Ojiva menor que de la distribución del Costo mensual por energía eléctrica de las
viviendas de la ciudad de Chiclayo usando frecuencias relativas acumuladas porcentuales.

Fuente: Tabla Nº 02.

21 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

4.- Grafico de líneas o serie cronológica

Son aquellas que se representan en unos ejes de coordenadas cartesianas mediante una línea
recta o quebrada, ya que los valores de las variables estadísticas serán aisladas, tanto en el caso de
variables discretas como las continuas, porque el dominio se divide en clases y se elige una marca
de clase.
Los polígonos de frecuencia y las ojivas son ejemplos de graficas de línea. Estos gráficos se utilizan
también para representar cronológicamente o sea de distribuciones analizadas a través del
tiempo.
En las series cronológicas el tiempo (años, meses, días, etc.) se ubica en eje horizontal, llamada
escala cronológica. En el eje vertical, llamada escala numérica o de valores, se representa el valor
de los datos. Ambas escalas, son independientes.
El grafico puede representar una sola variable en función del tiempo o más de una variable.

Ejemplo:
La USAT tiene esta información acerca del número de estudiantes matriculados desde el
año 2005 a 2011.

Gráfico Nº 05

F u e n te : D ir e cc i ón d e I n f o rm a c i ó n E s ta d í s t ic a U S A T .

22 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Tablas de contingencia

Cuando se trabaja con variables categóricas, los datos suelen organizarse en tablas de doble
entrada en las que cada entrada representa un criterio de clasificación (una variable categórica).
Como resultado de esta clasificación, las frecuencias (el número o porcentaje de casos) aparecen
organizadas en casillas que contienen información sobre la relación existente entre ambos
criterios.
A estas tablas de frecuencias se les llama tablas de contingencia.
Una tabla de contingencia se puede usar si:
 Una variables es cualitativa y la otra es una variable cuantitativa.
 Ambas variables son cualitativas, o ambas variables son cuantitativas, o
 Ambas variables con cuantitativas

Usando Excel para construir tablas de contingencia

Para este ejemplo vamos a seleccionar el archivo base de datos tutoria.xls, supóngase que se
desea determinar el número de sesiones a las que participo según sexo, de un grupo de 50
estudiantes.
1.- Al final de la base de datos agregar una columna más con nombre CONTADOR. Dar en la barra
de herramientas Seleccionar la opción insertar, tabla dinámica.

23 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Figura 1.

2.- El segundo paso es crear la tabla dinámica, seleccionado la base de datos. Así
mismo también elegiremos donde colocar la tabla dinámica si en la misma hoja de
calculo o en una nueva hoja.

Figura 2.

24 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

3.- Aparece en el formato la tabla dinámica. De la lista de campos, arrastrar con el


ratón la variable P1 (Numero de sesiones) en el rotulo de fila, y la variable sexo a
campos de la columna, y el CONTADOR en el campo de ∑ Valores.

Figura 3.

4.- Se puede observar que aparece por defecto la suma de los números de
estudiantes encuestados, para cada combinación de las categorías de número de
sesiones (P1) por sexo. La tabla de contingencia se muestra en la figura 4.

Figura 4.
En esta tabla se puede observar en primer lugar que de los 50 estudiantes de los que
se tiene información 11 son hombres y 39 son mujeres. Asimismo se sabe que 37
manifestaron que es adecuado, 7 escaso, 4 excesiva y 2 no contestaron acerca del
número de sesiones programadas de tutoría.

25 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

La tabla de contingencia nos permite tener información cruzada sobre ambas


variables: de los 11 hombres, 7 manifestaron que es adecuado, 3 escaso y 1 es
excesiva; mientras que en el caso de las 39 mujeres, 30 manifestaron que es
adecuado, 4 escaso, 3 excesivo y 2 no contestaron.

Figura 5.

Ahora supongamos que se desea saber que porcentaje de cada sexo tiene uno de los
niveles de grado de instrucción para ello:
Seleccionamos en la lista de campos el contador, anticlip, seleccionamos la opción
configuración de campo valor. Seleccionamos la opción mostrar valores como %
de columna, y aceptar.

Figura 6.

26 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Figura 7.

Se tiene como resultado una tabla de contingencia con los porcentajes por columna,
es decir según sexo.

Figura 8.

El 76.92% de los estudiantes del sexo femenino manifestaron que el número de


sesiones programadas de tutoría son adecuadas.
El 63.94% de los estudiantes del sexo masculino manifestaron que el número de
sesiones programadas de tutoría son adecuadas.

27 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

2.- Gráficos para distribuciones bidimensionales

2.1.- Grafico de barras compuestas

La información representada a través de barras compuestas, también pueden representarse por


en barras superpuestas.

Grafico Nº 01:

2.2- Gráfico de barras superpuestas

Figura 9.
Gráfico Nº 02

28 Lic. Est. Sandra Cecilia Loaiza Chumacero


Estadística Descriptiva

Número de reuniones prog ramadas

F M

63.64%

76.92%
27.27%
9.09%
10.26% 7.69% 0.00%
5.13%
Adec uado E s c as o E x c es iva (en blanc o)

29 Lic. Est. Sandra Cecilia Loaiza Chumacero

You might also like