You are on page 1of 87

ORGANIZACIN Y PRESENTACIN

DE DATOS
90
80
70
60
50
40
30
20
10
0
1er trim. 2do trim. 3er trim. 4to trim.

Lic. Justa Caridad Huaroto Sumari


ESTRUCTURA

Organizacin y presentacin de datos.


Tablas de frecuencia para variable
categrica.
Tablas de frecuencia para variable
numrica.
Representacin grfica.
Organizacin de datos

Una vez obtenidos los datos, como producto


de la aplicacin de un instrumento de
medicin, se realiza la crtica, se hace la
codificacin y se almacenan en una matriz
de datos.
Para explotar la base de datos y reportar los
resultados del estudio, se requiere organizar
los datos usando las tcnicas estadsticas.
PRESENTACION DE DATOS
.

Los datos ya organizados se presentan


mediante:
tablas de frecuencias y
representaciones grficas
Las dos representaciones exponen,
ordenadamente, la informacin recogida de
una poblacin o de una muestra.
TABLAS DE FRECUENCIA:

Las tablas de frecuencia son el resumen del


comportamiento de una sola variable.
TABLAS DE CONTINGENCIA:

Las tablas de contingencia o tablas


estadsticas muestran la relacin entre dos
o ms variables.
GRFICOS:

Generalmente, los grficos se utilizan como


complemento, para ilustrar mediante figuras
el comportamiento de las variables y
adems facilitan la comprensin de los
fenmenos estudiados
Presentacin de datos en tablas
de frecuencias

Dependiendo del tipo de variable y de la


naturaleza de los datos, se harn diferentes
presentaciones.
Bsicamente, interesa organizar los datos y
presentarlos adecuadamente, de manera
que facilite su interpretacin.
En algunos casos se considera que se ha
recopilado un conjunto de n datos de la
muestra y en otros, que se cuenta con N
datos de la poblacin.
Partes de una tabla estadstica

Nmero de tabla
Ttulo
Encabezamiento
Taln o columna matriz.
Cuerpo
Notas explicativas.
Estas mismas partes son vlidas para un
cuadro estadstico o un grfico.
Grficos estadsticos

La caracterstica principal de un buen


grfico es que debe ser explicativo por s
mismo, facilitando la interpretacin de los
datos.
El principio de construccin de los grficos
son las coordenadas rectangulares.
Partes principales de un grafico

Nmero de grfico
Ttulo
Escalas
Leyenda
Notas explicativas
Tablas de frecuencia

Frecuencia:
Es el nmero de veces que se repite un
mismo dato al medir una variable.
Tablas de frecuencia

Con los datos ya organizados en una base


de datos, construimos las tablas de
frecuencia, una para cada variable.
Tablas de frecuencia

Si la variable es categrica:
Los datos se organizan de acuerdo a las
diferentes categoras de la variable.

Si la variable es numrica:
Los datos se agrupan en clases.
Como producto de la observacin, conteo o
medicin de la variable en cada unidad
estadstica, se obtiene un conjunto de
respuestas o datos.
CASO 1. Tablas de frecuencias para
variables categricas

Si la variable es categrica, a cada una de


las respuestas o datos diferentes se les
llama nivel, categora o modalidad.
Una vez identificadas, se las dispone al lado
izquierdo de la tabla, en el taln, formando
la columna de categoras, y enseguida se
procede a hacer el conteo de datos que
caen en cada categora.
El nmero de datos por categora se conoce
como frecuencia absoluta simple y se
denota como fi.
Tabla de distribucin de
frecuencias:

Frecuencia
Variable fi
categora 1 f1
categora 2 f2
. .
. .
. .
categora k fk
Como puede verse, la tabla mostrada,
indica la distribucin de un conjunto de
datos en categoras.
- A veces, va a ser preferible conocer la
proporcin de datos por categora.
Entonces, se deben usar las frecuencias
relativas, hi, las cuales se obtienen
dividiendo cada frecuencia absoluta entre
N ( n).

fi
hi
N
EJEMPLO 1
Se distribuy un nuevo producto
alimenticio en una muestra de 50 amas de
casa para que lo degusten y
posteriormente se les pidi que lo
califiquen annimamente, segn los
siguientes niveles:
A: Excelente B: Muy Bueno C: Bueno
D: Regular E: Malo
Los datos obtenidos son:
B A C B B E B C A D
B B A C D E B A C B
B C B A D B A C B D
E B A B C B A B D C
B A B D E A C B A E
Quin es la unidad de anlisis?
Qu se desea medir en cada unidad de
anlisis (variable)?
Tipo de variable?
Enseguida, procedemos a presentar estos
datos en una tabla de frecuencias para
variable categrica.
Tabla 1
Distribucin de frecuencias absolutas y relativas
de las calificaciones de un producto

Calificacin fi hi
(%)
A 11 22
B 19 38
C 9 18
D 6 12
E 5 10
TOTAL n=50 100
Las tablas de frecuencias son herramientas
de trabajo intermedio que se usan en el
proceso de anlisis de los datos.
Pero, para presentar la informacin se
debe convertir una tabla de frecuencias en
un cuadro estadstico, como el que se
muestra a continuacin.
Cuadro N1
CALIFICACIONES DE UN NUEVO PRODUCTO
DADAS POR UN GRUPO DE AMAS DE CASA
Calificacin Nmero de Porcen-
Amas de casa taje
EXCELENTE 11 22
MUY BUENO 19 38
BUENO 9 18
REGULAR 6 12
MALO 5 10
TOTAL 50 100

FUENTE: GERENCIA DE PERSONAL


EJEMPLO 2
Cuadro N 2: Estado civil de un grupo de 45
amas de casa.

Estado civil Conteo Porcentaje

Casada 26 58

Soltera 2 4

Conviviente 17 38

TOTAL 45 100
Representacin grfica
Las frecuencias que se indican en las
columnas de este tipo de tablas pueden
representarse mediante:
barras rectangulares (figura 1) o
sectores circulares (figura 2).

Veamos estos dos tipos de grficos con las


frecuencias del cuadro No. 2
Grfico de Barras

Estado Civil

30
25
20
15
10
5
0
conv casada soltera
Grfico Circular

Estado Civil casada


58%

conv
soltera
38%
4%
CASO 2. Tablas de frecuencias de
variables numricas

En este caso, debemos distinguir dos


situaciones:

La primera, si entre los datos existen pocos


valores diferentes, se hace un listado de
esos valores y las clases sern
precisamente cada uno de esos valores
diferentes.
La segunda, si los datos son numerosos
y existen muchos valores diferentes, las
clases sern intervalos de nmeros reales.
Se acostumbra presentar a los datos de
variable discreta segn la primera situacin
y a los datos de variable continua segn la
segunda situacin.
Hay que precisar que estos tipos de
presentaciones no son exclusivas de dichos
tipos de variables estadsticas.
Tabla de distribucin de frecuencias para
variable numrica discreta

X fi hi Fi Hi
x1 f1 h1 F1 H1
x2 f2 h2 F2 H2
. . . . .
. . . . .
. . . . .
xk fk hk Fk Hk
fi es la frecuencia absoluta.

Representa el nmero de veces que se repite


cada dato.

Se cumple: f i = N ( n)
hi = fi / N conocida como la frecuencia
relativa.

Expresa la fraccin de las veces que aparece el


dato i- simo.

Se cumple: h i = 1
Fi = f1 + f2 + ... + fi,
es la frecuencia absoluta acumulada.

Acumula el nmero de veces que se presentan


los datos menores o iguales al i-simo dato.

Se cumple: F k = N ( n)

.
Hi = h1 + h2 + ... + hi,
es la frecuencia relativa acumulada.

Acumula la fraccin de las veces que se


presentan los datos menores o iguales al i-
simo dato.

Se cumple: H k = 1.00

.
EJEMPLO 3
Se aborda a un grupo de 50 familias y
se les pregunta acerca del nmero de
personas que laboran en cada familia.
Los resultados fueron los siguientes:
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
Podemos observar que la variable Nmero
de personas que laboran en la familia
toma valores comprendidos entre 1 y 4, por
lo que es necesario construir una tabla de
frecuencias en la que se resuman estos
datos, denotando a la variable como X, tal
como se muestra:
Tabla 2
Distribucin de frecuencias del nmero de personas que
laboran, por familia.
X fi

1 16
2 20
3 9
4 5
Total 50
Esta tabla describe la manera como estn
distribuidos los datos, permitiendo hacer
interpretaciones acerca del patrn de
comportamiento de los mismos y es un
punto de partida en la bsqueda de un
modelo terico para analizar tal
distribucin.
Considerando todas las frecuencias
tenemos:
Xi fi hi Fi Hi

1 16 0.32 16 0.32

2 20 0.40 36 0.72

3 9 0.18 45 0.90

4 5 0.10 50 1.00

Total 50 1.00
Ejemplo 4
Se tiene el registro del nmero de partos de 45 madres de familia,
del Hospital Almenara, en la 1 semana de marzo 2017.

2 2 1 3 3
2 5 2 4 3
4 5 1 2 1
1 3 2 2 3
1 4 2 1 3
3 2 3 1 2
2 1 1 3 2
1 2 1 1 2
3 3 2 2 5
Tabla de Distribucin de Frecuencias
Frecuencia Frecuencia
Absoluta Relativa
N de N de
partos madres
fi hi
1 12 0.27
2 16 0.35
3 11 0.24
4 3 0.07
5 3 0.07
Total 45 1
Grfico de Varas o bastones
Nmero de Partos
40

30

20
%

10

1 2 3 4 5
No de partos
Tabla de frecuencias para variable
numrica continua:

Procedimiento:

1. Calcular el Rango de los datos, R.


R = dato mayor dato menor
R = X(N) X(1)
2. Escoger el nmero de intervalos, k.
5 k 15
El valor de k se puede elegir por
conveniencia o tomando en cuenta
los siguientes criterios:

k N
k 1 3.32 * log N
Donde N es el tamao de la poblacin.
El segundo es llamado Criterio de
Sturges.
3. Hallar la amplitud, c, de cada
intervalo.

R
c
k
4. Se procede a construir los intervalos
semiabiertos, de amplitud constante.
El lmite inferior del primer intervalo es el
dato mnimo.
Agregndole a este lmite la amplitud se
tendr el lmite superior.
El segundo intervalo tiene como lmite
inferior el lmite superior del intervalo
anterior.
Agregndole a este lmite la amplitud se
tiene el lmite superior.
Y as sucesivamente se van generando los
intervalos de clase.
La construccin de intervalos de clase
semiabiertos, de amplitud constante, es
como sigue:
[Linf Lsup )
I1 [X(1) X(1) + c )
I2 [X(1) + c X(1) + 2c)
I3 [X(1) + 2c X(1) + 3c)
.
.
IK [X(1) + (k-1)c X(n) )
5. Se procede a hacer el conteo, ubicando
cada dato en el intervalo correspondiente y
se completa el cuadro agregando
columnas, como en el caso anterior,
considerando todas las frecuencias
definidas anteriormente.
EJEMPLO 5

A un grupo de 30 alumnos de la EPG se les


pregunta cul es la cantidad de dinero que
portan en ese momento. Se obtienen los
siguientes datos:
450 1500 1200
80 1315 675
1595 250 985
5 2680 560
375 3000 175
125 200 785
1152 2205 100
25 425 600
2300 300 185
180 605 1100
El Rango est dado por:
R = 3000 - 5 = 2995
Aplicando Sturges tenemos:
k = 1 + 3.32 * log 30 = 5.9
k=56
Por comodidad escogeremos 5.
La amplitud de cada intervalo ser:
c = 2995 / 5 = 599
La tabla resultante es:

Intervalos fi hi Fi Hi
5 - 604 16 0.5333 16 0.5333
604 - 1203 7 0.2333 23 0.7666
1203 - 1802 3 0.1000 26 0.8666
1802 - 2401 2 0.0667 28 0.9333
2401 - 3000 2 0.0667 30 1.0000
Total 30 1.0000
EJEMPLO 6

Con la finalidad de determinar el nmero


de horas diarias que las amas de casa se
dedican a ver televisin, se llev a cabo
una encuesta, obtenindose los siguientes
resultados, expresados en horas:
4,4 5,2 4,5 4,6 4,1 4,3 4,3 4,8 5,0 4,4

4,7 2,8 3,6 3,8 4,9 5,4 4,5 4,7 3,1 4,2

3,9 5,7 5,3 4,5 4,7 3,3 3,7 4,3 4,9 5,0

4,5 4,7 3,4 4,3 3,9 5,6 5,3 4,8 4,0 3,5

4,2 4,3 5,0 6,3 4,6 4,2 3,6 6,0 3,8 4,0
N = 50

Rango: R = 6,3 2,8 = 3,5

Por Sturges: k = 1 + 3,32 * log 50 = 6,64


k=7

Amplitud de cada intervalo:

c = 3,5 / 7 = 0,5
Tabla N 4: Distribucin de frecuencias
del tiempo dedicado a ver T.V.

Horas Xi fi hi% Fi Hi%


2,8 3,3 3,05 2 4 2 4
3,3 3,8 3,55 6 12 8 16
3,8 4,3 4,05 10 20 18 36
4,3 4,8 4,55 17 34 35 70
4,8 5,3 5,05 8 16 43 86
5,3 5,8 5,55 5 10 48 96
5,8 6,3 6,05 2 4 50 100
Total -- 50 100 -- --
En la segunda columna de la tabla se
tiene la marca de clase, Xi.
La marca de clase es el punto medio del
intervalo. Se calcula sumando los lmites
del intervalo indicado y dividiendo esta
suma por 2.
La marca de clase representa a todos
los valores que caen dentro de un
intervalo.
Tambin se puede observar que las
frecuencias relativas aparecen en
porcentajes. A veces, es conveniente
expresarlas as, pues facilitan las
interpretaciones y permiten hacer
comparaciones.
EJEMPLO 7
Se registr el peso de 45 recin nacidos en el Hospital San
Bartolom en enero del 2017. Los datos son los siguientes:

2.62 2.94 3.10 3.30 3.62


2.65 2.95 3.10 3.30 3.62
2.75 2.97 3.10 3.40 3.80
2.80 3.00 3.14 3.40 3.85
2.80 3.00 3.18 3.50 3.90
2.86 3.00 3.18 3.50 4.00
2.90 3.00 3.20 3.56 4.04
2.90 3.05 3.30 3.60 4.35
2.90 3.08 3.30 3.60 4.65
Pasos para la construccin de la tabla:
1. Clculo de la amplitud o rango ( R )
R = Xmax - Xmin
R = 4.65 2.62 = 2.03
2. Determinar el nmero de intervalos de clase ( k )
Utilizando la regla de Sturges:
k = 1 + 3.3 log N (donde N es el nmero de observaciones)
k = 1 + 3.3 log 45 = 6.4556 (6 7 intervalos)
Por redondeo simple, al entero ms cercano, k = 6
3. Determinar la amplitud, c, de los intervalos de clase:
R 2.03
C 0.33833
k 6

Redondeando por exceso, segn la cantidad de decimales de


los datos, C = 0.34
Tabla de Distribucin de Frecuencias
Marca Frec. Frec. Frec. Frec.
de
Abs. Rel. Abs. Rel.
clase
PESOS Acum. Acum.
[LI-LS> X i' fi hi Fi Hi
[2.62-2.96> 2.79 11 0.24 11 0.24
[2.96-3.30> 3.13 14 0.32 25 0.56
[3.30-3.64> 3.47 13 0.29 38 0.85
[3.64-3.98> 3.81 3 0.07 41 0.92
[3.98-4.32> 4.15 2 0.04 43 0.96
[4.32-4.66] 4.49 2 0.04 45 1
TOTAL 45 1
Histograma de Frecuencias
Es un grfico de bandas rectangulares contiguas, sin espacio entre ellas.
Cada barra representa la frecuencia (absoluta o relativa) de un intervalo de
clase.

Peso de Bebs

30

20
Percent

10

2.45 2.79 3.13 3.47 3.81 4.15 4.49 4.83


Peso
Polgono de Frecuencias
Es el grfico que resulta al trazar un polgono que pase por los puntos
(Xi, fi) o por los puntos (Xi, hi). Para construir este grfico, se debe
considerar dos intervalos adicionales: uno anterior al primero y otro
posterior al ltimo, cada uno de ellos con frecuencia cero.

Peso de Bebs

30

20
Percent

10

2.45 2.79 3.13 3.47 3.81 4.15 4.49 4.83


Peso
Ojiva de Frecuencias Absolutas
Es el grfico que resulta al trazar un polgono que pase por los
puntos (LSi, Fi). En este grfico se debe considerar adicionalmente
el punto (LI1, 0).

45
40
35
30
25
Fi

20
15
10
5
0
2,62 2,96 3,3 3,64 3,98 4,32 4,66
Peso de recien nacidos
Ojiva de Frecuencias Relativas
Es el grfico que resulta al trazar un polgono que pase por los
puntos (LSi, Hi). En este grfico se debe considerar adicionalmente
el punto (LI1, 0).

1.00

0.80

0.60
Hi

0.40

0.20

0.00
2.62 2.96 3.3 3.64 3.98 4.32 4.66
Peso de recien nacidos

You might also like