You are on page 1of 72

Tabuiacin y Presentacin de

Datos. Representacin Grfica


de Distribuciones de Frecuencias

Curso Mtodos Estadsticos Aplicados a la


investigacin Clnica y Epidemiolgica
SESIN II
Viernes 22 de junio de 2012
Distribucin emprica.
Caso Sexo Ed ad Clasificacin

Hemoglobinemia Nmero de
morfolgica en grs/dl consultas
previas
masculino 62 Microctica 12.1 2
n=30
1

2 femenino 75 Mcroctica 1
1.7 3
3 femenino 58 Normoctica 9.5 0
4 masculino 65 Microctica 9.8 1

5 masculino 84 Normoctica 10.1 1

6 femenino 64 Normoctica 10.8 2


7 femenino 77 Macroctica 10.2 1

8 femenino 54 Normoctica 8.6 0


9 femenino 66 Normoctica 11.7 0
10 mascu11no 72 Micr0ctica 12.4 2
1 1
masculino 79 Microctica 11.9 1

12 femenino 87 Normoctca 1
1.3 3
13 mascu1ino 69 Microctica 9.7 4
14 femenino 59 Normoctica 7.5 1

15 masculino 82 Microctica 12.1 2


16 masculino 74 Microctica 11.6 0
17 femenino 71 Normoctica 10.5 1

18 femenino 61 Macroctica 9.8 1

19 femenino 59 Microctca 10.0 2


20 masculino 66 Microctica 10.4 1

21 femenino 78 Normoctica 9.6 0


22 femenino 74 Microctica 8.9 0
23 masculino 63 Normoctica 11.2 1

24 ma5cu1 no 65 Microctica 11.6 1

25 femenino 74 .Vlicrocitica 10.3 2


26 femenino 84 Macroctica 9.9 0
27 masculino 68 .Vlicroctica 10.5 3
28 femenino 52 Normoctica 1
1.1 3
29 femenin () 72 Norm octica 10. 7 0
3 masculino 65 Vlcroctica 9.9 4
Distribucin emprica de Frecuencias.

'La distribucin emprica corresponde a la


coleccin clases y frecuencias de cada clase

Clases Frecuencias Frecuencias


absolutas relativas
MeSC(C1)

F(C2)
|fCI_
=I-_3
IfC2 =a7
|
|
f(C1)043

fC2)%0.57
1
Distribucin 'emprica de Frecuencias. _

i==k

Zn=n1+n2+...+nk=n, (2)
=1

i==k

ZQ=Q+f2++ka1. (3)
i=1
Distribucin emprica. Tabulacin.

Frecuencias Frecuencias
absolutas relativas

Distribucin emprica. Tabulacin. Variables Discretas. i 7%?

Clases Recuento de Frecuencia absoluta


frecuencias
///// ///// ///// n1=15
///// ///// // n2=12
/// n3=3
5 :,

Distribucin emprica. Tabulacin.

Clases Frecuencias ab- Frecuencias


solutas relativas
Microctica 15 0.5
Normoctica 12 0.4
Macroctica 3 0. ]

n=Zn=30 Z=1

variable cualitativa
:

nivel de medida: ordinal


las clases no tienen longitud, es un atributo cualitativo
Distribucin emprica. Tabulacin.Variables continuas. %

Clases Frecuencias absolutas Frecuencias relativas


7.5SX<8.4 1
0-03
8.4SX<9.3 0-07
9.3 SX < 10.2 0-30
10.2SX<11.1 UJ00xIKDN

0.23
11.15X<12 0-27
125X512.9 0.10

n= n=30 f,:1
=1

variab1e:cuantitativa continua
nivel de medida: razn
cada clase tiene longitud; ej :8.4-7.5=0.9
Distribucin emprica. Tabulacin.Variables continuas.

'Al ser una variable continua las distintas clases son


INTERVALOS de les valores posibles.
Est0s intervalos deben ser excluyente y exhaustivos
Clases
7.5<.X<8.4
8.45X<9.3
9.35X<10.2
10.25X<11.l
11.15X<12
125X12.9
,_
y:js ,
' ;;

Distribucin emprica. Tabulaci n.Variables continuas.


%% ??/%f 1/),'a*3/4
Distribucin emprica. Tabulacin.Variables continuas.
,4 v.42 ' ' " ' :r/
:

x<
wm
Representacin Grfica
Objetivos:
- Descripcin de la informacin estadstica
- Presentacin y transmisin de la misma
- Aportar una idea de la estructura de los
*

datos (de su distribucin)


Caractersticas en comn
Para que los grcos alcancen estos objetivos deben cumplir
con algunas premisas:

Sencilla construccin
Fcilmente interpretables
Presentar en forma clara ttulos y leyendas
- Concepto de tiempo y espacio especificado
Acompaados de una tabla (complementario)
Esquema de la Presentacin

Variables cualitativas

Representacin
grfica Variables cuantitativas discretas
u nivariada
Var1ables cuantitativas continuas
. . . .

Dos variables cualitativas

' Representacin Una cualitativa y otra cuantitativa


grfica bivariada
Dos variables cuantitativas
Base de datos para e emplos Umvarnado

WM"7' * 7
1

Caso Sexo Edad Clasificacin Hemoglobinemia Nmero de


morfolgica en grs/dl consultas
previas
1
masculino 62 Microctica 12.1 2
2 femenino 75 Microctica 1
1.7 3

3 femenino 58 Normoctica 9.5 0


4 masculino 65 Microctica 9.8 1

5 masculino 84 Norm0ctica 10.1 1

6 femenino 64 Normoctica 10.8 2


7 femenino 77 Macroctica 10.2 1

8 femenino 54 Normoctica 8.6 0


9 femenino 66 Normoctica 1 1.7 0
10 mascu1ino 72 Microctica 12.4 2
1 1
masculino 79 Microctica 1
1.9 1

12 femenino 87 Norm0ctica 1 1.3 3

13 masculino 69 Microctica 9.7 4


14 femenino 59 Norm0ctica 7.5 1

15 masculino 82 Microctica 12.1 2


16 masculino 74 Microctica 1
1.6 0
17 femenino 71 Normoctica 10.5 1

18 femenino 61 .V1acr0ctica 9.8 1

19 femenino 59 Microctica 10.0 2


20 mascu1ino 66 Microctica 10.4 1

21 femenino 78 Normoctica 9.6 0


22 femenino 74 Microctica 8.9 0
23 mascu1ino 63 Normoctica 1
1.2 1

24 mascu1ino 65 Microctica 1
1.6 1

25 femenino 74 Microctica 10.3 2


26 femenino 84 Macroctica 9.9 0
27 masculino 68 .Vlicroctica 10.5 3

28 femenino 52 Normoctica 1
1.1 3

29 Femenino 72 Normoctica 10.7 0


30 m ascu]i no 65 .V1icroc1'1 ica 9.9 4
Grficos para variables
cualitativas
- Diagrama de barras

Superficies representativas:
- Grficos sectoriales
- Pictogramas
Diagrama de barras vertical

Es un greo muy difundido.


' Utiliza un par de ejes de coordenadas:
- Eje de abseisas: categoras de la variable.

Eje de ordenadas escala de freeuene_ias


:

(absoluta o relat1va)
Destacar: en este grfico es la altura de la barra 10
que representa la frecuencia de la variable.
Distribucin de frecuencia por sexo en pacientes con anemia
Sexo Frecuencia absoluta Frecuencia relativa (%)
Masculino 13 43

Femenino 17 57
Totales 30 100
Distribucin de frecuencias por clasificacin morfolgica de la
anemia.
Clasicacin Frecuencia absoluta Frecuencia relativa
Microctica 15 0.50
Normoctica 12 0.40
Macroctica 3 0.10
Totales 30 1.00
Diagrama de Barras Horizontal
Grficos sectoriales

Trasmiten informacin en forma clara y rpida.


- Fcil comprensin.
sectores proporcionales de un circulo a

Asignan
cada una de las categoras de la variable
analizada de acuerdo a la frecuencia observada

en cada una de stas.


Sencilla construccin a partir de programas informticos

D microctica _

I normoctica
[E macroetica.
Pictogramas

Representa la distribucin de la variable a


travs de dibujos.
- Muy utilizados en medios masivos de
comunicacin, ya que permiten trasmitir
informacin a un publico no especializado.

Desventaja: No siempre el rea es proporcional a la


frecuencia
Graficos para variables
cuantitativas discretas

Diagrama de barras

Grfico escalera
Diagrama de barras
' Conoeptualmente: similar al descrito
anteriormente para variables cualitativas.

- Diferencia el eje de las absoisas corresponde a


:

_
los valores que toma la variable discreta, en
lugar de las categoras de la variable cualitativa.
Distribuin de frecuencias por nmero de consultas previas.
Nme ro de consultas Frecuencia absoluta Frecuencia relativa
0 8 0.27
1 10 0.33
2 6 0.20
3 4 0.13
4 2 0.07
Totales 30 1.00

Recordar: es la altura de la barra lo que indica la frecuencia


Grfico escalera

- Se utiliza para representar la distribucin de


frecuencias acumuladas.

- Al igual que para la distribucin de frecuencias


simples se puede expresar como frecuencias
'

absolutas, relativas () relativas porcentuales


acumuladas.
Di$tribucin de Frecuencias
Acumuladas

Definicin: Para una variable discreta la


frecuencia acumulada hasta un determinado
valor de la variable, se define como el nmero
de observaciones o la fraccin de las mismas

que se encuentran incluidas en o por debajo de


dicho valor, segn sean frecuencias absolutas o
relativas acumuladas.
Distribucin de frecuencias acumuladas para el nmero de
consultas en pacientes con anemias

Nmero de Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa


consultas absoluta relativa acumulada acumulada
0 8 0.27 8 8/30= 0.27

1 10 0.33 8+10= 18 18/30= 0.60

2 6 0.20 18+6= 24 24/30= 0.80

3 4 0.13 24+4= 28 28/30= 0.93

4 2 0.07 28+2= 30 30/30= 1.00

Totales 30 1 .00
,.1.,l,llll..lllg
Grficos para variables
cuantitativas continuas
Tallo y hojas
Dispersograma
- Histograma
Polgono de Densidad
Ojiva
Tallo y hojas

tilpara realizar un manejo primario de la


informacin.
Permite aproximarse a la distribucin de la
variable.
Indica claramente:
los valores ms extremos
los valores centrales
el valor que se repite ms veces
Aplicable con un nmero no muy elevado de
observaciones
Construccin
- A partir de datos originales, sin una agrupacin o
procesamiento previo.
- Estructuralmente consta de:
Columnas - Tallos
Filas Hojas
H
HHH
-IIIII

HHHHHH
HHHH
HH
Ejemplo: edad de pacientes con anemia
08.50 edad
62
'*
75
58
65
84
Paso 1 :
determinar los dgitos que constituirn los a)*J"'
64
77
tallos 54
66
A
72
u>n>*c3
79
Paso 2: reproduccin de los datos en el grfico 87
69
59
xioucn.b
82
74
Paso 3: reordenar en forma ascendente las hojas 71
61
c>cocn
59
mtviViviviUivleVI0IV----4-4-4-4-4-4
66
78
5 8 5 84992 5 4899 o>nJ-4
74
6 2 5 6 125 46 9i 63 58 5 6 23155 56(389 63
65
224445789
00xleU1

7 5 7 5729418442 7
x103(n-b
74
8 4 8 4'724 8 447 84
68
52
c><o<n
72
65
Grco de tronco y hojas para las edades de pacientes
con anemia.

5 24899
612345556689
71224445789
8 2 4 4 7

Valores Extremos? 52 y 87

Valores ms repetidos? 65 y 74

Valores centrales? 68 y 69
Grco de tallo y hoja cada 5 aos

-X-L11
24
899
1234
5 24899
612345556689
*ON

5556689
122444
71224445789
-X-xl

5789
244
82 447
9(OO

7
Dispersograma
Comparte con el grfico de tallo y hojas las
siguientes caractersticas:
- Construirse a partir de datos sin un

procesamiento previo
- Resulta de utilidad si el nmero de
observaciones es reducido
- Representa rpidamente la distribucin de la
variable
Construccin

En un eje de abscisas se colocan los valores de la


variable y sobre ellos se graea un punto cada
vez que dicho valor se repite.

* *
* * * * * *
* * * * * * * * * * * * * * * * * * * * * *

? 54 58 50 61 67 6? 64 65 66 62 60 71 77 74 75 77 72 70 R? 24 87
A destacar en comn
Reproducen el total de las observaciones en forma
ordenada.
Se mantiene la individualidad de las mismas.
Permiten obtener alguna de las medidas de resumen de
la distribucin como por ejemplo la mediana, los
cuartiles y el rango.
De utilidad como manejo preliminar de los datos, como
paso previo a la construccin de intervalos de clase y
tabulacin
Histograma

Es un diagrama de barras vertical particular que representa la


distribucin de la variable analizada, por medio de barras, donde el
rea de cada una de stas resulta proporcional a la cantidad de
observaciones de la variable.
El rea total contenida en el histograma representa entonces a la
totalidad de las observaciones, por lo que dicha rea es igual a 1 o
100 %.
Permite describir la distribucin de la variable al trabajar con un
nmero elevado de observaciones.
Construccin
Para su construccin se debe agrupar a los datos en
intervalos de clase o categoras.
Disposicin:
' eje de abscisas: valores de la variable (lim. Cat.)
' eje de ordenadas: Densidad de frecuencias (Y)
Frecuencia relativa del intervalo
Y_
Amplitud del intervalo

Justificacin: es el rea de la barra lo que representa


la frecuencia
Ejemplo Distribucin de frecuencias para la variable Hemoglobinemia en grs/dl
Densidad de
Intervalos de clase Frecuencia absoluta Frecuencia relativa Amplitud del intervalo trecuencws (Y)
_ .

7.0 S X<9.0 3 O. 10
2.() 0.l()/2.OI 0.05
9.0 S X< 10.0 7 0.23 1.0 0.23/l.0= 0.23
l0.0x<11.0 9 0.30 1.0 0.30/l.0= 0.30
ll.0x<l2.0 8 0.27 l.0 0.27/l.0= 0.27
12.0 SXSl3.0 3 0 1.0 0.lO/l.0= 0.10
Totales 30 1.00
Intervalos de clase Frecuencia absoluta Frecuencia relativa Amplitud del intervalo
7.05x<9.0 3 0.10 2.0
9.0 x< 10.0 7 0.23 1.0

10.05x<ll.0 9 0.30 1.0

ll.0$x<l2.0 8 0.27 1.0

l2.0$xl3.0 3
0.10 1.0

Totales 30 1.00

F.rel

Incorrecto
Recordar

Les histogramas se deben realizar


sistemticamente utilizando la densidad de
frecuencias, es decir se deben construir
como Histogramas de Densidad.
Polgono de densidad
- Es un grfico de lneas que se construye a partir de un
histograma de densidad.

Resulta til para la comparacin de dos o ms distribuciones


'
Ameabak)elpngono
1guala] 01(X)96
<wx&&&

Xmw

(
$v x

Mm?:

Ojiva
- Grfico lineal que representa la distribucin de
frecuencias acumuladas para variables cuantitativas
coanuas.

- Frecuencia acumulada: nmero de observaciones o


fraccin de las mismas (segn sean absolutas o
relativas, respectivamente) que se encuentran en o
por debajo de determinado intervalo de la variable.
Distribucin de frecuencias acumuladas para la hemoglobinemia
en grs/dl.

Intervalos de Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa


clase absoluta relativa acumulada acumulada
7.0 $ x< 8.0 1 0.03 1 0.03

8.0 S x< 9.0 2 0.07 3 0.10

9.0 S x< 10.0 7 0.23 10 0.33

10.0 $ x< 11.0 9 0.30 19 0.63

11.0 $ x< 12.0 8 0.27 27 0.90

12.0 $ XS 13.0 3 0.10 30 1.00

Totales 30 1.00

Conceptualmente es considerar la frecuencia para intervalos de


longitud creciente, hasta abarcar el rango total de observaciones.
F.R.A
_xx,;

&.
,;

x
.
&? x.
%
.: ,

.
,K
%x:m

3AY<
g?a

) :u3.

>??
?ux.

&
.

.
;
3
Lw
%3
?
2 if
, y
&

,,,, 4
,

uv

. *


UH"dades
Representa grficamente la distribucin
acumulada de la variable
Permite comparar varias distribuciones.
Permite hallar la mediana de los datos y otras
mediadas de posicin como percentiles y
cuannes.
Proporciona valiosa informacin de la variable
analizada.
Ejemplo:
]) Que porcentaje de individuos tienen un valor de
hem 0globinemia menor a 10.5 grd/dl?
2) Que valor de hemoglobinemia deja al 95% de los
individuos por debajo?

.....
_

0.95
Descripcin estadstica
bivariada

Dos variables cualitativas.

Una variable cualitativa y otra cuantitativa.

- Dos variables cuantitativas.


Dos variables cualitativas

Tablas de doble entrada

Organizar

Resumir
- Presentar

- Analizar
Organizacin
Filas y columnas: categoras de las variables.
Celdas: frecuencias observadas.
Mrgenes: totales marginales (distribucin univarlada).
Extremo inferior derecho: total de individuos del estudio.

Categoria Categoria
variable B variable B
Categoria Total
celda celda
variable A marginal
Cat_egora celda celda Tt?|
variable A marginal
Total Total Total de
marginal marginal individuos
Ejemplo: Apendicitis Aguda
En una clinica quirrgica un equipo de cirujanos realiz un estudio para valorar que variables influyen en la
aparicin de complicaciones en las apendicitis agudas. Los datos recogidos para las variables aparicin de
complicaciones y enfermedad diabtica para los pacientes de la muestra fueron los siguientes: de los 80
pacientes, 68 eran no diabticos y l2 eran diabticos. En estos ltimos aparecieron complicaciones en 9 casos
y por lo tanto 3 fueron no complicadas. De los no diabticos los casos complicados fueron 38 y los no
complicados resultaron ser 30 pacientes.

Distribucin de frecuencias para la aparicin de complicaciones en la apendicitis aguda y enfermedad diabti


ca en el conjunto de pacientes estudiados.

Enfermedad diabtica Aparicin de complicaciones

Complicadas No complicadas Totales

No Diabticos 38 30 68

Diabticos 9 3 12

Totales 47 33 80
Tabulacin Porcentual

Distribucin porcentual de la aparicin de complicaciones en la apendicitis aguda segn la presencia o


ausencia de enfermedad diabtica.
Enfermedad diabtica Aparicin de complicaciones

Complicadas No complicadas Totales

No Diabticos 56% 44% 100%

Diabticos 75% 25% 100%


Representacin Grfica

Diagrama de barras
- Agrupadas o apareadas

Estratificadas o apiladas

En el caso de que se identifique una de las variables


como independiente y a la otra como dependiente, la
primera se colocar en el eje horizontal mientras que
la segunda lo har en el eje vertical.
Diagrama de barras agrupadas

M :%

. complicados
no complicados
&&
Diagrama de barras
estrati cado

$$

n CmpuCad08
cmplicados

x&>

%
Anlisis de Una variable cualitativa y
una cuantitativa continua
Situacin habitual en la prctica mdica
Situaciones patolgicas (enfermedades)
Glicemia Diabticos - No diabticos
Presin Arterial Hipertensos - Normotensos
Acido Urico Hiperuricmicos - Normouricmicos
Situaciones fisiolgicas (normales)
Hemoglobinemia Hombre - Mujer - Mujer embarazada
Frecuencia Cardaca Adultos - Nios
Representacin Grfica

- Grfico de caja y lneas

- Polgono de densidad

' Ojiva
Grfico de caja y lneas
(Boxplots)

Aplicable a variables cuantitativas continuas.


Resultan muy tiles cuando se utilizan para
comparar diferentes distribuciones.
Representan grficamente las medidas de posicin
y la variabilidad de la distribucin.
Dan una idea de la forma de la distribucin y del
grado y direccin de sesgos.
Ejemplo: Albuminemia
Al burninemia grs/dl.

%- Funcin Insuficiencia
normal Heptica
Vaior mnimo 3.1 1.9
Primer cuartil 3.7 2.4
Mediana 4.0 2.8
Tercer cuartil 4.3 3.1
Valor mximo 5.0 3.9

kisu1r35n[:151 Pi1fu21f3n

hep t1 & normai

Diagramas de caja y lnea para la distribucin de albuminemia (en grs/dl) en


pacientes con funcin heptica normal y en pacientes con insuficiencia heptica.
Polgono de Densidad y Ojivas
- Aplicable a variables cuantitativas continuas.

- Resultan muy tiles cuando se utilizan para


comparar diferentes distribuciones.
Ejemplo: Neumopatas Agudas
Distribucin de frecuencias para el tiempo en horas en el cual remite la fiebre tras
el tratamiento antibitico adecuado en pacientes con neumona comunitaria

Intervalos de clase Frecuencia Frecuencia Frecuencia relativa Amplitud del Densidad de


(en horas) absoluta relativa % acumulada % intervalo frecuencias %

24 x< 36 24 20 20 12 1.67

36 x< 48 48 40 60 12 3.33

48 Sx< 60 30 25 85 12 2.08

60 S x< 72 l2 10 95 12 0.83

72 XS 84 6 5 100 12 0.42
Totales 120 100

Distribucin de frecuencias para el tiempo en horas en el cual remite la fiebre tras el


tratamiento antibitico adecuado en pacientes con neumona intrahospitalaria
Intervalos de clase Frecuencia Frecuencia Frecuencia relativa Amplitud del Densidad de
(en horas) absoluta relativa % acumulada % intervalo frecuencias %

24 S x< 36 4 5 5 2 0.42

365x<48 4 5 lo 12 0.42

485X<60 l6 20 30 12 1.67

60x< 72 24 30 60 12 2.50

72SXS84 32 40 100 12 3.33


Poigonos comparativos

+ nemona comunitaria
neumona intrahospitalaria
uvas compara '( vas

+
neumona comun"tar"El
:
neumoma trahospitalara
Anlisis de dos variables
cuantitativas
Situacin habitual en la prctica mdica

Edad Presin Arterial


Temperatura corporal Saturacin de oxigeno en la Hb
Dosis de un frmaco Efecto Bi01gico (FC, PAS, Glicemia)
Grfico de Dispersin (Grfico X-Y)

Grfico de puntos para variables cuantitativas continuas

- Disposicin:
Eje de abscisas: variable independiente (X)
Eje de ordenadas: variable dependiente (Y)
Frecuentemente X es una variable controlada (no aleatoria)

Un punto por cada observacin (par de valores X-Y)

- Aproximacin al tipo de relacin existente entre las variables


Tabla 1

Dosis del frmaco A Disminucin de la Fc


(mg) (latido/minuto)
1,0 2
1,5 6
2,0 5
2,5 10
3,0 g
3,5 18
4,0 15
4,5 14
5,0 19
5,5 17
6,0 23
6,5 25
7,0 23
7,5 35
8,0 26
8,5 31
9,0 42
9,5 33
10,0 38
10,5 41
11,0 36
11,5 44
12,0 48
12,5 47
Ta bla 2
Dosis del frmaco B Presin arterial
(mg) sistlica (mm Hg)
2,5 190
5,0 170
7,5 185
10,0 180
12,5 155
15,0 155
17,5 170
20,0 150
22,5 150
25,0 165
27,5 155
30,0 140
32,5 145
35,0 125
37,5 135
40.0 135
42,5 125
45,0 110
47,5 115
50,0 110
52,5 115
55,0 110
57,5 105
60,0 115

You might also like