You are on page 1of 23

19

CAPTULO 2: MEDIDAS DE RESUMEN


Las tablas y grficas construidas para tener una representacin de los
datos, son una primera aproximacin a la comprensin de su comportamiento. Sin
embargo hay rasgos especficos de las variables que puede interesar conocer.
Surgen as medidas que permiten captar en forma resumida los principales rasgos
de cada variable.
Cuando las variables son categricas, las medidas posibles son
proporciones y porcentajes.
Cuando las variables son numricas, existen varias medidas posibles que
tratan de resumir la informacin que contienen.
Las medidas de posicin buscan dar una idea numrica de donde se
encuentra situada una distribucin de frecuencias (donde se localizan las
observaciones).
Pueden ser de 2 tipos: Medidas de tendencia central y Medidas de posicin
no centrales.
Las medidas de tendencia central, buscan sintetizar la informacin
contenida en una distribucin de frecuencias, estimndose donde se encuentra el
centro de la misma, segn diferentes criterios.
Las medidas de posicin no centrales buscan dar una idea de donde se
encuentra el grueso de la distribucin de frecuencias.
Algunas caractersticas que interesa conocer sobre una medida de posicin:
Intervienen todos los elementos? Con qu tipo de datos se puede calcular? Es
nica? Es robusta? En qu sentido es representativa? Cmo se interpreta?
Cmo se comporta bajo transformaciones? (en particular bajo cambios de origen
y escala) Cundo conviene utilizarla?
Las medidas de dispersin buscan rescatar la dispersin o variabilidad de
los datos.
Las medidas de simetra y curtosis tienen que ver con la forma de la
distribucin de frecuencias.

20

Media aritm.

Media geom.

LOCALIZACIN
Mediana

Moda

No centrales: Cuantiles

Tendencia central

Rango

Rango intercuartlico

Rango interquintlico

MEDIDAS DE RESUMEN

DISPERSIN Varianza

Desviacin estndar

Coeficiente de variacin

Puntaje estndar

SIMETRA

CURTOSIS
2.1.- MEDIDAS DE LOCALIZACIN O MEDIDAS DE POSICIN.
2.1.1.- MEDIDAS DE TENDENCIA CENTRAL.
2.1.1.1.- Media aritmtica de una variable X
1.- DATOS SUELTOS

M(X) o

21

X : x 1 , x 2 , x 3 , ................, x n
2.- DATOS TABULADOS EN LA FORMA:

n
xi
M(X) i1
n
Xi
X1
X2
X3
.....
.....
Xr

ni
n1
n2
n3
....
.....
nr

r
xi n i
M(X) i1
n

3.- DATOS TABULADOS Y AGRUPADOS:


Si se dispone de los datos originales, la media verdadera es aquella
calculada con esos datos.
Si no se dispone de esos datos, una aproximacin a la verdadera media
est dada por:

r
xi n i
M(X) i 1
n

Donde los X i son las marcas de clase.


Ejemplos:
1.- X : Edad de 5 personas : 50, 42, 34, 38, 46

2.-

n
xi
50 42 34 38 46
M(X) i 1
42
n
5

22

Nde asig.
0
1
2
3
4

Nde
alumnos
4
8
9
6
3

Total

%de alumnos
13.3 %
26.7 %
30.0 %
20.0 %
10.0 %

30

N de al.
acumulados
4
12
21
27
30

% de al.
acumulados
13.3 %
40.0 %
70.0 %
90.0 %
100.0 %

100 %

r
xi n i
0 4 1 8 2 9 3 6 4 3
M(X) i 1

1.866..
n
30
3.Peso (Kg)

De 50 a menos de 54
De 54 a menos de 58
De 58 a menos de 62
De 62 a menos de 66
De 66 a menos de 70
De 70 a 74

N de
alum.
52
56
60
64
68
72

Total

30

4
4
6
8
5
3

% de
Alud.
13.3
13.3
20.0
26.7
16.7
10.0

N de al.
acumul.

% de al.
acumul.

4
8
14
22
27
30

13.3
26.6
46.6
73.3
90.0
100.0

100 %

r
xi n i
52 4 56 4 60 6 64 8 68 5 72 3
M(X) i 1

62
n
30
2.1.1.2.- Media aritmtica ponderada.

r
xi p i
x
i 1
p
pond .
Los p i son los pesos o ponderaciones y p es la suma de los pesos.

23

Ejemplo: Si las notas de un alumno son: 3, 5, 6 entonces la media


aritmtica es 4.7.
Si se agregaran las ponderaciones o pesos: 20%,
respectivamente, entonces la media aritmtica ponderada es:

30%,

50%,

r
xi p i
3 20 5 30 6 50
x
i 1

5.1
p
pond .
100
DEFINICIONES:
A la expresin: (x i - x ) se le puede llamar desviacin de x i con respecto
a la media. En otras palabras la desviacin de un determinado valor de la variable,
con respecto a la media de esa variable, es la distancia de ese valor a la media,
acompaada de un signo.
K , representa una constante, es decir puede considerarse como una
variable X que "toma" los valores: K, K, K,..........,K.
( X + K ), representa una variable generada a partir de la variable X, donde
a cada valor de X se le suma K. Es decir si la variable X toma los valores : x 1 , x2
, x 3 , ................, x n entonces la variable X + K toma los valores : x 1 + K, x 2 + K ,
x 3 + K , ................, x n + K
( KX ), representa una variable generada a partir de la variable X, donde
cada valor de X se multiplica por K. Es decir si la variable X toma los valores : x
Kx 1 , Kx 2
1 , x 2 , x 3 , ................, x n entonces la variable KX toma los valores :
, Kx 3 , ................, Kx n
Propiedades:

n
1. ( x x ) 0
i
i1

La suma de las desviaciones con respecto a la media es igual a cero.


2.- M ( K ) = K
La media de una constante, es la misma constante.
3.- M ( X + K ) = M ( X ) + K
Si cada valor que toma una variable se incrementa en K, entonces la media
queda incrementada en K.

24

4.- M ( K X ) = K M ( X )
Si cada valor que toma una variable se multiplica por K, entonces la media
queda multiplicada por K.
5.- Si se tiene un conjunto de datos A con n elementos (que corresponden a
los n valores que toma cierta variable X), y si se particiona A en r "grupos" A i ,
donde A i tiene n i elementos y la media es x i , i = 1, 2,....r , entonces:

r
x in i
M(X) i 1
n
2.1.1.3.- Media geomtrica.
X : x 1 , x 2 , x 3 , ................, x n
MG ( X ) n x1 x2 x3 xn

Ejemplo: Si X toma los valores : 50, 42, 34, 38, 46, entonces la media
geomtrica de X es :
MG ( X ) 5 50 42 34 38 46 41,6

2.1.1.4.- Mediana.
Si se tiene una variable X, que toma los valores x 1 , x 2 , x 3 , ................, x n
(ordenados de menor a mayor ), se define la mediana de X, como aquel valor que
deja a ambos lados la misma cantidad de datos.
De acuerdo a lo anterior, la mediana se puede calcular de la siguiente
manera:
De acuerdo a lo anterior, la mediana se puede calcular de la siguiente
manera:

25

,
si n es impar
n 1
2
Me x x
n 1
n
2 , si n es par
2

Ejemplo:
Si X toma los valores 1 , 5, 6, 8, 20 , entonces la mediana = 6
Si X toma los valores 2, 3, 8, 10, 14, 32 , entonces la mediana = 9
Si los datos estn agrupados en clases
M e LI
j

A
n

j
j

n
2

- N

j - 1

L I j : Es el lmite inferior de la clase mediana.


A j : Es la amplitud de la clase mediana.
n j : Es la frecuencia absoluta de la clase mediana.
N j - 1 : Es la frecuencia absoluta acumulada de la clase anterior a la clase
mediana.
La clase mediana se encuentra ubicando en la columna de las frecuencias
absolutas acumuladas, el primer valor que sea mayor o igual a n / 2 .
En el siguiente ejemplo, calcular la mediana.
Peso (Kg)

N de
alum.

% de
alum.

N de al. % de al.
acum.
acum.

26

De 50 a menos de 54
De 54 a menos de 58
De 58 a menos de 62
De 62 a menos de 66
De 66 a menos de 70
De 70 a 74

52
56
60
64
68
72

Total

4
4
6
8
5
3

30

13.3
13.3
20.0
26.7
16.7
10.0

4
8
14
22
27
30

13.3
26.6
46.6
73.3
90.0
100.0

100 %

2.1.1.5..- Moda:
Dado un conjunto de valores que toma una variable, se define la moda de
dicha variable, como aquel valor de la variable con mayor frecuencia.
Si se tiene la variable X que toma los valores: 2, 4, 7, 7, 7, 8, 8, 14,
entonces la moda es 7.
Si los datos estn agrupados en clases:
M o LI
j

LI
A
n

(n

)
j - 1
(n - n
) (n - n
)
j
j - 1
j
j 1
j

- n

: Es el lmite inferior de la clase modal.

: Es la amplitud de la clase modal.

: Es la frecuencia absoluta de la clase modal.

j-1

: Es la frecuencia absoluta de la clase anterior a la clase modal.

j+1

: Es la frecuencia absoluta de la clase siguiente a la clase modal.

La clase modal , es aquella que presenta la mayor frecuencia.


Calcular la moda, en el siguiente ejemplo.
Peso (Kg)

N de
alum.

% de
alum.

N de al.
acum.

% de al.
acum.

27

De 50 a menos de 54
De 54 a menos de 58
De 58 a menos de 62
De 62 a menos de 66
De 66 a menos de 70
De 70 a 74

52
56
60
64
68
72

Total

30

4
4
6
8
5
3

13.3
13.3
20.0
26.7
16.7
10.0

4
8
14
22
27
30

13.3
26.6
46.6
73.3
90.0
100.0

100 %

2.1.2.- MEDIDAS NO CENTRALES.

1
0
,
0
8
0
,
0
6
0
,
0
4
0
,
0
2
0
,0
0
,0
4
0
,05
0
,06
0
,0p
7
0
,s
0
8
0
,09
0
,01
0
,0
e
o

Nalum
nos

NOTA: Con respecto al histograma, la mediana lo divide en 2 partes de


igual rea.

As como la mediana divide al histograma en dos partes de igual rea, se


puede determinar ciertos valores que puedan dividir al histograma en n partes de
igual rea.
2.1.2.1.- Cuartiles: Son 3 valores que dividen al histograma en 4 partes de igual
rea.

LI

A
n

j
j

nk
4

- N

j - 1

L I j : Es el lmite inferior de la clase del Cuartil.


A j : Es la amplitud de la clase del Cuartil.
n j : Es la frecuencia absoluta de la clase del Cuartil.
N

j- 1

: Es la frecuencia absoluta acumulada de la clase anterior a la


clase del Cuartil.

28

La clase del Cuartil. se encuentra ubicando en la columna de las


frecuencias absolutas acumuladas, el primer valor que sea mayor o igual a (n k)/4
Anlogamente se definen
2.1.2.2.- Los Quintiles, que son 4 valores (C
histograma en 5 partes de igual rea.
2.1.2.3.-Los Deciles, que son 9 valores (D
al histograma en 10 partes de igual rea.

,C

,D

2.1.2.4.- Los Percentiles, que son 99 valores (P


dividen al histograma en 100 partes de igual rea.

,D

,C

3,

,P

3 ,

C 4 ) que dividen al

D 4 , ......,D 9 ) que dividen

,P

3,

......... P

) que

99

En el siguiente ejemplo, calcular el cuartil 3, el quintil 1, el percentil 15.


Peso (Kg)

De 50 a menos de 54
De 54 a menos de 58
De 58 a menos de 62
De 62 a menos de 66
De 66 a menos de 70
De 70 a 74

N de
alum.
52
56
60
64
68
72

Total

30

% de
alum.

4
4
6
8
5
3

13.3
13.3
20.0
26.7
16.7
10.0

N de al.
acum.

% de al.
Acum..

4
8
14
22
27
30

13.3
26.6
46.6
73.3
90.0
100.0

100 %

2.2.- MEDIDAS DE DISPERSIN:


Las medidas de localizacin nos entregan cierta informacin resumida de la
variable, sin embargo esta informacin es insuficiente para comprender el
comportamiento de la variable.
Se puede obtener una medida de tendencia central que resulte ser poco
representativa o que esconda realidades importantes de conocer. Situaciones
claramente distintas pueden dar lugar a medidas de tendencia central iguales, por
lo que las medidas de tendencia central pueden ser utilizadas parcialmente como
resumen de la informacin. Se hace necesario entonces complementar con otras
medidas, que recojan la variabilidad de los datos.
Ejemplo: Es conocido que para saber acerca de la PAS de una persona,
puede ser insuficiente con un solo registro. De ah que existe, por ejemplo, un
holter de presin, que registra en 24 horas varias mediciones de la PAS de la
persona. Supongamos las siguientes 2 situaciones:

29

Caso A.- PAS: 132, 132, 127, 129. Media = 130


Caso B.- PAS: 150, 150, 120, 100. Media = 130
Observando estas 2 situaciones se puede ver lo riesgoso que puede ser el
identificar un conjunto de datos, con slo la media aritmtica.
2.2.1.- RANGO O RECORRIDO.
Si X es una variable que toma los valores : x 1 , x 2 , x 3 , ............., x n, se
define el Rango de la variable X como: R = x max - x min , donde x max es el valor
mximo y x min el valor mnimo, que toma la variable X.
2.2.2.- RANGO INTERCUARTIL:
Si X es una variable que toma los valores x
define el

,x

, x

, ............., x

se

Rango intercuartil = Q3 - Q1
Se est comparando el 25% de los valores ms grande de la variable con el
25% de los valores ms pequeos. (comparacin por diferencia)
2.2.3.- RANGO Y CUOCIENTE INTERQUINTIL.
Si X es una variable que toma los valores x
define:

, x

,x

, ............., x

se

Rango interquintil = C4 - C1
Se est comparando el 20% de los valores ms grande de la variable con el
20% de los valores ms pequeos. (comparacin por diferencia)
Una medida que suele tambin usarse es el cuociente interquintil.
C4
Cuociente interquintil =
C1
Aqu la comparacin es por cuociente.
Nota: Se suele llamar al grupo de valores menores que el primer quintil,
como primer grupo quintil o primer quintil y al grupo de valores mayores al
cuarto quintil, como ltimo grupo quintil o ltimo quintil.

30

20%
Primer
quintil

20%

C1

20%

C2

20%

C3

20%
ltimo
quintil
C4

Variable
2.2.4.- VARIANZA.

2
(
x
x
)

DATOS SUELTOS V( x ) i

POBLACIN

( x i x ) 2 n i
DATOS TABULADOS V ( x )

VARIANZA

2
(
x

x
)

i
DATOS
SUELTOS
V
(
x
)

n- 1

MUESTRA

( x i - x ) 2 n i
DATOS TABULADOS V ( x )
n -1

2.2.5.- DESVIACIN ESTNDAR.


Si X es una variable cuya varianza es V(X)
desviacin estndar de X como la raz aritmtica de X.

Desviacin estndar de X
Simbologa:

V(x)

, entonces se define la

31

Desviacin estndar poblacional (x).


Desviacin estndar muestral S(x).
2.2.6.- COEFICIENTE DE VARIACIN.

C V ( X ) Desviacin estndar de X
Media de X
Ejemplo: Si las edades de 5 enfermos son: 50, 42, 34, 38 y 46 aos,
calcular la media aritmtica, la varianza, la desviacin estndar y el coeficiente de
variacin.
Ejemplo: Calcular la media aritmtica, la varianza y la desviacin estndar
y el coeficiente de variacin, en el siguiente caso:
Nde asig.

Nde al.

0
1
2
3
4
Total

% de al.

4
8
9
6
3

13.3 %
26.7 %
30.0 %
20.0 %
10.0 %

30

N de al.
acum.
4
12
21
27
30

% de al.
Acum..
13.3 %
40.0 %
70.0 %
90.0 %
100.0 %

100 %

2.2.7.- PROPIEDADES:
1.- V ( X ) 0
La varianza es un nmero real no negativo
2.- V ( K ) = 0
La varianza de una constante es igual a cero.
3.- V ( X + K ) = V ( X )
Si cada valor que toma una variable se incrementa en K, la varianza
permanece igual.
4.- V ( K X ) = K

V ( X)

Si cada valor que toma una variable se multiplica por K, entonces la


varianza queda multiplicada por K 2.

32

Nota. Cuando se quiere comparar valores observados que pertenenecen a


diferentes distribuciones de datos, las que difieren en su media o en su varianza o
en la unidad de medida usada, resulta til usar " El Valor Estndar":
2.2.7.- VALOR ESTNDAR.
Si X es una variable que toma los valores x
define el valor estndar para x i como:

,x

, x 3 , ................, x n se

x
- x
i
Z
i
Desv. est.
El valor estndar resulta til para saber como es un determinado valor, en
relacin al resto de los valores de una distribucin.
PROPIEDAD:
Al estandarizar los valores de una variable X , la media de los valores
estandarizados es cero y la desviacin estndar es 1.
2.2.8.- PRINCIPALES PROPIEDADES DE LAS MEDIDAS DE POSICIN.
Propiedades de la media aritmtica
Es nica
Utiliza todos los valores de la distribucin. ( de esta manera se considera que la
media aritmtica es ms informativa que otras medidas).
Slo se puede calcular con variables cuantitativas preferiblemente continuas
No se puede calcular con distribuciones agrupadas que tengan intervalos de clase
infinitos
Es el centro de gravedad de la distribucin en un sentido aditivo
Minimiza el error cuadrtico medio
No es robusta
No es invariante por cambios de origen y escala
Es descomponible
Propiedades de la media aritmtica ponderada.
Es una generalizacin de la media aritmtica que se utiliza cuando no todos los
datos observados tienen la misma importancia
Propiedades de la media geomtrica
Es nica
Utiliza todos los elementos.
Slo se puede calcular con variables cuantitativas positivas
Su logaritmo es la media aritmtica de la variable log X

33

Es el centro de gravedad de la distribucin en trminos multiplicativos


Es ms robusta que la media a valores grandes pero no a los pequeos y siempre
toma valores ms pequeos que la media aritmtica
No es invariante por cambios de origen y escala
Es til para promediar tasas, porcentajes, tipos de inters y, en general, en todas
aquellas situaciones en las que la variable analizada presente variaciones
acumulativas
Propiedades de la mediana
Es nica
No utiliza todos los elementos. Adems en su clculo no utiliza los valores de la
variable, sino su nmero. Esto le confiere menor capacidad informativa. Sin
embargo esto la hace apropiada para captar la localizacin de un grupo de
observaciones con distribucin asimtrica.
Se puede calcular con datos ordinales
Siempre es un valor observado de la variable, o la media de valores observados.
Es ms robusta que la media aritmtica
Minimiza el error absoluto medio
No es invariante por cambios de origen y escala
No es descomponible
Propiedades de la moda
Pueden existir varias modas.
Si existen varias modas esto es un sntoma de heterogeneidad en los datos
En su clculo no intervienen todos los elementos
Se puede calcular con datos nominales
Siempre es un valor observable de la variable
Es robusta
No es invariante por cambios de origen y escala
No es descomponible
Propiedades de los cuantiles.
Son nicos
No utilizan en su clculo todos los elementos
Se pueden calcular con datos ordinales
Siempre es un valor observable de la variable
Su robustez depende del valor de p: cuanto ms cercano a 0 o a 1, menos robusto
es; cuanto ms cercano a 0.5, ms robusto es
Se utilizan para situar a la distribucin y para dar una idea de su dispersin
No son invariantes por cambios de origen y escala
No son descomponibles
2.3.- MEDIDAS DE FORMA.
Miden si la forma de la distribucin es ms o menos simtrica o con un
mayor o menor grado de apuntamiento.

34

Coeficiente de asimetra = As =

(x
i 1

x) 3

n
s3

1
2
0
,
0
1
0
,
0
8
0
,
0
6
0
,
0
4
0
,
0
2
0
,
0
0
,0
4
0
,0
5
0
,0
6
0
,0
7
0
,
0
8
0
,0
9
0
,0
1
0
,
0
P
e
s
o
1
0
,
0
8
0
,
0
6
0
,
0
4
0
,
0
2
0
,
0
0
,0
4
0
,05
0
,06
0
,0
7
0
,s
0
8
0
,09
0
,01
0
,0
P
e
o
1
0
,
0
8
0
,
0
6
0
,
0
4
0
,
0
2
0
,
0
0
,0
4
0
,0
5
0
,0
6
0
,0
7
0
,
0
8
0
,0
9
0
,0
1
0
,
0
P
e
s
o

Nalumnos Nalumnos Nalumnos

Si As = 0, Simetra

Si As > 0, Asimetra positiva

Si As < 0, Asimetra negativa

35

Coeficiente de curtosis = Cu =

(x
i 1

x) 4

n
s4

Cu = 3, apuntamiento semejante a la distribucin normal

Nalumnos Nalumnos

2
0
,
0
1
5
0
,
0
1
0
,
0
5
,0
0
0
,0
4
0
,05
0
,06
0
,0P
7
0
,s
0
8
0
,09
0
,01
0
,0
e
o
Cu > 3, apuntamiento mayor a la distribucin normal

1
4
0
,
0
1
2
0
,
0
1
0
,
0
8
0
,
0
6
0
,
0
4
0
,
0
2
0
,
0
0
,0
4
0
,05
0
,06
0
,0
7
0
,s
0
8
0
,09
0
,0
1
0
,0
P
e
o
Cu < 3, apuntamiento menor a la distribucin normal.

36

EJERCICIOS CAPITULOS 1 Y 2.
1.- Se tiene la base de datos siguiente:
Alumno
1
2
3
4
5
6
7
8
9
10

Carrera
Q-F
Q-F
Enferm
Q-F
Enferm
Enferm
Enferm
Kines
Enferm
Kines

ColColSexo E.Civil Edad N.S.E. Total


HDL
PAS Fuma Peso
M
S
19
M
220
30 150
SI
68
M
S
20
M
250
55 160
SI
79
F
C
23
M
190
60 110
SI
80
F
S
26
A
230
50 125
NO
76
F
S
20
A
255
58 128
NO
59
F
S
19
M
160
67 110
NO
68
M
C
21
M
160
80 130
NO
75
M
S
23
B
180
50 135
NO
70
F
S
26
M
200
68 120
NO
67
F
S
22
M
240
35 130
SI
60

a) Cules de las variables son no numricas, cules numricas enteras y cules


numricas continuas.
b) Cmo se puede presentar la informacin para cada una de esas variables.
c) Que cruce de variables se podra hacer y para qu.
d) Que medida de resumen se puede usar para la variable carrera.
e) Que medida de resumen se puede usar para la variable edad.
f) Si se dice por ejemplo que el percentil 20 para la variable colesterol es 200, que
interpretacin se le puede dar.
g) Si se desea seleccionar al 10% de mayor nivel de colesterol, que medida puede
servir para identificar este grupo.
h) Si la media del peso fuera 73 y la desviacin estndar fuera 7, que se puede
decir de la variabilidad o dispersin del peso.
i) Si el puntaje estndar de una persona para PAS es 2, que significado tiene ese
valor.
2.- En un estudio realizado en la Universidad Arturo Prat en el ao 2002, se
recolect la siguiente informacin, en una muestra de 170 alumnos, clasificados
de acuerdo a sexo(Sexo) y presencia de depresin(Depre).
Sexo : Sexo del alumno ( 0 mujer, 1 hombre)
Depre : Tiene depresin ( 0 No, 1 Si)

37

Sexo

Depre

1
1
0
0

Frecuencia

1
0
1
0

11
71
27
61

a) Presente la informacin para cada una de las variables en una tabla de


distribucin de frecuencias.
b) Presente en una grfica de barras agrupadas la informacin, por Depre, segn
sexo.
3.- En la misma investigacin se estim el riesgo cardiovascular segn
Framingham y se encontr que en las mujeres haba 73 con 0 % de riesgo, 13 con
1% de riesgo y 2 con 2% de riesgo, mientras que en los hombres se encontr 72
con 1% de riesgo, 5 con 2% de riesgo, 3 con 3% de riesgo, 1 con 6% y 1 con 8%.
a) Presente en un cuadro estadstico la informacin para el riesgo de Framingham,
considerando el sexo.
4.- Los siguientes datos indican el tiempo de espera (en minutos) para una
muestra de 50 pacientes, antes de ser atendidos en cierto consultorio:
2
15
17 25 28 30 32 35
40 40

a)
b)
c)
d)

45

46

47

47

48

48

49

49

50

50

55

55

58

58

59

59

60

60

61

61

61

61

62

65

67

68

69

70

71

72

73

74

75

76

78

79

80

90

95

106

Indique cul podra ser en este caso la poblacin y cul es la muestra.


Indique cul es la variable y de que tipo es.
Construya la tabla de distribucin de frecuencias.
Construya una grfica que considere ms adecuada.

5. - La base de datos que se detalla a continuacin, contiene la siguiente


informacin:
PAC : Paciente
EDAD: Edad del paciente en aos
EC
: Presenta el paciente enfermedad coronaria ( 1 = s, 0 = no)

38

PAC EDAD EC
1
20
0
2
23
0
3
24
0
4
25
0
5
25
1
6
26
0
7
26
0
8
28
0
9
28
0
10
29
0
11
30
0
12
30
0
13
30
0
14
30
0
15
30
0
16
30
1
17
32
0
18
32
0
19
33
0
20
33
0
21
34
0
22
34
0
23
34
1
24
34
0
25
34
0

PAC EDAD EC
26
35 0
27
35 0
28
36 0
29
36 1
30
36 0
31
37 0
32
37 1
33
37 0
34
38 0
35
38 0
36
39 0
37
39 1
38
40 0
39
40 1
40
41 0
41
41 0
42
42 0
43
42 0
44
42 0
45
42 1
46
43 0
47
43 0
48
43 1
49
44 0
50
44 0

PAC EDAD EC
51
44
1
52
44
1
53
45
0
54
45
1
55
46
0
56
46
1
57
47
0
58
47
0
59
47
1
60
48
0
61
48
1
62
48
1
63
49
0
64
49
0
65
49
1
66
50
0
67
50
1
68
51
0
69
52
0
70
52
1
71
53
1
72
53
1
73
54
1
74
55
0
75
55
1

PAC EDAD EC
76 55 1
77 56 1
78 56 1
79 56 1
80 57 0
81 57 0
82 57 1
83 57 1
84 57 1
85 57 1
86 58 0
87 58 1
88 58 1
89 59 1
90 59 1
91 60 0
92 60 1
93 61 1
94 62 1
95 62 1
96 63 1
97 64 0
98 64 1
99 65 1
10 69 1
0

a) Presente la distribucin porcentual, segn EC, usando una tabla de distribucin


de frecuencias y una grfica de barras.
b) Construya una tabla de distribucin de frecuencias e histograma, para la
variable EDAD.
c) Segn la tabla obtenida en b) calcule la media aritmtica y la mediana.
6.- En un Universidad el promedio de notas parciales tiene una ponderacin del
60% y el examen un 40%. Si un alumno tiene las notas parciales 3.5, 4, 3.2, Qu
nota debera obtener en el examen para aprobar la asignatura?
7.- En un estudio realizado a un grupo de pacientes esquizofrnicos, se le registro
la siguiente informacin, para las variables indicadas:
Pac edad
1
2
3
4

32
20
30
34

imc
25.8
20.8
22.3
39.9

col
264
119
165
204

sexo
1
1
0
0

39

5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

33
20
26
40
27
21
31
35
36
38
27
22
20
25
19
32
31
36
30

29.4
28.1
36.6
25.9
23.4
37
30.1
23.7
26.6
35.3
26.3
23.2
20
29.4
35
24
34.7
34.8
29.4

179
155
244
210
130
229
210
162
185
213
153
94
160
229
193
168
176
165
147

1
1
1
1
1
1
0
1
1
0
1
1
1
1
1
0
1
1
1

Descripcin de las variables


imc indice.de.masa.corporal

peso
talla 2

El peso est medido en kilogramos y la talla en metros.


Col : colesterol medido en mgs%.
Sexo: sexo del paciente. 1= hombre, 0=mujer
a) Presente en una tabla de distribucin de frecuencias, la variable edad.
b) Categorice la variable imc, de acuerdo al siguiente criterio:
Normal, si imc < 25. Sobrepeso, si 25 imc < 30 . Obeso si imc 30
Presente en un cuadro estadstico, la distribucin de pacientes, por sexo,
segn la variable imc categorizada.
c) Categorice la variable col de acuerdo al siguiente criterio:
Normal, si col < 200, Alto, si col 200.
Presente en un cuadro estadstico, la distribucin de pacientes, por sexo,
segn la variable col categorizada.
8.- En una investigacin realizada en la Universidad, se entrevist a un grupo de
alumnos obtenindose lo siguiente:

40

Edad
18
N de
2
mujeres
N de
4
Hombres

19
4

20
5

21
7

22
10

23
8

24
6

25
4

26
3

27
2

28
2

29
1

12

14

13

12

10

a) Calcule la edad promedio para las mujeres, para los hombres, y para el
conjunto total de alumnos.
9.- Un profesor da al examen final de una asignatura 3 veces el peso que da a las
pruebas parciales. Si un alumno obtiene las notas parciales 3.5, 5, 4.6 y en el
examen un 4.8, Cul ser la nota final?
10.- En un curso que tiene 15 alumnas y 25 alumnos, la nota promedio de las
alumnas en Estadstica es 4.9 y el de los alumnos es 4.5. Calcule la nota promedio
de todo el curso.
11.- Se dispone de la siguiente informacin con relacin al nmero de das no
trabajados, por cada uno de los 40 empleados de la Empresa "Catulis Ltda.", en el
mes de marzo de 1999. Los datos son los siguientes:
2, 3, 3, 1, 0, 0, 3, 4, 5, 4, 3, 3, 3, 2, 4, 3, 6, 6, 5, 3, 4, 4, 3, 4, 0, 0, 0, 3, 3, 5, 2, 1, 2,
4, 3, 5, 4, 3, 3, 0.
a) Presente los datos en una tabla de frecuencias.
b) Calcule la media aritmtica e interprete.
c) Calcule la mediana e interprete.
12.- En una Empresa en que hay 60 mujeres y 140 hombres se sabe que el sueldo
promedio de las mujeres es de $180000 y el de los hombres de $ 200000 en el
mes de enero. En marzo se entrega un reajuste a cada uno de $ 15000, y en abril
un nuevo reajuste consistente en un 20 % de aumento en relacin a los sueldos
de marzo.
a) Calcule el sueldo promedio de todos los empleados en el mes de enero
b) Calcule el sueldo promedio de todos los empleados en el mes de marzo.
c) Calcule el sueldo promedio de todos los empleados en el mes de abril.
13. En una Empresa, se hace un estudio con relacin al sueldo de todos los
empleados. Se registra la siguiente informacin:
Sueldo( $)
N de empleados
De 100 a menos de 200
20
De 200 a menos de 300
35
De 300 a menos de 400
40
De 400 a menos de 500
15
De 500 a 600
a) Calcule e interprete el quintil 1 y el quintil 4.

10

41

b) Calcule e interprete el coeficiente de variacin, de la variable sueldo.


c) Si se aumentan los sueldos en $20000 a cada uno, calcular el coeficiente de
variacin.
d) Si una persona gana 580, calcule e interprete su puntaje estndar.

You might also like