You are on page 1of 4

UNIVERSIDAD NACIONAL DE COLOMBIA, BOGOT D.C.

Parcial Estadstica Descriptiva


David Santiago Daza Quiroga Cdigo: 25441220

I. S USTENTE O REFUTE LAS SIGUIENTES AFIRMACIONES : Estas son las varianzas para X y Y respectivamente, y con
A. El mtodo cientfico utiliza herramientas descriptivas ellas definir la varianza para Z:
Para entender la funcin de la estadstica como el apoyo n n
P P
del mtodo cientfico, primero se debe entender el significado (Xi + X)2 (Yi + Y )2
de mtodo cientfico. SZ2 = i=1
+ i=1
n1 n1
Mtodo cientfico: Son los procesos sistematizados de
un conjunto basados en ciencia para darle explicaciones a
fenmenos y las caractersticas que los rigen. SZ2 = SX+Y
2 2
= SX + SY2

Ahora la estadstica descriptiva es una herramienta que Una manera ms fcil de ver es a travs de las propiedades
primordial en la observacin del fenmeno a describir; con de la varianza para variables dependientes e independientes.
ello obtener datos y crear hiptesis basadas en los resultados,
adems de ello provee tambin la veracidad en los experimen- Para variables dependientes se tiene que:
tos realizados.

V (X) = E(X 2 ) E(X)2 = E((X E(X))2 )

V (Z) = V (X + Y ) = E((X + Y )2 ) E(X + Y )2 =

= E(X 2 + 2XY + Y 2 ) E(X 2 ) 2E(X)E(Y ) E(Y )2 =

= E(X 2 )E(X)2 +E(Y 2 )E(Y 2 )+2(E(XY )E(X)E(Y )) =

= V (X) + V (Y ) + 2(E(XY ) E(X)E(Y ))


En la anterior ilustracin es una forma simplificada de como
una serie de pasos puede definir el mtodo cientfico, donde en Siendo E(X), la esperanza de x.
la seccin de observacin se utiliza de las teoras estadsticas
para darle robustez a la hiptesis y as disear un experimento Esta propiedad se cumple en el caso de que las variables
con el fin de obtener la aprobacin, en este caso datos que se sean dependientes; ahora por propiedades de las variables
acomodan lo ms cercano al fenmeno natural estudiado. independientes se tiene que:

B. Si se miden dos variables cuantitativas, X y Y , en una


muestra y se define la variable Z = X + Y , entonces la E(XY ) = E(X)E(Y )
varianza de Z es igual a la suma de las varianzas de X y
Y , es decir, s2Z = s2X + s2Y . Por ende:
Siendo X y Y dos variables independientes una de la otra
con media aritmtica X y Y respectivamente sus varianzas
sern: V (Z) = V (X+Y ) = V (X)+V (Y )+2(E(X)E(Y )E(X)E(Y ))
n
P n
P
(Xi + X)2 (Yi + Y )2
2 i=1 i=1
SX = , SY2 = V (Z) = V (X + Y ) = V (X) + V (Y )
n1 n1
UNIVERSIDAD NACIONAL DE COLOMBIA, BOGOT D.C. 2

II. PARA TRES GRUPOS DE 150, 200 Y 250 VIVIENDAS SE


OBTUVIERON LOS COEFICIENTES DE VARIACIN DEL
CONSUMO DE ENERGA EN UN MES DETERMINADO , SIENDO
SUS VALORES DE 40 %, 20 % Y 30 % RESPECTIVAMENTE .
S SE SABE QUE EL CONSUMO PROMEDIO EN CADA UNA
DE LAS TRES MUESTRAS DE VIVIENDAS , ES EL MISMO ,
CUL SER EL COEFICIENTE DE VARIACIN DEL TOTAL DE
LAS 600 VIVIENDAS ? E L COEFICIENTE DE VARIACIN SE
DEFINE COMO EL COCIENTE ENTRE LA DESVIACIN
ESTNDAR Y LA MEDIA DE LOS DATOS
MULTIPLICADO POR
S2
100 % CV (X) = X
III. L A SIGUIENTE ES LA TABLA DE FRECUENCIAS DE LAS
VENTAS DIARIAS ( EN MILES DE PESOS ) DE UNA INDUSTRIA
FARMACUTICA DE B OGOT : Histograma de ventas
Complete la tabla.

Ventas ni Ni hi Hi
800 - 1000 6 6 0,12 0,12
1000 - 1200 9 15 0,18 0,3
1200 - 1400 20 35 0,4 0,7
1400 - 1600 10 45 0,2 0,9
1600 - 1800 5 50 0,1 1

Para esta parte del punto solo tenemos unos datos (en rojo)
y con ellos reconstruir la tabla de frecuencias y as obtener
los datos necesarios para plasmar los histogramas.

Obtener la tabla de frecuencias se puede obtener a partir Diagrama de Ojiva


del simple conocimiento de que Hi es la suma acumulada
para hi y con ello se puede llenar mitad de la tabla, con ello IV. C ONSTRUIR
UNA DISTRIBUCIN DE FRECUENCIAS
partir a la siguiente mitad. AGRUPADA PARA LOS SIGUIENTES DATOS . H ALLAR LA
LONGITUD DE CADA INTERVALO Y EL PUNTO MEDIO
Por ende se sabe que el primer dato H1 es igual al dato ( CONOCIDOCOMO LA MARCA DE CLASE ); ADICIONAR
h1 . GRFICAS CORRESPONDIENTES . 67, 63, 64, 57, 56, 55, 53,
53, 54, 54, 45, 45, 46, 47, 37, 23, 34, 44, 27, 44, 45, 34,
Ahora la diferencia entre H2 y h2 da igual a H1 que es 34, 15, 23, 43, 16, 44, 36, 36, 35, 37, 24, 24, 14, 43, 37,
igual a h1 . 27, 36, 26, 25, 36, 26, 5, 44, 13, 33, 33, 17, 33.
Para obtener la longitud de los intervalos se debe conocer
H1 = h1 = H2 h2 = 0, 3 0, 18 = 0, 12 la longitud del menor al mayor dato:
Igual para H3 y H5 : 67 5 = 62

H3 = H4 h4 = 0, 9 0, 2 = 0, 7 Con la regla de Sturges se obtiene un aproximado a 6,64


aproximando a 7, pero la divisin de 62 y 7 da un nmero
decimal no deseado; aunque 62 es un nmero muy cercano
h5 = H5 H4 = 1 0, 9 = 0, 1 a 60, se puede decir de manera aleatoria que la divisin de
intervalos es 6 donde:
Para hallar la siguiente mitad de la tabla ser igual a:
62/6 = 10, 3
35 Hi
Ni = Un nmero ms razonable y fcil de trabajar.
0, 7
Datos F. A. F. R. F. A. A. F. R. A.
Con esta frmula se halla la columna de Ni . [5-15,3) 4 4 0,08 0,08
[15,3-25,6) 7 11 0,14 0,22
Ahora se puede armar la primera columna. [25,6-36) 11 22 0,22 0,44
[36-46,3) 17 39 0,34 0,78
[46,3-56,6) 7 46 0,14 0,92
Con la informacin de la tabla, construya el histograma [56,6-67] 4 50 0,08 1
de frecuencias relativas y el diagrama de ojiva. Tabla de frecuencias
UNIVERSIDAD NACIONAL DE COLOMBIA, BOGOT D.C. 3

Datos agrupados en orden de menor a mayor: Altura (en cm)


Presencia de la enfermedad (S/No)
5, 13, 14, 15, 16, 17, 23, 23, 24, 24, 25, 26, 26, 27, 27, Presencia y recuperacin de la enfermedad anteriormente
33, 33, 33, 34, 34, 34, 35, 36, 36, 36, 36, 37, 37, 37, 43, 43, (S/No)
44, 44, 44, 44, 45, 45, 45, 46, 47, 53, 53, 54, 54, 55, 56, 57, Proporcin de tejido pulmonar infectado
63, 64, 67. Menor grado de consanguinidad con los familiares que
contraen la enfermedad
con los datos ordenados, se debe obtener el valor de la Frecuencia de consumo de cafeina (Nunca/Casi nunca/A
Mediana, en las posiciones; (n/2) y ((n + 1)/2), para n = 50. veces/Frecuentemente)
siendo en este caso los datos de las posiciones 25 y 26, que Frecuencia con la que se fuma (Nunca/Casi nunca/A
en este caso su valor es 36. veces/Frecuentemente)
Edad desde la que se empez a fumar (en aos o no
e = X(n/2) + X((n+1)/2) = 36 + 36 = 36
X aplica)
2 2 ltimo periodo de tiempo de abstinencia a fumar (en das
Diagramas o no aplica)
Clasifique cada una de las variables observadas en el estudio.
1) Nominal Cualitativa
2) Nominal Cualitativa
3) Ordinal Cualitativa
4) Nominal Cualitativa
5) Nominal Cualitativa
6) Continua Cuantitativa
7) Continua Cuantitativa
8) Continua Cuantitativa
9) Ordinal Cualitativa
10) Ordinal Cualitativa
11) Continua Cuantitativa
Histograma punto 4. 12) Ordinal Cualitativa
13) Nominal Cualitativa
14) Nominal Cualitativa
15) Discreta
16) Discreta

VI. M EDIANTE LOS DATOS QUE APARECEN EN LA TABLA


CORRESPONDIENTES AL NUMERO DE ESTUDIANTES
GRADUADOS POR CARRERA Y SEXO , RESPONDER A LAS
SIGUIENTES PREGUNTAS

Carrera Hombres Mujeres


Administracin de Empresas 400 100
Educacin 50 150
Humanidades 150 200
Biolgicas 250 100
Ojiva punto 4. Ciencias Sociales 200 200

De todos los estudiantes que se gradan en cada rea


V. E N UN ESTUDIO CLNICO QUE PRETENDA IDENTIFICAR
acadmica, Cul es el porcentaje de mujeres?
FACTORES DE RIESGO PARA CONTRAER CNCER DE
PULMN , SE MIDIERON LAS SIGUIENTES VARIABLES EN
Se hallan la cantidad de estudiantes que se gradan por cada
UNA MUESTRA DE PACIENTES DE DIFERENTES
rea, y con el dato de mujeres graduadas para cada una, se
HOSPITALES :
halla su porcentaje.

Nombre Carrera Total Graduados Porcentaje Mujeres [%]


Tipo de documento de identidad (RC/TI/CC/CE) Administracin de Empresas 500 20
Educacin 200 75
Nmero del documento de identidad Humanidades 350 57,14
Sexo (Hombre/Mujer) Biolgicas 350 28,57
Lugar de nacimiento (Segn divisin poltico- Ciencias Sociales 400 50
administrativa)
Edad (en aos) Considerando nicamente el sexo masculino, en qu
Peso (en Kg) proporcin est distribuido en cada rea acadmica?
UNIVERSIDAD NACIONAL DE COLOMBIA, BOGOT D.C. 4

Para este caso se tiene en cuenta cuanto es el aporte de cada


257
carrera a la totalidad de graduados; para el caso masculino su X= = 6, 425
total son 1050 graduados. lado femenino son 750. 40
Esto signifca que la tendencia a sacar un valor ms
Carrera Proporcin Hombres [%] probable sea 6 7, lo cual se refleja en la tabla y su
Administracin de Empresas 38,09 respectivo histogrma.
Educacin 4,76
Humanidades 14,28
Biolgicas 23,81 Varianza:
Ciencias Sociales 19,06
P
n
(ni X)2
Considerando solo el sexo femenino, en qu proporcin 2
S = i=1
= 6, 6545
est distribuido en cada rea? 39
Del lado femenino sern 750. Desviacin estandar:
Carrera Proporcin Mujeres [%] q
Administracin de Empresas 13,33 S= S2 = 6, 6545 = 2, 5796
Educacin 20
Humanidades 26,67 Para los datos obtenidos, puede verse que su Moda es 2.
Biolgicas 13,33
Ciencias Sociales 26,67

De todos los estudiantes que se gradan en las cinco


reas, qu porcentaje es masculino?, que porcentaje es
femenino
Se dividen la totalidad de hombres, y de mujeres por la
totalidad de graduados, sea 1800.
1050
M asculino = 100% = 58, 34
1800
750
F emenino = 100% = 41, 66
1800
VII. T OMAR UN PAR DE DADOS , LANZARLOS 40 VECES Y
ANOTAR LA SUMA DE LOS NMEROS QUE APARECEN EN LA
CARA SUPERIOR DE LOS DOS DADOS EN CADA
LANZAMIENTO . L UEGO REALIZAR ESTADSTICA
DESCRIPTIVA A LOS DATOS OBTENIDOS .
Datos obtenidos:

Nmero ni Ni hi Hi
2 3 3 0,075 0,075
3 3 6 0,075 0,15
4 1 7 0,025 0,175
5 6 13 0,15 0,325
6 8 21 0,2 0,525
7 8 29 0,2 0,725
8 4 33 0,1 0,825
9 2 35 0,05 0,875
10 2 37 0,05 0,925
11 2 39 0,05 0,975
12 1 40 0,025 1

Promedio de los datos:


n
P
ni N u
meroi
i=1
X=
n
Siendo N u meroi la representacin de la columna Nmero
y ni la frecuencia absoluta.

You might also like