You are on page 1of 9

ESTADSTICA (EDB)

Ing. Gustavo Carrasco

Alumnos:
Adriano Arevalo, Joel Jess
Adrianzn Salinas, Diandra Arleen
Castillo Crdenas, Angie Thas
Huamn Aguirre, Luis Alberto
Talledo Lagos, Csar Frank

Seccin: A

24-03-2016
INFORME DE LABORATORIO

ESTADSTICA DESCRIPTIVA UNIVARIANTE


El fichero Datos_EDB_2015_II.xlsx tiene datos de un conjunto de alumnos de ingeniera de segundo ao de la UDEP.

a. La variable Tiempo de construccin son los segundos que tardaron en hacer un avin de papel. Haz un anlisis
descriptivo, numrico y grfico resaltando los aspectos ms relevantes. Si lo consideras pertinente, elimina
aquellas observaciones que sean claramente atpicas y compara el anlisis con y sin estas observaciones.
Justifica tus resultados.

El tiempo que tardaron los alumnos de estadstica en construir el avin de papel, puede ser influenciado por
diversos factores tales como la habilidad de cada uno, el material del papel y el diseo que eligi cada alumno
para la construccin de su avin. Adems, se debe tener en cuenta que puede existir la posibilidad de un margen
de error en la medida del tiempo, ya que pudo haberse demorado en iniciarlo o detenerlo al finalizar.

Las grficas que se han considerado para este problema son un histograma y una ojiva.
La siguiente grfica es un histograma en el que se muestra una determinada cantidad de alumnos y el intervalo
de tiempo que tardan en la construccin de su avin.

Por el histograma que presentamos, podemos


observar que el tiempo mnimo de construccin
es 11 y el mximo es 195, por lo tanto, el rango
es 184. Otro dato muy importante y visible es la
moda, que tiene un valor de 60, lo cual significa
que la mayora de alumnos tardan entre 30 y 65
segundos en construir su avin. Tenemos que el
tiempo promedio es 57.04, mientras que el valor
de la mediana es 47. Y esto se puede deducir
claramente de la grfica, la media se desplaza
hacia la cola mientras que la mediana es poco
sensible a las asimetras. Se puede comprobar
que la grfica tiene una asimetra positiva puesto
que el coeficiente de asimetra es mayor a cero.
Tambin se puede observar que todos los datos
no estn concentrados alrededor de un solo
valor, no en su totalidad, estn cercanos una
Histograma de TIEMPO DE CONSTRUCCIN gran mayora, pero no todos. Esta dispersin la
100 calculamos con la frmula de varianza, la que
nos da un resultado de 1356.8. No presenta
80
valores atpicos, por lo tanto, no es necesario un
Porcentaje acumulado

60
anlisis para ver en que se altera nuestro
grfico.
40

La grafica que se presenta en la parte inferior


20
izquierda, muestra los percentiles para cada
0
tiempo de construccin.
30 60 90 120 150 180
TIEMPO DE CONSTRUCCIN
b. La variable Tiempo de vuelo tiene el tiempo que el avin de papel descrito arriba ha estado volando en una
prueba en el exterior. Haz un anlisis similar al del apartado anterior.

Presentar varios factores que pueden influir en el tiempo de vuelo:


*El diseo del avin, al hacerlo ms aerodinmico favorecer a que el tiempo aumente.
*El tipo de papel, hay papeles que son ms ligeros que otros, por ejemplo, el papel peridico es ms ligero que un
papel bond normal que solemos usar diariamente.
*La fuerza con la que el alumno lanzar el avin.
*El aire, puede que justo en el momento del lanzamiento haya viento que lo favorezca.
*La direccin hacia donde es lanzado, si se lanza a favor del viento, su tiempo ser mayor, mientras si es en
contra, ser menor.
El siguiente histograma muestra el tiempo de vuelo de los aviones de cada alumno, as como la frecuencia de
cada tiempo de vuelo.

Histograma de TIEMPO DE VUELO De la grfica se puede observar que el valor


25
mnimo es 1.5 y el valor mximo es 6. La moda se
20
encuentra en el intervalo de 1.5 a 2.25, con un valor
de 24 aproximadamente, lo cual quiere decir que el
15 tiempo de vuelo de 24 alumnos se encuentra ente
Frecuencia

1.5 y 2.25. El vuelo promedio es de 2.9508, mientras


que la mediana es de 2.78, nos indica que la
10

5
distribucin presenta una asimetra positiva, lo que
hace que la media se desplace hacia la cola como
0
1.50 2.25 3.00 3.75 4.50 5.25 6.00
se observa en la grfica. Adems, el coeficiente de
TIEMPO DE VUELO asimetra confirma que es positiva, dado que el
valor es positivo, pero no tanto aproximadamente
Histograma de TIEMPO DE VUELO
0.9008. El valor de la varianza es igual a 0.8114, lo
100
que indica un poco dispersin, como podemos ver
tambin en el grafico en donde los valores se
80 mantienen bastante cercanos especialmente en la
Porcentaje acumulado

moda.
60

40 La siguiente grfica (inferior izquierda) es un


histograma que muestra los percentiles para cada
20
tiempo de vuelo.
0
No presenta valores atpicos por lo que no es
1.50 2.25 3.00 3.75
TIEMPO DE VUELO
4.50 5.25 6.00
necesario aplicar otro histograma que los
grafiquen.

c. Cul es el percentil 30 del dinero gastado en ocio el fin de semana?

Histograma de DINERO FIN DE SEMANA


100
100 96.3351
95.8115 97.3822
96.3351 97.3822
91.623
86.3874
93.7173
92.6702
91.623
93.7173
Segn la grfica
84.2932
76.9634
(ojiva), podemos observar que
80
el percentil 30 pertenece a la
Porcentaje acumulado

71.2042
69.6335

variable 14,86 15; es decir


60
52.8796
que el 30% de los alumnos
43.4555
gasta menos o igual que s/.15
40 35.0785
en un fin de semana.
24.0838

20
13.6126

0
0 30 60 90 120 150 180
DINERO FIN DE SEMANA
*Observacin: Al calcular el percentil 30 con la opcin Calculadora , sta
nos dio como resultado datos aproximados. As la variable que corresponde
sera S/.20.

d. Cunto se gastan en ocio por trmino medio? Hasta cunto es el gasto de la mitad de los alumnos que menos
gastan? Qu cantidad de gasto slo es superada por el 5% de los alumnos?

El gasto en ocio por trmino medio, conduce a buscar la media aritmtica de los datos, la cual corresponde a s/.
49,06.
El gasto mximo de la mitad de los alumnos que menos gastan induce a pensar que se debe hallar la mediana, la
cual corresponde a s/.40.

Histograma de DINERO FIN DE SEMANA


50
47

40
36

31
30
Frecuencia

25

19
20

10
10
4 4 5
3 3 2
1 1
0
0 30 60 90 120 150 180
DINERO FIN DE SEMANA
*Observacin: La grfica asimtrica lleva a concluir que los datos giran en torno a la variable 45.
La media supera a la mediana en s/.9.06, debido a la existencia de datos atpicos ubicado en el lado derecho de la grfica.

Segn la Ojiva, la
cantidad de gasto que es
superada por el 5% de
los alumnos es s/.
146,66, puesto que el
95% de ellos gasta
menos o igual que dicha
cantidad.

Observacin: Segn la funcin Calculadora la cantidad de gasto superada


por el 5% de alumnos es s/.150, esto ocurre debido a la aproximacin de
dicha funcin.

e. Qu proporcin de chicas hay en este grupo?

La grfica indica que 7 alumnos representan el 5% de la poblacin, de los cuales 2 son mujeres y 5 hombres; por lo
2
tanto, la proporcin de mujeres que gastan ms de s/. 150 aproximadamente, es de 7 de dicha muestra.
f. Analiza la posible multimodalidad de las variables peso y altura. Para ellos, realiza histogramas con diferente
nmero de clases. Analiza despus esta variable para chicos (sexo=1) y chicas (chicas =0) por separado. Qu
puede concluirse?

18 INTERVALOS 12 INTERVALOS

Histograma de ALTURA Histograma de ALTURA


40

40

30

30
Frecuencia

Frecuencia
20
20

10
10

0
150.0 157.5 165.0 172.5 180.0 187.5 0
144 152 160 168 176 184
ALTURA
ALTURA

30 INTERVALOS

Histograma de ALTURA
30
Como se puede apreciar, para poder analizar la multimodalidad
de la variable altura, hemos utilizado la ayuda de 3
25
histogramas distintos y en cada uno la cantidad de intervalos
20 ha sido diferente. Podemos apreciar que a medida que
nuestros intervalos aumentan, podemos apreciar con mejor
Frecuencia

15
eficacia la modalidad de nuestro histograma, para el caso de
10 nuestra variable altura estaremos tratando con un histograma
5
con unimodalidad.

0
144 150 156 162 168 174 180 186
ALTURA

g. Haz una tabla de frecuencias y un diagrama de barras de las edades de estos alumnos.

Grfica de EDAD
Cuenta de variables discretas: EDAD 70

60

EDAD Conteo Porcentaje CntAcum PrcAcum


50
17 10 5,24 10 5,24
18 67 35,08 77 40,31 40
Conteo

19 54 28,27 131 68,59


20 28 14,66 159 83,25 30

21 14 7,33 173 90,58


20
22 12 6,28 185 96,86
23 5 2,62 190 99,48 10
24 1 0,52 191 100,00
N= 191 0
17 18 19 20 21 22 23 24
EDAD
h. Haz el grfico de la distribucin de frecuencias relativa acumulada de las calificaciones de ICS y de QG1. En cul
es ms probable obtener ms de 12 puntos?

ICS PrcAcum
5 0,53
7 1,06
9 2,66
10 4,79
11 21,28
12 40,43
13 59,04
14 73,94
15 82,98
16 89,36
17 96,28
18 98,40
19 100,00

QG1 PrcAcum
5 1,06
7 3,70
8 5,82
9 8,47
10 13,23
11 37,04
12 55,56
13 72,49
14 85,71
15 88,89
16 94,71
17 97,35
18 100,00

Conclusin:

Segn las grficas observadas, en ICS aproximadamente el 40,43% de alumnos obtuvo una nota menor a 12, es decir, el
59,75% obtuvo mas de 12 puntos; mientras que la grfica de QG1, aproxidamente el 36.69% de alumnos obtuvo menos de
12 puntos, por lo que el 63.31% superararon los 12 puntos. En resumen, el curso en el cual era ms probable obtener ms
de 12 puntos es QG1.
LA RECTA DE REGRESIN
El fichero AlumnosIndustriales.txt tiene varias variables de un conjunto de 95 estudiantes de primer curso de Ingeniera
Industrial. Se quiere saber:

A. Es razonable intentar predecir la altura de una persona de esta muestra a partir de su peso?

No sera razonable predecir la altura de una persona a partir de su peso, ya que todas las personas son diferentes en
aspecto fsico, y segn la gentica puede haber una persona con baja estatura y sobrepeso, al mismo tiempo puede existir
otra con baja estatura y bajo peso, lo que generara un error, tambin depender de la condicin fsica de la poblacin
(sobrepeso, normal, bajo de lo normal) , si la poblacin analizada es de una sola condicin fsica, se podr hacer una
prediccin ms acertada y el error producido ser menor, lo que no suceder si hacemos una prediccin con una poblacin
variada.

B. Utilizando la recta de regresin adecuada: qu altura se prev para una persona que pese 70 kilos?

La grfica mostrada nos


predice la altura teniendo
como variable el peso.
Observando esta, se
concluye que la altura de
una persona de 70 kg es de
176cm.

C. Utilizando la recta de regresin adecuada: qu peso se prev para una persona que mida 175 cm?

La grfica nos predice el


peso teniendo como variable
la altura.
A partir de ella, una persona
que mide 175 cm pesar
68kg.
D. Una persona que pese 72 kilos y mida 185 cm puede considerarse alta, baja o normal?

Tomando en cuenta la grfica, todos los valores normales de peso y altura forman la recta de
regresin. Los que se encuentren por encima y debajo de la recta se refiere a que esta alta o
baja respectivamente, ya sea de peso o altura. En este caso para un persona que pesa 72 kg y
mide 185 cm, es considerada baja de peso (grfica peso vs altura) y alta (grfica altura vs peso).

E. Analiza los residuos de los modelos

De acuerdo a este caso y utilizando el grfico de residuos, podemos concluir que es razonable predecir la altura a partir
del peso o viceversa, ya que los datos guardan una linealidad al estar dispersos y no tener un orden o una tendencia, tambin
se puede observar uno o dos valores muy alejados, que podran considerarse atpicos, pero no se puede afirmar eso hasta
evaluarlos.

You might also like