You are on page 1of 15

ANLISIS EXPLORATORIO DE DATOS HELICPTEROS

DIEGO ALEJANDRO LARROTTA AMADO

EDWIN SANTIAGO PIMIENTO ORTEGN

INGRID JULIETH SIERRA RUIZ

UNIVERSIDAD SANTO TOMAS DE AQUINO

PROBABILIDAD Y ESTADSTICA

TUNJA

2016
ANLISIS EXPLORATORIO DE DATOS HELICPTEROS

DIEGO ALEJANDRO LARROTTA AMADO:2166422

EDWIN SANTIAGO PIMIENTO ORTEGN: 2141984

INGRID JULIETH SIERRA RUIZ: 2165583

EDGAR FELIPE RUIZ

UNIVERSIDAD SANTO TOMAS DE AQUINO

PROBABILIDAD Y ESTADSTICA

TUNJA

2016
CONTENIDO

INTRODUCCION.4

PLANTEAMIENTO Y FORMULACION DEL PROBLEMA.4

OBJETIVOS5

METODOLOGIA..6

ANALISIS DE RESULTADOS.......7-12

INTERVALOS DE CONFIANZA..12-13

CONCLUSIONES14
INTRODUCCIN

En el siguiente informe realizaremos el anlisis exploratorio de los datos obtenidos en la prctica


de los helicpteros hechos en papel bond y cartn cartulina los cuales se lanzaban de un segundo
piso y se deba tomar el respectivo tiempo de cada, el anlisis exploratorio lo realizaremos por
medio del programa R, el cual fue enseado en el curso de probabilidad y estadstica.

PLANTEMIENTO Y FORMULACION DEL PROBLEMA

Llevar hojas de papel de dos tipos, podra ser de papel bond y cartn cartulina, un cronometro,
unas tijeras, y una caja de clips. El factor es: tipo de papel (el nivel bajo es el papel normal y el
alto el otro tipo de papel). El grafico siguiente indica la forma en que se corta el papel para hacer
el helicptero de 5 x 10 cm. La lnea continua representa cortes en el papel y la lnea punteada
indica doblez, la parte superior sern las aspas y el resto conforma el cuerpo del helicptero, en
su parte inferior se dobla en la misma direccin del papel.

Nota: formar grupos de 4 estudiantes, cada grupo har 40 helicpteros, con 20 rplicas por
tratamiento (tipo de papel). Se recomienda que lancen los helicpteros desde suficiente altura al
menos 3 metros. Recordarles que el orden de la experimentacin es aleatorio.

4
OBJETIVO GENERAL

Realizar el anlisis exploratorio de los datos en la prctica del helicptero y determinar con cual
tipo de material (bond, cartulina) dura ms en vuelo.

OBJETIVO ESPECIFICO

Realizar los helicpteros en los materiales recomendados y tomarle su respectivo tiempo.

Identificar la varianza la media y la mediana para los datos obtenidos.

Calcular los intervalos de confianza para los datos recolectados utilizando la distribucin t
student.

5
METODOLOGA

Para la elaboracin de los helicpteros debemos tener papeles en este caso para esta prctica se
utilizaron de dos tipos, papel bond y cartn cartulina, tijeras o bistur y ganchos clips. se debe
realizar un helicptero con estos dos tipos de papeles, modelo de 5 x 10 cm. Se debe recortar
respecto al modelo presentado por el profesor los cuales trae de igual forma lneas punteadas que
indican el doblez. En la parte superior del helicptero se encuentra las hlices y la parte inferior
su cuerpo esta sujetado por un clip se lanza desde una altura determinada que en este caso es de
3.5 metros de altura aproximadamente, se lanza primero los 20 helicpteros de bond y 20 de
cartulina, lanzados uno por uno y se va tomando el tiempo de cada uno al llegar al suelo. Para
determinar la variabilidad en los resultados y ordenndolos en una lista ya que la cual es la que
nos va a dar la probabilidad de saber que helicpteros caen ms rpido, ya que haciendo un
anlisis de resultados podemos decir que si no estn bien armados los helicpteros caen ms
rpido que uno que este bien cortado que cae ms despacio.

6
ANALISIS DE RESULTADOS

MEDIA :

VARIANZA:

DESVIACION ESTANDAR:

7
TABLA.1: DE MEDIDAS DE CENTRALIDAD Y VARIABILIDAD PARA LOS 40 DATOS
TOMADOS.

medidas de centralidad TOTAL DE DATOS


PROMEDIO 2.4115
VARIANZA 0.5089003
MEDIANA 2.205
DESVIACION 0.7133725
ESTANDAR

La tabla muestra los valores que se ubican en la parte central del conjunto de datos en su
totalidad, forma como los datos pueden condensarse en un solo valor central alrededor de todos
los datos mustrales que se distribuyen.

El promedio o media representa el valor ms representativo (2.4115) del conjunto de los 40


helicpteros, que permite establecer un equilibrio. La varianza representa la esperanza del
cuadrado de la desviacin de cada uno de los tiempos respecto a su media (0.508 aprx.). La
mediana es el valor central que divide a los datos en dos partes iguales (2.205).

GRAFICA.1: HISTOGRAMA DE LOS 40 HELICOPTEROS

Histogram of helicopter$tiempo
12
10
F re q u e n c y

8
6
4
2
0

1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5

helicopter$tiempo
8

Podemos observar que en el rango de tiempo (1.5-2.0 segundos) hay una mayor frecuencia es
decir la moda, y podemos decir que su mediana y su moda se encuentran a su derecha esto quiere
decir que el histograma presenta una asimetra positiva.

TABLA.2: DE MEDIDAS DE CETRALIDAD Y VARIANZA PARA LOS PRIMEROS 20


DATOS (PAPEL BOND).

medidas de centralidad TIEMPOS DE BOND


PROMEDIO 2.994
VARIANZA 0.2635516
MEDIANA 2.99
DESVIACION 0.5133727
ESTANDAR

El promedio o media representa el valor ms representativo (2.994) del conjunto de los 20


helicpteros hechos en papel bond, que permite establecer un equilibrio. La varianza

representa la esperanza del cuadrado de la desviacin de cada uno de los tiempos respecto a su
media (0.264 aprx.). La mediana es el valor central que divide a los datos en dos partes iguales
(2.99).

GRAFICA.2: HISTOGRAMA PARA LOS PRIMEROS 20 HELICOPTEROS HECHOS


EN PAPEL BOND.

Histogram of helicopter[1:20, 1]
7
6
5
Frequency

4
3
2
1
0

2.0 2.5 3.0 3.5 4.0 4.5

helicopter[1:20, 1]
9

Podemos suponer que, es un histograma con un promedio, una mediana y una media iguales,
presentara una simetra, pero al observar los valores de estos datos no coinciden por lo que
vemos que tambin presenta una asimetra positiva.

TABLA.3: DE MEDIDAS DE CETRALIDAD Y VARIANZA PARA LOS PRIMEROS 20


DATOS (CARTULINA).

medidas de centralidad TIEMPOS DE


CARTULINA
PROMEDIO 1.829
VARIANZA 0.06670421
MEDIANA 1.78
DESVIACION 0.258271
ESTANDAR

El promedio o media representa el valor ms representativo (1.829) del conjunto de los ltimos
20 helicpteros hechos en cartulina, que permite establecer un equilibrio. La varianza representa
la esperanza del cuadrado de la desviacin de cada uno de los tiempos respecto a su media (0.067
aprx.). La mediana es el valor central que divide a los datos en dos partes iguales (1.78).
Notamos que el promedio, la varianza y la mediana son menores que los anteriores, y
concluimos que estos helicpteros duraron menos tiempo volando

GRAFICA.2: HISTOGRAMA PARA LOS PRIMEROS 20 HELICOPTEROS HECHOS


EN CARTULINA.

Histogram of helicopter[21:40, 1]
8
6
Frequency

4
2
0

1.4 1.6 1.8 2.0 2.2 2.4

helicopter[21:40, 1]
10

La moda de este histograma de los datos de la cartulina tambin se encuentra a la izquierda de la


mediana y la media. Esto nos dice que tambin presenta una asimetra positiva.

TABLA.4: MEDIAS DE POSICION DE TODOS LOS HELICOPTEROS.

TOTAL DE DATOS
MIN. 1.4
Q1 1.78
MEDIANA O Q2 2.205
MEDIA 2.412
Q3 2.945
MX. 4.17

En esta tabla podemos observar las posiciones ms relevantes de la totalidad de los datos como
lo son: su valor mximo y mnimo, las posiciones de los tres cuartiles ya que son importantes a la
hora de ubicar los elementos del diagrama de caja y bigotes.
11

GRAFICA.4: UBICACIN DE TODOS LOS TIEMPOS DE LOS HELICOPTEROS

BOND

CARTULINA

BOND

1.5 2.5 3.5 1.5 2.0 2.5 3.0 3.5 4.0

tiempo
CARTULINA
4.0

4.0

Aqu podemos notar que los tiempos en el papel bond son mas altos que los de cartulina y
podemos ver sus respectivas medias tambien notamos que son mas parecidos los valores de los
3.5

3.5

tiempos que hicieron los helicopteros de cartulina.


3.0

3.0

GRAFICAS.5 Y 6: DIAGRAMAS DE CAJA Y BIGOTES


1.5 2.5 3.5 1.5 2.0 2.5 3.0
2.5

2.5

tiempo
2.0

2.0
1.5

1.5
4.0

4.0
fac1
3.5

3.5

BOND CARTULINA
3.0

3.0
2.5

2.5
2.0

2.0
1.5

1.5

3.5 1.5 2.0 2.5 3.0 3.5 4.0 fac1


BOND CARTULINA
tiempo
tipo
4.0

En esta grafica se hace necesario calcular los valores atpicos para saber si se encuentran en
nuestra toma de datos. Para esto debemos calcular el rango intercuartil.
3.5
3.0
2.5
2.0
12

rango 1.165
intercuartil
valores atpicos
En este caso vemos que los valores que hallamos no interfieren
leves
Min. 0.0325 con nuestro rango de nuestros datos por consiguiente no
mx. 4.6925 tenemos ningn dato atpico.

Para entender esta grafica debemos conocer que significa cada divisin:

La primera recta vertical corresponde al valor mnimo de nuestros datos: 1.4


La siguiente corresponde a primer cuartil Q1: 1.78
La que divisin de la caja se denomina mediana o Q2: 2.205
El tercer cuartil Q3 es donde finaliza el diagrama de caja: 2.945
Por ltimo, se encuentra el valor mximo de nuestros datos: 4.17

3.5 GRAFICA.7:
1.5 2.0SE 2.5
ILUSTRAN
3.0 3.5LOS PROMEDIOS DE CADA UNO DE LOS
4.0
MATERIALES Y A TAMBIEN MUESTRA EL PROMEDIO TOTAL
mpo tiempo
4.0
3.5
mean of Y

3.0

BOND
2.5
2.0

CARTULINA
1.5

fac1
ARTULINA

Main Factor

En esta grafica podemos observar los promedios totales y los promedios de los helicpteros
dependiendo su material, la lnea horizontal nos representa el promedio de los 4 helicpteros
mientras que la lnea vertical nos representa los promedio de los 20 de bond y los 2 de cartulina.

13

INTERVALOS DE CONFIANZA
promedi desviacin total varianza
o estndar
los 40 helicop. 2,4115 0,713372483 40 0,5089003
papel 2,994 0,513372769 20 0,2635516
cartulina 1,829 0,258271582 20 0,0667042
1

NOTA (Para valores de muestras pequeas se usan la tabla t student).

CASO II 80% 85% 90% 95% 99%


0.8 0.85 0.9 0.95 0.99
0.2 0.15 0.1 0.05 0.01
/2 0.1 0.075 0.05 0.025 0.005
n=20-1 19 19 19 19 19
t=1-/2 0.9 0.925 0.95 0.975 0.995
segn la tabla 3.883 2.674 2.205 2.2665 2.861

INTERVALOS DE CONFIANZA PARA LOS HELICOPTEROS DE BOND

PAPEL 80% 85% 90% 95% 99%


IC=+(t) 3,439743 3,300958196 3,247119 3,254179 3,322424
(var)/sqrt(n) 71 98 79 61
IC=-(t) 2,548256 2,687041804 2,740880 2,733820 2,665575
(var)/sqrt(n) 29 02 21 39

INTERVALOS DE CONFIANZA PARA LOS HELICOPTEROS DE CARTULINA

CARTULINA 80% 85% 90% 95% 99%


IC=+(t) 2,053248 1,983426926 1,956341 1,959893 1,994226
(var)/sqrt(n) 23 58 28 42
IC=-(t) 1,604751 1,674573074 1,701658 1,698106 1,663773
(var)/sqrt(n) 77 42 72 58

Como se explic en clase, hicimos los clculos del grado de libertad y como en R tenamos los
datos de la varianza y la media, sacamos los intervalos de confianza indicados desde el 80%
hasta el 99% cada t los hallamos interpolando o ya se encontraban en la tabla de distribucin T-
student, cada intervalo que hallamos nos dice que el nivel de confianza aumenta cada vez ms
hasta el 99%.

14
CONCLUSIONES

1. Podemos concluir que el anlisis exploratorio nos proporciona mtodos sencillos para
organizar y preparar los datos.

2. Gracias al anlisis exploratorio de datos en R sacamos las medidas de centralidad, posicin y


variabilidad.

3. Los tiempos en el papel bond son ms altos que los de cartulina y podemos ver sus respectivas
medias tambin notamos que son ms parecidos los valores de los tiempos que hicieron los
helicpteros de cartulina.

4. Y por ltimo concluimos que los helicpteros de papel bond duraron ms tiempo que los
helicpteros de cartulina.

15

You might also like