You are on page 1of 8

ESTADISTICA Y PROBAILIDADES

LABORATORIO

ANALISIS EXPLORATORIO DE DATOS


Ing. William Len Velsquez wjleonv@yahoo.com SEM 2012-2

05

MEDIDAS DE POSICIN YANLISIS EXPLORATORIO DE DATOS


Los estadsticos descriptivos mas comnmente utilizados han sido la media y la desviacin estndar. Sin embargo, el uso automtico de estos ndices no es muy aconsejable. Porque estas medidas son ndices convenientes solo cuando la distribucin de datos es aproximadamente normal o al menos simtrica y unimodal. Pero en la vida real muchas veces no cumple estos requisitos, por lo tanto es necesario un examen a fondo de la estructura de datos OBJETIVO: Visualizar las medidas de posicin. Utilizar e interpretar la visualizacin o despliegue de tallos y hojas y ver las propiedades de un esquema de cajas. PROCEDIMIENTO INGRESO DE DATOS 1.- Se ha realizado mediciones de plantones de almcigos de eucaliptos en un vivero de un programa de creacin de bosques Y se ha obtenido las siguientes mediciones de 46 plantas escogidas al azar cuyos datos se encuentran en la tabla 1 TABLA1 0.31 0.45 0.72 0.66 0.61 0.56 0.23 0.24 0.43 0.62 0.49 1.02 0.30 0.22

0.46 0.46 0.36 1.24 0.71 0.37 0.30

0.43 0.63 0.29 0.44 0.38 0.38 0.36

0.82 0.76 0.40 0.35 0.22 0.29 0.31

1.10 0.45 0.23 0.31 0.21 0.23 0.28

0.86 0.71 0.92 0.40 0.18 0.25 0.30

2.- A continuacin se muestra los pesos de 40 muestra de un producto mineral que ha sido extrado de 40 bloques en bruto de 20 kilogramos, con una aproximacin de 5 decimales. Los datos se muestran en la tabla 2 TABLA2 4.45511 5.44560 4.73725 5.51321 6.32021 4.48400 4.05677 6.63493 4.76959 5.25886 5.50998 5.06444 5.76873 3.60010 5.44789 5.84084 5.87766 4.51836 6.20240 4.38093 4.76308 5.19979 7.43777 3.41555 5.18568 4.32760 4.85909 5.00023 5.38812 5.62238 5.55878 4.07072 6.74472 4.22795 6.73609 4.48850 4.06230 6.82283 5.24825 6.57824

Pag: 1/1

ESTADISTICA Y PROBAILIDADES

LABORATORIO

ANALISIS EXPLORATORIO DE DATOS


Ing. William Len Velsquez wjleonv@yahoo.com SEM 2012-2

05

MEDIDAS DE POSICIN

Se selecciona las siguientes medidas:

Los resultados son:

DIAGRAMA DE TALLOS Y HOJAS Se recomienda iniciar un anlisis con grficos que permitan visualizar su estructura por ello se comenzar con el grfico de tallos de hojas (Steam-andLeaf) o histogramas digital. 1.1 Visualice los tallos y hojas de los datos de la tabla1. Seleccione: GRAPH y luego STEM AND LEAF 1.2 Seleccione la variable TABLA1 (C1) 1.3 Active la casilla Trim outliers (para visualizar discordantes) 1.4 Y por ultimo presione OK los puntos

Pag: 2/2

ESTADISTICA Y PROBAILIDADES

LABORATORIO

ANALISIS EXPLORATORIO DE DATOS


Ing. William Len Velsquez wjleonv@yahoo.com SEM 2012-2

05

1.5 Observe cada uno de los elementos y asocie a los conceptos que usted conoce Character Stem-and-Leaf Display Stem-and-leaf of C1 Leaf Unit = 0.010 N = 46
TALLO

PROFUNDIDAD DE CAMPO

1 11 22 (10) 14 13 10 6 4 3 2

1 8 2 1223334599 3 00111566788 4 0033455669 5 6 6 126 7 1126 8 26 9 2 10 2 11 0

HOJAS

1.6

HI 124, Repita los pasos 1,2,3 y 4 para los datos de la tabla2

PUNTO DISCORDANTE

La pantalla tiene tres columnas: Las hojas (derecha) Cada uno de los valores en la columna de hoja representa un dgito de una observacin. La "unidad de hoja" (declarada encima de la grfica) especifica la cifra que se utiliza. En el ejemplo, la unidad de hoja es 0.010. De este modo, el valor de hoja de una observacin de 18 es 0.18, mientras que el valor de hoja de una observacin de 110 es 1.10. El tallo (centro) El valor de tallo representa la cifra ubicada inmediatamente a la izquierda de la cifra de hoja. En el ejemplo, el valor de tallo de 1 indica que las hojas de esa fila pertenecen a observaciones con valores mayores que o iguales a 0.10, pero menores que 0.20. El valor de talla de 2 indica observaciones mayores que o iguales a 0.20, pero menores que 0.30. Conteos (izquierda) Si el valor de la mediana de la muestra est incluido en una fila, el conteo correspondiente a esa fila se encierra entre parntesis. Los valores de las filas por encima y por debajo de la mediana son acumulativos. El conteo de una fila por encima de la mediana representa el conteo total para esa fila y las filas que se encuentran por encima de sta. El valor de una fila que se encuentra por debajo de la mediana representa el conteo total para esa fila y las filas que se encuentran por debajo de sta. En el ejemplo, la mediana de la muestra es 0.45, por lo que el conteo de la cuarta fila est entre parntesis. El conteo de la segunda fila representa el nmero total de observaciones en las dos primeras filas.

Pag: 3/3

ESTADISTICA Y PROBAILIDADES

LABORATORIO

ANALISIS EXPLORATORIO DE DATOS


Ing. William Len Velsquez wjleonv@yahoo.com SEM 2012-2

05

2.- DIAGRAMA DE CAJAS Y BRAZOS En el siguiente grfico analizaremos la distribucin de los datos en una representacin dividido en cuatro partes, tambin se examinar la posible presencia de valores atpicos (outliers) en el conjunto de datos, para ello se utilizar los grficos de cajas y brazos (Box-and-Wisker Plot) 2.1 Proceda a visualizar el diagrama de cajas. Seleccione GRAPH, luego

BOXPLOT.

2.2 Seleccione la variable TABLA1 en la columna Y y presione OK. 2.3 Observe cada uno de los elementos y asocie a los conceptos que usted conoce

2.4Para visualizarlos en forma horizontal repita los pasos anteriores y presione el botn Scale

Pag: 4/4

ESTADISTICA Y PROBAILIDADES

LABORATORIO

ANALISIS EXPLORATORIO DE DATOS


Ing. William Len Velsquez wjleonv@yahoo.com SEM 2012-2

05

2.5

Activar la casilla Transpose value and category y presione Ok Ok

2.6

Repita los pasos 1, 2 y 3 para los datos de la tabla2.

Sugerencia Para obtener informacin precisa de Q1, mediana, Q3, rango intercuartil, bigotes y N, coloque el cursor sobre cualquier parte de la grfica de caja. La grfica de caja muestra: La puntuacin mediana . El rango intercuartil . Se estn presentando valores atpicos. El rango .

El brazo derecho es ms largo y el rea de caja grande ubicada a laderecha de la mediana indican que los datos tienen un sesgo ligeramente positivo la cola derecha de la distribucin es ms larga que la cola izquierda

Pag: 5/5

ESTADISTICA Y PROBAILIDADES

LABORATORIO

ANALISIS EXPLORATORIO DE DATOS


Ing. William Len Velsquez wjleonv@yahoo.com SEM 2012-2

05

3.- CAJAS MLTIPLES

3.1 Ingrese los datos en forma agrupada. A B 12 10 11 15 14 16 15 10 12 11 14 18 14 11 17 12 13 15 14 12

3.2 Proceda a visualizar el diagrama de cajas mltiples. Seleccione GRAPH, luego BOXPLOT.

3.3 Presione Ok

Pag: 6/6

ESTADISTICA Y PROBAILIDADES

LABORATORIO

ANALISIS EXPLORATORIO DE DATOS


Ing. William Len Velsquez wjleonv@yahoo.com SEM 2012-2

05

PROBLEMAS PROPUESTOS: 1. Un fabricante de pilas para linterna toma una muestra de 28 piezas de la produccin de un da y las utilizo en forma continua hasta que comenzaron a fallar. El resultado en horas de funcionamiento fue:

HORAS 342 307 357

631 277 780

350 492 1049

517 500 550

426 257 521

512 264 657

480 562

500 290

317 290

520 280

700 248

a) b) c)

Trace el diagrama de tallos y hojas e interprete los resultados Complemente su apreciacin con un diagrama de cajas y brazos De que forma le puede ser til esta informacin al fabricante.

2) Un entrenador de pista debe decidir a cual de tres atletas, debe elegir para la prxima carrera de 100 metros. El entrenador basar su decisin en los resultados de diez carreras entre los tres atletas realizadas en un periodo de 1 hora en la maana y en la tarde, con descansos de 15 minutos. Se registraron los siguientes datos en las 10 carreras (en segundos).

Prueba 1 2 3 4 5 6 7 8 9 10

ATL 1 ATL 2 ATL 3 12,1 12,3 12,3 12,0 12,4 12,4 12,0 12,4 12,3 12,5 12,5 12,4 12,1 12,4 12,5 12,2 12,3 12,4 12,1 12,3 12,4 12,1 12,2 12,3 12,2 12,3 12,2 12,1 12,4 12,4

a) Trace el diagrama de cajas y brazos mltiples. Describa su forma. b) A partir de los resultados anteriores cul de los atletas debe elegir el entrenador? Por qu?

Pag: 7/7

ESTADISTICA Y PROBAILIDADES

LABORATORIO

ANALISIS EXPLORATORIO DE DATOS


Ing. William Len Velsquez wjleonv@yahoo.com SEM 2012-2

05

3.- Un estudio realizado por el Ministerio de Salud sobre la cobertura de vacunacin en nios menores de 1 ao presenta los siguientes tipos de vacunas: Antituberculosis, Antipolio, Antisarampion y la Triple. Para los aos 96, 97, 98 y 99 (campaas de vacunacin)

Aos de Campaa de vacunacin 1996 1997 1998 1999 96.2 98.6 96.2 96.9 92.9 97 98.6 95.8 98.9 96.4 94.5 92.5 94.8 98.3 96.2 98.9 Antituberculosis Antipolio Antisarampion Triple

a) Mediante un diagrama de cajas y brazos mltiples analice la cobertura que han tenido estas campaas por ao y por vacuna. b) En que ao ha habido mayor cobertura y en que ao menos cobertura, analice el comportamiento en ese ao c) Que vacunacin tuvo mayor y menor cobertura en esos aos, analice el comportamiento en esos tipos de vacunacin

4.- La empresa de lavandera LAVARAPIDO contrata a una empresa encuestadora para que disee un experimento de rendimientos de blancura de sus detergentes. Para ello elige cinco detergentes mas usados por la lavandera Considerando que la prueba de rendimiento se realiza en iguales modelos de lavandera, se obtiene las siguientes lecturas de blancura de un conjunto de 50 cargas de lavado Mediante un diagrama de cajas y brazos mltiples analice la cobertura que han tenido estos experimentos. RENDIMIENTO A 45 B 45 C 48 D 42 E 35 43 46 50 40 39 46 41 53 39 38 48 43 51 46 41 51 47 49 45 39 49 49 55 48 36 50 50 54 49 37 48 51 52 50 40 50 49 50 39 39 51 50 53 38 41

Fuente: ICOM S.A. .....

Pag: 8/8

You might also like