Professional Documents
Culture Documents
Facultad de Economa
Estadstica Multivariada
Unidad II
Estadstica Univariada
Medidas de dispersin
Representaciones grficas
Diagrama de sectores Diagrama de barras Histograma Diagrama de dispersin, Diagrama de caja
xi X= i=1 n
10
11
12
Ejemplo 2.1
Un trabajador tiene una equivocacin a la hora de escribir en el formato de una hoja de inspeccin, se pregunta: cul es la falla al calcular el valor medio de los datos? Muestra de datos ante un cambio de 10 por 50.
Datos sin valor atpico Datos con valor atpico 6 6 3 3 10 50 7 7 8 8
13
Solucin
Aplicando la funcin mean ( ) y median ( ) en R commander solucionamos la duda del trabajador. La media y mediana de los datos sin valor atpico son: x = c(6,3,10,7,8) mean(x) 6.8 median(x) 7
14
Solucin
Ahora, la media y mediana de los datos con valor atpico son: y = c(6,3,50,7,8) mean(y) 14.8 median(y) 7 Como se observa, al cambio del valor 10 por 50 (frecuente en la captura de datos), la mediana no se altera y la media aritmtica si.
15
16
W iXi Xp = Wi
17
18
Ejemplo 2.2
Suponga tres empresas de la industria de lcteos que producen un artculo idntico, sus costos por artculo y sus datos de produccin se presentan a continuacin. Encuentre el costo medio por unidad de produccin en las tres empresas.
Empresa A B C Costo 1.50 1.00 1.05 Total de la produccin 200,000 400,000 800,000
19
Solucin
W=c(200000, 400000, 800000) X=c(1.50, 1.00, 1.05) # Media ponderada weighted.mean(X,W) 1.1 # Media aritmtica mean(X) 1.183333 Conclusin. Si se trabaja con la media aritmtica se tiene un error de $ 116,666.6, que es la cantidad que sobre estima el valor total de la produccin por las tres empresas, que viene siendo de $1,540,000. Lo recomendable es la media ponderada. 20
1 1 n 1 n i=1 xi
21
Ejemplo 2.3
Suponga que cuatro diferentes vehculos recorren una distancia a diferentes velocidades, imaginemos que sea de 200 Km. Un automvil lo recorre a 100 Km/h, una motocicleta a 80 Km/h, una bicicleta a 50 Km/h y un camin de carga a 25 Km/h. Se desea obtener el promedio de velocidad de los cuatro vehculos.
22
Solucin
X=c(100, 80, 50, 25) Media_armnica = (length(X))/sum(1/X) Media_armnica 48.48485 # Media aritmtica mean(X) 63.75
23
Solucin
Analicemos por que es errneo trabajar con la media aritmtica: tiempo utilizado para los cuatro vehculos fue de 2 h + 2.5 h + 4 h + 8 h = 16.5 h Si trabajamos con la media aritmtica implicara un recorrido total de (16.5 h.) (63.75 Km/h) = 1051.875 Km (No es cierto). Ahora, n 4
Xa =
x
i =1
1
i
1 1 1 1 + + + 100 80 50 25
= 48.48485 Km/h
24
Solucin
Entonces, el recorrido total es: (16.5 h) (48.48485 Km/h) = 800 Km (Qu es correcto) Lo recomendable es trabajar con la media armnica.
25
Ejemplo 2.4
Suponga que un ejecutivo tiene un ingreso de $ 3,000 en compensacin, recibir un aumento de 5% en este ao, y recibir uno de 15 % el prximo ao. Encontrar el aumento porcentual promedio.
27
Solucin
X=c(1.05, 1.15) p=prod(X) Media_geomtrica = p^(1/length(X))-1 Media_geomtrica 0.09886305
28
Solucin
Para comprobar lo antes calculado, seguir el proceso: Primer aumento: 3000*0.05 = $ 150.0 Segundo aumento: 3150*0.15 = $ 472.5 Aumento total a recibir: 150+472.5 = $ 622.5 Ahora, utilizando la media porcentual Xg = 0.09886305: Primer aumento: 3000*0.09886305 = $ 296.58915 Segundo aumento: 3296.58915*0.09886305 = $ 325.91085 Aumento total a recibir:296.58915 + 325.91085 = $ 622.5 Ambos razonamientos nos llevan al mismo resultado. Por lo tanto, el aumento porcentual promedio es del 9.886305 %.
29
Ejemplo 2.5
Las ganancias obtenidas por la empresa de agroqumicos R & D en cuatro aos fueron de 3%, 2%, 4% y 6%. Cul es el promedio de la ganancia?
30
Solucin
y=c(0.03, 0.02, 0.04, 0.06) g=prod(y) Media_geomtrica=g^(1/length(y)) Media_geomtrica 0.03464102 La ganancia promedio por la empresa R & D es de un 3.4641 %.
31
32
33
34
35
36
37
Ejemplo 2.6
A continuacin se presentan 20 observaciones en orden del tiempo de falla, en horas, de un eje de pin cnico de una maquinaria. 204, 228, 252, 300, 324, 444, 624, 720, 816, 912, 1176, 1296, 1392, 1488, 1512, 2520, 2856, 3192, 3528, 3710 Calcular el rango, rango intercuartlico y la desviacin cuartlica.
39
Solucin
# Datos y = c(204, 228, 252, 300, 324, 444, 624, 720, 816, 912, 1176, 1296, 1392, 1488, 1512, 2520, 2856, 3192, 3528, 3710) # Rango rango=max(y)-min(y) rango 3506 # Rango intercuartlico rango_inter=quantile(y,0.75)-quantile(y,0.25) rango_inter 1350
40
Solucin
# La desviacin cuartlica DC=IQR(y)/2 675 La diferencia entre la mayor y la menor falla del pin es 3506 horas. El 50% de las fallas intermedias se encuentran entre 414 y 1764 horas. El rango intercuartlico es de 1350 horas. 50% central de las observaciones vara en 675 horas con respecto a la mediana.
41
2 2 n X X = i n -1 i =1 n
42
43
S C.V. = 100 X
El C.V. tiene las siguientes caractersticas:
44
Ejemplo 2.6
Una empresa desea decidir entre dos tipos de valores. Para su decisin cuenta con la siguiente informacin acerca del rendimiento, expresado como porcentaje:
Valor B Valor C 7.8 9.2 10.5 7.9 8.7 9.5 8.9 9.1 11.1 8.8 9.8
Sugieren estos datos que los valores C tiene mayor variacin que los valores B?
46
Solucin
B=c(7.8,10.5,7.9,8.7,9.5,8.9) C=c(9.2,9.1,11.1,8.8,9.8) Coeficiente_variacin_B=sd(B)/mean(B) Coeficiente_variacin_B 0.1144496 Coeficiente_variacin_C=sd(C)/mean(C) Coeficiente_variacin_C 0.09518577
Para los valores B, la desviacin estndar representa el 11.44 % de la media y para los valores C, la desviacin estndar representa 9.51 % de la media, por lo tanto son ms variables los valores B.
47
49
51
52
Qu se observa en un histograma? En un histograma se puede observar caractersticas de los datos, tales como las siguientes: La medicin o grupo de mediciones ms comunes. Estas suelen encontrarse en el intervalo que corresponde a la barra ms alta.
53
Histograma
La dispersin o esparcimiento. Una posible mejora del proceso es reducir la variabilidad de los datos alrededor del valor objetivo, ya que en la medida en que se alejan de este valor, disminuye la calidad del producto.
Pequea variabilidad
Gran variabilidad
54
Histograma
La simetra o sesgo. La falta de simetra puede ser sntoma de algn problema, como calentamiento de los equipos o descalibramiento de los instrumentos de medicin o cansancio de los operadores.
Positivamente asimtrica
Negativamente asimtrica
55
Histograma
Que tan centrado est el proceso. De nada sirve un proceso con variabilidad mnima si ste no est centrado sobre el valor objetivo.
Proceso centrado
Proceso descentrado
56
Histograma
Nmero de picos. La existencia de varios picos en el histograma puede deberse a cambios de material, a diferentes proveedores, operadores e instrumentos de medicin.
Unimodal
Bimodal
57
Polgono de Frecuencias
Un polgono de frecuencias es una grfica de lneas rectas que unen los puntos obtenidos al colocar en el eje horizontal a los valores medios de clase y en el vertical a las frecuencias relativas o absolutas. Razones para usar el polgono de frecuencias: Cuando han de compararse varias distribuciones sobre el mismo grfico. Sugiere el uso de una curva suave como una representacin idealizada de la distribucin de la poblacin.
58
Ojiva
Una ojiva o Polgono Frecuencias Acumuladas es una grfica construida con segmentos de lneas rectas que unen los puntos obtenidos al colocar en el eje horizontal a los lmites superiores de clase y en el vertical a las frecuencias acumuladas absolutas o relativas. Una ojiva se usa principalmente para interpolaciones. Para contestar preguntas como esta: Cul es el valor que divide toda la serie en dos partes iguales?
59
Ejemplo 2.7
El departamento de servicio de un fabricante de refrigeradores tiene registrada las quejas que ha recibido de sus clientes durante el ltimo mes. Los resultados se muestran en la tabla siguiente
Tipo de defecto Mal el compresor No produce cubos de hielo Soportes de charolas rotos Fugas de agua en mangueras Otros problemas Frecuencia 12 28 25 24 9
62
Solucin
Mediante el archivo barra.xls representamos la informacin de la tabla. Obtenemos que el defecto ms comn es que el refrigerador no produce cubos de hielo.
30 25 20 15 10 5 0 Mal el No hielo compresor Charolas Fugas de Otros rotas agua problemas
63
Ejemplo 2.8
Realizar un grfico de sectores con la informacin de la tabla
Defecto Fractura Rayado Mancha Rajadura TOTAL Frecuencia absoluta 10 42 104 6 162
65
Solucin
Se puede observar en la grfica de sectores, que el 64% de los defectos fue en mancha, en segundo lugar fue el rayado con un 26%.
Rajadura 4% Fractura 6% Rayado 26%
Mancha 64%
66
Ejemplo 2.9
Construya un diagrama de Pareto con la informacin
No. 1 2 3 4 5 6 Datos Frecuencias 202 114 92 45 19 16
68
Falta de mantenimiento Programa inadecuado Interrupcin de la energa elctrica Manejo incorrecto del operador Virus en el sistema Otros
Solucin
DIAGRAMA DE PARETO
488 438 388 338 FRECUENCIAS 288 238 188 138 88 38 -12 1 2 3 4 5 6 7 8 CAUSAS 9 10 11 12 13 14 15
100.00% 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% % ACUMULADO
69
70
Ejemplo 2.10
La tabla siguiente presenta datos de la antigedad del empleado en aos (X) y los errores presentados en un mes.
X Y 1 15 2 13 3 14 4 12 5 10 6 11 7 12 8 10 9 8 10 10 11 9 12 7 13 6 14 7 15 4 16 5 17 3 18 4 19 2 20 2
71
Solucin
DIAGRAMA DE DISPERSIN
16 14 12 10 8 6 4 2 0
0 5 10 15 20 25
Errores presentados
72