You are on page 1of 18

PRODUCCIN

PRONSTICOS

PRONSTICOS CAUSALES CON REGRESIN El objetivo es pronosticar una variable dependiente, por ejemplo las ventas, en funcin de una o ms variables independientes, por ejemplo el precio. Este es un pronstico causal, porque el valor de la variable dependiente est causado o al menos tiene una correlacin alta con el valor de las(s) variable(s) independiente(s). Lo primero que debe hacerse es un anlisis de correlacin para medir la asociacin entre las dos variables: 1. Elaborar un diagrama de dispersin para observar si existe una relacin lineal entre las variables. En un sistema de coordenadas graficar la nube de puntos considerando X = variable independiente e Y = variable dependiente. Calcular el coeficiente de correlacin para establecer la medida de la fuerza de la relacin lineal entre las dos variables. Este coeficiente tiene las siguientes caractersticas: Varia de -1 hasta +1, ambos inclusive. Un valor cercano a 0 indica que hay poca asociacin entre las variables. Un valor cercano a +1 indica una asociacin directa o positiva entre las variables. Un valor cercano a -1 indica una asociacin inversa o negativa entre las variables. 1. 2. Calcular el coeficiente de determinacin para determinar la proporcin de la variacin total en la variable dependiente Y que se explica por la variacin en la variable independiente X. Realizar una prueba de la importancia del coeficiente de correlacin para determinar si la correlacin se debe o no a la casualidad.

2.

Si el anlisis de correlacin concluye que existe una relacin lineal fuerte entre las variables, se procede a elaborar una ecuacin para expresar la relacin lineal (recta) entre las variables con la finalidad de estimar el valor de la variable dependiente Y con base en un valor seleccionado de la variable independiente X. La tcnica para desarrollar la ecuacin y proporcionar los estimados se denomina anlisis de regresin. La referida ecuacin de la recta que relaciona las variables es una ecuacin de regresin que se determina aplicando el mtodo matemtico denominado principio de los mnimos cuadrados que proporciona la recta del mejor ajuste. El mtodo de los mnimos cuadrados determina una ecuacin de regresin al minimizar la suma de las desviaciones cuadrticas entre los valores reales y los valores estimados de Y.

REGRESIN LINEAL SIMPLE

ANIANO URTECHO AGUILAR

PRODUCCIN

PRONSTICOS

Ejemplo: La siguiente informacin muestra las llamadas realizadas a clientes y computadoras vendidas por 10 vendedores. Vendedores 1 2 3 4 5 6 7 8 9 10 Llamadas Computadoras a clientes vendidas 20 40 20 30 10 10 20 20 20 30 30 60 40 60 30 40 40 50 30 70

Se desea determinar si existe una relacin lineal entre las variables y usar esta relacin para fines de pronstico de ventas. Paso 1: Determinar cules son las variables independiente y dependiente Al analizar los datos se observa cierta relacin entre el nmero de llamadas a clientes y el nmero de computadoras vendidas. Por ejemplo, el vendedor 1 hizo 20 llamadas a clientes y vendi 30 computadoras, el vendedor 2 hizo 40 llamadas a clientes y logr una venta de 60 computadoras. Es decir, los vendedores que hicieron ms llamadas a clientes vendieron ms computadoras. Sin embargo, la relacin no es perfecta o exacta. Por ejemplo el vendedor 10 hizo menos llamadas que el vendedor 2, pero vendi ms computadoras. Concluimos que probablemente las ventas de computadoras dependen de la cantidad de llamadas que se hagan a los clientes. En este sentido, las variables son las siguientes: X = cantidad de llamadas a clientes (variable independiente) Y = cantidad de computadoras vendidas (variable dependiente) Paso 2: Elaboramos el diagrama de dispersin para establecer si la relacin entre las variables es lineal o no lineal. En un sistema de coordenadas graficamos los diez puntos (x,y) =(20,30); (40,60); (20,40); (30,60); (10,30); (10,40); (20,40); (20,50); (20,30); (30,70)

ANIANO URTECHO AGUILAR

PRODUCCIN

PRONSTICOS

La nube de puntos en el diagrama de dispersin nos muestra una relacin lineal (lo cual se indica con la lnea punteada por el centro de la nube) entre las ventas de computadoras (variable dependiente) y la cantidad de llamadas a clientes (variable independiente). Considerando que los valores de los coeficientes de correlacin y de determinacin suelen obtenerse fcilmente con los valores de a y b de la recta de regresin, vamos a suspender por el momento el anlisis de correlacin para determinar la recta de regresin. Paso 3: Recta de Regresin Una vez establecida una relacin lineal, se puede emplear el conocimiento de la variable independiente para pronosticar la variable dependiente mediante una lnea recta Y = a + bX, cuyos parmetros a y b se determinan aplicando el modelo de regresin lineal simple mediante las siguientes frmulas: b=nXY-XYnX2-X2 a=Y-bXn a = interseccin de la recta con el eje X, representa el valor promedio de Y cuando X es igual a cero. b = pendiente de la recta, significa que para cada incremento de una unidad en X, el valor de Y aumenta b unidades en promedio. Para determinar los parmetros a y b elaboramos la siguiente hoja de clculo: Vended Llamada or s i Xi 1 20 2 40 3 20 4 30 5 10 6 10 7 20 8 20 9 20 10 30 220 MEDIA 22 Ventas Yi 30 60 40 60 30 40 40 50 30 70 450 45 X2 400 1600 400 900 100 100 400 400 400 900 5600 XY 600 2400 800 1800 300 400 800 1000 600 2100 10800

b=nXY-XYnX2-X2=1010800-220450105600-2202=1.184210526 a=Y-bXn=450-(1.184210526)22010=18.94736842

ANIANO URTECHO AGUILAR

PRODUCCIN

PRONSTICOS

Usando las siguientes funciones de Excel se puede calcular directamente los promedios de las variables X e Y as como los valores de los parmetros a y b: a b Media X Media Y =INTERSECCION.EJE(Y1:Yn;X1:Xn) =PENDIENTE(Y1:Yn;X1:Xn) =PROMEDIO(X1:Xn) =PROMEDIO(Y1:Yn)

Donde Y1:Yn y X1:Xn son los rangos de celdas que contienen los valores de las variables dependiente Y e independiente X, respectivamente. RECTA DE REGRESIN: Yp = a + bX Yp = 18.94736842 + 1.184210526X a = 18.94736842 = 19, indica la venta de copiadoras cuando no hay ninguna llamada a clientes o la porcin de las ventas de computadoras que vara con respecto a factores diferentes a las llamadas a clientes. b = 1.184210526, significa que por cada aumento de una llamada a clientes, se espera que las ventas aumenten en 1.184210526 computadoras. Ejemplo, si se incrementa la cantidad de llamadas en 10, el efecto en el nmero de computadoras vendidas es 10*b, esto es: 10(1.184210526) = 11.84210526 = 12 Ahora, antes de realizar el pronstico retomamos el anlisis de correlacin para determinar si realmente existe una fuerte asociacin entre las variables y qu proporcin de la variacin de la variable dependiente se puede explicar por la variacin en la variable independiente. COEFICIENTE DE CORRELACIN (r) Indica la correlacin entre las variables dependiente e independiente. Su valor est comprendido entre -1 < r < +1, siendo su signo igual al del parmetro b. Una correlacin cercana a +1 indica una fuerte relacin lineal positiva entre X e Y, una correlacin prxima a -1 significa una fuerte relacin lineal inversa o negativa entre X e Y, y una correlacin cercana a cero quiere decir que existe una relacin lineal dbil entre X e Y. El coeficiente de correlacin puede calcularse mediante cualquiera de las siguientes frmulas: r=XY-nXYX2-nX2Y2-nY2 tambin: r=aY+bXY-nY2Y2-nY2 Donde: X = media de X = X / n = 220 / 10 = 22

ANIANO URTECHO AGUILAR

PRODUCCIN

PRONSTICOS

Y = media de Y = Y / n = 450 / 10 = 45 Para el ejemplo que venimos desarrollando, b es positivo, en consecuencia el coeficiente de correlacin tambin es positivo y su valor segn las frmulas anteriores es el siguiente: r=XY-nXYX2-nX2Y2-nY2=10800-1022455600-1022222100-10452=0.75901 r=aY+bXY-nY2Y2-nY2= 18.94736842450+1.18421052610800-104522210010452=0.75901 Si se conoce el valor del coeficiente de determinacin, r 2, entonces el coeficiente de correlacin se obtiene extrayendo la raz cuadrada, es decir: r=r2 En Excel el valor de =COEF.DE.CORREL(Y1:Yn;X1:Xn) r se calcula con la funcin:

El valor de r = +0.75901 = +0.76 es positivo lo cual nos indica que existe una relacin directa entre la cantidad de llamadas a clientes y la ventas de computadoras. Asimismo, el valor del coeficiente de correlacin est muy cercano a +1 indicando que la asociacin entre las variables es fuerte. Se podra motivar al personal de ventas para hacer llamadas adicionales, debido a que el nmero de llamadas a clientes se relaciona con el nmero de computadoras vendidas. Sin embargo, ms llamadas a clientes realmente generarn ms ventas No, aqu no se ha demostrado la causa y el efecto, slo que hay una relacin entre las dos variables. PRUEBA DE LA IMPORTANCIA DEL COEFICIENTE DE CORRELACIN El coeficiente de correlacin de +0.75901 indica una asociacin fuerte entre el nmero de llamadas a clientes y el nmero de computadoras vendidas. Sin embargo, la muestra contiene solamente 10 vendedores. Puede ser que en realidad la correlacin en la poblacin sea 0? Esto significara que la correlacin de +0.75901 se debi a la casualidad. La poblacin en este ejemplo sera toda la fuerza de ventas de la empresa. La pregunta que nos planeamos ahora es: puede haber una correlacin cero en la poblacin de la cual se seleccion la muestra? En otras palabras proviene el valor del coeficiente de correlacin de una poblacin de observaciones pareadas con correlacin cero? Para responder tal pregunta realizaremos una prueba de hiptesis de la siguiente manera: Formulacin de las hiptesis nula y alternativa: H0:=0 (la correlacin en la poblacin es cero) H1:0 (la correlacin en la poblacin es diferente de cero)

ANIANO URTECHO AGUILAR

PRODUCCIN

PRONSTICOS

Por la forma en que se ha formulado la hiptesis alternativa, la prueba es de dos colas. Adems como se trata de una muestra pequea utilizaremos el estadstico t de la distribucin Student. Prueba t para el coeficiente de correlacin: Nivel de significancia Valor crtico : 0.05 (95% de confianza) : 2.31

Con un nivel de significancia de 0.05, la regla de decisin en este caso indica que si el valor calculado de t se encuentra en el rea entre +2.31 y -2.31, no se rechaza la hiptesis nula. El valor crtico de 2.31 se obtiene directamente de la tabla estadstica de la distribucin Student o mediante la siguiente funcin de
Regin de rechazo se rechaza H 0 no (hay correlacin) (no hay correlacin en la poblacin) 0.025 0.025 0.95

-2.31

+2.31

Tabla de distribucin Student


99% 98% 95%

gl
1 2 3 4 5 6 7 8 9

0.995

0.99

0.975

63.66 9.92 5.84 4.60 4.03 3.71 3.50 3.36 3.25

31.82 6.96 4.54 3.75 3.36 3.14 3.00 2.90 2.82

12.71 4.30 3.18 2.78 2.57 2.45 2.36 2.31 2.26

Clculo del valor de t: t=rn-21-r2, con n-2 grados de libertad t=0.7590110-21-0.759012=3.29730276=3.30

ANIANO URTECHO AGUILAR

PRODUCCIN

PRONSTICOS

Decisin: El valor calculado de t = 3.30 > valor crtico = 2.31, es decir, est fuera de la regin de aceptacin de la hiptesis nula, por tanto se rechaza la hiptesis nula al nivel de significacin de 0.05. Esto significa que la correlacin en la, poblacin no es cero. Desde un punto de vista prctico, esto indica que hay una correlacin entre el nmero de llamadas a clientes y el nmero de computadoras vendidas en la poblacin de vendedores de la empresa. COEFICIENTE DE DETERMINACIN (r2) Permite establecer qu porcentaje de la variabilidad de la variable dependiente se puede explicar por la variabilidad de la variable independiente. Se calcula mediante cualquiera de las siguientes frmulas: r2=XY-nXY2X2-nX2Y2-nY2 r2=aY+bXY-nY2Y2-nY2 Donde: Y = media de Y = Y / n = 450 / 10 = 45 X = media de X = X / n = 220 / 10 = 22 Para nuestro ejemplo qu porcentaje de la variacin en las ventas de computadoras se puede explicar por la variabilidad en las llamadas a clientes? r2=XY-nXY2X2-nX2Y2-nY2=10800-10224525600-1022222100-10452=0.57610 r2=aY+bXY-nY2Y2-nY2=18.94736842450+1.18421052610800-1045222100-10452 r2=0.57610 En Excel el valor de r2 se calcula mediante la siguiente funcin: =COEFICIENTE.R2(Y1:Yn;X1:Xn) El valor de r2 = 0.57610 = 0.58 = 58%, significa que de la variabilidad en las ventas de computadoras: El 58% se puede explicar por la variabilidad en la cantidad de llamadas a clientes. El 42% no se puede explicar por la variabilidad en la cantidad de llamadas a clientes. Esta porcin en la variabilidad de las ventas se debe explicar mediante factores que an no han sido identificados en este anlisis de correlacin (por ejemplo: publicidad).

Podemos concluir que la cantidad de llamadas a clientes explican aproximadamente el 58% de la cantidad de computadoras vendidas. Por tanto, se puede usar esta relacin para fines de pronstico. PRONSTICO (Yp)
ANIANO URTECHO AGUILAR 7

PRODUCCIN

PRONSTICOS

Yp = 18.94736842 + 1.184210526X Considerando que existe una fuerte correlacin positiva entre las variables, utilizaremos la recta de regresin lineal para pronosticar las ventas de computadoras. Por ejemplo, para 25 llamadas a clientes esperaramos una venta aproximada de 49 computadoras, cantidad determinada reemplazando X = 25 en la ecuacin de la recta y calculando el valor correspondiente de Y, esto es: Yp = 18.94736842 + 1.184210526(25) = 48.552632 = 49. Si quisiramos estimar las ventas para un representante de ventas que hace 100 llamadas a clientes sera apropiado hacer la estimacin con la recta de regresin establecida anteriormente? No, porque la cantidad de llamadas a clientes tiene un rango de variacin de 10 a 40, de modo que hacer la estimacin sera una extrapolacin ms all de dicho rango. Se requiere entonces reunir informacin de ventas para cantidades de llamadas a clientes que incluyan la cantidad de 100 y determinar una nueva recta de regresin. En Excel el pronstico se determina con la siguiente funcin: =PRONOSTICO(X;Y1:Yn;X1:Xn) Donde X es el valor de la variable independiente para la cual se desea estimar el valor de la variable dependiente Y; Y1:Yn; X1:Xn son los rangos de celdas que contienen los valores Y y X respectivamente. ERROR ESTANDAR DE LA ESTIMACION (Syx) Mide la cantidad estndar en la cual los valores reales Y difieren de los valores pronosticados Yp, es decir es una medida de la dispersin de los valores observados con respecto a la lnea de regresin. Entonces, indica que tan preciso es el pronstico de Y con base en X o, por el contrario, cun inexacta podra ser la estimacin. Se calcula mediante cualquiera de las siguientes frmulas: Syx=Y-Yp2n-2 o tambin: Syx=Y2-aY-bXYn-2

Hoja de clculo para aplicar las frmulas:


i 1 2 3 4 5 Xi 20 40 20 30 10 Yi 30 60 40 60 30 X2 400 1600 400 900 100 Y2 900 3600 1600 3600 900 XY 600 2400 800 1800 300 Yp 42.63158 66.31579 42.63158 54.47368 30.78947 Yi -Yp -12.63158 -6.31579 -2.63158 5.52632 -0.78947 (Yi -Yp)2 159.55679 39.88920 6.92521 30.54017 0.62327

ANIANO URTECHO AGUILAR

PRODUCCIN

PRONSTICOS

6 7 8 9 10

10 20 20 20 30 220

40 40 50 30 70 450

100 400 400 400 900 5600

1600 1600 2500 900 4900 22100

400 800 1000 600 2100 10800

30.78947 42.63158 42.63158 42.63158 54.47368 450.00000

9.21053 -2.63158 7.36842 -12.63158 15.52632 0.00000

84.83380 6.92521 54.29363 159.55679 241.06648 784.21053

Los valores de Yp han sido obtenidos con la recta de regresin Yp = 18.94736842+1.184210526X, por ejemplo para X = 20 el valor de Yp = 18.94736842+1.184210526(20) = 42.63158. El error estndar de la estimacin segn las frmulas anteriores es el siguiente: Syx=Y-Yp2n-2= 784.2105310-2=9.90082 Syx=Y2-aY-bXYn-2=22100-18.94736842450-1.184210526(10800)n-2=9.90082 En Excel el valor de Syx se calcula mediante la siguiente funcin: =ERROR.TIPICO.XY(Y1:Yn;X1:Xn) Interpretacin: Los valores observados de Y se encuentran dispersos en 9.9 unidades en promedio, con respecto a la recta de regresin. Se observa en el cuadro anterior que la suma de las desviaciones es igual a cero, lo cual indica que las desviaciones positivas (por encima de la lnea de regresin) se compensan con las desviaciones negativas (por debajo de la lnea de regresin). ESTIMACIONES DE INTERVALO Se desea proporcionar estimaciones de intervalo de dos tipos. El primero, denominado intervalo de confianza, presenta el valor medio de Y para un valor dado de X. El segundo tipo se conoce como intervalo de pronstico e informa acerca del valor individual de Y para un valor particular de X. Anteriormente calculamos que para X = 25 llamadas a clientes se esperaba una venta de Yp =49 computadoras; sin embargo, la venta real rara vez coincidir con esta estimacin puntual o determinstica. En consecuencia, se requiere efectuar un pronstico estocstico o probabilstico dentro del siguiente intervalo: Yp k*Sp Donde: Yp = valor estimado con la recta de regresin, para nuestro ejemplo Yp = 48.55. k = coeficiente de confianza k = z, cuando el tamao de la muestra es mayor de 30 (n>30) y su valor se obtiene de la tabla de la Distribucin Normal para un determinado nivel de

ANIANO URTECHO AGUILAR

PRODUCCIN

PRONSTICOS

confianza o probabilidad. Los principales valore de z usados para fines de pronsticos son los siguientes: Nivel de Confianza Valor de z 90% 1.64 95% 1.96 95.5% 2 99% 2.58 99.73% 3

k = t, cuando el tamao de la muestra de datos es menor o igual a 30 (n 30) y su valor se obtiene de la tabla estadstica de la Distribucin Student cuando se conoce el nivel de confianza o probabilidad y los grados de libertad = n 2. Para el ejemplo que venimos desarrollando vamos a considerar un nivel de confianza de 95%. Entonces como n = 10 < 30, usaremos la tabla de la Distribucin Student para determinar el valor de t con n 2 = 10 2 = 8gl grados de libertad. En EXCEL el valor de t puede obtenerse con la siguiente funcin: =DISTR.T.INV(0.05,8) = 2.31 El valor de t tambin puede obtenerse directamente de la tabla estadstica de la Distribucin Student, segn se indica:
99% 98% 95% 0.99 t 5 t 0.99 t 0.975 63.6 31.8 6 2 12.71 9.92 6.96 4.30 5.84 4.54 3.18 4.60 3.75 2.78 4.03 3.71 3.50 3.36 3.25 3.36 3.14 3.00 2.90 2.82 2.57 2.45 2.36 2.31 2.26

gl 1 2 3 4 5 6 7 8 9

Sp = Error estndar del pronstico que mide la variabilidad de los valores de prediccin Yp alrededor del valor promedio de Y o de un valor individual de Y para un valor dado de X. Se calcula mediante las siguientes frmulas: Error estndar del pronstico para la media Y Sp=Syx*1n+X-X2X2-nX2 Para nuestro ejemplo: Sp=Syx*1n+X-X2X2-nX2=9.90082*110+25-2225600-10222=3.311 Error estndar del pronstico para un valor individual de Y Sp=Syx*1+1n+X-X2X2-nX2

ANIANO URTECHO AGUILAR

10

PRODUCCIN

PRONSTICOS

Para nuestro ejemplo: Sp=Syx*1+1n+X-X2X2-nX2=9.90082*1+110+25-2225600-10222=10.44 Intervalo de confianza para la media de Y Yp k*Sp equivalente a: Yp-k*SpyxYp+k*Sp, esto es: Ypk*Syx*1n+X-X2X2-nX2 Para nuestro ejemplo: 48.552.31*9.90082*110+25-2225600-10222=48.557.65 En forma de intervalo: 48.55-2.31*3.31yx48.55+2.31*3.31, de donde 41yx56; es decir, para todos los representantes de ventas que realicen 25 llamadas a clientes, con un 95% de confianza, se espera una venta entre 41 y 56 computadoras. Intervalo de pronstico para un valor individual de Y Yp k*Sp equivalente a: Yp-k*SpyxYp+k*Sp, esto es: Ypk*Syx*1+1n+X-X2X2-nX2 El intervalo de pronstico del 95%, para un representante de ventas que realiza 25 llamadas a clientes es: 48.552.31*9.90082*1+110+25-2225600-10222=48.5524.12 Expresndolo en intervalo: 48.55-2.31*10.44yx48.55+2.31*10.44, de donde 24yx73; es decir, para un representante de ventas que realice 25 llamadas a clientes, con un 95% de confianza, se espera una venta de computadoras comprendida entre 24 y 73 unidades. PRONSTICO MEDIANTE HOJA DE CLCULO Si nuestro objetivo solamente es obtener el intervalo de pronstico para valores individuales de Y con un determinado nivel de confianza, podemos usar una hoja de clculo con funciones de Excel. A continuacin se presenta la hoja de clculo con el intervalo de pronstico de 95% de confianza para la muestra de los 10 vendedores.
1 2 3 4 5 6 B C D DATOS Llamadas Computadora s vendidas Vendedores a clientes X2 X Y 1 20 30 400 2 40 60 1600 3 20 40 400 A E F G DEMANDA ESPERADA Promedio Yp 42.63 66.32 42.63 Mxima Yp + tSp 66.63 94.52 66.63

Mnima Yp - tSp 18.63 38.11 18.63

ANIANO URTECHO AGUILAR

11

PRODUCCIN

PRONSTICOS

7 8 9 10 11 12 13 14 15 16 17 18 19

4 5 6 7 8 9 10

30 10 10 20 20 20 30

60 30 40 40 50 30 70 95% 9.900824 8 2.3060041

900 100 100 400 400 400 900 5600

29.63 4.86 4.86 18.63 18.63 18.63 29.63

54.47 30.79 30.79 42.63 42.63 42.63 54.47

79.32 56.72 56.72 66.63 66.63 66.63 79.32

Nivel confianza = Syx = Grados libertad = t=

Para obtener los resultados mostrados, se requiere ingresar los datos y frmulas siguientes:
Celda A1:C13 D4 D14 F4 E4 G4 C16 C17 C18 C19 Frmula Datos =POTENCIA(B4;2) =SUMA(D4:D13) =PRONOSTICO(B4;$C$4:$C$13;$B$4:$B$13) =F4-$C$19*$C$17*RAIZ(1+1/CONTAR($F$4:$F$13) +POTENCIA(B4-PROMEDIO($B$4:$B$13);2)/($D$14 -CONTAR($F$4:$F$13)*POTENCIA(PROMEDIO($B$4:$B$13);2))) =F4+$C$19*$C$17*RAIZ(1+1/CONTAR($F$4:$F$13) +POTENCIA(B4-PROMEDIO($B$4:$B$13);2)/($D$14 -CONTAR($F$4:$F$13)*POTENCIA(PROMEDIO($B$4:$B$13);2))) 95% =ERROR.TIPICO.XY(C4:C13;B4:B13) =CONTAR(F4:F13)-2 =SI(CONTAR(F4:F13)>30;DISTR.NORM.ESTAND.INV(0.5 +C16/2);DISTR.T.INV(1-C16;C18)) F5:F13 E5:E13 G5:G13 D5:D13 Cpiese a

EJERCICIOS 1. La empresa Paraso SAC analiza la relacin entre el consumo de energa (en miles de kwh) y el nmero de habitaciones en una residencia privada unifamiliar. En una muestra aleatoria de 10 casas se obtuvo la siguiente informacin: Nmero habitaciones 12 9 14 Consumo energa (miles kwh) 9 7 10

ANIANO URTECHO AGUILAR

12

PRODUCCIN

PRONSTICOS

6 10 8 10 10 5 7 a) b) c) 1.

5 8 6 8 10 4 7

Elabore el diagrama de dispersin. Suponiendo que existe una relacin lineal, determine los parmetros a y b de la recta de regresin e interprete su significado. Anticipe el consumo de energa para una casa de 6 habitaciones

Un reciente artculo en una revista de negocios present una lista de las mejores empresas pequeas. Existe inters en los resultados actuales de las ventas y ganancias de las empresas. Se seleccion una muestra aleatoria de doce empresas. A continuacin se indican las ventas y ganancias, en miles de nuevos soles. Empresa A B C D E F G H I J K L a) b) c) d) e) Ventas (miles S/.) 89.2 18.6 18.2 71.7 58.6 46.8 17.5 11.9 19.6 51.2 28.6 69.2 Ganancias (miles S/.) 4.9 4.4 1.3 8.0 6.6 4.1 2.6 1.7 3.5 8.2 6.0 12.8

Trace un diagrama de dispersin qu relacin existe entre las variables? Calcule el coeficiente de determinacin e interprete el resultado. Calcule el coeficiente de correlacin e interprete el resultado. Determine la ecuacin de regresin e interprete los valores de los parmetros a y b. Estime las ganancias de una empresa pequea con ventas de S/ 50,000.

1.

A MERCA S.A.C, supervisora de mantenimiento, le gustara determinar si existe una relacin entre el costo anual de mantenimiento de un autobs y su antigedad. Si hay relacin MERCA piensa que puede pronosticar mejor el presupuesto anual de mantenimiento de autobuses. Por ello, rene los siguientes datos: AUTO BS COSTO DE ANTIGE MANTENIMI DAD ENTO (AOS)

ANIANO URTECHO AGUILAR

13

PRODUCCIN

PRONSTICOS

MENSUAL (US$) 1 2 3 4 5 a) b) c) d) e) 70 60 40 60 90 8 5 3 9 10

Qu porcentaje de la varianza no se puede explicar con la recta de regresin? Calcula el costo mensual de mantenimiento para un autobs con 20 aos de antigedad. Con un 95% de confianza, estima el costo mensual de mantenimiento para un autobs que tiene 5 aos de antigedad. Deber usar MERCA el anlisis de regresin para pronosticar el presupuesto mensual de mantenimiento de autobuses? Por qu? Si se usa el anlisis de regresin para formular dicho presupuesto, cul es el incremento mensual en el costo de mantenimiento por cada ao de antigedad de un autobs?

2.

Nuevo Milenio S.A.C. le contrata a Ud. Como analista de medio tiempo. La empresa qued complacida cuando usted determin que existe una relacin positiva entre el nmero de permisos de construccin y la cantidad de trabajo disponible en la empresa. Ahora, se pregunta si es posible emplear el conocimiento de las tasas de inters sobre primeras hipotecas, para predecir el nmero de permisos de construccin que se emitirn cada mes. Usted rene una muestra aleatoria de nueve meses de datos: Mes Permisos construccin Tasa Inters % a) b) c) d) e) 1 796 10.2 2 494 12.6 3 289 13.5 4 892 9.7 5 343 10.8 6 888 9.5 7 509 10.9 8 987 9.2 9 187 14.2

Grafique los datos en un diagrama de dispersin. Determine la ecuacin de regresin de la muestra. Al incrementarse la tasa de inters en 1% cul es la disminucin promedio en el nmero de permisos de construccin? Calcule e interprete el coeficiente de determinacin. Redacte un memo explicando los resultados de su anlisis.

1.

El Sr. Aguilar observa el precio y el volumen de ventas de latas de leche de 10 semanas elegidas en forma aleatoria. Los datos obtenidos se presentan en la siguiente tabla: Venta Sema s Preci na (latas o ) (S/.)

ANIANO URTECHO AGUILAR

14

PRODUCCIN

PRONSTICOS

1 2 3 4 5 6 7 8 9 10 a) b) c) d) 1.

10 6 5 12 10 15 5 12 17 20

1.3 2.0 1.7 1.5 1.6 1.2 1.6 1.4 1.0 1.1

Elaborar un diagrama de dispersin Qu tipo de relacin existe entre las ventas y el precio? Establezca la ecuacin de pronstico. Pronostique las ventas para un precio de S/.1.8 y de S/.3 con 95% de confianza. Qu porcentaje de las ventas se puede explicar mediante la variabilidad en el precio?

Al gerente de una empresa que fabrica partes le gustara desarrollar un modelo para estimar el nmero de horas-trabajador requeridas para las corridas de produccin de lotes de tamao variable. Se seleccion una muestra aleatoria de 14 corridas de produccin (dos por cada tamao de lote: 20, 30, 40, 50, 60, 70 y 80) y los resultados se muestran a continuacin: Tamao de lote 20 20 30 30 40 40 50 50 60 60 70 70 80 80 a) b) c) d) Horastrabajador 50 55 73 67 87 95 108 112 128 135 148 160 170 162

Elabore un diagrama de dispersin qu relacin existe entre las variables? Suponiendo que existe una relacin lineal, determine los coeficientes de regresin a y b. Qu cantidad de horas-trabajador no se ven afectadas por la variacin en el tamao del lote de produccin. Si el tamao del lote se incrementa en 2 unidades cul es el efecto en las horas-trabajador?
15

ANIANO URTECHO AGUILAR

PRODUCCIN

PRONSTICOS

e) f) g) h) i) j)

Estime el nmero promedio de horas-trabajador requerido para una corrida de produccin con tamao de lote de 45. Sera apropiado estimar el nmero promedio de horas-trabajador requerido para una corrida de produccin con un tamao de lote de 100? Explique su respuesta. Calcule el coeficiente de determinacin e interprete su significado. Calcule el coeficiente de correlacin e interprete su significado. Establezca una estimacin de intervalo de confianza del 90% de las horas-trabajador promedio para todas las corridas de produccin con un tamao de lote de 45. Establezca un intervalo de confianza del 90% de las horastrabajador para una sola corrida de produccin con un tamao de lote de 45.

1.

Al gerente de Comercializacin de una cadena grande se supermercados le gustara determinar el efecto del espacio en estantes sobre las ventas de comida para mascotas. Se selecciona una muestra aleatoria de 12 supermercados de igual tamao y los resultados se presentan a continuacin: Tienda 1 2 3 4 5 6 7 8 9 10 11 12 a) b) c) d) e) f) g) h) i) Espacio estante (m2) 5 5 5 10 10 10 15 15 15 20 20 20 Venta semanal (miles S/.) 1.6 2.2 1.4 1.9 2.4 2.6 2.3 2.7 2.8 2.6 2.9 3.1

Elabore un diagrama de dispersin qu relacin existe entre las variables? Suponiendo que existe una relacin lineal, calcule los coeficientes de regresin a y b. Interprete el significado de a y b. Si no se dispone de ningn espacio en estantes para alimentos de mascotas, es decir X = 0, estimar la venta e interpretar el resultado. Por cada m2 de incremento en el espacio del estante cul es el efecto en las ventas? Estime las ventas semanales promedio (en miles S/.) de alimentos para mascotas en estantes de 8 m2 de espacio. Calcule el error estndar de la estimacin e interprete el resultado. Calcule el coeficiente de determinacin e interprete el resultado. Calcule el coeficiente de correlacin e interprete el resultado.

ANIANO URTECHO AGUILAR

16

PRODUCCIN

PRONSTICOS

j) k)

Establezca una estimacin de intervalo del 95% de las ventas semanales promedio para todas las tiendas que poseen 8m2 de espacio en estantes para alimento de mascotas. Con un 95% de confianza cul es la venta estimada para una sola tienda que disponga de 8m2 de espacio en estantes para alimentos de mascotas?

1.

Un analista extrae una muestra aleatoria de 10 embarques recientes en camin que ha realizado una empresa y registra la distancia en Km., as como el tiempo de entrega con una aproximacin de medio da desde el momento en que el embarque estuvo disponible para recogerlo, tal como se indica:

Camin muestreado Tiempo entrega (das) Distancia (Km.)

1 3.5 825

2 1

3 4

4 2

5 1 480

6 3 920

7 4.5

8 1.5

9 3

10 5

215 1070 550

1350 325

670 1215

a) b) c) d) e) f) g) h) 2.

Elabora un diagrama de dispersin Qu tipo de relacin existe entre el tiempo de entrega y la distancia? Establece la recta de regresin. Estima el tiempo de entrega desde el momento en que el embarque est disponible para enviarlo en un camin que recorrer c1) 1,000 Km., c2) 2500 km. Qu porcentaje de la varianza en el tiempo de entrega es estadsticamente explicable por la distancia del recorrido en camin? Calcula el coeficiente de correlacin e interpreta el resultado Presenta en un cuadro los intervalos de pronstico del 95% para la muestra de 10 observaciones. Al incrementarse la distancia en 100 Km. cul es el efecto en el tiempo de entrega? Determina el tiempo de entrega mnimo.

El Gobierno Regional de Arequipa estudia la relacin entre el nmero de licitadores en un proyecto para una carretera y la licitacin ms alta (menor costo) para el proyecto. De inters particular resulta saber si el nmero de licitadores aumenta o disminuye la cantidad de la oferta ganadora. Proyecto 1 2 3 4 5 6 7 8 Nmero de licitadores 9 9 3 10 5 10 7 11 Oferta ganadora (millones de soles) 5.1 8.0 9.7 7.8 7.7 5.5 8.3 5.5
17

ANIANO URTECHO AGUILAR

PRODUCCIN

PRONSTICOS

9 10 11 12 13 14 15 a) b) c) d) e) f) 3.

6 6 4 7 7 7 6

10.3 8.0 8.8 9.4 8.6 8.1 7.8

Determine la ecuacin de regresin. Interprete la ecuacin. Ms licitadores tienden a aumentar o a disminuir la cantidad de la oferta ganadora? Estime la cantidad de la oferta ganadora si hubiera habido siete licitadores. Se construye una nueva entrada en la carretera. Hay siete licitadores en el proyecto. Determine un intervalo de prediccin de 95% para la oferta ganadora. Determine el coeficiente de determinacin. Interprete su valor. Para qu oferta ganadora no se presentarn licitadores. Para qu nmero de licitadores no habr oferta ganadora?

En la siguiente tabla se muestra el nmero de automviles vendidos en Lima durante los doce ltimos aos y el porcentaje de automviles importados por la compaa Alfa SAC. Ao 1 2 3 4 5 6 7 8 9 10 11 12 a) b) c) d) Automviles Porcentaje vendidos de Alfa 60 50.2 78 50.4 73 44.0 103 49.9 101 39.5 108 43.1 115 44.0 154 40.1 135 36.0 155 31.7 174 28.6 171 27.8

El nmero de automviles vendidos se relaciona de forma directa o indirecta con el porcentaje del mercado de la empresa ALFA? Trace un diagrama de dispersin para apoyar su conclusin. Determine el coeficiente de correlacin entre las dos variables. Interprete el valor. Es razonable concluir que hay una asociacin negativa entre ambas variables? Utilice el nivel de significancia de 0.01. Cunta variacin en el mercado de ALFA se explica por la variacin en los automviles vendidos?

ANIANO URTECHO AGUILAR

18

You might also like