You are on page 1of 6

ESTADSTICA DESCRIPTIVA Ing.

Enrique Morales Cauti

ANALISIS DE REGRESIN Y CORRELACION LINEAL

EJEMPLO PRCTICO:

Se tiene a continuacin las ventas de un nuevo producto (Y) que crecen en progresin
geomtrica en funcin del tiempo de exposicin en el mercado (X):

VENTAS TIEMPO
(Y) (X)
3 0
7 1
9 2
21 3
33 4
70 5

El modelo matemtico a hallar ser: y = b1x1 + b2x2 pero como x1 siempre equivale a 1,
entonces el modelo matemtico se simplifica a: y = b1+ b2x2
Para lo cual primero tenemos que desarrollar la ecuacin matricial B = (XT.X)-1.(XT.Y)

b1
Donde al final B ser una matriz de orden (2x1), sea B =
b2
Desarrollando la ecuacin matricial:

1 0
1 1

1 2

Matriz [X] (6x2) X = 1 3
1 4

1

5
X1X 2
Nota: Siempre la primera columna de la matriz X tiene como elementos a la unidad, la segunda
columna corresponde a los datos del problema.

3
7

9

Matriz [Y] (6x1) Y = 21
33

70

Yi
1 0
1 1

1 1 1 1 1 1 1 2 6 15
XT.X = *
0 1 2 3 4 5 1 3 15 55
1 4

1 5
0,52381 0.14286
(XT.X)-1 =
0.14286 0.057143
3
7

1 1 1 1 1 1 9 143
XT.Y = *
0 1 2 3 4 5 21 570
33

70

0,52381 0,14286 143 6,5238


B = (XT.X)-1.(XT.Y) = *
0,14286 0,057143 570 12,1428

b1 6,5238
B = =
b2 12,1428

El modelo matemtico para y = b1+ b2x2 es: y = - 6,5238+ 12,1428 x

Pero antes de hacer los clculos sobre pronsticos, debemos verificar la idoneidad del
modelo, para lo cual se requiere calcular e interpretar:

ndice de Determinacin (R2)


Coeficiente de correlacin (R)
Prueba F

ndice de Determinacin (R2)

2
B T (X T Y) nY
R2 2
(Y T Y) nY

Primero tenemos que resolver las ecuaciones matriciales dadas

143
BT.(XTY) = 6,5238 12,1428 * 5988,4926
570

3
7

9
(YTY) = * 3 7 9 21 33 70 6569
21
33

70
Reemplazando valores en la frmula dada tenemos:

5988,4926 6(23,8333) 2
R2 0,81635
6569 6(23,8333) 2
El valor de 0,81635 indica que el 81,635% de las ventas del producto es explicado por el tiempo
de exposicin, el restante 18,365% se debe a otros factores.

Coeficiente de correlacin (R)

R = (R2)1/2
Reemplazando en la frmula tenemos:

R = (0,81635)1/2 = 0,90352
Este valor 0,90352 por ser cercano a 1 proporciona confianza al modelo, indicando un alto
grado de relacin entre las variables.

Prueba F: (considerando un = 5%)

HO = El modelo no tiene la confianza requerida


H1 = El modelo tiene la confianza requerida

R2
(k 1) Observacionesexplicadas
Fc
(1 R ) Observacionesnoexplicadas
2

nk

Donde k es nmero de variables y n la cantidad total de datos que hay en una variable,
reemplazando en la frmula tenemos:
0,81635
(2 1)
Fc 17,781
(1 0,81635)
62

ste valor se compara con el F de la tabla de Fisher, para lo cual se considera:


FT(1-=0,95; V1=k-1=1; V2=n-k=4) = 7,709

Como Fc = 17,781 > FT = 7,709; entonces se rechaza Ho y se acepta H 1, por lo que se concluye
que el modelo tiene la confianza requerida a un nivel de significacin del 5%.

Como ya se ha probado la confiabilidad del modelo, con la ecuacin y = - 6,5238+ 12,1428 x se


pueden hacer pronsticos, as por ejemplo si tenemos que el tiempo x = 6 entonces se
obtendrn ventas de y = - 6.5238+ 12,1428 (6) = 66,3 unidades. Es decir cuando x = 6, y = 66,3

Para obtener ventas del orden de 100 unidades (sea y = 100), entonces se demora alrededor
de 100 = - 6.5238 + 12,1428 (x), despejando x = 8,8 unidades de tiempo.

Tambin podemos hacer la Estimacin y Verificacin de los Coeficientes del modelo


matemtico hallado:

Para hacer la estimacin por intervalos de confianza tenemos que desarrollar la siguiente
ecuacin:
( bj T.Sbj < Bj < bj + T.Sbj ) = (1-) %

Primero calculamos la varianza del error o residuo:

S2e = (YTY BT(XTY)) / (n-k)

Reemplazando valores tenemos:

S2e = (6569- 5988,4926) / (6-2) = 145,1268

Obtenido ste indicador de variabilidad, se procede a determinar la varianza de los


estimadores:

0,52381 S 2 b 1
2
S bj = 2
S e(X X)T -1*
= 145,1268 *
0.057143 = =
S 2b 2
76,01887
8,29298

Entonces la varianza de los estimadores ser: S2b1=76,01887; S2b2=8,29298; Por lo que la


desviacin estndar de los estimadores ser: Sb1=8,71889; Sb2=2,87975
As tenemos el intervalo de confianza para B1:

b1 T.Sb1 < B1 < b1 + T.Sb1; donde el valor de T viene de la tabla T-Student T(P:1-2 = 0,975 y
n-k = 6-2 = 4GL), donde T = 2,776; reemplazando valores tenemos:

- 6,5238 2,776(8,71889) < B1 < - 6,5238 + 2,776(8,71889) = -30,727 < B1 < 17,680; por lo que
[-30,727; 17,680] es un intervalo del 95% de confianza para B1.

Del mismo modo el intervalo de confianza para B2:

B2 T.Sb2 < B2 < b2 + T.Sb2; donde el valor de T = 2,776; reemplazando valores tenemos:

12,1428 2,776(2,87975) < B2 < 12,1428 + 2,776(2,87975) = 4,149 < B2 < 20,134; por lo que
[4,149; 20,134] es un intervalo del 95% de confianza para B2.

Una vez estimado los intervalos de confianza para los coeficientes, se procede a verificar stos
estimadores, es decir se realiza las pruebas de hiptesis respectivas para los estimadores.

Verificacin de b1:

Se plantean las hiptesis de la siguiente manera: Ho: B 1 = b1 y H1: B1 b1, se elige el mismo
nivel de significacin de la estimacin, es decir =5%, se determina la RA/Ho a partir del valor T
de la tabla de T-Student, vale decir T(P:1-2 = 0,975 y n-k = 6-2 = 4GL), donde T = 2,776, por
lo que la RA/Ho: [-2.776; 2,776]; luego se halla el valor Tc y se determina si est en el intervalo
de la RA/Ho:

Tc = bj / Sbj;

Para ste caso especifico Tc = b1 / Sb1, entonces Tc = - 6,5238 / 8,71889 = -0,748

Finalmente se decide, como Tc=-0,748 pertenece a la RA/Ho: [-2.776; 2,776]; entonces se


acepta Ho por lo que a un nivel de significacin del 5% se admite que b 1 es un buen estimador
para B1.

Verificacin de b2:
Se trabaja de la misma forma, planteando las hiptesis de sta manera: Ho: B 2 = b2 y H1: B2
b2, se elige el mismo nivel de significacin 5% y se determina la RA/Ho: [-2.776; 2,776];
finalmente se halla el valor Tc = b2 / Sb2, entonces Tc = 12,1428 / 2,87975= 4,217. Finalmente se
decide, como Tc=4,217 no pertenece a la RA/Ho: [-2.776; 2,776]; entonces se rechaza Ho y se
acepta H1 por lo que a un nivel de significacin del 5% se admite que b 2 no es un buen
estimador para B2.

Resolucin del mismo ejemplo utilizando Excel:

Utilizando las herramientas de Excel podemos resolver el mismo ejemplo de acuerdo a la ruta
de comandos. Datos /anlisis de datos / Regresin:
Al hacer clic en Aceptar sale la siguiente informacin:

EJERCICIO PROPUESTO:
En una muestra de 10 obreros de una fbrica de conservas, se han observado sus aos de
experiencia y el tiempo en horas que tardan en realizar una determinada tarea. Los datos se
muestran en la siguiente tabla:
TIEMPO AOS DE
TRANSCURRIDO EXPERIENCIA
10 1
9 2
8 3
7 4
6 5
5 6
4 7
3 8
2 9
1 10
Se sabe que el tiempo que tardan los obreros en realizar una tarea, esta en funcin de sus aos de
experiencia, es decir: y = f (x)
x = Aos de experiencia
y = Tiempo que demora en realizar una tarea (en horas)
a) De acuerdo a los datos de la muestra tomada, hallar el siguiente Modelo matemtico: y = b1 +
b2x2 Utilizando la siguiente ecuacin matricial: B = (XT.X)-1.(XT.Y) (Respuesta: y = 11 x).
b) Si un obrero que tenga solo 6 meses de experiencia, en cuantas horas realizara una
determinada tarea. (Respuesta: y = 11 0,5 = 10,5 aos)

You might also like