You are on page 1of 38

Tema 3: Anlisis de Regresin

1
Agenda
Definicin de Regresin
Funcin aproximante
Regresiones Lineales y no Lineales
Precisin del modelo de regresin
Mtodo de mnimos Cuadrados

2
Definicin
Es el procedimiento de encontrar la relacin
entre variables a partir de una serie de datos
Utilidad:
Permite predecir un valor basndonos en el
conocimiento de otro
Valor a predecir: variable dependiente (y)
Valor conocido: variable independiente (x)

3
Definicin
Objetivo de la regresin
Intentar reconocer a partir de un conjunto de
datos observados (xi, yi) si hay relacin entre las
variables, de qu tipo, y si es posible predecir el
valor de una de ellas en funcin de la otra

4
Diagrama de Dispersin
El conjunto de observaciones pueden ser
representadas en un diagrama de dispersin
(scatterplot).
En los diagrama de dispersin, cada variables
observadas es representada por una
coordenada

5
Aproximacin
Buscamos una funcin que sea una buena
aproximacin a una nube de puntos (xi,yi),
mediante una curva de algn tipo conocida
Y=f(X)
o Funcin aproximante o curva aproximante

Debemos de asegurarnos de que la diferencia


entre los valores Yi (observacin) e
(aproximacin) sea tan pequea como sea
posible.
6
Diagrama de Dispersin
Observacin
(xi, yi)

Aproximacin i= f(x)
(xi, i)

7
Ejemplos
Modelo
Lineal Para los valores de
X mayores que la
media le
corresponden
valores de Y
mayores tambin

Cuando x crece,
y crece Relacin directa
8
Ejemplos
Modelo
Para los valores de
Lineal
X mayores que la
media le
corresponden
valores de Y
menores

Cuando x crece,
y decrece Relacin inversa
9
Ejemplos

Modelo no Lineal
Buen ajuste

Cuando x crece,
y crece

10
Ejemplos

Modelo no Lineal
Buen ajuste

Cuando x crece,
y decrece
11
Ejemplos

Variables no relacionadas Para valores de X


Ninguna curva de regresin por encima de la
es adecuada media tenemos
valores de Y por
encima y por
debajo en
proporciones
similares

no-correlacin
12
Regresin
Podemos hacer un ajuste visual
trazando una curva aproximante que representa
los datos observados

las constantes del


modelo matemtico
se obtienen del
mismo grfico

13
Regresin
Podemos hacer un utilizando mnimos cuadrados
constantes del modelo matemtico

=b+aX

b : ordenada en el origen,
constante
a : pendiente de la recta i= f(x)

14
Mnimos Cuadrados: Regresin Lineal

solucin del sistema de ecuaciones:

15
Covarianza de dos variables X e Y
La covarianza entre dos variables, Sxy, nos indica si la
posible relacin entre dos variables es directa o
inversa

El signo de la covarianza nos dice si el aspecto de la


nube de puntos es creciente o no, pero no nos dice
nada sobre el grado de relacin entre las variables.
16
Coeficiente de Correlacin Lineal de
Pearson
Se denota con la letra r
Este coeficiente indica si los puntos tienen una
tendencia a disponerse alineadamente
Excluyendo rectas horizontales y verticales
r es til para determinar si hay relacin lineal
entre dos variables
No servir para otro tipo de relaciones:
cuadrtica, logartmica, etc.

17
Coeficiente de Correlacin Lineal de
Pearson (r)
De su signo obtenemos el que la posible
relacin sea directa o inversa
Es adimensional
Slo toma valores en [-1,1]
Las variables son no-correlacionadas r=0

Relacin Inversa Variables no Relacin Directa


perfecta correlacionadas casi perfecta

-1 0 1 18
Coeficiente de Correlacin Lineal de
Pearson (r)
Relacin Variables no Relacin Directa
Inversa perfecta correlacionadas casi perfecta

-1 0 1

19
Coeficiente de Correlacin Lineal de
Pearson (r)

r= -0.5 r= -0.999

r= 0.4 r= 0.99

20
Precisin del modelo de regresin
La precisin de un modelo de regresin se
mide usando una cantidad llamada:
Coeficiente de determinacin - R2
R2 representa la proporcin de variabilidad
total en las observaciones de Y que se explica
por la lnea de regresin

21
Coeficiente de determinacin (R2)
Variabilidad
en el eje Y La franja rosada
(sombreada)
indica la zona
donde varan los
valores de Y.

22
Coeficiente de determinacin (R2)
Errores de proyeccin
( eje Y)

23
Coeficiente de determinacin (R2)
2
= =

2

= 1

Cuanto menor sea la dispersin del error


residual mejor ser el ajuste de regresin

R2 = r2 slo cierto para la regresin lineal simple!!!


= + 24
Coeficiente de determinacin (R2)
R2 es una cantidad adimensional que slo puede
tomar valores en [0, 1]
Para R2 cerca de 1
Ajuste de regresin lineal bueno
La lnea de regresin puede explicar una gran porcin
de la variabilidad en los valores de y
Para R2 cerca de 0
puede significar que el modelo de lnea recta no
representa completamente la relacin entre las
variables
Ajuste lineal malo

27
Otros modelos de regresin
Se pueden considerar otros tipos de modelos,
en funcin del aspecto que presente el
diagrama de dispersin (regresin no lineal)

28
Mnimos Cuadrados: Regresin no
Lineal
Ecuaciones de curvas aproximantes:

Y=a+bx

= + + 2

29
Anlisis de Regresin
Recta de mnimos cuadrados:
Sea la ecuacin:
Y = a0 + a1X
Aplicando sumatorias Y = a0N + a1 X
*X y aplicando sumatorias XY = a0 X + a1 X2
Mnimos Cuadrados: Regresin Lineal
Ecuacin:
Y = b + ax
Aplicando sumatorias Y = b*n + a X
*(x) + sumatorias XY = b X +a X2
solucin del sistema de ecuaciones:

31
Mnimos Cuadrados: Regresin Lineal

solucin del sistema de ecuaciones:

a : pendiente de la recta b : ordenada en el origen,


constante 32
Mnimos Cuadrados: Regresin no
Lineal
Y = a0 + a1x + a2x2
Aplicando sumatorias Y = a0n + aX + a2 X2
*X y aplicando sumatorias XY = a0 X + a1 X2 + a2 X3
*X2 y aplicando sumatorias X2Y = a0 X2+ a1 X3 + a2 X4

solucin del sistema de ecuaciones:

33
Mnimos Cuadrados: Regresin no
Lineal -MULTIVARIABLES
Z = a0 + a1X + a2Y
Aplicando sumatorias Z = a0N + a1 X + a2 Y
*X y aplicando sumatorias XZ = a0 X + a1 X2 + a2 XY
*Y y aplicando sumatorias YZ = a0 Y+ a1 XY + a2 Y2

solucin del sistema de ecuaciones:

34
Prctico
Ejercicio 1
Se tienen datos experimentales que
representan la relacin que existe entre el
cambio del volumen (pulg3) de un gas y la
presin (psi) del mismo
Donde P = f(V).
Se conoce que el comportamiento de del gas
sigue el modelo de la forma:

PV k =C 35
Prctico
Datos:

36
Prctico
Realizar:
1. El diagrama de dispersin en coordenadas rectangulares.
2. El diagrama de dispersin en coordenadas y escalas
adecuadas, conociendo que el comportamiento de
modelo
3. Determinar mediante el mtodo grfico las constantes K y
C, de la ecuacin aproximante.
4. Determinar mediante el mtodo de Mnimos Cuadrados,
las constantes K y C, de la ecuacin aproximante.
5. Estimar P, para cuando V=100 , 150 y 200 pulg3.
6. Realizar la curva de la ecuacin aproximante

37
Prctico
Algunas sugerencias:
P*Vk = C
Aplicando logaritmos:
log P + k log V = log C
Ordenando trminos:

log P = log C - k log V

Y a0 a1 X 38
Prctico

log P = Y; log C = a0
log V = X ; -k = a1
39
Prctico Kr Agua- Condensado
Sw Krw Krow
Ejercicio 2 0.5527 0.0319 0.7513
1. Determine el mejor 0.5675 0.0638 0.5477
ajuste para el 0.5822 0.0956 0.3847
siguiente conjunto de 0.5969 0.1275 0.2577
datos 0.6116 0.1594 0.1623
2. Presente la ecuacin
0.6264 0.1913 0.0939
de las curvas
aproximantes 0.6411 0.2231 0.0481
3. Genere las curvas 0.6558 0.255 0.0203
aproximantes 0.6705 0.2869 0.006
0.6853 0.3188 0.0008
0.7 0.3506 0
40

You might also like