You are on page 1of 31

UNIVERSIDAD NACIONAL AUTNOMA DE

NICARAGUA, UNAN-Len

QUIMIOMETRIA
MSc. FABIO PALAVICCINI

CALIBRACIN
Y REGRESION
LINEAL

ANLISIS DE CORRELACIN
COVARIANZA DE DOS VARIABLES ALEATORIAS X e Y
La correlacin es una mediad de la asociacin entre dos variables entre dos
variables. Cuando existe correlacin los valores a lo largo de las dos estn
ligadas entre si de algn modo.
Esta relacin se estima a travs de la covarianza (COVxy) la cual nos indica si la
posible correlacin entre dos variables es directa o inversa:

Directa: Si COVxy > 0

Inversa: Si COVxy < 0

Incorreladas: Si COVxy = 0

El signo de la covarianza nos dice si el aspecto de la nube de puntos es


creciente o no, pero no nos dice nada sobre el grado de relacin entre las
variables.
3

ANLISIS DE CORRELACIN
COEFICIENTE DE CORRELACIN LINEAL DE PEARSON

El coeficiente de correlacin lineal de Pearson de dos variables, r, nos indica si


los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas
horizontales y verticales).
Tiene el mismo signo que COVxy. Por tanto de su signo obtenemos el que la
posible relacin sea directa o inversa.
r es til para determinar si hay correlacin lineal entre dos variables, pero no
servir para otro tipo de relaciones (cuadrtica, logartmica,...)

ANLISIS DE CORRELACIN
PROPIEDADES DE r

Es adimensional.

Slo toma valores entre

Las variables son incorreladas cuando r = 0.

Relacin lineal perfecta entre dos variables cuando r = +1 o cuando r = -1.

Cuanto ms cerca est r de +1 o -1 mejor ser el grado de correlacin lineal.

-1
Relacin directa
casi perfecta

0
Variables
incorreladas

+1

Relacin directa
casi perfecta

ANLISIS DE CORRELACIN
CORRELACIONES POSITIVAS

ANLISIS DE CORRELACIN
CORRELACIONES POSITIVAS

ANLISIS DE CORRELACIN
CORRELACIONES NEGATIVAS

ANLISIS DE REGRESIN
De lo que se trata es de verificar la funcin matemtica que permita predecir a que
valores de una variable y corresponden valores dados de una variable x. Esto se
suele escribir como y = f (x), donde x es la variable independiente y la variable
dependiente es y.
Rectas de regresin

Y^bbx

(x3,y3)
(x4,y4)

(x1,y1)

(x2,y2)

ANLISIS DE REGRESIN
Entonces para cada valor medido de x se tendrn dos valores:
El valor medido en el experimento y
Y su valor esperado, calculado a partir de la recta de regresin
La diferencia entre ambos (y - ) debe ser lo ms pequea posible, para tener una
buena aproximacin, al modelo ,lineal.
El objetivo del Anlisis de Regresin es minimizar matemticamente el cuadrado de
estas diferencias con el denominado mtodo de los mnimos cuadrados.


bi

2
i

0
10

MODELO DE REGRESIN LINEAL


Consideremos el caso del modelo:
En ste modelo, 0 y 1 son parmetros poblacionales que no se
conocen. 0 es conocido como la ordenada en el origen, intercepto
o intercepcin de eje poblacional y 1 es la pendiente poblacional
del modelo.

Donde
es la prediccin de y, b0 es la estimacin de 0 y b1 es la
estimacin de 1, estos se denominan coeficientes de regresin.

11

MODELO DE REGRESIN LINEAL


Para cada xi la diferencia entre el valor real observado yi, y el valor
predicho, es denominada residual o residuo, ei, el que se calcula
mediante:
En la siguiente figura se muestran algunas caractersticas del
modelo:

12

MODELO DE REGRESIN LINEAL


PARAMETROS DE REGRESION

COEFICIENTE DE
DETERMINACIN

PENDIENTE

EL INTERCEPTO U
ORDENADA EN EL ORIGEN

13

MODELO DE REGRESIN LINEAL

ANLISIS DE GRAFICOS DE LOS RESIDUOS


Buena Linealidad

No existe buena linealidad

+
0
-

0
-

14

MODELO DE REGRESIN LINEAL


LINEALIDAD DE UN MODELO
Tal y como ya hemos mencionado en algunas ocasiones solemos utilizar el
coeficiente de correlacin lineal para decir si un modelo es lineal. Por lo general
este coeficiente se ubica en el intervalo:

Es importante especificar que, el hecho de que r = 0, no significa que no exista


correlacin entre los datos, solo que esta no es lineal.
Un test que puede ayudarnos a decidir sobre la linealidad de un recta de
calibracin es calcular el siguiente estadstico t:

Luego se compara ste con ttab a un nivel de significacin deseado ( = 0.05)


usando una tabla de 2 colas y n-2 grados de libertad.
15

MODELO DE REGRESIN LINEAL


LINEALIDAD DE UN MODELO
Para ello plantemos las siguientes hiptesis:
H0: No existe linealidad entre x e y
H1: Existe linealidad entre x e y
Si tcal >ttab se rechaza H0 y se concluye que existe correlacin
lineal entre los datos x e y.

16

ANLISIS DE VARIANZA PARA LA REGRESIN LINEAL SIMPLE


Cuando cada particin se asocia a una porcin correspondiente del total de
grados de libertad, la tcnica es conocida cono ANALISIS DE VARIANCIA
(ANOVA), que generalmente se presenta en un cuadro de la siguiente forma:
Fuentes de variacin
Regresin
Error o residual
total

Cuadro de ANOVA
Suma de cuadrados GL Cuadrados medios
Fcal
SCR
1
CMR=SCR/1
CMR/CME
SCE
n-2
CME=SCE /n-2
SCT
n-1

El estadstico de contraste es F. Se evala las hiptesis:


H0 : No existe una regresin lineal entre X e Y
H1 : Existe regresin lineal de Y en funcin de X
Se compara el Fcal con un F(0.05;1;n-2).
Si Fcal > Ftab, se rechaza H0 y existe un alto grado de que la regresin sea lineal, es decir la
regresin lineal es altamente significativa.
17

ANLISIS DE VARIANZA PARA LA REGRESIN LINEAL SIMPLE

Los trminos del ANOVA son:


Suma de cuadrados del total (SCT), mide la dispersin o variacin total en los
valores observados de Y. Este trmino se utiliza para el clculo de la variancia de
la muestra.

Suma de cuadrados explicada (suma de cuadrados debido a la regresin,


scr) mide la variabilidad total en los valores observados de Y en consideracin a la
relacin lineal entre X e Y.

Suma de Cuadrados inexplicada (Suma de Cuadrados del Error o Residual,


SCE) mide la dispersin de los valores de Y observados respecto a la recta de
regresin de (es la cantidad que se minimiza cuando se obtiene la recta de
regresin).
18

MODELO DE REGRESIN LINEAL


ERRORES EN LA PENDIENTE Y EL INTERCEPTO
Para calcular los errores aleatorios en la pendiente e intercepto,
se debe calcular en primer lugar el error de los residuos Sy/x, que
estima los errores aleatorios en el eje y.
Desviacin residual

Desvo de la pendiente

Desvo del intercepto


19

MODELO DE REGRESIN LINEAL


ERRORES EN LA PENDIENTE Y EL INTERCEPTO
Los valores de Sb0 y Sb1, pueden ser usados para calcular los
limites de confianza de los coeficientes de regresin:

Estos intervalos sirven para decidir si la recta se ajusta a


determinadas especificaciones predeterminadas de antemano,
tales como: 0 = 0 y 1 = 1.

20

APLICACIN No I

21

22

MODELO DE REGRESIN LINEAL


CALCULO DE UNA CONCENTRACIN Y SU ERROR ALEATORIO
La concentracin de una muestra a partir de los coeficientes de regresin
se realiza mediante:

Sin embargo conviene estimar el error asociado a la concentracin


calculada, mediante la siguiente ecuacin:
CAP

Donde y0 es el valor experimental de y a partir del cual se determina la concentracin x 0,


Sxo es la desviacin estndar estimada de x0,
n es el nmero de puntos de la recta de regresin.

Una vez calculado esto se expresa la concentracin de la muestra como


un intervalo, como sigue:
23

MODELO DE REGRESIN LINEAL


CALCULO DE UNA CONCENTRACIN Y SU ERROR ALEATORIO
En algunos casos el investigador o analista, puede realizar varias lectura de y0
para obtener una media de x0, en tal caso se dispone de m lecturas por lo que la
ecuacin de Sx0 que se usa es:

Donde y0 es el valor experimental de y a partir del cual se determina la


concentracin x0, Sxo es la desviacin estndar estimada de x0, n es el nmero de
puntos de la recta de regresin, m es el nmero de lecturas realizadas a y0. Una
vez calculado esto se expresa la concentracin de la muestra como un intervalo,
como sigue:

24

INTERVALOS DE CONFIANZA EN REGRESIN LINEAL

En muchos casos es de inters conocer, entre que valores


se encuentra los trminos de un modelo de regresin, esto
para darnos una idea del ajuste del modelo.
En estas condiciones hacemos uso de los llamados:
Intervalos de confianza (en algunos casos llamados
tambin bandas de confianza), que nos ayudan a discernir
grficamente que tan bien se encuentra ajustado nuestro
modelo de regresin.
Estos pueden ser calculados usando las siguientes
ecuaciones:

y
t 2 s

( xg x ) 2
1
1
n
( xi x ) 2

Intervalos de confianza

25

APLICACIN DE REGRESION
Dado los siguientes valores de estndar de concentracin de oxitocina con sus
respectivas respuesta. encuentre los parmetros de regresin, evalu la linealidad.
Si la lectura de rea de una muestra es 458860.3, cual es la concentracin de
oxitocina en la muestra con su error
Conncetracin
UI/mL
1
2
4
8
16

a
b
Sa
Sb
R2

2163.520
83
117183.1
808
1649.320
871
199.7160
498
0.999991
286

respuesta

115344.5
229393.5
469670.0
934958.0
1872495.0

26

REGRESIN LINEAL PONDERADA


Si los datos son heterocedsticos o si bien han perdido homocedasticidad
al linealizar el modelo, la recta de regresin no es adecuada para el
calculo de los limites de confianza.
En estas condiciones hacemos uso de la regresin ponderada. Par esto
previamente debemos calcular una funcin de ponderacin que utiliza el
inverso de la varianza de y.

La pendiente se calcula mediante:

Donde:

son las coordenadas del centroide ponderado, es decir:

27

REGRESIN LINEAL PONDERADA


Puesto que la recta de regresin ponderada pasa por el centroide
ponderado, la ordenada en el origen se calcula mediante:

La desviacin estndar de los residuos se calcula mediante:

La desviacin estndar del intercepto y la pendiente se calcula mediante:

28

REGRESIN LINEAL PONDERADA


La desviacin estndar de la prediccin de la concentracin viene dada por:

Donde w0 es una ponderacin adecuada de y0 La desviacin estndar de la


prediccin de la concentracin viene dada por:
En regresin ponderada y debido al trmino 1/w0 la precisin de las predicciones
vara con el peso del punto donde se hace la lectura. En general el trmino 1/w0
aumenta con el aumento de x, por lo que se obtienen lmites de confianza mayores
a valores altos de concentracin, esto se refleja en el siguiente grfico.

29

REGRESIN LINEAL PONDERADA


Se prepar una curva de calibracin estandares de cido ascrbico en ppm, para
cada estndar se realizaron tres replicas. evale la linealidad del mtodo, por
regresin lineal simple y por regresin ponderada.
C ppm /
replicas
1
5
10
15
20
25

1
26.3796
110.763
7
271.739
5
415.619
1
544.435
7
671.525
6

2
26.3238
111.0972
272.1218
416.0305
537.2949
674.4119

3
25.0436
112.608
9
277.487
9
415.619
1
539.356
7
676.762
8

30

REGRESIN LINEAL PONDERADA


Dado los siguientes niveles de concentracin de alfa-Tocoferol con las respectivas
lecturas de reas en diferentes muestras. Evale la linealidad y encuentre la
concentracin de alfa tocoferol
rea
Nivel
1
2
3
4
5

Concentracin (%)
0.0022
0.0037
0.0059
0.0081
0.0103

211118.5
363923.8
564046.3
761679.1
962813.7

Media de las reas de los picos de -Tocoferol, de las muestras diluidas y saponificadas de los aceites vegetales comerciales estudiados

Diluidas
Saponificadas

Clover
564903.7
653974.5

Girol
489510.3
372543.1

Regia
426789.4
612243.3

Sabemas
422321.1
635228.3

31

You might also like