Professional Documents
Culture Documents
0 j x ji wi , i 1, , N
(1.1)
j 1
dove wi una sequenza aleatoria a valor medio nullo che rappresenta il disturbo connesso al
rilevamento sperimentale delle misure
yi della
modello che devono essere determinati sono lordine del modello m e le m 1 costanti 0 , , m .
Nei riguardi del legame tra la grandezza di misura e le variabili indipendenti , tali costanti hanno un
significato preciso. La costante 0 loffset del modello, e rappresenta il valore di y quando tutte
le variabili indipendenti hanno valore nullo; sebbene questo possa sembrare un controsenso difatto
pi frequente di quanto non si pensi in quanto il pi delle volte il modello lineare una
rappresentazione del comportamento del processo allo studio nellintorno di un punto di lavoro
y f x1 , , xm che corrisponde a determinati valori costanti y , x1 , , xm della variabile di
misura e di quelle indipendenti, mentre i valori x1i , x2i , , xmi sono le variazioni di ampiezza
opportuna rispetto ai valori di equilibrio x1 , , xm . Inoltre 0
utile per intercettare
eventualmente un valor medio non nullo del disturbo di misura. La costante generica j rappresenta
la sensibilit della variabile di misura rispetto alle variazioni della j -esima variabile indipendente
x j quando le altre sono tenute costanti; infatti risulta
y
,
x j
j 1, , m
Il modello (1.1) molto usato in vari campi, per cui i suoi elementi sono suscettibili di varie
denominazioni, di cui si riportano quelle pi usate: luscita viene chiamata genericamente dato; le
variabili indipendenti vengono dette variabili di regressione, regressori, predittori, scores; i
parametri possono chiamarsi coefficienti di correlazione parziale, oppure loads. Il modello quindi
pu trovarsi sotto il nome di modello di regressione lineare, modello di regressione multipla o
multivariata.
Assegnato ora un set di N misure sperimentali yi della grandezza di misura e delle
variabili indipendenti x ji vogliamo stimare i parametri del modello; a tale scopo, sulla base di
opportune informazioni a disposizione circa il processo allo studio, si scelga un valore dellordine
m del modello, tale scelta sar poi perfezionata in sede di validazione del modello identificato. I
parametri 0 , , m possono essere determinati minimizzando la seguente funzione di costo
2
m
1 N
(1.2)
yi 0 j x ji N yi yi
i 1
j
i
1
1
T
per cui si vuole trovare il valore 0 m che minimizzi lo scarto quadratico medio tra le
misure sperimentali yi ed i valori delluscita riprodotti dal modello identificato yi .
1
f 0 , , m
N
Per il problema dei minimi quadrati sar dimostrato pi avanti la sussistenza di condizioni
necessarie e sufficienti di minimo globale
i 1
j 1
2
f
N
0
yi 0 j x ji 0
2
f
N
k
yi
i 1
0 j x ji xki 0 ,
j 1
(1.3)
k 1, , m
1
N
yi ,
2y
1
N
yi y
2yxk
i 1
N
1
N
i 1
yi y
x ki
i 1
, x2k
i 1
1
N
xk
1
N
xki xk
N
i 1
xki xk , x2h xk
1
N
xhi xh xki xk
N
i 1
y 0 j x j
j 1
1
N
yi x k i
i 1
0 xk
N m
j x ji xki ,
(1.4)
k 1, , m
i 1 j 1
Ora, per il generico k , si moltiplichi la prima delle (1.4) per xk e la si sottragga dalla seconda
delle (1.4); si ottiene
1
N
m
1
y
x
i k i y xk j N
i 1
j 1
i 1
x ji xki x j xk ,
k 1, , m
(1.5)
1
N
yi x k i y x k
i 1
1
N
yi y xki xk 2yxk
N
i 1
(1.6)
1
N
x ji xki x j xk
i 1
1
N
x ji x j xki xk x2 j xk
N
i 1
y 0 j x j
j 1
2
yxk
j x2 j xk
j 1
(1.7)
, k 1, , m
Il sistema (1.7) fornisce la stessa soluzione del sistema (1.4) da un punto di vista teorico; tuttavia da
un punto di vista numerico, mentre i coefficienti del sistema (1.4) sono dati dai campioni misurati
della variabile di misura e di quelle indipendenti, valori quindi affetti da rumore di misura, i
coefficienti del sistema (1.7) sono dati dalle medie campionarie dei suddetti campioni, in cui la
presenza del rumore drasticamente ridotta proprio dalloperazione di media campionaria; dal
sistema (1.7) otterremo quindi una stima dei parametri del modello numericamente pi affidabile.
Esaminiamo ora alcuni modelli tipici.
2yx1
x21
0 y 1 x1
2
2
2
yx x x
2 2 1 x2 2
da cui si ottiene
pi usati quello del R 2 : esso consiste nel valutare in che percentuale i dati yi 0 j x ji
j 1
yi . A tale scopo
yi y
N
i 1
yi yi
i 1
yi y
N
(1.8)
i 1
Il primo termine a destra viene detto varianza residua, mentre il secondo termine a destra viene
detto varianza spiegata (dal modello sintende). Il modello identificato tanto migliore quanto pi
la varianza spiegata eguaglia la varianza totale, cio quanto pi
R2
yi y
i 1
N
yi y
i 1
prossimo ad uno. Se questo non dovesse succedere si deve aumentare lordine del modello; tale
scelta fa certamente diminuire il valore della varianza residua in quanto questa costituisce proprio il
valore allottimo della funzione di costo dei minimi quadrati. Tuttavia si pu aumentare lordine
m del modello fino a che la diminuzione della varianza residua significativo.
Come si vede dalla figura, aumentare lordine da m1 a
m2 produce una forte diminuzione della varianza
residua; aumentare ancora lordine fino a m3 o anche
oltre non produrrebbe diminuzioni apprezzabili del
residuo; a questo punto se il valore di R 2 non dovesse
risultare prossimo a 1, si dovrebbe ritenere che il
modello lineare non in grado di rappresentare
adeguatamente il legame tra le variabili di ingresso e di
uscita.
Per la scelta della complessit del modello esistono altri
criteri che tengono anche conto della numerosit del
m 1
ln f
N
Questo, dato che m assume solo valori interi positivi,
viene fatto semplicemente calcolando la funzione c m
c m 2
i 1
pi2
yi
0 j x ji
j 1
(1.9)
ji
yi yi
yi
ji
x ji x j
xj
(1.10)
1
N
i j ji
i 1
j 1
(1.11)
dove ovviamente non compare il termine di offset dato che tutte le variabili sono a valor medio
nullo.
I parametri 1 , , m che si ottengono dalla minimizzazione della (1.11), dove gli scarti si
riferiscono a variabili tutte con la stessa scala di variazione, sono legati a quelli del modello
originale 0 ,1 , , m da semplici relazioni. Infatti tenendo conto che
xj x
m
m
j
yi y y i y y j j y y j i
i
xj
j 1
j 1
m
m
y j
x j y j x ji
y
j 1
xj
j 1
xj
0 j x x j
j 1
si ottiene
y
, j 1, , m ,
xj j
0 y
j 1 x j
j 1
j x j y j x j
(1.12)