You are on page 1of 11

篇名:

應用線性迴歸方法進行實驗數值分析與預測

作者:
施宗憲。國立埔里高工。高二資訊科甲班
萬明珠。國立埔里高工。高二資訊科甲班
應用線性迴歸方法進行實驗數值分析與預測

壹●前言

在閱覽報章雜誌時,常看到有專家學者預測未來的人口增加率或者是明年度的經濟
成長趨勢而感到好奇,想探究那些專家學者是用什麼方法得知那些數據,以及課堂
上常做的實驗數據是否也能用那些方法進行數值分析與預測,因此我們著手收集相
關文獻加以研讀,並以一些統計資料與實驗數據來分析探討。

本文旨在就目前在科學或工程研究領域中,所採用最小平方法(least-square method)
來做曲線揉合(curve fitting),將有限的數據資料或實驗資料,找出一代表性函數來近
似,使函數與資料之偏離誤差為最小,並以此函數來分析並瞭解這些資料數據其背
後所蘊涵的意義,進而估測其內部其它值以及預測未來之趨勢,延伸這些統計或實
測資料之使用性。

這時我們想到在第三冊數學課本的第 1 章裡所提到的點到直線之距離公式(註一)和
第二冊數學課本的第三單元裡所提到之指數(註二)與對數(註三)特質與其圖形以及
第四冊數學課本的第 3 章裡所提到之導函數基本性質與意義(註四),可以用來計算
那些數據,因此我們著手研究要如何運用這些觀念來理解最小平方法(least-square
method),並以線性函數模式加以探討,且以課堂上的直流暫態實驗數據來進行曲線
揉合(curve fitting),推測與驗證其計算出之數據。

貳●正文

科學家和工程師經常想要使用一個數學方程式的函數來代表實驗數據或統計資料,
希望經由此方程式,可從已知參數(自變數)計算出相對應的數值(因變數),此過程即
所謂曲線揉合(curve fitting)。為了進行揉合,必須定義一些函數來估算實際數據與所
求函數值間的差異,使其曲線模型愈接近數據資料,進而尋找函數最佳的係數值。
最簡單的情形是用一條直線揉合數據,也就是所謂線性迴歸。然而在大多數科學與
工程領域,其資料數據通常呈現非線性模式。

在曲線揉合過程中,若運用正確的函數模型與微積分觀念,則可推測這些數據資料
的重要性質,比如任意曲線上的斜率能由該函數一次微分求得,而一次微分為零則
可求出函數的相對極大值和極小值,以及利用積分觀念來得到曲線在區間內所圍的
面積。藉由以上觀念進行曲線揉合這些數據,以便找到最佳的函數模型來逼近其實
際值,而最佳的函數模型往往取決於其可調整的係數。

最小平方法(least-square method)是目前曲線揉合過程中最常使用的客觀且有效方
法,將數值與欲擬合的函數做分析運算,以求出”最逼近”或最能表示出資料”趨勢”
的函數。最早由 Gauss 在 1809 年時,為了使用天文觀測數據來決定行星運行的軌道
所發展出來。『統計學史家 Stigler 在他的「統計學史」一書中開宗明義就說:最小
平方法是十九世紀統計學的主題曲。從許多方面來看。它之於統計學就相當於十八
世紀的微積分之於數學。』(註五)

1
應用線性迴歸方法進行實驗數值分析與預測

而在許多情況下,我們希望能從一組數據中,找出能真正反應出這組數據的函數,
以便分析及預測資料的走向。有時也需要從已知的數據中,找出數據間的插值以便
估計某個點的度量。在這些情況下,真實的函數皆不可得知,因此可利用曲線擬合,
尤其在許多工程領域中,我們常常需要把一些離散的數據用一個近似的解析表示式
描述出來,所以本文將對直流暫態充放電實驗所得之數據使用最小平方法來進行曲
線揉合。

一、最小平方法介紹

最小平方法用於尋找最接近於數據點的曲線模型參數之值, 亦即是在數據和模型之
間的最接近函數。這個函數取決於用來做揉合的方法,而函數通常被選擇當曲線到
每個點的垂直誤差之平方總和,將誤差平方再總計是為了避免在正和負的誤差值之
間相互抵消。

假設有 n 個統計資料或實驗數據 ( x1 , Y1 、 ) ( x 2 , Y2 、
) ( x3 , Y3 )......( x n , Yn ) ,希望找一個數學
方程式的函數 y = f (x ) 來揉合,再把統計資料或實驗數據之 x 值代入後,可求得預
測值數據為 ( x1 , y1 、 ) ( x2 , y 2 、
) ( x3 , y 3 )......( x n , y n ) ,讓統計資料或實驗數據 ( xi , Yi ) 與預測
值 ( xi , y i ) 之誤差為最小,如圖一所示。

( x4 , y 4 )
e4
( x2 , y 2 )
e2 e3
( x3 , y 3 )
e1
( x1 , y1 )

(0 ,0 )
X

圖一:最小平方法示意圖

現以 E 表示垂直誤差之平方總和,e 表示垂直誤差,其數學表示式為:
n n n
E = e12 + e 22 + ... + e n2 = ∑
i =1
e i2 = ∑i =1
(Y i − f ( x i )) 2 = ∑ (Y
i =1
i − yi ) 2 …(1)

式(1)中,應用微分性質產生極值的必要條件,亦即應用 E 一次微分(即斜率)為零,
使 E 最小值的必要條件,進而求出函數 f (x ) 模型之待定係數。

2
應用線性迴歸方法進行實驗數值分析與預測

二、線性函數模式(線性迴歸)

將工程及科學實驗所量測的數據做分析,是執行實驗評估的一項極重要工作,分析
工作可以從統計資料中計算其特性,線性函數執行線性迴歸是最簡單的類型。如果
實驗數據 ( x1 , Y1 、
) ( x 2 , Y2 、
) ( x3 , Y3 )......( x n , Yn ) 分佈呈現線性的特性時,則可用直線方程
式表示,其數學式為:

y = a + bx ………………………………………(2)

式(2)中, ( x, y ) 為預測值, x 是自變數、 y 是因變數, a 、 b 分別為直線的截距與斜


率。使用最小平方法,則總誤差 E 為

n n
E = ∑ (Yi − yi ) = ∑ (Yi − a − bxi ) 2 ……………………………(3)
2

i =1 i =1

式(3)中,因為 a、b 為待求係數, ( x i , Y i ) 為已知數,欲使總誤差 E 最小之必要


條件為

∂E n
= ∑2(Yi − a − bxi )(−1) = 0 ………………………………(4)
∂a i=1
∂E
式(4)中, 表示 E 對 a 的偏微分。
∂a

∂E n
= ∑2(Yi − a − bxi )(−xi ) = 0 ………………………………(5)
∂b i=1
∂E
式(5)中, 表示 E 對 b 的偏微分。
∂b
化簡式(4)與式(5),可分別得

a × n + b∑xi = ∑Yi ………………………………(6)

a∑xi + b∑xi2 = ∑xiYi ………………………………(7)

將式(6)與式(7)聯立方程式,可分別求出

3
應用線性迴歸方法進行實驗數值分析與預測

a=
∑x ∑Y − ∑x ∑x Y
2
i i i i i
………………………………(8)
n∑x − (∑x )
2
i i
2

n∑xiYi − ∑xi ∑Yi


b= ………………………………(9)
n∑xi2 − (∑xi )2

經由以上線性迴歸求解過程,便可得到一直線方程式來描述此一線性特性。

三、非線性函數模式

在大部分的情況中,統計資料或實驗數據往往呈現非線性,而非線性函數的曲線揉
合也是尋求觀察值與預估值間的最小偏差之參數值。而非線性模型通常不能以解析
方式求解方程式,取而代之是使用各種的迭代方法逼近,一般用 Levenberg-Marquardt
方法,可得到不錯的揉合效果(註六)。不過,一些常用非線性函數,如冪次函數、
指數函數以及飽和成長率公式(註七)等曲線揉合,仍可透過變數轉換技巧來線性化
方程式,這樣便可採用線性迴歸方式求解;另外,常用的多項式函數則直接運用最
小平方法求得。本文由於應用例的理論公式與指數函數相關,是故以指數函數模型
之線性迴歸方法加以探討。

1、若不含常數項之指數函數模型為

y = aebx ………………………………(10)
將式(10)兩邊各取對數,我們得到

ln y = ln a + bx ………………………………(11)

令 Z=lny、A=lna 進行變數轉換成線性函數

Z = A + bx ………………………………(12)

A
使用線性迴歸方式求解,所得結果A和b再轉換為a=e ,則可求出指數函數的待求係
數a與b。

2、若含常數項之指數函數模型為

y = c + aebx ………………………………(13)

4
應用線性迴歸方法進行實驗數值分析與預測

式(13)中的常數項 c 為已知。再將式(13)的常數 c 移項至左邊,然後兩邊各取對數,


我們得到
ln(y − c) = ln a + bx ………………………………(14)

令 Z=ln(y-c)、A=lna 進行變數轉換成線性函數,代入式(12)中,使用線性迴歸方式求
解,則可求出指數函數的待求係數 a 與 b。

四、應用例

當電路通電瞬間或斷電瞬間,直流電路上的電壓或電流會有一個短暫的不穩定狀
態,稱之為暫態。而電容器具有儲存能量之特性,而儲存能量必須經過時間的累積,
所以暫態現象在電容上更為明顯,一般稱電容的暫態現象為充電或放電,如圖二所
示。暫態的時間通常都只有千分之幾秒而已,然而對電能的傳輸而言,已經算是很
長的時間了(註八),此RC充放電現象在電子與電機控制工程均時常用到,故對於暫
態現象的處理是不容忽視的。

RC 充電 RC 放電
電阻100.0k Ω 電阻100.0k Ω

電流方向 a b 電流方向
c Switch
電壓12.0 V
電容器 +
220.0u F Vc V
電壓表

圖二:RC充放電電路圖

電容器充放電所需要的時間與電路中電阻值與電容器大小有關,因此定義RC充放電
電路的時間常數為電阻器與電容器大小之乘積,符號為 τ ,單位為秒,數學式為

τ = R× C ………………………………(15)

由上式得知,R 或 C 值愈大,充放電過程所需的時間愈久,一般充放電完成,以 5
個時間常數為基準。

5
應用線性迴歸方法進行實驗數值分析與預測

RC 充電時,電容壓降為
t
− ………………………………(16)
Vc = E × (1− e RC
)

RC 放電時,電容壓降為
t

Vc = E × e RC
………………………………(17)

所以我們依照如圖二所示 RC 充放電電路圖,使用電源 E =12V、電阻 R = 100k Ω 以


及 C = 220 μ F 架構本實驗,如圖三所示;並依照充放電時間每隔 5 秒來實際測量電
容壓降值,得到如表一所示之數據。

在充電狀態時,根據式(16),令函數模型為

y = 11.51+ aebx ………………………………(18)

式(18)中的常數 11.51 為穩態時實測電壓。再將式(18) 的常數 11.51 移項至左邊,然


後兩邊各取對數,我們得到
ln(y − 11.51) = ln a + bx ………………………………(19)

令 Z=ln(y-11.51)、A=lna 進行變數轉換成線性函數,經由線性迴歸方式可求出非線
性函數為
y = 11.51 − 0.9982e −1.493 ………………………………(20)

圖三:RC充放電實驗架構圖

6
應用線性迴歸方法進行實驗數值分析與預測

表一:RC 充放電實驗數據

充電過程 放電過程
時間(s)
實測值電壓 理想值電壓 實測值電壓 理想值電壓
(v) (v) (v) (v)

0 0 0 11.51 11.984
5 2.29 2.439 9.52 9.56
10 3.99 4.383 8.01 7.616
15 5.36 5.931 6.64 6.068
20 6.48 7.165 5.42 4.834
25 7.39 8.148 4.50 3.851
30 8.13 8.931 3.74 3.068
35 8.74 9.555 3.12 2.444
40 9.24 10.052 2.64 1.947
45 9.61 10.448 2.21 1.551
50 9.97 10.763 1.70 1.236
55 10.24 11.014 1.52 0.985
60 10.46 11.215 1.28 0.784
65 10.66 11.374 1.10 0.625
70 10.81 11.501 0.92 0.498
75 10.95 11.603 0.81 0.396
80 11.06 11.683 0.69 0.316
85 11.15 11.748 0.61 0.251
90 11.23 11.799 0.52 0.2
95 11.30 11.84 0.45 0.159
100 11.35 11.872 0.39 0.127
105 11.41 11.898 0.34 0.101
110 11.46 11.919 0.30 0.08
115 11.48 11.935 0.27 0.064
120 11.51 11.984 0.24 0.051

7
應用線性迴歸方法進行實驗數值分析與預測

12.00

8.00
----- 實測曲線
電壓(V) ----- 理想 曲 線

* 實測數據

4.00

0.00

0.00 40.00 80.00 120.00


時間(sec)

圖四:RC 充電時之電容壓降變化圖

12.00

8.00

----- 實側曲線

電壓(V) ----- 理想 曲 線

* 實測數據

4.00

0.00

0.00 40.00 80.00 120.00


時間(sec)

圖五:RC 放電時之電容壓降變化圖

8
應用線性迴歸方法進行實驗數值分析與預測

而在放電時,將這些數據描繪在圖形上,趨勢走向為非線性指數函數模型,經由變
數轉換與線性迴歸方式可求出指數函數為

y = 11.46e −0.03668 ………………………………(21)

最後將理論曲線與實測曲線以及實測點描繪出,分別得出 RC 充放電直流暫態現象
時之電容壓降變化圖,如圖四、圖五所示。從圖中可看出理論曲線與實測曲線的趨
勢走向是具有一致性的,但兩者有明顯差距,這乃是電阻消耗功率與電阻值誤差等
因素造成,屬於正常容許範圍。

參●結論

科學有實驗的一面,也有理論的一面,數學理論貴在靈活應用,而應用就常需靠實
驗來驗證結果,所以就離不開觀測度量,觀測度量就得到一些數據,數據免不了就
會有誤差。

曲線擬合中,是要將一組離散的數據以一個近似的曲線方程式來代表,有了這個解
析形態的方程式,我們就可以很方便去運用它。而在無窮多條曲線中,我們設法找
出某條光滑曲線,它可以最佳地擬合數據,但不需要經過每個數據點。

曲線揉合的成功或失敗,選擇揉合的函數模型選擇佔了很大的因素,所以我們歸納
三步驟如下:

一、將資料或數據描繪於圖面上

做揉合曲線時,最好的方法是先將資料繪出,判斷資料的走向,最像哪種函數或函
數的組合。

二、決定想要使用的函數模型

函數模型的選擇是很重要的,但卻也是最常出錯的地方,換成其它人來設定就可能
採用不同的線性方程式,所以我們需要有比較精確方式決定理想的線性方程式,可
從資料的走向配合理論公式,判斷最佳之函數模型。

三、從函數模型解讀資料與數據背後的意義

用理論來揉合既知, 並且預測或探索未知。這些點連成曲線,再進一步將曲線轉換
成有意義的數學函數,才能對數據做比較和分析,有了這個解析形態的方程式,我
們就可以很方便去運用它。

9
應用線性迴歸方法進行實驗數值分析與預測

肆●引註資料

註一、程崇海。數學III。(台北縣:龍騰,民 96)。頁 29-35。

註二、余俊、邱瑞鍍、林明正、陳宏瑋。數學II(工業類群)。(台中市:廣懋,民 95)。
頁 88-95。

註三、余俊、邱瑞鍍、林明正、陳宏瑋。數學II(工業類群)。(台中市:廣懋,民 95)。
頁 97-102。

註四、程崇海。數學IV。(台北縣:龍騰,民 97)。頁 106-217。

註五、蔡聰明。
「誤差論與最小平方法」
。數學傳播。21 卷 3 期(民 86 年 9 月)。頁 3-13。

註六、Marko Ledvij。“Curve Fitting Made Easy”。The Industrial Physicist。Vol.9, No.2。


pp.24-27。April/May 2003。

註七、鄭明哲。工程數值方法。(台北市:全華,民 84)。頁 271-274。

註八、彭信成、弘茂松。基本電學II。(台北市:知行,民 95)。頁 4-14。

10

You might also like