Professional Documents
Culture Documents
Chương 1
Hệ thống điều khiển như hình trên bao gồm các phần tử chủ yếu : đối tượng
điều khiển ( ĐTĐK ) , cơ cấu điều khiển ( CCĐK ) và vòng hồi tiếp ( K ) .
Với các ký hiệu :
x0 : tín hiệu đầu vào
u : tín hiệu điều khiển
x : tín hiệu đầu ra
ε = x0 – x : tín hiệu sai lệch
f : tín hiệu nhiễu
Chỉ tiêu chất lượng J của một hệ thống có thể được đánh giá theo sai lệch
của đại lượng được điều khiển x so với trị số mong muốn x0 , lượng quá điều
khiển ( trị số cực đại xmax so với trị số xác lập x ( ∞ ) tính theo phần trăm ) ,
thời gian quá độ … hay theo một chỉ tiêu hỗn hợp trong điều kiện làm việc
nhất định như hạn chế về công suất , tốc độ , gia tốc … Do đó việc chọn một
luật điều khiển và cơ cấu điều khiển để đạt được chế độ làm việc tối ưu còn
tùy thuộc vào lượng thông tin ban đầu mà ta có được .
Ở đây chúng ta có thể thấy được sự khác biệt của chất lượng tối ưu khi
lượng thông tin ban đầu thay đổi ( Hình 1.2 ) .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu
Khi tín hiệu điều khiển u giới hạn trong miền [u1,u2] , ta có được giá trị tối
ưu cực đại J1∗ của chỉ tiêu chất lượng J ứng với tín hiệu điều khiển u1∗ .
Khi tín hiệu điều khiển u không bị ràng buộc bởi điều kiện u1 ≤ u ≤ u2 , ta
có được giá trị tối ưu J 2∗ > J1∗ ứng với u2∗ . Như vậy giá trị tối ưu thực sự
bây giờ là J 2∗ .
Tổng quát hơn , khi ta xét bài toán trong một miền [um , un ] nào đó và tìm
được giá trị tối ưu J i∗ thì đó là giá trị tối ưu cục bộ . Nhưng khi bài toán
không có điều kiện ràng buộc đối với u thì giá trị tối ưu là
J ∗ = extremum( J i∗ ) với J i∗ là các giá trị tối ưu cục bộ , giá trị J ∗ chính là
giá trị tối ưu toàn cục .
Điều kiện tồn tại cực trị :
• Đạo hàm bậc một của J theo u phải bằng 0 :
∂J
=0
∂u
• Xét giá trị đạo hàm bậc hai của J theo u tại điểm cực trị :
∂2J
> 0 : điểm cực trị là cực tiểu
∂u 2
∂2J
< 0 : điểm cực trị là cực đại
∂u 2
Trang 3
PGS.TS Nguyễn Thị Phương Hà 4
Trong đó L là một phiếm hàm đối với tín hiệu x , tín hiệu điều khiển u và
thời gian t .
Lấy ví dụ về bài toán điều khiển động cơ điện một chiều kích từ độc lập
Φ kt = const với tín hiệu điều khiển u là dòng điện phần ứng iu và tín hiệu ra
x là góc quay ϕ của trục động cơ .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu
dω
kM iu − M c = M q (1)
dt
dϕ
ω= (2)
dt
trong đó kM = CM Φ = const ; Mq là moment quán tính ; ω là tốc độ góc ; ϕ
là góc quay . Giả sử bỏ qua phụ tải trên trục động cơ ( M c = 0 ) thì :
d 2ϕ
kM iu = M q (3)
dt 2
Nếu xét theo thời gian tương đối bằng cách đặt :
τ = t kM / M q
thì (3) có dạng :
d 2ϕ
= iu (4)
dτ 2
Từ đó ta có :
d 2x
=u (5)
dτ 2
Vậy phương trình trạng thái của động cơ điện là một phương trình vi phân
cấp hai .
• Bài toán tối ưu tác động nhanh ( thời gian tối thiểu ) :
Tìm luật điều khiển u(t) với điều kiện hạn chế u ≤ 1 để động cơ quay từ vị
trí ban đầu có góc quay và tốc độ đều bằng 0 đến vị trí cuối cùng có góc
quay bằng ϕ0 và tốc độ bằng 0 với một khoảng thời gian ngắn nhất .
Vì cần thời gian ngắn nhất nên chỉ tiêu chất lượng J sẽ là :
T
J = ∫ L[ x(t ), u (t ), t ]dt = T
0
Trang 5
PGS.TS Nguyễn Thị Phương Hà 6
Để có được tiêu hao năng lượng tối thiểu , ta chỉ cần tìm cực tiểu của J :
T T
J = ∫ L[ x(t ), u (t ), t ]dt = ∫ iu2 dt
0 0
Mà dòng điện phần ứng iu ở đây chính là tín hiệu điều khiển u . Vì vậy chỉ
tiêu chất lượng J đối với bài toán năng lượng tối thiểu có dạng :
T
J = ∫ u 2 (t )dt
0
http://www.khvt.com
Chương 1 : Điều khiển tối ưu
Với O(3) có thể coi là số hạng thứ 3 . Grad của L theo u là một vector m cột :
⎡ ∂L / ∂u1 ⎤
⎢ ⎥
Δ ∂ L ⎢ ∂L / ∂u 2 ⎥
Lu = (1.2)
∂u ⎢ ⎥
⎢ ⎥
⎣ ∂L / ∂u m ⎦
và đạo hàm cấp 2 của L theo u là một ma trận m x m ( còn gọi là ma trận
Hessian ) :
Δ ∂ 2 L ⎛⎜ ∂ 2 L ⎞
⎟
Luu = (1.3)
∂u 2 ⎜⎝ ∂u i ∂u j ⎟
⎠
Giả sử đang ở tại điểm cực trị , có Lu = 0 như (1.4) . Để điểm cực trị trở
thành điểm cực tiểu , chúng ta cần có :
Trang 7
PGS.TS Nguyễn Thị Phương Hà 8
1 T
dL = du Luu du + O(3) (1.5)
2
là xác định dương với mọi sự biến thiên du . Điều này được đảm bảo nếu ma
trận uốn Luu là xác định dương :
Luu > 0 (1.6)
Nếu Luu là xác định âm thì điểm cực trị chính là điểm cực đại ; còn nếu Luu
là không xác định thì điểm cực trị chính là điểm yên ngựa . Nếu Luu là bán
xác định thì chúng ta sẽ xét đến thành phần bậc cao hơn trong (1.1) để xác
định được loại của điểm cực trị .
Nhắc lại : Luu là xác định dương ( hoặc âm ) nếu như các giá trị riêng của nó
là dương ( hoặc âm ) , không xác định nếu các giá trị riêng của nó vừa có
dương vừa có âm nhưng khác 0 , và sẽ là bán xác định nếu tồn tại giá trị
riêng bằng 0 . Vì thế nếu Luu = 0 , thì thành phần thứ hai sẽ không hoàn
toàn chỉ ra được loại của điểm cực trị .
2. Tối ưu hóa với các điều kiện ràng buộc
Cho hàm chỉ tiêu chất lượng vô hướng L(x, u ) , với vector điều khiển
u ∈ R m và vector trạng thái x ∈ R n . Bài toán đưa ra là chọn u sao cho hàm
chỉ tiêu chất lượng L(x,u) đạt giá trị nhỏ nhất và thỏa mãn đồng thời các
phương trình điều kiện ràng buộc .
f ( x, u ) = 0 (1.7)
Vector trạng thái x được xác định từ một giá trị u cho trước bằng mối quan
hệ (1.7) , vì thế f là một hệ gồm n phương trình vô hướng , f ∈ R n .
Để tìm điều kiện cần và đủ của giá trị cực tiểu , đồng thời thỏa mãn
f ( x, u ) = 0 , ta cần làm chính xác như trong phần trước . Đầu tiên ta khai
triển dL dưới dạng chuỗi Taylor , sau đó xác định số hạng thứ nhất và thứ
hai .
Thừa số Lagrange và hàm Hamilton .
Tại điểm cực trị , dL với giá trị thứ nhất bằng 0 với mọi sự biến thiên của
du khi df bằng 0 . Như vậy chúng ta cần có:
dL = LTu du + LTx dx = 0 (1.8)
và:
df = f u du + f x dx = 0 (1.9)
http://www.khvt.com
Chương 1 : Điều khiển tối ưu
Từ (1.7) ta xác định được x từ giá trị u đã có, độ biến thiên dx được xác định
bởi (1.9) từ giá trị biến thiên du đã có . Như vậy , ma trận Jacobi fx không
kỳ dị và :
dx = − f x−1 f u du (1.10)
Thay dx vào (1.8) ta được :
dL = ( LTu − LTx f x−1 f u )du (1.11)
Đạo hàm riêng của L theo u chứa hằng số f được cho bởi phương trình :
∂L
∂u
(
= LTu − LTx f x−1 f u )T
= Lu − f uT f x−T Lx (1.12)
df = 0
( )
với f x−T = f x−1
T
. Lưu ý rằng :
∂L
= Lu (1.13)
∂u dx =0
Để thành phần thứ nhất của dL bằng không với giá trị du tùy ý khi df = 0 ,
ta cần có :
Lu − f uT f x−T L x = 0 (1.14)
Đây là điều kiện cần để có giá trị cực tiểu . Trước khi đi tìm điều kiện đủ ,
chúng ta hãy xem xét thêm một vài phương pháp để có được (1.14) .
Viết (1.8) và (1.9) dưới dạng:
⎡dL ⎤ ⎡ LTx LTu ⎤ ⎡ dx ⎤
⎢ df ⎥ = ⎢ ⎥⎢ ⎥ = 0 (1.15)
⎣ ⎦ ⎣ fx f u ⎦ ⎣du ⎦
Hệ phương trình tuyến tính này xác định một điểm dừng , và phải có một
[ ]
kết quả dx T du T . Điều này chỉ xảy ra nếu ma trận hệ số (n + 1) × (n + m )
T
có hạng nhỏ hơn n+1 . Có nghĩa là các hàng của ma trận tuyến tính với nhau
để tồn tại một vector λ có n số hạng như sau:
[ ⎡ LTx
1 λ .⎢
T
] LTu ⎤
⎥=0 (1.16)
⎣ fx fu ⎦
Hay:
LTx + λT f x = 0 (1.17)
LTu + λT f u = 0 (1.18)
Trang 9
PGS.TS Nguyễn Thị Phương Hà 10
Do đó -λ là đạo hàm riêng của L với biến điều khiển u là hằng số . Điều này
nói lên tác dụng của hàm chỉ tiêu chất lượng với biến điều khiển không đổi
khi điều kiện thay đổi .
Như là một cách thứ ba để tìm được (1.14) , ta phát triển thêm để sử dụng
cho các phân tích trong những phần sau . Kết hợp điều kiện và hàm chỉ tiêu
chất lượng để tìm ra hàm Hamilton .
H ( x, u, λ ) = L( x, u ) + λT f ( x, u ) (1.22)
Với λ ∈ R n là thừa số Lagrange chưa xác định . Muốn chọn x , u , λ để có
được điểm dừng , ta tiến hành các bước sau .
Độ biến thiên của H theo các độ biến thiên của x , u , λ được viết như sau :
dH = H xT dx + H uT du + H λT dλ (1.23)
Lưu ý rằng :
∂H
Hλ = = f ( x, u ) (1.24)
∂λ
Giả sử chúng ta chọn các giá trị của u thỏa mãn :
Hλ = 0 (1.25)
Sau đó ta xác định x với giá trị của u đã có bằng phương trình điều kiện ràng
buộc f ( x, u ) = 0 . Trong trường hợp này hàm Hamilton tương đương với
hàm chỉ tiêu chất lượng:
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
H f =0
=L (1.26)
Nhắc lại : nếu f = 0 , ta sẽ tìm được dx theo du từ (1.10) . Ta không nên xét
mối quan hệ giữa du và dx để thuận tiện trong việc chọn λ sao cho :
Hx = 0 (1.27)
Sau đó , từ (1.23) , độ biến thiên dH không chứa thành phần dx. Điều này
mang lại kết quả λ :
∂H
= L x + f xT λ = 0 (1.28)
∂x
hay λT = − LTx f x−1 .
Nếu giữ nguyên (1.25) và (1.27) thì:
dL = dH = H uT du (1.29)
Vì H = L, để có được điểm dừng ta phải áp đặt điều kiện:
Hu = 0 (1.30)
Tóm lại , điều kiện cần để có được điểm cực tiểu của L(x,u) thỏa mãn điều
kiện ràng buộc f(x,u) = 0 gồm có :
∂H
= f =0 (1.31a)
∂λ
∂H
= L x + f xT λ = 0 (1.31b)
∂x
∂H
= Lu + f uT λ = 0 (1.31c)
∂u
Với H (x, u , λ ) xác định bởi (1.22) . Cách thường dùng là từ 3 phương trình
đã cho xác định x , λ , và u theo thứ tự tương ứng . So sánh 2 phương trình
(1.31b) và (1.31c) ta thấy chúng tương ứng với 2 phương trình (1.17) và
(1.18) .
Trong nhiều ứng ụng , chúng ta không quan tâm đến giá trị của λ , tuy nhiên
ta vẫn phải đi tìm giá trị của nó vì đó là một biến trung gian cho phép chúng
ta xác định các đại lượng cần tìm là u , x và giá trị nhỏ nhất của L .
Ưu điểm của thừa số Lagrange có thể tóm tắt như sau : trên thực tế , hai đại
lượng dx và du không phải là hai đại lượng biến thiên độc lập với nhau ,
theo (1.10) . Bằng cách đưa ra một thừa số bất định λ , chúng ta chọn λ sao
cho dx và du có thể được xem là hai đại lượng biến thiên độc lập với nhau .
Trang 11
PGS.TS Nguyễn Thị Phương Hà 12
Lấy đạo hàm riêng của H lần lượt theo các biến như trong (1.31) , như thế ta
sẽ có được điểm dừng .
Khi đưa ra thừa số Lagrange , chúng ta có thể thay thế bài toán tìm giá trị
nhỏ nhất của L(x,u) với điều kiện ràng buộc f(x,u) = 0 , thành bài toán tìm
giá trị nhỏ nhất của hàm Hamilton H(x,u,λ) không có điều kiện ràng buộc .
Điều kiện đã (1.31) xác định một điểm dừng . Ta sẽ tiếp tục chứng minh đây
là điểm cực tiểu như đã thực hiện trong phần trước .
Viết chuỗi Taylor mở rộng cho độ biến thiên của L và f như sau :
[
dL = LTx ] ⎡ dx ⎤ 1
LTu ⎢ ⎥ + dx T [ ]
⎡L
du T ⎢ xx
L xu ⎤ ⎡ dx ⎤
Luu ⎥⎦ ⎢⎣du ⎥⎦
+ O(3) (1.32)
⎣du ⎦ 2 ⎣ Lux
df = [ f x
⎡ dx ⎤ 1
f u ]⎢ ⎥ + dx T [ ]
⎡f
du T ⎢ xx
f xu ⎤ ⎡ dx ⎤
f uu ⎥⎦ ⎢⎣du ⎥⎦
+ O(3) (1.33)
⎣du ⎦ 2 ⎣ f ux
Với:
Δ ∂2 f
f xu =
∂u∂x
Để đưa ra hàm Hamilton , ta sử dụng các phương trình sau :
[1 λT ]⎢
⎡dL ⎤
⎥ = Hx
T
[ ] ⎡ dx ⎤ 1
H uT ⎢ ⎥ + dx T [ ]
⎡H
du T ⎢ xx
H xu ⎤ ⎡ dx ⎤
H uu ⎥⎦ ⎢⎣du ⎥⎦
+ O(3)
df
⎣ ⎦ ⎣du ⎦ 2 ⎣ H ux
(1.34)
Bây giờ , để có được điểm dừng ta cần có f = 0 , và đồng thời thành phần
thứ nhất của dL bằng 0 với mọi sự biến thiên của dx và du . Vì f = 0
nên df = 0 , và điều này đòi hỏi H x = 0 và H u = 0 như trong (1.31) .
Để tìm điều kiện đủ cho điểm cực tiểu , chúng ta xét đến thành phần thứ hai .
Đầu tiên , ta cần xem mối quan hệ giữa dx và du trong (1.34) . Giả sử rằng
chúng ta đang ở điểm cực trị nên H x = 0 , H u = 0 và df = 0 . Sau đó, từ
(1.33) ta có :
dx = − f x−1 f u du + O(2) (1.35)
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
1.1.3 Ví dụ
Tối ưu hóa không có điều kiện ràng buộc
Ví dụ 1.1 : Không gian toàn phương .
Cho u ∈ R 2 và :
1 T ⎡ q11 q12 ⎤
L(u ) = u u + [s1 s 2 ]u (1)
2 ⎢⎣q12 q 22 ⎥⎦
Δ 1
= u T Qu + S T u (2)
2
Trang 13
PGS.TS Nguyễn Thị Phương Hà 14
Điểm u* là cực tiểu nếu Luu > 0 ( q11 > 0 và q11 q 22 − q122 > 0 ) . Là điểm cực
đại nếu Luu < 0 ( q11 < 0 và q11 q 22 − q122 > 0 ) . Nếu Q < 0 , thì u* là điểm
yên ngựa . Nếu Q = 0 , thì u* là điểm kỳ dị , chúng ta không thể xác định
được đó là cực tiểu hay cực đại từ Luu .
Bằng cách thay (4) vào (2) ta sẽ tìm được giá trị của hàm chỉ tiêu chất lượng
như sau :
Δ 1 T −1
L* = L(u * ) = S Q QQ −1 S − S T Q −1 S
2
1 T −1
=− S Q S (6)
2
là một cực tiểu , vì Luu > 0 . Từ (6) ta thấy rằng giá trị nhỏ nhất của L là L* =
-1/2 .
Các đường đồng mức của L(u) trong (7) được vẽ trong Hình 1.4 , với u = [u1
u2]T . Các mũi tên là gradient .
⎡ u + u2 ⎤
Lu = Qu + S = ⎢ 1 ⎥ (9)
⎣u1 + 2u 2 + 1⎦
Lưu ý rằng gradient luôn luôn vuông góc với các đường đồng mức và có
hướng là hướng tăng L(u) .
Chúng ta dùng dấu “*” để chỉ giá trị tối ưu của u và L cần tìm . Tuy nhiên ta
thường bỏ qua dấu “*” .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Với u1 , u 2 là các đại lượng vô hướng . Điểm cực trị xuất hiện khi đạo hàm
riêng của L theo tất cả các đối số phải bằng 0 :
∂L
= u1 + u 2 = 0 (2a)
∂u1
∂L
= u1 + 2u 2 + 1 = 0 (2b)
∂u 2
Trang 15
PGS.TS Nguyễn Thị Phương Hà 16
[x u ]⎡⎢ ⎤⎥ ⎡⎢ ⎤⎥ + [0 1]⎡⎢ ⎤⎥
1 1 1 x x
L ( x, u ) = (1)
2 ⎣1 2⎦ ⎣u ⎦ ⎣u ⎦
Với điều kiện ràng buộc :
f ( x, u ) = x − 3 = 0 (2)
Hàm Hamilton sẽ là :
1 2
H = L + λT f = x + xu + u 2 + u + λ ( x − 3) (3)
2
với λ là một đại lượng vô hướng . Điều kiện để có điểm dừng theo (1.31) là :
Hλ = x − 3 = 0 (4)
Hx = x +u + λ = 0 (5)
H u = x + 2u + 1 = 0 (6)
Giải (4) , (5) , (6) ta được : x = 3 , u = -2 , λ = -1 . Điểm dừng là :
(x, u )∗ = (3,−2) (7)
Để xác định (7) là điểm cực tiểu , tìm ma trận uốn theo (1.37) :
Luuf = 2 (8)
Các đường đồng mức của L(x,u) và điều kiện ràng buộc (2) được vẽ trong
Hình 1.5 .
Grad của f(x,u) trong hệ tọa độ (x,u) được viết như sau:
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
⎡ f x ⎤ ⎡1 ⎤
⎢ f ⎥ = ⎢0 ⎥ (9)
⎣ u⎦ ⎣ ⎦
được vẽ trong Hình 1.4 . Và grad của L(x,u) :
⎡ Lx ⎤ ⎡ x + u ⎤
⎢ L ⎥ = ⎢ x + 2u + 1⎥ (10)
⎣ u⎦ ⎣ ⎦
Tại điểm cực tiểu (3,-2) , grad L(x,u) sẽ có giá trị :
⎡ L x ⎤ ⎡1⎤
⎢ L ⎥ = ⎢0 ⎥ (11)
⎣ u⎦ ⎣ ⎦
Cần lưu ý rằng gradf và gradL tương đương với nhau tại điểm dừng . Có
nghĩa là điểm cực tiểu xuất hiện khi điều kiện ràng buộc (2) là đường tiếp
tuyến của các đường đồng mức của L. Di chuyển hướng dọc theo đường
thẳng f = 0 sẽ làm tăng giá trị của L .
Ta tìm được giá trị của L tại điểm cực tiểu bằng cách thay x = 3, u = -2 vào
(1) , ta được L*=0,5 .
Vì λ = -1 , giữ nguyên giá trị u = -2 , thay đổi điều kiện ràng buộc df ( dịch
chuyển đường thẳng trong Hình 1.5 về phía phải ) sẽ làm tăng L(x,u) với dL
= -λdf = df .
Ví dụ 1.4 : Hàm chỉ tiêu chất lượng dạng toàn phương với điều kiện ràng
buộc tuyến tính - Trường hợp vô hướng .
Xét hàm chỉ tiêu chất lượng dạng toàn phương :
1 ⎛ x2 y2 ⎞
L( x, u ) = ⎜⎜ 2 + 2 ⎟⎟ (1)
2⎝a b ⎠
Với điều kiện ràng buộc tuyến tính :
f ( x, u ) = x + mu − c (2)
Các đường đồng mức của L(x,u) là những ellip ; nếu L(x,u) = F/2 , thì bán
trục chính và bán trục phụ là al và bl . Điều kiện ràng buộc f(x,u) là một họ
các đường thẳng chứa thông số c . Xem Hình 1.6 ( lưu ý rằng u là biến độc
lập , với x được xác định bởi f(x,u) = 0 ) .
Hàm Hamilton là :
1 ⎛ x2 u2 ⎞
H = ⎜⎜ 2 + 2 ⎟⎟ + λ ( x + mu − c) (3)
2⎝a b ⎠
Trang 17
PGS.TS Nguyễn Thị Phương Hà 18
Hình 1.5 : Các đường đồng mức của L(x,u) và điều kiện ràng buộc f(x,u) .
Hình 1.6 : Các đường đồng mức của L(x,u) và điều kiện ràng buộc f(x,u).
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Để giải hệ phương trình này , trước hết ta sử dụng phương trình (6) để đưa
ra biến điều khiển tối ưu theo thừa số Lagrange .
u = −b 2 mλ (7)
Bây giờ thay phương trình (7) vào (4) để khử u , kết hợp với (5) và được
viết lại :
⎡1 − b 2 m 2 ⎤ ⎡ x ⎤ ⎡c ⎤
⎢1 ⎥ = (8)
⎢ 2 1 ⎥ ⎢⎣λ ⎥⎦ ⎢⎣0⎥⎦
⎣a ⎦
Giải ra ta được giá trị của điểm dừng :
a 2c
x= (9)
a2 + b2m2
c
λ=− (10)
a + b2m2 2
Trang 19
PGS.TS Nguyễn Thị Phương Hà 20
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Để giải các phương trình trên , đầu tiên ta dùng điều kiện (6) để tìm u theo
λ:
u = − R −1 B T λ (7)
Từ (5) ta có :
λ = −Qx (8)
Kết hợp với (4) ta được :
λ = QBu + Qc (9)
dùng kết quả này thay vào (7) cho ta :
u = − R −1 B T (QBu + Qc) (10)
hay :
(I + R B QB )u = − R B Qc
−1 T −1 T
(R + B QB )u = − B Qc
T T
(11)
Vì R > 0 và BTQB ≥ 0 , chúng ta có thể tìm nghịch đảo của (R + BTQB) và vì
thế giá trị u tối ưu là :
u = −( R + B T QB) −1 B T Qc (12)
So sánh kết quả này với (11) trong ví dụ 1.4 .
Thay (12) vào (4) và (9) cho ta giá trị trạng thái tối ưu và thừa số Lagrange
tối ưu :
(
x = − I − B ( R + BT QB ) BT Q c
−1
) (13)
(
λ = Q − QB ( R + BT QB ) B Q) c
−1 T
(14)
Trang 21
PGS.TS Nguyễn Thị Phương Hà 22
L* =
1 T
2
[ (
c Q − QB R + B T QB )−1
]
BT Q c (17)
1 T
L* = c λ (18)
2
Vì thế :
∂L *
=λ (19)
∂c
Ví dụ 1.6 : Bài toán với nhiều điều kiện ràng buộc .
Tìm khoảng cách nhỏ nhất giữa parabol :
y = ax 2 + bx + d (1)
với đường thẳng :
y = x+c (2)
Xem Hình 1.7 .
Trong bài toán này sẽ có hai điều kiện ràng buộc :
f1 ( x1 , y1 ) = y1 − ax12 − bx1 − d = 0 (3)
Và :
f 2 ( x2 , y 2 ) = y2 − x2 − c = 0 (4)
với (x1 , y1 ) là 1 điểm trên parabol và (x 2 , y 2 ) là 1 điểm trên đường thẳng .
Chúng ta chọn hàm chỉ tiêu chất lượng là một nửa của bình phương khoảng
cách giữa 2 điểm này .
1 1
L( x1 , x 2 , y1 , y 2 ) = ( x1 − x 2 ) 2 + ( y1 − y 2 ) 2 (5)
2 2
Để giải bài toán này , ta xử lý bằng cách đặt :
Δ⎡ f ⎤ Δ⎡x ⎤ Δ⎡y ⎤
f =⎢ 1 ⎥ , x =⎢ 1 ⎥ , u =⎢ 1 ⎥ (6)
⎣ f2 ⎦ ⎣ x2 ⎦ ⎣ y2 ⎦
và sử dụng cách tiếp cận vector ; tuy nhiên , sự kết hợp giữa một điều kiện
ràng buộc tuyến tính và một điều kiện phi tuyến sẽ làm phức tạp thêm bài
toán . Thay vào đó ta sẽ sử dụng các đại lượng vô hướng .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Hình 1.7 : Bài toán với nhiều điều kiện ràng buộc .
Đưa ra một thừa số Lagrange cho mỗi điều kiện ràng buộc , hàm Hamilton
là :
1 1
H= ( x1 − x 2 ) 2 + ( y1 − y 2 ) 2 + λ1 ( y1 − ax12 − bx1 − d ) + λ 2 ( y 2 − x 2 − c)
2 2
(7)
Khi đó , để có điểm dừng ta cần có :
H x1 = x1 − x 2 − 2aλ1 x1 − bλ1 = 0 (8)
H x2 = − x1 + x2 − λ2 = 0 (9)
H y1 = y1 − y 2 + λ1 = 0 (10)
H y2 = − y1 + y 2 + λ2 = 0 (11)
Trang 23
PGS.TS Nguyễn Thị Phương Hà 24
x2 =
1
2
(
ax12 + (b + 1) x1 + d − c ) (17)
λ1 = −
1
2
(
ax12 + (b − 1) x1 + d − c ) (18)
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
có cực trị .
L là hàm có đạo hàm riêng bậc một và bậc hai liên tục với mọi biến của nó .
Để thống nhất , ở đây ta lấy t0 = 0 và t1 = T .
Biến đổi của J do δu tạo nên là :
ΔJ (u + δu ) = J (u + δu ) − J (u )
T T
= ∫ L(u + δu , u + δu , t )dt − ∫ L(u , u , t )dt
0 0
T
= ∫ [ L(u + δu , u + δu , t ) − L(u , u , t )]dt (1.39)
0
Phân tích (1.39) theo chuỗi Taylor và chỉ khảo sát thành phần bậc một của J
ta được :
T
∂L(u , u , t ) ∂L(u , u , t )
ΔJ (u , δu ) = ∫ [( )δu + ( )δu ]dt (1.40)
0
∂u ∂u
Trang 25
PGS.TS Nguyễn Thị Phương Hà 26
Xem δu là hàm biến đổi độc lập , biểu thức (1.40) có thể biến đổi để chỉ
chứa δu bằng cách lấy tích phân những thành phần chứa δu :
T
∂L(u , u , t ) T ∂L(u , u , t ) d ∂L(u , u , t )
δJ (u , δu ) = δu 0 + ∫ [ − ]δudt... (1.41)
∂u 0
∂u dt ∂u
Từ điều kiện đã cho δu(0) = δ(T) = 0 , phần đầu của vế phải ở biểu thức
(1.41) bằng 0 .
Nếu gia số δJ của chỉ tiêu chất lượng J tồn tại và nếu J có cực trị đối với u*
thì :
ΔJ (u * , δu ) = 0 (1.42)
Đó là điều kiện cơ bản của phép tính biến phân .
Từ các biểu thức (1.41) , (1.42) ta có :
T
∂L(u * , u * , t ) d ∂L(u * , u * , t )
δJ (u * , δu ) = ∫ [ − ]δudt = 0 (1.43)
0
∂u dt ∂u
Từ đó có thể rút ra phương trình Euler_Lagrange :
∂L(u, u , t ) d ∂L(u, u , t )
− =0 (1.44a)
∂u dt ∂u
Hoặc có thể viết đơn giản :
∂L d ∂L
− =0 (1.44b)
∂u dt ∂u
Trường hợp có điều kiện ràng buộc
Nếu ngoài chỉ tiêu chất lượng (1.38) còn có các điều kiện ràng buộc dạng :
ϕ i (u, u, t ) = 0 t ∈ [0, T ] , i = 1, n (1.45)
thì chỉ tiêu chất lượng J có dạng :
T n
J a (u, λi ) = ∫ [ L(u, u, t ) + ∑ λi (t )ϕ i (u, u, t )]dt (1.46)
0 i =1
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
mà λi(t) với i = 1,2,…,n là hàm Lagrange .Vì giới hạn thỏa mãn với mọi t
nên hàm Lagrange phụ thuộc thời gian .
Tương tự như trên ta có phương trình Euler_Lagrange tổng quát :
∂La (u, u, λ , t ) d ∂La (u, u , λ , t )
− =0 (1.47)
∂u dt ∂u
n
mà La (u, u, λ , t ) = L(u , u , t ) + ∑ λi (t )ϕ i (u, u, t ) (1.48)
i =1
∫ψ
0
i (u , u , t )dt = qi (1.49)
Trong trường hợp này , λi là các hệ số không phụ thuộc thời gian .
Khi có điều kiện ràng buộc dạng (1.45) hoặc (1.49) phải giải (n+1) phương
trình để xác định y*(t) và λi*(t) với i=1,2,…,n .
Phương trình Euler_Lagrange với tín hiệu điều khiển bị hạn chế
Trong phần trên ta chỉ đề cập tới bài toán mà trong đó tín hiệu điều khiển
không có giới hạn nào ràng buộc . Trong thực tế , thường gặptín hiệu điều
khiển có ràng buộc dạng u ≤ 1 .
Điều kiện cần để có cực trị : khi u(t) là đường cực trị thì u+δu và u-δu là
những hàm cho phép . Bây giờ ta so sánh trị số phiếm hàm ở đường cực trị
với trị số của nó ở hàm u+δu và u-δu . Nếu miền biến đổi của u(t) là kín và
u(t) ở ngoài biên thì một trong các hàm u+δu hoặc u-δu sẽ ra ngoài miền
cho phép .
Một trong các biện pháp khắc phục khó khăn trên là đường cực trị ở biên và :
u ≥ ϕ (t ) (1.51)
Ví dụ , nếu u ≤ 1 , điều kiện u ≥ ϕ (t ) nghĩa là ϕ (t ) ≥ −1 . Đổi biến ta có :
z2 = u −ϕ (1.52)
Trang 27
PGS.TS Nguyễn Thị Phương Hà 28
thì biến mới z sẽ không có điều kiện hạn chế và biên giới của biến u tương
T
đương với z = 0 . Bây giờ chỉ tiêu chất lượng J (u ) = ∫ L(u , u , t )dt có biến
0
mới u = z + ϕ , từ đó :
2
u = 2 zz + ϕ
và chỉ tiêu chất lượng J có dạng :
T
J = ∫ L[ z 2 + ϕ ,2 zz + ϕ , t ]dt (1.53)
0
Vì không có điều kiện hạn chế nên phương trình Euler_Lagrange có dạng :
∂L d ∂L
− =0 (1.54)
∂z dt ∂z
∂L ∂L ∂u ∂L ∂u ∂L ∂L
Ở đây = + = 2z + 2z
∂z ∂u ∂z ∂u ∂z ∂u ∂u
∂L ∂L ∂u ∂L ∂u ∂L
= + = 2z
∂z ∂u ∂z ∂u ∂z ∂u
d ∂L d ∂L ∂L
= 2z( )+ 2z
dt ∂z dt ∂u ∂u
và (1.54) sẽ có dạng :
∂L ∂L d ∂L ∂L
2z + 2z − 2z − 2z = 0
∂u ∂u dt ∂u ∂u
⎛ ∂L d ∂L ⎞
hay : 2 z⎜ − ⎟=0 (1.55)
⎝ ∂u dt ∂u ⎠
Phương trình trên thỏa mãn với z = 0 , nghĩa là đường cực trị có những giá
trị biên và phương trình Euler_Lagrange vẫn là phiếm hàm xuất phát :
∂L d ∂L
− =0
∂u dt ∂u
2. Ví dụ
Ví dụ 1.7 :
du1
Tìm quá trình tối ưu x* = u2 và u2* = để cực tiểu hóa chỉ tiêu chất lượng
dt
J:
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
T
J (u ) = ∫ (u2 ) 2 dt (1)
0
∫ u (t )dt = θ
0
2 0 (2)
∫ψ
0
i (u , u , t )dt = qi (4)
Trang 29
PGS.TS Nguyễn Thị Phương Hà 30
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
J a 16
Nghĩa là chúng khác nhau = = 1.33 lần .
J 12
Hình 1.8 : Đặc tính thời gian của hệ tổn hao năng lượng tối thiểu (a) và hệ
tác động nhanh (b) .
Ví dụ 1.8 :
Xét bài toán tối ưu tác động nhanh với điều kiện đầu :
T
∫ u dt = θ
0
2 0 (1)
∫ (u ) dt = q0
2
2 (2)
0
Trang 31
PGS.TS Nguyễn Thị Phương Hà 32
λ1
⇒ u2 = (7)
2λ2
Lấy tích phân biểu thức trên ta được :
λ1
u2 (t ) = x(t ) = t + c1 (8)
2λ2
λ1 2
u2 (t ) = t + c1t + c2 (9)
4λ2
λ1
Kết hợp (9) với điều kiện u2 (0) = 0 suy ra : c2 = 0 và c1 = − T .
4λ2
2θ 0 λ1
Và điều kiện u2 (T ) = 0 ta có : c1 = − T
T 2 6λ2
λ1 24θ
⇒ = − 30 (10)
λ2 T
6θ 0
⇒ c1 = (11)
T2
Thế vào (8) , (9) được :
6θ0 12θ 0
u2∗ (t ) = x∗ (t ) = − 3 t (12)
T2 T
6θ 0 6θ
u2∗ (t ) = 2
t − 30 t 2 (13)
T T
So sánh với ví dụ trước , ta thấy quá trình tối ưu là hoàn toàn giống nhau .
Ví dụ 1.9 :
Xét đối tượng có mô hình toán học gần đúng như sau :
xi = f i ( x, δ i (t )) + g k ( x )u * i = 1, n; k ∈ [1, n] (1)
[ ]
∞
J = ∫ Ψ ( x ) + Ψ (x ) dt
2 2
(2)
0
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Giải phương trình (3) kết hợp với (5) , xác định luật điều u * khiển đảm bảo
cực tiểu hoá hàm mục tiêu J và định hướng động học hệ thống chuyển
động theo xu hướng lim Ψ ( x ) → 0 :
t →∞
−1 ⎡ ⎤
1 ⎡ ∂Ψ ⎤ ⎢ n n
∂Ψ ⎥
u =− ⎥ Ψ + ∑ f i ( x, δ i ) + ∑ δi
*
⎢ (6)
g k ( x ) ⎣ ∂xi ⎦ ⎢ i =1 i =1 ∂δ i
⎥
⎢⎣ i≠k ⎥⎦
∂Ψ
Lưu ý rằng luật điều khiển u * chỉ có nghĩa khi g k ( x ) ≠ 0 và ≠0 .
∂x k
Trang 33
PGS.TS Nguyễn Thị Phương Hà 34
Nguyên lý tối ưu của Belman : “ Bất kỳ một đoạn cuối cùng nào của quỹ đạo
tối ưu cũng là một quỹ đạo tối ưu ” .
Nguyên lý này giới hạn xem xét trên một số các chỉ tiêu tối ưu . Nó chỉ ra
rằng phương án tối ưu phải được xác định từ trạng thái cuối đi ngược về
trước đó .
Điều kiện áp dụng : nguyên lý tối ưu là một phương pháp số , chỉ áp dụng
được khi hệ thống có phân cấp điều khiển và ta biết trước sơ đồ mắt lưới
được xây dựng bằng thực nghiệm .
Ví dụ đơn giản sau sẽ chỉ ra những vấn đề mấu chốt của phương pháp này .
Bài toán đường bay của máy bay
Một máy bay bay theo hướng từ trái sang phải như Hình 1.9 qua các điểm a,
b, c… tượng trưng cho các thành phố , và mức nhiên liệu cần thiết để hoàn
tất mỗi chặng đường . Chúng ta sẽ dùng nguyên lý tối ưu của Belman để
giải bài toán cực tiểu hóa nhiên liệu tiêu hao .
Liệt kê các trạng thái k từ 0 đến 4 trong quá trình ra quyết định như Hình
1.9 (đầu mũi tên và con số trong khung bước đầu có thể chưa cần quan tâm).
Tại mỗi giá trị k = 0,1,....N − 1 phải có một quyết định , và N là trạng thái
cuối .
Trạng thái hiện tại là nút mà chúng ta đang ra quyết định . Vì thế trạng thái
ban đầu là x0 = a . Tại trạng thái 1 , các khả năng có thể là x1 = b hoặc
x1 = d . Tương tự với x2 = c , e hoặc g ; x3 = f hoặc h và trạng thái cuối
cùng xn = x4 = i .
Điều khiển u k ở trạng thái k đến trạng thái k+1 có hai giá trị u k = ±1 : đi
theo hướng lên thì u k = 1 và u k = −1 nếu đi theo hướng xuống .
Đến đây chúng ta có bài toán tối thiểu hóa năng lượng tiêu hao với trạng
thái cuối cố định , luật điều khiển và các giá trị trạng thái .
Để tìm ra luật điều khiển ứng với mức tiêu hao nhiên liệu tối thiểu , ta sử
dụng nguyên lý tối ưu của Belman , được bắt đầu ở k = N = 4 . Không có
quyết định nào được yêu cầu ở đây do đó ta giảm k = 3 .
Nếu x3 = f thì luật điều khiển tối ưu là u3 = −1 và chi phí là 4 . Điều này
được thể hiện bằng cách đặt (4) phía trên nút f và chiều mũi tên theo chiều
từ f đến i . Nếu x3 = h thì luật điều khiển tối ưu là u3 = 1 và chi phí là 2 ,
được thể hiện như trên hình .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Bây giờ giảm k xuống 2 . Nếu x2 = c thì u 2 = −1 với tổng chi phí sẽ là 4 +
3 = 7 . Nếu x2 = e chúng ta phải đưa ra một quyết định . Nếu chọn u 2 = 1
để đến được f và sau đó đến i , chi phí sẽ là 4 + 3 = 7 .
Hình 1.9 : Luật điều khiển năng lượng tiêu hao tối thiểu .
Một cách khác , nếu chúng ta chọn u 2 = −1 tại e và đi đến h , chi phí sẽ là 2
+ 2 = 4 . Vì thế , tại e cách lựa chọn tối ưu là u 2 = −1 với chi phí là 4 .
Nếu x2 = g thì chỉ có một sự chọn lựa duy nhất là u 2 = 1 với chi phí di
chuyển là 6 .
Bằng cách lần lượt giảm k và tiếp tục so sánh các phương án điều khiển tối
ưu được cho bởi nguyên lý tối ưu , chúng ta có thể điền vào các lựa chọn
còn lại ( đầu mũi tên ) và chi phí tối ưu được thể hiện trong Hình 1.9 . Dễ
dàng nhận ra rằng chuỗi điều khiển được lựa chọn là chuỗi tối ưu .
Chú ý rằng khi k = 0 , luật điều khiển có thể là u 0 = 1 hoặc u0 = −1 cùng
cho chi phí là 8 ; luật điều khiển khi k = 0 là duy nhất .
Có nhiều điểm cần chú ý trong ví dụ này . Trước hết , ta có hai đường đi từ
a đến i với cùng một chi phí là 8 : a → b → e → h → i ( đường nét đậm ) và
a → d → e → h → i ( đường nét đứt ) . Hiển nhiên giải pháp tối ưu trong
quy hoạch động là không duy nhất . Thứ hai , giả định chúng ta cố gắng xác
định lộ trình tối ưu đi từ a đến i khi không biết nguyên lý tối ưu và đi theo
chiều thuận . Tại a ta sẽ so sánh chi phí khi đi đến b hoặc d , và chúng ta
quyết định đi đến d . Tiếp tục như vậy ta sẽ đi đến g . Ở đó không còn lựa
Trang 35
PGS.TS Nguyễn Thị Phương Hà 36
chọn nào khác là đi đến i qua h . Toàn bộ chi phí cho phương án này là 1 + 2
+ 4 + 2 = 9 và không phải là tối ưu .
Cuối cùng chúng ta chỉ ra rằng nguyên lý tối ưu của Belman giúp giảm số
lượng phép tính toán cần thiết bằng cách giảm số lượng các lựa chọn có thể
thực hiện .
2. Hệ rời rạc
Phương pháp quy hoạch động cũng có thể dễ dàng áp dụng cho hệ phi tuyến
Ngoài ra , nếu có càng nhiều điều kiện ràng buộc đối với tín hiệu điều khiển
và biến trạng thái thì ta có được lời giải càng đơn giản .
Đặt :
xk +1 = f k ( xk , uk ) (1.56)
với số mũ k trên f thể hiện sự thay đổi theo thời gian . Giả định kết hợp với
hàm chỉ tiêu chất lượng :
N −1
J i ( xi ) = φ ( N , xN ) + ∑ Lk ( xk , uk ) (1.57)
k =i
với [i, N ] là thời gian lấy mẫu . Chúng ta cần chỉ ra sự phụ thuộc của J đối
với trạng thái và thời gian đầu .
Giả sử ta đã có được tổn hao tối ưu J k∗+1 ( xk +1 ) từ thời điểm k + 1 đến thời
điểm cuối N ứng với những phương án khả thi xk +1 , và chuỗi các phương
án tối ưu từ thời điểm k + 1 đến N cho mọi xk +1 .
Tại thời điểm k , nếu ta áp dụng một luật điều khiển u k bất kỳ và sử dụng
một chuỗi luật điều khiển tối ưu kể từ vị trí k + 1 , lúc đó tổn hao sẽ là :
J k = Lk ( xk , uk ) + J k∗+1 ( xk +1 ) (1.58)
với xk là trạng thái ở thời điểm k , và xk +1 được cho bởi (1.56) . Theo
nguyên lý Belman thì tổn hao tối ưu từ thời điểm k sẽ là :
(
J k∗ ( xk ) = min Lk ( xk , uk ) + J k∗+1 ( xk +1 )
uk
) (1.59)
và luật điều khiển tối ưu u k* tại thời điểm k là u k làm cho tổn hao đạt cực
tiểu .
Phương trình (1.59) chính là nguyên lý tối ưu cho hệ rời rạc . Vai trò quan
trọng của nó là có thể cho phép chúng ta tối ưu hóa cùng lúc tại thời điểm a
nhiều hơn một vector điều khiển .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Trong thực tế , ta có thể định rõ các điều kiện ràng buộc được thêm vào
chẳng hạn như yêu cầu luật điều khiển u k thuộc về một bộ các luật điều
khiển được chấp nhận .
Ví dụ 1.10 :
Xét hệ :
x k +1 = x k + u k (1)
có hàm chỉ tiêu chất lượng :
1 N −1 2
J 0 = xN2 + ∑ uk
2 k =0
(2)
với thời điểm cuối cùng N = 2 . Tín hiệu điều khiển bị ràng buộc lấy các giá
trị :
uk = −1, −0.5, 0, 0.5,1 (3)
và biến trạng thái bị ràng buộc lấy các giá trị :
xk = 0, 0.5,1,1.5 (4)
Điều kiện ràng buộc đối với tín hiệu điều khiển không phải là không có lý
do , tín hiệu điều khiển tối ưu thời gian tối thiểu chỉ lấy các giá trị ±1 ( ví dụ
1.12 ), trong khi tín hiệu điều khiển tối ưu nhiên liệu tối thiểu nhận các giá
trị 0 , ±1 . Điều kiện ràng buộc đối với biến trạng thái trong bài toán này
cũng hợp lý , vì nếu trạng thái ban đầu lấy một trong các giá trị chấp nhận
được (4) , thì dưới ảnh hưởng của các tín hiệu điều khiển cho phép (3) các
trạng thái sau đó sẽ lấy các giá trị nguyên và bán nguyên . Điều kiện ràng
buộc (4) có thể viết lại là x0 = 0, 0.5,1,1.5 và
0 ≤ xk ≤ 1.5 (5)
Đây là điều kiện xác thực và ràng buộc biên độ về trạng thái , thường là hợp
lý trong các tình huống vật lý .
Bây giờ , bài toán điều khiển tối ưu là tìm dãy tín hiệu điều khiển chấp nhận
được u0∗ , u1∗ sao cho chỉ tiêu chất lượng J 0 đạt giá trị cực tiểu trong khi tạo
ra quỹ đạo trạng thái chấp nhận được x0∗ , x1∗ , x2∗ . Chúng ta muốn uk∗ được xác
định như là luật điều khiển hồi tiếp trạng thái .
Theo (1.58) ta có :
1
J k = uk2 + J k∗+1 (6)
2
Trang 37
PGS.TS Nguyễn Thị Phương Hà 38
⇒ J k∗ = min ( J k ) (7)
uk
Để tìm uk∗ và J k∗ ứng với mỗi xk . Ta xuất phát từ trạng thái cuối cùng .
k = N = 2 : J 2∗ = x2∗
Ứng với mỗi giá trị xN = 0, 0.5,1,1.5 ta có các giá trị J N∗ = 0, 0.25,1, 2.25 .
k = 1 : J1 = u22 / 2 + J 2∗
- x1 = 1.5 : vì x2 = x1 + u1 và 0 ≤ x2 ≤ 1.5 nên ta chỉ xét các giá trị u1 ≤ 0
u1 = 0 ⇒ x2 = 1.5 + 0 = 1.5 ⇒ J 2∗ = 2.25
⇒ J1 = u22 / 2 + J 2∗ = 02 / 2 + 2.25 = 2.25
u1 = −0.5 ⇒ x2 = 1.5 + ( −0.5 ) = 1 ⇒ J 2∗ = 1
⇒ J1 = ( −0.5 ) / 2 + 1 = 1.125
2
Như vậy , tín hiệu điều khiển tối ưu với x1 = 1.5 là u1∗ = −1 và tổn hao tối
ưu là J1∗ = 0.75 . Ta có được sơ đồ như sau với mũi tên chỉ ra trạng thái tối
ưu .
Tương tự như vậy cho các trường hợp còn lại của x1 . Tiếp tục với trạng
thái k = 0 . Cuối cùng ta sẽ được lưới kết quả như Hình 1.10 .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Hình 1.10 : Lưới kết quả của bài toán tối ưu giải bằng phương pháp quy
hoạch động .
Trang 39
PGS.TS Nguyễn Thị Phương Hà 40
Để rời rạc hệ thống với chu kỳ lấy mẫu τ giây, ta có thể sử dụng hàm xấp
xỉ bậc 1 :
x(kτ ) = ( xk +1 − xk ) / τ (1.62)
Viết (1.60) dưới dạng :
xk +1 = xk + τ f ( xk , uk , kτ ) (1.63)
T
Trong đó : N= (1.67)
τ
Sử dụng hàm xấp xỉ bậc 1 cho mỗi đại lượng tích phân :
N −1
J ( 0 ) = φ ( x (T ) , T ) + ∑τ L ( xk , uk , kτ ) (1.68)
k =0
φ S ( N , xN ) φ ( x ( Nτ ) , Nτ )
Lk ( xk , uk ) τ L ( xk , uk , kτ ) (1.69)
Khi đó ta có :
N −1
J ( 0 ) = φ S ( N , xN ) + ∑ Lk ( xk , uk ) (1.70)
k =0
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Trong trường hợp hệ thống tuyến tính bất biến theo thời gian với chỉ tiêu
chất lượng dạng toàn phương :
x = Ax + Bu (1.71)
T
1 1
2 20
(
J ( 0 ) = xT (T ) S (T ) x (T ) + ∫ xT Qx + u T Ru dt ) (1.72)
Sử dụng hàm xấp xỉ bậc nhất để rời rạc hoá hệ thống trở thành :
xk +1 = ( I + Aτ ) xk + Bτ uk (1.73)
1 T 1 N −1
J (0) =
2 2 k =0
(
xN S N xN + ∑ xkT Q S xk + ukT R S uk ) (1.74)
Trong đó :
SN S ( Nτ ) (1.75)
Q S = Qτ (1.76)
R S = Rτ (1.77)
Tuy nhiên trong trường hợp này ta có thể làm tốt hơn xầp xỉ Euler (1.73)
bằng cách sử dụng chính xác phương trình trạng thái (1.71) bao gồm bộ lấy
mẫu và khâu giữ bậc 1 :
x k +1 = A S x k + B S u k (1.78)
Trong đó :
A S = e Aτ (1.79)
τ
(
B S = ∫ e Aτ B dt ) (1.80)
0
Khi đó hệ thống này đã được rời rạc hoá , phương pháp quy hoạch động có
thể được áp dụng để tính u k* như trong phần rời rạc . Điều khiển số áp dụng
trong thực tế được thể hiện như sau :
u ( t ) = uk∗ , kτ ≤ t ≤ ( k + 1)τ (1.81)
Để sử dụng phương pháp quy hoạch động , biến trạng thái và giá trị điều
khiển trước hết phải được lượng tử hoá , được giới hạn theo một số tập giá
trị có thể chấp nhận . Mức độ lượng tử càng tốt thì tín hiệu số càng chính
xác ; tuy nhiên khi số lượng có thể chấp nhận được của xk và uk tăng thì
Trang 41
PGS.TS Nguyễn Thị Phương Hà 42
khối lượng tính toán để tìm u k* cũng tăng theo . Vấn đề này có thể nhanh
chóng gây khó khăn kể cả đối với các máy tính lớn .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Chúng ta sẽ thấy nguyên lý cực tiểu hữu dụng như thế nào . Đặc biệt chú ý
không thể nói rằng biểu thức H ( x∗ , u ∗ , λ ∗ ) ≤ H ( x, u, λ , t ) chắc chắn phải
đúng .
Ví dụ 1.11 :
Tối ưu hóa với những ràng buộc
Giả sử chúng ta muốn tối ưu cực tiểu hàm :
1 2
L= u – 2u + 1 (1)
2
Với điều kiện :
u ≤1 (2)
Xem Hình 1.11 .
Nguyên lý cực tiểu :
L(u*) ≤ L(u) thỏa ∀u (3)
Hình 1.11 : Tối ưu hoá với nhiều điều kiện ràng buộc .
Trang 43
PGS.TS Nguyễn Thị Phương Hà 44
1
L* = L(1) = - (5)
2
Giá trị nhỏ nhất không ràng buộc tìm được bằng cách giải :
∂L
= u -2 = 0 (6)
∂u
nhận được :
u=2 (7)
và :
L(2) = -1 (8)
nhỏ hơn (5) ; nhưng u=2 thì không nằm trong khoản u ≤ 1 .
∂H
0= = BTλ (1.92)
∂u
Nó không chứa u bởi vì hàm Hamilton tuyến tính đối với u . Rõ ràng , để H
cực tiểu chúng ta nên chọn u(t) sao cho λT(t)Bu(t) càng nhỏ càng tốt ( có
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
nghĩa là giá trị càng xa về phía bên trái trên trục tọa độ thực ; λTBu = - ∞ là
giá trị nhỏ nhất ) . Nếu không có sự ràng buộc nào trên u(t) , thì điều này sẽ
cho ra những giá trị vô hạn ( dương hoặc âm ) của những biến điều khiển .
Với kết quả này , bài toán tối ưu đặt ra phải có những điều kiện ràng buộc
đối với tín hiệu điều khiển .
Theo nguyên lý cực tiểu Pontryagin (1.87) , hàm điều khiển tối ưu u*(t) phải
thỏa mãn :
1 + (λ ∗ )T ( Ax∗ + Bu ∗ ) ≤ 1 + (λ ∗ )T ( Ax∗ + Bu )
⇒ (λ ∗ )T Bu ∗ ≤ (λ ∗ )T Bu (1.93)
đối với tất cả giá trị u(t) cho phép . Điều kiện này cho phép chúng ta biểu
diễn u*(t) dưới dạng biến trạng thái . Để thấy điều này , trước tiên chúng ta
thảo luận về trường hợp một ngõ vào .
Đặt u(t) là một đại lượng vô hướng và đặt b tượng trưng cho vector ngõ vào .
Trong trường hợp này dễ dàng chọn u*(t) để tối thiểu λT(t) bu(t) . ( Chú ý :
giá trị nhỏ nhất nghĩa là λT(t)bu(t) nhận một giá trị càng gần - ∞ càng tốt ) .
Nếu λT(t)b là giá trị dương , chúng ta nên chọn u(t) = -1 làm cho λT(t)bu(t)
có giá trị âm nhất . Mặt khác , nếu λT(t)b là giá trị âm , chúng ta nên chọn
u(t) ở giá trị cực đại là giá trị 1 để giá trị λT(t)bu(t) càng âm càng tốt . Nếu
giá trị λT(t)bu(t) bằng zero tại thời điểm t , khi đó u(t) có thể nhận bất cứ giá
trị nào tại thời điểm này .
Quan hệ giữa điều khiển tối ưu và biến trạng thái có thể biểu diễn bằng hàm
sgn(w) :
⎧ 1 w>0
⎪
sgn ( w ) = ⎨( −1,1) w = 0 (1.94)
⎪ −1 w < 0
⎩
Khi đó hàm điều khiển tối ưu được cho bởi :
u ∗ (t ) = − sgn(bT λ (t )) (1.95)
u* được biểu diễn dưới dạng biến trạng thái , với hệ tuyến tính dạng toàn
phương .
Giá trị bTλ(t) được gọi là hàm chuyển đổi . Một hàm chuyển đổi mẫu và bộ
điều khiển tối ưu được diễn tả ở Hình 1.12 . Khi hàm chuyển đổi này đổi
dấu , bộ điều khiển chuyển từ cực trị này đến cực trị khác . Bộ điều khiển
trong hình được chuyển đổi bốn lần . Điều khiển thời gian tối thiểu tuyến
Trang 45
PGS.TS Nguyễn Thị Phương Hà 46
tính tối ưu luôn bão hòa khi nó chuyển đổi tại vị trí giữa các giá trị cực trị ,
cho nên được gọi là điều khiển Bang-bang .
Nếu bộ điều khiển là một vector có m phần tử , theo nguyên lý cực tiểu ta
chọn các thành phần ui(t) bằng 1 , nếu các thành phần biTλ(t) là giá trị âm ;
và bằng -1 nếu biTλ(t) là giá trị dương , với bi là cột thứ i của B . Phương
pháp điều khiển này tạo thành một giá trị :
m
λ T (t ) Bu (t ) = ∑ ui (t )biT λ (t ) (1.96)
i =1
Hệ thống bất biến theo thời gian trong biểu thức (1.88) có thể đạt được nếu
chỉ có một ma trận
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
U n = ⎡⎣ B AB … An −1 B ⎤⎦ (1.99)
cấp n . Nếu bi là cột thứ i của B∈Rn x n , khi đó hệ thống là bình thường nếu :
U = ⎡⎣b Ab … An −1b ⎤⎦ (1.100)
cấp n cho mỗi giá trị i = 1 , 2 , … , m ; mà khi thành lập cho mỗi giá trị
riêng biệt u , u ∈ Rm .
Giả sử hệ thống bình thường và ta muốn dẫn x(t0) tiến đến trạng thái cuối
cố định x(T) với hàm điều khiển thỏa [u (t )] ≤ 1 . Khi đó :
1. nếu trạng thái cuối x(T) bằng zero , khi đó sẽ tồn tại bộ điều khiển thời
gian tối thiểu nếu hệ thống không có cực với phần thực dương ( ví dụ
không có cực trên mặt phẳng phía bên phải ) .
2. cho bất kỳ giá trị x(T) cố định , nếu tồn tại đáp án cho bài toán tối ưu thời
gian thì nó là duy nhất .
3. cuối cùng , nếu hệ thống có n cực thực và nếu tồn tại bộ điều khiển tối ưu
thời gian thì mỗi thành phần ui(t) của bộ điều khiển tối ưu thời gian thay
đổi n-1 lần .
Ví dụ 1.12 :
Điều khiển Bang-Bang
Cho hệ thống tuân theo định luật Newton :
y=v (1)
v =u (2)
T
với y là vị trí tọa độ và v là vận tốc . Trạng thái là x = [y u] . Cho gia tốc
ngõ vào u ràng buộc bởi :
u (t ) ≤ 1 (3)
Mục đích điều khiển là đưa trạng thái từ điểm ban đầu bất kỳ ( y ( 0 ) , v ( 0 ) )
đến điểm gốc trong thời gian T ngắn nhất . Trạng thái cuối được cố định tại :
⎡ y (T )⎤
ϕ (x(T),T) = ⎢ ⎥ =0 (4)
⎣ v(T ) ⎦
Lập hàm Hamilton (1.91) :
H = 1 + λyv + λvu (5)
λ = [λy λv] là biến trạng thái .
T
Trang 47
PGS.TS Nguyễn Thị Phương Hà 48
∂H
λy = − =0 (6)
∂y
∂H
λv = − = −λ y (7)
∂v
Điều kiện tiếp tuyến :
0 = H (T ) = 1 + λ y (T ) v (T ) + λv (T ) u (T ) (8)
hoặc dùng công thức (4) ,
λv (T ) u (T ) = −1 (9)
Nguyên lý cực tiểu Pontryagin cần đến phương trình (1.97) , hoặc :
u ( t ) = − sgn ( λv ( t ) ) (10)
vì thế thành phần biến trạng thái λv(t) là hàm chuyển đổi . Để xác định bộ
điều khiển tối ưu , ta chỉ cần xác định λv(t) .
Giải phương trình (6) và (7) với thời gian cuối T :
λ y ( t ) = const λy (11)
λv ( t ) = λv (T ) + (T − t ) λ y (12)
Dùng công thức (9) và giá trị u ∗ ( t ) bão hòa tại giá trị 1 hoặc –1 , ta được :
u ∗ (T ) = 1 và λv∗ (T ) = −1 (13)
hoặc :
u ∗ (T ) = −1 và λv∗ (T ) = 1 (14)
Có nhiều khả năng cho hàm chuyển đổi λv∗ ( t ) , tuỳ thuộc vào giá trị của
λv∗ (T ) và λy . Vài khả năng của hàm chuyển đổi λv∗ ( t ) được diễn tả trong
Hình 1.13 . Giá trị λv∗ (T ) ∈ (y(0) , v(0)) . Chú ý rằng λv∗ ( t ) là tuyến tính ,
và cắt ngang trục tọa độ .
Ta cần xác định phương pháp chuyển đổi để bộ điều khiển tối ưu luôn đúng ,
đồng thời cũng phải xác định thời điểm chuyển đổi tS ( xem Hình 1.13 ) .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Xét 2 tín hiệu điều khiển chấp nhận được : u ( t ) = 1 với ∀t hoặc u ( t ) = −1
với ∀t . Do cả 2 trường hợp u đều là hằng số nên khi kết hợp phương trình
trạng thái (2) và (1) ta được :
v ( t ) = v ( 0 ) + ut (15)
1
y ( t ) = y ( 0 ) + v ( 0 ) t + ut 2 (16)
2
Để loại bỏ thời gian biến thiên , từ dùng biểu thức (15) ta có được :
t = (v (t ) − v (0)) / u
và sau đó thay vào biểu thức (16) suy ra :
( y ( t ) − y ( 0 ) ) u = v ( 0 ) ( v ( t ) − v ( 0 ) ) + 12 ( v ( t ) − v ( 0 ) )
2
(17)
Đây là một parabol đi qua tọa độ ( y ( 0 ) , v ( 0 ) ) và khi trạng thái ban đầu
biến thiên ta vẽ được một họ parabol . Đồ thị mặt phẳng pha phản ánh trạng
thái biến thiên diễn tả cho trường hợp u = 1 và u = -1 ở Hình 1.14 . Họ quỹ
đạo đi từ dưới lên trên ứng với trường hợp u = 1 , và họ quỹ đạo đi từ trên
xuống dưới ứng với u = -1 . Mũi tên chỉ hướng tăng của thời gian .
Trang 49
PGS.TS Nguyễn Thị Phương Hà 50
Như đã trình bày ở trên , tín hiệu điều khiển tối ưu u ( t ) là một hàm không
đổi từng đoạn , lấy giá trị ±1 và có nhiều nhất là hai đoạn không đổi . Do
đó, nếu ban đầu trong một khoảng thời gian nào đó u ( t ) lấy giá trị +1 và
sau đó là -1 thì họ quỹ đạo pha gồm hai đoạn của các parabol nối tiếp nhau,
trong đó đoạn parabol thứ hai là đường parabol chạy về gốc toạ độ. Như
vậy, đường cong hợp bởi hai nhánh parabol (đường đứt nét trên Hình 1.14)
là quỹ đạo cuối đưa trạng thái về gốc toạ độ , đường cong đó được gọi là
đường chuyển đổi và có phương trình là :
⎧ 1 2 v<0
⎪⎪ v
y=⎨ 2 (18)
⎪− 1 v 2 v>0
⎪⎩ 2
Theo nguyên lý cực tiểu, chỉ có những quỹ đạo trên là tối ưu và từ một điểm
của mặt phẳng pha chỉ có một quỹ đạo tối ưu chạy về gốc tọa độ .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Bây giờ chúng ta sẽ đi tìm thời gian tối thiểu tới đích với trạng thái ban đầu
( y ( 0) , v ( 0)) .
Giả sử rằng trạng thái đầu nằm trên đường cong chuyển ứng với u = -1 , sau
đó chuyển sang u = 1 rồi về gốc tọa độ . Khi đó luật điều khiển u = -1 được
áp dụng đầu tiên để đưa trạng thái từ ( y ( 0 ) , v ( 0 ) ) dọc theo đường parabol
để đến đường cong chuyển đổi . Tại điểm chuyển đổi ( I ) ứng với thời điểm
chuyển đổi tS , tín hiệu điều khiển chuyển thành u = 1 và đưa trạng thái về
gốc toạ độ .
Chúng ta có thể xác định thời điểm chuyển đổi ts khi trạng thái nằm trên
đường cong này . Dùng công thức (15) và (16) với u = -1 suy ra :
t2
y (t ) = y ( 0) + v ( 0) t −
2
v2 (t ) v2 ( 0) t2
= = − v ( 0) t +
2 2 2
v2 ( 0)
⇒ t 2 − 2v ( 0 ) t + − y ( 0) = 0 (19)
2
Thời điểm chuyển đổi sẽ là :
v2 ( 0)
tS = v ( 0 ) + y ( 0 ) + (20)
2
Áp dụng (15) tại điểm chuyển đổi ta có :
v ( tS ) = v ( 0 ) − tS (21)
Cũng sử dụng (15) đối với thời gian còn lại (T − tS ) ( bây giờ u = 1 ) :
0 = v (T ) = v ( tS ) + (T − tS ) (22)
Từ (21) và (22) ta tính được thời gian cực tiểu đến đích :
T = 2tS − v ( 0 )
Hoặc :
v2 ( 0)
T = v ( 0) + 2 y ( 0) + (23)
2
Trang 51
PGS.TS Nguyễn Thị Phương Hà 52
Khi đó chúng ta cho phép khả năng tiêu thụ nhiên liệu của m đầu vào ui(t)
bởi trọng số vô hướng ci . Ta định nghĩa trị tuyệt đối của vector :
⎡ u1 ⎤
⎢ ⎥
u =⎢ ⎥ (1.103)
⎢u ⎥
⎣ m ⎦
( định nghĩa này tương tự (1.90) ) và vector C = [c1 c2 … cm]T . Ta có :
T
J ( t0 ) = ∫ C T u ( t ) dt (1.104)
t0
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
(λ ) (λ )
T T
*
bi u * *
bi ui
ui* + ≤ ui + (1.109)
ci ci
Với bi biểu diễn thành phần cột thứ i của ma trận B . Bây giờ ta phải tìm ra
cách thức để chọn giá trị ui*(t) từ λT(t)bi .
Với :
⎧u ui ≥ 0
ui = ⎨ i (1.110)
⎩− u i ui ≤ 0
ta có thể viết lại chỉ tiêu chất lượng theo dạng sau :
⎧⎛ 1 + biT λ ⎞
⎪⎜ ⎟ ui ui ≥ 0
biT λ ui ⎪⎝ ci ⎠
qi ( t ) ui + =⎨ (1.111)
ci ⎪⎛ 1 − bi λ ⎞
T
⎜ ⎟ ui ui ≤ 0
⎪
⎩⎝ ci ⎠
Nếu biTλ/ci bằng 1 , khi đó một vài giá trị không xác định dương của ui(t) sẽ
làm qi trong (1.111) bằng zero ; nếu biTλ/ci bằng -1 , khi đó một vài giá trị
không xác định âm của ui(t) sẽ làm qi bằng zero . Do đó bài toán nhiên liệu
tối thiểu có luật điều khiển giống như một bài toán phi tuyến .
Biến trạng thái hồi tiếp là :
bi λ (t ) / ci < −1
T
⎧ 1
⎪nonnegative
bi λ (t ) / ci = −1
T
⎪⎪
ui ( t ) = ⎨ 0 − 1 < bi λ (t ) / ci < 1
T
(1.112)
⎪ nonpositive bi λ (t ) / ci = 1
T
⎪
⎪⎩ bi λ (t ) / ci > 1
T
-1
Trang 53
PGS.TS Nguyễn Thị Phương Hà 54
⎧ −1 w < −1
⎪ −1; 0
⎪⎪( ) w = −1
dez ( w ) = ⎨ 0 −1 < w < 1 (1.113)
⎪ ( 0;1) w =1
⎪
⎪⎩ 1 w >1
Ta có thể viết lại bài toán nhiên liệu tối thiểu như sau :
⎛ bi T λ (t ) ⎞
u i (t ) = −dez⎜⎜ ⎟
⎟ i = 1,2,..., m (1.114)
⎝ c i ⎠
mỗi thành phần u(t) hoặc bão hòa hoặc bằng zero , ta gọi điều này là luật
điều khiển bang-off-bang .
Nếu biTλ(t)/ci bằng 1 hoặc –1 , giữa 2 trạng thái có một khoảng thời gian
khác zero . Trong trường hợp này , nguyên lý cực tiểu sẽ không xác định
được các thành phần ui(t) . Đây gọi là những khoảng kỳ dị . Nếu biTλ(t)/ci
bằng 1 hoặc –1 chỉ tại một số khoảng thời gian xác định , đây là bài toán
nhiên liệu tối thiểu thông thường .
Bài toán điều khiển nhiên liệu tối thiểu là thông thường nếu A # 0 và nếu hệ
thống là bình thường . Có nghĩa là nếu Ui được định nghĩa bởi (1.100) thì nó
là kỳ dị với i = 1 , … , m .
Nếu bài toán nhiên liệu tối thiểu là bình thường và bộ điều khiển nhiên liệu
tối thiểu tồn tại , khi đó nó là duy nhất .
Ở ví dụ kế ta sẽ xem xét một số vấn đề của bài toán nhiên liệu tối thiểu .
Ví dụ 1.13 :
Điều khiển Bang-off-bang
Hệ thống được mô tả :
y=v (1)
v=u (2)
với x = [ y v ] . Điều kiện ràng buộc của ngõ vào :
T
u (t ) ≤ 1 (3)
Giả sử ta xác định được trạng thái đầu (y(0),v(0)) . Ta được :
⎡ y[T ]⎤
ψ (x(T ), T ) = ⎢ ⎥=0 (4)
⎣ v[T ]⎦
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Chỉ tiêu chất lượng với yêu cầu nhiên liệu tối thiểu :
T
J (0 ) = ∫ u (t )dt (5)
0
Ta chưa chú ý đến trạng thái thời gian cuối T hoặc tự do hoặc ràng buộc,
mặc dù cuối cùng ta cũng sẽ xét đến cả 2 trường hợp .
Hàm Hamilton :
H = u + λ y v + λv u (6)
λv = −λ y (8)
Điều kiện tiếp tuyến yêu cầu :
0 = H (T ) = u (T ) + λv (T )u (T ) (9)
Từ (4) , (7) , (8) ta suy ra :
λ y ( t ) = const λy (10)
λv ( t ) = λv (T ) + (T − t ) λ y (11)
Thành phần biến trạng thái λv(t) là tuyến tính . Tùy thuộc vào biến chưa biết
λy và λv(T) ( chúng tuỳ thuộc vào giá trị của trạng thái đầu ) , λv(t) có thể là
hằng số (λy = 0) , có thể tăng (λy < 0) hoặc giảm (λy > 0) . Xem Hình 1.13 .
Nguyên lý cực tiểu Pontryagin yêu cầu :
u (t ) = −dez (λv (t )) (12)
do đó điều khiển tối ưu là :
⎧ 1 λv (t ) < −1
⎪ [0;1] λv (t ) = −1
⎪⎪
u (t ) = ⎨ 0 − 1 < λv (t ) < 1 (13)
⎪[- 1;0] λv (t ) = 1
⎪
⎩⎪ - 1 λv (t ) > 1
Nói về tính tuyến tính của λv(t) , chúng ta thấy rằng u = 1 không thể chuyển
ngay thành u = -1 mà không qua giá trị trung gian u = 0 . Luật điều khiển có
thể chấp nhận là điều khiển tối ưu nếu thỏa những yêu cầu này .
Trang 55
PGS.TS Nguyễn Thị Phương Hà 56
Bây giờ chúng ta sẽ xác định luật điều khiển tối ưu và đi tìm những thời
điểm lúc bộ điều khiển chuyển đổi sang giá trị mới .
Bỏ qua những khoảng thời gian riêng biệt khác , có 3 giá trị của u(t) là : -1 ,
0 , 1 . Hình 1.14 cho ta quỹ đạo mặt phẳng pha khi u = 1 và u = -1 .
Nếu u(t) = 0 ∀t , khi đó trạng thái xác định bởi :
v (t ) = v ( 0) (14)
y (t ) = y ( 0) + v ( 0) t (15)
Những đường nằm ngang của hằng số v trong quỹ đạo mặt phẳng pha được
cho ở Hình 1.15 .
Quỹ đạo mặt phẳng pha trong trường hợp u = 0 là những đường mà việc tiêu
thụ nhiên liệu là zero . Để nhiên liệu sử dụng là tối thiểu , chúng ta sẽ cho hệ
thống di chuyển theo đường u = 1 hoặc –1 , dẫn trạng thái đến một trong
những đường nằm ngang . Sau đó di chuyển dọc theo đường nằm ngang
đến vị trí chuyển đổi qua đường u = -1 hoặc 1 để dẫn trạng thái tiến về zero .
Để thấy được luật điều khiển Bang-off-bang , chúng ta kết hợp quỹ đạo của
hai Hình 1.14 và 1.15 được Hình 1.16 .
Phần tiếp theo chúng ta sẽ thảo luận riêng những tình huống cho hai vấn đề
thời gian cuối tự do và cố định .
Hình 1.15 : Quỹ đạo mặt phẳng pha trong trường hợp u = 0 .
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Hình 1.17 : Quỹ đạo trạng thái nhiên liệu tối thiểu .
Trang 57
PGS.TS Nguyễn Thị Phương Hà 58
t12
y ( t1 ) = y ( 0 ) + v ( 0 ) t1 − (19)
2
Từ t1 < t < t2 , u(t) = 0 , ta có phương trình trạng thái :
v ( t2 ) = v1 (20)
y ( t2 ) = y ( t1 ) + v1 ( t2 − t1 ) (21)
Từ t2 < t < T , u(t) = 1 , ta được :
0 = v (T ) = v ( t2 ) + ( T − t2 ) (22)
(T − t2 )
2
0 = y (T ) = y ( t2 ) + v ( t2 )(T − t2 ) + (23)
2
trong đó ta có sử dụng điều kiện biên (4) .
Thế (18) , (20) vào (22) , ta được :
t 2 = v 0 + T − t1 (24)
Thế (18) , (19) , (20) , (21) , (24) vào (23) và đơn giản hóa , cho ra kết quả :
⎛ v ⎞
2
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
với nghiệm :
Trang 59
PGS.TS Nguyễn Thị Phương Hà 60
nhiên , do hàm mô tả tín hiệu điều khiển tìm được theo bảng số liệu rời rạc
nên biểu thức giải tích của tín hiệu điều khiển chỉ là gần đúng . Phương
pháp quy hoạch động còn gặp hạn chế khi áp dụng đối với hệ thống liên tục
vì rất khó giải phương trình Belman .
Nguyên lý cực tiểu Pontryagin áp dụng tốt cho các bài toán tối ưu có điều
kiện ràng buộc bất kể điều kiện ràng buộc cho theo hàm liên tục hoặc hàm
gián đoạn . Nhưng đối với bài toán tối ưu phi tuyến thì nguyên lý cực tiểu
Pontryagin lại gặp khó khăn , đặc biệt trong việc xác định các hàm phụ
λi (t ) để cho hàm H đạt cực đại .
1.3 ĐIỀU KHIỂN TỐI ƯU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM HÀM
DẠNG TOÀN PHƯƠNG
Trong phần này chúng ta sẽ xem xét phương pháp xây dựng bài toán tổng
hợp các hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương .
1.3.1 Ổn định Lyapunov đối với hệ thống tuyến tính
Tiêu chuẩn ổn định thứ hai của Lyapunov ( điều kiện đủ )
Xét hệ thống được mô tả bởi phương trình trạng thái :
x = f ( x1 , x 2 ,..., x n )
Nếu tìm được một hàm V(x) với mọi biến trạng thái x1 , x2 ,…, xn là một hàm
dV ( x )
xác định dấu dương , sao cho đạo hàm của nó dựa theo phương
dt
trình vi phân của chuyển động bị nhiễu cũng là hàm xác định dấu , song trái
dấu với hàm V(x) thì chuyển động không bị nhiễu sẽ ổn định tiệm cận .
V ( x).V ( x) < 0 : hệ thống ổn định tiệm cận .
V ( x).V ( x) = 0 : hệ thống ổn định .
V ( x).V ( x) > 0 : hệ thống không ổn định .
Phương trình Lyapunov
Xét hệ tuyến tính mô tả bởi phương trình trạng thái :
x = Ax (1.115)
Yêu cầu cực tiểu hoá chỉ tiêu chất lượng J :
∞
J = ∫ xT Qxdt (1.116)
0
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
V ( x ) = xT Sx + xT Sx + xT Sx
= ( Ax ) Sx + xT S ( Ax ) + xT Sx
T
= xT AT Sx + xT SAx + xT Sx
(
= xT AT S + SA + S x )
Do V(x) xác định dương , nên để hệ thống ổn định thì V ( x) phải là xác định
âm .Ta chọn V ( x) = − xT Qx ( do Q là ma trận xác định dương nên V ( x) sẽ
là xác định âm ) .
⇒ (
Q = − AT S + SA + S ) (1.118)
Điều kiện cần và đủ để trạng thái cân bằng x = 0 ổn định tiệm cận : cho
trước bất kỳ một ma trận xác định dương Q và ma trận A ổn định , tồn tại
một ma trận xác định dương S thoả mãn phương trình :
AT S + SA + S = −Q
⇒ − S = AT S + SA + Q (1.119)
Phương trình (1.119) được gọi là phương trình Lyapunov .
Khi S không thay đổi theo thời gian S = 0 , ta có phương trình đại số
Lyapunov :
0 = AT S + SA + Q (1.120)
Chỉ tiêu chất lượng J được tính như sau :
∞
∞
J = ∫ xT Qxdt = − xT Sx = − xT ( ∞ ) Sx ( ∞ ) + xT ( 0 ) Sx ( 0 )
0
0
J = xT ( 0 ) Sx ( 0 ) (1.121)
Trang 61
PGS.TS Nguyễn Thị Phương Hà 62
1.3.2 Điều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng toàn
phương _ Phương trình Riccati đối với hệ liên tục
Xét hệ thống :
x = Ax + Bu (1.122)
Chúng ta cần tìm ma trận K của vector điều khiển tối ưu :
u (t ) = − Kx(t ) (1.123)
thỏa mãn chỉ tiêu chất lượng J đạt giá trị cực tiểu :
∞
J = ∫ (x T Qx + u T Ru )dt (1.124)
0
Trong đó Q là ma trận xác định dương ( hoặc bán xác định dương ) , R là ma
trận xác định dương . Chú ý : thành phần thứ hai ở phần bên phải phương
trình (1.124) xác định lượng năng lượng tiêu tốn của tín hiệu điều khiển .
Chúng ta sẽ chứng minh luật điều khiển tuyến tính cho bởi phương trình
(1.123) là luật điều khiển tối ưu . Khi đó , nếu ma trận K được xác định để
tối thiểu hoá chỉ tiêu chất lượng J thì luật điều khiển u(t) sẽ tối ưu với mọi
trạng thái ban đầu x(0) .
Từ (1.122) và (1.123) ta có :
x = Ax − BKx = ( A − BK )x (1.125)
Thay u (t ) = − Kx(t ) vào phương trình (1.124) :
∞
(
J = ∫ x T Qx + x T K T RKx dt )
0
∞
(1.126)
= ∫ x Q + K RK xdt
T
( T
)
0
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Do V(x) xác định dương , nên để hệ thống ổn định thì V ( x) phải là xác định
âm . Ta đặt :
d T
V ( x) =
dt
( )
x Sx = − xT (Q + K T RK ) x
⇒ ( ⎣ )
xT Q + K T RK x = − xT ⎡( A − BK ) S + S ( A − BK ) + S ⎤ x
T
⎦
Q + K T RK = ( A − BK ) S + S ( A − BK ) + S
T
(1.129)
Theo tiêu chuẩn ổn định thứ hai của Lyapunov , nếu ma trận (A-BK) ổn định
thì sẽ tồn tại một ma trận xác định dương S thoả mãn phương trình (1.129) .
Chỉ tiêu chất lượng bây giờ có thể được xác định như sau :
∞
(
J = ∫ x T Qx + u T Ru dt = − x T Sx ) ∞
0
= − x(∞ ) Sx(∞ ) + x(0 ) Sx(0 )
T T
[
AT S + SA + TK − T T ( ) −1
][
T
B T S TK − T T ( ) −1
]
B T S − SBR −1 B T S + Q + S = 0
(1.130)
Chỉ tiêu chất lượng J đạt giá trị cực tiểu khi biểu thức :
[
x T TK − T T ( ) −1
][
T
B T S TK − T T ( ) −1
]
BT S x
đạt giá trị cực tiểu . Khi đó :
TK = T T( ) BS −1 T
⇒ K = T −1 (T ) B S = R
T −1 T −1
BT S (1.131)
Trang 63
PGS.TS Nguyễn Thị Phương Hà 64
Phương trình (1.131) cho ta ma trận tối ưu K . Như vậy , luật điều khiển tối
ưu cho bài toán điều khiển tối ưu dạng toàn phương với chỉ tiêu chất lượng
cho bởi phương trình (1.131) là tuyến tính và có dạng :
u (t ) = − Kx(t ) = − R −1 B T Sx(t ) (1.132)
Ma trận S khi đó phải thỏa mãn phương trình (1.130) được viết lại như sau :
AT S + SA − SBR −1 B T S + Q = − S (1.133)
Phương trình (1.133) được gọi là phương trình Riccati .
Khi S không thay đổi theo thời gian S = 0 , ta có phương trình đại số
Riccati ( ARE : Algebraic Riccati Equation ) :
AT S + SA − SBR −1 B T S + Q = 0 (1.134)
Khi đó , luật điều khiển tối ưu của tín hiệu điều khiển có dạng :
uk = − K k xk (1.137)
với Kk được xác định như sau :
K k = ( BkT S k +1 Bk + Rk ) −1 BkT S k +1 Ak (1.138)
Trong đó Sk phải thoả mãn phương trình :
(
S k = AkT ⎡ Sk +1 − S k +1 Bk BkT S k +1 Bk + Rk ) BkT Sk +1 ⎤ Ak + Qk
−1
⎢⎣ ⎥⎦ (1.139)
Phương trình (1.139) chính là phương trình Riccati cho hệ rời rạc . Khi
S k ≠ 0 với ∀k , ta có thể dùng bổ đề ma trận nghịch đảo để viết lại phương
trình (1.139) như sau :
( )
S k = AkT Sk−+11 + Bk Rk−1 BkT Ak + Qk (1.140)
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
1.3.4 Các bước giải bài toán toàn phương tuyến tính
Bước 1 :
Thành lập hệ phương trình trạng thái :
⎧ x = Ax + Bu
⎨
⎩ c = Dx
Xác định các thông số A , B , D .
Bước 2 :
Xác định ma trận trọng lượng Q , R từ chỉ tiêu chất lượng J cho dưới dạng
toàn phương tuyến tính .
Bước 3 :
Tìm nghiệm S của phương trình Riccati :
- Đối với hệ liên tục : − S = AT S + SA − SBR −1 BT S + Q
- Đối với hệ rời rạc :
(
S k = AkT ⎡ Sk +1 − S k +1 Bk BkT S k +1 Bk + Rk ) BkT Sk +1 ⎤ Ak + Qk
−1
⎢⎣ ⎥⎦
Bước 4 :
Chỉ tiêu chất lượng tối ưu đối với hệ dừng :
J = xT ( 0 ) Sx ( 0 )
min
Bước 5 :
Luật điều khiển tối ưu :
- Đối với hệ liên tục : u = − R −1 BT Sx
Ví dụ 1.14:
Cho hệ thống như hình vẽ .
Trang 65
PGS.TS Nguyễn Thị Phương Hà 66
∞
J = ∫ (e 2 + μe 2 )dt ( μ > 0 ) (1)
0+
0+ 0+
∞
⎡1 0 ⎤ ⎡ x1 ⎤
= ∫ [x
0+
1 x 2 ]⎢ ⎥ ⎢ ⎥ dt
⎣0 μ ⎦ ⎣ x 2 ⎦
∞
= ∫x
T
Qxdt (9)
0+
Nếu ma trận A ổn định thì chỉ tiêu chất lượng J có thể xác định từ (1.129) :
J = x T (0+ ) Sx(0+ ) (10)
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Trang 67
PGS.TS Nguyễn Thị Phương Hà 68
∂2 J 1+ μ
=
∂ζ 2 2ζ 3
1+ μ 2
= = >0 (22)
⎛ 1+ μ ⎞
3
1+ μ
2⎜ ⎟⎟
⎜ 2
⎝ ⎠
Như vậy, chỉ tiêu chất lượng J sẽ đạt cực tiểu tại giá trị tối ưu ζ = 1 + μ / 2
J min = 1 + μ (23)
Ví dụ 1.15 :
Xác định luật điều khiển tối ưu rời rạc biết hệ thống có đối tượng điều khiển
mô tả bởi phương trình trạng thái sau :
⎡0 1 ⎤ ⎡ 0 ⎤
x (t ) = ⎢ ⎥ x (t ) + ⎢ ⎥ u (t ) (1)
⎣0 −0.1⎦ ⎣0.01⎦
(
S k = AkT ⎡ Sk +1 − S k +1 Bk BkT S k +1 Bk + Rk ) BkT Sk +1 ⎤ Ak + Qk
−1
(4)
⎢⎣ ⎥⎦
⎡1 0 ⎤
với : Ak = Ad , Bk = Bd , Qk = ⎢ ⎥ , Rk = 0.001
⎣0 0⎦
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Ta tính được K49 = 0 khi biết S50 = 0 . Tiếp theo ta tính giá trị S49 :
⎡1 0 ⎤
S 49 = Q49 = ⎢ ⎥ (5)
⎣0 0⎦
Tiếp tục với K48 và S48 :
−1
⎛ ⎡1 0 ⎤ ⎡ 0.00123⎤ ⎞
K 48 = ⎜ [ 0.00123 0.00488] ⎢ ⎥ ⎢ ⎥ + 0.001⎟ .[ 0.00123 0.00488] .
⎝ ⎣0 0 ⎦ ⎣ 0.00488⎦ ⎠
⎡1 0 ⎤ ⎡1 0.488⎤
⎢ 0 0 ⎥ ⎢0 0.951⎥ = [1.228 0.599] (6)
⎣ ⎦⎣ ⎦
⎡ 1 0 ⎤ ⎪⎧ ⎡1 0 ⎤ ⎡1 0 ⎤ ⎡ 0.00123⎤ ⎛ ⎡1 0 ⎤
S 48 = ⎢ ⎥ ⎨⎢ ⎥ −⎢ ⎥ ⎢ ⎥ ⎜ [ 0.00123 0.00488] ⎢ ⎥.
⎣0.488 0.951⎦ ⎪⎩ ⎣ 0 0 ⎦ ⎣ 0 0⎦ ⎣ 0.00488⎦ ⎝ ⎣0 0⎦
⎡1 0 ⎤ ⎫⎪ ⎡1 0.488⎤ ⎡1 0⎤
−1
⎡ 0.00123⎤ ⎞
⎢ 0.00488⎥ + 0.001 ⎟ [ 0.00123 0.00488 ] ⎢0 0 ⎥ ⎬ ⎢0 0.951⎥ + ⎢ 0 0⎥
⎣ ⎦ ⎠ ⎣ ⎦ ⎪⎭ ⎣ ⎦ ⎣ ⎦
⎡0.9985 0.4873⎤
=⎢ ⎥ (7)
⎣ 0.4873 0.2378⎦
Tiếp tục tính toán nhờ máy tính , ta sẽ xác định được với k = 39 ma trận Kk
sẽ hội tụ về giá trị [25 63] .Vậy điều khiển tối ưu cuối cùng là :
uk = − [ 25 63] xk (8)
Trang 69
PGS.TS Nguyễn Thị Phương Hà 70
Chương trình :
C = [1/(18^(1/2)) 0;0 1/(8^(1/2))];
D = [0;0];
Aeq = [1 1];
Beq = [1];
x = lsqlin(C, D, [], [], Aeq, Beq)
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
1.4.2 Điều khiển tối ưu cánh tay máy hồi tiếp góc θ
Xét mô hình cánh tay máy hai đoạn như hình :
Vị trí điểm cuối của cánh tay hai đoạn được cho bởi phương trình sau :
x = L1 cos (θ1 ) + L2 cos (θ1 + θ 2 )
Trang 71
PGS.TS Nguyễn Thị Phương Hà 72
⎧ x1 = x2
⎪ x = AT + BT − E
⎪
⇒⎨ 2 1 2
⎪ x3 = x4
⎪⎩ x4 = CT1 + DT2 − F
( )
J = ∫ Ψ12 + Ψ12 + Ψ 22 + Ψ 22 dt
0
Tín hiệu điều khiển T được tính toán bằng chương trình Giai_PT.m
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Chương trình :
Thông số đầu vào cho hệ thống (file thongso.m) :
global m1 m2 L1 L2 a1 a2 I1 I2
m1 = 3.6745;
m2= 1.0184;
L1= 0.6519 ;
L2= 0.6019;
a1= 0.3365 ;
a2= 0.2606;
I1= 0.370 ;
I2= 0.081;
Trang 73
PGS.TS Nguyễn Thị Phương Hà 74
B = [e1+B(1,1)*K1-theta1_dot*(K1+1); e2+B(2,1)*K2-theta2_dot*(K2+1)];
C = inv(A)*B;
u1 = C(1,1);
u2 = C(2,1);
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Trang 75
PGS.TS Nguyễn Thị Phương Hà 76
Chương trình :
function [x,u,t] = ex1.12
a = [0 1;0 0];
b = [0;1];
x0 = [10 10];
T = 0.025;
N = 1200;
x(:,1) = x0;
eps = 1e-4;
t=0:T:T*N;
for k = 1:N
sw = x(1,k) + 0.5 * x(2,k) * abs( x(2,k) );
if ( abs(sw) < eps )
if ( x(1,k) > 0 ) u(k) = 1; end
if ( x(1,k) < 0 ) u(k) = -1; end
else
if ( sw > 0 ) u(k) = -1; end
if ( sw < 0 ) u(k) = 1; end
end
if ( x(1,k)^2 + x(2,k)^2 < eps ) u(k) = 0; end
y = lsim(a,b,eye(2),zeros(2,1),u(k)*ones(1,2),[(k-1)*T, k*T],x(:,k));
x(:,k+1)=y(2,:)';
end
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Chương trình :
function [x,u,S,tf] = ex
x0 = 10;
a = .05;
b = 1;
r = 1;
Trang 77
PGS.TS Nguyễn Thị Phương Hà 78
[tb,S] = ode45('fex',-10,0,0);
K = -b * flipud(S) / r;
tf = flipud(-tb);
x(1) = x0;
u(1) = K(1) * x(1);
for k = 1 : length(tf)-1
x(k+1) = expm( (a + b * K(k) ) * ( tf(k+1) - tf(k) ) ) * x(k);
u(k+1) = K(k+1) * x(k+1);
end
function sd = fex(t,s)
q = 1; a = .05; b = 1; r = 1;
sd = 2 * a * s(1) - ( b^2 * s(1)^2 ) / r + q;
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Trang 79
PGS.TS Nguyễn Thị Phương Hà 80
2. Hệ rời rạc
Xét hệ vô hướng :
xk +1 = axk + buk
với chỉ tiêu chất lượng :
1 1 N −1
Ji =
2
(
sN xN2 + ∑ qxk2 + ruk2
2 k =i
)
a = 1.05 , b = 0.01 , q = r = 1 , x0 = 10 , N = 100 . Chúng ta sẽ xét hai trường
hợp sN = 5 và sN = 500 bằng chương trình dex để tìm các quỹ đạo tối ưu .
Chương trình :
function [x,u,K,S] = dex
a = 1.05;
b = 0.01;
q = 1;
r = 1;
x0 = 10;
s = 5;
N = 100;
S(N+1) = s;
for k = N:-1:1
K(k) = ( a * b * s ) / ( r + s * b^2 );
s = q + ( r * s * a^2 ) / ( r + s * b^2 );
S(k) = s;
end
x(1) = x0;
for k = 1:N
u(k) = -K(k) * x(k);
x(k+1) = a * x(k) + b * u(k);
end
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Trang 81
PGS.TS Nguyễn Thị Phương Hà 82
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
Trang 83
PGS.TS Nguyễn Thị Phương Hà 84
Hãy chứng minh hàm biến số phụ Ψ được xác định từ điều kiện cực tiểu của
J như sau :
Ψ+Ψ =0
3. Phát biểu nguyên lý tối ưu của Belman . Trình bày ý tưởng giải quyết bài
toán tối ưu của phương pháp quy hoạch động .
4. Trình bày nguyên lý cực tiểu của Pontryagin
5. Phát biểu tiêu chuẩn ổn định thứ hai của Lyapunov .
6. Ứng dụng Lyapunov trong bài toán LQR liên tục .
7. Tìm điểm (x,y) thuộc parabol :
y = x 2 + 3x − 6
sao cho khoảng cách từ (x , y) đến điểm có toạ độ (2,2) là ngắn nhất . Tính
khoảng cách đó .
8. a. Tìm hình chữ nhật có diện tích lớn nhất với chu vi p nhỏ nhất . Nghĩa là
tìm x và y thoả mãn cực đại hoá hàm :
L( x, y ) = xy
với điều kiện ràng buộc : f ( x, y ) = 2 x + 2 y − p = 0
b. Tìm hình chữ nhật có chu vi nhỏ nhất với diện tích cho trước là a 2 .
Nghĩa là cực tiểu hoá hàm :
L ( x, y ) = 2 x + 2 y
với điều kiện ràng buộc : f ( x, y ) = xy − a 2 = 0
9. Cho hệ thống :
⎡1⎤ ⎡2 2⎤
x = ⎢ ⎥x+⎢ ⎥u
3
⎣ ⎦ ⎣ 1 0 ⎦
Tìm các giá trị tối ưu x∗ , u ∗ , L∗ thoả mãn cực tiểu chỉ tiêu chất lượng :
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
1 T ⎡1 0 ⎤ 1 T ⎡ 2 1⎤
L= x ⎢0 2⎥ x + 2 u ⎢1 1⎥ u
2 ⎣ ⎦ ⎣ ⎦
10. Cho hệ thống :
d2y
=u
dt 2
Tìm tín hiệu điều khiển u thoả mãn cực tiểu chỉ tiêu chất lượng :
1
⎛1 ⎞
J = ∫ ⎜ μ u 2 + ρ u ⎟ dt
−1 ⎝
2 ⎠
với các điều kiện đầu :
y (−1) = y (1) = 0
y (−1) = y (1) = 0
11. Cho hệ thống :
x = −x + u
a. Tìm phương trình trạng thái của hệ thống .
b. Tìm điều khiển tối ưu để cực tiểu chỉ tiêu chất lượng J :
1
J = ∫ u 2 dt
0
Cho N = 2 . Tín hiệu điều khiển chỉ nhận các giá trị : uk = 1 hoặc uk = −1 .
xk nhận các giá trị -1, 0, 1, 2 .
a. Sử dụng phương pháp quy hoạch động để tìm luật điều khiển hồi tiếp
trạng thái tối ưu .
b. Với x0 = 2 , hãy tìm tổn hao tối ưu , trình tự điều khiển và quỹ đạo
trạng thái .
Trang 85
PGS.TS Nguyễn Thị Phương Hà 86
http://www.khvt.com
Chương 1 : Điều khiển tối ưu -
a. Vẽ quỹ đạo nghiệm số của hệ hở khi a thay đổi từ 0 đến ∞ . Với giá
trị nào của a thì hệ thống ổn định .
b. Với a = -8 tìm lời giải cho phương trình đại số Riccati và hệ số K .
17. Xét hệ rời rạc :
xk +1 = 2 xk + uk
a. Tìm lời giải xk với k = 0 ; 5 nếu x0 = 3 .
b. Xác định luật uk tổn hao năng lượng tối thiểu để đưa hệ thống từ x0 = 3
về x5 = 0 . Vẽ quỹ đạo trạng thái tối ưu .
c. Tìm luật hồi tiếp trạng thái Kk tối ưu sao cho chỉ tiêu chất lượng J đạt
cực tiểu :
4
(
J = 5 x52 + 0.5∑ xk2 + uk2 )
k =0
Trang 87
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 1
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 2
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
KӃt luұn
http://www.khvt.com Trang 3
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 6
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
2.1.5 Ӭng dөng
x Tӵ chӍnh ÿӏnh Quá trình ÿӝng hӑc
Sӱ dөngbӝbӝÿiӅu
Sӱdөng ÿiӅukhiӇn
khiӇnvӟi
vӟicác
cácthông
thôngsӕsӕ Sӱ
Sӱdөng biӃnÿәi
dөngbӝbӝbiӃn ÿәivӟi
vӟicác
cácthông
thôngsӕsӕ
biӃnÿәi
biӃn ÿәi hҵng
hҵng
http://www.khvt.com Trang 7
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Cѫ
Cѫcҩu
cҩuhiӋu
hiӋuchӍnh
chӍnh
uc y
Bӝ ÿiӅu khiӇn u Ĉӕi
Bӝ ÿiӅu khiӇn Ĉӕitѭӧng
tѭӧng
http://www.khvt.com Trang 11
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
dT we
J e
dt wT
http://www.khvt.com Trang 13
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 14
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
wT wJ we
J Je (2.2)
wt wT wT
http://www.khvt.com Trang 15
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
dT we
J sign(e) (2.4)
dt wT
http://www.khvt.com Trang 16
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Hoһc
dT § we ·
J sign ¨ ¸ sign (e )
dt © wT ¹
Ĉây gӑi là giҧi thuұt dҩu - dҩu. HӋ rӡi rҥc sӱ dөng
giҧi thuұt này ÿѭӧc ӭng dөng trong viӉn thông nѫi
ÿòi hӓi tính toán nhanh và thӵc hiӋn ÿѫn giҧn.
Phѭѫng trình (2.2) còn ÿѭӧc áp dөng trong trѭӡng
hӧp có nhiӅu thông sӕ hiӋu chӍnh, khi ÿó T trӣ
thành mӝt vector và e/T là gradient cӫa sai sӕ ÿӕi
vӟi các thông sӕ tѭѫng ӭng. Ӭng dөng cӫa luұt
MIT ÿѭӧc biӇu diӉn bҵng hai ví dө sau :
http://www.khvt.com Trang 17
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
dy
ay bu (2.5)
dt
http://www.khvt.com Trang 19
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 20
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
bt 0
y uc
p a bs 0
vӟi p là toán tӱ vi phân. Ĉӝ nhҥy có thӇ tính ÿѭӧc
bҵng cách lҩy ÿҥo hàm riêng phҫn theo tham sӕ cӫa
bӝ ÿiӅu khiӇn s0 và t0 :
http://www.khvt.com Trang 21
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
we b
uc
wt 0 p a bs 0
2
we b t0 b
u
2 c
y
ws 0 ( p a bs 0 ) p a bs 0
Các công thӭc này không thӇ dùng vì thông sӕ ÿӕi
tѭӧng a và b chѭa biӃt. Vì vұy cҫn phҧi làm xҩp xӍ
ÿӇ có ÿѭӧc luұt hiӋu chӍnh tham sӕ thӵc tӃ. ĈӇ thӵc
hiӋn ÿiӅu này, ÿҫu tiên cҫn quan sát vӟi giá trӏ tӕi ѭu
cӫa tham sӕ bӝ ÿiӅu khiӇn, ta có :
p + a + bs0 = p + am
http://www.khvt.com Trang 22
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Bài tұp vӅ nhà (dùng làm bài tұp trong phҫn Câu
hӓi ôn tұp và bài tұp ӣ cuӕi chѭѫng): Mô phӓng
bҵng Matlab hӋ MRAS trong ví dө 2.2 (Ví dө 4.2
TLTK[1]) vӟi a = 1, b = 0.5, am = 2 và bm = 2. Tín
hiӋu vào là sóng vuông vӟi biên ÿӝ bҵng 1 và J = 2.
http://www.khvt.com Trang 24
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Luұt MIT có thӇ thӵc hiӋn tӕt nӃu ÿӝ lӧi thích nghi J
là nhӓ. Ĉӝ lӟn J tuǤ thuӝc vào biên ÿӝ cӫa tín hiӋu
chuҭn và ÿӝ lӧi cӫa ÿӕi tѭӧng. Vì vұy không thӇ có
mӝt giӟi hҥn cӕ ÿӏnh ÿҧm bҧo an toàn do ÿó luұt
MIT có thӇ cho mӝt hӋ vòng kín không an toàn. Luұt
hiӋu chӍnh bә sung có thӇ ÿѭӧc dùng bҵng lí thuyӃt
әn ÿӏnh. Nhӳng luұt này tѭѫng tӵ luұt MIT nhѭng
các hàm ÿӝ nhҥy thì ÿѭѫng nhiên là khác. Ý này
ÿѭӧc trình bày nhiӅu hѫn trong mөc 2.2.4
http://www.khvt.com Trang 26
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
ÿһt. NӃu có thӇ làm cho sai sӕ bҵng 0 ÿӕi vӟi mӑi tín
hiӋu yêu cҫu thì gӑi là mô hình kèm theo hoàn hҧo.
B
y (t ) u (t ) (2.8)
A
http://www.khvt.com Trang 30
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Bm
ym u c (t ) (2.9)
Am
vӟi Am, Bm cNJng là nhӳng ÿa thӭc theo biӃn S hoһc Z.
http://www.khvt.com Trang 31
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Ru Tu c Sy (2.10)
http://www.khvt.com Trang 32
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 33
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 35
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 36
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Bӝ ÿiӅu khiӇn:
Ru = Tuc - Sy (*)
HӋ vòng kín ÿѭӧc mô tҧ:
BT
y uC
AR BS
Thay y vào (*) ta tính ÿѭӧc:
AT
u uC
AR BS
Sai sӕ là: e = y - ym
http://www.khvt.com Trang 38
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Bây giӡ cҫn phҧi xác ÿӏnh các ÿҥo hàm riêng cӫa sai
sӕ ÿӕi vӟi tӯng tham sӕ hiӋu chӍnh ÿӇ tìm luұt chӍnh
ÿӏnh thông sӕ các hàm ÿӝ nhҥy.
Ĉһt ri , si , ti là các hӋ sӕ cӫa ÿa thӭc R, S, T. Các
hàm ÿӝ nhҥy ÿѭӧc cho bӣi:
BT Bm u C
e uC
AR BS Am
k i l 1
we BTAp Bp
u
2 C
y
wri ( AR BS ) AR BS
i = 1,…,k
http://www.khvt.com Trang 39
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
we BTBp l i Bp l i
u
2 C
y i = 1,…,l
wsi ( AR BS ) AR BS
we Bp m i
uC i = 1,…,m
wt i AR BS
http://www.khvt.com Trang 40
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 41
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
k i
dri p
Je u i = 1,…, k = b̵c(R )
dt A0 A m
l i
dsi p
Je y i = 0,…,l = b̵c(S)
dt A0 Am
m i
dt i p
Je u C i = 0,…,m = b̵c(T)
dt A0 Am
http://www.khvt.com Trang 42
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Nhұn xét:
- Cҫn phҧi xây dӵng 3 trҥng thái cӫa bӝ lӑc 1/A0Am
cho luұt hiӋu chӍnh trên.
- Sӵ thay ÿәi các tham sӕ này tӍ lӋ vӟi tích sai sӕ e
và tín hiӋu bӝ lӑc 1/A0Am
- ĈӇ có ÿѭӧc luұt ÿiӅu chӍnh các tham sӕ trên cҫn
phҧi giҧ sӱ các zero phҧi әn ÿӏnh và dҩu cӫa b0
phҧi ÿѭӧc biӃt.
- Có thӇ tránh ÿѭӧc giҧ sӱ này bҵng cách sӱ dөng
các thuұt toán phӭc tҥp hѫn nhѭ ѭӟc lѭӧng trҥng
thái…
http://www.khvt.com Trang 43
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 44
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 47
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 48
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Ví dө 2.4
Giҧ sӱ hӋ thӕng có mô hình ӣ hình 2.6:
http://www.khvt.com Trang 49
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 50
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 51
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
d 2 ym dy m
2
a1 a2 ym T uc 0
(I)
dt dt
2
d y dy
2
a1 a2 y T uc (II)
dt dt
dT
J e ym J ( y y m ) y m (III)
dt
http://www.khvt.com Trang 52
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Phѭѫng trình (I) có thӇ giҧi ÿѭӧc nӃu cho sҹn hàm uc
, xem nhѭ biӃn ym biӃt trѭӟc
Ĉҥo hàm (II) ta ÿѭӧc:
d3y d2y dy dT du c
3
a1 2 a 2 u c T (t )
dt dt dt dt dt
Thay (III) vào ta ÿѭӧc:
3 2
dy dy dy duc
a1 a2 J (y ym)ymuc T(t)
dt dt dt dt
2 duc
J ym(t)uc (t)y(t) J y (t)uc T(t)
m
dt
http://www.khvt.com Trang 53
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Suy ra:
http://www.khvt.com Trang 54
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Giҧ sӱ cѫ cҩu hiӋu chӍnh thích nghi ÿѭӧc nӕi vào khi
ÿҥt ÿӃn ÿiӇm cân bҵng (trҥng thái cân bҵng). Khi ÿó
phѭѫng trình (II) ӣ trên sӁ có các hӋ sӕ hҵng và có
lӡi giҧi trҥng thái cân bҵng là:
0 0 0
y (t ) y m T u / a2
c
0 0 Jc 0 2
әn ÿӏnh nӃu a1 a 2 ! Ju yc m (u )
c
a2
http://www.khvt.com Trang 55
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 56
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
we
e
dT wT
J T
dt § we · § we ·
D ¨ ¸ ¨ ¸
© wT ¹ © wT ¹
http://www.khvt.com Trang 57
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
2.2.4 ThiӃt kӃ MRAS dùng lý thuyӃt әn ÿӏnh cӫa
Lyapunov
Vӟi luұt hiӋu chӍnh tham sӕ có ÿѭӧc tӯ phѭѫng pháp
Gradient ÿѭӧc trình bày trong mөc 2.2.3 lҩy gҫn
ÿúng là ÿӇ có ÿѭӧc luұt hiӋu chӍnh tham sӕ dӵa vào
kinh nghiӋm có vҿ hӧp lí rӗi chúng ta thӱ chӍ ra rҵng
sai sӕ mô hình sӁ tiӃn ÿӃn 0. Mӝt khҧ năng khác ÿӇ
có ÿѭӧc vòng ngoài cӫa hӋ thӕng thích nghi sӱ dөng
mô hình chuҭn là tìm ra luұt hiӋu chӍnh mà ÿҧm bҧo
sai sӕ tiӃn vӅ 0. Nhӳng nghiên cӭu cho luұt hiӋu
chӍnh nhѭ vұy ÿã ÿѭӧc thӵc hiӋn trong mӝt khoҧng
thӡi gian dài. Ý tѭӣng cѫ bҧn ÿӇ thiӃt kӃ luұt hiӋu
chӍnh dӵa vào lý thuyӃt әn ÿӏnh ÿѭӧc trình bày trong
mөc này và ÿѭӧc thӇ hiӋn theo lӏch sӱ phát triӇn.
http://www.khvt.com Trang 58
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 61
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 62
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 63
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Ví dө 2.5 Xét hӋ thӕng ÿѭӧc mô tҧ bӣi phѭѫng
trình trҥng thái sau:
x1 x 2 x1 ( x12 x 22 )
2 2
x 2 x1 x 2 ( x x ) 1 2
Trҥng thái cân bҵng (ÿҥo hàm = 0) tҥi gӕc tӑa ÿӝ
(x1= 0, x2 = 0). NӃu chúng ta ÿӏnh nghƭa mӝt hàm vô
hѭӟng V(x) nhѭ sau:
2 2
V ( x) x x
1 2
là hàm xác ÿ͓nh d˱˯ng, sao cho ÿҥo hàm theo thӡi
gian hàm V(x) theo mӝt ÿѭӡng cong bҩt kì
V ( x) 2 x1 x1 2 x 2 x 2 2( x12 x 22 )
http://www.khvt.com Trang 64
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
là hàm xác ÿ͓nh âm. ĈiӅu này cho thҩy rҵng V(x)
tăng liên tөc theo ÿѭӡng cong bҩt kì; vì vұy V(x) là
hàm Lyapunov. Hàm V(x) trӣ thành vô hҥn vӟi ÿӝ
lӋch vô hҥn tӯ trҥng thái cân bҵng, trҥng thái cân
bҵng ӣ gӕc cӫa hӋ thӕng là әn ÿӏnh tiӋm cұn trong
vùng rӝng.
Chú ý rҵng nӃu chúng ta ÿӇ V(x) nhұn giá trӏ hҵng sӕ
0, C1, C2,. . . (0 < C1 < C2 <. . . ), thì V(x) = 0 tѭѫng
ӭng vӟi gӕc cӫa trҥng thái ÿӕi tѭӧng và V(x)=C1,
V(x) = C2, . . .mô tҧ nhӳng vòng tròn không so sánh
kèm theo gӕc cӫa trҥng thái ÿӕi tѭӧng, nhѭ minh hӑa
ӣ hình 2.8. CNJng cҫn chú ý rҵng V(x) là bán kính vô
tұn, hoһc V(x) o f khi __x__o f.
http://www.khvt.com Trang 65
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Khi vòng tròn V(x) = Ck nҵm hoàn toàn trong vòng
tròn V(x) = Ck+1, mӝt ÿѭӡng cong ÿҥi diӋn ÿi qua
vùng biên giӟi cӫa các ÿѭӡng viӅn V tӯ ngoài vào
trong. Tӯ ÿây, biӇu diӉn hình hӑc cӫa hàm Lyapunov
có thӇ ÿѭӧc phát biӇu nhѭ sau: V(x) là thѭӟc ÿo
khoҧng cách cӫa biӃn trҥng thái x tӯ gӕc toҥ ÿӝ cӫa
trҥng thái trung gian. NӃu khoҧng cách giӳa gӕc và
biӃn trҥng thái tӭc thӡi x(t) tăng liên tөc khi t tăng
{V[x(t)] < 0 } thì x(t) o 0.
Quӻ ÿҥo (1) trên hình 2.8 là chuyӇn ÿӝng әn ÿӏnh
tiӋm cұn vӅ gӕc tӑa ÿӝ, song không thoҧ tiêu chuҭn
әn ÿӏnh thӭ 2 cӫa Lyapunov: hàm không phҧi là hàm
xác ÿӏnh âm vӟi mӑi biӃn trҥng thái x.
http://www.khvt.com Trang 66
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Tiêu chuҭn әn ÿӏnh thӭ 2 cӫa Lyapunov là ÿiӅu kiӋn
ÿӫ, không phҧi là ÿiӅu kiӋn cҫn ÿӇ ÿánh giá tính әn
ÿӏnh cӫa nghiӋm phѭѫng trình vi phân phi tuyӃn.
NӃu thoҧ tiêu chuҭn thì hӋ әn ÿӏnh. NӃu không thoҧ,
vҩn ÿӅ kӃt luұn vӅ tính әn ÿӏnh còn bӓ ngõ, phө
thuӝc vào:
1.Chӑn hàm V(x)
2.Chӑn biӃn trҥng thái x
Ví dͭ thi͇t k͇ MRAS dùng Lyapunov
Giҧ sӱ tҩt cҧ các biӃn trҥng thái cӫa hӋ thӕng ÿӅu ÿo
lѭӡng ÿѭӧc, ÿӏnh lý vӅ әn ÿӏnh cӫa Lyapunov có thӇ
dùng ÿӇ thiӃt kӃ luұt ÿiӅu khiӇn thích nghi ÿҧm bҧo
sӵ әn ÿӏnh cho hӋ thӕng vòng kín, ví dө sau trình
bày ý tѭӣng này.
http://www.khvt.com Trang 67
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 68
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
.
de
a m e (a m a bs 0 ) y (bt 0 bm )u c
dt
1 2 1 2 1
V (e, t 0 , s 0 ) [e (bs 0 a a m ) (bt 0 bm ) 2 ]
2 bJ bJ
http://www.khvt.com Trang 70
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Nhѭ vұy:
Hàm V sӁ giҧm khi e khác 0. Vì vұy có thӇ kӃt luұn
là sai sӕ e sӁ tiӃn vӅ 0. Tuy nhiên cҫn chú ý là các
tham sӕ t0 và s0 sӁ hӝi tө ÿӃn giá trӏ cân bҵng nӃu
không có các ÿiӅu kiӋn khác tác ÿӝng vào. Vì vұy
luұt này tѭѫng tӵ nhѭ luұt MIT nhѭng ÿӝ nhҥy ÿѭӧc
thay ÿәi bӣi tín hiӋu khác.
Luұt hiӋu chӍnh các thông sӕ làm әn ÿӏnh cho hӋ
thӕng mà các biӃn trҥng thái có thӇ ÿo lѭӡng ÿѭӧc
xây dӵng bҵng sӵ tәng quát hoá trӵc tiӃp cӫa kƭ
thuұt dùng trong ví dө sau .
http://www.khvt.com Trang 72
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Ví dө 2.7
Ӣ ÿây chӍ xét vҩn ÿӅ hiӋu chӍnh ÿӝ lӧi nuôi tiӃn. Sai
sӕ ÿѭӧc cho bӣi
e = G(p)( T - T0 )uc
giӟi thiӋu mӝt không gian trҥng thái biӇu thӏ cho
hàm truyӅn G. Quan hӋ giӳa tham sӕ T và sai sӕ e
ÿѭӧc viӃt bӣi:
dx 0
Ax B (T T )u c
dt
(2.18)
e = Cx
http://www.khvt.com Trang 74
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
2 dt
K
Ví dө 2.8 Xét G(s)
s( s a)
Bm Z2
và mô hình là Gm ( s)
Am s 2 29Zs Z 2
ÿa thӭc A0, R, S và T ÿѭӧc chӑn bӣi :
A0(s) = s + a0
R(s) = s + r1
S(s) = s0s + s1
T(s) = t0s + t1
http://www.khvt.com Trang 77
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 78
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Bài tұp vӅ nhà (dùng làm bài tұp trong phҫn Câu
hӓi ôn tұp và bài tұp ӣ cuӕi chѭѫng): Mô phӓng
bҵng Matlab hӋ bұc hai MRAS trong ví dө 2.8 (Ví
dө 4.8) vӟi J = 1, ] = 0.7, Z = 1, a0 = 2, a =1 và K=2.
Giҧ sӱ rҵng bˆ 0 b0
HӋ thӕng MRAS rӡi rҥc
HӋ MRAS ÿã ÿѭӧc thӵc hiӋn cho hӋ liên tөc không
có nhiӉu, nhѭng có thӇ thӵc hiӋn ÿѭӧc MRAS cho
hӋ rӡi rҥc. Thuұt giҧi ӣ trên có thӇ ÿѭӧc dùng cho
trѭӡng hӧp hӋ rӡi rҥc. Bӝ ѭӟc lѭӧng có thӇ dӵa vào
chuҭn bình phѭѫng tӕi thiӇu. Phҫn này ÿӇ dành trình
bày trong bӝ ÿiӅu khiӇn tӵ chӍnh ÿӏnh trong phҫn
2.3
http://www.khvt.com Trang 79
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
MRAS cho hӋ thӕng chӍ biӃt ÿѭӧc tӯng phҫn
Trong phҫn trѭӟc ta ÿã giҧ sӱ tҩt cҧ mô hình cӫa ÿӕi
tѭӧng là chѭa biӃt.Trong mӝt sӕ trѭӡng hӧp ÿһc tính
ÿӝng hӑc cӫa hӋ thӕng ÿѭӧc biӃt mӝt phҫn, còn lҥi là
không biӃt. Sӵ biӃt trѭӟc này có thӇ ÿѭӧc kӃt hӧp
vào hӋ MRAS. ĈiӅu này có thӇ thӵc hiӋn tuǤ thuӝc
chӫ yӃu vào tham sӕ và cҩu trúc cӫa mô hình ÿӕi
tѭӧng. Phѭѫng pháp này ÿѭӧc minh hӑa bҵng ví dө .
ĈiӅu khiӇn thích nghi cho tay máy
Giҧ sӱ các biӃn trҥng thái ÿѭӧc ÿo lѭӡng ÿҫy ÿӫ, có
thӇ tìm ÿѭӧc mӝt biӃn sai sӕ tuyӃn tính ÿӕi vӟi các
tham sӕ, ÿiӅu này làm dӉ dàng trong viӋc xây dӵng
hӋ thích nghi sӱ dөng mô hình chuҭn әn ÿӏnh.
http://www.khvt.com Trang 80
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
ĈiӅu này ÿѭӧc minh hӑa bҵng viӋc ÿiӅu khiӇn tay
máy khi mà ÿһc tính ÿӝng hӑc là phi tuyӃn.
Mӝt thao tác trӵc tiӃp ÿѭӧc mô tҧ bӣi mô hình :
H ( q ) q C ( q, q ) G ( q ) T (2.21)
vӟi q là vector tӑa ÿӝ tәng quát. H là ma trұn quán
tính, C là ma trұn tҳt, G là vector trӑng trѭӡng. BiӃn
ÿiӅu khiӇn là moment ÿһt vào cѫ cҩu chҩp
hành.Phѭѫng trình mô tҧ tay máy có tính chҩt :
1 d T
(q Hq ) q T H (q )q q T C (q, q )q q T (T G ) (2.21a)
2 dt
http://www.khvt.com Trang 81
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
ĈiӅu này ÿѭӧc giҧi thích là ÿҥo hàm cӫa ÿӝng năng
T
q Hq bҵng vӟi công suҩt ÿѭӧc cung cҩp bӣi cѫ
cҩu chҩp hành và moment trӑng lӵc.
e2 g / l1
http://www.khvt.com Trang 83
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 84
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
vӟi g là gia tӕc thѭӡng và bӕn tham sӕ chѭa biӃt
T1,…,T4 là nhӳng hàm có các tham sӕ vұt lý chѭa
biӃt.
T1 I 1 m1l c21 I e me l ce2 me l12
T2 I 1 me l ce2
T3 me l1l ce cos G e
T4 me l1l ce sin G e
Bӕn tham sӕ chѭa biӃt me, lce, Ie và įe ÿѭӧc xác ÿӏnh
duy nhҩt bӣi T1,…,T4. HӋ thӕng có thӇ ÿѭӧc viӃt lҥi:
T
M (q, q , q)T T
http://www.khvt.com Trang 85
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
T
vӟi ˳ ÿѭӧc cho bӣi:
§ q1 ec q2 ec 2 cos(q 2 )q1 cos(q 2 )q2 Y1 2 sin( q 2 )q1 sin( q 2 )q2 Y2 ·
¨¨ ¸¸
© 0 q1 q2 cos(q 2 )q1 Y3 sin( q 2 )q1 Y4 ¹
T T1 , T 2 , T 3 , T 4 T
§W 1 e1e2 cos(q1 ) ·
T ¨¨ ¸¸
© W2 ¹
http://www.khvt.com Trang 86
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Ví dө có thӇ ÿѭӧc tәng quát hoá và phѭѫng trình
(2.21) có thӇ ÿѭӧc viӃt thành:
T 0
T Hc(q)q Cc(q, q)q Gc(q)
M (q, q, q)T
http://www.khvt.com Trang 88
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
. ~ 1 q~ T H q~ q~ T K q~ T~ T *T~
q T H q~
V p
2
q T ( H q H q Cq~ K q~ ) T~ T *T~
~
m p
Ĉһt:
~ ~ ~ T ~
H qm Cq m G M T
m
http://www.khvt.com Trang 90
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
~ ~ ~ T ~ T~
` V q K d q T (*T M m q )
T
ÿӅ nghӏ cұp nhұt thông sӕ:
~
T T * 1M mT q~ * 1M mT (q q m ) (2.21c)
Hàm V thoҧ tính chҩt cӫa hàm Lyapunov là xác
ÿӏnh dѭѫng và ÿҥo hàm:
V q~ K d q~
là bán xác ÿ͓nh âm. ĈiӅu này có nghƭa là hӋ vòng
kín әn ÿӏnh và vұn tӕc khi xác lұp bҵng không. Bӝ
ÿiӅu khiӇn cNJng có thӇ ÿѭӧc bә sung ÿӇ ÿҧm bҧo là
sai sӕ vӏ trí bҵng 0.
http://www.khvt.com Trang 91
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Luұt ÿiӅu khiӇn theo phѭѫng trình (2.21b) và tham
sӕ ÿѭӧc cұp nhұt theo phѭѫng trình (2.21c) là các
hàm cӫa biӃn và , nhѭng gia tӕc cӫa khӟp nӕi không
cҫn thiӃt phҧi ÿo ÿѭӧc. ĈӇ ý rҵng luұt ÿiӅu khiӇn là
trѭӡng hӧp ÿһc biӋt cӫa hӋ MRA tәng quát vӟi .
http://www.khvt.com Trang 95
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 97
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
http://www.khvt.com Trang 98
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
NhiӅu phѭѫng pháp ѭӟc lѭӧng khác nhau có thӇ ÿѭӧc
vұn dөng nhѭ xҩp xӍ ѭӟc ÿoán, bình phѭѫng tӕi
thiӇu..... Khӕi ‘design’ ӣ hình 2.9 tѭӧng trѭng cho bài
giҧi trӵc tuyӃn các bài toán thiӃt kӃ hӋ thӕng vӟi các
thông sӕ chѭa biӃt trѭӟc. Ĉây là bài toán thiӃt kӃ cѫ
bҧn. ĈiӇn hình cho phѭѫng pháp này là phѭѫng pháp
khác biӋt cӵc tiӇu, bình phѭѫng tuyӃn tính, ÿһt cӵc,
model – following. Phѭѫng pháp thiӃt kӃ ÿѭӧc lӵa
chӑn phө thuӝc vào ÿһc tính cӫa hӋ thӕng vòng kín.
Mөc tiêu cӫa mөc này là ÿѭa ra quan ÿiӇm cѫ bҧn và
tính chҩt cӫa các bӝ tӵ chӍnh ÿӏnh. Bӝ tӵ chӍnh ÿӏnh
ban ÿҫu chӍ áp dөng cho các hӋ thӕng lҩy mүu dӳ liӋu,
nhѭng các thuұt toán liên tөc và hӛn hӧp (hybrid)
cNJng ÿѭӧc phát triӇn.
http://www.khvt.com Trang 99
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Trong mөc này, giҧ sӱ hӋ thӕng là SISO :
A(q)y(t) = B(q)u(t) + C(q)e(t) (2.24)
y : ÿҫu ra
u : ÿҫu vào
{e(t)} : chuӛi phân bӕ Gausse
A, B, C : các ÿa thӭc theo q (toán tӱ sai phân tӟi).
Giҧ thiӃt b̵cA = b̵cC = n và b̵cA - b̵cC = d0.
Quá trình ÿiӅu khiӇn thѭӡng ÿѭӧc mô tҧ ӣ dҥng toán
tӱ q-1. Ĉa thӭc ÿһc tính có dҥng:
* n 1
A ( z) z A( z )
Bài tұp vӅ nhà (dùng làm bài tұp trong phҫn Câu
hӓi ôn tұp và bài tұp ӣ cuӕi chѭѫng) Ӭng dөng
Matlab mô phӓng hӋ thӕng trong ví dө 2.9 (Ví dө
5.1 (TLTK[1]).KӃt quҧ nhұn ÿѭӧc ÿѭӧc mô tҧ ӣ
hình (5.2), (5.3) và (5.4) trong TLTK[1].
http://www.khvt.com Trang 110
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Hình 5.2 biӇu diӉn tín hiӋu ÿҫu ra và tín hiӋu ÿiӅu khiӇn
cӫa hӋ thӕng thӵc khi mӝt bӝ tӵ chӍnh ÿӏnh gián tiӃp ÿѭӧc
sӱ dөng vӟi phѭѫng pháp bình phѭѫng cӵc tiӇu và zero
z = - 0.84 cӫa hӋ thӕng thӵc bӏ khӱ.
Hình 5.3 chӍ ra viӋc ѭӟc lѭӧng các thông sӕ cӫa hӋ thӕng
hӝi tө nhanh ÿӃn các thông sӕ cӫa mô hình thӵc.Có sӵ dao
ÿӝng lӟn cӫa tín hiӋu ÿiӅu khiӇn do viӋc khӱ zero. Dao
ÿӝng này là kӃt quҧ cӫa sӵ chӑn lӵa kém trong bài
toán thiӃt kӃ cѫ bҧn chӭ không phҧi phө thuӝc vào bӝ tӵ
chӍnh ÿӏnh. Dao ÿӝng này có thӇ tránh ÿѭӧc bҵng cách
thay ÿәi thiӃt kӃ mà không khӱ zero cӫa hӋ thӕng thӵc
( chҷng hҥn Bm = B). Hình 5.4 chӍ ra kӃt quҧ khi thay ÿәi
thiӃt kӃ không có zero nào bӏ khӱ. Ĉáp ӭng cӫa hӋ thӕng
vòng kín bây giӡ ÿã ÿѭӧc thoҧ mãn.
http://www.khvt.com Trang 111
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Ví dө 2.10 Bӝ tӵ chӍnh ÿӏnh vӟi nhiӉu ngүu nhiên
Xét hӋ thӕng ÿѭӧc mô tҧ nhѭ sau :
y(t) + ay(t – 1) = bu(t – 1) + e(t) + ce(t – 1)
vӟi a = - 0.9, b = 3, c = -0.3. Bài toán thiӃt kӃ cѫ bҧn
ÿѭӧc sӱ dөng là ÿiӅu khiӇn sai lӋch cӵc tiӇu. Bӝ ÿiӅu
khiӇn sai lӋch cӵc tiӇu ÿѭӧc cho nhѭ sau :
ca
u (t ) y (t ) 0.2 y (t )
b
ĈiӅu này dүn ÿӃn hӋ thӕng vòng kín : y(t) = e(t)
Phѭѫng pháp cӵc ÿҥi ÿӋ qui ÿѭӧc sӱ dөng ÿӇ ѭӟc
lѭӧng các thông sӕ chѭa biӃt a, b và c.
trong ÿó R
B R S BS
http://www.khvt.com Trang 117
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Bây giӡ ta xem xét các trѭӡng hӧp khác nhau. Ĉҫu
tiên giҧ sӱ e = 0. Ĉa thӭc quan sát có thӇ ÿѭӧc chӑn
tӵ do, khi dùng mô hình liên tөc theo thӡi gian thì
ÿiӅu cҫn thiӃt phҧi giҧ sӱ b0/(A0Am) là SPR (Strictly
Positive Real = Thӵc dѭѫng chһt) ÿӇ ÿҥt ÿѭӧc mӝt
MRAS әn ÿӏnh. Ta cNJng cҫn lѭu ý rҵng hàm truyӅn
có các hӋ sӕ là sӕ thӵc dѭѫng thoҧ ÿiӅu kiӋn cҫn ÿӇ
әn ÿӏnh ÿѭӧc gӑi là PR (Positive Real). Hàm là SPR
nӃu nó әn ÿӏnh vӟi ÿӝ dӵ trӳ H dѭѫng nhӓ tuǤ ý.
Mӝt ÿiӅu kiӋn tѭѫng tӵ cNJng là cҫn thiӃt cho các mô
hình rӡi rҥc theo thӡi gian. ViӃt lҥi mô hình nhѭ sau:
NӃu quá trình là cӵc tiӇu pha, bӝ chӍnh ÿӏnh thay ÿәi
cӵc tiӇu ÿѭӧc cho bӣi:
R*(q-1)u(t) = - S*(q-1)y(t) (2.39)
Trong ÿó R* và S* là nghiӋm có bұc cӵc tiӇu cӫa
phѭѫng trình Diophantine
A*(q-1)R*(q-1) + q-doB*(q-1)S*(q-1)=B*(q-1)C*(q-1) (2.40)
vӟi d0 = B̵c (A) - B̵c (B). Bӝ ÿiӅu khiӇn thay ÿәi
cӵc tiӇu tѭѫng ӭng vӟi mô hình mong muӕn vӟi mӝt
khoҧng trӉ d0 bѭӟc, A*m = 1. Tӯ phѭѫng trình 2.40
thì R* phҧi chia hӃt cho B* :
R* = R*1.B*
trong ÿó dҩu gҥch chӍ giá trӏ trung bình theo thӡi
gian; k, l là sӕ các thông sӕ ѭӟc lѭӧng trong R* và S*.
M (k )Tˆ(k d )
T
0
http://www.khvt.com Trang 134
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Tҥi mӝt trҥng thái cân bҵng, các thông sӕ ѭӟc lѭӧng
Tˆ là nhӳng hҵng sӕ. Hѫn nӳa, chúng thoҧ mãn
các phѭѫng trình chuҭn, trong trѭӡng hӧp này ÿѭӧc
viӃt lҥi nhѭ sau:
1 t 1 t ˆ(t d )
¦
tk 1
M (k ) y (k d ) ¦
tk 1
M ( k )M T
( k )T
y (t W ) y (t ) 0 W d , d 1,...... ( 2.48)
Bài tұp vӅ nhà (dùng làm bài tұp trong phҫn Câu
hӓi ôn tұp và bài tұp ӣ cuӕi chѭѫng): Dùng Matlab
mô phӓng cho ví dө 2.11 (Ví dө 5.3 TLTK[1]). Xem
kӃt quҧ mô phӓng ӣ hình 5.8 và 5.9 trong TLTK[1].
Hình 5.8 biӇu diӉn tӍ sӕ sˆ0 / rˆ0 , nó nhanh chóng hӝi
tө ÿӃn mӝt giá trӏ cӫa bӝ ÿiӅu khiӇn thay ÿәi cӵc tiӇu
tӕi ѭu thұm chí không bҵng giá trӏ thұt cӫa nó. Hình
5.9 biӇu diӉn hàm tәn hao khi dùng bӝ tӵ chӍnh ÿӏnh
và bӝ ÿiӅu khiӇn thay ÿәi cӵc tiӇu tӕi ѭu.
http://www.khvt.com Trang 144
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
2.3.5 ĈiӅu khiӇn dӵ báo thích nghi
Thuұt toán 2.4 là cách ÿӇ thӵc hiӋn mӝt bӝ ÿiӅu
khiӇn vӟi tҫm dӵ báo thay ÿәi. Bài toán ÿiӅu khiӇn
cѫ bҧn là bӝ ÿiӅu khiӇn trung bình di chuyӇn. Bӝ
ÿiӅu khiӇn trung bình di chuyӇn cNJng có thӇ áp dөng
ÿѭӧc cho các hӋ thӕng không cӵc tiӇu pha nhѭ ÿѭӧc
minh hӑa ӣ phҫn “Bӝ chӍnh ÿӏnh trӵc tiӃp”. NhiӅu
cách khác ÿӇ có ÿiӅu khiӇn dӵ báo sӁ ÿѭӧc ÿӅ cұp
trong tài liӋu, mӝt vài trong sӕ này sӁ ÿѭӧc thҧo luұn
và phân tích. CNJng nhѭ ÿӕi vӟi các thuұt toán trѭӟc,
xác ÿӏnh bài toán ÿiӅu khiӇn cѫ bҧn là rҩt quan trӑng
ÿӇ hiӇu rõ các tính chҩt tiӋm cұn cӫa thuұt toán.
Trѭӟc tiên ta sӁ phân tích trѭӡng hӧp các thông sӕ là
biӃt trѭӟc.
http://www.khvt.com Trang 145
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Xét mô hình :
A*(q-1)y(t) = B*(q-1)u(t – d0) (2.52)
1 = A*(q-1)F*(q-1) + q–dGd*(q-1) (2.53)
trong ÿó:
b̵c( Fd* ) = d – 1
b̵c( Gd*) = n – 1
ChӍ sӕ d là tҫm dӵ báo vӟi d bѭӟc. Giҧ sӱ d t d0.
ViӋc ÿӗng nhҩt ÿa thӭc ӣ phѭѫng trình 2.52 ÿѭӧc sӱ
dөng ÿӇ dӵ báo ngõ ra ӣ d bѭӟc phía trѭӟc. Vì vұy :
y(t + d)=A*Fd*y(t + d)+G*dy(t)=B*F*du(t+d–d0)+G*dy(t)
1 1 1 ( d d 0 1)
*
B (q ) F (q ) d
* *
R (q ) q
d Rd* ( q 1 )
http://www.khvt.com Trang 147
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
B̵c(R*d) = d – d0
*
B̵c( Rd ) n 2
Các hӋ sӕ cӫa R*d là nhӳng giӟi hҥn d – d0 + 1 ÿҫu
tiên cӫa ÿáp ӭng xung cӫa hӋ thӕng vòng hӣ. ĈiӅu
này có thӇ thҩy nhѭ sau:
d 0 B* d 0 Gd*
q q B* (Fd* q d )
A* A *
* 1 * 1
B (q )G (q ) (d d0 )
q d 0 *
R q
d
1
q ( d 1) * 1
Rd (q ) *
d
1
q (2.54)
A (q )
¦ u (k )
k t
2
(2.57)
http://www.khvt.com Trang 149
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Cӵc vòng kín vӟi các giá trӏ khác nhau cӫa a và b
ÿѭӧc chӍ ӣ hình 5.16 (TLTK[1]). Ví dө cNJng cho
thҩy ÿӇ viӋc quan sát là ÿҫy ÿӫ thì tҫm dӵ báo phҧi
tӯ 5 – 10 mүu.
CNJng có thӇ tәng quát hoá kӃt quҧ ӣ ví dө 2.12 cho
các hӋ thӕng bұc cao hѫn. Ĉӕi vӟi các hӋ thӕng thay
ÿәi chұm hoһc không әn ÿӏnh thì ÿáp ӭng vòng kín
cӫa nó sӁ rҩt chұm khi tăng tҫm dӵ báo. Vì vұy giӟi
hҥn ӣ 2.56 khi ÿó sӁ là không hӳu ích.
rd 0 u (t X ) ... rdX u (t ) y d (t )
X = d – d0. Giӟi thiӋu hàm Lagrange:
2J =u(t)2+...+u(t+X)2+2O[ym(t + d) - y d (t ) - R*d(q-1)u(t + X)]
Cho ÿҥo hàm riêng ÿӕi vӟi các biӃn u(t), ... ,u(t + X)
và O bҵng 0 ta ÿѭӧc:
u(t) = OrdX
.
.
.
u(t + X) = O
ym(t + d) - y d (t ) = u(t + X) + . . . + rdXu(t)
Các phѭѫng trình này cho ta:
y m (t d ) y d (t )
u (t )
P
P
rdQ
Sӱ dөng ÿӏnh nghƭa y d (t ) cho ta:
* *
Pu (t ) y m (t d ) R u (t 1) G y (t )
d d
hoһc
y m (t d ) Gd* y (t ) y m (t d n 1) G d (q ) y (t )
u (t ) (2.60)
P q 1 Rd* n 1
Pq Rd (q )
cho ta ( khi ym = 0)
d 2 d 1 2
a a (a 1)
u (t ) y (t ) 2d
y (t )
P b(a 1)
Cӵc cӫa hӋ thӕng vòng kín là:
2 d 1 2 2 d 1
a (a 1) a a
pd a 2d 2d
a 1 a 1
cho ta:
lim p d a _ a _ d 1 (hӋ thӕng әn ÿӏnh)
d of
J ( N1 , N 2 , N u ) E{ ¦ [ y (t k ) y m (t k )] ¦ U'u (t k 1) 2 } (2.61)
2
k N1 k 1
Bӝ ÿiӅu khiӇn vӟi kӃt quҧ nhѭ thӃ gӑi là ÿiӅu khiӇn
hӗi tiӃp tӕi ѭu vòng hӣ. Nhѭ tên cӫa nó, giҧ sӱ sӱ
dөng hӗi tiӃp nhѭng nó chӍ ÿѭӧc tính toán chӍ dӵa
vào thông tin có sҹn ӣ thӡi ÿiӇm hiӋn tҥi. Dùng
phѭѫng trình 2.55 :
y(t+1) = R*1(q–1)'u(t+1–d0) + y1 (t ) + F1*e(t+1)
y(t+2) = R2*(q–1)'u(t+2–d0) + y 2 (t ) + F2*e(t+2)
.
.
.
y(t + N) = RN*(q–1)'u(t +N–d0) + y N (t )+ e(t+N)
Mӛi giá trӏ ngõ ra bao gӗm các tín hiӋu ÿiӅu khiӇn ӣ
tѭѫng lai ( nӃu d > d0), ngõ vào ÿo ÿѭӧc và tín hiӋu
nhiӉu ӣ tѭѫng lai. Các phѭѫng trình ӣ trên có thӇ
ÿѭӧc viӃt lҥi:
y = R'u + y + e
trong ÿó:
FN*
«# % #»
« »
«¬rN 1 rN 2 " r0 »¼
NӃu hӋ thӕng có thӡi gian trӉ (d0 > 1) thì (d0 – 1)
hàng ÿҫu cӫa R sӁ là zero. Gӑi:
ym = [ym(t + 1) . . . ym(t + N)]T
http://www.khvt.com Trang 166
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Giá trӏ mong ÿӧi cӫa hàm tәn hao ÿѭӧc viӃt lҥi:
J (1, N , N ) E{( y y m ) T ( y y m ) U'u T 'u}
( R'u y y m ) T ( R'u y y m ) U'u T 'u
Cӵc tiӇu hoá biӇu thӭc này theo 'u ta ÿѭӧc:
T 1 T
'u ( R R UI ) R ( y m y ) ( 2.65)
Thành phҫn ÿҫu trong 'u là 'u(t) là tín hiӋu ÿiӅu
khiӇn ӭng dөng cho hӋ thӕng. Chú ý bӝ ÿiӅu khiӇn tӵ
ÿӝng có mӝt khâu tích phân. ĈiӅu này là cҫn thiӃt ÿӇ
bù cho sӕ hҥng nhiӉu sai lӋch ӣ phѭѫng trình 2.62.
ViӋc tính toán phѭѫng trình 2.65 liên quan tӟi ma
trұn nghӏch ÿҧo NxN, mà N là tҫm dӵ báo cӫa hàm
tәn hao.
http://www.khvt.com Trang 167
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
[D 1 ... D N ][ y m y ]
Bӝ ÿiӅu aKc Ti / L Td / L Tp / L
khiӇn
P 1 4
PI 0.9 3 5.7
PID 1.2 2 0.5 3.4
A0
T L
k
eA1
T
k
http://www.khvt.com Trang 181
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Bӝ ÿiӅukhiӇn Kc /Ku Ti / Tu Td / Tu Tp / Tu
P 0.5 1
PI 0.4 0.8 1.4
PID 0.6 0.5 0.12 0.85
http://www.khvt.com Trang 182
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
Thӵc nghiӋm:
Ĉһt fˆ 1
là hàm ngѭӧc xҩp xӍ cӫa ÿһc tính valse. ĈӇ
bù cho tính phi tuyӃn, ngõ ra cӫa bӝ ÿiӅu chӍnh ÿѭӧc
cung cҩp thông qua hàm này trѭӟc khi nó ÿѭӧc áp
vào valse (xem hình (a)). Ta có quan hӋ :
Q f (u ) f [ fˆ 1 (c)]
Vӟi c là ngõ ra cӫa bӝ ÿiӅu chӍnh PI. Hàm
ˆ 1
f [ f (c )] có ÿӝ lӧi ít thay ÿәi hѫn hàm f.
NӃu fˆ 1 chính xác là hàm ngѭӧc cӫa f thì : v = c.
Giҧ sӱ f(u) = u4 ÿѭӧc xҩp xӍ bӣi 2 ÿѭӡng thҷng: mӝt
ÿѭӡng nӕi tӯ ÿiӇm (0 , 0) ÿӃn ÿiӇm (1.3;3) và ÿѭӡng
thҷng thӭ hai nӕi giӳa 2 ÿiӇm (1.3;3) và (2;16), ÿѭӧc
vӁ trong hình (b) . Khi ÿó:
http://www.khvt.com Trang 195
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
0.433c , 0dcd3
°
fˆ 1 9c) ®
°0.0538c 1.139 , 3 d c d 16
¯
Tәng các lӵc cҧn ÿӕi vӟi ôtô không phө thuӝc tuyӃn
tính vào vұn tӕc cӫa ôtô và các thành phҫn lӵc cҧn
này có nhӳng hӋ sӕ phө thuӝc vào ÿiӅu kiӋn làm
viӋc cӫa ôtô nhѭ loҥi ÿѭӡng, ÿӝ mҩp mô, ÿӝ nghiêng
cӫa mһt ÿѭӡng, loҥi lӕp xe, nhiӋt ÿӝ môi trѭӡng, gió,
tҧi trӑng cӫa xe, tình trҥng cӫa ÿӝng cѫ, cӫa hӋ thӕng
truyӅn ÿӝng, ÿӝ mòn cӫa lӕp…Các ÿiӅu kiӋn làm
viӋc này không cӕ ÿӏnh mà thay ÿәi mӛi khi ôtô vұn
hành và trong lúc ôtô vұn hành.
b
>
f ( x) ym( n ) K T E @ (2.68)
Vӟi luұt ÿiӅu khiӇn u*, các thành phҫn phi tuyӃn cӫa
ÿӕi tѭӧng bӏ triӋt tiêu. Thành phҫn KTE ÿѭӧc ÿѭa
vào ÿӇ ÿҧm bҧo sai sӕ ngõ ra vүn hӝi tө vӅ 0 trong
trѭӡng hӧp trҥng thái ban ÿҫu cӫa ÿӕi tѭӧng không
làm cho ngõ ra y bám ngay ngõ ra mong muӕn ym.
Do thành ph̯n f(x) và b ch˱a xác ÿ͓nh nên lu̵t ÿi͉u
khi͋n u* cho ÿ͙i t˱ͫng ÿ˱ͫc xem là ch˱a bi͇t. Trong
b͡ ÿi͉u khi͋n mͥ thích nghi trc ti͇p, m͡t h͏ th͙ng
mͥ ÿ˱ͫc s͵ dͭng ÿ͋ tìm ra hay x̭p x͑ lu̵t ÿi͉u
khi͋n mong mu͙n u* ch˱a bi͇t này.
ThiӃt kӃ luұt thích nghi (luұt cұp nhұt, chӍnh ÿӏnh
thông sӕ)
Vӟi:
- J > 0 là mӝt hҵng sӕ, ÿѭӧc gӑi là hӋ sӕ cұp
nhұt hay hҵng sӕ hӝi tө.
- P Rnunlà ma trұn thӵc, ÿӕi xӭng, xác ÿӏnh
dѭѫng thoҧ mãn phѭѫng trình:
/T P P/ Q
Trong ÿó,Q Rnun là ma trұn thӵc,dѭѫng,chӑn trѭӟc.
Theo tiêu chuҭn әn ÿӏnh Lyapunov, vӟi V(E) xác
ÿӏnh dѭѫng và V (E ) xác ÿӏnh âm thì sai sӕ E sӁ tiӃn
vӅ 0, hay giá trӏ ngõ ra y sӁ bám theo giá trӏ ngõ ra
ym mong muӕn, khi ÿó xác ÿӏnh ÿѭӧc luұt thích
nghi: T JE T p n [ ( X )
http://www.khvt.com Trang 214
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
1 Throttle Position
Throttle Position 1
Traction Force -K- 3.6 1
s
Vehicle Velocity Vehicle Velocity
Vehicle Integrator
m/s to km/h
Power Train Model Inertia
1
0 f(u)
s
Integrator Gain Climbing Load
Lookup Table
1
Road Load
1 1/3.6 f(u)
Vehicle Velocity
Road_Load
km/h to m/s
0 1/3.6
Wind
km/h to m/s2
P Part
1
1 1.2 1
s
Demand Velocity Throttle Position
Integrator I Part Saturation1
2
Actual Velocity
du/dt 5
Derivative D Part
P12 x1 15 15 15 15 15
Bi͇n ngôn
ngͷ P13 x1 30 30 30 30 30
ACTUAL
VELOCITY P14 x1 48 48 48 48 48
ª 0 1º
4. Chӑn ma trұn / « 0.01
¬ 0.1»¼
ª10 0 º
5. Chӑn ma trұn Q «0 10»
¬ ¼
6. Chӑn hӋ sӕ J = 1.
100
Engine throttle position (%)
80
60
40
20
0
4
2 120
100
0 80
60
-2 40
20
2
-4 0
Acceleration (m/s ) Vehicle velocity (km/h)
Hình 2.20 Ĉ̿c tính làm vi͏c cͯa b͡ ÿi͉u khi͋n mͥ thích
nghi trc ti͇p khi mͣi ÿ˱ͫc khͧi t̩o
http://www.khvt.com Trang 228
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
4. So sánh kӃt quҧ ÿiӅu khiӇn
1. Trѭӡng hӧp 1: Age = 100%, Gt = 100kg,
vwind = 0 km/h, ôtô ÿi trên ÿѭӡng bҵng Grade = 0q
(xem hình 2.21).
2. Trѭӡng hӧp 2: Age = 100%, Gt = 500kg,
vwind=0km/h, ôtô ÿi trên ÿѭӡng bҵng Grade = 0q
(xem hình 2.22).
3. Trѭӡng hӧp 3: Age = 100%, Gt = 100kg,
vwind=30km/h, ôtô ÿi trên ÿѭӡng bҵng Grade = 0q.
4. Trѭӡng hӧp 4: Age = 100%, Gt = 500kg,
vwind = 30 km/h, ôtô ÿi trên ÿѭӡng bҵng Grade = 0q.
5. Trѭӡng hӧp 5: Age = 85%, Gt = 100kg,
vwind = 0 km/h, ôtô ÿi trên ÿѭӡng bҵng Grade = 0q.
http://www.khvt.com Trang 229
ĈLӅXNKLӇQWKtFKQJKL 3*6761JX\ӉQ7Kӏ3KѭѫQJ+j
70
Vehicle velocity (km/h)
60
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100 110 120
Time (s)
Hình 2.21.a
80
70
60
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100 110 120
Time (s)
Hình 2.21.b
70
Vehicle velocity (km/h)
60
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100 110 120
Time (s)
Hình 2.22.a
80
70
60
50
40
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100 110 120
Time (s)
Hình 2.22.b
100
Engine throttle position (%)
80
60
40
20
0
4
2 120
100
0 80
60
-2 40
20
-4 0
Acceleration (m/s2) Vehicle velocity (km/h)
Hình 2.21.c
100
Engine throttle position (%)
80
60
40
20
0
4
2 120
100
0 80
60
-2 40
20
-4 0
Acceleration (m/s2) Vehicle velocity (km/h)
Hình 2.22.c
80
70
Vehicle velocity (km/h)
60
50
40
30
20
10
0
0 1000 2000 3000 4000 5000 6000 7000
Distance (m)
Hình 2.23.a
80
Engine throttle position (%)
70
60
50
40
30
20
10
-10
0 1000 2000 3000 4000 5000 6000 7000
Distance (m)
Hình 2.23.b
Chương 3
Cho tập mô hình có sai số PΔ và một tập các chỉ tiêu chất lượng, giả sử
P0 ∈ PΔ là mô hình danh định dùng để thiết kế bộ điều khiển K.Hệ thống
hồi tiếp vòng kín được gọi là có tính :
- Ổn định danh định: nếu K ổn định nội với mô hình danh định P0
- Ổn định bền vững: nếu K ổn định nội với mọi mô hình thuộc PΔ
- Chất lượng danh định: nếu các mục tiêu chất lượng được thỏa đối với mô
hình danh định P0
- Chất lượng bền vững: nếu các mục tiêu chất lượng được thỏa đối với mọi
mô hình thuộc PΔ
Mục tiêu bài toán ổn định bền vững là tìm bộ điều khiển không chỉ ổn định
mô hình danh định P0 mà còn ổn định một tập các mô hình có sai số PΔ
3.1.2 Chuẩn của tín hiệu
3.1.2.1 Khái niệm chuẩn
Trong điều khiển nói riêng cũng như trong các công việc có liên quan đến
tín hiệu nói chung,thông thường ta không làm việc chỉ riêng với một tín hiệu
hoặc một vài tín hiệu điển hình mà ngược lại phải làm việc với một tập gồm
rất nhiều các tín hiệu khác nhau. Khi phải làm việc với nhiều tín hiệu khác
nhau như vậy chắc chắn ta sẽ gặp bài toán so sánh các tín hiệu để chọn lọc
ra được những tín hiệu phù hợp cho công việc.
Các khái niệm như tín hiệu x1(t) tốt hơn tín hiệu x2(t) chỉ thực sự có nghĩa
nếu như chúng cùng được chiếu theo một tiêu chuẩn so sánh nào đó. Cũng
như vậy nếu ta khẳng định rằng x1(t) lớn hơn x2(t) thì phải chỉ rõ phép so
sánh lớn hơn đó được hiểu theo nghĩa nào, x1(t) có giá trị cực đại lớn hơn ,
có năng lượng lớn hơn hay x1(t) chứa nhiều thông tin hơn x2(t)…..Nói một
cách khác ,trước khi so sánh x1(t) với x2(t) chúng ta phải gắn cho mỗi một
tín hiệu một giá trị đánh giá tín hiệu theo tiêu chuẩn so sánh được lựa chọn .
Định nghĩa: Cho một tín hiệu x(t) và một ánh xạ x(t) →||x(t)|| ∈ R+ chuyển
x(t) thành một số thực dương ||x(t)||.Số thực dương này sẽ được gọi là chuẩn
của x(t) nếu nó thỏa mãn:
a. ||x(t)|| ≥ 0 và ||x(t)|| = 0 khi và chỉ khi x(t) =0 (3.1)
b. ||x(t)+y(t)|| ≤ ||x(t)|| + ||y(t)|| ∀ x(t), y(t) (3.2)
c. ||ax(t)|| = |a|.||x(t)|| ∀ x(t) và ∀a ∈ R . (3.3)
3.1.2.2 Một số chuẩn thường dùng trong điều khiển cho một tín hiệu x(t):
∞
- Chuẩn bậc 1: || x(t ) ||1 = ∫ | x(t ) |dt (3.4)
−∞
∞
|| x(t ) || 2 = ∫ | x(t ) |
2
- Chuẩn bậc 2: dt . (3.5)
−∞
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Bình phương chuẩn bậc hai chính là giá trị đo năng lượng của tín hiệu x(t).
∞
|| x(t ) || p = ∫ | x(t ) | với p ∈ N
p
-Chuẩn bậc p: p dt (3.6)
−∞
∑x
2
x 2
= i (3.9)
i =1
Trang 3
PGS.TS Nguyễn Thị Phương Hà Trang 4
Định lí 3.1: (Parseval) Chuẩn bậc hai của một tín hiệu x(t) và ảnh Fourier
X(j ω ) của nó có quan hệ :
∞ ∞
1
|| x(t ) || 22 = ∫ | x(t ) | 2 dt = ∫ | X ( jω ) |
2
dω (3.11)
−∞
2π −∞
Cho tín hiệu nhân quả causal x(t). Gọi X(s) là ảnh Laplace của nó .Giả sử
rằng X(s) có dạng thực -hữu tỷ với bậc của đa thức tử số không lớn hơn bậc
đa thức mẫu số ,tức là:
B( s ) b0 + b1 s + ..... + bm s m
X ( s) = = với m < n (3.12)
A( s ) a0 + a1 s + ..... + an s n
Định lí 3.2: Xét tín hiệu nhân quả causal x(t) có X(s) dạng (3.12) .Để chuẩn
bậc 1 của x(t) là một số hữu hạn ||x(t)||1= K < ∞ thì điều kiện cần và đủ là tất
cả các điểm cực của X(s) phải nằm bên trái trục ảo (có phần thực âm) .
3.1.3 Đại số ma trận
3.1.3.1 Một số ma trận thường gặp:
- Một ma trận A=(aij) có số hàng bằng số cột được gọi là ma trận vuông.
Đường chéo nối các phần tử aii trong ma trận vuông được gọi là đường chéo
chính .Đường chéo còn lại được gọi là đường chéo phụ.
⎡ a11 a12 " a1n ⎤
⎢a a 22 " a 2 n ⎥⎥
A = ⎢ 21 (3.13)
⎢ # # # # ⎥
⎢ ⎥
⎣a n1 an 2 " a nn ⎦
- Một ma trận vuông A=(aij) có aij = 0 khi i ≠ j ,tức là các phần tử không
nằm trên đường chéo chính đều bằng 0, được gọi là ma trận đường chéo. Ma
trận đường chéo được ký hiệu bởi:
⎡a11 0 " 0 ⎤
⎢0 a 22 " 0 ⎥⎥
A= ⎢ = diag(aij) (3.14)
⎢ # # # # ⎥
⎢ ⎥
⎣0 0 " a nn ⎦
http://www.khvt.com
Chương 3 : Điều khiển bền vững
⎡1 0 " 0⎤
⎢0 1 " 0⎥⎥
- Ma trận đường chéo I = diag(1) = ⎢ gọi là ma trận đơn vị.
⎢# # # #⎥
⎢ ⎥
⎣0 0 " 1⎦
- Ma trận vuông A=(aij) có aij = 0 khi i > j (hoặc i < j) được gọi là ma trận
tam giác
+ Ma trận tam giác dưới
⎡ a11 0 " 0 ⎤
⎢a a 22 " 0 ⎥⎥
A= ⎢ 21 (3.15)
⎢ # # # # ⎥
⎢ ⎥
⎣ a n1 an 2 " a nn ⎦
Trang 5
PGS.TS Nguyễn Thị Phương Hà Trang 6
Một ma trận vuông A ∈ R n×n được gọi là ma trận trực giao nếu ATA=AAT=I
3.1.3.3 Hạng của ma trận:
Cho n vector vi i=1,2,…,n Chúng sẽ được gọi là độc lập tuyến tính nếu đẳng
thức a1v1+a2v2+…….+anvn=0 trong đó ai là những số thực (hoặc phức) sẽ
đúng khi và chỉ khi a1 = a2 = …..=an = 0
Xét một ma trận A=(aij) bất kì có m hàng và n cột .Nếu trong số m vector
hàng có nhiều nhất p ≤ m vector độc lập tuyến tính và trong số n vector cột
có nhiều nhất q ≤ n vector độc lập tuyến tính thì hạng ma trận đươc hiểu là:
Rank(A) = min{p,q}
Một ma trận vuông A kiểu (n× n) sẽ được gọi là không suy biến nếu
Rank(A)=n .Ngược lại nếu Rank(A) <n thì A được nói là ma trận suy biến
Hạng ma trận có các tính chất sau:
- Rank(A) = min{p,q} (3.17)
- Rank(AB) ≤ rank(A) và rank(AB) ≤ rank(B) (3.18)
- Rank(A + B) ≤ rank(A) + rank(B) (3.19)
- Nếu B không suy biến thì rank(AB) = rank(B) (3.20)
3.1.3.4 Ma trận nghịch đảo:
Cho ma trận A=(aij),i=1,2,…,m ; j=1,2,…,n,trong đó aij là những số thực
(hoặc phức),nói cách khác A ∈ Rm × n(hoặc A ∈ Cm × n ).Nếu tồn tại một ma
trận B thỏa mãn :
AB = BA = I (ma trận đơn vị) (3.21)
Thì ma trận B được gọi là ma trận nghịch đảo của A và ký hiệu là B = A-1.
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Do phải tồn tại cả hai phép nhân AA-1 và A-1A cho ra kết quả có cùng kiểu
nên ma trận A phải là một ma trận vuông,tức là phải có m = n.Hơn nữa do
det(I) = 1 ≠ 0 nên:
det(A)det(A-1) ≠ 0 => det(A) ≠ 0 và det(A-1) ≠ 0. (3.22)
Vậy A phải là ma trận không suy biến.
Ma trận nghịch đảo A-1 của A có tính chất sau:
- Ma trận nghịch đảo A-1 của A là duy nhất (3.23)
- Tập hợp tất cả các ma trận vuông cùng kiểu và không suy biến cùng với
phép nhân ma trận tạo thành một nhóm (không giao hoán). (3.24)
⎡a b ⎤ 1 ⎡ d − b⎤
- Nghịch đảo ma trận kiểu (2× 2): A −1 = ⎢ ⎥ = ⎢ ⎥ (3.25)
⎣ c d ⎦ det( A) ⎣− c a ⎦
- (AB)-1 = B-1A-1 (3.26)
- (A-1)T = (AT)-1 (3.27)
⎡1⎤
- Nếu A = diag(ai) và không suy biến thì A-1 = diag ⎢ ⎥ (3.28)
⎣ ai ⎦
Aadj
- A-1 = (3.29)
det( A)
trong đó Aadj là ma trận có các phần tử a i j = (-1)i+jdet(Aij) với Aij là ma trận
thu được từ A bằng cách bỏ đi hàng thứ j và như cột thứ i.
- Cho ma trận A ∈ Rn × n không suy biến . Nếu U ∈ Rn × m và V ∈ Rn × m là
hai ma trận làm cho (I+VTA-1U) cũng không suy biến thì
(A+UVT)-1 = A-1 – A-1U(I+VTA-1U)-1VTA-1 (3.30)
⎡A A2 ⎤
- Cho ma trận vuông A = ⎢ 1 không suy biến,trong đó A1,A2,A3,A4
⎣ A3 A4 ⎥⎦
cũng là các ma trận.
Nếu A1 không suy biến và B = A4 – A3A1-1A2 cũng không suy biến thì
−1
⎡A
−1
A2 ⎤ ⎡ A1 −1 + A −11 A2 B −1 A3 A1 −1 − A1 A2 B −1 ⎤
−1
A =⎢ 1 =⎢ ⎥ (3.31)
⎣ A3 A4 ⎥⎦ ⎣ − B −1 A3 A1
−1
B −1 ⎦
Trang 7
PGS.TS Nguyễn Thị Phương Hà Trang 8
Nếu A4 không suy biến và C = A1 – A2A4-1A3 cũng không suy biến thì
−1
⎡A
−1
A2 ⎤ ⎡ C −1 − C −1 A2 A4
−1
⎤
A =⎢ 1 =⎢ −1 ⎥
(3.32)
⎣ A3 A4 ⎥⎦ −1
⎣− A4 A3 AC
−1 −1 −1
A4 + A4 A3C −1 A2 A3 ⎦
http://www.khvt.com
Chương 3 : Điều khiển bền vững
∂ ⎡ ∂ ⎤
F(X ) = ⎢ F ( X )⎥ (3.41)
∂X ⎣⎢ ∂xij ⎦⎥
Cho A và B là những ma trận phức với không gian tương thích .Một số công
thức đạo hàm :
∂
Trace ( AXB ) = AT B T (3.42)
∂X
∂
Trace ( X k
) = k(X k −1 T
) (3.43)
∂X
∂
Trace ( XBX T ) = 2 XB (B = BT ) (3.44)
∂X
∂
( X T AX ) = AX + A T X (3.45)
∂X
∂
Trace ( AX T B ) = BA (3.46)
∂X
3.1.3.8 Chuẩn của ma trận:
Người ta cần đến chuẩn của ma trận là nhằm phục vụ việc khảo sát tính giải
tích của nó.Có nhiều chuẩn khác nhau cho một ma trận A=(aij)
,i=1,2,…,m;j=1,2,…,n.
Những chuẩn thông thường được sử dụng:
- Chuẩn 1 của ma trận A
m
A 1 = max ∑ aij (3.47)
1≤ j ≤ n
i =1
A 2
= max λi ( A* A) (3.48)
1≤ i ≤ n
Trang 9
PGS.TS Nguyễn Thị Phương Hà Trang 10
n
A ∞
= max ∑ a ij (3.49)
1≤i ≤ m
j =1
∑∑ a
2
A F
= ij = trace( AT A) (3.50)
i j
σ i ( A) = λi ( A* A) i = 1,2,...k (3.51)
với k = min{m, l} .
Nếu chúng ta biểu diễn ma trận A dưới dạng A(s) và đặt s = jω
(0 ≤ ω < ∞) , thì trị suy biến của A( jω ) là một hàm của ω và được gọi là
độ lợi chính của A(s). Ở đây chúng ta giả sử rằng σ i được sắp xếp theo thứ
tự sao cho σ i ≥ σ i +1 . Như vậy, σ 1 là trị suy biến lớn nhất và σ k là trị suy
biến nhỏ nhất. Ký hiệu σ là trị suy biến lớn nhất và σ là trị suy biến nhỏ
nhất.
Ta có:
σ ( A) = max σ i ( A) = max λi ( A* A)
= A 2
(3.52)
Ax
với A 2 = sup 2
.
x 2
Độ lợi của hệ đa biến nằm giữa độ lợi chính lớn nhất và nhỏ nhất.
Trong Matlab tìm trị suy biến của ma trận A dùng lệnh svd(A)
Ví dụ: Cho ma trận A:
http://www.khvt.com
Chương 3 : Điều khiển bền vững
⎡9 4⎤
>> A = ⎢⎢6 8 ⎥⎥ ;
⎢⎣2 7 ⎥⎦
>> S =svd(A)
S=
[14.9359
5.1883]
S: vector của các giá trị suy biến của ma trận A
σ ( A) =14.9359
σ (A)=5.1883
3.1.5 Ổn định nội
Ổn định nội là yêu cầu cơ bản đối với một hệ thống hồi tiếp thực. Ý nghĩa
của ổn định nội là khi đầu vào hệ thống bằng không thì tất cả các trạng thái
hệ thống đều phải về không từ mọi giá trị ban đầu. Mọi hệ thống tự động
đều phải bảo đảm ổn định nội mới hoạt động được.
+ e1
w1 G
+
+
K + w2
e2
Định nghĩa :
Hệ hồi tiếp hình 3.2 được gọi là ổn định nội nếu tất cả các hàm truyền đạt từ
w1, w2 đến e1, e2 đều ổn định.
Trang 11
PGS.TS Nguyễn Thị Phương Hà Trang 12
Điều kiện ổn định nội chặt hơn điều kiện ổn định dựa trên hàm truyền vào-
ra thông thường, vì nó tránh việc khử các cực và zero không ổn định giữa
các khâu liên tiếp nhau. Khi thành lập hàm truyền vào-ra, có thể xảy ra hiện
tượng khử cực và zero không ổn định của các khâu liên tiếp nhau. Như vậy,
điều kiện ổn định nội bảo đảm các tín hiệu bên trong hệ thống đều hữu hạn
khi tín hiệu vào là hữu hạn.
Ví dụ, ta khảo sát điều kiện ổn định nội của hệ thống hình 3.2:
e1 = w1 + Ke 2 = w1 + Kw2 + KGe1
⇒ e1 = ( I − KG ) −1 w1 + ( I − KG ) −1 Kw2
e2 = w2 + Ge1 = w2 + Gw1 + GKe 2
⇒ e2 = ( I − GK ) −1 Gw1 + ( I − GK ) −1 w2
Suy ra:
⎡ e1 ⎤ ⎡ ( I − KG ) −1 ( I − KG ) −1 K ⎤ ⎡ w1 ⎤
⎢e ⎥ = ⎢ −1 −1 ⎥ ⎢ ⎥
⎣ 2 ⎦ ⎣( I − GK ) G ( I − GK ) ⎦ ⎣ w2 ⎦
( I − GK ) −1 G , ( I − GK ) −1 đều ổn định.
r u y
G
-
http://www.khvt.com
Chương 3 : Điều khiển bền vững
v w
Δ
c. M ∞
= σ ( M ( jω )) < 1 ∀ω (3.56)
Trang 13
PGS.TS Nguyễn Thị Phương Hà Trang 14
3.1.7.2 Điều kiện ổn định bền vững đối với sai số cộng:
Với Δ A ( s ) = δ A ( s )Δ( s ), σ (Δ( jω )) ≤ 1 ∀ω , (3.57)
v w
Δ
M
δA
+
K G
-
Ta có:
v( s ) = − K ( s )[δ A ( s ) w( s ) + G ( s )v( s )] (3.58)
hay
v( s ) = −[ I + K ( s )G ( s )]−1 K ( s )δ A ( s ) w( s ) (3.59)
vậy
K ( s )δ A ( s )
M ( s) = − (3.60)
[ I + K ( s )G ( s )]
Kết luận: Hệ thống vòng kín hình 3.5 ổn định bền vững khi và chỉ khi:
K ( s )δ A ( s )
σ ( jω ) =||M(s)||∞= <1 (3.61)
[ I + K ( s )G ( s )] ∞
http://www.khvt.com
Chương 3 : Điều khiển bền vững
3.1.7.3 Điều kiện ổn định bền vững đối với sai số nhân ở đầu ra
v w
Δ
M
δ0
+
K G
-
G ( s ) K ( s )δ O ( s )
<1 (3.66)
I + G ( s) K ( s) ∞
Trang 15
PGS.TS Nguyễn Thị Phương Hà Trang 16
Ngõ ra y là ngõ ra hồi tiếp và đo được. Ngõ ra z là điều khiển được. Tín hiệu
nhiễu w là nhiễu hệ thống và v là nhiễu đo .
Tín hiệu v và w là những quá trình nhiễu trắng .Trạng thái ban đầu của x(0)
được giả sử là một vector ngẫu nhiên .
Nhiều sự giả sử khác nhau định nghĩa trạng thái x(t) t ∈ R và ngõ ra điều
khiển được z(t),t ∈ R là những quá trình ngẫu nhiên .Biểu thức sai số toàn
phương :
z T (t )Qz (t ) + u T (t ) Ru (t ) t≥0 (3.68)
∫ E [z (t )Qz (t ) + u T (t ) Ru (t )]dt
T
(3.69)
0
là nhỏ. Đây là vấn đề điều khiển tuyến tính nhiễu loạn. Khoảng thời gian [0
T] là xác định nhưng thật sự chúng ta xem xét trường hợp T → ∞ . Tại bất
kỳ thời gian t toàn bộ tín hiệu đo được ở quá khứ y(s) s ≤ t được giả sử có
giá trị cho hồi tiếp. Hình (3.7) làm rõ trường hợp này :
http://www.khvt.com
Chương 3 : Điều khiển bền vững
z
u
SYSTEM
+
+ y
v
CONTROLLER
Trang 17
PGS.TS Nguyễn Thị Phương Hà Trang 18
u z
SYSTEM
y
+
L
-
ŷ
SYSTEM
MODEL x̂
Hình (3.8) cho thấy cấu trúc của bộ quan sát .Định nghĩa :
~
x (t ) = x(t ) − xˆ (t ) (3.72)
là sai số ước lượng trạng thái. Phương trình vi phân của ~
x nhận được sau
khi trừ (3.70) cho (3.71) :
~
x (t ) = ( A − LC ) ~
x (t ) t ∈ R (3.73)
Nếu hệ thống (3.70) được tìm thấy thì tồn tại ma trận độ lợi L mà sai số hệ
thống (3.73) là ổn định. Nếu sai số hệ thống là ổn định thì
~
x (t ) → 0 khi t → ∞ cho bất kỳ sai số ~
x (0). Vì vậy
→∞
xˆ (t ) ⎯t⎯
⎯→ x(t ) (3.74)
Trạng thái ước lượng hội tụ về trạng thái thực.
Trong Matlab dùng hai lệnh acker và place để tính ma trận L của khâu
quan sát trạng thái :
L= acker(A’,C’,p)
L= place(A’,C’,p)
A’ : Chuyển vị của ma trận A
C’ : Chuyển vị của ma trận C
p : Khai báo các điểm cực mong muốn
http://www.khvt.com
Chương 3 : Điều khiển bền vững
w(t) v(t)
u x x y
B ∫ C
A Hệ thống
~
y
L
-
xˆ x̂ ŷ
B ∫ C
A Bộ lọc Kalman
Trang 19
PGS.TS Nguyễn Thị Phương Hà Trang 20
Giá trị trung bình hay mong muốn của z được xác định như sau:
∞
E{z}= ∫ ξ ƒ z ( ξ )d ξ (3.80)
−∞
http://www.khvt.com
Chương 3 : Điều khiển bền vững
được minh họa ở hình 3.10 .Vì vậy những vector ngẫu nhiên lấy giá trị gần
với z có xác suất lớn nhất và xác suất sẽ giảm khi lấy giá trị xa z .Nhiều
biến ngẫu nhiên là Gaussian.
Nếu vector ngẫu nhiên là một hàm của thời gian được gọi là một quá trình
ngẫu nhiên được tượng trưng là z(t). Khi đó PDF có thể thay đổi theo thời
gian và chúng ta viết là ƒ z ( ξ ,t). Điều đó có thể tưởng tượng rằng PDF ở
hình 3.10 thay đổi theo thời gian. Trong tình huống này, giá trị mong đợi và
ma trận hiệp phương sai là những hàm thời gian vì thế chúng có thể biểu
hiện z (t) và P z (t).
Trang 21
PGS.TS Nguyễn Thị Phương Hà Trang 22
Nhiều quá trình ngẫu nhiên z(t) quan trọng là có PDF bất biến theo thời gian
Đó là những quá trình tĩnh, thậm chí chúng là hàm thời gian ngẫu nhiên
chúng vẫn có trị trung bình và hiệp phương sai là hằng số.
Đặc trưng cho liên hệ giữa hai quá trình ngẫu nhiên z(t) và x(t), có thể sử
dụng PDF kết hợp ƒ zx (ς , ξ , t1 , t 2 ) , tượng trưng cho xác xuất mà (z(t1),
x(t2)) ở trong vùng vi phân d ς × d ξ ở giữa ( ς , ξ ). Giả sử rằng các quá trình
z(t) và x(t) là liên kết tĩnh , PDF kết hợp không là hàm của cả hai thời gian
t 1 và t 2 nhưng nó chỉ dựa vào sai biệt (t 1 - t 2 ).
Trong nhiều trường hợp tĩnh, giá trị mong muốn của hàm hai biến g(z,x)
được xác định bởi:
+∞
E {g ( z (t1 ), x(t 2 )) }= ∫ g( ς , ξ )ƒ zx ( ς , ξ ,t 1 - t 2 )d ς d ξ (3.84)
−∞
Do đó, ma trận tương quan chéo của hai quá trình không tĩnh mà được xác
định bởi
R zx (t, τ )=E {z (t ) x T (τ )} (3.86)
Xem như z(t 1 ) và z(t 2 ) như là hai quá trình ngẫu nhiên của quá trình tĩnh,
hàm tự tương quan z(t) được xác định như sau:
R z ( τ )=E {z (t + τ ) z T (t )} (3.87)
Hàm tự tương quan đem đến cho ta vài thông tin quan trọng về quá trình
ngẫu nhiên z(t). Thí dụ như :
[ ]
trace [R z (0)] =trace E {z (t ) z T (t )} =E { z (t ) } (3.88)
tương đương với tổng năng lượng của quá trình z(t).
Nếu
R zx (τ ) = 0 (3.89)
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Giả sử x(0) có thể được thay thế bằng các đại lượng biết trước x (giá trị
trung bình của x(0)) và hiệp phương sai P 0 ) , có thể biểu diễn nó như sau :
x (0) ≈ (x 0 ,P 0 ) (3.91)
giả sử w(t) và v(t) có trị trung bình bằng 0 và giả sử rằng nhiễu quá trình và
nhiễu đo là nhiễu trắng quá trình để:
R w ( τ )=E {w(t + τ ) wT (t )} = Wδ (τ ) (3.92)
R v ( τ )=E {v(t + τ )v T (t )} = Vδ (τ ) (3.93)
Ma trân mật độ phổ W và V sẽ giả sử đã biết trước.Theo tính chất của hàm
tự tương quan, W và V là bán xác định dương. Giả sử thêm rằng V là không
suy biến.Tóm lại, có thể giả sử rằng :
w(t) ≈ (0,W), W≥0 (3.94)
v(t) ≈ (0,V), V>0 (3.95)
Việc giả sử w(t) và v(t) là nhiễu trắng có thể là xấu trong một vài ứng
dụng.Thí dụ như nhiễu ở tần số thấp. Tuy nhiên, giả sử rằng w(t) không là
nhiễu trắng, có thể xác định được một hệ thống:
Trang 23
PGS.TS Nguyễn Thị Phương Hà Trang 24
.
x 0 =A w x w +B w n (3.96)
w=C w x w +D w n (3.97)
có nhiễu trắng ngõ vào là n(t) và ngõ ra là w(t). Chúng được gọi là các bộ
lọc nắn nhiễu . Những đặc tính động này có thể kết hợp với phương trình
của đối tượng (3.75), (3.76) để có được đặc tính động được hiệu chỉnh như
sau.
⎡ x ⎤ ⎡ A γC w ⎤ ⎡ x ⎤ ⎡ B ⎤ ⎡γDw ⎤
⎢ x ⎥ = ⎢0 A ⎥ ⎢ x ⎥ + ⎢0 ⎥u + ⎢ B ⎥ n (3.98)
⎣ w⎦ ⎣ w ⎦⎣ w ⎦ ⎣ ⎦ ⎣ w⎦
y= [C 0] ⎡ x ⎤ + v (3.99)
⎢⎣ x w ⎥⎦
Đặc tính động có nhiễu trắng quá trình n(t). Một thủ tục tương tự có thể làm
theo các bước như thế nếu v(t) không phải là nhiễu trắng. Do đó, có thể mô
tả một hệ thống không có nhiễu trắng dưới dạng một hệ thống điều chỉnh
với nhiễu trắng và nhiễu đo lường .
Xác định hệ thống (3.96), (3.97) miêu tả nhiễu không phải là nhiễu trắng
w(t) (hoặc v(t)) dựa trên phân tích mật độ phổ của nhiễu w(t). Chi tiết xem
Lewis (1986 )
Bây giờ thiết kế bộ ước lượng cho hệ thống (3.75), (3.76) dưới những giả sử
đã được liệt kê. Cho bộ quan sát có dạng như sau:
xˆ = Axˆ + Bu + L( y − yˆ ) (3.100)
http://www.khvt.com
Chương 3 : Điều khiển bền vững
≡A0 ~
x + γ w-Lv (3.104)
chú ý rằng sai số hệ thống xảy ra khi có sự tham gia của nhiễu quá trình và
nhiễu đo lường . Ngõ ra của sai số hệ thống có thể được cho bởi ỹ=y- ŷ để:
ỹ=C ~x (3.105)
Hiệp phương sai của sai số được cho bởi:
{ }
P(t)=E ~
x~xT (3.106)
thay đổi theo thời gian. Do đó, ~ x (t) là quá trình ngẫu nhiên không tĩnh.
Hiệp phương sai của sai số là thước đo sự không chắc chắn trong ước lượng.
Những giá trị càng nhỏ cho P(t) đồng nghĩa với việc ước luợng càng tốt hơn
vì những sai số được phân bố càng gần với trị trung bình bằng 0 nếu P(t) là
nhỏ hơn.
Nếu bộ quan sát là ổn định tiệm cận và w(t) và v(t) là quá trình tĩnh khi đó
sai số ~
x (t) sẽ thực sự tiến đến trạng thái ổn định với trị trung bình và hiệp
phương sai là hằng số. Độ lợi L sẽ được chọn lựa để làm tối thiểu hiệp
phương sai cũa sai số P. Vì vậy, độ lợi tối ưu L sẽ là ma trận hằng của độ lợi
bộ quan sát
Trước khi xác định độ lợi tối ưu L, chúng ta sẽ tính toán giá trị trung bình và
hiệp phương sai của sai số ước lượng của ~ x (t). Sử dụng (3.104) và sự tuyến
tính của phép toán mong muốn:
{}
E ~x = A E{~
0 x } + γE{w} − LE {v} (3.107)
d
Vì thế x }=A 0 E{~
E {~ x} (3.108)
dt
Do đó, E {~
x }là lượng biến đổi theo thời gian tuân theo phương trình vi phân
với ma trận hệ thống A .Nếu A =A-LC là ổn định thì E {~
0 0 x }luôn bền vững
tại giá tri tĩnh zero. Khi đó
E{~x } = E{x}− E{xˆ} = E{x}− xˆ (3.109)
Theo trừơng hợp này ước lượng x̂ (t) tiến tới E{x(t)} .Như vậy ước lượng
này được cho là không lệch. Cũng như theo (3.109), giá trị trung bình của
Trang 25
PGS.TS Nguyễn Thị Phương Hà Trang 26
sai số ban đầu ~ x (0) bằng với giá trị zero nếu như bộ quan sát (3.101) có giá
trị đầu x̂ (0)= x0 với x 0 là giá trị trung bình của x(0)
Nếu như nhiễu quá trình w(t) hoặc nhiễu đo được v(t) có giá trị trung bình
không phải là zero thì theo (3.107) giá trị E {~ x } của trạng thái tĩnh cũng
không bằng zero. Trong trường hợp này x̂ (t) không đến được ổn định tiệm
cận để đạt được trạng thái thật x(t), nhưng có được một khoảng offset bằng
giá trị hằng- E {~
x }. Khi đó trạng thái ước lượng là bị lệch.
Để xác định P, chú ý rằng lời giải phương trình (3.104) được cho :
t t
x(t)=e A0 J x(0)- ∫ e A0 (t −τ ) Lv(τ )dτ + ∫ e A0 (t −τ )γ w(τ )dτ (3.110)
0 0
Tìm ma trận tương quan chéo R v~x (t,t) và R w~x (t,t) sử dụng (3.110) và giả sử
rằng x(0) (và cả ~
x (0) ,w(t) và v(t) là trực giao).Do đó
Chú ý rằng
R v (t, τ ) =V δ (t − τ ) (3.112)
Nhưng tích phân (3.111) có giá trị giới hạn trên là t. Xung đơn vị có thể
được biểu hiện như sau
1 t
δ (t ) = lim Π( ) (3.113)
T →0 T T
ở đây hàm xung vuông:
⎧ T
⎪ 1, t <
1 t ⎪ 2
Π( ) = ⎨ (3.114)
T T ⎪0, t ≥ T
⎪⎩ 2
được đặt tại trung tâm t = 0.
Vì vậy, ta chỉ xét một nửa vùng δ (t − τ ) tại bên trái τ =t. Do đó từ (3.111)
được suy ra:
1
R v~x (t , t ) = − VLT (3.115)
2
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Tương tự,
{
R w~x (t , t ) = E w(t ) ~ }
x T (t )
t
= ∫ E {w(t ) wT (τ )}γ T e A0 ( t −τ ) dτ
T
hoặc
0
1
R w~x (t , t ) = Wγ T (3.116)
2
Phương trình đạo hàm cho P(t)=E ~
x~xT { }
⎧ d~
x T⎫ ⎧ d~
xT ⎫
P (t)=E ⎨ ~ x ⎬ = E ⎨~
x ⎬ (3.117)
⎩ dt ⎭ ⎩ dt ⎭
Theo (3.104) , (3.115) và (3.116) ta có :
⎧ d~
x T⎫ 1 1
E⎨ ~ x ⎬ = ( A − LC ) P + LVLT + γWγ T (3.118)
⎩ dt ⎭ 2 2
⎧ dx T ⎫ 1 1
⎬ = P ( A − LC ) + LVL + γ W γ
T T T
E ⎨ x (3.119)
⎩ dt ⎭ 2 2
Từ (3.118) và (3.119)
2 P = A0 P + PA0T + LVLT + γWγ T (3.120)
Cho bất kì L để (A-LC) là ổn định ,chúng ta giải (3.120) tìm P(t) sử dụng
điều kiện đầu là P (0) = P0 với P0 là hiệp phương sai của trạng thái đầu mà
nó tượng trưng cho tính không chắc chắn trong ước lượng đầu xˆ (0) = x0
Thực sự những độ lợi cho kết quả P(t) càng nhỏ thì càng tốt vì sai số ~ x (t)
càng gần với trị trung bình bằng 0.Do đó P(t) là thước đo chất lượng của bộ
quan sát ,và ma trận hiệp phương sai càng nhỏ thì bộ quan sát càng tốt hơn
Chúng ta nói rằng P là thước đo sự không chắc chắn trong ước lượng .
P(t) tiến tới giá trị trạng thái bền vững P khi t → ∞ ngay khi A0 là ổn định
tiệm cận.Tại trạng thái bền vững thì P = 0 , (3.121) trở thành phương trình
đại số
0= A0 P + PA0T + LVLT + γWγ T (3.121)
Trang 27
PGS.TS Nguyễn Thị Phương Hà Trang 28
Hiệp phương sai của sai số trạng thái bền vững là ma trận bán xác định
dương được xác định từ (3.121). Để lấy độ lợi của bộ quan sát là hằng số, có
thể chọn lựa L để làm tối thiểu hoá hiệp phương sai của sai số P trạng thái
bền vững.
Ta có chỉ tiêu chất lượng (PI)
1
J= trace( P) (3.122)
2
Do đó nếu P nhỏ thì J sẽ nhỏ. Để chọn L sao cho J đạt được tối thiểu phải
thỏa mãn phương trình (3.121), xác định phương trình Hamiltonian
1 1
H= trace( P) + trace( gS ) (3.123)
2 2
Trong đó
g =A 0 P+PA T0 +LVL T + γ W γ T
(3.124)
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Giả sử (C,A) là có thể quan sát được và (A, γ W ) là có thể tìm được .Khi
đó ARE tìm được ma trận xác định dương duy nhất P .Hơn nữa,sai số hệ
thống (3.104) sử dụng độ lợi kalman cho bởi (3.128) với P là ma trận xác
định dương duy nhất của ARE là ổn định tiệm cận.
Một cách chắc rằng nhiễu hệ thống sẽ giảm.Tuy nhiên vị trí thực sự rất xa
vời so với thực tế.
Tóm lại ,từ mô hình hệ thống:
x = Ax + Bu (3.132)
y=Cx (3.133)
x(0)~(x 0 ,P 0 ) , w(t) ~(0,W), v(t) ~(0,V)
w(t) và v(t) là nhiễu trắng quá trình trực giao với nhau và với x(0)
Giá trị đầu
x̂ (0)= x 0 (3.134)
Trang 29
PGS.TS Nguyễn Thị Phương Hà Trang 30
Bộ điều chỉnh toàn phương tuyến tính (LQR) và bộ lọc Kalman được sử
dụng với nhau để thiết kế bộ điều chỉnh động. Thủ tục này được gọi là thiết
kế bộ tuyến tính toàn phương Gaussian (LQG). Điều thuận lợi quan trọng
của việc thiết kế LQG là cấu trúc của bộ điều khiển được cho bởi thủ tục.
Điều này làm cho các bộ LQG được thiết kế rất có ích cho việc điều khiển
các hệ thống hiện đại (ví dụ như điều khiển không gian và hàng không ) khi
cấu trúc bộ điều khiển không biết trước được.
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Trang 31
PGS.TS Nguyễn Thị Phương Hà Trang 32
3.2.4 Ví dụ:
Mô hình con lắc ngược:
Xét hệ thống con lắc ngược như hình sau.Con lắc ngược được gắn vào xe
kéo bởi động cơ điện.Chúng ta chỉ xét bài toán hai chiều,nghĩa là con lắc chỉ
di chuyển trong mặt phẳng.Con lắc ngược không ổn định vì nó luôn ngã
xuống trừ khi có lực tác động thích hợp.Giả sử khối lượng con lắc tập trung
ở đầu thanh như hình vẽ (khối lượng thanh không đáng kể).Lực điều khiển u
tác động vào xe.Yêu cầu của bài toán là điều khiển vị trí của xe và giữ cho
con lắc ngược luôn thẳng đứng. Bài toán điều khiển hệ con lắc ngược chính
là mô hình của bài toán điều khiển định hướng tàu vũ trụ khi được phóng
vào không gian.
y
x lsin θ
m
θ
mg
lcosθ
x
u M
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Trang 33
PGS.TS Nguyễn Thị Phương Hà Trang 34
tính.Giả sử góc θ nhỏ để chúng ta có thể xấp xỉ sin θ bằng 0,cos θ bằng 1
•2
và cũng giả sử θ nhỏ để θ θ ≈ 0 .Với các điều kiện trên,chúng ta có thể
tuyến tình hoá các phương trình phi tuyến:
•• ••
( M + m) x + ml θ = u
•• ••
m x + ml θ = mgθ
⎧ x1 = θ
⎪ •
⎪⎪ x 2 = θ
Đặt các biến trạng thái: ⎨ (3.144)
⎪ x 3 = x
⎪ •
⎪⎩ x 4 = x
Kết hợp với hai phương trình trên ta suy ra hệ phương trình biến trạng thái
như sau:
⎧•
⎪ x1 = x 2
⎪• M +m 1
⎪x 2 = gx1 − u
⎪ Ml Ml
⎨• (3.145)
⎪ x 3 = x4
⎪
⎪ x• = − m gx + 1 u
⎪⎩ 4 Ml
1
M
Viết lại dưới dạng ma trận
⎡ D ⎤ ⎡0 1 0 0⎤ ⎡0 ⎤
⎢ x1 ⎥ ⎢ M + m ⎥ ⎡ x1 ⎤ ⎢ 1 ⎥
⎢• ⎥ ⎢ g 0 0 0 ⎥ ⎢ ⎥ ⎢− ⎥
⎢ x 2 ⎥ = ⎢ Ml ⎥ ⎢ x 2 ⎥ + ⎢ Ml ⎥ u (3.146)
⎢• ⎥ ⎢ 0 0 0 1 ⎥ ⎢ x 3 ⎥ ⎢0 ⎥
⎢x3 ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥
⎢ • ⎥ ⎢− m g 0 0 0⎥⎥ ⎣ x4 ⎦ ⎢ 1 ⎥
⎢⎣ x 4 ⎥⎦ ⎢⎣ M ⎦ ⎢⎣ M ⎥⎦
Phương trình ở ngõ ra,chúng ta giả sử hai trường hợp:
⎡1 0 0 0 ⎤ ⎡ x1 ⎤
⎢0 ⎢ ⎥
1 0 0 ⎥⎥ ⎢ x 2 ⎥
y=⎢ (3.147)
⎢0 0 1 0 ⎥ ⎢ x3 ⎥
⎢ ⎥⎢ ⎥
⎣0 0 0 1 ⎦ ⎣ x4 ⎦
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Nếu chỉ đo được hai biến trạng thái(vị trí x và góc lệch θ )thì :
⎡ x1 ⎤
⎢ ⎥
⎡1 0 0 0⎤ ⎢ x 2 ⎥
y=⎢ ⎥ (3.148)
⎣0 0 1 0⎦ ⎢ x 3 ⎥
⎢ ⎥
⎣ x4 ⎦
Chúng ta sẽ khảo sát hệ con lắc ngược có các thông số nhưsau:M=1kg,l=1m
Lấy giá trị gia tốc trọng trường g=9.8m/s2
Phương trình (3.146) trở thành:
⎡• ⎤
⎢ x 1 ⎥ ⎡0 1 0 0 ⎤ ⎡ x1 ⎤ ⎡0 ⎤
⎢• ⎥ ⎢ ⎢ ⎥
⎢ x 2 ⎥ = ⎢ 10.78 0 0 0 ⎥⎥ ⎢ x 2 ⎥ ⎢⎢− 1⎥⎥
⎢ • ⎥ ⎢0 + u (3.149)
0 0 1 ⎥ ⎢ x 3 ⎥ ⎢0 ⎥
⎢x3 ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥
⎢ • ⎥ ⎣− 0.98 0 0 0 ⎦ ⎣ x 4 ⎦ ⎣1 ⎦
⎢⎣ x 4 ⎥⎦
Thiết kế LQG:
Lọc Kalman:
- Bộ quan sát:
Nếu không có đường phản hồi qua L thì ~ x không tiệm cận về x được vì
~
vậy L được chọn sao cho x ¼x
Bộ quan sát được thiết kế theo giả thuyết
Giả sử ta có hệ thống:
⎧⎪ •
x = Ax + Bu + γω ω ,ν : nhiễu (3.150)
⎨
⎪⎩ y = Cx + ν
{ }
E ν .ω T = 0 ⇒ ν , ω độc lập nhau
Bộ quan sát có phương trình trạng thái:
⎧ xˆ = Axˆ + Bu + L( y − yˆ )
⎨ (3.151)
⎩ yˆ = Cxˆ
Trang 35
PGS.TS Nguyễn Thị Phương Hà Trang 36
u •
x = Α x + Bu + γω
y
y = Cx + Du + v
- +
+
B
+ ∫ C
+ ∧
y
~
x = x − xˆ ⇒ ~x = A~
x + γω − L(Cx + ν − Cxˆ )
⇒~ x = A~x + γω − L(C~x −ν ) (3.152)
⇒~
x = ( A − LC ) ~
x + γω − Lν
Lọc Kalman được xây dựng trên cơ sở:xác định L sao cho kỳ vọng toán
{ }
E x T x cực tiểu.
⇒ L = PC T V −1 (3.153)
Trong đó P là nghiệm của phương trình Riccati
PAT + AP + γWγ T − PC T V −1CP = 0
W = E{w.wT } (3.154)
V = E{v.v }
T
http://www.khvt.com
Chương 3 : Điều khiển bền vững
•
u x = Ax + Bu + γω y
y = Cx
-
- +
B
+
∫ C
+ -
+
Kc
Điều khiển LQG là kết hợp điều khiển LQR với lọc Kalman .
Bước 1:Thiết kế điều khiển LQR=>KC
Bước 2:Thiết kế bộ lọc Kalman =>L
Biên độ của ma trận hàm truyền toàn phương H(jω) tại bất kỳ một tần số
jω nào, phụ thuộc vào hướng tín hiệu kích thích đầu vào.Biên độ của ma
trận hàm truyền H( jω ) được bao phía trên bởi giá trị suy biến cực đại, kí
hiệu σ ( H ( jω )) , phía dưới bởi giá trị suy biến cực tiểu của nó, kí hiệu
σ ( H ( jω )) . Chính vì vậy,chúng ta cần tính toán hai giá trị ràng buộc này.
Ví dụ: Biểu Đồ Bode Biên Độ Hệ MIMO:
Giả sử hệ thống đa biến:
Trang 37
PGS.TS Nguyễn Thị Phương Hà Trang 38
⎡− 1 − 2 0 0⎤ ⎡1 0⎤
⎢ 2 −1 0 0⎥⎥ ⎢0 0⎥⎥
x = ⎢ x+⎢ u = Ax + bu
⎢0 0 − 3 − 8⎥ ⎢0 1⎥
⎢ ⎥ ⎢ ⎥
⎣0 0 8 − 3⎦ ⎣0 0⎦ (3.155)
⎡1 0 0 0⎤
y=⎢ ⎥ x = Cx ,
⎣0 0 0 0 ⎦
có hàm truyền hệ MIMO 2 × 2 là:
H ( s ) = C ( sI − A) −1 B = N ( s ) D −1 ( s )
Với: D( s ) = s 4 + 8s 3 + 90s 2 + 176s + 165
⎡1 0⎤ 3 ⎡7 0⎤ 2 ⎡79 0 ⎤ ⎡73 0 ⎤
N ( s) = ⎢ ⎥ s + ⎢0 5⎥ s + ⎢ 0 15⎥ s + ⎢ 0 15⎥ .
⎣ 0 1 ⎦ ⎣ ⎦ ⎣ ⎦ ⎣ ⎦
Hàm H(s) là ma trận 2 × 2 , nó có hai giá trị suy biến. Chú ý rằng giá trị suy
biến là liên tục, ngọai trừ gía trị suy biến cực đại và cực tiểu. Những giá trị
suy biến có thể giao nhau , được minh chứng bằng hình học.
Hình 3.14 Biểu Đồ Bode Biên độ hệ MIMO của giá trị suy biến trong
miền tần số
Trong Malab dùng hàm sigma(H)
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Để minh họa sự khác biệt giữa đồ thị trị suy biến hệ MIMO và giản đồ
Bode hệ SISO riêng biệt, xét hệ thống sau. Hàm truyền của hệ thống này là
ma trận vuông có hạng 2. Hàm truyền hệ SISO riêng biệt trong hệ thống
vòng hở 2 ngõ vào/2 ngõ ra là:
14.8
H11 ( s ) =
s ( s + 0.0163)( s + 3.615)( s + 20.2)
− 36.9 s ( s + 2.237)[( s + 0.55) 2 + 2.49 2 ]
H12 ( s ) =
( s + 0.0163)( s + 1)( s + 3.615)( s + 20.2)[( s + 0.4225) 2 + 3.0632 ]
− 2.65s ( s + 2.573)( s − 2.283)
H 21 ( s) =
s( s + 0.0163)( s + 3.615)( s + 20.2)[(s + 0.4225) 2 + 3.0632 ]
− 0.79[( s + 0.139) 2 + 0.4462 ]
H 22 ( s ) =
( s + 0.0163)( s + 1)( s + 3.615)( s + 20.2)[( s + 0.4225) 2 + 3.0632 ]
Trang 39
PGS.TS Nguyễn Thị Phương Hà Trang 40
di d
e u + uG +
r G y
K̂
-
+
n
Lưu ý: Để liên hệ với phần lý thuyết điều khiển kinh điển, trong mục này ta
phân tích sơ đồ điều khiển hồi tiếp âm, với bộ điều khiển là K̂ ( K̂ = -K ở mô
hình hồi tiếp dương)
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Các quan hệ truyền đạt của hệ thống vòng kín được thể hiện qua các biểu
thức sau:
GKˆ GKˆ G 1
y= r− n+ di + d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ
Kˆ Kˆ GKˆ Kˆ
u= r− n− di − d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ
Kˆ Kˆ 1 Kˆ
uG = r− n+ di − d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ
1 1 G 1
e= r− n− di − d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ
Định nghĩa các hàm nhạy, hàm bù nhạy và độ lợi vòng như sau:
1
- Hàm nhạy : S =
1 + GKˆ
GKˆ
- Hàm bù nhạy : T =
1 + GKˆ
y = Tr − Tn + GSdi + Sd (3.156)
u = Kˆ Sr − Kˆ Sn − Td i − Kˆ Sd (3.157)
ˆ − KSn
uG = KSr ˆ + Sd − KSd
ˆ (3.158)
i
e = Sr − Sn − GSdi − Sd (3.159)
Từ (3.156) – (3.159), ta có thể rút ra các mục tiêu chất lượng của hệ thống
vòng kín.Từ phương trình (3.156) ta thấy rằng:
- Để giảm ảnh hưởng của nhiễu đầu ra d lên đầu ra y, hàm nhạy S cần phải
nhỏ.
Trang 41
PGS.TS Nguyễn Thị Phương Hà Trang 42
- Để giảm ảnh hưởng của nhiễu đo n lên đầu ra y, hàm bù nhạy T cần phải
nhỏ. Tương tự, từ phương trình (3.158), để làm giảm ảnh hưởng của nhiễu
đầu vào di, hàm nhạy S cần phải nhỏ.
Nhưng từ định nghĩa ,hàm nhạy và hàm bù nhạy có quan hệ ràng buộc như
sau:
S+T=1 (3.160)
Do đó, S và T không thể đồng thời nhỏ. Để giải quyết mâu thuẫn này,
người ta dựa vào đặc tính tần số của các tín hiệu nhiễu. Nhiễu tải d, di tập
trung chủ yếu ở vùng tần số thấp, còn nhiễu đo n tập trung chủ yếu ở vùng
tần số cao.
Như vậy, để hệ ít bị ảnh hưởng bởi d, thì S và GS cần phải nhỏ trong
vùng tần số mà d tập trung, cụ thể là vùng tần số thấp. Tương tự, điều kiện
để hệ ít nhạy đối với nhiễu di là |S| và | Kˆ S | nhỏ trong vùng tần số mà di tập
trung, cụ thể là vùng tần số thấp.
Ta có:
Suy ra:
1 1 1
≤ ≤ , nếu | GKˆ |>1
| GKˆ | +1 1 + GKˆ ˆ
| GK | −1
hay:
1 1
≤ S ≤ ,nếu L >1
L +1 L −1
Từ đó, ta thấy:
S <<1 ⇔ L >>1
http://www.khvt.com
Chương 3 : Điều khiển bền vững
G 1
GS = ≈
1 + GKˆ | Kˆ |
Kˆ 1
| Kˆ S | = ≈
1 + GKˆ G
Trang 43
PGS.TS Nguyễn Thị Phương Hà Trang 44
Để ý rằng, nếu |L| rất lớn thì |T| ≈ 1 và |S| ≈ 0. Do đó, từ (3.156) ta thấy
nếu như L( jω ) lớn ở trong một dải tần số rộng, thì nhiễu đo n cũng sẽ
truyền qua hệ thống trong vùng tần số đó, nghĩa là:
y= Tr − Tn + GSd i + Sd ≈ (r - n)
vì rằng nhiễu đo n tập trung chủ yếu ở vùng tần số cao. Hơn nữa, nếu độ lợi
vòng lớn ở ngoài vùng băng thông của G, nghĩa là L( jω ) >>1 trong khi
G ( jω ) <<1, thì có thể làm cho tín hiệu điều khiển quá lớn, gây bão hòa ở
cơ cấu chấp hành. Điều này có thể được lý giải từ (3.157) như sau:
1
u= Kˆ S (r − n − d ) − Td i ≈ (r − n − d ) − d i
|G|
Phương trình trên cho thấy nhiễu tải và nhiễu đo sẽ được khuyếch đại lên
khi mà vùng tần số mà nó tập trung vượt ra ngoài phạm vi băng thông của
1
G, vì đối với dải tần số mà G ( jω ) <<1 thì >>1.
G ( jω )
Tương tự, biên độ của bộ điều khiển, | K̂ |, không được quá lớn trong vùng
tần số mà độ lợi vòng nhỏ nhằm tránh làm bão hòa cơ cấu chấp hành. Vì lẽ
khi độ lợi vòng nhỏ ( L( jω ) <<1), thì
u= Kˆ S (r − n − d ) − Ti d i = Kˆ (r − n − d )
Do đó, một điều cần lưu ý khi thiết kế là | K̂ | không được lớn quá khi độ lợi
vòng nhỏ.
Từ những điều trình bày ở trên, ta tổng kết lại các ý tưởng thiết kế sau đây:
- Để đảm bảo mục tiêu chất lượng trong một vùng tần số nào đó, cụ thể là
vùng tần số thấp (0, ω l ), hệ thống cần phải có:
| GKˆ |<< 1 , | Kˆ |≤ M
http://www.khvt.com
Chương 3 : Điều khiển bền vững
L
log ω
ωc
ωl ωh
Hình 3.18: Độ lợi vòng và các ràng buộc tần số thấp và tần số cao.
Những điều phân tích trên đây là cơ sở cho một kỹ thuật thiết kế điều khiển:
đó là nắn dạng vòng (loop shaping). Mục tiêu nắn dạng vòng là tìm ra một
bộ điều khiển sao cho độ lợi vòng |L| tránh được các vùng giới hạn (xem
hình 3.18) chỉ định bởi các điều kiện về chất lượng và bền vững.
Trang 45
PGS.TS Nguyễn Thị Phương Hà Trang 46
Tập con đặc biệt của H∞ mà trong điều khiển bền vững rất được quan tâm là
tập hợp gồm các hàm G(s) thực - hữu tỷ (real-rational) thuộc H∞, tức là các
hàm hữu tỷ phức G(s)∈ H∞ với các hệ số là những số thực dạng
b0 + b1 s + " + bm s m
G ( s) =
1 + a1 s + " + an s n
trong đó ai,bj ∈ R, ký hiệu là RH∞.
Trong lý thuyết hàm phức, người ta chỉ ra được rằng: một hàm thực – hữu tỷ
G(s) bất kỳ sẽ thuộc RH∞ khi và chỉ khi
- lim G ( s ) < ∞ , hay G (∞) bị chặn (khi m≤n),được gọi là hàm hợp thức và
s →∞
- G(s) không có cực trên nửa kín mặt phẳng phức bên phải. Nói cách khác
G(s) không có điểm cực với Re(s) ≥ 0.Một hàm G(s) có tính chất như vậy
gọi là hàm bền.
Nếu hàm truyền hợp thức G(s) không những ở nửa hở bên phải mặt phẳng
phức bị chặn khi s → ∞ mà còn thỏa mãn (khi m<n)
lim | G ( s ) |= 0
s →∞
Chuẩn H∞ của một hệ thống SISO G(s) ∈ RH∞ được định nghĩa như sau:
G ∞
= sup { G ( jω ) } (3.161)
ω
http://www.khvt.com
Chương 3 : Điều khiển bền vững
−1 N
b. G = M (3.163)
c.∃ V, U ∈ RH∞ sao cho: + NU
MV =I (3.164)
Định nghĩa 2:
Nếu N , M
là phân tích coprime bên trái của G đồng thời thỏa:
∗ + MM
NN ∗=I (3.165)
thì được gọi là phân tích coprime bên trái chuẩn.
Một đối tượng G có thể có vô số phân tích coprime bên trái, nhưng chỉ có
một phân tích coprime bên trái chuẩn
Xác định phân tích coprime bên trái chuẩn
Phân tích coprime bên trái chuẩn có thể được xác định từ mô hình trạng thái
của G và nghiệm của phương trình Riccati. Giả sử A, B, C, D là mô hình
trạng thái của G, ký hiệu là:
⎡A B⎤
G=⎢ ⎥ (3.166)
⎣C D ⎦
trong đó: G ( s ) = C ( sI − A) −1 B + D . Để xác định phân tích coprime bên trái,
trước tiên ta cần phải tìm nghiệm của phương trình Riccati sau:
( A − BD∗ R −1C ) Z + Z ( A − BD∗ R −1C )∗ − ZC ∗ S −1CZ + B ( I − D∗ R −1 D) B ∗ = 0
(3.167)
trong đó R ≡ I + DD . Phương trình này có tên là Phương trình Riccati lọc
*
Trang 47
PGS.TS Nguyễn Thị Phương Hà Trang 48
trong đó Z là nghiệm xác định dương duy nhất của GFARE, R = I + DD∗ ,
và H = −( ZC ∗ + BD∗ ) R −1 .
Sai số mô hình phân tích coprime bên trái
Sau đây, ta định nghĩa sai số mô hình phân tích coprime bên trái. Giả sử G
là mô hình đối tượng, ( N , M
) là một phân tích coprime bên trái của G. Hệ
có sai số mô hình phân tích coprime bên trái chuẩn được định nghĩa như
sau:
+ Δ ) −1 ( N + Δ )
GΔ = ( M (3.169)
M N
trong đó ΔN, ΔM ∈ RH∞ là các hàm truyền chưa biết thể hiện phần sai số
trong mô hình danh định. Họ mô hình có sai số là một tập Gε định nghĩa
như sau:
{ + Δ ) −1 ( N + Δ ) :
Gε = ( M M N [ΔM , Δ N ] ∞
<ε } (3.170)
ΔN ΔM
+ -
N −1
M
+ +
Hình 3.19: Biểu diễn sai số mô hình phân tích coprime bên trái
Mục tiêu của điều khiển bền vững là tìm bộ điều khiển K ổn định hóa không
chỉ mô hình danh định G, mà cả họ mô hình Gε .
Ưu điểm của cách biểu diễn sai số mô hình trên đây so với biểu diễn sai số
cộng và sai số nhân là số cực không ổn định có thể thay đổi do tác động của
sai số mô hình
http://www.khvt.com
Chương 3 : Điều khiển bền vững
ΔN ΔM
+
u +
w N −1
M
+ +
+
K + d
y
Hình 3.20: Sơ đồ phân tích ổn định bền vững với mô hình có sai số LCF
Định lý 3.4:
⎡K ⎤ −1
b. ⎢ ⎥ ( I − GK ) −1 M ≤γ (3.171)
⎣I⎦ ∞
Định lý 3.4 có thể phát biểu một cách tương đương dưới dạng một bài toán
tối ưu như sau:
Định lý 3.5:
+ Δ ) −1 ( N + Δ ) , với
Đối tượng GΔ = ( M M N [ΔM ΔN ] ∞
< 1 γ , ổn định
Trang 49
PGS.TS Nguyễn Thị Phương Hà Trang 50
⎡K ⎤ −1
inf ⎢ ⎥ ( I − GK ) −1 M ≤γ (3.172)
K I
⎣ ⎦ ∞
trong đó infimum được thực hiện trong tất cả các bộ điều khiển K ổn định
hóa G.
trong đó ( N , M
) là phân tích coprime bên trái của G. Và theo định lý 3.4,
nếu tìm được bộ điều khiển K, thì K sẽ ổn định hóa đối tượng có sai số GΔ,
với Δ = [ Δ M Δ N ] ∞ < 1 γ .
Nếu phát biểu dưới dạng một bài toán tối ưu H∞ (đối với hệ thống hình 3.20)
thì ta có bài toán tối ưu H∞ như sau:
Bài toán tối ưu H∞
Tìm bộ điều khiển K (nếu tồn tại) ổn định hóa đối tượng danh định G và
cực tiểu hóa chuẩn H∞ sau đây:
⎡K ⎤ −1 −1
⎢ I ⎥ ( I − GK ) M (3.174)
⎣ ⎦ ∞
trong đó ( N , M
) là phân tích coprime bên trái của G.
Bài toán tối ưu H∞ phức tạp ở chỗ phải thực hiện cực tiểu hóa chuẩn (3.174)
trong điều kiện tồn tại bộ điều khiển K ổn định hóa hệ thống. Để giải quyết
vấn đề này, thông thường người ta giải bài toán ổn định bền vững với một
giá trị γ cho trước, rồi sau đó thực hiện quá trình lặp γ để tìm giá trị γmin.
Glover và McFarlane đã sử dụng bài toán mở rộng Nehari (Nehari
extension problem), và dạng phân tích coprime chuẩn của mô hình đối
tượng để tìm ra lời giải không gian trạng thái cho bài toán tối ưu H∞ mà
không cần phải thực hiện quá trình lặp γ để tìm γmin. Hơn nữa, từ cách tiếp
http://www.khvt.com
Chương 3 : Điều khiển bền vững
cận này, tác giả có thể tính được độ dự trữ ổn định cực đại εmax ( = 1 γ min )
một cách chính xác.
Phần sau đây chỉ trình bày một số kết quả chính mà Glover và McFarlane đã
thực hiện.
Định lý 3.6: Bộ điều khiển K ổn định hóa hệ thống và thỏa
⎡K ⎤ −1 −1
⎢ I ⎥ ( I − GK ) M ≤γ (3.175)
⎣ ⎦ ∞
nếu và chỉ nếu K có một phân tích coprime bên phải: K = UV −1 với U, V ∈
RH∞ thỏa
⎡ − N ∗ ⎤ ⎡U ⎤
≤ (1 − γ −2 )
12
⎢ ∗ ⎥+⎢ ⎥ (3.176)
⎣ M ⎦ ⎣V ⎦ ∞
Định lý 3.7:
a. Lời giải tối ưu của bài toán ổn định bền vững đối với mô hình phân tích
coprime bên trái chuẩn cho kết quả:
{ }
−1 2
⎡K ⎤ −1
2
inf ⎢ ⎥ ( I − GK ) −1 M = 1 − ⎣⎡ N ⎤
M ⎦ (3.177)
K
⎣I⎦ ∞
H
trong đó infimum được thực hiện trong tất cả các bộ điều khiển ổn định hóa
hệ thống.
b. Độ dự trữ ổn định cực đại là
{ }
2 −1 2
ε max = 1 − ⎡⎣ N ⎤
M ⎦ >0 (3.178)
H
⎡ − N ∗ ⎤ ⎡U ⎤
⎢ ∗ ⎥+⎢ ⎥ = ⎡⎣ N ⎤
M ⎦ (3.179)
⎣ M ⎦ ⎣V ⎦ ∞
H
Trang 51
PGS.TS Nguyễn Thị Phương Hà Trang 52
- Việc xác định bộ điều khiển tối ưu H∞ có thể được thực hiện thông qua bài
toán mở rộng Nehari (Nehari extension).
Bài toán tối ưu con
Độ dự trữ ổn định cực đại cho ta một cận dưới của γ, đó là γmin = 1/εmax.
Việc giải bài toán tối ưu H∞ với γ > γmin cho kết quả là một tập các bộ điều
khiển ổn định hóa K sao cho
⎡K ⎤ −1 −1
⎢ I ⎥ ( I − GK ) M ≤γ (3.180)
⎣ ⎦ ∞
Đây chính là bài toán tối ưu con (suboptimal problem). Lời giải dạng không
gian trạng thái của bài toán này được xác định theo các bước như sau :
Bước 1: Giải hai phương trình Riccati GCARE và GFARE.
Phương trình GCARE (Generalized Control Algebraic Riccati Equation)
có dạng:
( A − BS −1 D∗C )∗ X + X ( A − BS −1 D∗C ) − XBS −1 B ∗ X + C ∗ ( I − DS −1 D∗ )C = 0
(3.181)
trong đó: S = I + D ∗ D .
Phương trình GFARE là phương trình trình bày ở trên.
( A − BD∗ R −1C ) Z + Z ( A − BD∗ R −1C )∗ − ZC ∗ S −1CZ + B ( I − D∗ R −1 D) B ∗ = 0
trong đó R = I + DD ∗ .
Bước 2: Tính giá trị γ nhỏ nhất có thể đạt được.
γ min = (1 + λmax ( ZX ))1 2
trong đó λmax ( • ) là trị riêng lớn nhất, X và Z lần lượt là nghiệm của
GCARE và GFARE.
Bước 3: Chọn γ > γ min . Thông thường, chọn γ lớn hơn γmin một chút; chẳng
hạn, γ = 1.05γ min .
Bước 4: Bộ điều khiển trung tâm có biểu diễn trạng thái được xác định như
sau
http://www.khvt.com
Chương 3 : Điều khiển bền vững
⎡ A + BF + γ 2W1∗−1 ZC ∗ (C + DF ) γ 2W1∗−1 ZC ∗ ⎤
K0 = ⎢ ⎥ (3.182)
⎣⎢ B∗ X − D∗ ⎦⎥
trong đó X và Z là lần lượt là nghiệm của các phương trình GCARE và
GFARE,
F = − S −1 ( D∗C + B ∗ X ) , và W1 = I + ( XZ − γ 2 I ) .
Công thức tính γ min ở bước 2 được dẫn ra từ công thức (3.177) trong định lý
3.7. Nếu ( N , M
) coprime bên trái chuẩn thì ⎡ N M
⎣
⎤
⎦ có thể được
H
xác định từ nghiệm của hai phương trình Riccati GCARE và GFARE như
sau:
= λmax ( XZ ( I + ZX ) −1 )
2
⎡⎣ N ⎤
M ⎦ (3.183)
H
Trang 53
PGS.TS Nguyễn Thị Phương Hà Trang 54
Nếu γ min quá lớn thì trở về bước 1. (Thông thường 1< γ min <5 thì chấp nhận
được)
Bước 3: Chọn γ > γ min , tổng hợp bộ điều khiển K ∞ sao cho
⎡K ∞ ⎤ ~
−1
⎢ I ⎥( I − Gs K ∞ ) M s
−1
≤γ
⎣ ⎦ ∞
K = W1 K ∞ W2
http://www.khvt.com
Chương 3 : Điều khiển bền vững
W1 G W2
Gs
W1 G W2
K∞
W1 K∞ W2
Nhận xét:
-Khác với phương pháp thiết kế nắn dạng vòng cổ điển (nắn dạng hàm S
và T), ở đây ta không cần quan tâm đến tính ổn định vòng kín, cũng như
thông tin về pha của đối tượng danh định, vì điều kiện ổn định nội đã được
đảm bảo trong bài toán ổn định bền vững H ∞ ở bước 3.
- Thủ tục thiết kế sử dụng thích hợp cho các đối tượng ổn định, không ổn
định, cực tiểu pha, không cực tiểu pha; đối tượng chỉ cần thỏa mãn yêu cầu
tối thiểu cho mọi thiết kế là không có các chế độ ẩn. Cụ thể là nếu đối tượng
Trang 55
PGS.TS Nguyễn Thị Phương Hà Trang 56
không cực tiểu pha thì các hạn chế về chất lượng điều khiển vẫn thể hiện
trong thủ tục thiết kế quả giá trị của γ min .
3.3.4.2 Sơ đồ điều khiển:
Trên đây ta chỉ quan tâm đến vòng điều khiển, không quan tâm đến vị trí
tín hiệu đặt được đưa vào vòng điều khiển như thế nào. Thông thường, tín
hiệu đặt đưa vào vòng điều khiển như hình 3.22 với hồi tiếp đơn vị.
+ y
r K G
-
+
r W2 K∞ W1 G
- y
Hình 3.23: Sơ đồ điều khiển hồi tiếp đơn vị với bộ điều khiển đạt được
từ LDSP
http://www.khvt.com
Chương 3 : Điều khiển bền vững
K ∞ (0)W2 (0) W1 G
r y
+
K∞ W2
Hình 3.24: Sơ đồ điều khiển cải tiến với bộ điều khiển đạt được từ
LDSP
Khi tín hiệu đặt được đưa vào hệ thống tại vị trí giữa hai khối K ∞ và W1, ta
cần bổ sung một bộ tiền bổ chính để đảm bảo độ lợi tĩnh bằng 1 (hình 3.24).
Hàm truyền vòng kín từ tín hiệu đặt r đến đầu ra y trở thành:
G ( s )W1 ( s )
y(s)= K ∞ (0)W2 (0)r ( s ) (3.184)
1 − G ( s) K ( s)
trong đó:
K ∞ (0)W2 (0) = lim K ∞ ( s )Ws ( s ) (3.185)
s →0
Theo kinh nghiệm, điều khiển theo sơ đồ hình 3.24 sẽ cho đáp ứng quá độ
tốt hơn; điều khiển theo sơ đồ hồi tiếp đơn vị như hình 3.23 thường cho đáp
ứng quá độ, có độ vọt lố lớn. Nguyên nhân là trong sơ đồ 3.24 tín hiệu đặt
không trực tiếp kích thích đặc tính động của K ∞ . Theo thủ tục thiết kế
LSDP, K ∞ lại được xác định qua lại bài toán ổn định bền vững, trong đó ta
không thể trực tiếp can thiệp vào vị trí điểm cực – zero được, mà mọi đặc
tính mong muốn ta chỉ có thể đưa vào hệ thống thông qua các hàm nắn dạng
W1 và W2.
3.3.4.3 Lựa chọn các hàm nắn dạng W1,W2:
Việc lựa chọn các hàm nắn dạng trong thủ tục thiết kế LSDP nói chung là
dựa vào kinh nghiệm của người thiết kế. Tuy nhiên, đối với từng đối tượng
cụ thể, người ta thường đưa ra các hướng chọn hàm nắn dạng thích hợp.
Trang 57
PGS.TS Nguyễn Thị Phương Hà Trang 58
Thông thường, W2 được chọn có dạng ma trận đường chéo với các phần tử
trên đường chéo là các hằng số nhằm đặt trọng số lên các tín hiệu ra của đối
tượng. W1 thường là tích của hai thành phần: WP và WA; trong đó, WA là bộ
tách kênh (decoupler), WP có dạng đường chéo được chọn sao cho thỏa hiệp
các mục tiêu chất lượng và ổn định bền vững của hệ thống, và thường có
chứa khâu tích phân để đảm bảo sai số xác lập bằng 0.
Đối với hệ SISO, việc lựa chọn các hàm nắn dạng đơn giản hơn: W2 thường
được chọn bằng 1, và W1 được chọn sao cho thỏa hiệp được các mục tiêu
chất lượng và ổn định bền vững của hệ thống.
~
Ở đây ta ký hiệu H ( jω ) =HT(- jω )
Ta có :
+∞
1 ~
H 2
= trace ∫
2Π −∞
H ( jω ) H ( jω )dω (3.189)
Gọi là chuẩn H2 của hệ thống .Nếu nhiễu trắng w có mật độ W = I thì trị
trung bình của ngõ ra toàn phương E{ y T (t ) y (t )} tương đương với bình
phương của chuẩn H2 của hệ thống
http://www.khvt.com
Chương 3 : Điều khiển bền vững
3.4.2 Tối ưu H2
Vấn đề tối ưu H2 được thể hiện dưới dạng ma trận chuyển đổi. Chúng ta giả
sử rằng Q = I, và R = I, phiếm hàm chất lượng LQG là
lim E[ z T (t ) z (t ) + u T (t )u (t )] (3.190)
t →∞
Sự giả sử này không làm mất đi tính tổng quát bởi vì bằng cách biến đổi
thang tỷ lệ các thông số z và u chỉ tiêu chất lượng luôn có thể chuyển thành
hình thức này .
Cho hệ thống vòng hở :
x = Ax + Bu + γw (3.191)
z = Dx (3.192)
y = Cx + v (3.193)
Có ma trận chuyển đổi
z = D( sI − A) −1 γ w + D( sI − A) −1 Bu (3.194)
G11 ( s ) G12 ( s )
y = C ( sI − A) −1 γ w + C ( sI − A) − 1Bu + v (3.195)
G21 ( s ) G22 ( s )
Kết nối hệ thống như hình (3.25) với một bộ điều khiển Ce chúng ta có cân
bằng của tín hiệu :
u w
z
Ce G
-
+ v
y +
Hình 3.25 : Hệ thống hồi tiếp với ngõ vào và ngõ ra nhiễu loạn
u = −C e y = −C e (G21 w + G22 u + v)
u = − ( I + C e G22 ) −1 C e G21 w− ( I + C e G22 ) −1 C e v (3.196)
H 21 ( s ) H 22 ( s )
Từ z = G11 w + G12 u ta có :
Trang 59
PGS.TS Nguyễn Thị Phương Hà Trang 60
H11 ( s ) H12 ( s )
Hay
⎡ z ⎤ ⎡ H 11 ( s ) H 12 ( s ) ⎤ ⎡ w⎤
⎢u ⎥ = ⎢ H ( s ) H ( s )⎥ ⎢ v ⎥ (3.198)
⎣ ⎦ ⎣ 21
22
⎦ ⎣ ⎦
H (s)
Từ (3.198) theo ta có :
T
⎡ z (t ) ⎤ ⎡ z (t ) ⎤
lim E ( z (t ) z (t ) + u (t )u (t )) = lim E ( ⎢
T T
⎥ ⎢ ⎥)
t →∞ t →∞
⎣u (t )⎦ ⎣u (t )⎦
+∞
1 ~
= trace
2π ∫ H ( jω )H ( jω )dω
−∞
(3.199)
2
= H 2
Vì vậy giải quyết vấn đề LQG là cực tiểu hoá chuẩn H2 của hệ thống vòng
kín hình (3.25) với (w,v) như ngõ vào và (z,u) như ngõ ra.
Cấu hình của hình (3.25) là trường hợp đặc biệt của cấu hình hình (3.26).Ở
hình (3.26)v là ngõ vào mở rộng (w và v trong hình (3.25)).Tín hiệu z là tín
hiệu sai số (lý tưởng bằng 0)(z và u trong hình (3.25)).Thêm vào đó u là ngõ
vào điều khiển và y là ngõ ra quan sát .G là đối tượng tổng quát và Ce là bộ
điều khiển .
v z
G
u y
Ce
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Đầu tiên, xem xét lời giải với hồi tiếp trạng thái .Khảo sát hai phương trình :
x (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (3.204)
Trang 61
PGS.TS Nguyễn Thị Phương Hà Trang 62
⎡ I ⎤ ⎡ z (t ) ⎤
E{z T (t ) z (t )} = E ⎡⎣ z0T (t ) u T (t ) ⎤⎦ ⎢ T ⎥ [ I D12 ] ⎢ 0 ⎥
⎣ D12 ⎦ ⎣ u (t ) ⎦
(3.207)
⎡ I D12 ⎤ ⎡ z0 (t ) ⎤
= E ⎡⎣ z0T (t ) u T (t ) ⎤⎦ ⎢ T T ⎥⎢ ⎥
⎣ D12 D12 D12 ⎦ ⎣ u (t ) ⎦
Đây là vấn đề bộ điều chỉnh tuyến tính với thành phần chéo ở ngõ ra và ngõ
vào .Nó có lời giải nếu hệ thống x (t ) = Ax(t ) + B 2 u (t ) , z 0 (t ) = C1 x(t ) là ổn
định và tìm được, ma trận trọng lượng
⎡ I D12 ⎤
⎢DT (3.208)
⎣ 12 D12T D12 ⎥⎦
Là xác định dương. Điều kiện cần và đủ cho (3.208) là D12T D12 không suy
biến .Lời giải của vấn đề điều chỉnh là luật hồi tiếp trạng thái:
u (t ) = − Kx(t ) (3.209)
Nếu trạng thái là không có giá trị cho hồi tiếp thì cần được ước lượng với
một bộ lọc Kalman. Xem xét hai phương trình :
x (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (3.210)
y (t ) = C 2 x(t ) + D21v(t ) + D22 u (t ) (3.211)
Phương trình thứ hai có thể trở thành dạng chuẩn cho bộ lọc Kalman nếu
coi y(t) – D22u(t) như là biến quan sát hơn là y(t).Nếu biểu thị nhiễu sự quan
sát là v (t ) = D21v(t ) thì :
x (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (3.212)
y (t ) − D22 u (t ) = C 2 x(t ) + v (t ) (3.213)
Xác định một hệ thống nhiễu với những thành phần nhiễu tương quan chéo
chúng ta có:
⎡ v(t + τ ) ⎤ T
E⎢
v (t + τ ) ⎥[ ] ⎡ I ⎤
v (t ) v T (t ) = E ⎢
D ⎥ v(t + τ )v (t ) I
T
[ T
D21 ]
⎣ ⎦ ⎣ 21 ⎦
(3.214)
⎡ I D21T
⎤
=⎢ T ⎥
δ (τ )
⎣ D21 D21 D21 ⎦
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Dưới những giả sử này bộ điều khiển hồi tiếp ngõ ra tối ưu là
xˆ (t ) = Axˆ (t ) + B 2 u (t ) + L[ y (t ) − C 2 xˆ (t ) − D22 u (t )] (3.221)
u (t ) = − Kxˆ (t ) (3.222)
Ma trận độ lợi hồi tiếp trạng thái và bộ quan sát là :
K = ( D12T D12 ) −1 ( B2T X + D12T C1 ) , L = (YC2T + B1 D21 T
)( D21 D21T −1
) (3.223)
Trang 63
PGS.TS Nguyễn Thị Phương Hà Trang 64
Ma trận đối xứng X,Y là nghiệm xác định dương duy nhất của phương trình
đại số Riccati:
AT X + XA + C1T C1 − ( XB2 + C1T D12 )( D12T D12 ) −1 ( B2T X + D12T C1 ) = 0
T −1
AY + AY T + B1 B1T − (YC2T + B1 D21
T
)( D21 D21 ) (C 2Y + D21 B1T ) = 0
(3.224)
M=1 m=0.1
b=0.0036 k=0.091
⎧ x = Ax + Bu
⎨
⎩ y = Cx + Du
http://www.khvt.com
Chương 3 : Điều khiển bền vững
⎡ 0 1 0 0 ⎤
⎢ −k ⎡0⎤
⎢ −b k b ⎥⎥ ⎢0⎥
⎢ ⎥
A = ⎢⎢
m m m m⎥
; B=⎢ 0 ⎥
0 0 0 1 ⎥ ⎢ ⎥
⎢ ⎥
⎢ k b −k −b ⎥ ⎢1⎥
⎢⎣ M ⎣⎢ M ⎦⎥
M M M ⎥⎦
⎡1 0 0 0 ⎤ ⎡0⎤
C = ⎢⎢0 0 1 0 ⎥⎥ ; D = ⎢⎢0 ⎥⎥
⎢⎣0 0 0 0 ⎥⎦ ⎢⎣1 ⎥⎦
Từ sơ đồ khối trên, ta thấy rằng cấu trúc của bộ điều khiển LQG chính là bộ
điều khiển LQR kết hợp với bộ ước lượng Kalman và có xét đến nhiễu quá
trình w(k) và nhiễu đo lường v(k).
Phương trình Biến Trạng Thái của hệ rời rạc khi có xét đến nhiễu như sau:
⎧ x(k + 1) = Φx(k ) + Γu (k ) + w(k )
⎨
⎩ y (k ) = Cx(k ) + Du (k ) + v(k )
Trang 65
PGS.TS Nguyễn Thị Phương Hà Trang 66
Sơ đồ mô phỏng hệ thống:
http://www.khvt.com
Chương 3 : Điều khiển bền vững
2
x
1
0 θ x0
Trang 67
PGS.TS Nguyễn Thị Phương Hà Trang 68
trong đó:
dqi
q i =
dt
Mô hình biểu diễn trạng thái của đối tượng(n=3) có dạng như sau:
⎡0 0 0 0 1 0 0 0⎤ ⎡0⎤
⎢0 0 0 0 0 1 0 0⎥ ⎥ ⎢0⎥
⎢ ⎢ ⎥
⎢0 0 0 0 0 0 1 0⎥ ⎢0⎥
⎢ ⎥ ⎢ ⎥
0 0 0 0 0 0 0 1⎥ 0
x = ⎢ x + ⎢ ⎥T
⎢0 u12 u13 u14 0 0 0 0⎥ ⎢ u11 ⎥
⎢ ⎥ ⎢ ⎥
⎢0 u22 u23 u24 0 0 0 0⎥ ⎢u21 ⎥
⎢0 u32 u33 0 0 0 0⎥ ⎢u ⎥
⎢ 34
⎥ ⎢ 31 ⎥
⎢⎣ 0 u42 u43 u44 0 0 0 0 ⎥⎦ ⎢⎣u41 ⎥⎦
y = [l3 0 0 1 0 0 0 0] x
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Thông thường ,trước khi đưa mô hình vào sử dụng ,cần phải sửa đổi mô
hình dựa trên biểu đồ Bode.
990679.4792 (s+598.2) (s-598.2) (s+167.2) (s-167.2)
G ( s) = 2 2 2 2
(s+1e-006) (s + 11.44s + 1.309e004) (s + 34.86s + 1.215e005) (s + 93.16s + 8.678e005)
Ta sử dụng G(s) làm mô hình danh định và sử dụng thủ tục LSDP thiết kế
bộ điều khiển
Sơ đồ mô phỏng:
Trang 69
PGS.TS Nguyễn Thị Phương Hà Trang 70
W1, W2 Các hàm nắn dạng chỉ định trong thủ tục LSDP
Kinf Bộ điều khiển K ∞ đạt được sau bước 3 của thủ tục
LSDP.
Flexible Link Khối giả lập đối tượng điều khiển. Lẽ ra khối này
chỉ có một đầu vào – một đầu ra, nhưng phần hoạt
hình (animation) cần lấy trạng thái của đối tượng
để vẽ, nên khối này còn có các đầu ra phụ q
(chuyển vị nút) và Theta (góc quay của trục).
Disturbance Khối tạo nhiễu tải, phát tín hiệu có dạng hàm nấc
âm.
Noise Khối tạo nhiễu đo.
Load Nạp dữ liệu từ file loaddata.m để mô phỏng.
Design W1 (Raw) Kích hoạt công cụ hỗ trợ thiết kế sơ bộ hàm nắn
dạng W1.
Design W1 (Fine) Kích hoạt công cụ hỗ trợ thiết kế cho phép tinh
chỉnh hàm nắn dạng W1.
Plot G/W1/Gs/L/ST Khi nhấp kép chuột vào những khối này, Matlab sẽ
vẽ biểu đồ Bode các hàm tương ứng.
Info Hiển thị thông tin hệ thống lên Workspace.
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Công cụ này được sửa lại từ công cụ shapemag.m của MATLAB cho tiện sử
dụng với phần mô phỏng điều khiển trong luận án này. Design W1 (Raw) có
giao diện như sau:
Sử dụng: Người thiết kế chỉ định các điểm gãy (điểm chỉ định), các điểm
này sẽ tự động được nối với nhau bằng các đoạn thẳng tạo nên dạng chỉ
định, sau đó điền bậc mong muốn của W1 vào ô Bậc của W1, và nhấn nút
Xấp xỉ để MATLAB phát sinh W1. Sau khi có được W1, người thiết kế cần
phải tinh chỉnh lại hàm này bằng công cụ Design W1 (Fine).
Trang 71
PGS.TS Nguyễn Thị Phương Hà Trang 72
Design W1 (Fine)
Công cụ này được xây dựng dựa trên giao diện đồ họa của JF Whidborne và
SJ King. Design W1 (Fine) có thể được sử dụng độc lập, hoặc sử dụng để
tinh chỉnh dạng của W1 đạt được sau khi sử dụng Design W1 (Raw). Design
W1 (Fine) có giao diện như sau:
Sử dụng: Nếu Design W1 (Fine) được sử dụng độc lập, thì lúc khởi động W1
= 1; nếu được sử dụng sau Design W1 (Raw), thì W1 sẽ thừa kế kết quả đạt
được từ Design W1 (Raw). Người thiết kế có thể thêm/bớt cực-zero, dịch
chuyển cực-zero thêm/bớt khâu tích phân, hay thay đổi độ lợi của W1 bằng
các công cụ ở bên phải giao diện. Sau cùng, người thiết kế nhấn nút Tính
Kinf để tổng hợp bộ điều khiển. Hộp thoại xuất hiện sau khi nhấn nút Tính
http://www.khvt.com
Chương 3 : Điều khiển bền vững
Kinf cho biết thông tin về giá trị γ min đạt được, và đưa ra 3 lựa chọn cho
Nhấn nút Trở về để quay lại giao diện Design W1 (Fine) hiệu chỉnh W1.
Nhấn nút Đáp ứng nấc nếu muốn xem đáp ứng với đầu vào hàm nấc thang
đơn vị của đối tượng danh định. Nhấn nút Mô phỏng, kết quả thiết kế (Kinf,
W1) sẽ được chuyển vào Workspace để chạy mô phỏng.
Load
Khi nhấp kép chuột lên khối Load, Simulink sẽ gọi loaddata.m. Tệp này
chứa toàn bộ thông số thiết kế của hệ thống. Người thiết kế có thể đặt hàm
nắn dạng W1 vào tệp này nếu muốn thiết kế “bằng số”
Sau bước thiết kế, Kinf và W1 được nạp vào Workspace dưới dạng mô hình
Trang 73
PGS.TS Nguyễn Thị Phương Hà Trang 74
http://www.khvt.com
Chương 3 : Điều khiển bền vững
d(t)
+ n(t)
⎡0 1 0 ⎤ ⎡0 0 ⎤
⎢ ⎥ ⎡1 0 0⎤
x = ⎢0 − 3 0⎥ x + ⎢1 0⎥u , z = ⎢ x
⎢ ⎥
⎣ 0 0 1 ⎥⎦
⎢⎣0 0 0⎥⎦ ⎢⎣0 1⎥⎦
Và bộ điều khiển K(s)=2I2
a. Tìm độ lợi vòng đa biến GK(j ω )
b. Tìm hàm nhạy và hàm bù nhạy
c. Tìm hàm truyền vòng kín từ r(t) đến z(t) và các cực của vòng
kín
14. Thiết kế LQG dùng Matlab mô phỏng mô hình con lắc ngược
Trang 75
Chương 4 : Điều khiển mờ
Chương 4
ĐIỀU KHIỂN MỜ
Khái niệm về logic mờ được giáo sư L.A Zadeh đưa ra lần đầu tiên năm
1965, tại trường Đại học Berkeley, bang California - Mỹ. Từ đó lý thuyết
mờ đã được phát triển và ứng dụng rộng rãi.
Năm 1970 tại trường Mary Queen, London – Anh, Ebrahim Mamdani đã
dùng logic mờ để điều khiển một máy hơi nước mà ông không thể điều khiển
được bằng kỹ thuật cổ điển. Tại Đức Hann Zimmermann đã dùng logic mờ
cho các hệ ra quyết định. Tại Nhật logic mờ được ứng dụng vào nhà máy xử
lý nước của Fuji Electronic vào 1983, hệ thống xe điện ngầm của Hitachi
vào 1987.
Lý thuyết mờ ra đời ở Mỹ, ứng dụng đầu tiên ở Anh nhưng phát triển mạnh
mẽ nhất là ở Nhật. Trong lĩnh vực Tự động hoá logic mờ ngày càng được
ứng dụng rộng rãi. Nó thực sự hữu dụng với các đối tượng phức tạp mà ta
chưa biết rõ hàm truyền, logic mờ có thể giải quyết các vấn đề mà điều
khiển kinh điển không làm được.
μF(x) : B → [0 1]
trong đó : μF gọi là hàm thuộc , B gọi là tập nền.
MXĐ
Hình 4.1:
• Độ cao tập mờ F là giá trị h = SupμF(x), trong đó supμF(x) chỉ giá trị nhỏ
nhất trong tất cả các chặn trên của hàm μF(x).
• Miền xác định của tập mờ F, ký hiệu là S là tập con thoả mãn :
S = SuppμF(x) = { x∈B | μF(x) > 0 }
• Miền tin cậy của tập mờ F, ký hiệu là T là tập con thoả mãn :
T = { x∈B | μF(x) = 1 }
• Các dạng hàm thuộc (membership function) trong logic mờ
Có rất nhiều dạng hàm thuộc như : Gaussian, PI-shape, S-shape, Sigmoidal,
Z-shape …
0.8
0.6
0.4
0.2
0.8
0.6
0.4
0.2
http://www.khvt.com
Chương 4 : Điều khiển mờ
Biến ngôn ngữ là phần tử chủ đạo trong các hệ thống dùng logic mờ. Ở đây
các thành phần ngôn ngữ của cùng một ngữ cảnh được kết hợp lại với nhau.
Để minh hoạ về hàm thuộc và biến ngôn ngữ ta xét ví dụ sau :
Xét tốc độ của một chiếc xe môtô, ta có thể phát biểu xe đang chạy:
- Rất chậm (VS)
- Chậm (S)
- Trung bình (M)
- Nhanh (F)
- Rất nhanh (VF)
Những phát biểu như vậy gọi là biến ngôn ngữ của tập mờ. Gọi x là giá trị
của biến tốc độ, ví dụ x =10km/h, x = 60km/h … Hàm thuộc tương ứng của
các biến ngôn ngữ trên được ký hiệu là :
μVS(x), μS(x), μM(x), μF(x), μVF(x)
μ
VS S M F VF
1
0.75
0.25
0 20 40 60 65 80 100 tốc độ
Hình 4.2:
Như vậy biến tốc độ có hai miền giá trị :
- Miền các giá trị ngôn ngữ :
N = { rất chậm, chậm, trung bình, nhanh, rất nhanh }
- Miền các giá trị vật lý :
V = { x∈B | x ≥ 0 }
Biến tốc độ được xác định trên miền ngôn ngữ N được gọi là biến ngôn ngữ.
Với mỗi x∈B ta có hàm thuộc :
x → μX = { μVS(x), μS(x), μM(x), μF(x), μVF(x) }
Ví dụ hàm thuộc tại giá trị rõ x=65km/h là :
μX(65) = { 0;0;0.75;0.25;0 }
Trang 3
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com
Chương 4 : Điều khiển mờ
Trang 5
PGS.TS Nguyễn Thị Phương Hà
4.1.6. Giải mờ
Giải mờ là quá trình xác định giá trị rõ ở đầu ra từ hàm thuộc μB’(y) của
tập mờ B’. Có 2 phương pháp giải mờ :
1. Phương pháp cực đại
Các bước thực hiện :
- Xác định miền chứa giá trị y’, y’ là giá trị mà tại đó μB’(y) đạt Max
G = { y∈Y | μB’(y) = H }
- Xác định y’ theo một trong 3 cách sau :
+ Nguyên lý trung bình
+ Nguyên lý cận trái
+ Nguyên lý cận phải
μ
G
y1 y2
Hình 4.3:
y1 + y 2
• Nguyên lý trung bình : y’ =
2
• Nguyên lý cận trái : chọn y’ = y1
• Nguyên lý cận phải : chọn y’ = y2
2. Phương pháp trọng tâm
Điểm y’ được xác định là hoành độ của điểm trọng tâm miền được bao bởi
trục hoành và đường μB’(y).
Công thức xác định :
∫ yμ ( y)dy
S
y’ = trong đó S là miền xác định của tập mờ B’
∫ μ (y)dy
S
http://www.khvt.com
Chương 4 : Điều khiển mờ
⎛ m ⎞ m m
∫S ⎜⎝ y∑
k =1
μ B 'k ( y ) ⎟dy
⎠
∑ ( yμ B 'k ( y)dy ) ∑M k
y’ = = k =1
= k =1
(4.1)
m m ⎛ ⎞ m
trong đó Mi = ∫ yμ
S
B 'k ( y )dy và Ai = ∫ μ B 'k ( y )dy
S
i=1,2,…,m
m1 m2 y
a b
Xét riêng cho trường hợp các hàm thuộc dạng hình thang như hình trên :
H
Mk = (3m22 − 3m12 + b 2 − a 2 + 3m2 b + 3m1 a)
6
H
Ak = (2m2 – 2m1 + a + b)
2
Chú ý hai công thức trên có thể áp dụng cả cho luật Max-Min
♦ Phương pháp độ cao
Từ công thức (4.1), nếu các hàm thuộc có dạng Singleton thì ta được:
m
∑y k Hk
y’ = k =1
m
với Hk = μB’k(yk)
∑H
k =1
k
Trang 7
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com
Chương 4 : Điều khiển mờ
1 1
0.7 0.75
0.3 0.35
0 4 10 0 60 100
R1 If … Then…
H1
X y’
Rn If … Then …
Hn
Hình 4.4:
Trang 9
PGS.TS Nguyễn Thị Phương Hà
X e u y
BĐK MỜ ĐỐI TƯỢNG
THIẾT BỊ ĐO
Hình 4.5:
http://www.khvt.com
Chương 4 : Điều khiển mờ
Dùng điều khiển mờ để điều khiển hệ thống bơm xả nước tự động. Hệ thống
sẽ duy trì độ cao bồn nước ở một giá trị đặt trước như mô hình bên dưới.
♦Mô hình :
Ba bộ điều khiển mờ (control) sẽ điều khiển : bơm, van1, van2 sao cho mực
nước ở 2 bồn đạt giá trị đặt trước (set).
♦Sơ đồ simulink:
Trang 11
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com
Chương 4 : Điều khiển mờ
Trang 13
PGS.TS Nguyễn Thị Phương Hà
DE Khối controller1
ERROR DB DM ZR IM IB
NB OF OF NC
NM OS
ZR OF OS NC CS CF
PM CS
PB NC CF CF
DE Khối controller2
ERROR DB DM ZR IM IB
NB CF CF NC
NM CS
ZR CF CS NC OS OF
PM OS
PB NC OF OF
+ Khối “control3”
Đây là khối điều tiết lưu lượng cho bồn 2, ta đưa ra mức ưu tiên như sau :
Khi sai lệch bồn 1 lớn thì van2 sẽ điều tiết để sai lệch này nhỏ rồi mới đến
bồn 2.
If error1=NB and de1=DB Then control=CF
If error1=NB and de1=DM Then control=CS
If error1=NB and de1=ZR Then control=CS
If error1=NM and de1=DB Then control=CS
http://www.khvt.com
Chương 4 : Điều khiển mờ
Trang 15
PGS.TS Nguyễn Thị Phương Hà
z (m)
Có thể nói trong lĩnh vực điều khiển, bộ PID được xem như một giải pháp
đa năng cho các ứng dụng điều khiển Analog cũng như Digital. Việc thiết kế
bộ PID kinh điển thường dựa trên phương pháp Zeigler-Nichols, Offerein,
Reinish … Ngày nay người ta thường dùng kỹ thuật hiệu chỉnh PID mềm
(dựa trên phầm mềm), đây chính là cơ sở của thiết kế PID mờ hay PID thích
nghi.
Hình 4.6:
http://www.khvt.com
Chương 4 : Điều khiển mờ
BỘ CHỈNH
ĐỊNH MỜ
de
dt THIẾT BỊ
CHỈNH ĐỊNH
x e u y
BĐK PID ĐỐI TƯỢNG
Hình 4.7
a1 thời gian
+ Lân cận a1 ta cần luật ĐK mạnh để rút ngắn thời gian lên, do vậy chọn: KP
lớn, KD nhỏ và KI nhỏ.
Trang 17
PGS.TS Nguyễn Thị Phương Hà
+ Lân cận b1 ta tránh vọt lố lớn nên chọn: KP nhỏ, KD lớn, KI nhỏ.
+ Lân cận c1 và d1 giống như lân cận a1 và b1.
ET
0
-12 -8 -4 0 4 8 12 C
http://www.khvt.com
Chương 4 : Điều khiển mờ
μ
N31 N21 N11 ZE1 P11 P21 P31
DET
0
-0.6 -0.4 -0.2 0 0.2 0.4 0.6 C/s
μ
Z S M L U
KD
0 0.25 0.5 0.75 1 KP
μ
L1 L2 L3 L4 L5
Trang 19
PGS.TS Nguyễn Thị Phương Hà
KP DET
N31 N21 N11 ZE1 P11 P21 P31
N3 U U U U U U U
N2 L L L L L L L
N1 M M M M M M M
ET ZE Z Z Z Z Z Z Z
P1 M M M M M M M
P2 L L L L L L L
P3 U U U U U U U
http://www.khvt.com
Chương 4 : Điều khiển mờ
Tham số
PID mờ
t (s)
Trang 21
PGS.TS Nguyễn Thị Phương Hà
4.4. Hệ mờ lai
Hệ mờ lai (Fuzzy Hybrid) là một hệ thống điều khiển tự động trong đó thiết
bị điều khiển bao gồm: phần điều khiển kinh điển và phần hệ mờ
Bộ tiền
BỘ ĐK ĐỐI TƯỢNG
Xử lý mờ
Hình 4.8
2. Hệ mờ lai cascade
Δu
BĐK MỜ
x BĐK + u y
KINH ĐIỂN ĐỐI TƯỢNG
Hình 4.9
3. Công tắc mờ
Điều khiển hệ thống theo kiểu chuyển đổi khâu điều khiển có tham số đòi
hỏi thiết bị điều khiển phải chứa đựng tất cả các cấu trúc và tham số khác
nhau cho từng trường hợp. Hệ thống sẽ tự chọn khâu điều khiển có tham số
phù hợp với đối tượng.
x y
Bộ điều khiển 1 Đối tượng
u
Hình 4.10
http://www.khvt.com
Chương 4 : Điều khiển mờ
Đối tượng
x E + 1 -Δu y
Bộ mờ KR + G(s)
Δx TI s Δu
DE
Sử dụng Simulink kết hợp với toolbox FIS Editor của Matlab để mô phỏng
hệ thống trên.
Đáp ứng hệ thống khi không có bộ mờ:
Trang 23
PGS.TS Nguyễn Thị Phương Hà
Thử với các giá trị Δu và K khác nhau cho thấy đặc tính động của hệ sẽ xấu
đi khi vùng chết rộng hoặc hệ số khuếch đại lớn. Để hiệu chỉnh đặc tính
động của hệ thống ta đưa vào bộ lọc mờ như hình vẽ ở trên.
Xây dựng luật điều khiển với 2 đầu vào và một đầu ra như sau:
DE
Δx NB NS ZE PS PB
NB NB NS
NS NS NS NS ZE
E ZE NB NS ZE PS PB
PS PS PS PS PS
PB PB PS PB
Tất cả 18 luật có khuôn dạng như sau:
Nếu E = x1 và DE = x2 Thì Δx = x3
Trong đó x1, x2, x3 ∈ {NB, NS, ZE, PS, PB}
μ μ
NB NS ZE PS PB NB NS ZE PS PB
-1 0 1 E -1 0 1 Δx
-20 0 20 DE
http://www.khvt.com
Chương 4 : Điều khiển mờ
Từ hai đồ thị trên ta thấy được bộ mờ đã cải thiện rất tốt đặc tính động của
hệ thống. Thử với nhiều Δu khác nhau ta sẽ thấy đáp ứng hầu như không
phụ thuộc vào Δu .
Nhân Axon
X Bộ y
tổng
trong đó θ là ngưỡng kích hoạt nơron, wk là các trọng số, f là hàm kích hoạt.
Trang 25
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com
Chương 4 : Điều khiển mờ
∂G
w(k + 1) = w(k ) − μ , trong đó μ >0 là hằng số tỷ lệ học.
∂ω
Mạng MLP là một giải pháp hữu hiệu cho việc mô hình hoá, đặc biệt với
quá trình phức tạp hoặc cơ chế chưa rõ ràng. Nó không đòi hỏi phải biết
trước dạng hoặc tham số.
2. Mạng RBF (Radial basis functions)
Biểu diễn toán học của RBF
N −1
F ( x ) = C 0 + ∑ C k ϕ ( x − Rk )
k =0
Hình 4.12
Nhận dạng thông số chính là quá trình luyện mạng. Tín hiệu sai số
e= y−~y là cơ sở cho luyện mạng, Δ là thời gian trễ.
2. Điều khiển sử dụng mạng nơron
Ta có nhiều cấu trúc điều khiển sử dụng mạng nơron như:
Trang 27
PGS.TS Nguyễn Thị Phương Hà
Mô hình yd
tham chiếu e
r e BĐK bằng u y
ĐTĐK
mạng nơron
( )
1
2 −
S k = x − Ck +ρ 2
k
2
, với k = 1, 2, 3,…N
Tâm Ck ∈ Rn và độ rộng ρk ∈ Rn được biết trước. Ta viết lại (4.5) như sau:
x = Ax + W * S ( x) + V * S ( x)u
Vậy mô hình của đối tượng có thể được mô tả bằng phương trình:
http://www.khvt.com
Chương 4 : Điều khiển mờ
~
x = A~x + WS ( x) + VS ( x)u
trong đó W ∈ R , V ∈ Rn x N là các ma trận ước lượng của W*, V*, ~
nxN
x ∈Rn
là ước lượng trạng thái của x. Gọi
xe = ~ x − x , We = W*-W, Ve = V*-V
Phương trình sai số ước lượng sẽ là :
x e = Axe + We S ( x) + Ve S ( x)u (4.6)
Thuật toán nhận dạng sử dụng hàm Lyapunov:
1 T 1 1
L( x e , We ,Ve ) = xe Pxe + Tr (WeT We ) + Tr (VeT Ve ) (4.7)
2 2 2
với P là ma trận đối xứng xác định dương. Có thể xác định ma trận Q đối
xứng xác định dương thoả phương trình Lyapunov sau:
PA+ATP = - Q.
Thay (4.6) vào (4.7) và lấy đạo hàm ta được:
1 1 1
L = xeT (PA + AT P) xe + S T ( x)WeT Pxe + S T ( x)VeT Pxeu + Tr(WeT We ) + Tr(VeT Ve )
2 2 2
Chọn : Tr (W W ) = − S ( x)W Px
T
e e
T T
e e (4.8)
Tr (V Ve ) = − S ( x)V Pxe u
e
T T
e
T
(4.9)
1
thì : L ( xe ,We , Ve ) = − xeT Qxe (4.10)
2
Do các ma trận W* và V* là ma trận hằng nên từ (4.8), (4.9) ta suy ra thuật
nhận dạng mô hình như sau:
n
W ij = − S j ∑ Pik xek
k =1
n
Vij = − S j ∑ Pik xek u
k =1
Trang 29
PGS.TS Nguyễn Thị Phương Hà
W = − pS x
ij j ei
V = − pS x u
ij j ei
q
Từ phương trình Lyapunov rút ra : p = >0.
2a
Để hội tụ đến trọng số thực, hệ động lực phải có đủ giàu thông tin ở đầu
vào. Vì thế đa số đầu vào được chọn ngẫu nhiên.
http://www.khvt.com
Chương 4 : Điều khiển mờ
• Giới thiệu
Thuật toán di truyền là thuật toán tối ưu ngẫu nhiên dựa trên cơ chế chọn lọc
tự nhiên và tiến hóa di truyền. Nguyên lý cơ bản của thuật toán di truyền đã
được Holland giới thiệu vào năm 1962. Cơ sở toán học đã được phát triển từ
cuối những năm 1960 và đã được giới thiệu trong quyển sách đầu tiên của
Holland, Adaptive in Natural and Artificial Systems. Thuật toán di truyền
được ứng dụng đầu tiên trong hai lĩnh vực chính: tối ưu hóa và học tập của
máy. Trong lĩnh vực tối ưu hóa thuật toán di truyền được phát triển nhanh
chóng và ứng dụng trong nhiều lĩnh vực khác nhau như tối ưu hàm, xử lý
ảnh, bài toán hành trình người bán hàng, nhận dạng hệ thống và điều khiển.
Thuật toán di truyền cũng như các thuật toán tiến hóa nói chung, hình thành
dựa trên quan niệm cho rằng, quá trình tiến hóa tự nhiên là quá trình hoàn
hảo nhất, hợp lý nhất và tự nó đã mang tính tối ưu. Quan niệm này có thể
xem như một tiên đề đúng, không chứng minh được, nhưng phù hợp với
thực tế khách quan. Quá trình tiến hóa thể hiện tính tối ưu ở chỗ, thế hệ sau
bao giờ cũng tốt hơn (phát triển hơn, hoàn thiện hơn) thế hệ trước bởi tính
kế thừa và đấu tranh sinh tồn.
Trang 31
PGS.TS Nguyễn Thị Phương Hà
- Tính độ thích nghi fi, i=1÷ n của mỗi nhiễm sắc thể trong quần thể hiện
hành,với n là kích thước của quần thể (số nhiễm sắc thể trong quần thể).
n
- Tìm tổng giá trị thích nghi toàn quần thể: F = ∑ f i
i =1
fi
- Tính xác suất chọn pi cho mỗi nhiễm sắc thể: pi =
F
i
- Tính vị trí xác suất qi của mỗi nhiễm sắc thể: qi = ∑ p j
j =1
Tiến trình chọn lọc được thực hiện bằng cách quay bánh xe roulette n lần,
mỗi lần chọn một nhiễm sắc thể từ quần thể hiện hành vào quần thể mới
theo cách sau:
- Phát sinh ngẫu nhiên một số r (quay bánh xe roulette) trong khoảng
[0÷1]
- Nếu r < q1 thì chọn nhiễm sắc thể đầu tiên; ngược lại thì chọn nhiễm
sắc thể thứ i sao cho qi-1 < r ≤ qi
Ví dụ 4.5.6:
Xem xét dân số có 6 nhiễm sắc thể với giá trị tổng thích nghi toàn quần thể
là 50 (bảng 1), bánh xe roulette trong hình 4.14. Bây giờ ta quay bánh xe
roulette 6 lần, mỗi lần chọn một nhiễm sắc thể cho quần thể mới. Giá trị
ngẫu nhiên của 6 số trong khoảng [0÷1] và các nhiễm sắc thể tương ứng
được chọn được cho trong bảng 2.
Chuổi mã Trị thích nghi Xác suất chọn Vị trí xác suất
Nhiễm sắc hóa f(i) pI qi
thể
1 01110 8 0.16 0.16
2 11000 15 0.3 0.46
3 00100 2 0.04 0.5
4 10010 5 0.1 0.6
5 01100 12 0.24 0.84
6 00011 8 0.16 1
Bảng 1: Các nhiễm sắc thể và các giá trị thích nghi
http://www.khvt.com
Chương 4 : Điều khiển mờ
6 1
5
2
4 3
Trang 33
PGS.TS Nguyễn Thị Phương Hà
- Ghép đôi các nhiễm sắc thể đã chọn được một cách ngẫu nhiên, đối với
mỗi cặp nhiễm sắc thể được ghép đôi, ta phát sinh ngẫu nhiên một số
nguyên pos trong khoảng [0÷m-1] (m là tổng chiều dài của một nhiễm
sắc thể - tổng số gen). Số pos cho biết vị trí của điểm lai. Điều này được
minh họa như sau:
Vị trí lai
b1b2…bposbpos+1…bm
c1c2…cposcpos+1…cm
- Chuyển đổi các gen nằm sau vị trí lai.
b1b2…bposcpos+1…cm
c1c2…cposbpos+1…bm
Như vậy phép lai này tạo ra hai chuỗi mới, mỗi chuổi đều được thừa hưởng
những đặc tính lấy từ cha và mẹ của chúng. Mặc dù phép lai ghép sử dụng
lựa chọn ngẫu nhiên, nhưng nó không được xem như là một lối đi ngẫu
nhiên qua không gian tìm kiếm. Sự kết hợp giữa tái sinh và lai ghép làm cho
thuật toán di truyền hướng việc tìm kiếm đến những vùng tốt hơn.
http://www.khvt.com
Chương 4 : Điều khiển mờ
kiếm ngẫu nhiên, với tỷ lệ đột biến cao, thuật toán di truyền sẽ còn xấu hơn
phương pháp tìm kiếm ngẫu nhiên.
Sau quá trình tái sinh, lai và đột biến, quần thể mới tiếp tục được tính toán
các giá trị thích nghi, sự tính toán này được dùng để xây dựng phân bố xác
suất (cho tiến trình tái sinh tiếp theo), nghĩa là, để xây dựng lại bánh xe
roulette với các rãnh được định kích thước theo các giá trị thích nghi hiện
hành. Phần còn lại của thuật toán di truyền chỉ là sự lặp lại chu trình của
những bước trên.
Trang 35
PGS.TS Nguyễn Thị Phương Hà
u x y
b c
Đối tượng ĐK
f(y)
BĐK mờ
Hình 4.15: Cấu trúc hệ SISO
… …
α x1 x2 xN+1 x2N+1 β y
Hình 4.16: Hàm thuộc của BĐK
http://www.khvt.com
Chương 4 : Điều khiển mờ
∑
2 N +1
yμ Ak ( y )
u = − f ( y) = − k =1
∑
2 N +1
k =1
μ A ( y)
k
Trang 37
PGS.TS Nguyễn Thị Phương Hà
⎧≤ 0 → l k = 1,2,..., N k
⎪
⎨= 0 → l k = N k + 1
l1 ...l m
y k (4.14)
⎪≥ 0 → l = N + 2,...,2 N + 1
⎩ k k k
• Bước 3: Chọn luật hợp thành tích, giải mờ theo phương pháp trung bình
trọng số, ta được luật điều khiển:
với k=1,2,…,m.
[ ]
T
J = x T (T ) Mx(T ) + ∫ x T (t )Qx(t ) + u T (t ) Ru (t ) dt (4.17)
0
n×n n×n
với M ∈ R ,Q∈R , R ∈ Rm × m là các ma trận xác định dương.
Ta xác định u(t) dạng như (4.15), với u(t) = (u1,u2,…,um)T
∏
n
i =1
μ A ( xi )
li
bl ( x) = i
(4.19)
∑ ...∑ (∏i =1 μ Ali ( xi ))
2 N1 +1 2 N n +1 n
l1 =1 ln =1 i
http://www.khvt.com
Chương 4 : Điều khiển mờ
[
Θ = − Θ1T ,−Θ T2 ,...,−Θ Tm ]T
(4.20)
với Θ Tk ∈ R 1× N chứa N thông số y kl1 ...ln , có bậc giống như bl(x). Ta viết lại tín
hiệu điều khiển mờ dạng u = (u1,u2,..,um)T = (-f1(x),…,-fn(x))T như sau:
u = Θb(x) (4.21)
Giờ ta giả sử Θ = Θ(t). Thay (4.21) vào (4.16) và (4.17) ta được :
x (t ) = Ax(t ) + BΘ(t )b[x(t )] (4.22)
và hàm chỉ tiêu chất lượng là :
[ ]
T
J = x (T ) Mx(T ) + ∫ x T (t )Qx(t ) + b T ( x(t ))Θ T (t ) RΘ(t )b( x(t )) dt
T
(4.23)
0
Vì vậy vấn đề cần giải quyết bây giờ là xác định Θ(t) tối ưu để cự tiểu hoá J.
Xét hàm Hamilton:
H ( x, Θ, p) = x T Qx + b T ( x)Θ T RΘb( x) + p T [ Ax + BΘb( x)] (4.24)
∂H
Ta có: = 2 RΘb( x)b T ( x) + B T pb T ( x) = 0
∂Θ
1
Suy ra : Θ = − R −1 B T pb T ( x)[b( x)b T ( x)]−1 (4.25)
2
Thay (4.25) vào (4.24) ta được:
H ∗ ( x, p ) = x T Qx + p T Ax + [α 2 ( x) − α ( x)] p T BR −1 B T p (4.26)
1 T
trong đó: α ( x) = b ( x)[b( x)b T ( x)]−1 b( x) (4.27)
2
Áp dụng nguyên lý cực tiểu Pontryagin ta được:
∂H ∗
x = = Ax + 2[α 2 ( x) − α ( x)]BR −1 B T p (4.28)
∂p
∂H ∗ ∂α ( x) T
p = − = −2Qx − AT p − [2α ( x) − 1] p BR −1 B T p (4.29)
∂x ∂x
Giải hai phương trình vi phân (4.27) và (4.28) ta sẽ được x*(t) và p*(t), từ đó
ta xác định được:
1
Θ ∗ (t ) = − R −1 B T p ∗ (t )b T ( x ∗ (t ))[b( x ∗ (t ))b T ( x ∗ (t ))]−1 (4.30)
2
Trang 39
PGS.TS Nguyễn Thị Phương Hà
Và bộ mờ tối ưu sẽ là:
u ∗ = Θ ∗ (t )b( x) (4.31)
Các bước để thiết kế BĐK mờ tối ưu:
• Bước 1: Xác định hàm thuộc μ Ali ( xi ) , với li = 1,2,…,2Ni+1 và I = 1,…,n.
i
r u
O θ
Hình 4.17
Thiết kế BĐK mờ để điều khiển quả bóng di chuyển từ điểm gốc O đến mục
tiêu (vị trí đặt) cách O khoảng r. Chọn biến trạng thái như sau:
x = (r , r,θ ,θ) T = ( x , x , x , x ) T và y = r = x1
1 2 3 4
ip
http://www.khvt.com
Chương 4 : Điều khiển mờ
mục tiêu
điều khiển
Đối tượng
Bộ ĐK mờ
Bộ ĐK giám sát
Hình 4.18
Trang 41
PGS.TS Nguyễn Thị Phương Hà
Giả sử |x(t)| ≤ Mx, ∀x với Mx = const. Khi thêm bộ giám sát thì tín hiệu điều
khiển hệ thống sẽ là:
u = ufuzz(x) + I*us(x) (4.33)
trong đó I* = 1 nếu |x(t)| ≥ Mx, I* = 0 nếu |x(t)| < Mx. Ta cần thiết kế bộ
giám sát us(t).
Thay (4.33) vào (4.32) ta được:
x(n) = f(x) + g(x)ufuzz(x) + g(x)I*us(x) (4.34)
U U
Giả sử ta luôn xác định được hai hàm f (x) và gL(x) sao cho |f(x)| ≤ f (x) và
0 < gL(x) ≤ g(x).
Đặt : u∗ =
1
g ( x)
[
− f ( x) − k T x ] (4.35)
⎡ 0 1 0 0 ... 0 0 ⎤
⎢ 0 0 1 0 ... 0 0 ⎥⎥
⎢
Đặt A = ⎢ ... ... ... ... ... ... ... ⎥
⎢ ⎥
⎢ 0 00 0 0 ... 0 1 ⎥
⎢⎣− k n − k n −1 ... ... ... − k 2 − k1 ⎥⎦
⎡0⎤
⎢...⎥
b=⎢ ⎥
⎢0⎥
⎢ ⎥
⎣g ⎦
Viết (4.36) dạng véctơ :
x = Ax + b[u fuzz − u ∗ + I ∗ u s ] (4.37)
1 T
Xét hàm Lyapunov : V = x Px (4.38)
2
Trong đó P là ma trận đối xứng xác định dương thoả phương trình
Lyapunov : AT P + PA = −Q (4.39)
Từ (4.37), (4.39) và xét trường hợp |x| ≥ Mx , ta có:
http://www.khvt.com
Chương 4 : Điều khiển mờ
1
V = − x T Qx + x T Pb[u fuzz − u ∗ + u s ] ≤ x T Pb ( u fuzz + u ∗ ) + x T Pbu s (4.40)
2
Ta cần tìm us để V ≤ 0 , kết hợp phương trình trên với (4.6.25) ta đựơc:
⎡ 1 ⎤
u s = − sign( x T Pb) ⎢ ( f U + k T x ) + u fuzz ⎥ (4.41)
⎣ gL ⎦
Thay (4.41) vào (4.40) ta sẽ được V ≤ 0 .
• Ví dụ (4.6.1.4)
Thiết kế hệ thống có bộ giám sát để giữ cân bằng cho con lắc ngược.
Mô hình:
θ = x 2
θ=x1
l
mgsinθ
mc u
Hình 4.19
Trang 43
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com
Chương 4 : Điều khiển mờ
Trang 45
PGS.TS Nguyễn Thị Phương Hà
Với luật điều khiển như vậy, hệ thống sẽ ổn định theo tiêu chuẩn Lyapunov,
lúc này mọi quỹ đạo trạng thái của hệ thống bên ngoài mặt trượt sẽ được
đưa về mặt trượt và duy trì một cách bền vững.
x2= x
S=0
x1
http://www.khvt.com
Chương 4 : Điều khiển mờ
ra của hệ thống.
Mục tiêu của điều khiển là xác định luật điều khiển u để ngõ ra của hệ thống
bám theo quỹ đạo mong muốn yd(t) với sai số nhỏ nhất.
Luật điều khiển u gồm 2 thành phần:
u = ueq + us (4.56)
Thành phần ueq được thiết kế như sau:
u eq (t ) =
gˆ
[
1 ˆ
]
− f ( X , t ) + yd (t ) − λe , (λ>0) (4.57)
u s (t ) ≥
1
gˆ
[α ( F ( X , t ) + η ) + (α − 1) u eq (t ) ] (4.58)
g1
α=
g0
Luật điều khiển mờ được thiết kế như sau:
⎧⎪u − (t ), → S < 0
u (t ) = ⎨ + (4.59)
⎪⎩u (t ), → S > 0
Trong đó:
[
u − (t ) = u eq (t ) + kgˆ −1 α ( F ( X , t ) + η ) + (α − 1) u eq (t ) ]
u + (t ) = u eq (t ) − kgˆ −1 [α ( F ( X , t ) + η ) + (α − 1) u eq (t ) ] (4.60)
(k ≥ 1)
Trang 47
PGS.TS Nguyễn Thị Phương Hà
∑ β (S )u (t )i
i
u (t ) = i =1
r
(4.62)
∑ β (S )
i =1
i
Với r : số luật mờ
n
β i (S ) = ∏ μ A (S ) i
j
j =1
Mô hình:
Hình 4.22 minh hoạ một hệ thống nâng vật bằng từ trường, từ trường được
tạo ra từ cuộn dây quấn quanh lõi thép, cuộn dây nhận áp điều khiển u.
http://www.khvt.com
Chương 4 : Điều khiển mờ
⎪m = mg − C ⎜ ⎟
⎩ dt ⎝h⎠
Trong đó:
h : vị trí hòn bi (m)
v : vận tốc hòn bi (m/s)
i : dòng điện qua cuộn dây (A)
u : điện áp cung cấp cho cuộn dây (V)
R, L : điện trở và điện cảm cuộn dây (Ω, H)
C : hằng số lực từ (Nm2/A2)
m : khối lượng hòn bi (Kg)
g : gia tốc trọng trường. (m/s2)
Điện cảm của cuộn dây là một hàm phi tuyến phụ thuộc vào vị trí của hòn bi
2C
L(h) = L1 + (4.64)
h
L1 là điện cảm của cuộn dây khi hòn bi ở rất xa.
Chọn biến trạng thái như sau:
Trang 49
PGS.TS Nguyễn Thị Phương Hà
x1 = h, x2 = v, x3 = i (4.65)
Véctơ trạng thái của hệ thống X = (x1, x2, x3)T
Từ (4.63), (4.64) và (4.65) ta được phương trình trạng thái:
⎧
⎪
⎪ x1 = x 2
⎪ 2
⎪ C ⎛ x3 ⎞
⎨ x 2 = g − ⎜⎜ ⎟⎟ (4.66)
⎪ m ⎝ x1 ⎠
⎪ ⎛ ⎞
⎪ x 3 = R x3 + 2C ⎜ x 2 x3 ⎟ + 1 u
⎪⎩ L L ⎜⎝ x12 ⎟⎠ L
Điểm cân bằng của hệ thống là nghiệm của hệ (x1 = 0, x 2 = 0, x 3 = 0)
gm
Giải ra được Xb = [x1b, 0, x3b ]T , với x3b = x1b
C
Gọi Xd = [ x1d, x2d, x3d ]T là véctơ trạng thái mong muốn.
Mục tiêu của hệ thống là đưa X tiến về Xd với sai số nhỏ nhất.
http://www.khvt.com
Chương 4 : Điều khiển mờ
Đặt
⎧ 2 C
⎪g ( z) = − ( g − z 3 )u
⎪ L( z1 + x1d ) m
⎨ (4.69)
⎪ f ( z ) = 2( g − z ) ⎡ z 2 ⎛⎜1 − 2C ⎞ R⎤
⎟⎟ + ⎥
⎪ 3 ⎢ ⎜
⎩ ⎣ z1 + x1d ⎝ L( z1 + x1d ) ⎠ L ⎦
Từ (4.68) và (4.69) ta được mô hình động học của hệ thống trong hệ toạ độ
mới như sau:
⎧ z 1 = z 2
⎪
⎨ z 2 = z 3 (4.70)
⎪ z = f ( z ) + g ( z )u
⎩ 3
Ngõ ra của hệ thống trong hệ tọa độ mới là:
e = z1 = x1 − x1d (4.71)
Trang 51
PGS.TS Nguyễn Thị Phương Hà
1
u= [− f ( z ) − a1 z 3 − a0 z 2 − Wsign( z 3 + a1 z 2 + a0 z1 )] (4.78)
g ( z)
Thay (4.78) vào (4.77) ta được:
S = −Wsign( z 3 + a1 z 2 + a 0 z1 ) = −Wsign( S ) (4.79)
Nếu chọn W là hằng số dương thì ta sẽ được SS < 0 . Do vậy biến trạng thái
Z sẽ hội tụ về zero khi t → ∞ thoả yêu cầu đề ra.
Ta có thể viết lại mặt trượt S dưới dạng hàm của x1, x2, x3 như sau:
2
C⎛x ⎞
S = g − ⎜⎜ 3 ⎟⎟ + a1 x 2 + a 0 ( x1 − x1d ) (4.80)
m ⎝ x1 ⎠
Và luật điều khiển u là:
1⎡ ⎛ C ⎛ x3 ⎞ ⎞⎟ ⎛ ⎞⎤
2 2
C ⎛ x3 ⎞
u = ⎢− f1 − a1 g − ⎜⎜ ⎟⎟ − a0 x2 − Wsign g − ⎜⎜ ⎟⎟ + a1x2 + a0 ( x1 − x1d ) ⎟⎥
⎜ ⎜
g1 ⎢ ⎜ m ⎝ x1 ⎠ ⎟ ⎜ m ⎝ x1 ⎠ ⎟⎥
⎣ ⎝ ⎠ ⎝ ⎠⎦
(4.81)
Hình 4.23: Vị trí và áp điều khiển khi tín hiệu đặt biến thiên
http://www.khvt.com
Chương 4 : Điều khiển mờ
1 ⎡ ⎛ C⎛x ⎞ ⎞
2
⎤
u= ⎢− f1 − a1 ⎜ g − ⎜ 3 ⎟ ⎟ − a0 x2 − Wsign(S )⎥
g1 ⎢ ⎜ m ⎜⎝ x1 ⎟⎠ ⎟ ⎥
⎣ ⎝ ⎠ ⎦
với S được xác định từ (4.80), f1 và g1 được xác định từ (4.73).
Do trong luật điều khiển có hàm sign nên gây ra hiện tượng dao động, để
khắc phục nhược điểm này ta thêm khâu xử lý mờ trong bộ điều khiển để
thay thế cho hàm sign.
Chọn luật điều khiển u = ueq + us , với:
1 ⎡ ⎛ C ⎛ x3 ⎞ ⎞⎟ ⎤
2
u eq = ⎜
⎢− f1 − a1 g − ⎜⎜ ⎟⎟ − a0 x 2 ⎥ (4.82)
g1 ⎢ ⎜ m ⎝ x1 ⎠ ⎟ ⎥
⎣ ⎝ ⎠ ⎦
Trang 53
PGS.TS Nguyễn Thị Phương Hà
∑β u i
i
u= i =1
5
(4.83)
∑β
i =1
i
http://www.khvt.com
Chương 4 : Điều khiển mờ
Trang 55
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com
Chương 4 : Điều khiển mờ
Kết luận
- Việc thêm BĐK mờ đã triệt tiêu hiện tượng dao động.
- Đáp ứng hệ thống tốt hơn.
- Chọn 5 tập mờ là thích hợp nhất khi xây dựng BĐK mờ.
Trang 57
PGS.TS Nguyễn Thị Phương Hà
r u y
Đối tượng
e
Bộ điều khiển mờ
θ
Luật thích nghi
Hình 4.32 θ = h(θ , e)
BĐK mờ
u I = [− fˆ ( x | θ f ) + y m( n ) + k T e] / gˆ ( x | θ g )
θf, θg
Luật thích nghi
Điều kiện
θ f = −γ 1e T Pbξ
ban đầu
θf(0), θg(0) θ = −γ e T Pbηu
g 2 I
http://www.khvt.com
Chương 4 : Điều khiển mờ
u∗ =
1
g ( x)
[− f ( x) + y m( n ) + k T e ] (4.89)
u = uI =
1
gˆ ( x | θ g )
[− fˆ ( x | θ f ) + y m( n ) + k T e ] (4.90)
Trang 59
PGS.TS Nguyễn Thị Phương Hà
∏
n
Xác định gˆ ( x | θ g ) từ i =1
q i luật dạng:
∑ ...∑ y (∏
p1 pn n
l1 ...l n
f μ A ( xi ))
li
fˆ ( x | θ f
l1 =1 l n =1 i =1
)= i
(4.91)
∑ ...∑ (∏ μ
p1 pn n
l1 =1 l n =1 i =1 Aili
( xi ))
∑ ...∑ y (∏
q1 qn n
l1 =1 l n =1
l1 ...l n
g i =1
μ B ( xi ))
li
gˆ ( x | θ g )= i
(4.92)
∑ ...∑ (∏ μ
q1 qn n
l1 =1 l n =1 i =1 B li
( xi ))
i
Cho thông số y lf1 ...ln và y gl1 ...ln tự do, vì thế ta có thể dồn vào θf và θg , ta viết
lại (4.91) và (4.92) như sau:
fˆ ( x | θ f ) = θ Tf ξ ( x) (4.93)
gˆ ( x | θ g ) = θ gTη ( x) (4.94)
∏ ∏
n n
trong đó ξ(x) lf véctơ i =1
pi chiều và η(x) là véctơ i =1
q i chiều, với
thành phần l1…ln được cho bởi:
∏ μ (x )
n
i =1 Aili i
ξ l ...l ( x) = (4.95)
∑ ...∑ (∏ μ
1 n p1 pn n
l1 =1 l n =1 i =1 Aili
( xi ))
∏ μ (x )
n
i =1 Bili i
η l ...l ( x) = (4.96)
∑ ...∑ (∏ μ
1 n q1 qn n
l1 =1 l n =1 i =1 Bili
( xi ))
http://www.khvt.com
Chương 4 : Điều khiển mờ
⎡ 0 1 0 0 ... 0 0 ⎤
⎢ 0 ⎡0⎤
⎢ 0 1 0 ... 0 0 ⎥⎥ ⎢...⎥
A = ⎢ ... ... ... ... ... ... ... ⎥, , b = ⎢ ⎥ (4.98)
⎢ ⎥ ⎢0⎥
⎢ 0 0 0 0 ... 0 1 ⎥ ⎢ ⎥
⎢⎣− k n ⎥ ⎣1⎦
− k n −1 ... ... ... ... − k1 ⎦
Ta viết lại (4.97) dạng véctơ:
{[ ] [
e = Ae + b fˆ ( x | θ f ) − f ( x) + gˆ ( x | θ g ) − g ( x) u I ] } (4.99)
Định nghĩa các thông số tối ưu như sau:
⎡ ⎤
θ ∗f = arg min ⎢⎢sup fˆ ( x | θ f ) − f ( x) ⎥ (4.100)
θ f ∈R ∏i =1
n
pi ⎣ X ∈R n ⎦⎥
⎡ ⎤
θ g∗ = arg min ⎢⎢sup gˆ ( x | θ g ) − g ( x) ⎥ (4.101)
θ g ∈R ∏i =1
n
qi ⎣ X ∈R n ⎦⎥
Đặt :
[ ] [
w = fˆ ( x | θ ∗f ) − f ( x) + gˆ ( x | θ g∗ ) − g ( x) u I ] (4.102)
Ta viết lại (4.99) như sau:
{[ ] [
e = Ae + b fˆ ( x | θ f ) − fˆ ( x | θ ∗f ) + gˆ ( x | θ g ) − gˆ ( x | θ g∗ ) u I + w ] } (4.103)
Thay (4.93) và (4.94) vào (4.102) ta được phương trình động học vòng kín
diễn tả mối liên hệ giữa sai số e và thông số θf và θg.
[
e = Ae + b (θ f − θ ∗f ) T ξ ( x) + (θ g −θ g∗ ) T η ( x)u I + w ] (4.104)
Ta cần tìm luật thích nghi để chỉnh định θf và θg sao cho cực tiểu hoá e,
θ f − θ ∗f , θ g − θ g∗ . Xét phương trình lyapunov:
1 T 1 1
V = e Pe + (θ f −θ ∗f ) T (θ f −θ ∗f ) + (θ g − θ g∗ ) T (θ g − θ g∗ ) (4.105)
2 2γ 1 2γ 2
với γ1 và γ2 là các hằng số dương, P thoả phương trình:
ATP + PA = - Q
với Q là ma trận n × n , xác định dương.
Lấy đạo hàm V dọc theo quỹ đạo hệ thống ta được:
Trang 61
PGS.TS Nguyễn Thị Phương Hà
1
2
1
[
V = − e T Pe + e T Pbw + (θ f − θ ∗f ) T θ f + γ 1e T Pbξ ( x)
γ1
]
+
1
γ2
[
(θ g − θ g∗ ) T θg + γ 2 e T Pbη ( x)u I ] (4.106)
http://www.khvt.com
Chương 4 : Điều khiển mờ
x2
-π/6 -π/12 0 π/12 π/6 x1
f(x1,x2) g(x1,x2)
x1 F11 F12 F13 F14 F15 x1 F11 F12 F13 F14 F15
x2 x2
F11 -8 -4 0 4 8 F11 1.26 1.36 1.46 1.36 1.26
F12 -8 -4 0 4 8 F12 1.26 1.36 1.46 1.36 1.26
F13 -8 -4 0 4 8 F13 1.26 1.36 1.46 1.36 1.26
F14 -8 -4 0 4 8 F14 1.26 1.36 1.46 1.36 1.26
F15 -8 -4 0 4 8 F15 1.26 1.36 1.46 1.36 1.26
Viết chương trình M-file hay dùng simulink của Matlab để mô phỏng kết
quả ví dụ trên.
BĐK MỜ
uD = θ Tξ(x)
θ
Điều kiện đầu LUẬT THÍCH NGHI
θ(0) θ = γe T p nξ (x)
Trang 63
PGS.TS Nguyễn Thị Phương Hà
∏
n
+ Bước 2: Xây dựng hệ mờ uD(x|θ) từ i =1
mi luật dạng:
∑ ...∑ y [∏
m1 mn n
l1 =1 l n =1
l1 ...l n
u i =1
μ A ( x i )]
li
uD (x | θ ) = i
(4.113)
∑ ...∑ [∏ μ
m1 mn n
l1 =1 l n =1 i =1 Aili
( x i )]
Chọn y ul1 ...ln như thông số có thể chỉnh định và ta đưa y ul1 ...ln vào thành phần
của véctơ thông số θ, từ đó luật điều khiển được xác định:
u D ( x | θ ) = θ T ξ ( x) (4.114)
3.Thiết kế luật thích nghi
Xem u* như là BĐK lý tưởng (4.89) trong phần (4.6.2.1), với g(x) = b, ta
được:
e ( n ) = − k T e + b[u ∗ − u D ( x | θ )] (4.115)
Ma trận A được định nghĩa như (4.98), b = (0,…,0,b)T, ta viết lại (4.115)
dạng véctơ như sau:
e = Ae + b[u ∗ − u D ( x | θ )] (4.116)
Định nghĩa thông số tối ưu θ* :
http://www.khvt.com
Chương 4 : Điều khiển mờ
Trang 65
PGS.TS Nguyễn Thị Phương Hà
COM
Vi xử lý PWM
Động cơ DC Encoder
(AT89C52)
Tốc độ thực y
Hình 4.35
http://www.khvt.com
Chương 4 : Điều khiển mờ
Mô hình gồm có :
1. Động cơ DC 14V, tốc độ Max 2100vòng/phút, làm việc không tải.
2. Cảm biến tốc độ Incremental 200xung/vòng.
3. Vi xử lý AT89C52, tấn số xung clock 11.059MHz, chu kỳ máy
12
TVXL = ( s ) , có nhiệm vụ đo tốc độ động cơ gửi về máy tính
11.059.000
điều khiển áp cấp cho động cơ bằng phương pháp PWM.
4. Chu kỳ PWM = 1024 × TVXL (≈1.1ms), chu kỳ lấy mẫu
46.080×TVXL (≈50ms), tốc độ port nối tiếp 19200Kbps.
ym − y
5. Hệ số thích nghi γ thay đổi tuỳ thuộc vào sai lệch ε = . Khi
ym
sai lệch ε≥1% thì γ = γ0, khi ε<1% thì γ = γ0/10, với γ0 đã chọn trước.
Trang 67
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com
Chương 4 : Điều khiển mờ
m1 m2
∑∑ θi, j .μ1i (x 1 ).μ 2j (x 2 )
i=1 j=1
u= (4.125)
m1 m2
∑∑ μ1i (x 1 ).μ 2j (x 2 )
i=1 j=1
Ghi chú : Trong các đồ thị bên dưới, đường liền nét là tốc độ mong muốn
ym đường còn lại là tốc độ thực.
2π
Trường hợp 1: Chọn γ0 = 0.5; y m = 1400 + 500 sin(
t ) , θi,j = 20, với
120
i = 1…m1, j = 1…m2. Các tập mờ cho bởi Hình 4.36 và Hình 4.37
Trang 69
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com
Chương 4 : Điều khiển mờ
Trang 71
PGS.TS Nguyễn Thị Phương Hà
2π
Trường hợp 2: γ0 = 0.5 ; y m = 1400 + 500 sin( t ) ( trường hợp 2a) và
30
2π
y m = 1400 + 500 sin( t ) (trường hợp 2b); θi,j = 20, với i = 1..5, j = 1..5.
60
Các tập mờ vẫn như trường hợp 1. (Xem kết quả ở Hình 4.39)
Nhận xét: Với cùng hệ số cập nhật và các giá trị ban đầu θI,j, khi tốc độ
mong muốn ym biến thiên nhanh hơn thì tốc độ thức y không bám theo kịp
dẫn đến sai số lớn. Do luật cập nhật phụ thuộc vào ym nên ta cần hiệu chỉnh
lại thông số γ0 cho phù hợp.
http://www.khvt.com
Chương 4 : Điều khiển mờ
2π
Trường hợp 3: θi,j = 20; với i =1..5, j = 1..5; y m = 1400 + 500 sin( t ) , các
60
tập mờ như Trường hợp 1, γ0 lần lượt là 0.2, 0.5, 0.8, 1.2.
Nhận xét:
Việc tăng γ0 sẽ làm cho luật cập nhật nhạy hơn với sai số, do vậy đáp
ứng hệ thống sẽ tốt hơn.
Tuy vậy ở tốc độ thấp, khi γ0 tăng sẽ làm cho tốc độ động cơ bị dao
động lớn hơn. Sự dao động tỷ lệ thuận với việc tăng γ0 .
Bằng kinh nghiệm qua các trường hợp đã xét ta thấy rằng đáp ứng tốc độ
phụ thuộc vào nhiều yếu tố như: số lượng tập mờ, hệ số γ0, θi,j, tốc độ biến
thiên của tốc độ mong muốn…Từ đó ta đưa ra việc lựa chọn các thông số
cho phù hợp để tối ưu đáp ứng của hệ thống.
2π
Trường hợp 4: γ0 = 2.5; y m = 1400 + 500 sin( t ) ; θi,j được chọn như bảng
60
bên dưới, sử dụng 7 tập mờ cho biến tốc độ và 5 tập mờ cho biến gia tốc.
Trang 73
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com
Chương 4 : Điều khiển mờ
Ngành điều khiển học đã ra đời và phát triển từ rất sớm, đặc biệt là trong 2
thập niên gần đây việc ứng dụng Lý thuyết mờ và Mạng nơron đã tạo ra
nhiều phương pháp điều khiển mới với đặc tính “linh hoạt” và “thông
minh” hơn. Công nghệ mờ và công nghệ mạng nơron là hai trụ cột chính để
tạo nên công nghệ tích hợp mới, công nghệ tính toán mềm (Soft computing).
4.7.1. Khái niệm
Một số phương pháp được sử dụng trong ngành điều khiển học:
Mỗi phương pháp đều có những điểm mạnh và hạn chế nhất định, vì vậy
người ta thường có xu hướng kết hợp chúng lại với nhau để tạo ra một mô
hình điều khiển có khả năng đáp ứng cao với các đòi hỏi thực tế. Việc kết
hợp này đã cho ra một phương pháp điều khiển mới đó là điều khiển tích
hợp.
Điều khiển tích hợp : Điều khiển kết hợp phương pháp kinh điển hoặc hiện
đại với phương pháp điều khiển thông minh.
Trang 75
PGS.TS Nguyễn Thị Phương Hà
4.7.3. Ứng dụng thuật toán GA thiết kế bộ điều khiển PID tối ưu H2/H∞
1. Mô tả bài toán
Dựa vào hai bài toán cực đại hóa độ dự trữ ổn định và cực tiểu hóa hàm
nhạy của điều khiển tối ưu H∞, bài toán thiết kế bộ điều khiển PID tối ưu
H2/H∞ được mô tả như sau.
Cho hệ thống điều khiển PID như trong hình 4.42. Mô hình P(s) của đối
tượng trong bài toán này được giả thiết là có một sai lệch Δ0(s) được biểu
diễn theo mô hình sai số nhân ở đầu ra.
r + e C(s) u y
[1+Δ0(s)] P0(s)
-
Hình 4.42: Hệ thống điều khiển PID với sai số nhân ở đầu ra
Bộ điều khiển PID có dạng như sau:
C (s ) = k 1 + k 2 / s + k 3 s
(4.127)
Sai số mô hình Δ0(s) được xem như ổn định nhưng không biết rõ ràng.Giả
sử Δ0(s) bị chặn như sau:
PO ( s )C ( s )δ O ( s )
<1 (4.129)
I + PO ( s )C ( s ) ∞
http://www.khvt.com
Chương 4 : Điều khiển mờ
thì hệ thống vòng kín trong hình 4.42 cũng ổn định dưới tác động của sai số
mô hình Δ0(s). Bất đẳng thức (4.129) chính là điều kiện ổn định bền vững
(chuẩn H∞) của hệ thống.
Trong đó chỉ tiêu chất lượng thường được sử dụng kết hợp với điều khiển
tối ưu H∞ là chỉ tiêu tích phân của bình phương sai lệch (ISE) hay còn gọi là
phiếm hàm H2:
∞
min ∫ e 2 (t )dt (4.130)
C
0
1
≤γ (4.131)
1 + P( s )C ( s ) ∞
với γ là một giá trị vô hướng nhỏ hơn 1. γ đặc trưng cho mức độ ảnh hưởng
của nhiễu tác động đến tín hiệu ra của hệ.
Để giảm ảnh hưởng của nhiễu trong dãy tần số mà nhiễu tập trung thì điều
kiện (4.131) trở thành:
W ( s)
≤γ (4.132)
1 + P( s )C ( s ) ∞
với W(s) là hàm trọng để giảm ảnh hưỡng của nhiễu trong dãy tần mà nhiễu
tập trung.
Như vậy, đối với bài toán cực tiểu hóa hàm nhạy, việc xác định BĐK PID
kết hợp với điều khiển tối ưu H2/H∞ là tìm bộ điều khiển PID sao cho cực
tiểu (4.130), đồng thời thỏa mãn ràng buộc ổn định bền vững (4.132).
2. Cơ sở thiết kế
Trang 77
PGS.TS Nguyễn Thị Phương Hà
Trong trường hợp bình thường đối với hệ danh định (không xét đến sai số
mô hình của đối tượng cũng như nhiễu d), tín hiệu sai số điều chỉnh E(s),
trong hệ thống hình 4.42 có dạng như sau:
R( s)
E ( s) = (4.133)
1 + P0 ( s )C ( s )
Theo định lý Parseval, chuẩn bậc hai của một tín hiệu x(t) và ảnh Fourier
X(jω) của nó có quan hệ như sau:
∞ ∞ 2
1
= ∫ x(t ) dt = ∫ X ( jω
2 2
x(t ) dω (4.134)
2
−∞
2π −∞
Vì vậy ta có:
∞
J = min ∫ e 2 (t )dt
C
0
∞
1
∫ E ( jω )
2
= dω
2π −∞
thay s = jω ta được:
j∞
1
k1 , k 2 , k3 2πj ∫
J = min E (− s ) E ( s )ds
− j∞
j∞
1 R (− s ) R( s )
= min
k1 , k 2 , k3 2πj ∫
− j∞
[1 + P ( − s )C ( − s )][(1 + P ( s )C ( s )]
ds
j∞
1 B( s ) B(− s )
= min
k1 , k 2 , k3 2πj ∫
− j∞
A( s ) A( − s )
ds (4.135)
m
A(s) và B(s) có thể được biểu diễn như sau: A( s ) = ∑ a k s k ,
k =0
m −1
B( s ) = ∑ bk s k ; phương trình (4.20) được viết lại như sau:
k =0
http://www.khvt.com
Chương 4 : Điều khiển mờ
⎛ m −1 k ⎞⎛ m −1 k ⎞
j∞ ⎜ ∑ bk s ⎟⎜ ∑ bk ( − s ) ⎟
1 ⎝ k =0 ⎠⎝ k =0 ⎠ ds (4.136)
2πj −∫j∞ ⎛ m
J m ( k1 , k 2 , k 3 ) =
⎞⎛ m
⎞
⎜ ∑ a k s k ⎟⎜ ∑ a k (− s ) k ⎟
⎝ k =0 ⎠⎝ k =0 ⎠
Việc xác định J trong (4.136) có thể được tính một cách đơn giản bằng lý
thuyết thặng dư như sau:
- Xác định tất cả các điểm cực pk của E(s).
- J = ∑ Re s E ( s ) E (− s )
pk
k
Giá trị của Jm(k1, k2, k3) có thể tìm được trong Newton, 1957.
b02
J 1 ( k1 , k 2 , k 3 ) =
2a 0 a1
b12 a0 + b02 a 2
J 2 ( k1 , k 2 , k 3 ) =
2a 0 a1 a 2
b32 (−a02a3 + a0a1a2 ) + (b22 − 2b1b3 )a0 a1a4 + (b12 − 2b0b2 )a0 a3a4 + b02 (−a1a42 + a2 a3a4 )
J4 =
2a0 a4 (−a0 a32 − a12 a4 + a1a2a3 )
với Jm(k1, k2, k3) là hàm số của các thông số PID (k1, k2, k3), và m là bậc của
đối tượng.
Từ định nghĩa chuẩn H∞:
A( s ) ∞
≡ sup A( jω ) (4.138)
ω∈( 0 ,∞ )
Điều kiện ổn định bền vững (4.129) được viết lại như sau:
Trang 79
PGS.TS Nguyễn Thị Phương Hà
P0 ( s )C ( s )δ 0 ( s ) P0 (− jω ) P0 ( jω )C (− jω )C ( jω )δ 0 (− jω )δ 0 ( jω )
= sup
1 + P( s) 0 C ( s) ∞
ω∈[ 0 ,∞ ) (1 + P0 (− jω )C (− jω ))(1 + P0 ( jω )C ( jω ))
β (ω ) β (ω )
= sup = sup <1 (4.139)
α (ω ) ω∈[ 0 , ∞ ) α (ω )
ω∈[ 0 ,∞ )
Với β(ω) và α(ω) là những đa thức thích hợp của ω. Ý nghĩa của (4.139) là
nếu giá trị lớn nhất của β(ω)/α(ω) nhỏ hơn 1, thì hệ thống trong hình 4.42
ổn định với mọi Δ 0 ( jω ) < δ 0 ( jω ) .
Việc quét ω trong [0,∞) để tìm giá trị lớn nhất của β(ω)/α(ω) trong (4.139)
không phải là công việc dễ dàng. Thực tế, giá trị lớn nhất của β(ω)/α(ω) chỉ
xảy ra ở những điểm thỏa mãn phương trình sau:
dβ (ω ) dα (ω )
α (ω ) − β (ω )
d β (ω ) dω dω = 0
= (4.1340)
dω α (ω ) α (ω )
2
Với kết quả trên, ràng buộc ổn định bền vững (4.129) tương đương với:
β (λ i )
max <1 (4.142)
λi α (λ i )
Từ sự phân tích trên, bài toán thiết kế bộ điều khiển PID, kết hợp H2/H∞ trở
thành bài toán xác định bộ điều khiển PID để cực tiểu (4.137) dưới ràng
buộc ổn định bền vững (4.142).
Tương tự như trên, đối với bài toán cực tiểu hóa hàm nhạy thì ràng buộc
(4.132) được chuyển đổi sang dạng (4.141) như sau:
β (λ i )
max ≤γ (4.143)
λi α (λ i )
http://www.khvt.com
Chương 4 : Điều khiển mờ
Vế phải của (4.144) là phiếm hàm H2 mà chúng ta muốn cực tiểu, hàm đánh
giá chỉ được xác định trong miền ổn định (D) của hệ thống.
Mục tiêu của chúng ta là tìm (k1, k2, k3) trong D để cực tiểu (4.144). Tương
ứng với mỗi nhiễm sắc thể ta sẽ có được một giá trị của hàm đánh giá
E(k1,k2, k3). Sau đó giá trị đánh giá được ánh xạ thành giá trị thích nghi
F(k1,k2, k3) để cho phù hợp với thuật toán di truyền (tìm kiếm giá trị cực
đại). Quá trình tìm kiếm giá trị nhỏ nhất của Jm(k1, k2, k3) tương ứng với quá
trình tìm kiếm giá trị lớn nhất của F(k1, k2, k3). Nhiễm sắc thể có Jm(k1, k2,k3)
nhỏ hơn sẽ có giá trị thích nghi lớn hơn. Sau mỗi thế hệ, thuật toán di truyền
sẽ tạo ra những con cháu tốt hơn, cải thiện giá trị thích nghi, do đó nếu độ
thích nghi của thuật toán di truyền tốt hơn thì sẽ tìm được một bộ điều khiển
PID tốt hơn. Vì vậy ta có:
1
F ( k1 , k 2 , k 3 ) ∝ (4.145)
E ( k1 , k 2 , k 3 )
Trang 81
PGS.TS Nguyễn Thị Phương Hà
Có một số phương pháp để thực hiện sự liên hệ giữa hàm đánh giá và hàm
thích nghi trong (4.145). Ở đây mối liên hệ giữa hàm thích nghi và hàm
đánh giá được biểu diễn như sau:
⎧ β (λ i )
⎪− E (k1 , k 2 , k 3 ) + b khi max <1
⎪ λi α (λi )
F ( k1 , k 2 , k 3 ) = ⎨ (4.146)
⎪0 β (λ i )
⎪ khi max ≥1
⎩
λi α (λi )
Ở đây dấu trừ được sử dụng để chuyển bài toán cực tiểu thành bài toán cực
đại, giá trị của b được chọn sao cho giá trị của hàm thích nghi luôn luôn
dương. Đối với các nhiễm sắc thể không thỏa mãn điều kiện (4.142) hoặc
(4.143), giá trị của hàm thích nghi sẽ được gán bằng 0 (giá trị nhỏ nhất), vì
vậy các nhiễm sắc thể này sẽ không tồn tại trong thế hệ sau.
3.3. Các bước thực hiện
Từ sự phân tích trên, quá trình thiết kế bao gồm các bước sau:
(1) Bước 1: Áp dụng tiêu chuẩn Routh Hurwitz, xác định điều kiện của các
hệ số PID để hệ thống vòng kín ổn định.
(2) Bước 2: Xác định miền ổn định (D) của ba thông số (k1, k2, k3).
(3) Bước 3: Thiết lập các thông số của thuật toán di truyền: xác suất lai, xác
suất đột biến, kích thước quần thể, số thế hệ tối đa, điều kiện dừng,…
(4) Bước 4: Khởi tạo quần thể, mã hóa nhiễm sắc thể.
(5) Bước 5: Tính λi từ phương trình (4.141).
(6) Bước 6: Tính giá trị thích nghi cho từng cá thể theo biểu thức (4.146).
(7) Bước 7: Thực hiện các phép toán di truyền.
(8) Bước 8: Kiểm tra điều kiện dừng, nếu điều kiện dừng chưa thỏa mãn thì
quay lại bước 5.
3.4. Giải thuật chương trình
Giải thuật chính của chương trình xác định các thông số của bộ điều khiển
PID tối ưu H2/H∞
http://www.khvt.com
Chương 4 : Điều khiển mờ
Baét ñaàu
i=1
j=1
total = fitness(1)
Y j = j+1
total<pointer
total = total+fitness(j)
N
i = i+1
N
i=pop_size?
Keát thuùc
Trang 83
PGS.TS Nguyễn Thị Phương Hà
Baét ñaàu
i=1
N
Thoûa xaùc suaát lai?
i=i+1
N i=pop_size?
Keát thuùc
http://www.khvt.com
Chương 4 : Điều khiển mờ
Baét ñaàu
i=1
j=1
Ñoät bieán
j=j+1
i=i+1
N i=pop_size?
Y
Keát thuùc
Trang 85
PGS.TS Nguyễn Thị Phương Hà
4. Ví dụ minh hoạ
Để thấy được kết quả của thuật toán thiết kế bộ điều khiển PID kết hợp với
điều khiển tối ưu H2/H∞, trong phần này thủ tục thiết kế được thực hiện
tương ứng với hai trường hợp đối tượng có sai số mô hình và đối tượng bị
ảnh hưởng của nhiễu ngoài.
1. Trường hợp đối tượng có sai số mô hình
Cho hệ thống như hình 4.42, đối tượng P0(s) có hàm truyền như sau:
1.8
P0 ( s ) = 2
s ( s + 2)
Sai lệch mô hình Δ0(s), bị chặn như sau:
0.1
Δ 0 (s) ≤
s + 0.1s + 10
2
β (ω )
max <1
ω∈[ 0 , ∞ ) α (ω )
http://www.khvt.com
Chương 4 : Điều khiển mờ
Giá trị tốt nhất của ba thông số PID và phiếm hàm H2 sau mỗi thế hệ
K1 k2 K3 J4
Thế hệ 1 3.6651 9.6770 24.5629 0.2808
Thế hệ 2 3.8436 1.7971 29.3725 0.2732
Thế hệ 3 3.0000 0.1000 26.3050 0.2726
Thế hệ 4 3.0000 0.1000 26.3050 0.2726
Thế hệ 5 3.0000 0.1000 30.0000 0.2697
Thế hệ 6 3.0000 0.1000 30.0000 0.2697
Thế hệ 7 3.0000 0.1000 30.0000 0.2697
Thế hệ 8 3.0000 0.1000 30.0000 0.2697
Thế hệ 9 3.0000 0.1000 30.0000 0.2697
Thế hệ 10 3.0000 0.1000 30.0000 0.2697
Thế hệ 11 3.0000 0.1000 30.0000 0.2697
Thế hệ 12 3.0000 0.1000 30.0000 0.2697
Thế hệ 13 3.0000 0.1000 30.0000 0.2697
Thế hệ 14 3.0000 0.1000 30.0000 0.2697
Thế hệ 15 3.0000 0.1000 30.0000 0.2697
Trang 87
PGS.TS Nguyễn Thị Phương Hà
1.8
1.6
1.4
1.2
1
Bien do
0.8
0.6
0.4
0.2
0
0 50 100 150 200 250 300
Thoi gian
Hình 4.44: Đáp ứng nấc của hệ thống trong thế hệ thứ nhất
(k1 = 3.8436, k2 = 1.7971, k3 = 24.5629)
- Đáp ứng nấc của hệ thống trong thế hệ 2:
1.5
1
Bien do
0.5
0
0 50 100 150 200 250 300
Thoi gian
Hình 4.45: Đáp ứng nấc của hệ thống trong thế hệ thứ hai
(k1 = 3.6651, k2 = 9.677, k3 = 29.3725)
http://www.khvt.com
Chương 4 : Điều khiển mờ
1.4
1.2
0.8
Bien do
0.6
0.4
0.2
0
0 50 100 150 200 250 300
Thoi gian
Hình 4.46: Đáp ứng nấc của hệ thống trong thế hệ thứ năm (hệ danh định)
1.4
1.2
0.8
Bien do
0.6
0.4
0.2
0
0 50 100 150 200 250 300
Thoi gian
Hình 4.47: Đáp ứng hàm nấc của hệ ở thế hệ thứ năm (có sai số mô hình)
Trang 89
PGS.TS Nguyễn Thị Phương Hà
1.4
1.2
0.8
Bien do
0.6
0.4
0.2
0
0 50 100 150 200 250 300
Thoi gian
Hình 4.48: Đáp ứng nấc của hệ thống trong thế hệ thứ năm, vẽ chung cho
hai trường hợp, (k1 = 3, k2 = 0.1, k3 = 30)
Sự hội tụ của phiếm hàm H2 được trình bày trong hình 4.43. Đáp ứng nấc
của hệ thống được trình bày cho hai trường hợp: hệ danh định (hình 4.46) và
hệ thống có sai số mô hình (hình 4.47). Kết quả cho thấy bộ điều khiển được
thiết kế có thể điều khiển thành công hệ thống với mọi Δ0(s).
2. Trường hợp hệ thống chịu ảnh hưởng của nhiễu ngoài
Cho hệ thống điều khiển như hình 4.50, đối tượng P(s) có hàm truyền như
sau:
1.8
P( s) =
s ( s + 2)
2
Nhiễu ngoài d(t) giả sử bằng 0.1sint. Áp dụng bài toán cực tiểu hóa hàm
nhạy với γ = 0.1.
Tương ứng với d(t) trên, hàm trọng W(s) trong (4.132) được chọn như sau:
http://www.khvt.com
Chương 4 : Điều khiển mờ
1
W (s) =
s +1
Ta được:
s 3 ( s + 2)
≤ 0.1
( s + 1)( s 4 + 2s 3 + 1.8k 3 s 2 + 1.8k1 s + 1.8k 2 ) ∞
với β (ω ) = ω 6 (ω 2 + 4)
α (ω ) = (1 + ω 2 )[(ω 4 − 1.8k 3ω 2 + 1.8k 2 ) 2 + ω 2 (2ω 2 − 1.8k1 ) 2 ]
Tương tự như ví dụ trước, phiếm hàm H2 của hệ thống là J4:
1.8k1k3 − 2k2 + 4
J4 =
7.2k1k3 − 3.6k12 − 8k2
Thuật toán di truyền bắt đầu bằng việc tạo ngẫu nhiên một quần thể bao
gồm 200 nhiễm sắc thể, sau 19 thế hệ, tìm được bộ điều khiển PID thích hợp
với các thông số như sau, k1 = 3, k2 = 0.1, k3 = 30.
0.284
0.282
0.28
0.278
Chuan H2
0.276
0.274
0.272
0.27
0.268
0 2 4 6 8 10 12 14 16 18 20
The he
Trang 91
PGS.TS Nguyễn Thị Phương Hà
Giá trị tốt nhất của ba thông số PID và phiếm hàm H2 sau mỗi thế hệ
k1 k2 K3 J4
Thế hệ 1 3.6651 9.6770 24.5629 0.2808
Thế hệ 2 3.6651 9.6769 24.5628 0.2808
Thế hệ 3 3.0000 17.6599 27.9843 0.2781
Thế hệ 4 3.6650 9.6768 30.0000 0.2742
Thế hệ 5 3.8635 0.1000 30.0000 0.2724
Thế hệ 6 3.8635 0.1000 30.0000 0.2724
Thế hệ 7 3.8635 0.1000 30.0000 0.2724
Thế hệ 8 3.8630 0.1000 30.0000 0.2724
Thế hệ 9 3.1635 0.1000 30.0000 0.2701
Thế hệ 10 3.1634 0.1000 30.0000 0.2701
Thế hệ 11 3.1634 0.1000 30.0000 0.2701
Thế hệ 12 3.0000 0.1000 30.0000 0.2697
Thế hệ 13 3.0000 0.1000 30.0000 0.2697
Thế hệ 14 3.0000 0.1000 30.0000 0.2697
Thế hệ 15 3.0000 0.1000 30.0000 0.2697
Thế hệ 16 3.0000 0.1000 30.0000 0.2697
Thế hệ 17 3.0000 0.1000 30.0000 0.2697
Thế hệ 18 3.0000 0.1000 30.0000 0.2697
Thế hệ 19 3.0000 0.1000 30.0000 0.2697
e u +
r + + y
C(s) P(s)
-
http://www.khvt.com
Chương 4 : Điều khiển mờ
1.8
1.6
1.4
1.2
1
Bien do
0.8
0.6
0.4
0.2
0
0 50 100 150 200 250 300
Thoi gian
Hình 4.51: Đáp ứng nấc của hệ thống trong thế hệ thứ nhất
(k1 = 3.8436, k2 = 9.6768, k3 = 30)
- Đáp ứng nấc của hệ thống trong thế hệ 4:
1.8
1.6
1.4
1.2
1
Bien do
0.8
0.6
0.4
0.2
0
0 50 100 150 200 250 300
Thoi gian
Hình 4.52: Đáp ứng nấc của hệ thống trong thế hệ thứ tư
(k1 = 3.6650, k2 = 1.7971, k3 = 24.5629)
Trang 93
PGS.TS Nguyễn Thị Phương Hà
1.4
1.2
0.8
Bien do
0.6
0.4
0.2
0
0 50 100 150 200 250 300
Thoi gian
Hình 4.53: Đáp ứng nấc của hệ thống trong thế hệ thứ 12 (hệ danh định)
1.2
0.8
0.6
Bien do
0.4
0.2
-0.2
0 50 100 150 200 250 300
Thoi gian
Hình 4.54: Đáp ứng nấc của hệ thống trong thế hệ thứ 12 (có nhiễu ngoài)
http://www.khvt.com
Chương 4 : Điều khiển mờ
1.2
0.8
0.6
Bien do
0.4
0.2
-0.2
0 50 100 150 200 250 300
Thoi gian
Hình 4.55: Đáp ứng nấc của hệ thống trong thế hệ thứ 12, vẽ chung cho hai
trường hợp, (k1 = 3, k2 = 0.1, k3 = 30)
Sự hội tụ của phiếm hàm H2 được trình bày trong hình 4.50. Đáp ứng nấc
của hệ thống được trình bày cho hai trường hợp: hệ danh định (hình 4.53) và
hệ thống có ảnh hưởng của nhiễu (hình 4.54). Kết quả cho thấy bộ điều
khiển được thiết kế có thể điều khiển thành công hệ thống với ảnh hưởng
của nhiễu ngoài, đáp ứng trong hai trường hợp gần trùng với nhau.
Trang 95
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com
Chương 4 : Điều khiển mờ
Trang 97
PGS.TS Nguyễn Thị Phương Hà
http://www.khvt.com