vỀ mỘt phƢƠng pháp tỔng hỢp hỆ ĐiỀu khiỂn mỜ · pdf filehình...
TRANSCRIPT
BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ CÔNG THƢƠNG
VIỆN NGHIÊN CỨU ĐIỆN TỬ, TIN HỌC, TỰ ĐỘNG HÓA
NGUYỄN DUY HƢNG
VỀ MỘT PHƢƠNG PHÁP TỔNG HỢP HỆ
ĐIỀU KHIỂN MỜ DÙNG MẠNG NƠRON
ỨNG DỤNG TRONG CÔNG NGHIỆP
Chuyên ngành: Kỹ thuật Điện tử
Mã ngành: 62.52.70.01
LUẬN ÁN TIẾN SĨ KỸ THUẬT
HƯỚNG DẪN KHOA HỌC:
GS. TSKH. NGUYỄN XUÂN QUỲNH
HÀ NỘI – 2009
LỜI CẢM ƠN
Tác giả xin bày tỏ lời cảm ơn và lòng kính trọng đối với thầy hướng dẫn:
GS. TSKH. Nguyễn Xuân Quỳnh bởi những chỉ dẫn quý báu về phương pháp
luận và định hướng nghiên cứu để luận án được hoàn thành.
Tác giả cũng bày tỏ lời cảm ơn đối với Viện NC Điện tử, Tin học, Tự
động hóa – Bộ Công Thương đã tạo điều kiện thuận lợi về cơ sở vật chất và
thời gian để tác giả hoàn thành luận án.
Tác giả xin trân trọng cảm ơn các nhà khoa học và các đồng nghiệp đã
phản biện, lý luận, đóng góp các ý kiến xây dựng và trao đổi về các vấn đề lý
thuyết cũng như thực tiễn để luận án được hoàn thiện.
Cuối cùng tác giả xin bày tỏ lời cảm ơn sâu sắc nhất đến gia đình và người
thân đã luôn chia sẻ, gánh đỡ những khó khăn cũng như dành những tình cảm
và là nguồn cổ vũ, động viên tinh thần không thể thiếu đối với tác giả trong
suốt quá trình thực hiện luận án này.
LỜI CAM ĐOAN
Tôi xin cam đoan luận án này là công trình nghiên cứu khoa học của tôi và
không trùng lặp với bất kỳ công trình khoa học nào khác. Các số liệu trình
bày trong luận án đã được kiểm tra kỹ và phản ánh hoàn toàn trung thực. Các
kết quả nghiên cứu do tác giả đề xuất chưa từng được công bố trên bất kỳ tạp
chí nào đến thời điểm này ngoài những công trình của tác giả.
Hà Nội, ngày 15 tháng 9 năm 2009
Tác giả luận án
Nguyễn Duy Hưng
- i -
MỞ ĐẦU
Vấn đề điều khiển ổn định các hệ động học phi tuyến có phương trình động
học chuyển được về dạng tuyến tính hóa phản hồi trạng thái (state feedback
linearizable) hoặc tuyến tính hóa phản hồi vào-ra (input-output feedback
linearizable) có chứa các thành phần không rõ nhằm bám theo tín hiệu mẫu cho
trước với sai số bị chặn là mục tiêu giải quyết của luận án. Đây là vấn đề phức
tạp do đặc tính phi tuyến của động học cũng như của các thành phần chưa biết
trong phương trình động học của đối tượng. Các công trình nghiên cứu hiện nay
chủ yếu tìm cách giải quyết các vấn đề về điều khiển ổn định và bền vững hệ
phi tuyến có các thành phần bất định dựa trên điều khiển thích nghi, tuy nhiên
các phương pháp còn khá phức tạp và chưa chỉ rõ khả năng và mô hình áp dụng
trên các hệ thống điều khiển công nghiệp.
Nhằm đóng góp, đưa ra một phương pháp tổng hợp có khả năng áp dụng trên
các hệ thống điều khiển tự động tiên tiến hoạt động trong các phân cấp mạng
công nghiệp, tác giả trình bày một phương pháp tổng hợp mới dựa trên ý tưởng
thay thế ước lượng (không cần gần đúng như các phương pháp hiện nay) các
hàm trạng thái chưa biết bằng các hàm số đã biết, từ đó tìm cách xấp xỉ sai lệch
chung do phép thay thế ước lượng gây nên và thiết kế thành phần bù liên tục
nhằm triệt tiêu tác động này. Đặc điểm của phương pháp là sử dụng bộ xấp xỉ
vạn năng mờ nơron (xấp xỉ sai lệch nêu trên) làm thành phần bù trong luật điều
khiển phản hồi. Để xây dựng được một cơ sở toán học chứng minh cho phương
pháp đề xuất, luận án lần lượt phát triển phương pháp cho các trường hợp bù
tĩnh (luật điều khiển phản hồi tĩnh) và trường hợp bù động (luật điều khiển thích
nghi). Ngoài ra luận án còn phân tích và giải quyết một số vấn đề khác liên quan
đến các điều kiện giới hạn của quỹ đạo trạng thái và đầu vào của hệ phi tuyến
cũng như mở rộng phương pháp trong trường hợp hệ khả tuyến tính hóa phản
hồi chặt (strict-feedback linearizable system).
Ngoài cơ sở lý thuyết được chứng minh, luận án cũng phân tích và chỉ ra khả
năng áp dụng phương pháp trên các hệ thống điều khiển công nghiệp (PLC,
IPC) thông qua thử nghiệm trên một mô hình phần mềm ứng dụng được xây
dựng cho hệ thống SIMATIC S7 của hãng Siemens.
- ii -
Bố cục của luận án
Luận án chia thành 4 chương. Chương 1 trình bày tổng quan các vấn đề
trong điều khiển các hệ phi tuyến và ứng dụng, từ đó đưa ra mục tiêu và nội
dung nghiên cứu của luận án giới hạn vào các hệ khả tuyến tính hóa phản hồi có
chứa các thành phần không rõ trong bài toán bám theo tín hiệu mẫu bị chặn cho
trước.
Chương 2 trình bày chi tiết vấn đề cần giải quyết cũng như tổng quan các
nghiên cứu và các kết quả đã đạt được đến nay. Dựa trên phương pháp thiết kế
định nghĩa hệ sai số thỏa mãn giả thiết ban đầu, luận án xây dựng một số cơ sở
toán học (các định lý và bổ đề) để hình thành phương pháp mới theo hướng đơn
giản và có khả năng ứng dụng – được gọi là phương pháp thay thế ước lượng
hàm trạng thái – làm tiền đề phát triển các bộ điều khiển ổn định tĩnh và động
trong các chương tiếp theo.
Trong Chương 3, tác giả giới thiệu một số cơ sở toán học nhằm đưa ra luật
điều khiển tĩnh dùng bộ xấp xỉ vạn năng mờ nơron làm thành phần bù liên tục
để nghiệm của hệ sai số vòng kín bị chặn tới hạn đều (uniformly ultimately
bounded) cũng như trình bày phương pháp tính toán, xác định tham số điều
khiển và các điều kiện cần trong phương pháp để quỹ đạo trạng thái và tín hiệu
điều khiển bị chặn theo thiết kế. Ngoài ra Chương 3 còn tiếp tục mở rộng
phương pháp cho thiết kế bộ điều khiển ổn định tĩnh các hệ chuyển động hỗn
loạn (chaotic systems) có phương trình động học ở dạng tuyến tính hóa phản hồi
chặt.
Chương 4 tập trung vào giải quyết vấn đề bù động dựa trên luật điều khiển
tĩnh và sử dụng bộ xấp xỉ mờ nơron để xây dựng được bộ điều khiển thích nghi
ổn định cũng như trình bày mô hình phần mềm ứng dụng. Nhằm chứng minh
tính khả thi của phương pháp trong phát triển bộ điều khiển với thành phần bù
động, luận án sử dụng điều khiển thích nghi trực tiếp áp dụng phương pháp
chỉnh định để chỉnh định tham số của bộ xấp xỉ mờ nơron trong các trường
hợp bộ xấp xỉ tuyến tính và phi tuyến đối với tham số. Tác giả cũng đưa ra mô
hình phần mềm ứng dụng cho phép áp dụng các kiểu điều khiển tĩnh và động
trên các hệ thống điều khiển công nghiệp và phân tích khả năng ứng dụng trên
hệ thống tự động hóa SIMATIC S7 của hãng Siemens.
Phần cuối là kết luận và kiến nghị của luận án, tiếp theo sau là Phụ lục bao
gồm một số chứng minh và thiết kế.
- iii -
MỤC LỤC
CHƢƠNG 1: TỔNG QUAN ....................................................................................... 1
1.1. Đặt vấn đề ....................................................................................................... 1
1.2. Mục tiêu và nhiệm vụ nghiên cứu ................................................................ 9
CHƢƠNG 2: ĐIỀU KHIỂN ỔN ĐỊNH CÁC HỆ THỐNG KHẢ TUYẾN
TÍNH HÓA PHẢN HỒI BẰNG PHƢƠNG PHÁP THAY
THẾ ƢỚC LƢỢNG HÀM TRẠNG THÁI ...................................... 11
2.1. Giới thiệu chung ........................................................................................... 11
2.1.1. Đặt vấn đề ........................................................................................... 11
2.1.2. Biểu diễn các hệ thống khả tuyến tính hóa phản hồi .......................... 12
2.1.3. Vấn đề trong điều khiển ổn định các hệ khả tuyến tính hóa
phản hồi trạng thái ............................................................................. 15
2.2. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi
trạng thái bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái ......... 21
2.2.1. Cơ sở toán học của phương pháp ....................................................... 21
2.2.2. Tính bền vững của hệ vòng kín trong phương pháp ........................... 31
2.3. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi vào-
ra bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái ...................... 44
2.3.1. Bài toán điều khiển và cơ sở toán học ................................................ 44
2.3.2. Điều khiển ổn định bằng phương pháp thay thế ước lượng hàm
trạng thái ............................................................................................. 47
2.3.3. Tính bền vững của hệ vòng kín đối với thành phần không rõ
trong phương trình động học .............................................................. 51
2.4. Tổng hợp thiết kế bộ điều khiển tĩnh ổn định ........................................... 55
2.5. Kết luận ......................................................................................................... 56
CHƢƠNG 3: PHƢƠNG PHÁP THAY THẾ ƢỚC LƢỢNG HÀM
TRẠNG THÁI DÙNG BỘ XẤP XỈ MỜ NƠRON .......................... 58
3.1. Đặt vấn đề và cơ sở lý thuyết xây dựng phƣơng pháp ............................. 58
3.1.1. Giới thiệu chung.................................................................................. 58
3.1.2. Bộ xấp xỉ vạn năng .............................................................................. 59
3.1.3. Cơ sở toán học xây dựng các bộ xấp xỉ dùng hệ mờ và mạng
nơron ................................................................................................... 60
3.2. Thay thế ƣớc lƣợng hàm trạng thái ........................................................... 69
3.2.1. Cơ sở toán học của phương pháp ....................................................... 69
3.2.2. Xác định tham số bộ điều khiển .......................................................... 74
3.2.3. Mô phỏng điều khiển tay rôbốt ........................................................... 79
3.3. Thay thế ƣớc lƣợng hàm trạng thái mở rộng trong điều khiển ổn
định các hệ khả tuyến tính hóa phản hồi chặt ........................................... 84
- iv -
3.3.1. Phương pháp cuốn chiếu .................................................................... 84
3.3.2. Phương pháp thay thế ước lượng hàm trạng thái khi hệ chứa
các thành phần không rõ .................................................................... 85
3.4. Tổng hợp và kết luận ................................................................................... 93
CHƢƠNG 4: ĐIỀU KHIỂN THÍCH NGHI TRỰC TIẾP DÙNG HỆ MỜ
NƠRON TRONG PHƢƠNG PHÁP THAY THẾ ƢỚC
LƢỢNG HÀM TRẠNG THÁI ......................................................... 96
4.1. Giới thiệu chung ........................................................................................... 96
4.1.1. Sự cần thiết phát triển bộ điều khiển thích nghi ................................. 96
4.1.2. Vấn đề và cơ sở toán học xây dựng bộ điều khiển thích nghi
trực tiếp ............................................................................................... 98
4.2. Điều khiển mờ nơron thích nghi trực tiếp các hệ thống khả tuyến
tính hóa phản hồi ....................................................................................... 101
4.2.1. Hệ khả tuyến tính hóa phản hồi trạng thái ....................................... 101
4.2.2. Hệ khả tuyến tính hóa phản hồi vào-ra ............................................ 108
4.3. Tổng hợp thiết kế bộ điều khiển thích nghi trực tiếp ổn định ............... 110
4.4. Mô hình điều khiển thích nghi trên hệ thống điều khiển công
nghiệp .......................................................................................................... 111
4.4.1. Giới thiệu chung................................................................................ 111
4.4.2. Mô hình phần mềm ứng dụng và khả năng áp dụng trên hệ
thống điều khiển công nghiệp ........................................................... 113
4.5. Kết luận ....................................................................................................... 121
KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................. 122
CÁC CÔNG TRÌNH CÔNG BỐ LIÊN QUAN CỦA TÁC GIẢ......................... 124
TÀI LIỆU THAM KHẢO ....................................................................................... 125
PHỤ LỤC ............................................................................................................ 134
5.1. Một số thuật ngữ tiếng Anh ...................................................................... 134
5.2. Bổ đề 1 trang 23 .......................................................................................... 136
5.3. Bổ đề 3 trang 40 và kết quả (2-64) ........................................................... 139
5.4. Tuyến tính hóa phƣơng trình động lực học (3-23) ................................. 143
5.5. Chƣơng trình mô phỏng ví dụ điều khiển tay rôbốt trang 79 ............... 145
5.6. Bổ đề 6 trang 100 ........................................................................................ 152
5.7. Một số môđun phần mềm trong mô hình phần mềm ứng dụng ............ 155
- v -
MỤC LỤC HÌNH VẼ
Hình 1 : Hàm ε( , ) 1 sign( )bsig( , )E E E .......................................................... 33
Hình 2 : Hàm μ( , ) ε( , )E E E ............................................................................. 34
Hình 3 : Hàm Lambert w( )w( ) xx e x ....................................................................... 35
Hình 4 : Hàm μ ( , , ) sign( )bsig( , )E E E E E ........................................ 41
Hình 5 : Hàm ( , )mE và _ maxμ ( , ) μ ( , , )E E mE ................................... 41
Hình 6 : Hệ mờ MISO .................................................................................................. 63
Hình 7 : Mạng nơron 2 lớp ........................................................................................... 65
Hình 8 : Mô phỏng trong trường hợp không sử dụng thành phần bù .......................... 81
Hình 9 : Mô phỏng sử dụng thành phần bù tĩnh với 1 và 1.0 ...................... 82
Hình 10 : Mô phỏng sử dụng thành phần bù tĩnh với 1 và 0.8 .................... 83
Hình 11 : Điều khiển thích nghi trong hệ thống điều khiển công nghiệp .................. 114
Hình 12 : Sơ đồ đường đi dữ liệu trong mô hình điều khiển thích nghi .................... 115
Hình 13 : Các môđun phần mềm chính trong mô hình hệ thống NF ......................... 117
Hình 14 : Cấu trúc bộ đệm và dữ liệu quá trình cung cấp cho PC-Server ................. 155
Hình 15 : Các khối môđun phần mềm trên giao diện STEP7 V5 .............................. 157
- vi -
BẢNG CHỮ VIẾT TẮT
ABS Antilock Braking System
ANFIS Adaptive-Network-based Fuzzy Inference System
CNC Computerized Numerical Control
CSDL Cơ sở dữ liệu
DC Direct Current
DCS Distributed Control System
DVD Digital Video Disc
GUAS Globally Uniformly Asymtotically Stable
HD DVD High Density DVD
IE Industrial Ethernet
IEC International Electrotechnical Commission
IPC Industrial Personal Computer
ISPS Input-to-State Practically Stable
ISS Input-to-State Stable
KH&CN Khoa học và Công nghệ
LTI Linear Time Invariant
MIMO Multi-Input Multi-Output
MLP Multilayer Perceptron (Network)
NF/NFN Neuro-Fuzzy/Neuro-Fuzzy Network
PC Personal Computer
PID Proportional Integral Differential
PLC Programmable Logic Controller
R&D Research and Development
RBF Radial Basis Function Network
RBN Radial Basis Neural Network
SCADA Supervisory Control and Data Acquisition
SCL Structured Control Language
SISO Single-Input Single-Output
UAS Uniformly Asymtotically Stable
- 1 -
CHƢƠNG 1
TỔNG QUAN
1.1. Đặt vấn đề
Trong những thập kỷ gần đây, sự phát triển mạnh mẽ của khoa học và công
nghệ (KH&CN) trong các lĩnh vực công nghệ chế tạo, công nghệ vật liệu mới
và công nghệ thông tin đã cho ra đời các bộ vi xử lý mạnh, kích cỡ nhỏ gọn, tiêu
thụ điện năng thấp và giá thành hạ. Nhờ đó con người có thể tạo ra hàng loạt sản
phẩm công nghệ cao tinh vi và thông minh cũng như các sản phẩm công nghệ
cao này ngày càng trở nên phổ biến hơn và là một phần không thể thiếu trong sự
phát triển của xã hội văn minh hiện đại. Những thiết bị dân dụng công nghệ cao
như máy điện thoại di động, iPod, đầu đĩa HD DVD và Blu-ray hay máy giặt,
máy rửa bát, ... đã không còn xa lạ đối với nhiều người dân trong khi các thiết bị
khác như máy rút tiền tự động, máy bán hàng, bán vé tàu xe tự động, thiết bị trợ
giúp y tế, thiết bị dẫn đường, rôbốt giúp việc, ... đang trở nên gần gũi với con
người hơn bao giờ hết. Có thể nói sự phát triển của KH&CN đã và đang tạo ra
những thay đổi lớn trong xã hội loài người nhằm đáp ứng nhu cầu ngày một cao
của con người về môi trường và điều kiện sống.
Cùng với sự phát triển này là sự lớn mạnh của các ngành công nghiệp nhằm
khai thác và cung cấp các sản phẩm, dịch vụ có chất lượng tốt nhất với giá
thành hạ tới người tiêu dùng. Kinh nghiệm của các nước phát triển cho thấy việc
áp dụng KH&CN trong cải tiến, tạo ra các sản phẩm mới cũng như việc nâng
cao chất lượng, giảm chi phí sản xuất và hạ giá thành sản phẩm, dịch vụ có ý
nghĩa sống còn đối với mỗi nhà sản xuất nhưng ngược lại cũng đòi hỏi KH&CN
phải luôn đi trước một bước, đáp ứng được yêu cầu phát triển của nhà sản xuất
nói riêng và của xã hội nói chung. Mặc dù hiện nay thế giới đang phải đối mặt
với các vấn đề nghiêm trọng về khủng hoảng tài chính và tình trạng suy thoái
kinh tế toàn cầu ảnh hưởng lớn đến các hoạt động sản xuất, tuy nhiên đứng trên
quan điểm triết học thì bản chất của phát triển và phát triển là bản chất của xã
- 2 -
hội và do đó chúng ta hoàn toàn có thể tin tưởng rằng trong tương lai không xa,
việc các nền kinh tế được khôi phục và tiếp tục phát triển là tất yếu, trong đó
KH&CN vẫn là động lực để thúc đẩy phát triển kinh tế xã hội.
Tính phi tuyến và vai trò của lý thuyết điều khiển hiện đại
Trong sự phát triển của KH&CN, lý thuyết điều khiển hiện đại có vai trò hết
sức quan trọng để giải quyết nhiều vấn đề như nâng cao chất lượng điều khiển,
độ ổn định của hệ thống, tiết kiệm năng lượng hay như sử dụng máy móc thay
thế con người trong các ứng dụng điều khiển phức tạp hoặc nguy hại. Hàng loạt
các công trình nghiên cứu về điều khiển bền vững, điều khiển thích nghi, điều
khiển tối ưu hay điều khiển mờ và mạng nơron được công bố trong những năm
gần đây cho thấy sự quan tâm lớn của các nhà khoa học trên khắp thế giới và
những vấn đề, các hướng nghiên cứu phát triển trong lĩnh vực này ([35], [40],
[41], [42], [44], [46], [48], [52], [53], [54], [56], [57], [59], [60], [61], [62], [63],
[64], [65], [66], [67], [71], [73], [75], [77], [79], [80], [81], [82], [83], [92], [93],
[94], [95], [96], [98], [99], [100], [101], [102], [103], [104], [105], [106], [107],
[108]).
Như chúng ta đã biết, các hệ thống thực là các mô hình phi tuyến hết sức
phức tạp nên các phương pháp thiết kế kinh điển dựa trên điều khiển tuyến tính
trong nhiều trường hợp không đảm bảo được yêu cầu do đặc tính phi tuyến của
động học đối tượng điều khiển, đặc tuyến đầu đo hoặc cơ cấu chấp hành cũng
như tính chất không đầy đủ, chính xác của các mô hình thay thế (động học chưa
biết, nhiễu, điều kiện ban đầu).
Trong công nghiệp, đầu đo và cơ cấu chấp hành là những ví dụ rõ nhất về
tính phi tuyến. Tuy nhiên đặc tính phi tuyến còn thể hiện rõ trong các hệ cơ điện
(động cơ DC không chổi than, động cơ điện cảm ứng), tay máy, các hệ thống
trang bị trên ôtô (Power train, ABS, Precision Control), các quá trình hóa học,
sinh học và các hệ chuyển động hỗn loạn (chaos). Cần lưu ý rằng các hệ chuyển
động hỗn loạn là các hệ động học phi tuyến tiền định (deterministic) nghĩa là -
khác với ngẫu nhiên - động học tương lai của hệ thống được định nghĩa bởi các
- 3 -
điều kiện ban đầu nên hệ còn được xem là rất nhạy với các điều kiện ban đầu.
Ví dụ điển hình của hệ chuyển động hỗn loạn trong tự nhiên là thời tiết khí hậu
còn trong công nghiệp là các quá trình hóa học, sinh học, dòng chảy.
Ngoài ra một vấn đề khác cũng được đặt ra là rất nhiều hệ cần điều khiển có
các tham số không rõ (như hệ truyền động servo, rôbốt), có các tham số biến đổi
chậm (ví dụ như các tham số phụ thuộc vào nhiệt độ) hoặc có các tham số thay
đổi không dự đoán được (như các hệ thống năng lượng).
Để giải quyết các vấn đề phức tạp trên, lý thuyết điều khiển bền vững và
thích nghi được xem là các công cụ hữu hiệu. Thực tế hiện nay điều khiển thích
nghi đã được áp dụng thành công trong nhiều lĩnh vực như điều khiển rôbốt,
máy công cụ, CNC, điều khiển quá trình (hóa học, sinh học, ...), điều khiển
truyền động hay như điều khiển lái tàu, máy bay tự động. Tuy nhiên việc thiết
kế các bộ điều khiển phi tuyến nói chung và điều khiển thích nghi nói riêng là
không đơn giản và đặt ra hàng loạt vấn đề cần giải quyết như vấn đề về ổn định
hệ vòng kín, vấn đề điều khiển bám theo tín hiệu mẫu, vấn đề chống nhiễu hoặc
làm suy giảm nhiễu cũng như khi kết hợp các vấn đề trên với nhau. Giống như
trong điều khiển tuyến tính, phản hồi vẫn là chìa khóa để thiết kế các bộ điều
khiển phi tuyến nói chung. Về mặt lý thuyết, nếu toàn bộ các trạng thái của hệ
đo được khi đó ta nói đến điều khiển phản hồi trạng thái, còn trong trường hợp
chỉ có véctơ đầu ra đo được, điều khiển phản hồi đầu ra được áp dụng. Các
phương pháp thiết kế bộ điều khiển phi tuyến như tuyến tính hóa phản hồi
(feedback linearization), điều khiển tích phân (integral control), điều chỉnh định
trình khuếch đại (gain scheduling) là các phương pháp chủ đạo hiện nay ([32],
[45], [50], [51], [68]).
Điều khiển mờ nơron
Mặc dù các nghiên cứu về điều khiển phi tuyến đã có nhiều bước tiến quan
trọng, tuy nhiên vấn đề trở nên phức tạp hơn khi hệ phi tuyến có chứa các thành
phần không rõ làm mất ổn định hệ. Các đặc tính không rõ này có thể xuất phát
từ các nguồn như nhiễu đầu vào, động học chưa biết của đối tượng, sai số của
- 4 -
các mô hình thay thế hoặc tác động bên ngoài. Để điều khiển ổn định hệ, các
phương pháp thiết kế sử dụng điều khiển mờ nơron (hay còn gọi là điều khiển
mờ dùng mạng nơron) nhằm xấp xỉ các thành phần chưa biết từ đó tìm cách
giảm trừ tác động của các thành phần này để đạt được chất lượng điều khiển tốt
nhất. Việc áp dụng điều khiển mờ nơron còn cho phép phát triển các bộ điều
khiển thích nghi do tham số có thể chỉnh định được trực tuyến trong quá trình
hoạt động.
Cần lưu ý thêm rằng về mặt thuật ngữ, điều khiển mờ nơron trong luận án
còn được hiểu là điều khiển (phi tuyến) dựa trên cơ sở hệ mờ (fuzzy system),
mạng nơron nhân tạo (artificial neural network), mạng nơron mờ lai (hybrid
fuzzy neural network) hoặc hệ mờ nơron (neuro-fuzzy system).
Chúng ta biết rằng lý thuyết tập mờ đã được giới thiệu từ những năm 60 của
thế kỷ trước, tuy nhiên phải tới đầu thập kỷ 90 các hệ thống điều khiển mờ mới
thực sự được đưa vào ứng dụng trong đời sống và sản xuất. Hệ mờ đã chứng tỏ
được tính ưu việt so với các hệ điều khiển được dùng trước đó trong giải quyết
các bài toán như điều khiển quá trình sản xuất dựa trên kinh nghiệm vận hành,
điều khiển phi tuyến, điều khiển các thông số môi trường, các hệ thống dự báo
khí tượng, thủy văn. Trong công nghiệp, điều khiển mờ còn được nghiên cứu
kết hợp với điều khiển PID kinh điển nhằm tận dụng được các ưu điểm của cả
hai hệ thống, cho phép nâng cao chất lượng điều khiển ([21], [28], [34], [47],
[69], [86]). Hiện nay các hệ thống điều khiển mờ trong công nghiệp được phát
triển dựa trên cơ sở các môđun phần mềm cho các hệ thống thiết bị khả trình
(PLC), máy tính công nghiệp (IPC) cho phép giải quyết được nhiều bài toán
trước đây khó thực hiện được.
Mạng nơron nhân tạo thường được dùng để điều chỉnh các hàm liên thuộc
của các hệ mờ trong các thiết bị điều khiển. Mặc dù logic mờ có thể mã hóa trực
tiếp tri thức chuyên gia sử dụng các luật với các nhãn ngôn ngữ nhưng logic mờ
lại đòi hỏi nhiều thời gian thiết kế và chỉnh định các hàm liên thuộc để định
lượng các nhãn ngôn ngữ. Kỹ thuật luyện mạng nơron cho phép tự động hóa
- 5 -
quá trình này và giảm đáng kể thời gian, chi phí phát triển trong khi cải thiện
được tốc độ xử lý ([76], [86], [91]).
Mặc dù về lý thuyết các mạng nơron và các hệ thống mờ là tương đương
nhau theo nghĩa chúng có khả năng chuyển đổi được tuy nhiên trong thực tế mỗi
hệ thống lại có ưu và nhược điểm riêng. Đối với các mạng nơron, tri thức có thể
thu được tự động bởi thuật toán hồi quy nhưng quá trình luyện lại tương đối
chậm và việc phân tích mạng đã luyện là khó khăn. Ngoài ra ta cũng không có
khả năng rút ra được tri thức có dạng cấu trúc (các luật) từ mạng nơron đã luyện
cũng như không thể đưa thêm các thông tin đã biết vào trong mạng nơron để
đơn giản hóa quá trình luyện mạng.
Các hệ thống mờ tốt hơn theo nghĩa hoạt động của chúng có thể giải thích
được dựa trên các luật mờ và như vậy tốc độ thực thi của hệ có thể thay đổi
được bằng cách chỉnh định các luật. Tuy nhiên thông thường việc thu được tri
thức là khá khó khăn và việc phải chia biến đầu vào thành nhiều miền nên ứng
dụng của các hệ thống mờ bị giới hạn trong các vùng mà ở đó tri thức chuyên
gia phải có cũng như đa phần trong thực tế chỉ áp dụng được với số lượng các
biến đầu vào nhỏ.
Việc kết hợp các ưu điểm của hệ mờ và mạng nơron dẫn đến các hệ thống lai
với các cấu trúc được sử dụng rộng rãi là mạng nơron mờ lai (hybrid FNN) và
hệ mờ nơron (NFS). Trong lý thuyết điều khiển hiện đại, hệ mờ, mạng nơron và
sự kết hợp của hệ mờ với mạng nơron được coi là những công cụ đa năng để
giải quyết các vấn đề về phi tuyến và tính không chắc chắn trong điều khiển các
hệ phi tuyến nói chung.
Hệ thống điều khiển công nghiệp và xu hƣớng phát triển
Khái niệm hệ thống điều khiển công nghiệp thông thường được hiểu là các
hệ thống SCADA, các hệ điều khiển phân tán (DCS) và các thiết bị (logic) khả
trình (PLC). Về mặt thuật ngữ, SCADA là hệ thống máy tính phục vụ giám sát
và điều khiển một quá trình nào đó. Quá trình ở đây có thể là quá trình công
nghiệp (như chế tạo, sản xuất, tinh chế có chế độ hoạt động liên tục, gián đoạn
- 6 -
hay có tính chất theo mẻ hoặc lặp lại), cơ sở hạ tầng (như xử lý, cấp nước; xử lý,
thu hồi nước thải; các đường ống dẫn dầu, khí ga; phân phối và truyền dẫn điện;
các hệ thống thông tin) hoặc cơ sở tiện nghi (như tòa nhà, cảng hàng không, hải
cảng, trạm vũ trụ). Trong khi đó, DCS để chỉ các hệ điều khiển có các thành
phần điều khiển nằm phân tán (không tập trung) trong toàn hệ thống, trong đó
mỗi hệ con được điều khiển bởi một hoặc nhiều thành phần điều khiển. Trong
công nghiệp các hệ DCS giám sát và điều khiển các thiết bị phân tán được dùng
trong các nhà máy điện, lọc dầu, hóa chất, xử lý nước, nước thải, ... Một dạng
hệ điều khiển công nghiệp khác là PLC dùng trong tự động hóa các quá trình cơ
điện và các thiết bị điều khiển máy móc. PLC là một dạng máy tính số, so với
máy tính thông thường PLC được thiết kế để hoạt động ở dải nhiệt độ rộng hơn,
khả năng chống nhiễu cao, chịu được rung động và va đập tốt cũng như có tính
năng xử lý thời gian thực.
Tuy nhiên việc phân chia các hệ điều khiển công nghiệp nêu trên chỉ có ý
nghĩa tương đối mà không có ranh giới rõ ràng. Ngày nay nhiều hệ PLC có thể
thực thi nhiệm vụ của một hệ DCS nhỏ trong khi các hệ DCS lại có thể có các
hệ con hoạt động như các PLC thực thụ. Sự phát triển của KH&CN trong những
năm gần đây cho thấy xu hướng tích hợp các hệ thống điều khiển trên lại với
nhau để tạo ra các hệ thống mạnh, có tính mở và sử dụng các ngôn ngữ lập trình
bậc cao. PAC (Process Automation Control) là một ví dụ của xu hướng phát
triển này.
Trong hệ thống điều khiển công nghiệp, hệ thống mạng công nghiệp có một
vai trò quan trọng hiện tại cũng như trong tương lai. Nhờ sự phát triển nhanh
chóng của công nghệ thông tin và yêu cầu ngày càng cao của tự động hóa công
nghiệp mà việc sử dụng các mạng công nghiệp ngày một rộng rãi hơn. Tuy
nhiên khác với mạng thông tin, mạng công nghiệp phải đáp ứng được các yêu
cầu về tốc độ truyền thích hợp với giá thành tốt cũng như phải đảm bảo hoạt
động ổn định, tin cậy trong môi trường công nghiệp.
Hệ thống mạng công nghiệp thường được sử dụng theo mô hình phân cấp
tùy thuộc vào yêu cầu trao đổi dữ liệu giữa các thiết bị trong mạng (như đáp ứng
- 7 -
thời gian thực, độ lớn dữ liệu, dịch vụ truyền thông). Theo đó cấp trên cùng (gọi
là cấp nhà máy) được sử dụng để kết nối giữa các máy tính trong hệ thống quản
lý và điều hành hoạt động sản xuất của nhà máy (thông thường đòi hỏi thời gian
đáp ứng dữ liệu dưới 1s). Trong khi đó, cấp trung gian (cell/control level) dùng
để kết nối các bộ điều khiển (phân tán) với nhau cho thực thi các nhiệm vụ điều
khiển chung nên yêu cầu thời gian đáp ứng dữ liệu phải nhanh hơn (dưới
100ms). Dưới cùng là cấp trường (field level) thực hiện việc kết nối thiết bị điều
khiển với các I/O phân tán (đầu đo, cơ cấu chấp hành), do đó đáp ứng phải
nhanh hơn cả để đảm bảo bộ điều khiển xử lý được các I/O thời gian thực
(thông thường thời gian đáp ứng dưới 10ms).
Trao đổi dữ liệu trong hệ thống mạng công nghiệp được thực hiện thông qua
bus trường (fieldbus). Bus trường là tên gọi chung của họ các giao thức mạng
công nghiệp dùng trong các ứng dụng điều khiển phân tán thời gian thực và đã
được tiêu chuẩn hóa (tiêu chuẩn IEC 61158). Một số chuẩn bus trường có thể kể
ra như Foundation Fieldbus (H1, HSE), Profibus, ProfiNet IO, ControlNet, P-
Net, Interbus và WorldFIP. Tuy nhiên các chuẩn bus trường không tương thích
với nhau do được phát triển bởi các hãng riêng biệt nên khó khăn cho người sử
dụng lựa chọn công nghệ và thiết bị. Ngày nay cùng với việc Ethernet hỗ trợ
phần lớn các giao thức mạng và được dùng rộng rãi trong mạng thông tin dữ
liệu, Ethernet công nghiệp đang là sự lựa chọn phát triển số một của nhiều hãng
tự động hóa. Ethernet công nghiệp không chỉ sử dụng trong các phân cấp trên
mà đang có xu thế hướng tới cả phân cấp dưới (cấp trường). Có thể nói công
nghệ Ethernet hứa hẹn sẽ mang đến sự thay đổi lớn trong lĩnh vực điều khiển
công nghiệp ([39], [84]).
Tình hình nghiên cứu hiện nay trên thế giới và tại Việt Nam
Trong những năm gần đây vấn đề về thiết kế bộ điều khiển thích nghi cho
các hệ thống động học phi tuyến luôn là một trong các chủ đề chính trên các tạp
chí chuyên ngành về điều khiển, tự động hóa trên thế giới và ngày càng thu hút
được nhiều nhà khoa học tham gia nghiên cứu. Đã có nhiều bước tiến, kết quả
- 8 -
đạt được cả về mặt lý thuyết và thực tiễn ứng dụng ([41], [44], [45], [46], [50],
[51], [57], [59], [66], [97], [100]), đặc biệt theo hướng sử dụng hệ mờ và/hoặc
mạng nơron để xấp xỉ phương trình động học của đối tượng phi tuyến và dùng
các phương pháp tuyến tính hóa phản hồi trạng thái hoặc phản hồi đầu ra của hệ
thống ([35], [40], [45], [52], [54], [56], [57], [75], [94], [95], [98], [101], [102],
[106]) để thiết kế bộ điều khiển ổn định tĩnh. Để bộ điều khiển có đặc tính thích
nghi với những sai lệch không rõ khi hoạt động trực tuyến, các bộ điều khiển
được thiết kế sử dụng cấu trúc mạng nơron hoặc logic mờ với các luật để chỉnh
định các trọng số trong quá trình làm việc. Đây cũng là phương pháp thường
dùng để thiết kế các bộ điều khiển thích nghi trong các ứng dụng công nghiệp.
Đối với trong nước, các nghiên cứu về điều khiển mờ, mạng nơron nhân tạo
và hệ thống mờ nơron cũng đã được nhiều cơ sở KHCN tập trung nghiên cứu
trong nhiều năm trở lại đây ([2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12],
[13], [14], [15], [16], [17], [18], [20], [23], [24], [26], [27], [29], [30], [31], [36],
[78]) và đã có không ít công trình hướng tới việc ứng dụng được công bố nhưng
nhìn chung các kết quả đạt được còn khá khiêm tốn. Một số cơ sở như Viện NC
Điện tử, Tin học, Tự động hóa (VIELINA), Đại học Bách khoa Hà Nội, Đại học
Bách khoa thành phố Hồ Chí Minh, Phân viện Tự động hóa - Viện công nghệ
thông tin, Viện Tự động hóa Kỹ thuật quân sự, Học viện Công nghệ Bưu chính
Viễn thông, ... là những đơn vị đã có nhiều năm nghiên cứu về điều khiển mờ
nơron và đã có một số kết quả nhất định, tuy nhiên các nghiên cứu sâu rộng hơn
nhằm ứng dụng công nghệ này trong các hệ thống tự động hóa công nghiệp tiên
tiến còn là những bước đi ban đầu.
Vấn đề nghiên cứu và đóng góp chính của luận án
Những vấn đề còn tồn tại hiện nay cả về lý thuyết và thực tiễn ứng dụng
trong điều khiển các hệ phi tuyến có chứa các thành phần không rõ đòi hỏi
những nghiên cứu, phát triển tiếp nhằm giải quyết các vấn đề đã nêu. Trong
khuôn khổ của luận án, tác giả chọn hướng nghiên cứu áp dụng hệ mờ và mạng
nơron trong điều khiển các hệ động học phi tuyến tuy nhiên chỉ giới hạn vào các
- 9 -
hệ phi tuyến có phương trình động học chuyển được về dạng tuyến tính hóa
phản hồi có chứa các thành phần không rõ do đây là một trong những dạng điển
hình trong công nghiệp. Ngoài ra đây cũng là vấn đề chưa được giải quyết đầy
đủ trên thế giới ([40], [50], [52], [53], [54], [56], [57], [60], [61], [62], [63],
[72], [73], [75], [81], [92], [94], [95], [98], [104], [105]) cũng như có rất ít công
trình nghiên cứu trong nước được công bố ([14], [81]). Chương 2 sẽ trình bày
và phân tích rõ hơn những hạn chế trong các phương pháp giải hiện nay và ý
tưởng hình thành phương pháp mới nhằm tránh phải giải quyết các vấn đề trên.
Như vậy đóng góp chính của luận án là một phương pháp mới (gọi là
phương pháp thay thế ước lượng hàm trạng thái) cho phép tổng hợp bộ điều
khiển ổn định tĩnh và động các hệ thống khả tuyến tính hóa phản hồi trạng thái
và khả tuyến tính hóa phản hồi vào-ra có các thành phần không rõ trong phương
trình động học cho lớp bài toán điều khiển bám tín hiệu mẫu cho trước. Phương
pháp mới đưa ra cách thức phân tích được ảnh hưởng của phép thay thế lên hệ
sai số nhằm tránh phải giải quyết một số vấn đề thường gặp trong các phương
pháp giải hiện nay. Ngoài ra phương pháp có khả năng áp dụng được trên các hệ
thống điều khiển công nghiệp tiên tiến với PLC đủ mạnh hoặc sử dụng Soft-
PLC (như WinAC RTX của hãng Siemens).
1.2. Mục tiêu và nhiệm vụ nghiên cứu
Mục tiêu
Xây dựng phương pháp thay thế ước lượng hàm trạng thái trên cơ sở áp dụng
hệ mờ và mạng nơron cho phép tổng hợp bộ điều khiển ổn định tĩnh và động
(thích nghi) các hệ khả tuyến tính hóa phản hồi (feedback linearizable system)
có chứa các thành phần không rõ trong phương trình động học để giải quyết bài
toán điều khiển bám theo tín hiệu mẫu cho trước và có khả năng áp dụng trên
các hệ thống điều khiển công nghiệp.
Nhiệm vụ nghiên cứu
Với mục tiêu trên, nhiệm vụ nghiên cứu đặt ra của luận án như sau:
- 10 -
- Nghiên cứu các vấn đề trong điều khiển ổn định các hệ khả tuyến tính hóa
phản hồi có chứa các thành phần không rõ trong bài toán bám theo tín hiệu
mẫu cho trước, tập trung vào các hệ khả tuyến tính hóa phản hồi trạng thái
và khả tuyến tính hóa phản hồi vào-ra.
- Xây dựng cơ sở toán học của phương pháp tổng hợp mới nhằm giải quyết và
tránh được một số vấn đề trong các phương pháp hiện nay.
- Xây dựng luật điều khiển tĩnh và động trong phương pháp mới.
- Xây dựng mô hình phần mềm ứng dụng trên một hệ thống điều khiển công
nghiệp điển hình nhằm phân tích khả năng áp dụng của phương pháp.
Phƣơng pháp nghiên cứu
Xuất phát từ những vấn đề của các phương pháp giải và các hướng nghiên
cứu tiếp theo hiện nay, luận án chọn phương pháp nghiên cứu áp dụng hệ mờ và
mạng nơron trong điều khiển để giải quyết vấn đề phi tuyến và không rõ trong
phương trình động học của hệ. Liên quan đến vấn đề ổn định và tính bền vững
của hệ vòng kín, luận án lựa chọn một số cơ sở toán học để phân tích, xây dựng
và phát triển cơ sở toán học của phương pháp. Các cơ sở toán học chính gồm
phương pháp lập hệ sai số, phân tích ổn định hệ theo tiêu chuẩn Lyapunov, lý
thuyết xấp xỉ vạn năng mờ nơron và điều khiển thích nghi trực tiếp. Để thực
hiện ý tưởng của phương pháp (thay thế ước lượng các hàm trạng thái không
phải xấp xỉ gần đúng như nhiều phương pháp hiện nay), tác giả vận dụng một số
kết quả nghiên cứu đã được công bố gần đây và sử dụng các cơ sở toán học nêu
trên để từng bước chứng minh cách giải quyết các vấn đề trong phương pháp
tổng hợp nhằm đạt được mục tiêu và nội dung nghiên cứu đề ra. Ngoài ra một
số cơ sở toán học quan trọng xây dựng trong luận án cũng được tác giả lập trình
mô phỏng trên Matlab để kiểm tra lại tính chính xác của các kết quả đạt được.
- 11 -
CHƢƠNG 2
ĐIỀU KHIỂN ỔN ĐỊNH CÁC HỆ THỐNG KHẢ TUYẾN TÍNH
HÓA PHẢN HỒI BẰNG PHƯƠNG PHÁP THAY THẾ ƯỚC
LƯỢNG HÀM TRẠNG THÁI
2.1. Giới thiệu chung
2.1.1. Đặt vấn đề
Một trong những vấn đề cơ bản trong lý thuyết điều khiển là nghiên cứu sử
dụng phản hồi để làm thay đổi động học của đối tượng nhằm đạt được đặc tính
theo ý muốn. Đối với hệ tuyến tính bất biến theo thời gian (LTI) vấn đề này
được gọi là đặt điểm cực, còn trong trường hợp tổng quát của hệ phi tuyến vấn
đề được gọi là tuyến tính hóa phản hồi (feedback linearization).
Tuyến tính hóa phản hồi trong hệ phi tuyến là tìm cách (nếu có) thay đổi tọa
độ không gian trạng thái qua phép biến đổi vi đồng phôi (diffeomorphism) toàn
cục và sử dụng luật phản hồi tĩnh để biểu diễn hệ thống trong không gian trạng
thái mới, tuyến tính và điều khiển được ([32], [50], [51]). Tuy nhiên trong nhiều
trường hợp phép biến đổi vi đồng phôi chỉ xác định trong lân cận của điểm cần
xét, khi đó phép biến đổi được gọi là cục bộ.
Các phương pháp tuyến tính hóa phản hồi chủ yếu đưa về dạng tuyến tính
hóa phản hồi trạng thái hay còn gọi là tuyến tính hóa đầu vào-trạng thái hoặc
tuyến tính hóa đầy đủ trạng thái, trong đó toàn bộ phương trình trạng thái được
tuyến tính hóa và dạng tuyến tính hóa phản hồi vào-ra hay còn gọi là tuyến tính
hóa không đầy đủ trạng thái, trong đó chỉ có ánh xạ đầu vào - đầu ra và một
phần phương trình trạng thái được tuyến tính hóa.
Trong chương này của luận án, các nghiên cứu tập trung vào phương pháp
điều khiển ổn định các hệ phi tuyến đưa được về dạng tuyến tính hóa phản hồi
trạng thái có dạng (2-6) và mở rộng đối với các hệ khả tuyến tính hóa phản hồi
- 12 -
vào-ra dạng (2-3) có các đặc tính không rõ trong phương trình động học do đây
là một trong những bài toán điển hình trong công nghiệp.
2.1.2. Biểu diễn các hệ thống khả tuyến tính hóa phản hồi
Xét hệ phi tuyến SISO có phương trình động học và đầu ra biểu diễn được ở
dạng sau:
( ) ( )
( )
u
y h
ξ ξξ f ξ g ξ
ξ
(2-1)
với 1( ) , , , ,T n d
n n dt ξ là vectơ trạng thái, 0d ; ( )u t ,
( )y t tương ứng là đầu vào điều khiển và đầu ra của đối tượng;
( ) n dξf ξ , ( ) n dξg ξ , ( )h ξ là các hàm phi tuyến đối với đối số ξ và
khả vi với bậc bất kỳ (hàm trơn).
Giả thiết hệ (2-1) có ξ 0 là điểm cân bằng của ( )ξf ξ , hay ( ) ξf 0 0 và
( ) 0h 0 ; ngoài ra hệ có bậc tương đối (relative degree) bằng n tại ξ 0 . Khi
đó tồn tại lân cận n dU của ξ 0 và phép đổi tọa độ
1( ) T ( ), ,T ( )T
n dT ξ ξ ξ định nghĩa trên U với nx , dq , ( ) T 0 0
và:
1
2
1
T ( ) ( )
T ( ) ( )
T ( ) ( )
T ( )( ) 0; 1, ,
nn
i
h
L h
L h
i n n d
ξ
ξ
f
f
ξ
ξ ξ
ξ ξ
ξ ξ
ξg ξ
ξ
(2-2)
để biểu diễn hệ trong không gian trạng thái mới ở dạng tuyến tính hóa phản hồi
vào-ra chuẩn tắc như sau:
- 13 -
1 2
1
1
( , )
( , ) ( , )
n n
n
x x
x x
x f g u
y x
q π x q
x q x q
(2-3)
với
1 1
2 2
1
( )T
( )T
T ( )nn n
hx
L hx
x L h
ξ
ξ
f
f
ξ
ξ
x
ξ
,
1 1T ( )
T ( )
n
d n d
q
q
ξ
q
ξ
,
1( , )
( , )
( , )d
x q
π x q
x q
và ( , ) ( )nf L hξf
x q ξ , 1( , ) ( )ng L L hξ ξg fx q ξ trong đó 1
xξ T
q.
Nếu ký hiệu
0 1 0 0 0
0 0 1 0 0
0 0 0 0 1
0 0 0 0 0
A
,
0
0
1
b
,
1
0
0
c
với : n nA ,
: 1nb , : 1nc thì phương trình (2-3) có thể viết dưới dạng:
( , )
( , ) ( , )
.T
f g u
y
q π x q
x Ax b x q x q
xc
q
(2-4)
Chọn luật phản hồi 1( , ) ( , )u g f x q x q , hệ vòng kín sẽ có dạng:
( , )
.Ty
q π x q
x Ax b
xc
q
(2-5)
- 14 -
Phương trình (2-5) cho thấy hệ được phân tích thành hai hệ con gồm một hệ
con tuyến tính có chiều n , biểu diễn quan hệ vào-ra (còn gọi là hệ con ngoại
động học [50]) và một hệ con (phi tuyến) có chiều d nhưng không có tác động
tới đầu ra của hệ (hệ con nội động học). Ngoài ra hệ con tuyến tính nêu trên (hệ
con ngoại động học) là điều khiển được và quan sát được, có hàm truyền là
( ) 1 nH s s hay có điểm cực bội bậc n tại 0s .
Phương trình động học của hệ con (phi tuyến) trên (hệ con nội động học) khi
x 0 là ( , )q π 0 q được gọi là động học không (zero dynamics, [32], [33]) của
hệ thống. Động học không cho biết đầu ra của hệ (2-4) luôn bằng 0 khi các
trạng thái ban đầu của hệ là 0( , ) ( , )x q 0 q hay x 0 nhưng 0 (0)q q có thể
chọn tùy ý và đầu vào của hệ phải đặt bằng 1( ) , ( ) , ( )u t g t f t 0 q 0 q với
( )tq là nghiệm của phương trình động học không với điều kiện ban đầu
0(0) q q . Ngoài ra có thể nhận thấy với mỗi tập hợp điều kiện ban đầu
0( , ) ( , )x q 0 q luôn tồn tại một đầu vào duy nhất giữ cho đầu ra luôn bằng 0.
Như vậy động học không còn có thể xác định được bằng cách giữ cho đầu ra
luôn bằng 0 bởi đầu vào thích hợp mà không nhất thiết phải biến đổi hệ sang
dạng chuẩn tắc.
Đặc tính ổn định của động học không đóng vai trò quan trọng trong phương
pháp tuyến tính hóa phản hồi vào-ra. Trường hợp 0d hay bậc tương đối bằng
với bậc của hệ phi tuyến, khi đó phép tuyến tính hóa là đầy đủ nghĩa là toàn bộ
quan hệ vào-ra được tuyến tính hóa và do vậy vấn đề bền vững của hệ đã được
giải quyết. Tuy nhiên trong trường hợp 0d thì chỉ hệ con ngoại động học
được tuyến tính hóa, hệ con nội động học là phi tuyến và không quan sát được
từ đầu ra. Khi đó đặc tính ổn định của hệ con nội động học được xác định từ
động học không.
Giống như trường hợp hệ tuyến tính có toàn bộ các điểm cực và các điểm
không nằm bên nửa mặt phẳng phức trái gọi là hệ pha tối thiểu (minimum-phase
system, [70]), hệ phi tuyến (2-1) có động học không có điểm cân bằng q 0 là
- 15 -
ổn định tiệm cận cũng được gọi là hệ pha tối thiểu và có thể dùng phản hồi trạng
thái để ổn định tiệm cận hệ ([32]). Nếu động học không có điểm cân bằng
không ổn định tiệm cận thì phương pháp tuyến tính hóa vào-ra không có ý nghĩa
thực tiễn do không đưa ra được luật điều khiển thực. Mục 2.3 sẽ phân tích vấn
đề này thông qua một phương pháp thiết kế để ổn định hệ trong trường hợp hệ
có chứa thành phần không rõ.
Lưu ý là trường hợp 0d thì hệ còn có thể biểu diễn được cả dưới dạng
tuyến tính hóa phản hồi trạng thái được phân tích trong mục 2.1.3 dưới đây.
2.1.3. Vấn đề trong điều khiển ổn định các hệ khả tuyến tính hóa phản hồi
trạng thái
Xét hệ phi tuyến SISO biểu diễn được dưới dạng phương trình trạng thái và
đầu ra sau:
1 2
1
1
( ) ( )
n n
n
x x
x x
x f g u
y x
x x
(2-6)
với ( 1)1 2 1 1 1, , , , , ,
TT n nnx x x x x x
x là vectơ trạng thái giả thiết đo
được của hệ phi tuyến; ( )u t , ( )y t tương ứng là các đầu vào điều khiển
và đầu ra của đối tượng; ( )f x , ( )g x là các hàm số thực liên tục bị chặn
thỏa mãn các điều kiện sẽ được giả thiết sau trong mỗi trường hợp. Hệ (2-6) còn
có thể biểu diễn ở các dạng:
( ) ( 1) ( 1)1 1 1 11 1 1
1
( ) ( 1) ( 1)
( , , , ) ( , , , )
( , , , ) ( , , , )
n n n
n n n
x f x x x g x x x u
y x
y f y y y g y y y u
(2-7)
hoặc
- 16 -
1
( ) ( )x f g u
y x
x A b x x với
0
0 0
IA , 0, ,0,1
Tb . (2-8)
Rõ ràng để hệ (2-6) điều khiển được ta cần ( ) 0g x với mọi x trong miền
hợp lệ n x . Ngoài ra do ( )g x liên tục nên sau đây ta luôn giả thiết rằng
( ) 0g x với mọi xx mà không làm mất tính tổng quát do trường hợp
( ) 0g x ta chỉ cần đảo dấu tín hiệu đầu vào u .
Bài toán đặt ra ở đây là cần tìm luật điều khiển phản hồi bị chặn ( )u v z với
z là vectơ chứa các tín hiệu đo được thích hợp đối với phương pháp thiết kế sao
cho đầu ra của hệ luôn bám theo được tín hiệu mẫu ( )r t cho trước bị chặn hay
véctơ trạng thái x của hệ phải bám theo được véctơ tín hiệu mẫu
( 1)1 2, , , , , ,
TT nnr r r r r r
r với 1 1/i i
ir d r dt , 1..i n . Ngoài ra
cũng giả thiết rằng tín hiệu mẫu có đạo hàm đến bậc n đã biết và véctơ tín hiệu
mẫu bị chặn bởi Mrr .
Sau đây là tổng hợp một số phương pháp giải hiện nay và vấn đề của các
phương pháp giải này trong 2 trường hợp. Trường hợp 1 xem xét với giả thiết
toàn bộ phương trình động học của hệ cần phân tích đã biết trong khi Trường
hợp 2 sẽ phân tích hệ phi tuyến với giả thiết có các thành phần không rõ trong
phương trình động học của hệ và đây cũng chính là vấn đề cần giải quyết của
luận án. Mặc dù các vấn đề trong Trường hợp 1 đã được giải quyết và không
nằm trong nội dung phát triển mới của luận án, tuy nhiên để thuận tiện cho việc
trình bày và theo dõi, luận án xem xét vấn đề trong cả hai trường hợp.
Trƣờng hợp 1
Trường hợp ( )f x , ( )g x đã biết hoàn toàn, khi đó bằng phương pháp tuyến
tính hóa phản hồi kinh điển ([50], [51], [57]), đặt ( 1)
1 1 1, , ,T
ne e e
e x r
là sai số bám với ( 1), , ,T
nr r r
r thì động học của sai số bám là:
- 17 -
( )( ) ( ) nf g u r e x r Ae b x x (2-9)
Sử dụng luật điều khiển phản hồi:
1 ( )( ) ( ) n Tu g f r x x k e (2-10)
với 1 2, , ,Tnk k kk được chọn sao cho 1
1n n
nx k x k là đa thức
Hurwitz (có toàn bộ các nghiệm nằm bên nửa trái của mặt phẳng phức) dẫn đến
( )T T ke Ae bk e A bk e A e .
Chọn hàm Lyapunov TV e Pe với P là ma trận đối xứng xác định dương
thì ( )T T T TV k ke Pe e Pe e PA A P e . Rõ ràng là cần chọn P sao cho
T k kPA A P Q với Q cũng là ma trận đối xứng xác định dương để hệ vòng
kín ổn định và do đó lim 0t
e .
Trƣờng hợp 2
Trường hợp 2 có thể xem xét dưới nhiều điều kiện giả thiết khác nhau. Trước
tiên xét trường hợp giả thiết ( )f x đã biết và ( )g x là hàm phi tuyến chưa biết
hoặc có chứa thành phần chưa biết thỏa mãn ( ) 0Lg g x với xx , khi đó
phương pháp giải thông thường là thiết kế mặt trượt và luật điều khiển phản hồi
trạng thái để quỹ đạo trạng thái của hệ luôn chuyển động bám xung quanh mặt
trượt này ([50], [51]). Ngoài ra một khi trạng thái của hệ nằm trên mặt trượt thì
cần giữ để quỹ đạo trạng thái không thoát ra khỏi mặt trượt đó. Đối với bài toán
bám ở đây, ta cần thiết phải ổn định gốc của hệ phương trình sai số sau:
1 2
1
( )( ) ( )
n n
nn
e e
e e
e f g u r
x x
(2-11)
Nếu coi ne là đầu vào điều khiển của hệ 1n phương trình đầu tiên trong
(2-11) thì gốc của hệ được ổn định bởi luật điều khiển tuyến tính:
- 18 -
1 1 1 1n n ne k e k e
với 1 1.. nk k được chọn sao cho đa thức 11 1
n nnx k x k là Hurwitz. Khi
đó thiết kế mặt trượt là 1 1 1 1 0n n ns k e k e e thì:
( )1 2 1 ( ) ( ) n
n ns k e k e f g u r x x .
Bằng luật điều khiển phản hồi:
1 ( )1 2 1( ) ( ) n
n nu g k e k e f r v x x
với ( )g x là mô hình thay thế của ( )g x ta có thể biểu diễn s ở dạng:
( ) ( , , )s g v t v x x (2-12)
Giả thiết:
0( , , )
( )( )
t vv
g
xx
x, 00 1 (2-13)
với mọi ( , , ) 0,t v D x , nD trong đó ( ) x và 0 đã biết, khi đó
chọn ( )sign( )v s x với
1 0
sign( ) 0 0
1 0
s
s s
s
, 00
( )( )
1
xx , 0 0 và
hàm Lyapunov 21
2V s thì đạo hàm của V theo quỹ đạo động học (2-12) của
mặt trượt sẽ là:
0 0
0 00
0 0
( ) ( )sign( ) ( , , )
(1 )
(1 )1
(1 ) L
V ss sg s s t v
g s g s g s
g s
g s
x x x
Rõ ràng là với mô hình thay thế đáp ứng điều kiện giả thiết (2-13) nêu trên
thì sai số bám sẽ luôn tiến đến 0 khi t .
▲
- 19 -
Vấn đề trở nên phức tạp hơn trong trường hợp đặc tính phi tuyến của cả
( )f x và ( )g x đều chưa biết hoặc có chứa thành phần không rõ. Khi đó các
phương pháp giải chủ yếu theo hướng điều khiển thích nghi ([40], [50], [52],
[53], [54], [56], [57], [60], [61], [62], [63], [72], [73], [75], [81], [92], [94], [95],
[98], [104], [105]) có thể tổng hợp như dưới đây.
1. Tìm cách thay thế ( )g x bằng mô hình xấp xỉ gần đúng ( , )g x θ với θ là
véctơ tham số hay các trọng số ước lượng của mô hình.
Để đảm bảo mô hình gần đúng luôn đáp ứng ( , ) 0g x θ với xx , một
số phương pháp giải quyết như sau:
a) Chọn tham số khởi tạo ban đầu (0)θ gần nhất với giá trị tối ưu bằng
phương pháp luyện ngoại tuyến trước khi đưa vào hoạt động ([92]).
b) Sử dụng các thuật toán quy chiếu (projection) với một số giả thiết đã biết
khác về hệ cho phép xác định θ để ( , ) 0g x θ ([72], [73]).
c) Sử dụng mạng nơron hoặc hệ mờ để xấp xỉ đảo của ( )g x nếu Hg g với
Hg đã biết ([56]).
d) Thiết kế bộ điều khiển thích nghi có chứa thành phần điều khiển theo chế
độ trượt để giữ cho biên độ của tín hiệu điều khiển bị chặn ([50]).
e) Xây dựng hàm Lyapunov sửa đổi cho phép cấu trúc bộ điều khiển thích
nghi dựa trên hàm Lyapunov để tránh trường hợp 0 nêu trên ([81], [104]).
2. Đưa ra mô hình thay thế hỗn hợp các hàm ( )f x , ( )g x :
a) Sử dụng các mô hình cục bộ và xấp xỉ tuyến tính đối với tham số cũng
như dùng phương pháp quy chiếu tham số (parameter projection) để giải
quyết vấn đề ( ) 0g x với ( )g x là ước lượng của ( )g x trong mô hình
hỗn hợp ([53], [60], [61], [62]).
b) Dùng mô hình điều khiển mờ thích nghi bền vững giải quyết trường hợp
0 nêu trên thay cho sử dụng phương pháp quy chiếu tham số và chuyển
đổi liên tục tín hiệu đầu vào điều khiển ([54])
- 20 -
3. Thiết kế mô hình xấp xỉ tín hiệu điều khiển phản hồi (2-10) dùng mạng
nơron hoặc hệ mờ ([57]).
▲
Đặc điểm chung của các phương pháp giải hiện nay là sử dụng các mô hình
thay thế để xấp xỉ các thành phần không biết (với các điều kiện giả thiết về giới
hạn khác nhau) và phải giải quyết vấn đề ( , ) 0g x θ trong mô hình thay thế.
Ngoài ra do mô hình xấp xỉ có nhiều đầu vào (các trạng thái, sai số, tín hiệu
mẫu và các đạo hàm) nên phải xác định được tham số ban đầu để luật chỉnh
định tham số hoạt động đúng cũng như phần lớn đều giả thiết rằng mô hình xấp
xỉ đảm bảo sai số trong miền làm việc của quỹ đạo trạng thái. Mặc dù một số
kết quả nghiên cứu công bố gần đây ([53], [54], [71], [93], [103], [105]) đã giải
quyết được vấn đề xác định tham số và đơn giản hơn do luật điều khiển phản
hồi luôn đảm bảo không xảy ra ( ) 0g x tuy nhiên chỉ giới hạn trong các điều
kiện của tác giả. Về mặt ứng dụng, các tác giả không chỉ rõ mô hình thực tế nên
chưa đánh giá được tính khả thi của các phương pháp đề xuất khi áp dụng trên
thiết bị điều khiển công nghiệp.
Với những vấn đề đã nêu, luận án sau đây đi vào nghiên cứu, đề xuất một
phương pháp tiếp cận mới dựa trên ý tưởng thay thế ước lượng (không cần gần
đúng) các hàm trạng thái chưa biết và sử dụng hệ mờ và mạng nơron để giải
quyết vấn đề bù sai lệch do phép thay thế ước lượng gây nên. Phương pháp tiếp
cận mới nhằm đơn giản hóa việc thiết kế mô hình thay thế nhờ tránh phải giải
quyết một số vấn đề thường gặp trong các phương pháp nêu trên. Ngoài ra luận
án cũng xây dựng mô hình phần mềm ứng dụng nhằm thử nghiệm, đánh giá khả
năng áp dụng phương pháp trên các hệ thống điều khiển công nghiệp. Các cơ sở
lý thuyết để xây dựng phương pháp mới được tác giả sử dụng bao gồm phương
pháp phân tích dựa trên hệ sai số, điều khiển phi tuyến ổn định theo tiêu chuẩn
Lyapunov, lý thuyết xấp xỉ vạn năng mờ nơron và điều khiển thích nghi trực
tiếp được tác giả trích dẫn chủ yếu trong các tài liệu [32], [50], [51], [57], [66]
và [68].
- 21 -
2.2. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi trạng
thái bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái
2.2.1. Cơ sở toán học của phương pháp
Phương pháp thay thế ước lượng hàm trạng thái trong luận án được đề xuất
nhằm giải quyết bài toán đã nêu trên cơ sở phân tích tính bền vững của hệ vòng
kín cũng như theo hướng phát triển các bộ điều khiển thích nghi cho các ứng
dụng công nghiệp. Trước khi đi sâu vào cơ sở toán học của phương pháp, ta
xem xét một phương pháp tiếp cận khác ([57]) dựa trên định nghĩa hệ sai số
thỏa mãn Giả thiết 1 dưới đây có thể áp dụng cho các hệ phi tuyến SISO tổng
quát ở dạng:
( ) ( )
( )
u
y h
x f x g x
x
(2-14)
với 1 2( ) , , ,T n
nt x x x x là vectơ trạng thái; ( )u t , ( )y t là các đầu
vào điều khiển và đầu ra của đối tượng; ( ) nf x , ( ) ng x , ( )h x là các
hàm phi tuyến đối với đối số x của chúng và khả vi với bậc bất kỳ (hàm trơn).
Giả thiết 1: Hệ sai số ( , )tE x được định nghĩa sao cho E 0 thì ( ) ( )y t r t và
( , )t xx E với mọi t , : x là hàm số bị chặn với E bị chặn và
( , )t u x không giảm dần (nondecrescent) đối với u khi t không đổi.
Nếu Giả thiết 1 được thỏa mãn thì khi hệ sai số bị chặn cũng có nghĩa là quỹ
đạo trạng thái của hệ cũng bị chặn. Mặt khác nếu tồn tại tín hiệu ( )t E với
mọi t thì ( , )t xx do ( , )t x không giảm dần đối với . Như vậy
với Giả thiết 1, hệ sai số không chỉ là phép đo chất lượng của hệ vòng kín mà
còn cho biết đặc tính bị chặn đối với các trạng thái của hệ.
Ngoài ra với phương trình động học (2-14) và hệ sai số được chọn thỏa mãn
Giả thiết 1, ta có thể sử dụng động học của hệ thống để tính động học hệ sai số
như sau:
- 22 -
( , ) ( ) ( ) ( , ) ( )t u t ut t
E E E EE x x f x g x α x β x
x x . (2-15)
Phần tiếp theo cho thấy để giải quyết bài toán của hệ (2-6), ta luôn lập được
hệ sai số thích hợp thỏa mãn Giả thiết 1 mà không cần phải đưa thêm bất cứ
điều kiện ràng buộc nào khác.
Trƣờng hợp 1
Áp dụng phương pháp lập hệ sai số ([57]) trong giải bài toán của hệ (2-6)
trong trường hợp ( )f x , ( )g x xác định dẫn đến phương pháp giải sau đây. Định
nghĩa hệ sai số:
( 1)( , ) ,1
nT T TE E E nE t x r
x k e k e k d (2-16)
với ,1T TE
k k , 1 1, ,TE nk k k ,
( 2)
1 2 1, , ,Τ
nE nx r x r x r
d ,
e x r và 1 21 1
n nns k s k là Hurwitz. Lưu ý rằng E ở đây là đại
lượng vô hướng thay vì dùng vectơ e như phương pháp giải trình bày trong
phần trước. Giả sử hệ sai số (2-16) thỏa mãn Giả thiết 1, khi đó động học của hệ
sai số có dạng:
( )( ) ( ) ( , ) ( )T nE EE f r g u t u k d x x x x (2-17)
với ( )( , ) ( )T nE Et f r x k d x và ( ) ( )g x x .
Chọn hàm Lyapunov 21
2V E và sử dụng luật điều khiển:
1( ) ( , )u t E x x (2-18)
với 0 sẽ cho kết quả 2( , ) ( ) 2V E t u E V x x nên 0E là
điểm cân bằng ổn định theo hàm mũ (exponentially stable) của hệ sai số. Bổ đề
dưới đây (tổng hợp từ các kết quả trong [57]) cho thấy hệ sai số được định nghĩa
như trên (điểm cân bằng ổn định) thì cũng thỏa mãn Giả thiết 1.
- 23 -
Bổ đề 1 : Hệ sai số định nghĩa bởi (2-16) cho bài toán bám của hệ (2-6) thỏa
mãn Giả thiết 1.
Chứng minh bổ đề trên được trình bày trong Phụ lục mục 5.2 trang 136.
▲
Có thể thấy trong trường hợp này, các luật điều khiển phản hồi (2-10) và
(2-18) trong hai phương pháp về cơ bản là giống nhau do thành phần phản hồi
trong cả hai phương pháp đều tuyến tính. Tuy nhiên với phương pháp thiết kế
dựa trên hệ sai số có thể đưa thành phần phản hồi phi tuyến vào hệ sai số để
nâng tính bền vững của hệ vòng kín như sẽ thấy ở phần sau của luận án này.
Trƣờng hợp 2
Trước tiên ta xem lại Bổ đề 2.1 trong tài liệu [57] dùng để phân tích tính bị
chặn của hệ sai số được phát biểu như sau: Nếu ( , ) : nV t E là hàm
số xác định dương và 1 2V m V m với 1 0m , 2 0m là các hằng số bị chặn
thì 12 2
1 1
( , ) (0)m tm m
V t V em m
E với mọi 0t .
Chứng minh bổ đề bằng cách gọi 1 2m m và chọn (0) (0) 0V
thì 12 2
1 1
( ) (0)m tm m
t V em m
, mặt khác từ V (hay V luôn giảm nhanh
hơn hoặc bằng so với ) và (0) (0)V suy ra ( , ) ( )V t tE với 0t .
Lưu ý là bổ đề trên cũng cho biết 2 1V m m khi t và nếu
( , )V t E E với K E (hàm thuộc lớp K ) thì 12 1lim
tm m
E .
▲
Trường hợp ( )f x , ( )g x có chứa các thành phần không rõ, giả thiết rằng từ
số liệu đo và hiểu biết về hệ thống ta có thể tìm được các hàm số
( ) ( ) ( )ff f x x x , ( ) ( ) ( )gg g x x x để tính gần đúng được nx như sau:
- 24 -
( ) ( ) ( ) ( ) ( ) ( )
( , )
n f g
n dxn
x f g u u
x u
x x z x x z
x
(2-19)
với dxn n n f gx x u là sai số giữa tín hiệu xấp xỉ nx với tín hiệu nx
và dxn W , 0W cho trước với mọi x , u trong miền hợp lệ n x và
u . Tiếp tục định nghĩa hệ sai số như (2-16) trong Trường hợp 1, khi đó
đạo hàm của hệ sai số theo thời gian sẽ là:
( )
( )
( ) ( ) ( )
T nE E n
T nE E n dxn
T nE E dxn
E x r
x r
r f g u
k d
k d
k d x x
hay với ký hiệu ( )( , ) ( )T nE Et r f x k d x , ( ) ( )g x x thì:
( , ) ( ) ( , )dxnE t u u x x x (2-20)
Sử dụng luật điều khiển phản hồi:
1
1 ( )
( ) ( ) ( , )
( ) ( )T nE E
u t E
g r f E
z x x
x k d x (2-21)
với 0 và ,T Tt
z x là véctơ đo được thì phương trình động học của hệ sai
số trở thành:
( , )dxnE E u x . (2-22)
Lưu ý là z trong luật điều khiển phản hồi (2-21) chỉ chứa t xuất hiện rõ
trong trường hợp ( )r t có đạo hàm là hàm số có chứa t .
Chọn hàm Lyapunov xác định dương 21
2( )V E E và tính đạo hàm của V
theo (2-22) ta được:
- 25 -
2
212
22
2
1
2 2
2
dxnV EE E E
V E W E
WV W E
WV
(2-23)
Áp dụng Bổ đề 2.1 ([57]) với 1m , 2
22
Wm
dẫn đến V bị chặn và do đó
E cũng bị chặn:
2 2 2
2 2 2(0) 1 (0)
2 2 2
t t tH
W W WV V e e V e V
2
2
21 (0) .t t
HW
E e E e E
(2-24)
Kết quả (2-23) cho thấy 0V khi 2
22
WV
và từ (2-24):
2
22
1
lim2
Ht
m WV V
m
, 2
1
2lim Ht
m WE E
m
(2-25)
do vậy nếu đủ lớn thì có thể xác định HE trong chế độ xác lập nhỏ tùy ý.
Ngoài ra nếu phép xấp xỉ nx càng chính xác bao nhiêu (sai số xấp xỉ W càng
nhỏ) trong miền hợp lệ của x và u thì E hay giới hạn HE khi t của hệ
sai số càng nhỏ bấy nhiêu.
Biết rằng 0V khi 2
22
W WV V V E
hay 2
1
2m WE E
m ,
do đó ta còn có thể suy luận như sau: 0V V E E E V .
Như vậy nếu 0V V E với 0 (0)V V là V ban đầu tại 0t thì
0 V V E với mọi 0t do V là hàm số xác định dương nên không thể
- 26 -
tăng lớn hơn V E . Trường hợp 0V V E thì rõ ràng 0V cho đến khi
V V E . Tóm lại kết quả (2-24) còn có thể viết như sau:
0
0
0 max ,
max ,
V V V E
E E E
(2-26)
với mọi 0t , 0 (0)E E là giá trị ban đầu của hệ sai số tại 0t và 2
0 01
2V E
.
▲
Các kết quả trên cho thấy với luật điều khiển phản hồi (2-21) chất lượng của
hệ vòng kín chỉ phụ thuộc vào sai số xấp xỉ nx và không nhất thiết phải xác
định được chính xác các hàm ( )f x , ( )g x có chứa các thành phần không rõ. Nói
cách khác thay vì phải xấp xỉ gần đúng từng hàm ( )f x , ( )g x với sai số cần
thiết hoặc sử dụng các mô hình xấp xỉ như trong nhiều phương pháp khác ([40],
[52], [53], [54], [56], [60], [61], [62], [63], [72], [73], [75], [92], [94], [95], [98],
[103], [104], [105]), ta có thể xấp xỉ ( )f x , ( )g x với sai số tùy ý miễn sao sai số
xấp xỉ nx thỏa mãn dxn W trong miền hợp lệ của xx và uu (lưu ý
là điều kiện sai số xấp xỉ không cần đáp ứng ngoài miền hợp lệ).
Ngoài ra với mỗi 0W cho trước và với :u Mu u u u , 0Mu
luôn tồn tại các cặp hàm trạng thái ( )f x , ( )g x liên tục bị chặn đáp ứng điều
kiện xấp xỉ ví dụ như trường hợp các hàm thay thế thỏa mãn:
gM
W
u , 0 f g MW u (2-27)
do khi đó dxn f g f g Mu u W .
Tuy nhiên ngay cả trường hợp không xác định được cặp hàm thay thế thỏa
mãn hay cặp hàm thay thế không đáp ứng điều kiện sai số xấp xỉ (2-27) nêu trên
ta vẫn có thể áp dụng được phương pháp nếu như bù được sai số xấp xỉ do phép
- 27 -
ước lượng các thành phần không rõ gây nên. Trong thực tế có nhiều cách để xác
định cặp hàm thay thế từ số liệu đã biết về hệ thống ví dụ như ta có thể định
nghĩa trước hàm ( )f x và ( ) 0g x dựa trên các thành phần đã biết và tìm cách
bù sai số xấp xỉ do các thành phần không rõ gây nên thông qua luật điều khiển
phản hồi sao cho đạo hàm của V theo (2-22) thỏa mãn (2-23) hay
2
2
WV V
trong miền hợp lệ của x và u . Như vậy bài toán điều khiển để
hệ vòng kín ổn định trong trường hợp này trở thành bài toán xấp xỉ nx với độ
chính xác cần thiết và vấn đề đảm bảo các điều kiện về trạng thái và đầu vào
trong miền hợp lệ. Phương pháp giải quyết các vấn đề này sẽ được trình bày chi
tiết trong Chương 3.
Do đặc điểm của phương pháp là để xấp xỉ nx không nhất thiết phải xấp xỉ
riêng từng hàm trạng thái với sai số cần thiết mà có thể thay thế bằng cặp hàm
ước lượng như đã phân tích mà trong luận án này phương pháp được gọi là
phương pháp thay thế ước lượng hàm trạng thái. Phần sau của luận án sẽ phân
tích phương pháp thay thế ước lượng các hàm trạng thái sử dụng điều khiển mờ
nơron nhằm thích nghi với các thay đổi không rõ trong hệ sai số.
▲
Tính chất bị chặn tới hạn đều của hệ sai số
Giả sử tìm được cặp hàm trạng thái thay thế để điều kiện xấp xỉ nx được
thỏa mãn, khi đó tiếp tục biến đổi biểu thức:
1 1 1
1 1 1 1 1 11 1 1
1
1 1 1 1 1 1 2 11
( ) ( )
( ) , , ,
0
n n nT TE E i i i i i i i i
i i i
n
i i i ni
T
T
E
E k x r k x r k e k e
k k e k e k k k k
k d k e
e
k e η ek
ta có thể biểu diễn lại luật điều khiển phản hồi (2-21) như sau:
- 28 -
1 ( )( ) ( )n Tu u g r f x η e x (2-28)
với 1 1 2 1, , ,T
nk k k k η .
Do ( )( ) ( ) n Tnx f g u r x x η e nên:
( )1 1 1
1
,
,1 , ,
( )
dxn n n
Tn
TnT
dxn
u x x
e
e e e
e
x
η e
η
(2-29)
hay dxn cũng là hàm của 1e . Mặt khác từ phép chọn 1 1, , ,1Tnk k k để đa
thức 1 21 1
n nns k s k là Hurwitz nên các số hạng của
1,1 , , ,1Tn
η cũng lập thành đa thức Hurwitz:
11 2
11 1 2 1
11 2
( ) ( )
( )( ).
n nn
n nn
n
s s s
k k k s k s s
s k k s s
(2-30)
Biểu diễn quan hệ (2-29) qua phép biến đổi Laplace:
1 11 2
11 2
1( ) ( )
( )
1( )
( )( )
n
dxnn
E s E sk k s s
ss k k s s
(2-31)
với 1( )E s , ( )E s và ( )dxn s tương ứng là biến đổi Laplace của 1( , )e t x , ( , )E t x
và 1( )dxn e suy ra:
- 29 -
11 1
11 1
1 1lim lim lim
1lim lim
1lim lim
dxnt t t
dxnt t
dxnt t
e Ek k
We
k k
WE
(2-32)
hay với luật điều khiển phản hồi (2-28), giới hạn sai số bám đầu ra 1e y r
trong chế độ xác lập bị chặn phụ thuộc vào các giá trị 1, , k W được chọn
trong thiết kế. Lưu ý là 1 ik s chính là giá trị tuyệt đối của tích toàn bộ các
nghiệm của đa thức Hurwitz (2-30). Ngoài ra do ( )n Tnx r η e nên điều kiện
xấp xỉ còn có thể viết dưới dạng:
( )n Tdxn nr x W η e (2-33)
Như vậy trong bài toán bám của hệ phi tuyến (2-6) ở trường hợp 2, bằng
phương pháp lập hệ sai số (2-16) và sử dụng luật điều khiển phản hồi (2-21),
nếu ta coi E là trạng thái của hệ sai số thì kết hợp các kết quả trên, dẫn đến phát
biểu của Định lý 1 dưới đây về tính chất bị chặn của nghiệm của phương trình
động học hệ sai số (2-20) trong phương pháp thay thế ước lượng hàm trạng thái.
Định lý 1 : Phương trình động học hệ sai số (2-20) có nghiệm bị chặn tới hạn
đều (uniformly ultimately bounded) theo (2-26) và giới hạn sai số bám đầu ra
trong chế độ xác lập theo (2-32), nếu xác định được các hàm số liên tục, bị
chặn ( ) 0g x và ( )f x để với luật điều khiển phản hồi tĩnh (2-28) thì điều kiện:
( )n Tnr x W η e (2-34)
luôn thỏa mãn với mọi n xx , uu và 0W cho trước.
- 30 -
Chứng minh
Theo định lý về điều kiện bị chặn tới hạn đều ([51], [57]), việc chứng minh
nghiệm của phương trình động học (2-20) với luật điều khiển phản hồi (2-28) bị
chặn tới hạn đều (hay bị chặn cuối đồng đều) thực chất là phải chỉ ra được các
hàm số 1 2( ), ( )E E K (hàm lớp K ) và 3( )E K (hàm lớp K ) xác
định trên 0, thỏa mãn:
1 2
3
( ) ( ) ( )
( ) ( )
E V E E
VV E E E
E
(2-35)
với E R và ( )V E là hàm số khả vi liên tục xác định trên E R .
Chọn 21
1 2 2( ) ( ) ( )E E V E E là các hàm lớp K , ta cần tìm
3( )E K thỏa mãn (2-35) khi E R . Từ (2-23) có thể biến đổi tiếp như sau:
2 2
2
1
( ) (1 )2 2
( ) (1 )2
W WV E V V V
WE V
với 0 1 nên nếu chọn 3 1( ) ( )E E thì
2
3( ) ( ) (1 )2
WV E E V
. Để 3( ) ( )V E E cần thiết
2
22(1 )
WV
hay khi 1
WE R
.
Rõ ràng các hàm 1 2 3( ), ( ), ( ), ( )E E E V E được chọn như trên luôn
thỏa mãn điều kiện (2-35) nên Định lý 1 đã được chứng minh.
▲
- 31 -
2.2.2. Tính bền vững của hệ vòng kín trong phương pháp
Nâng cao tính bền vững của hệ vòng kín
Phương pháp thay thế ước lượng hàm trạng thái nêu trên xuất phát từ giả
thiết thành phần sai số dxn W bị chặn với 0W cho trước, từ đó sử dụng
luật điều khiển phản hồi trạng thái tĩnh (2-28) để 2
2
WV V
và do đó hệ
vòng kín có sai số E cũng bị chặn theo (2-26). Ngoài ra quan hệ (2-32) cho
thấy luôn tồn tại sai số đầu ra có quan hệ tỷ lệ thuận với sai số xấp xỉ trong chế
độ xác lập. Nhằm tìm cách bù trừ ảnh hưởng của sai số xấp xỉ, sau đây tiếp tục
phân tích phương pháp theo hướng nâng cao tính bền vững của hệ vòng kín để
giải quyết vấn đề này.
Kết quả dưới đây cho thấy nếu tồn tại hàm 1Φ( , ) : nu x thỏa mãn
điều kiện ( , )dxn u x với xx , uu thì về lý thuyết có thể loại trừ
hoàn toàn ảnh hưởng của sai số xấp xỉ dxn trong phương trình động học sai số
(2-20) bằng cách đưa thêm thành phần bù cu vào luật điều khiển phản hồi, hay
cu u u với 1 ( )( ) ( )n Tu g r f x η e x , 1 1 2 1, , ,Tnk k k k η
là thành phần phản hồi theo (2-28).
Từ phương trình động học của hệ sai số:
( , ) ( )
( , ) ( ) ( )
( )
c dxn
c dxn
c dxn
E t u u
t u u
E u
x x
x x x
x
(2-36)
trong đó ( ) ( )( , ) ( ) ( )T n T n
E Et r f E r f x k d x η e x , ( ) ( )g x x dẫn
đến đạo hàm của hàm Lyapunov theo (2-36) sẽ là:
2 ( ) c dxnV EE E E u E x
- 32 -
Rõ ràng nếu xác định được cu để 0V với 0E thì hệ vòng kín sẽ ổn
định và loại trừ được giới hạn sai số bám đầu ra 1limt
e
trong (2-32). Từ bất
đẳng thức trên suy ra Φ( , )sign( )
( )c
E u Eu
x
x
với và
1 0
sign( ) 0 0
1 0
E
E E
E
luôn đáp ứng được yêu cầu này do:
2
2
2
( ) Φ( , )
( ) Φ sign( ) Φ
( ) 0 0.
cV E E u E u
E E E E
E E
x x
(2-37)
Khi đó với thành phần bù cu nêu trên, luật phản hồi (2-28) trở thành:
1 ( )( ) ( ) Φ( , )sign( )n Tcu u u g r f E u E x η e x x (2-38)
hay khi 0 có thể biểu diễn gọn lại dưới dạng:
1 ( )( ) ( ) Φ( , )sign( )n Tu g r f u E x η e x x (2-39)
Tuy nhiên kết quả (2-39) có chứa thành phần sign( )E không liên tục nên nếu
Φ( , )ux là hàm liên tục thì có thể thay thế gần đúng sign( )E bằng một hàm liên
tục để tín hiệu điều khiển là liên tục. Sau đây đề xuất và phân tích sử dụng hàm
xíchma lưỡng cực:
2 1
bsig( , ) 11 1
E
E E
eE
e e
(2-40)
trong phương pháp với 0 là hệ số góc tại điểm uốn 0E của hàm. Do
sign( ) lim bsig( , )E E
nên với thành phần bù:
Φ( , )
bsig( , )( )
cu
u E
x
x
(2-41)
luật điều khiển phản hồi sẽ liên tục và có dạng:
- 33 -
1 ( )( ) ( ) Φ( , )bsig( , )n Tu g r f u E x η e x x . (2-42)
Nếu ký hiệu:
ε( , ) 1 sign( )bsig( , )
μ( , ) ε( , )
E E E
E E E
(2-43)
thì 0 ε 1 (Hình 1) và:
2
2
2
Φ sign( )bsig( , ) Φ
Φ ε( , )
Φμ( , )
V E E E E E
E E E
E E
(2-44)
Hình 1 : Hàm ε( , ) 1 sign( )bsig( , )E E E
Biết rằng hàm xíchma lưỡng cực bsig( , ) bsig( , )E E là hàm lẻ nên
suy ra ε( , )E là hàm chẵn không âm và do đó μ( , ) μ( , )E E cũng là hàm
chẵn không âm (Hình 2). Như vậy để tìm cực đại của hàm μ( , )E ta chỉ cần xét
hàm μ ( , ) μ( , )E E với 0,E và 0 để tìm (các) điểm cực trị của
hàm μ , từ đó suy ra (các) điểm cực trị còn lại của μ( , )E đối xứng qua trục
tọa độ tung và xác định giá trị cực đại.
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 10
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
E
( ,E) = 1 - sign(E)bsig( ,E)
= 5
= 10
= 100
- 34 -
Hình 2 : Hàm μ( , ) ε( , )E E E
Từ μ ( , ) 1 bsig( , ) 21
E
E
EeE E E
e
, tính đạo hàm của μ theo E ta
được
2
2μ ( , ) 1
1
EE
E
d eE E e
dEe
hay hàm μ có cực trị (cũng là
cực đại) tại mE E là nghiệm của phương trình:
1 EE e . (2-45)
Để giải phương trình (2-45), ta dùng Bổ đề 2 sau:
Bổ đề 2 : Nghiệm của phương trình xx b a với 0a là
w ln( )
ln( )
ba ax b
a
với w( )x là hàm Lambert và ln( )a là logarit cơ số tự
nhiên của a .
-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 10
0.02
0.04
0.06
0.08
0.1
0.12
E
(,E) = E. (,E)
= 5
= 10
= 100
0.1114
0.0557
0.0056
- 35 -
Có thể chứng minh Bổ đề 2 từ định nghĩa hàm Lambert ([85]) với
ln( )bx a a và lưu ý 1/ln( )ae a .
▲
Áp dụng Bổ đề 2 với 1/a e , 1b thu được nghiệm của phương trình
(2-45) là 1 w(1 / )mE e với w(1/ )e là hàm Lambert của 1/ e (Hình 3) và:
1 w(1/ )
1 w(1/ )
1 w(1/ ) 1.2785
0.5569μ ( , ) 2 2
11
m
m
m
E em
m mE e
eE
E e eE E
ee
(2-46)
Hình 3 : Hàm Lambert w( )w( ) xx e x
Như vậy μ( , )E nhận giá trị cực đại tại các điểm mE E . Ví dụ giá trị cực
đại của hàm μ( , )E trong các trường hợp minh họa trên Hình 2 tương ứng sẽ là
μ(5, 0.2557) 0.1114 , μ(10, 0.1278) 0.0557 và μ(100, 0.0128) 0.0056 .
Thay (2-46) vào (2-44) thu được:
2 0.5569
Φμ( , ) 2 Φ.mV E E V
(2-47)
-1 0 1 2 3 4 5-1
-0.5
0
0.5
1
1.5
x
w
(x)
w(x)ew(x)=x
e1/e
0.2785
-1/e
Lambert W Function
- 36 -
Kết quả (2-47) cho thấy 0V khi 0.5569
Φ2
V
hay 0.5569
ΦE
và áp
dụng Bổ đề 2.1 ([57]) với 1 2m , 20.5569
m
dẫn đến:
2 2 2
2 2 2 *
* *
0.5569Φ 1 (0)
2
0.5569Φ 1 (0)
0.5569lim lim .
t t
t tH
Ht t
V e V e
E e E e E
E E
(2-48)
Tóm lại, các kết quả trên cho thấy nếu xác định được hàm Φ( , )ux sao cho
2( , ) Φ( , )0.5569
dxn u u E
x x với xx , uu thì hệ vòng kín sẽ ổn
định; nếu 2Φ( , )0.5569
u E
x thì nghiệm của hệ sai số luôn bị chặn theo (2-48).
▲
Trường hợp Φ( , )u Wx , luật điều khiển phản hồi và giới hạn nghiệm của hệ
sai số sẽ là:
1 ( )
* *
( ) ( ) bsig( , )
0.5569lim .
n T
Ht
u g r f W E
E E W
x η e x
(2-49)
Khi đó từ các kết quả (2-25), (2-49) dẫn đến:
*
* *
0.5569
0.5569lim H
t H
E E
E E
E E W
(2-50)
- 37 -
hay với luật điều khiển phản hồi (2-49) có chứa thành phần bù bị chặn, giới hạn
của hệ sai số trong chế độ xác lập luôn nhỏ hơn so với trường hợp không có
thành phần bù ( *E E ) nếu hệ số góc được chọn thỏa mãn:
0.5569
0.5569W E
. (2-51)
Tính bền vững của hệ vòng kín đối với đặc tính không rõ trong hệ sai số
Các kết quả (2-48), (2-50) cho thấy bằng cách đưa thêm thành phần bù phản
hồi trong hệ vòng kín có thể bù trừ ảnh hưởng của sai số xấp xỉ do phép ước
lượng gây nên. Như vậy phương pháp này cũng có thể áp dụng đối với thành
phần không rõ xuất hiện trong phương trình động học của hệ sai số có dạng:
( , ) ( ) ( , )
( , ) ( ) ( ) ( , )
u dxn
dxn u
E t u t
t u t
x x x
x x x x
(2-52)
với ( , )u t x là thành phần không rõ.
Trường hợp thành phần không rõ ( , ) 0u t x , các kết quả (2-23), (2-47) ở
trên cho thấy luôn tồn tại luật điều khiển phản hồi u u để hệ vòng kín ổn định
có nghiệm bị chặn nhờ phương pháp phân tích sử dụng hàm Lyapunov xác định
dương 212
V E để đạo hàm theo quỹ đạo động học (2-52) của hệ sai số thỏa
mãn 1 2V m V m với 1 20, 0m m .
Giả thiết rằng ( , ) ( )u t x x với 0 là hằng số chưa biết bị chặn và
( ) : n x là hàm liên tục không âm bị chặn đã biết, khi đó sử dụng luật
điều khiển phản hồi trạng thái:
u u u (2-53)
với u là thành phần bù dẫn đến:
( , ) ( ) ( ) ( , )dxn uE t u t u x x x x
- 38 -
1 2
1 2
dxn u
u
V EE E Eu E E u
m V m E u
m V m E Eu
(2-54)
Kết quả (2-54) cho thấy nếu biết trước , thì tương tự như phương pháp đã
trình bày ở trên, với thành phần bù ( )sign( )u E x có thể loại trừ hoàn
toàn tác động của thành phần không rõ ( , )u t x do:
1 2
21 2
1 2
sign( )
1 sign ( )
.
V m V m E E E
m V m E E
m V m
(2-55)
Trường hợp sử dụng thành phần bù liên tục:
( )bsig( , )u E x (2-56)
với 0 là hệ số góc của hàm bsig( , )E tại 0E , đạo hàm:
1 2
1 2
1 2
sign( ) bsig( , )
1 sign( )bsig( , )
μ( , )
V m V m E E E E
m V m E E E
m V m E
(2-57)
với μ( , ) ε( , )E E E như (2-43). Áp dụng kết quả (2-46) cho thấy:
1 2
1 2
μ( , )
0.5569
mV m V m E
m V m
(2-58)
hay nếu chọn càng lớn thì có thể giảm được tương ứng mức độ tác động của
thành phần không rõ.
Tuy nhiên do không biết nên bằng phương pháp sử dụng thành phần bù
2Vu
E
với 0 như đề xuất trong [57] dẫn đến:
- 39 -
2 2 21 2
2 2
1 2
2
1 2
2 4
.4
V m V m E E
m V m E
m V m
(2-59)
Kết quả (2-59) cho biết có thể giảm tác động của thành phần không rõ bằng
cách cho nhận giá trị lớn, tuy nhiên phương pháp này khó áp dụng trong thực
tế vì thành phần bù tạo dao động lớn trong tín hiệu điều khiển khi E đổi dấu.
Sau đây luận án đề xuất sử dụng thành phần bù có dạng:
bsig( , )u E (2-60)
như đã trình bày trong phần trên, khi đó:
1 2
1 2
1 2
sign( ) bsig( , )
sign( )bsig( , ) .
V m V m E Eu
m V m E E E E
m V m E E E
Đặt 0
và:
μ ( , , ) sign( )bsig( , )E E E E E (2-61)
dẫn đến 0.5569
μ ( , , ) (ε 1) ( 1)E E E E
hay nếu tìm được
để 1 thì không những có thể giảm được tác động của thành phần
không rõ mà sai số do thành phần không rõ gây nên bị chặn không phụ thuộc
vào do:
1 2
1 2
0.5569( 1)
0.5569.
V m V m E
m V m
(2-62)
- 40 -
Ngoài ra có thể tính toán chính xác giá trị lớn nhất của hàm μ ( , , )E E
bằng phương pháp giải trên MATLAB nhờ Bổ đề 3 sau:
Bổ đề 3 : Hàm μ ( , , )E E định nghĩa như (2-61) với 0 1 , 0 có giá
trị lớn nhất bằng _ maxμ ( , ) 0E tại hai điểm đối xứng ( , )mE xác định
bởi:
_ maxμ ( , ) μ ( , , ) 0E E mE , 0mm
xE
(2-63)
với mx là nghiệm duy nhất của phương trình
2( 1) 2( ) 1 0x xe x e .
Chứng minh
Phương pháp chứng minh và chương trình tính toán giá trị lớn nhất trên
MATLAB được tác giả trình bày trong mục 5.3 trang 139 phần Phụ lục.
Lưu ý là với 1 thì μ (1, , ) μ( , )E E E theo (2-43) nên kết quả (2-46) là
trường hợp riêng của Bổ đề 3 và 1.2785 1.2785 0.5569
μ( , ) μ (1, , )E
.
Ngoài ra x E và với mỗi giá trị xác định trong khoảng (0, 1] và 0 ,
hàm μ ( , , )E E đạt cực đại và cũng là lớn nhất bằng _ maxμ ( , )E tại các
điểm ( , )mE là các hàm số của và .
▲
Hình 4 biểu diễn hàm μ ( , , )E E trong các trường hợp 5 , 10 và giá
trị được chọn trong mỗi trường hợp là 1, 0.9 và 0.5. Kết quả tính trong các
trường hợp trên Hình 4 như sau:
μ (1.0, 5, 0.2557) 0.1114 μ (1.0, 10, 0.1278) 0.0557
μ (0.9, 5, 0.2154) 0.0879 μ (0.9, 10, 0.1077) 0.0440
μ (0.5, 5, 0.1046) 0.0256 μ (0.5, 10, 0.0523) 0.0128
E E
E E
E E
(2-64)
- 41 -
Hình 4 : Hàm μ ( , , ) sign( )bsig( , )E E E E E
Hình 5 : Hàm ( , )mE và _ maxμ ( , ) μ ( , , )E E mE
-1 -0.5 0 0.5 1-0.04
-0.02
0
0.02
0.04
0.06
0.08
0.1
0.12
E
E
= 5
= 1
= 0.9
= 0.5
0.1114
0.0879
0.0256
-0.5 -0.25 0 0.25 0.5-0.02
-0.01
0
0.01
0.02
0.03
0.04
0.05
0.06
E
E
= 10
= 1
= 0.9
= 0.5
0.0557
0.0440
0.0128
0 0.2 0.4 0.6 0.8 10
0.2
0.4
0.6
0.8
1
1.2
1.4
= 1
Em
E_max
0.5
0.1278
0.5
0.5229
0.9
0.4396
0.9
1.0769
1.2785
0.5569
0 5 10 15 200
0.1
0.2
0.3
0.4
= 1
Em
E_max
0.1114
0.2557
0.0557
0.1278
- 42 -
Hình 5 biểu diễn đồ thị của _ maxμE trong các trường hợp đặc biệt 1 và
1 . Ngoài ra có thể ước lượng tọa độ điểm cực đại từ đồ thị bên trái trên
Hình 5 ( 1 ). Ví dụ để tính điểm cực đại của hàm với 0.9 và 5 , từ đồ
thị Hình 5 bên trái suy ra:
(0.9,1) 1.0769
(0.9,5) 0.21545
mm
EE
_ max
_ max
μ (0.9,1) 0.4396μ (0.9,5) 0.0879
5
EE
Như vậy so với (2-62) ta thu được kết quả mạnh hơn như sau:
1 2 _ max ( , )EV m V m . (2-65)
Tổng hợp các kết quả trên, trong trường hợp hệ sai số (2-52) có chứa thành
phần không rõ bị chặn ( , ) ( )u t x x với 0 là hằng số bị chặn chưa biết
và ( ) : n x là hàm liên tục không âm bị chặn cho trước, dẫn đến phát
biểu của Bổ đề 4 dưới đây.
Bổ đề 4 : Nghiệm của phương trình động học hệ sai số (2-52) bị chặn tới hạn
đều (uniformly ultimately bounded) bởi luật điều khiển phản hồi u u u với
u là thành phần bù liên tục theo (2-60) và u là thành phần điều khiển ổn định
nếu 1 2V m V m với 212
V E , 1 20, 0m m khi 0u và .
Chứng minh
Để chứng minh nghiệm của hệ sai số vòng kín bị chặn tới hạn đều ta cần chỉ
ra các hàm số 1 2( ), ( )E E K và 3( )E K xác định trên 0, thỏa
mãn:
1 2
3
( ) ( ) ( )
( ) ( )
E V E E
VV E E E
E
(2-66)
- 43 -
với E R và ( )V E là hàm số khả vi liên tục xác định trên E R .
Sau đây chọn 21
1 2 2( ) ( ) ( )E E V E E là các hàm lớp K và từ
(2-65) biến đổi tiếp như sau:
1 2 _ max
1 1 2 _ max
1 1 1 2 _ max
( ) μ
(1 ) μ
( ) (1 ) μ
E
E
E
V E m V m
m V m V m
m E m V m
với 0 1 . Đặt 3 1 1( ) ( )E m E K suy ra 3( ) ( )V E E khi E R
với 2 _ max
1
2 μ
(1 )
EmR
m
và Bổ đề 4 được chứng minh.
Ngoài ra lưu ý là trường hợp ( )V E tổng quát ta có
2 _ max11
1
2 μ
(1 )
EmR
m
.
- 44 -
2.3. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi vào-ra
bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái
2.3.1. Bài toán điều khiển và cơ sở toán học
Trong phần trước, mục 2.2 đã trình bày và phân tích phương pháp thay thế
ước lượng hàm trạng thái trong điều khiển các hệ khả tuyến tính hóa phản hồi
trạng thái (không có thành phần hệ con phi tuyến nội động học q ). Sau đây luận
án phân tích khả năng áp dụng phương pháp thay thế ước lượng hàm trạng thái
trong điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi vào-ra có
phương trình động học và đầu ra biến đổi được về dạng chuẩn tắc (2-3) với Giả
thiết 2 như sau:
Giả thiết 2: Hệ (2-3) có:
1) bậc tương đối n và hệ con ( , )q π x q là ổn định đầu vào-trạng thái
(ISS) với x là đầu vào;
2) ( , )f x q , ( , )g x q là các hàm số thực bị chặn và ( , ) 0g x q với mọi ( , )x q
trong miền hợp lệ đóng n d xq ;
3) các trạng thái ( , )x q của hệ đo được.
Bài toán đặt ra là cần điều khiển ổn định (2-3) sao cho đầu ra của hệ bám
theo tín hiệu mẫu ( )r t với giả thiết ( )r t và các đạo hàm của tín hiệu mẫu đến
bậc n bị chặn và đo được. Vấn đề là mặc dù hệ con q không có tác động tới
đầu ra của hệ, tuy nhiên cho dù xác định được bộ điều khiển ổn định động học
của hệ con tuyến tính hóa x thì vẫn có thể xảy ra q nếu động học của hệ
con (phi tuyến) ( , )q π x q không ổn định. Như vậy để giải quyết bài toán, cần
thiết phải biết được đặc tính động học của hệ con phi tuyến. Nhằm đơn giản hóa
tính toán mà không làm mất đi tính thực tế nên phương pháp giải trong phần
này luôn giả thiết rằng hệ con phi tuyến ( , )q π x q là ổn định đầu vào-trạng
thái với x là đầu vào.
- 45 -
Theo định nghĩa, hệ ( , , )tx f x u với : 0, , ,n m n f liên tục phân
đoạn (piecewise continuous) đối với t và Lipschitz cục bộ đối với x và u được
gọi là ổn định đầu vào-trạng thái nếu tồn tại hàm β KL (hàm lớp KL) và
K (hàm lớp K) để với bất kỳ trạng thái ban đầu 0 0( )tx x và đầu vào bị
chặn ( )tu nào, luôn tồn tại nghiệm ( )tx với mọi 0t t và thỏa mãn:
0
0 0( ) ( ) , sup ( )t t
t t t t
x x u . (2-67)
Bất đẳng thức (2-67) cho thấy nếu hệ là ISS thì luôn đảm bảo rằng với bất kỳ
đầu vào ( )tu bị chặn nào, trạng thái ( )tx của hệ cũng bị chặn. Ngoài ra khi t
tăng dần thì trạng thái ( )tx sẽ bị chặn cuối (tới hạn) bởi hàm K do khi đó
0 0( ) , 0t t t x và nếu ( )tu hội tụ về 0 khi t thì ( )tx cũng hội tụ về
0 . Một tính chất khác của hệ ISS là khi ( )t u 0 thì do bất đẳng thức (2-67) rút
gọn thành 0 0( ) ,t t t x x nên suy ra hệ không cưỡng bức ( , , )tx f x 0 có
gốc tọa độ là ổn định tiệm cận đều.
Các Bổ đề 13.1 và 13.2 trong [50] cho biết trong trường hợp hệ con x có thể
ổn định được (dùng luật điều khiển phản hồi trạng thái) về dạng ( )T x A bk x
hay Tν k x trong (2-5) được chọn sao cho ( )TA bk là Hurwitz thì có thể
kết luận được đặc tính ổn định đối với điểm gốc tọa độ ; x q 0 của hệ (2-3)
tương ứng như sau: Gốc tọa độ của hệ (2-3) là ổn định tiệm cận nếu gốc của hệ
con ( , )q π 0 q (điểm q 0 ) ổn định tiệm cận và gốc của hệ (2-3) là ổn định
tiệm cận toàn cục nếu hệ con ( , )q π x q là ổn định đầu vào-trạng thái (ISS) với
x là đầu vào. Ngoài ra các kết quả trên còn xuất phát từ tính chất của các hệ
liên kết tầng (cascade) được trình bày trong [50], [51] và được tổng hợp lại như
dưới đây:
Hệ liên kết tầng phi tự trị (nonautonomous):
- 46 -
1 1
2 2
: ( , , )
: ( , )
t
t
q f q x
x f x
(2-68)
với 1 : 0, m n m f và 2 : 0, n n f là liên tục phân đoạn
đối với t và Lipschitz cục bộ đối với ;q x . Nếu hệ 1 – với x là đầu vào – là
ổn định đầu vào-trạng thái và điểm gốc của hệ 2 là ổn định tiệm cận đều toàn
cục (globally uniformly asymtotically stable) thì gốc tọa độ của hệ liên kết tầng
(2-68) cũng ổn định tiệm cận đều toàn cục.
Đối với trường hợp hệ liên kết tầng tự trị (autonomous):
1 1
2 2
: ( , )
: ( , )
q f q x
x f x u
(2-69)
nếu hệ 1 – với x là đầu vào – là ổn định đầu vào - trạng thái (cục bộ/toàn cục)
và điểm gốc của hệ 2 là ổn định tiệm cận (cục bộ/toàn cục) thì gốc tọa độ của
hệ liên kết tầng (2-69) cũng là ổn định tiệm cận (cục bộ/toàn cục).
▲
Do phương pháp xây dựng trong luận án dựa trên cơ sở lập hệ sai số thỏa
mãn Giả thiết 1 với các thành phần không rõ nên có thể dùng Định lý 6.1 trong
[57] để chứng minh các kết quả của luận án. Phát biểu của định lý này như sau:
Gọi ( , )tE x là hệ sai số thỏa mãn Giả thiết 1. Giả thiết rằng tồn tại bộ điều
khiển ( )u v z và hàm Lyapunov ( )V E sao cho ( ) ( )V E E E với K E và
0V theo quỹ đạo (2-3) khi rV V với mọi dq , nx và t . Nếu hệ
con ( , )q π x q với đầu vào x là ổn định đầu vào-trạng thái (ISS) thì bộ điều
khiển ( )u v z đảm bảo rằng x và q bị chặn đều.
Lưu ý rằng nếu hệ con q là ổn định đầu vào-trạng thái (ISS) cũng có nghĩa
là tồn tại hàm xác định dương Vq để:
1 2
3
( ) ( ) ( )
( ), ( )
V
V
q q q
q q
q q q
q q x (2-70)
- 47 -
với 1 2, K q q , 3, K q .
Định lý 6.1 ([57]) cho biết nếu bộ điều khiển được thiết kế để ổn định động
học x thì động học q cũng sẽ ổn định nếu thỏa mãn điều kiện (2-70). Ngoài ra
từ Định lý 6.1 ([57]) có thể suy ra hệ quả mạnh hơn của Định lý trong trường
hợp V kV thì E 0 là điểm cân bằng ổn định theo hàm số mũ trong khi có
thể q chỉ bị chặn. Lưu ý là khi x 0 thì điều kiện đối với Vq trong (2-70) trở
thành 3( )V q q q với mọi q dẫn đến nghiệm của động học không
( , )q π 0 q là ổn định tiệm cận toàn cục và hệ là pha cực tiểu (minimum phase).
Với các cơ sở toán học như đã trình bày ở trên, phần tiếp theo của luận án
cho thấy bằng phương pháp lập hệ sai số và thay thế ước lượng hàm trạng thái
đối với các thành phần không rõ tương tự như trong trường hợp hệ khả tuyến
tính phản hồi đầu vào-trạng thái (mục 2.2) và với giả thiết hệ con phi tuyến là
ISS thì vấn đề điều khiển trong trường hợp này luôn giải quyết được.
2.3.2. Điều khiển ổn định bằng phương pháp thay thế ước lượng hàm trạng
thái
Trƣờng hợp 1
Trường hợp ( , )f x q , ( , )g x q xác định, đặt e x r với ( 1), , ,T
nr r r
r
thì từ phương trình (2-4) suy ra:
( )
( , ) ( , )
( , ) ( , )
( , ) ( , ) n
f g u
f g u
f g u r
e x r
Ax b x q x q r
Ae Ar r b x q x q
Ae b x q x q
(2-71)
nên nếu chọn luật điều khiển phản hồi tĩnh theo [50]:
1 ( )( , ) ( , ) n Tu g f r x q x q k e (2-72)
với k được chọn sao cho ( )TA bk là Hurwitz thì hệ vòng kín trở thành:
- 48 -
( , )
( )
.
T
Ty
q π e r q
e A bk e
e rc
q
(2-73)
Áp dụng tính chất của hệ liên kết tầng và do giả thiết ban đầu hệ con
( , )q π x q là ổn định đầu vào-trạng thái (ISS) với x e r là đầu vào bị chặn
do Mrr bị chặn suy ra điểm gốc tọa độ của (2-73) là ổn định toàn cục.
Ngoài ra bằng phương pháp lập hệ sai số có thể giải quyết bài toán như sau
([57]). Định nghĩa hệ sai số:
( 1)( , , ) ,1 T T T nE E E nE t x r
x q k e k e k d (2-74)
với ,1T TE
k k , 1 1, ,TE nk k k ,
( 2)
1 2 1, , ,Τ
nE nx r x r x r
d ,
e x r và 1 21 1
n nns k s k là Hurwitz. Khi đó hệ sai số (2-74) thỏa
mãn Giả thiết 1 và phương trình động học của hệ sai số có dạng:
( , , ) ( , )E t u x q x q (2-75)
với ( )( , , ) ( , )T nt r f E Ex q k d x q , ( , ) ( , )g x q x q .
Chọn hàm Lyapunov 21
2V E và sử dụng luật điều khiển phản hồi tĩnh:
1( , ) ( , , )u t E x q x q (2-76)
với 0 dẫn đến E E và 2V E . Do giả thiết hệ con ( , )q π x q là ổn
định đầu vào-trạng thái (ISS) với x là đầu vào nên áp dụng hệ quả của Định lý
6.1 ([57]) suy ra 0E là điểm cân bằng ổn định theo hàm mũ của hệ sai số.
Trƣờng hợp 2
Trường hợp ( , )f x q , ( , )g x q có chứa các thành phần không rõ, giả thiết rằng
từ số liệu đo và hiểu biết về hệ thống ta có thể tìm được các hàm số
- 49 -
( , ) ( , ) ( , )ff f x q x q x q , ( , ) ( , ) ( , )gg g x q x q x q thay thế ( , )f x q ,
( , )g x q để tính gần đúng được nx như sau:
( , ) ( , ) ( ) ( , , )n n dxnx f g u x u x q x q z x q (2-77)
với ( , , ) ( , ) ( , ) ( )dxn n n f gu x x u x q x q x q z là sai số giữa tín hiệu xấp
xỉ nx với tín hiệu nx và dxn W , 0W cho trước với mọi ,x q trong miền
hợp lệ ,n d x q và uu .
Định nghĩa hệ sai số như (2-74) khi đó:
( , , ) ( , ) dxnE t u x q x q (2-78)
với ( )( , , ) ( , )T nt r f E Ex q k d x q , ( , ) ( , )g x q x q .
Sử dụng luật điều khiển phản hồi trạng thái tĩnh:
1
1 ( )
( ) ( , ) ( , , )
( , ) ( , )T n
u u t E
g r f E
E E
z x q x q
x q k d x q
(2-79)
với 1, ,T T T n dt
z x q và 0 thì phương trình động học của hệ sai số
vòng kín trở thành:
( , , )dxnE E u x q . (2-80)
Dùng hàm Lyapunov 21
2V E dẫn đến:
2
22
2
1
2 2
2
dxnV EE E E
WV W E
WV
(2-81)
hay 0V khi 2
22r
WV V
. Khi đó theo Định lý 6.1 ([57]) ta có x , q bị chặn
đều và tương tự như trong trường hợp hệ là khả tuyến tính hóa phản hồi đầu
- 50 -
vào-trạng thái, áp dụng Bổ đề 2.1 ([57]) với 1m , 2
22
Wm
dẫn đến V bị
chặn và do đó E cũng bị chặn theo biểu thức sau:
2 2 2
2 2 2
22
2
(0) 1 (0)2 2 2
1 (0) .
t t tH
t tH
W W WV V e e V e V
WE e E e E
(2-82)
hay:
0
0
0 max ,
max ,
V V V E
E E E
(2-83)
với 0 (0)E E , lim Ht
WE E
và
2
0 01
2V E .
Lưu ý là do T T E E Eη e k d với 1 1 2 1, , ,Tnk k k k η nên luật
điều khiển (2-79) có thể viết như sau:
1 ( )( , ) ( , )n Tu u g r f x q η e x q (2-84)
và điều kiện sai số xấp xỉ chung còn có thể biểu diễn dưới dạng:
( )n Tdxn nr x W η e (2-85)
Kết quả trên cho thấy ảnh hưởng của sai số xấp xỉ do phép thay thế ước
lượng các hàm trạng thái gây nên trong trường hợp hệ khả tuyến tính hóa phản
hồi vào-ra thỏa mãn Giả thiết 2 cũng có thể giảm trừ được bằng cách đưa thêm
thành phần bù phản hồi vào hệ vòng kín giống như trường hợp hệ khả tuyến
tính phản hồi đầu vào-trạng thái nhưng với điều kiện hệ con phi tuyến là ISS.
Phần tiếp theo cho thấy cũng với giả thiết này phương pháp hoàn toàn áp dụng
tương tự được trong trường hợp hệ có chứa thành phần không rõ trên đầu vào
của phương trình động học.
- 51 -
2.3.3. Tính bền vững của hệ vòng kín đối với thành phần không rõ trong
phương trình động học
Xét hệ có phương trình động học và đầu ra sau:
1 2
1
1
( , )
( , ) ( , ) ( , , )
n n
n u
x x
x x
x f g u t
y x
q π x q
x q x q x q
(2-86)
trong đó ( , , )u t x q là thành phần không rõ và ( , , ) ( , )u t x q x q với 0
là hằng số chưa biết bị chặn, ( , ) : n x q là hàm không âm đã biết.
Hệ con ( , )q π x q là ISS với x là đầu vào, các hàm ( , )f x q , ( , )g x q có chứa
các thành phần không rõ bị chặn và ( , ) 0g x q với mọi ( , )x q trong miền điều
khiển được n d xq như Giả thiết 2.
Trường hợp thành phần không rõ ( , , ) 0u t x q , tiếp tục với giả thiết rằng từ
số liệu đo ta có thể tìm được các hàm thay thế ước lượng để tính gần đúng được
nx như (2-77) thì bằng phương pháp lập hệ sai số (2-74) và sử dụng luật điều
khiển phản hồi u u như (2-84) dẫn đến x , q bị chặn đều nhờ phương pháp
phân tích sử dụng hàm Lyapunov xác định dương 21
2V E để đạo hàm theo
quỹ đạo động học (2-80) của hệ sai số thỏa mãn 1 2V m V m với
1 20, 0m m .
Với thành phần không rõ ( , , )u t x q thỏa mãn giả thiết nêu trên, tương tự
như đã trình bày trong phần trước ta có thể sử dụng thành phần bù u đưa vào
đầu điều khiển u u u để ổn định hệ sai số trong đó:
( , )bsig( , )u E x q (2-87)
- 52 -
với bsig( , )E là hàm xíchma lưỡng cực định nghĩa như (2-40), 0 và 0
là hệ số góc của hàm bsig( , )E tại 0E .
Khi đó động học của hệ sai số sẽ là:
( , , ) ( , ) ( , ) ( , , )dxn uE t u t u x q x q x q x q (2-88)
và đạo hàm của hàm Lyapunov theo quỹ đạo động học của hệ sai số phân tích
được thành:
1 2
1 2
1 2
1 2 E
1 2 E_max
sign( ) bsig( , )
sign( )bsig( , )
μ ( , , )
μ ( , ).
dxn u
u
V EE E Eu E E u
m V m E u
m V m E E E E
m V m E E E
m V m E
m V m
(2-89)
với 1 0
và Eμ ( , , )E định nghĩa như (2-61) đạt giá trị lớn nhất bằng
E_maxμ ( , ) có thể xác định nhờ Bổ đề 3 trang 40 hay nếu tìm được thì
theo Định lý 6.1 ([57]) ta có x , q bị chặn đều và sai số do thành phần không rõ
gây nên bị chặn không phụ thuộc vào . Như vậy trong trường hợp này kết quả
(2-89) cũng có dạng giống như kết quả (2-65) trong trường hợp hệ tuyến tính
hóa phản hồi trạng thái.
Tổng hợp lại dẫn đến phát biểu tổng quát của Định lý 2 như sau:
Định lý 2 : Hệ (2-86) có x và q bị chặn đều (uniformly bounded) bởi luật điều
khiển phản hồi u u u với u và u được định nghĩa như (2-84) và (2-87)
hay:
1 ( )( , ) ( , ) ( , )bsig( , )n Tu g r f E x q η e x q x q (2-90)
- 53 -
nếu trong đó ( , ) 0g x q , ( , )f x q là các hàm liên tục bị chặn thỏa mãn
( )n Tnr x W η e với mọi , n d xqx q , uu và 0W cho trước.
Chứng minh
Chứng minh Định lý 2 từ các kết quả nêu trên và Định lý 6.1 ([57]).
Sau đây chọn 21
1 2( ) ( )E V E E là hàm lớp K thì từ (2-89) biến đổi
tương tự như trong chứng minh 0 sẽ cho kết quả:
1 1 1 2 _ max( ) ( ) (1 ) μEV E m E m V m
với 0 1 nên suy ra đạo hàm của hàm Lyapunov 1 1( ) ( )V E m E khi
E R với 2 _ max
1
2 μ
(1 )
EmR
m
.
Kết quả trên tương đương 0V khi ( )rV V V R với mọi
, n d xqx q nên theo Định lý 6.1 ([57]), với giả thiết hệ con
( , )q π x q là ổn định đầu vào-trạng thái (ISS) với x là đầu vào suy ra luật điều
khiển (2-90) đảm bảo rằng x và q bị chặn đều và Định lý 2 được chứng minh.
▲
Một điểm cần lưu ý là các kết quả trên của phương pháp xuất phát từ giả
thiết toàn bộ trạng thái của hệ đo được. Tuy nhiên cũng có thể áp dụng phương
pháp trong các trường hợp đặc biệt khi một số trạng thái của hệ không đo được
như ví dụ sau. Xét hệ có phương trình động học và đầu ra:
1 2
1
1
( , )
( ) ( ) ( , , )
n n
n u
x x
x x
x f g u t
y x
q π x q
x x x q
(2-91)
- 54 -
trong đó ( , )q π x q là ISPS (Input-to-State Practically Stable) với x là đầu vào,
( , , )u t x q là thành phần không rõ có điều kiện ràng buộc như trong Định lý 2
và ( , ) x q không giảm dần đối với q , ngoài ra giả thiết rằng chỉ các trạng thái
x của hệ là đo được, các trạng thái q không đo được.
Tiếp tục áp dụng phương pháp trên với giả thiết từ số liệu đo ta có thể thay
thế được các hàm số ( )f x , ( )g x để tính gần đúng nx với sai số ( , )dxn u W x
với mọi n xx , uu và 0W cho trước. Khi đó với hệ sai số định
nghĩa như (2-74), nếu x , q đo được và nếu tìm được thì theo Định lý 2
hệ (2-91) có x , q bị chặn đều. Tuy nhiên do giả thiết trạng thái q của hệ không
đo được nên ta cần xác định u không phụ thuộc vào q .
Biết rằng hệ con phi tuyến ( , )q π x q là ISPS với x là đầu vào nên theo
điều kiện cần và đủ của hệ ISPS ([51], [57]) tồn tại hàm xác định dương ( )Vq q
để:
1 2( ) ( ) ( )
( , ) ( )
V
VcV d
q q q
q q q
π x q xq
(2-92)
với 1 2, , K q q và 0c , 0d .
Từ (2-92) định nghĩa ( )c d x và chọn (0) ( )V q 0 để V q thì
1 11 1( ) ( )V q q qq . Do vậy nếu chọn 1
1, ( ) bsig( , )u E qx và
sử dụng luật phản hồi u u u
thì biến đổi như trên cũng dẫn đến
1 2 _ maxμEV m V m nên suy ra x và q bị chặn đều.
- 55 -
2.4. Tổng hợp thiết kế bộ điều khiển tĩnh ổn định
Tóm lại, các kết quả trình bày trong chương có thể tổng hợp lại thành các
bước tổng hợp bộ điều khiển tĩnh ổn định theo phương pháp thay thế ước lượng
hàm trạng thái như sau:
1. Biểu diễn phương trình động học và đầu ra của hệ ở dạng tuyến tính hóa
phản hồi trạng thái – phương trình (2-6) hoặc tuyến tính hóa phản hồi
vào-ra – phương trình (2-3). Xác định các thành phần không rõ và các
giới hạn.
2. Xác định tín hiệu mẫu cần bám, định nghĩa hệ sai số và chọn hàm
Lyapunov V . Sử dụng luật điều khiển phản hồi tĩnh theo (2-28) hoặc
(2-84) để 1 2V m V m . Xác định giá trị 0W cần đạt để chất lượng
hệ vòng kín thỏa mãn yêu cầu thiết kế.
3. Từ các dữ liệu đo và hiểu biết về hệ thống tìm cách xác định cặp hàm
thay thế f và g phù hợp sao cho sai số xấp xỉ nx thỏa mãn
( )n Tnr x W η e với mọi x trong miền đóng x và uu . Trường
hợp điều kiện sai số xấp xỉ không thỏa mãn thì có thể sử dụng thành phần
bù mờ nơron trong phương pháp thay thế ước lượng (chi tiết trình bày
trong Chương 3) để bù sai số do phép thay thế ước lượng gây nên.
4. Thiết kế thành phần bù liên tục bsig( , )u E đưa thêm vào đầu
điều khiển nhằm nâng cao tính bền vững của hệ đối với các thành phần
không rõ (nếu có) xuất hiện trên đầu vào của hệ. Sử dụng các công thức
(2-51), (2-65) và Bổ đề 3 (trang 40) để tính toán các tham số thành phần
bù liên tục đáp ứng sai lệch cho phép theo yêu cầu thiết kế.
- 56 -
2.5. Kết luận
Chương 2 trình bày các cơ sở toán học để hình thành phương pháp mới tổng
hợp bộ điều khiển ổn định tĩnh (không thích nghi) các hệ thống khả tuyến tính
hóa phản hồi trạng thái dạng (2-6) và khả tuyến tính hóa phản hồi vào-ra dạng
(2-3) có chứa các thành phần không rõ bị chặn trong các hàm trạng thái f và g
của phương trình động học.
Để giải quyết bài toán bám theo tín hiệu mẫu cho trước, không như các
phương pháp tìm cách xấp xỉ gần đúng các hàm trạng thái f và g chưa biết,
phương pháp mới đề xuất xây dựng trên cơ sở giả định rằng có thể tìm được cặp
hàm f và g thay thế ước lượng (không cần chính xác) các hàm trạng thái chưa
biết sao cho sai số xấp xỉ nx thỏa mãn điều kiện sai số trong miền trạng thái hợp
lệ (Chương tiếp theo của luận án sẽ giải quyết vấn đề khi điều kiện xấp xỉ không
thỏa mãn). Khi đó bằng cách lập hệ sai số thích hợp (Bổ đề 1 trang 23) và sử
dụng luật điều khiển phản hồi chứa cặp hàm thay thế tìm được sẽ đảm bảo
nghiệm của hệ sai số được lập bị chặn tới hạn đều và do đó sai số bám đầu ra
cũng như trạng thái của hệ bị chặn (Định lý 1 trang 29).
Mặt khác nhằm phân tích tính bền vững của hệ vòng kín trong phương pháp
đối với thành phần không rõ bị chặn xuất hiện trên đầu vào của hệ (như sai số
xấp xỉ, nhiễu đầu vào, ...), phương pháp chỉ ra rằng bằng cách đưa thêm thành
phần bù liên tục dựa trên hàm xíchma lưỡng cực (2-40) vào luật điều khiển phản
hồi (để tín hiệu điều khiển cũng liên tục) có thể giảm trừ được tác động của
thành phần không rõ gây nên. Với cơ sở toán học đã được tác giả xây dựng và
chứng minh là Bổ đề 3 (trang 40) dùng để xác định chính xác giá trị lớn nhất
của hàm μ ( , , )E E (định nghĩa như (2-61)) bằng phương pháp giải trên
MATLAB, tác giả chỉ ra công thức để tính toán tác động này lên hệ sai số và từ
đó cho phép xác định được tác động lên sai số bám đầu ra (Bổ đề 4 trang 42 và
Định lý 2 trang 52). Các kết quả này có ý nghĩa quan trọng trong thiết kế bộ
- 57 -
điều khiển áp dụng trong thực tế và là cơ sở để giải quyết vấn đề bù sai số khi
điều kiện xấp xỉ không được thỏa mãn trong các chương tiếp theo.
Tóm lại Chương 2 đưa ra cơ sở toán học và đề xuất một phương pháp mới
thiết kế bộ điều khiển ổn định tĩnh các hệ thống khả tuyến tính hóa phản hồi
trạng thái và khả tuyến tính hóa phản hồi vào-ra có các thành phần không rõ
trong phương trình động học cho lớp bài toán điều khiển bám tín hiệu mẫu là
dạng bài toán thông dụng trong các ứng dụng công nghiệp. Các bước để tổng
hợp bộ điều khiển ổn định tĩnh theo phương pháp được trình bày trong mục 2.4.
Mục tiêu của phương pháp hướng tới đơn giản hóa quá trình thiết kế và tìm
cách tránh được những vấn đề thường gặp trong các phương pháp hiện nay cũng
như có thể áp dụng trên các hệ thống điều khiển công nghiệp (PLC, IPC).
Tuy nhiên để phương pháp có tính ứng dụng cũng như được phân tích đầy
đủ, trong chương tiếp theo tác giả tiếp tục phát triển phương pháp để giải quyết
các vấn đề trong thiết kế luật điều khiển phản hồi tĩnh khi điều kiện xấp xỉ
không được thỏa mãn trong miền hợp lệ của x và u cũng như phân tích, xác
định tham số điều khiển để đáp ứng các điều kiện ràng buộc đối với quỹ đạo
trạng thái và đầu vào điều khiển của hệ phi tuyến. Ý tưởng của phương pháp là
xây dựng thêm thành phần bù phi tuyến trong luật điều khiển phản hồi sao cho
với luật điều khiển phản hồi mới, hệ sai số bị chặn như trong trường hợp điều
kiện xấp xỉ được thỏa mãn (hay tương đương như khi xác định được các hàm
thay thế thỏa mãn). Để thực hiện ý tưởng này phương pháp được xây dựng theo
hướng ứng dụng điều khiển mờ nơron do những ưu điểm của hệ mờ và mạng
nơron trong nhận dạng đặc tính phi tuyến của đối tượng.
- 58 -
CHƢƠNG 3
PHƯƠNG PHÁP THAY THẾ ƯỚC LƯỢNG HÀM TRẠNG
THÁI DÙNG BỘ XẤP XỈ MỜ NƠRON
3.1. Đặt vấn đề và cơ sở lý thuyết xây dựng phƣơng pháp
3.1.1. Giới thiệu chung
Một trong những vấn đề của phương pháp thay thế ước lượng hàm trạng thái
là từ số liệu đo và hiểu biết về hệ thống phải xác định được các hàm số ước
lượng thay thế sao cho sai số xấp xỉ nx luôn đáp ứng yêu cầu thiết kế. Các kết
quả trong Định lý 1 (trang 29) và Định lý 2 (trang 52) đều giả thiết rằng có thể
tìm được các hàm số liên tục, bị chặn f và 0g sao cho sai số xấp xỉ nx thỏa
mãn dxn W với xx , uu . Tuy nhiên nếu điều kiện xấp xỉ không
được đáp ứng hay nói cách khác nếu không tìm được các hàm ước lượng thay
thế thỏa mãn yêu cầu thì rõ ràng không thể áp dụng phương pháp.
Ngoài ra một vấn đề khác cần xem xét là việc xác định tham số điều khiển
(nếu tồn tại) để bộ điều khiển ổn định tĩnh đáp ứng được các điều kiện ràng
buộc đối với quỹ đạo trạng thái và đầu vào trong suốt quá trình hoạt động, ví dụ
như cần giữ x và u tương ứng luôn nằm trong miền hợp lệ x và u . Vấn đề
này có ý nghĩa quan trọng nếu xét ở góc độ ứng dụng để trả lời cho câu hỏi là
nếu chỉ xác định được các hàm số thay thế thỏa mãn điều kiện xấp xỉ trong một
miền nào đó không bao phủ miền hợp lệ thì có thể thiết kế bộ điều khiển ổn
định tĩnh thỏa mãn yêu cầu thiết kế hay không.
Như vậy để mở rộng phạm vi ứng dụng và phát triển phương pháp, các vấn
đề trên cần được xem xét và giải quyết. Đây cũng là mục tiêu đặt ra trong
Chương 3 này của luận án.
Như đã nêu, do những ưu điểm của hệ mờ và mạng nơron trong nhận dạng
đặc tính phi tuyến của đối tượng mà phương pháp được xây dựng theo hướng
ứng dụng điều khiển mờ nơron để xây dựng thành phần bù phi tuyến trong luật
- 59 -
điều khiển phản hồi tĩnh. Phần sau của luận án sẽ cho thấy vấn đề này được giải
quyết nhờ các bộ xấp xỉ vạn năng (universal approximators) trong lý thuyết xấp
xỉ hàm số. Lưu ý là các nghiên cứu và đề xuất trong chương này chủ yếu tập
trung giải quyết tiếp các vấn đề còn tồn tại của phương pháp trong thiết kế bộ
điều khiển ổn định tĩnh. Vấn đề xây dựng luật điều khiển phản hồi động (hay
thích nghi) sẽ được phát triển trong chương tiếp theo.
3.1.2. Bộ xấp xỉ vạn năng
Sau đây ký hiệu ( , )F x θ là bộ xấp xỉ với pθ là vectơ tham số chỉnh định
được và pF là tập hợp của toàn bộ các giá trị tham số hợp lệ của bộ xấp
xỉ. Nếu gọi ( , ) : , 0pFF p x θ θ là lớp hàm chứa toàn bộ các hàm
có dạng ( , )F x θ , F θ với 0p bất kỳ, khi đó khái niệm xấp xỉ đều hay
xấp xỉ đơn trị (uniformly approximation) được định nghĩa như sau:
Định nghĩa 1 : Hàm :f D có thể xấp xỉ đều (hay xấp xỉ đơn trị) trên
nD bởi các hàm thuộc lớp nếu với 0 luôn tồn tại ( )F x để
sup ( ) ( )D
F f
x
x x .
Lưu ý là định nghĩa trên cho biết việc chọn ( )F x có thể phụ thuộc vào và
giá trị 0p ở trên là số lượng tham số cần thiết của ( )F x để đảm bảo sai số
xấp xỉ bị chặn hay sup ( ) ( )D
F f
x
x x . Ngoài ra ký hiệu ( )F x rút gọn để chỉ
vectơ tham số θ xác định và không phải là đối tượng cần quan tâm.
Trong lý thuyết xấp xỉ hàm số, bộ xấp xỉ vạn năng có vai trò quan trọng do
chúng cho biết có thể xấp xỉ lớp hàm số nào đó với độ chính xác bất kỳ. Định
nghĩa bộ xấp xỉ vạn năng được phát biểu dựa trên khái niệm xấp xỉ đều như sau:
Định nghĩa 2 : Cấu trúc lớp hàm 1 được gọi là bộ xấp xỉ vạn năng đối với các
hàm thuộc lớp hàm 2 nếu mỗi hàm 2f đều có thể xấp xỉ đều bởi 1 .
- 60 -
Nếu ký hiệu ( , )c n D là tập hợp của toàn bộ các hàm số liên tục vô hướng
định nghĩa trên miền đóng nD , khi đó có thể sử dụng một trong số các bộ
xấp xỉ vạn năng thông dụng sau ([34], [44], [57], [66], [76], [91]) để xấp xỉ các
hàm liên tục:
- Các hàm định nghĩa lớp hàm bước nhảy; mạng nơron 2 lớp với các nút ẩn có
hàm kích hoạt theo ngưỡng hoặc hàm kích hoạt xíchma : 0,1 và nút
đầu ra tuyến tính đều là các bộ xấp xỉ vạn năng các hàm liên tục vô hướng
(1, )cf D , ,D a b .
- Các đa thức định nghĩa lớp hàm
0 10
( ) : , , , , 0p
ip i p
i
g x a x a a a p
với :g D, D
(Định lý Weiertrass); các hàm định nghĩa lớp hàm
1
( ) cos( ) : , ,m
T na i i i i i i
i
g a c a c
x b x b ; hệ mờ với hàm liên
thuộc Gauss, phương pháp giải mờ điểm trọng tâm COG; mạng nơron 2 lớp
với các nút ẩn có hàm kích hoạt xíchma và nút đầu ra tuyến tính đều là các
bộ xấp xỉ vạn năng các hàm liên tục vô hướng ( , )cf n D , nD .
Việc chứng minh cấu trúc của một lớp hàm là bộ xấp xỉ vạn năng đối với các
hàm thuộc lớp hàm khác thông thường theo định nghĩa, tuy nhiên có một công
cụ chứng minh hữu hiệu là sử dụng kết quả của Định lý Stone-Weierstrass có
thể tham khảo trong các tài liệu [43], [57], [66], [74].
3.1.3. Cơ sở toán học xây dựng các bộ xấp xỉ dùng hệ mờ và mạng nơron
Như đã trình bày, các bộ xấp xỉ vạn năng với số lượng tham số chọn đủ lớn
có thể xấp xỉ bất kỳ hàm liên tục nào với độ chính xác tùy ý trên tập compac
(compact set), ngoài ra do khả năng chỉnh định trực tuyến (on-line) mà chúng
còn được dùng trong các bộ điều khiển thích nghi. Các nghiên cứu dùng bộ xấp
xỉ làm bộ điều khiển thích nghi chủ yếu theo hướng dùng hệ mờ ([52], [57],
- 61 -
[73], [98], [104]), dùng mạng nơron ([54], [57], [91], [92], [104], [108]) hoặc
kết hợp dùng hệ mờ và mạng nơron ([44], [55], [66], [86]).
Mặc dù về lý thuyết có thể sử dụng bất kỳ bộ xấp xỉ nào thỏa mãn yêu cầu
trong phương pháp ví dụ như các bộ xấp xỉ mờ với hàm liên thuộc Gauss,
phương pháp giải mờ COG; mạng nơron 2 lớp với các nút ẩn có hàm kích hoạt
xíchma và nút đầu ra tuyến tính hoặc mạng thích nghi ANFIS. Tuy nhiên không
dễ dàng chỉ ra cấu trúc bộ xấp xỉ tối ưu trong từng trường hợp do phụ thuộc vào
số liệu đo có được, đặc tính phi tuyến của đối tượng và các điều kiện giới hạn.
Thông thường việc thiết kế bộ xấp xỉ vạn năng có kích cỡ cấu trúc nhỏ nhất
thỏa mãn yêu cầu về sai số xấp xỉ cũng cần nhiều thời gian để thử và kiểm
nghiệm do với cấu trúc bộ xấp xỉ vạn năng cho trước chỉ đảm bảo rằng sai số
xấp xỉ bị chặn bởi 0FW còn không thể xác định được giá trị FW này nhỏ
chừng nào. Tuy nhiên có điều chắc chắn rằng cần phải tăng kích cỡ cấu trúc của
bộ xấp xỉ và lựa chọn tham số điều chỉnh cho phù hợp để đạt được sai số xấp xỉ
nhỏ tùy ý.
Ngoài ra những vấn đề về nghiên cứu lựa chọn giữa bộ xấp xỉ tuyến tính hay
phi tuyến đối với tham số có cùng kích cỡ cấu trúc (hay số lượng tham số), vấn
đề về phương pháp chỉnh định tham số trong bộ xấp xỉ phi tuyến hay xác định
cấu trúc bộ xấp xỉ tốt nhất đều là những chủ đề đang được nghiên cứu ([57]) và
nằm ngoài phạm vi nghiên cứu của luận án này. Tuy nhiên do những ưu điểm
của hệ mờ và mạng nơron trong xử lý phi tuyến và chỉnh định tham số trực
tuyến mà luận án chỉ xem xét các bộ xấp xỉ được xây dựng dựa trên hệ mờ và
mạng nơron. Phần sau sẽ cho thấy các bộ xấp xỉ mờ nơron có thể dùng trong cả
bộ điều khiển ổn định tĩnh và bộ điều khiển ổn định động (thích nghi) và là cơ
sở để giải quyết vấn đề điều khiển ổn định trong phương pháp đề xuất. Dưới
đây trình bày biểu diễn toán học một số cấu trúc hệ mờ và mạng nơron được
dùng làm các bộ xấp xỉ vạn năng cũng như một số vấn đề về sử dụng và tối ưu
hóa các bộ xấp xỉ mờ nơron.
- 62 -
Biểu diễn toán học bộ xấp xỉ mờ
Xét hệ mờ MISO là ánh xạ phi tuyến từ vectơ đầu vào 1, ,T n
nx x x
tới đầu ra y (Hình 6). Trong lý thuyết logic mờ và tập mờ ([34], [47], [86]),
phép mờ hóa các đầu vào sử dụng toán tử mờ hóa có chức năng chuyển các dữ
liệu rõ thành các tập mờ và cơ sở luật mờ với giả thiết gồm p luật mờ được
biểu diễn dưới dạng tập hợp của các mô tả mờ (fuzzy implications) sau:
iR : (1
1
ijA VÀ 2
2
ijA VÀ ... VÀ ni
njA ) kiB (3-1)
với 1..i p . Ký hiệu A B chỉ mô tả mờ hay phát biểu điều kiện NẾU A THÌ
B và ,ij kA B là các tập mờ được định nghĩa như sau:
, ( ) :
, ( ) :
ij
k
ij i i iA
k B
A x x x
B y y y
với , 0,1ikj
BA tương ứng là các hàm liên thuộc thứ j và thứ k của đầu
vào ix và đầu ra y .
Vấn đề căn bản của hệ mờ nằm trong cơ chế suy diễn mờ (fuzzy inference)
và phương pháp giải mờ (defuzzification) dùng để tính toán đầu ra rõ của hệ mờ
khi đầu vào rõ cho trước trên cơ sở luật mờ đã biết. Cơ chế suy diễn mờ này
được xây dựng trên luật hợp thành của suy diễn. Để tính vế đầu trong (3-1) ta có
thể sử dụng bất kỳ t-norm ([86]) nào như t-norm nhỏ nhất
( , ) min{ , }MINT a b a b , tích đại số ( , )PANDT a b ab , hàm Lukasiewicz
( , ) max{ 1, 0}LANDT a b a b , ... Trường hợp sử dụng t-norm nhỏ nhất MINT
khi đó mô tả mờ (3-1) có thể viết dưới dạng tích Đềcác
1 2
1 2
i i ni
nj j j kiA A A B và vế đầu của (3-1) được tính như sau:
1 2 1 2
1 2 1 2
1 2( ) min ( ), ( ), , ( )n nj j j j j ji i ni i i ni
nA A A A A Ax x x
x
.
- 63 -
Hình 6 : Hệ mờ MISO
Để tính mô tả mờ của mỗi luật hay đầu ra của mỗi luật có thể dùng các toán
tử mô tả mờ (t-norm hoặc t-conorm) ([86]). Một số toán tử mô tả mờ thông
dụng gồm Zadeh max{1 , min{ , }}x y x x y , Lukasiewicz
min{1, 1 }x y x y , Mamdani min{ , }x y x y và Larsen x y xy
([28], [76], [86]). Trường hợp sử dụng toán tử mô tả mờ Mamdani thì đầu ra của
luật thứ i ( iR ), ký hiệu là , ( , ) : ,i
ni CC y y y x x được xác định
như sau:
1 2 1 2
1 2 1 2
( , ) ( , ) min ( ), ( )n ni kikij j j j j ji i ni i i ni
C BA A A B A A Ay y y
x x x
Cuối cùng để tính đầu ra của hệ mờ ta có thể sử dụng một phương pháp giải
mờ như giải mờ điểm trọng tâm COG (Center Of Gravity) sau:
1
1
( , )
( , )
( , )
i
i
p
i Ci z
p
Ci z
c z dz
y F
z dz
x
x θ
x
(3-2)
x1
x2
xn
y
Đầu vào rõ
(crisp inputs)
Đầu ra rõ
(crisp output)
Cơ sở luật mờ
(Fuzzy Rule-Base)
Đầu vào
mờ hóa
Kết luận
mờ
. .
.
Cơ chế suy diễn mờ (Fuzzy Inference
Mechanism)
Giả
i m
ờ
(Defu
zzific
ation)
Mờ
hó
a
(Fuzzific
ation)
- 64 -
với ic là trọng tâm của ( )ki
By đối với luật thứ i . Thông thường ta chọn
( )ki
By đối xứng qua trục thẳng đứng qua đỉnh để ic là điểm giữa của ( )
kiB
y
. Phương trình (3-2) chính là mô hình của hệ mờ Mamdani với phương pháp
giải mờ COG và được dùng làm bộ xấp xỉ mờ ( , )F x θ với 1, ,T
pc c θ .
Biểu diễn toán học bộ xấp xỉ nơron
Xét mạng nơron nhân tạo truyền thẳng 1p lớp với đầu ra có hàm kích hoạt
tuyến tính trong đó 0,1.. 1,p p lần lượt chỉ số thứ tự từ lớp đầu vào, (các) lớp
ẩn (khi 2p ) đến lớp đầu ra. Nếu ký hiệu:
ix , jy : tương ứng là các đầu vào và đầu ra của mạng với 1..i n , 1..j m ;
iL : là số lượng nơron trong lớp ẩn thứ i (khi 2p ) với 1.. 1i p ;
ijkw : là trọng số từ nút mạng thứ k trong lớp 1i tới nút mạng thứ j
trong lớp i với 1..i p , 1.. 1
1..
iL i pj
m i p
,
1.. 1
1.. 1i
n ik
L i p
;
ij : là giá trị ngưỡng của nút mạng thứ j trong lớp i với 1..i p ,
1.. 1
1..
iL i pj
m i p
;
ij : là hàm kích hoạt nút mạng thứ j trong lớp ẩn i với 1.. 1i p ,
1.. ij L ;
thì đầu ra của nơron thứ j trong lớp ẩn i (khi 2p ), ký hiệu là ,i jo với
1.. 1i p , 1.. ij L và đầu ra của mạng ry với 1..r m là:
- 65 -
1
1 1 1
1
1
1
1
1 1i
n
j jk k jki
j Li i i ij jk k j
k
w x i
o
w o i p
, 1
1 1
1
1
1
1
2p
n
rs s rs
r Lp p prs s r
s
w x p
y
w o p
Hình 7 : Mạng nơron 2 lớp
Hình 7 biểu diễn mạng nơron truyền thẳng 2 lớp ( 2p ) có n đầu vào, m
đầu ra tuyến tính và L nút ẩn. Mô hình của mạng được viết như sau:
2 1 1 2
1 1
L n
i ij j jk k j ij k
y w w x
(3-3)
với 1..i m . Trường hợp mạng chỉ có một đầu ra ( 1m ) với hàm kích hoạt
xíchma 2
1sig( )
1 xx
e
trong lớp ẩn thì có thể dùng mạng làm bộ xấp xỉ vạn
năng các hàm liên tục vô hướng ( ) : nf x hay:
i : Hàm kích hoạt nút mạng
thứ i trong lớp ẩn 1
11
21
2m 1
L
211w
21Lw
21mw
2mLw
111w
112w
11nw
11Lw
12Lw
1Lnw
L nút ẩn n đầu vào
xn
x1
x2
1
1
2
n
L
y1 1
ym m
m đầu ra
Lớp đầu vào (Lớp 0)
Lớp ẩn (Lớp 1)
Lớp đầu ra (Lớp 2)
- 66 -
2 1 1 21 1 1
1 1
( , ) sigL n
j jk k jj k
F y w w x
x θ (3-4)
Bộ xấp xỉ mờ nơron
Có nhiều kết quả nghiên cứu nhằm kết hợp được các ưu điểm của hệ mờ và
mạng nơron trong xây dựng cấu trúc bộ xấp xỉ ([86]). Một trong những kết quả
nghiên cứu khả quan là hệ suy diễn mờ dựa trên mạng thích nghi ANFIS
(Adaptive-Network-based Fuzzy Inference System) do Jang đề xuất ([64], [65],
[66], [86]). Đây là một cấu trúc mạng nơron lai dựa trên mô hình hệ mờ Takagi-
Sugeno có luật mờ được cho dưới dạng mô tả mờ sau:
iR : 1 2
1 2 ( )i i ni
nj j j iA A A g x
Mạng ANFIS sử dụng hàm tuyến tính 1
( )n
i ij jj
g a x
x , hàm liên thuộc đầu
vào hình chuông và đã được chứng minh là một bộ xấp xỉ vạn năng các hàm phi
tuyến.
Biểu diễn toán học các bộ xấp xỉ tuyến tính và phi tuyến đối với tham số
Các bộ xấp xỉ (mờ nơron) có thể biểu diễn dưới dạng tuyến tính hoặc phi
tuyến đối với tham số. Bộ xấp xỉ được gọi là tuyến tính đối với tham số nếu
biểu diễn được dưới dạng:
( , ) ( )TF x θ θ φ x hay ( , )
( )TF
x θφ x
θ (3-5)
trong đó ( )φ x là véctơ hàm của x và θ là véctơ tham số đầu vào biểu diễn
tuyến tính trong hàm số của bộ xấp xỉ. Ví dụ bộ xấp xỉ mờ nơron tuyến tính đối
với tham số như hệ mờ theo công thức (3-2) và mạng nơron RBN (Radial Basis
NN). Trường hợp bộ xấp xỉ dùng hệ mờ theo (3-2) nếu 1, ,T
pc c θ thì
- 67 -
1( , )
( ) ( ), , ( )Tp
F
x θφ x x x
θ với
1
( , )
( )
( , )
i
i
C
zi p
Ci z
z dz
z dz
x
x
x
nên có thể
biểu diễn ( , ) ( )TF x θ θ φ x là dạng tuyến tính đối với tham số.
Trường hợp ( , )
( , )TF
x θφ x θ
θ hay ( , )φ x θ có chứa véctơ tham số θ như
trường hợp bộ xấp xỉ dựa trên mạng nơron đa lớp biểu diễn trong (3-4), bộ xấp
xỉ được gọi là phi tuyến đối với tham số do ( , )F x θ là hàm phi tuyến của tham
số θ :
( , ) ( , )TF x θ θ φ x θ . (3-6)
Tuyến tính hóa các bộ xấp xỉ
Các bộ xấp xỉ phi tuyến đối với tham số thường đơn giản hơn (về kích cỡ và
số lượng tham số) so với các bộ xấp xỉ tuyến tính để đạt được độ chính xác xấp
xỉ tương đương nhau. Đối với luật điều khiển phản hồi tĩnh trong phương pháp
thay thế ước lượng hàm trạng thái, vấn đề sử dụng bộ xấp xỉ tuyến tính hay phi
tuyến đối với tham số không được đặt ra do chỉ cần bộ xấp xỉ đảm bảo sai số
cần thiết trong miền hợp lệ. Tuy nhiên để chỉnh định tham số của bộ xấp xỉ
trong luật điều khiển phản hồi động, việc sử dụng bộ xấp xỉ tuyến tính hay phi
tuyến đối với tham số có ý nghĩa quan trọng. Mặc dù các kết quả nghiên cứu
của luận án trong chương sau cho phép áp dụng một trong hai dạng bộ xấp xỉ,
tuy nhiên cũng có thể tuyến tính hóa bộ xấp xỉ phi tuyến đối với tham số tùy
theo mỗi ứng dụng.
Vấn đề tuyến tính hóa bộ xấp xỉ được trình bày trong [57]. Kết quả này cho
biết nếu bộ xấp xỉ là liên tục Lipschitz đối với tham số chỉnh định (không kể là
biểu diễn được ở dạng tuyến tính hay phi tuyến) thì đều có thể viết như sau:
* *( , )( , ) ( , ) ( , ) ( , , )F
FF F
θ
x θx θ x θ x θ Δ x θ θ
θ (3-7)
- 68 -
trong đó θ là tham số hiện thời, * arg min sup ( , ) ( )F f
θ x
θ x
θ x θ x là tham số
tối ưu, * θΔ θ θ , *( , , ) ( ) θx θ θ Δ với 0
( )lim 0
θ
θ
Δ θ
Δ
Δ. Ngoài ra
*( , , ) x θ θ bị chặn bởi 2*( , , ) L θx θ θ Δ với L là hằng số Lipschitz, do vậy
nếu tìm được luật chỉnh định θ để giảm được 2
θΔ thì θ có xu hướng tiến về
*θ và ( , )F x θ sẽ tiến đến
*( , )F x θ . Như vậy nếu 2
θΔ bị chặn thì sai số xấp xỉ
cũng bị chặn. Đây chính là cơ sở để xây dựng luật chỉnh định tham số trong
chương tiếp theo.
Tối ƣu hóa các bộ xấp xỉ mờ nơron
Vấn đề tối ưu hóa các bộ xấp xỉ mờ nơron nói chung là tìm cách tối thiểu
hóa hàm giá trị (cost function) 2
( ) sup ( ) ( , )J f F
xx
θ x x θ với p θθ là
véctơ của p tham số chỉnh định được của hệ mờ hoặc mạng nơron hay cần tìm
tham số chỉnh định tối ưu *θθ từ số liệu đo để * arg min ( )J
θθ
θ θ .
Như vậy để sai số xấp xỉ nhỏ theo yêu cầu, số liệu đo phải đủ lớn và bao phủ
được toàn bộ miền hợp lệ x . Tuy nhiên trong thực tế đa phần không thể lựa
chọn được cách phân bố số liệu đo trong x cũng như không thể thay đổi số
liệu đo để cải thiện độ chính xác mà chỉ có thể sử dụng trực tiếp số lượng hữu
hạn các số liệu đo có được. Đây thực sự là vấn đề phức tạp và trong nhiều
trường hợp phương pháp tối ưu hóa không đảm bảo đáp ứng được yêu cầu về
sai số xấp xỉ. Thông thường để tìm véctơ tham số chỉnh định tối ưu *θθ từ
các số liệu đo có được có thể áp dụng thuật toán bình phương nhỏ nhất (Least
Squares) tuyến tính (batch, recursive) hoặc phi tuyến (gradient, conjugate
gradient, line search, Levenberg-Marquardt) được trình bày trong các tài liệu
[57], [58], [66], [68], [76], [86], [91].
- 69 -
3.2. Thay thế ƣớc lƣợng hàm trạng thái
3.2.1. Cơ sở toán học của phương pháp
Trƣờng hợp hệ khả tuyến tính hóa phản hồi trạng thái
Trước tiên xét trường hợp hệ khả tuyến tính hóa phản hồi trạng thái. Khi đó
phương pháp thay thế ước lượng hàm trạng thái trong luận án sử dụng bộ xấp xỉ
vạn năng để thay thế thành phần chưa biết trong phương trình trạng thái của hệ
phi tuyến sao cho sai số xấp xỉ nx của hệ thỏa mãn yêu cầu dxn W trong
miền hợp lệ của xx , uu và với 0W cho trước để E bị chặn theo
(2-26) hay 0max ,E E E với 0 (0)E E và W
E
.
Xuất phát từ thực tế trong nhiều trường hợp dạng của ( )f x , ( )g x đã biết (ví
dụ như 1 2( ) ( ) ( )f f f x x x , 1( ) ( )g cgx x với 1( )f x , 1( )g x là các hàm liên
tục đã biết; 2 ( )f x và c là hàm số và hằng số chưa biết) hoặc có thể ước lượng
được nên phương pháp xây dựng theo hướng thay thế ( )f x , ( )g x tương ứng
bởi các hàm liên tục ( )f x và ( ) 0g x bị chặn đã biết và tìm cách bù sai lệch
do phép thay thế gây nên để kết quả cuối cùng sai số E bị chặn theo (2-26).
Giả sử phép thay thế trên dẫn đến điều kiện xấp xỉ không thỏa mãn hay:
( , ) ( ) ( ) ( ) ( )dxn u f f g g u W x x x x x (3-8)
với W W trong miền xx , uu và u là luật điều khiển phản hồi theo
(2-28). Khi đó như đã phân tích trong mục 2.2.2 trang 31, nếu ta xác định được
hàm 1Φ( , ) : nu x thỏa mãn điều kiện ( , )dxn u x với xx ,
uu thì có thể bù được ảnh hưởng của sai số xấp xỉ dxn bằng cách sử dụng
luật điều khiển phản hồi cu u u theo (2-39) hoặc (2-42) để E bị chặn theo
(2-26).
- 70 -
Điều này cũng có nghĩa là nếu xấp xỉ được dxn trong miền hợp lệ của x và
u bởi bộ xấp xỉ vạn năng 1( , , ) : n pF u x θ với pθ là véctơ tham
số chỉnh định được của bộ xấp xỉ và tìm được véctơ tham số θ thỏa mãn:
( , , ) ( , )dxnF u u W x θ x (3-9)
với 0W thì vấn đề sai số xấp xỉ nx nêu trên cũng sẽ được giải quyết bằng
cách thay thế Φ( , )ux bằng ( , , )F u x θ trong luật điều khiển phản hồi (2-39)
hoặc (2-42) hay với thành phần bù:
( , , )
sign( )( )
c
F uu E
g
x θ
x
hoặc
( , , )bsig( , )
( )c
F uu E
g
x θ
x
(3-10)
có thể giảm trừ được ảnh hưởng của sai số trong phép thay thế như đã phân tích
trong Chương 2.
Như vậy vấn đề xấp xỉ nx với sai số W lại trở thành vấn đề xấp xỉ dxn với
sai số W trong phương pháp. Do nx có thể tính được từ các số liệu đo nên với
giả thiết số liệu đo đầy đủ, dxn theo công thức (3-8) luôn xấp xỉ được bởi bộ
xấp xỉ vạn năng ( , , )F u x θ các hàm liên tục vô hướng thuộc lớp hàm
,( 1, )c un x trong miền đóng 1
,n
u x với sai số bất kỳ. Lưu ý là dxn
còn có thể viết như sau:
( , ) ( ) ( )dxn nu f g u x x x x (3-11)
Tuy nhiên do ( , , )F u x θ không liên tục nên với thành phần bù (3-10), tín
hiệu điều khiển cũng không liên tục. Để giải quyết vấn đề này tác giả đề xuất sử
dụng thành phần bù liên tục có dạng:
( , , )
bsig , ( , , )( )
cF u
u EF ug
x θ
x θx
(3-12)
với 0 1 , 0 và u định nghĩa như (2-28) khi đó tín hiệu điều khiển phản
hồi được tính như sau:
- 71 -
1 ( ) 1
( ) ( ) ( , , ) bsig , ( , , )
c
n T
u u u
g r f F u EF u
x η e x x θ x θ
(3-13)
Phát biểu của Định lý 3 dưới đây giải quyết vấn đề còn tồn tại của phương
pháp trong trường hợp ( ) 0g x và ( )f x thay thế không thỏa mãn điều kiện
(2-34) và được gọi là Định lý 1 mở rộng trong trường hợp điều kiện (2-34)
không được đáp ứng.
Định lý 3 : (Định lý 1 mở rộng) Điều kiện để phương trình động học hệ sai số
(2-20) với luật điều khiển phản hồi tĩnh (3-13) có nghiệm bị chặn tới hạn đều
theo (2-26) là bộ xấp xỉ vạn năng 1( , , ) : n pF u x θ xấp xỉ (3-11) với
sai số W bị chặn bởi:
2_ max
20 μ ( , )EW W
(3-14)
trong miền hợp lệ của xx và uu , trong đó _ maxμ ( , )E tính theo
công thức (2-63) và W là sai số thiết kế theo (2-34).
Chứng minh
Để chứng minh Định lý 3 ta cần chỉ ra rằng bằng luật điều khiển phản hồi
(3-13) chứa đại lượng bù (3-12) thì đạo hàm của hàm Lyapunov cũng thỏa mãn
(2-23).
Ký hiệu ( , , )F F u x θ và ( , , )F F u x θ thì từ phương trình động học
của hệ sai số ( ) ( , )c dxnE E g u u x x suy ra:
2
2
2
( ) ( , )
1bsig( , )
1sign( ) bsig( , )
c dxn
dxn
dxn
V E Eg u E u
E EF EF E
E E F E EF
x x
- 72 -
Do sign( )sign( ) sign( )E F EF và dxn dxnF F W hay
dxn F W nên:
2
2
22
2
_ max
1sign( )sign( ) bsig( , )
1sign( ) bsig( , )
1 1μ ( , )
2 2
1μ ( , )
2
E
E
V E E W E F E F EF
E E W EF EF EF
WV W E EF
WV
(3-15)
với μ ( , , )E E được định nghĩa như (2-61) và _ maxμ ( , , ) μ ( , )E EE với
mọi thỏa mãn 0 1 , 0 và E theo Bổ đề 3 trang 40.
Rõ ràng để 0max ,E E E như (2-26), cần có 2
2
WV V
như
(2-23) nên từ (3-15) suy ra sai số của bộ xấp xỉ vạn năng dxnF W cũng
như phải đáp ứng điều kiện:
2_ max
20 μ ( , )EW W
,
2
_ maxμ ( , )2
EW
nên Định lý 3 được chứng minh.
Lưu ý trường hợp 1 , ta có _ max1.2785 0.5569
μ (1, ) μ (1, , )E E
nên điều kiện trên trở thành:
2 1.11380 W W
,
2
1.1138
W
▲
- 73 -
Trƣờng hợp hệ khả tuyến tính hóa phản hồi vào-ra
Tương tự như trên, xét trường hợp hệ là khả tuyến tính hóa phản hồi vào-ra
dạng (2-4) có hệ con phi tuyến là ISS và thỏa mãn Giả thiết 2. Nếu ( , )f x q ,
( , ) 0g x q là các hàm số thay thế liên tục bị chặn cho trước không thỏa mãn
điều kiện (2-85) nhưng thỏa mãn:
( , , ) ( , ) ( , ) ( , ) ( , )dxn u f f g g u W x q x q x q x q x q
với W W trong miền ,( , ) n d x qx q , uu và u là luật điều khiển
phản hồi theo (2-84) thì có thể sử dụng thành phần bù:
( , , , )
bsig , ( , , , )( , )
cF u
u EF ug
x q θ
x q θx q
(3-16)
với 0 1 , 0 để với luật điều khiển phản hồi tĩnh cu u u hay:
( ) 1( , ) ( , , , ) bsig , ( , , , )
( , )
c
n T
u u u
r f F u EF u
g
η e x q x q θ x q θ
x q
(3-17)
ta có x , q bị chặn đều theo Định lý 6.1 ([57]) tương tự như đã trình bày ở trên.
Lưu ý là trong trường hợp này ( , , )dxn u x q được xấp xỉ bởi bộ xấp xỉ vạn
năng 1( , , , ) : n d pF u x q θ các hàm liên tục vô hướng thuộc lớp hàm
, ,( 1, )c un d x q trong miền đóng 1
, ,n d
u x q với pθ là véctơ
tham số chỉnh định được và θ là véctơ tham số cần tìm thỏa mãn:
( , , , ) ( , , )dxnF u u W x q θ x q (3-18)
với W là sai số cần đạt thỏa mãn (3-14).
- 74 -
3.2.2. Xác định tham số bộ điều khiển
Các kết quả trong phần trước đã đề cập đến việc chọn tham số điều khiển
trong một số trường hợp tuy nhiên từ trước đến giờ ta luôn giả thiết rằng từ các
số liệu đo và dữ liệu đã biết về hệ thống đủ để thiết kế được bộ xấp xỉ đảm bảo
sai số xấp xỉ theo yêu cầu trong miền hợp lệ của n xx và uu . Tuy
nhiên trong thực tế miền hợp lệ x , u ở đây thực chất là miền mà bộ xấp xỉ
tìm được phải đảm bảo được sai số xấp xỉ theo yêu cầu và do vậy cần thiết kế
bộ điều khiển sao cho x và u không vượt ra ngoài x và u .
Nhằm xác định tham số điều khiển và các điều kiện cần trong phương pháp
đảm bảo các yêu cầu bị chặn trong miền hợp lệ của không gian trạng thái và tín
hiệu điều khiển, sau đây trình bày phương pháp tính toán. Để đơn giản các
phương pháp chỉ phân tích áp dụng cho trường hợp hệ khả tuyến tính hóa phản
hồi trạng thái. Trường hợp hệ khả tuyến tính hóa phản hồi vào-ra có thể áp dụng
các bước tính toán tương tự.
Xác định tham số điều khiển để quỹ đạo trạng thái bị chặn
Giả thiết rằng bằng phương pháp thay thế ước lượng như trên, luật điều
khiển phản hồi (2-28) đảm bảo sai số dxn W chỉ trong miền xx , uu
và : , 0nM Mx x x x x là siêu cầu chứa gốc tọa độ. Bài toán đặt ra
là cần xác định tham số điều khiển 1 1 2 1, , ,T
nk k k k η và các điều
kiện giới hạn khác để quỹ đạo trạng thái của hệ luôn nằm trong x hay Mxx
, 0Mx cho trước với mọi 0t . Khi đó cần xác định được E sao cho khi
EE thì xx .
Định lý 1 (trang 29) cho biết nếu điều kiện sai số được đảm bảo trong miền
hợp lệ của xx , uu thì hệ sai số có nghiệm bị chặn bởi (2-26). Như vậy
nếu định nghĩa 0: max ,E E E E E thì E chính là miền chứa
- 75 -
toàn bộ quỹ đạo của hệ sai số E hay EE với 0t . Do E luôn nằm trong
E nên không cần thiết phải có 0V khi E không nằm trong E hay khi
EE .
Mặt khác do hệ sai số được lập thỏa mãn Giả thiết 1 (Bổ đề 1 trang 23) nên
từ kết quả chứng minh trong mục 5.2 trang 136 phần Phụ lục, suy ra x bị chặn
bởi:
1
1
1 ( , )E
n
M ii
r E k t E
dx
với 2 2 ( )1 1
0
( , ) e (0) e ( )E
t-p t -p t
Et E p p E d d d và 1p , 2p được chọn
thỏa mãn 21e e
t -p tpkA .
Nếu chọn 0 0E thì từ (2-26) suy ra E E và:
2 2( ) 1 11
2 20
11
21
( , ) e 1
1
E
t-p t p t
n
M ii
p W p Wt E p E d e
p p
W p Wr k
p
d
x
Do vậy để Mxx cần thiết chọn các tham số điều khiển thỏa mãn:
1
2 11
2
1
( )
n
ii
M M
p p kW
p x r
(3-19)
Xác định tham số điều khiển để tín hiệu đầu vào điều khiển bị chặn
Sau đây xét bài toán điều khiển với điều kiện đầu vào (3-13) cần giữ trong
miền :u Mu u u , 0Mu hay Mu u cần đảm bảo với 0t .
Ngoài ra cũng giả thiết rằng 0 ( )Lg g x .
- 76 -
Dựa theo phương pháp tính toán trình bày trong [48] áp dụng trong trường
hợp này, bổ đề sau cho biết điều kiện và cũng là cách xác định tham số điều
khiển trong phương pháp thay thế ước lượng hàm trạng thái để luật điều khiển
phản hồi trong Định lý 3 bị chặn.
Bổ đề 5 : (Tính bị chặn của luật điều khiển) Luật điều khiển phản hồi (3-13)
đảm bảo uu với :u Mu u u nếu ML
W Wu
g
và điều kiện
(3-22) được thỏa mãn.
Chứng minh
Nếu ( )f x , ( )g x là các hàm liên tục Lipschitz cục bộ thì có thể xác định
được các hằng số fK , gK để:
( ) ( )
( ) ( )
f
g
f f K
g g K
x x x x
x x x x
với , xx x . Mặt khác từ (3-13) và do x e r nên có thể phân tích:
( )
( )
1( ) ( , , ) bsig , ( , , )
( )
( ) ( ) ( ) bsig( , ) ( )
( ) ( ) ( )
n T
n T
r f F u EF u
ug
r f f f F EF g
g g g
η e x x θ x θ
x
η e e r r r r
r r e r
Với giả thiết 0 ( )Lg g x tiếp tục biến đổi được như sau:
- 77 -
( )
( )
( )
( ) ( ) ( ) bsig( , )
( ) ( ) ( ) ( )
( ) ( )1
( )
( )1
( ) ( ) ( ) ( ) ( )
( )
( )
n T
nf g
n
fL L
r f f f F EFu
g g g g
g g
g
FK Kr f
g g g g g
r f W WK
g g g
r r e r η e
r r r r
e r r
e r
e eη er
r r r r e r
erη
r
1 g
L
Kg
e
do dxn dxnF F W F W W và W W là sai số xấp xỉ
thực nx do phép thay thế gây nên theo (3-8).
Như vậy để Mu u cần thiết:
( ) ( )
( )1
nM
fL L
gL
r f u W WK u
g g gK
g
erη
er
(3-20)
Từ (2-26) ta có 0max ,TE E E k e nên
0( ) max , Mt K E E e e , 0Me . Khi đó định nghĩa:
1
M Mf
M L Lg
L
u e W WM K
e g gK
g
η
(3-21)
thì M u và nếu 0M thì điều kiện (3-20) luôn thỏa mãn. Để 0M cần có:
2
1
0
M MM g f
L L L
M Mg f f g M
L L L L
e e W Wu K K
g g g
e W W e W WK K K K u
g g g g
η
η η
- 78 -
là dạng bất phương trình bậc hai 2 0Az Bz C với 0g fA K K η ,
0f gL
W WB K K
g
η
, ML
W WC u
g
và 0M
L
ez
g . Gọi 1 2z z là
hai nghiệm của đa thức bậc hai nêu trên thì bất phương trình có nghiệm
1 2z z z .
Do nếu 0C thì đa thức bậc hai trên có hai nghiệm thực không dương nên
cần thiết 0C hay ML
W Wu
g
để đa thức có một nghiệm dương. Khi đó:
2
0 24
0 max ,2L
K B B ACz E E z
g A
và như vậy để 0M cần chọn:
2
04
max ,2
LB B AC gE E
A K
và
( ) ( )
( )
nr fM
g
r
r
(3-22)
để tín hiệu điều khiển luôn nằm trong u hay Mu u .
Kết quả trên chứng minh cho phát biểu của Bổ đề 5. Lưu ý là Bổ đề 5 không
chỉ cho phép tính toán tham số của bộ điều khiển (nếu tồn tại) để tín hiệu điều
khiển bị chặn trong u mà còn là cơ sở để kết luận có thể điều khiển bám theo
tín hiệu mẫu cho trước với sai số thiết kế và các điều kiện ban đầu được chọn
của hệ sai số hay không.
▲
- 79 -
3.2.3. Mô phỏng điều khiển tay rôbốt
Để minh họa sau đây là một ví dụ áp dụng phương pháp trong điều khiển tay
rôbốt theo quỹ đạo định trước. Để đơn giản, xét mô hình đơn thanh nối (flexible
single-link) có phương trình động lực học như sau ([50]):
1 1 1 2
2 1 2
sin ( ) 0
( )
Iq MgL q k q q
Jq k q q u
(3-23)
với 1q , 2q tương ứng là vị trí góc quay của thanh nối và trục động cơ; I , J là
mômen quán tính của thanh nối và trục động cơ; k là hệ số đàn hồi; g là gia tốc
trọng trường; M là khối lượng thanh nối; L là khoảng cách từ trục tới trọng
tâm của thanh nối và u là lực quay đầu vào của motor. Các số liệu cho trước
gồm: 20.04Nms /radI J , 0.8Nm/radk , 0.1mL , 6kgM , 29.8m/sg
. Bài toán đặt ra là cần điều khiển vị trí góc quay 1q hay 1y q theo quỹ đạo r
định trước.
Phương trình động lực học (3-23) và đầu ra có thể chuyển về dạng tuyến tính
hóa phản hồi trạng thái sau (xem chi tiết trong mục 5.4 trang 143 phần Phụ lục):
1 2
2 3
3 4
24 2 1 1 3
1
sin cos
x x
x x
x x
x a x c x a x b c x bdu
y x
(3-24)
với MgL
aI
, k
bI
, k
cJ
, 1
dJ
chính là dạng quen thuộc (2-6) với
22 1 1 3( ) sin cosf a x c x a x b c x x và ( )g bdx .
Sau đây giả thiết rằng các trạng thái của hệ (3-24) đo được, trong khi ( )f x ,
( )g x chưa biết đầy đủ. Ta cần điều khiển vị trí góc quay của thanh nối theo quỹ
đạo định trước ( ) sin(0.5 )cos(0.1 )3
r t t t
với trạng thái ban đầu (0) x 0 .
- 80 -
Để mô phỏng phương pháp đề xuất, sau đây thay thế các hàm trạng thái chưa
biết bằng các hàm số 2 2 1 2 2 2 3( ) sin ( )f a c x a b c x x và 2 2( )g b dx với
2a a , 2 0.9b b , 2 1.1c c , 2 1.3d d . Phép thay thế trên dẫn đến sai số lớn
trong điều khiển bám theo tín hiệu mẫu như kết quả mô phỏng trên Hình 8. Các
đồ thị trên Hình 8 này, theo thứ tự biểu diễn đồ thị theo thời gian sai lệch của
phép thay thế ( ) ( )f f f x x , ( ) ( )g g g x x ; tín hiệu đầu vào điều khiển
u (khi không có thành phần bù); tín hiệu mẫu ( )r t và đáp ứng đầu ra.
Để thiết kế thành phần bù trong phương pháp, mô phỏng sử dụng bộ xấp xỉ
mờ nơron ANFIS với 5 đầu vào (bao gồm véctơ trạng thái x và đầu vào điều
khiển u ). Như vậy cùng với giả thiết số liệu đo là đầy đủ, bộ xấp xỉ mờ nơron
ANFIS luôn xấp xỉ được dxn với sai số nhỏ tùy ý. Tuy nhiên để kích cỡ bộ xấp
xỉ không quá lớn và tốc độ mô phỏng nhanh hơn, ta có thể chấp nhận sai số xấp
xỉ lớn hơn bằng cách mỗi đầu vào ANFIS chỉ sử dụng 2 hàm liên thuộc dạng
hình chuông (hàm gbellmf trong MATLAB V6.5) để xấp xỉ ( , )dxn u x và sẽ
chọn các tham số và để chất lượng điều khiển đáp ứng được yêu cầu thiết
kế.
Hình 9 và Hình 10 tương ứng biểu diễn kết quả mô phỏng điều khiển khi sử
dụng thành phần bù là bộ xấp xỉ mờ nơron ANFIS đã luyện nêu trên trong luật
điều khiển phản hồi tĩnh (3-13) với 1 , 1.0 và 1 , 0.8 . Tương tự
như trường hợp mô phỏng không có thành phần bù, các đồ thị trong Hình 9 và
Hình 10 theo thứ tự biểu diễn đồ thị thời gian của sai lệch do phép thay thế gây
ra; tín hiệu đầu vào điều khiển cu u u có chứa thành phần bù; tín hiệu mẫu
( )r t và đáp ứng đầu ra trong mỗi trường hợp. Chất lượng điều khiển tốt hơn
trong trường hợp 0.8 so với trường hợp 1.0 minh họa cho việc sử dụng
hàm _ maxμ ( , )E để phân tích giới hạn bị chặn của hệ sai số trong phương
pháp.
Có thể tham khảo toàn bộ mã code chương trình mô phỏng viết trên Matlab
V6.5 trong mục 5.4 trang 143 phần Phụ lục.
- 81 -
Hình 8 : Mô phỏng trong trường hợp không sử dụng thành phần bù
0 5 10 15 20 25 30 35 40 45 50-300
-200
-100
0
100
200
300 = 0
t [s]
f(x), g(x
)
f(x)
g(x)
0 5 10 15 20 25 30 35 40 45 50-2
-1.5
-1
-0.5
0
0.5
1
1.5
2 = 0
t [s]
u
0 5 10 15 20 25 30 35 40 45 50
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
= 0
t [s]
r, y
Reference signal
Plant's output
- 82 -
Hình 9 : Mô phỏng sử dụng thành phần bù tĩnh với 1 và 1.0
0 5 10 15 20 25 30 35 40 45 50-300
-200
-100
0
100
200
300 = 1, = 1.0
t [s]
f(x), g(x
)
f(x)
g(x)
0 5 10 15 20 25 30 35 40 45 50-3
-2
-1
0
1
2
3
4
5 = 1, = 1.0
t [s]
u
0 5 10 15 20 25 30 35 40 45 50
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
= 1, = 1.0
t [s]
r, y
Reference signal
Plant's output
- 83 -
Hình 10 : Mô phỏng sử dụng thành phần bù tĩnh với 1 và 0.8
0 5 10 15 20 25 30 35 40 45 50-300
-200
-100
0
100
200
300 = 1, = 0.8
t [s]
f(x), g(x
)
f(x)
g(x)
0 5 10 15 20 25 30 35 40 45 50-3
-2
-1
0
1
2
3
4
5
6
7 = 1, = 0.8
t [s]
u
0 5 10 15 20 25 30 35 40 45 50
-1
-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
= 1, = 0.8
t [s]
r, y
Reference signal
Plant's output
- 84 -
3.3. Thay thế ƣớc lƣợng hàm trạng thái mở rộng trong điều khiển ổn
định các hệ khả tuyến tính hóa phản hồi chặt
3.3.1. Phương pháp cuốn chiếu
Phương pháp thay thế ước lượng hàm trạng thái có thể áp dụng trong trường
hợp hệ khả tuyến tính hóa phản hồi chặt (strict-feedback system) có phương
trình động học và đầu ra ở dạng:
1 1 1 1 1 2
1 1 1 1 1 1 1
1
( ) ( )
( , , ) ( , , )
( ) ( )
n n n n n n
n n n
x f x g x x
x f x x g x x x
x f g u
y x
x x
(3-25)
trong đó 1, ,Tnx xx là các trạng thái đo được của hệ; if , ig ( 1..i n ) là
các hàm trơn liên tục bị chặn và 0ig với xx .
Dạng biểu diễn phản hồi chặt có thể gặp trong phân tích phần lớn các hệ
chuyển động hỗn loạn (chaotic systems) như trong công nghiệp hóa chất điều
khiển nồng độ pha trộn của các thành phần hóa học hoặc các chuyển động dòng
chảy. Một số ví dụ về các mô hình chuyển động hỗn loạn và phương pháp điều
khiển gồm Duffling oscillator ([96]), van der Pol oscillator ([50]), Brusselator
([107]) và Lorenz ([37], [87]).
Phương pháp thiết kế bộ điều khiển ổn định tĩnh để đầu ra của hệ luôn bám
theo tín hiệu mẫu ( )r t bị chặn cho trước trong trường hợp các hàm trạng thái if
, ig đã biết (trường hợp 1) dựa trên phương pháp cuốn chiếu (integrator
backstepping) được trình bày chi tiết trong [51], [57]. Theo đó bằng cách lập hệ
sai số cho các hệ con lần lượt từ hệ con 1x để hình thành nên hệ sai số chung
của toàn hệ 1, ,TnE EE với 1 1E x r và 1i i iE x u , 2..i n trong
đó:
1 1 1i i i i ii
i
f u g E Eu
g
, 0
- 85 -
thì phương trình động học của hệ sai số có thể chuyển về dạng tổng quát sau:
( , ) ( )t u E α x β x
với
1 1 2
2 2 1 1
1
( , )
( )
n n n n n
n n
E g E
tg E E g E
u f
α x
x
và
0
( )0
( )ng
β x
x
.
Sử dụng luật điều khiển phản hồi 1 1 1( )
( )
n n n n n
n
f u E g Eu
g
x
x
và
chọn hàm Lyapunov 2
1
1
2
n
n ii
V E
sẽ dẫn đến 2n nV V nên suy ra E 0 là
điểm cân bằng ổn định theo hàm số mũ và E bị chặn. Ngoài ra do hệ sai số
được lập thỏa mãn Giả thiết 1 nên E bị chặn cũng có nghĩa là x bị chặn nên
bài toán bám trong trường hợp 1 đã được giải quyết.
3.3.2. Phương pháp thay thế ước lượng hàm trạng thái khi hệ chứa các
thành phần không rõ
Trƣờng hợp điều kiện sai số xấp xỉ thỏa mãn
Sau đây xét trường hợp tổng quát khi các hàm trạng thái ( )i if x , ( )i ig x (
1..i n ) đều chứa thành phần chưa biết (trường hợp 2) nhưng với giả thiết rằng
từ các số liệu đo và hiểu biết về hệ thống ta có thể xác định được các cặp hàm
( )i if x , ( )i ig x thay thế tương ứng sao cho sai số xấp xỉ ix thỏa mãn:
( , ) ( ) ( ) ( ) ( )dxi i i i i i i i i i i i iu f f g g u W x x x x x (3-26)
với xx , ii uu và 0iW cho trước, trong đó ký hiệu 1[ , , ]Ti ix xx ,
1..i n và n x x . Khi đó tiếp tục áp dụng phương pháp cuốn chiếu như trong
trường hợp 1, ta có thể lần lượt định nghĩa các hệ con để hình thành hệ sai số
chung của toàn hệ như sau:
- 86 -
Hệ con 1x :
1 1 1 1 1 1 1 1 1 1( ) ( ) ( ) ( ) dxx f x g x u f x g x u
Định nghĩa hệ sai số cho hệ con 1x là 1 1E E x r , khi đó động học của
hệ sai số sẽ là 1 1 1 1 1 1( ) ( ) dxE f x g x u r với 2u x là đầu vào ảo. Chọn
hàm Lyapunov 21 1
1
2V V E và sử dụng luật điều khiển phản hồi ảo:
11 1 1 1u u g r f E
dẫn đến 1 1 1dxE E và đạo hàm của V theo quỹ đạo động học của hệ sai
số có thể biến đổi như sau:
1 1 1 1 1 1 1
21 1 1
2 21
1 1 1
21
1
( ) ( ) ( )
1
2 2
2
dx
dx
V E E f x g x u r
E E
WV W E
WV
nên áp dụng Bổ đề 2.1 ([57]) với 1m , 2
12
2
Wm
dẫn đến 1V V bị chặn và
do đó 1E E cũng bị chặn.
Hệ con 2x :
1 1 1 1 1 2 1 1 1 1 2 1
2 2 1 2 2 1 2 2 1 2 2 1 2 2
( ) ( ) ( ) ( )
( , ) ( , ) ( , ) ( , )
dx
dx
x f x g x x f x g x x
x f x x g x x u f x x g x x u
Định nghĩa hệ sai số cho hệ con 2x là 1 2,T
E EE với 1 1E x r ,
2 2 1E x u , 3u x là đầu vào ảo mới, khi đó:
- 87 -
1 1 1 2 1 1 1
1 1 1 1 1 2
1 1 2 1
dx
dx
dx
E f g x u u r
f g u r g E
E g E
Chọn hàm Lyapunov 2
21 1 2 2
1
1( ) ( ) ( )
2i
i
V V E V E E
E thì:
1 21 2
1 2
1 1 1 2 1 2 2 1
1 1 1 2 2 2 2 2 1
21
1 1 1 2 2 2 2 2 1
( )
( )
2
dx
dx
dx
V VV E E
E E
E E g E E x u
V E g E E E f g u u
WV g E E E f g u u
E
Sử dụng luật phản hồi:
12 2 2 1 1 1 2u u g f u g E E
dẫn đến 2 2 2 2 1 1 1 2 2dx dxE f g u u g E E và:
221
1 2 2 2
2 2 21 2
1 2 2 2
22
1
( )2
1
2 2 2
1
2
dx
ii
WV V E E
W WV V W E
V W
E
nên theo Bổ đề 2.1 ([57]) với 1m , 2
22
1
1
2i
i
m W
sẽ có ( )V E bị chặn và do
đó E cũng bị chặn.
- 88 -
Hệ nx :
1 1 1 1 1 2 1
2 2 1 2 2 1 2 3 2
1 1 1 1 1 1 1 ( 1)
1
( ) ( )
( , ) ( , )
( , , ) ( , , )
( ) ( )
dx
dx
n n n n n n dx n
n n n dxn
x f x g x x
x f x x g x x x
x f x x g x x x
x f g u
y x
x x
(3-27)
Bằng cách lập và tính toán lần lượt từng hệ con dẫn đến hệ sai số cho toàn hệ
được lập như sau:
1 1
2 2 1
1n n n
E x r
E x u
E x u
E
(3-28)
với 1 1, , nu u là các đầu vào ảo của các hệ con 1x đến 1nx sẽ được định nghĩa
sau. Chọn hàm Lyapunov 22
1 1
1 1( )
2 2
n n
i ii i
V V E
E E thì đạo hàm của V
theo quỹ đạo động học của hệ sai số sẽ là 1 1
( )n n
ii i i
ii i
VV E E E
E
E và có thể
biến đổi tiếp như sau:
1 1 1 2 1 1 1
1
1 12
1
1 1 1 1 1 1 1 2
1
1 12
1
( ) ( )
( )
dx
n
i i i i i i dxi ii
n n n dxn n
dx
n
i i i i dxi i i i ii
n n n dxn n
V E f g x u u r
E f g x u u u
E f g u u
E f g u r g E E
E f g u u g E E
E f g u u
E
- 89 -
Sử dụng luật phản hồi:
11 1 1 1 1
12 2 2 2 1 1 1 2
11 1 1 1 2 2 2 1
11 1 1
n n n n n n n n
n n n n n n n
u u g f r E
u u g f u g E E
u u g f u g E E
u u g f u g E E
(3-29)
dẫn đến phương trình động học của hệ sai số:
1 1 2 1
1 1 2 2 3 2
2 2 1 1 ( 1)
1 1
dx
dx
n n n n n dx n
n n n dxn
E g E
g E E g E
g E E g E
g E E
E
(3-30)
và đạo hàm của V theo quỹ đạo động học của hệ sai số:
2
1
2 2
1
22
1
( )
1
2 2
1
2 2
n
i i dxii
ni
i i ii
n
ii
V E E
WV W E
V W V
E
W
(3-31)
với 1, ,TnW WW là véctơ sai số xấp xỉ cho phép.
Áp dụng Bổ đề 2.1 ([57]) với 1m ,
2
22
m
W
sẽ có ( )V E bị chặn và do
đó E cũng bị chặn:
- 90 -
2
2
22
2
1 (0)2
1 (0)
t tH
t tH
V e V e V
e e E
W
WE E
(3-32)
Ngoài ra trong chế độ xác lập:
2
2lim
2H
tV V
W, lim H
tE E
W (3-33)
và tương tự như kết quả (2-26), ta còn có thể biểu diễn (3-32) như sau:
0
0
0 max ,
max ,
V V V E
E
E E (3-34)
với mọi 0t , 0 (0)E E là giá trị ban đầu của hệ sai số tại 0t và 2
0 01
2V E
.
▲
Lưu ý là để tính nu u cần thực hiện lần lượt các phép tính:
1 1 1 2 2 2 1 1 1, , ,n n n n nE u u E u u E u u E u u
và phương trình động học (3-30) của hệ sai số còn có thể viết ở dạng ma trận và
véctơ sau:
11
21 2
( 1)2 1
1
0 0
0
0
0 0
dx
dx
dx nn n
n dxn
d
g
g g
g g
g
x
E E
GE Δ
(3-35)
trong đó G là ma trận đối xứng lệch, dxΔ là véctơ sai số xấp xỉ các đạo hàm
trạng thái của hệ.
- 91 -
Trƣờng hợp điều kiện sai số xấp xỉ không thỏa mãn
Xét trường hợp tổng quát khi toàn bộ sai số xấp xỉ ix không thỏa mãn điều
kiện (3-26) hay giả thiết:
( , ) ( ) ( ) ( ) ( )dxi i i i i i i i i i i i iu f f g g u W x x x x x (3-36)
với xx , ii uu là các luật điều khiển phản hồi theo (3-29) và i iW W ,
1..i n . Khi đó tồn tại các bộ xấp xỉ vạn năng 1( , , ) : ipii i i iF u
x θ
để xấp xỉ được ( , )dxi i iu x bị chặn với sai số bất kỳ trong miền hợp lệ của ix
và iu . Sau đây ký hiệu ( , , )i i i i iF F u x θ , ( , , )i i i i iF F u x θ , iθ là các
véctơ tham số của các bộ xấp xỉ vạn năng thỏa mãn:
( , , ) ( , )i i i i dxi i i iF u u W x θ x (3-37)
với 0iW là sai số xấp xỉ của các bộ xấp xỉ vạn năng nêu trên và 1..i n .
Tiếp tục lập hệ sai số như (3-28) và áp dụng kết quả của Định lý 3 (trang 71)
bằng cách sử dụng các thành phần bù có dạng:
bsig( , )( )
iic i i
i i
Fu E F
g
x
(3-38)
với 0 1i , 0 trong luật điều khiển phản hồi i i icu u u trong đó bsig
là hàm xíchma lưỡng cực định nghĩa như (2-40) dẫn đến:
11 1 1 1 1 1 1 1
11 1 1
11 1 1
c c
i i ic i i i i i i i ic
n nc n n n n n n n nc
u u u g f r E g u
u u u g f u g E E g u
u u u g f u g E E g u
(3-39)
Khi đó phương trình động học của hệ sai số sẽ là:
- 92 -
1 1 2 1 1 1
1 1 2 2 3 2 2 2
2 2 1 1 ( 1) 1 ( 1)
1 1
dx c
dx c
n n n n n dx n n n c
n n n dxn n nc
E g E g u
g E E g E g u
g E E g E g u
g E E g u
E
(3-40)
và đạo hàm của V theo quỹ đạo động học của hệ sai số:
2
1
2
1
( )
1sign( ) bsig( , )
n
i i dxi i i ici
n
i i i dxi i i i iii
V E E E g u
E E F E E F
E
Do dxi i i dxi i dxi i iF F W F W nên:
2
1
1( ) sign( ) bsig( , )
n
i i i dxi i i i iii
V E E F E E F
E
với μ ( , , )E i E được định nghĩa như (2-61) và _ maxμ ( , , ) μ ( , )E i E iE
với 0 1i , 0 và E (Bổ đề 3 trang 40) hay:
2E_max
1
μ ( , )
2
ni
ii
V V
W (3-41)
trong đó ký hiệu 1, ,T
nW W W là véctơ sai số xấp xỉ của các bộ xấp xỉ
vạn năng iF như (3-37).
Để 0max ,EE E như (3-34) ta cần có
2
2V V
W theo (3-31)
nên từ (3-41) suy ra:
2 2E_max
1
μ ( , )
2 2
ni
ii
W W
hay sai số của các bộ xấp xỉ vạn năng W và cần chọn phải đáp ứng các điều
kiện sau:
- 93 -
2 E_max
1
μ ( , )2
ni
ii
W W (3-42)
và
2
E_max1 1
μ ( , )2
n n
i ii i
W
với 1, ,T
nW WW là véctơ sai số xấp xỉ theo thiết kế.
▲
Lưu ý là nếu chọn i với 1..i n thì (3-41) có thể rút gọn:
2
E_maxμ ( , )2
nV V
W
và điều kiện (3-42) trở thành:
2
E_max2
μ ( , )n
W W và
2
E_maxμ ( , )2 n
W.
3.4. Tổng hợp và kết luận
Chương 3 phát triển phương pháp thay thế ước lượng hàm trạng thái để giải
quyết vấn đề còn tồn tại trong Định lý 1 (trang 29) khi điều kiện sai số xấp xỉ
(2-34) không được thỏa mãn. Phương pháp dùng bộ xấp xỉ vạn năng mờ nơron
để xấp xỉ sai số gây nên bởi phép thay thế trong miền hợp lệ đóng của không
gian trạng thái và đầu vào, từ đó sử dụng thành phần bù liên tục (3-12) dựa trên
hàm xíchma lưỡng cực (2-40) đưa vào luật điều khiển phản hồi nhằm giảm trừ
tác động của sai số và để bảo đảm nghiệm của hệ sai số vòng kín bị chặn tới hạn
đều theo yêu cầu thiết kế (Định lý 3 trang 71).
Mặt khác nhằm xác định tham số điều khiển và các điều kiện cần trong
phương pháp đảm bảo các yêu cầu bị chặn trong miền hợp lệ của không gian
trạng thái và tín hiệu điều khiển, luận án đã đưa ra phương pháp tính toán trong
mỗi trường hợp trình bày dưới dạng công thức (3-19) và Bổ đề 5 (trang 76).
- 94 -
Ngoài ra luận án cũng chỉ ra rằng với một số điều kiện ràng buộc có thể áp
dụng phương pháp thay thế ước lượng hàm trạng thái để thiết kế bộ điều khiển
ổn định tĩnh các hệ chuyển động hỗn loạn (chaotic systems) thường gặp trong
công nghiệp hóa chất như điều khiển nồng độ pha trộn của các thành phần hóa
học hoặc các chuyển động dòng chảy có phương trình động học ở dạng tuyến
tính hóa phản hồi chặt (kết quả (3-38), (3-39) và (3-42)).
Phương pháp thay thế ước lượng đề xuất có các đặc điểm sau:
- Bộ điều khiển tĩnh có đặc tính bền vững và tín hiệu điều khiển liên tục nên
có thể áp dụng trong điều khiển công nghiệp.
- Quá trình thiết kế không cần phải xây dựng mô hình phức tạp hoặc xấp xỉ
chính xác từng hàm trạng thái không rõ trong phương trình động học do
phương pháp chỉ xấp xỉ chung các đại lượng không rõ dựa trên tri thức đã
biết về hệ thống.
- Có thể giảm trừ được tác động của nhiễu hoặc động học chưa biết khác trong
phương trình động học nhờ phương pháp bù sai lệch được xấp xỉ trong miền
hợp lệ của không gian trạng thái và đầu vào.
- Không phải giải quyết vấn đề ( ) 0g x (như nhiều phương pháp đã nêu trong
phần tổng hợp ở đầu Chương 2) do có thể chọn ( )g x trước để tránh trường
hợp này ngay từ ban đầu.
- Số lượng đầu vào bộ xấp xỉ vạn năng được xác định trước, lớn nhất là 1n
với n là số trạng thái của hệ.
Các kết quả trình bày trong chương này có thể tổng hợp lại thành các bước
tổng hợp bộ điều khiển ổn định tĩnh theo phương pháp thay thế ước lượng hàm
trạng thái khi điều kiện xấp xỉ không thỏa mãn như sau:
1. Dựa trên các số liệu đo và hiểu biết về hệ, tìm cách lập các hàm trạng thái
liên tục bị chặn ( )f x , ( ) 0g x tốt nhất có thể thay thế ( )f x , ( )g x chứa
các thành phần không rõ. Xác định các điều kiện ràng buộc về trạng thái
và đầu vào cần đáp ứng theo yêu cầu thiết kế, sử dụng các kết quả (3-19)
- 95 -
và Bổ đề 5 để xác định E sao cho khi EE thì luôn có xx và
uu .
2. Lựa chọn cấu trúc bộ xấp xỉ mờ nơron 1( , , ) : n pF u x θ phù
hợp để xấp xỉ ( ) ( )dxn nf g u x x x với pθ là véctơ tham số
chỉnh định, u là luật điều khiển phản hồi không chứa thành phần bù như
(2-28) và chuẩn bị cơ sở dữ liệu đo cần thiết dùng để luyện ngoại tuyến
bộ xấp xỉ mờ nơron trong miền hợp lệ của x và u .
3. Chỉnh định ngoại tuyến bộ xấp xỉ mờ nơron ( , , )F u x θ , xác định tham số
θ của bộ xấp xỉ mờ nơron đáp ứng điều kiện ( , , ) dxnF u W x θ với
sai số cần đạt thỏa mãn (3-14) trong miền hợp lệ của xx và uu
(hay trong miền hợp lệ của EE , lưu ý điều kiện sai số xấp xỉ không
cần đáp ứng ngoài miền hợp lệ). Trường hợp bộ xấp xỉ không đáp ứng
được yêu cầu thiết kế, cần thiết quay lại các bước 1, 2 ở trên để thay đổi
lại phép chọn các hàm f , g và/hoặc mở rộng cấu trúc (hay số lượng
tham số chỉnh định được) của bộ xấp xỉ mờ nơron.
4. Sử dụng bộ xấp xỉ mờ nơron tìm được thỏa mãn yêu cầu làm thành phần
bù trong luật điều khiển phản hồi (3-13).
Như vậy, những kết quả đạt được trong Chương 3 đủ để thiết kế bộ điều
khiển ổn định tĩnh cho bài toán đã nêu. Tuy nhiên do bộ điều khiển là tĩnh nên
luật điều khiển phản hồi chỉ đảm bảo sai số bị chặn theo yêu cầu thiết kế và do
vậy trong nhiều trường hợp, khi phải thiết kế bộ điều khiển bền vững hơn như
yêu cầu sai số giảm dần về 0 trong chế độ xác lập, ta cần thiết phải áp dụng luật
điều khiển động (thích nghi). Vấn đề mở rộng phương pháp theo hướng áp dụng
luật điều khiển thích nghi cho yêu cầu thiết kế này là mục tiêu giải quyết trong
chương tiếp theo của luận án.
- 96 -
CHƢƠNG 4
ĐIỀU KHIỂN THÍCH NGHI TRỰC TIẾP DÙNG HỆ MỜ
NƠRON TRONG PHƯƠNG PHÁP THAY THẾ ƯỚC LƯỢNG
HÀM TRẠNG THÁI
4.1. Giới thiệu chung
4.1.1. Sự cần thiết phát triển bộ điều khiển thích nghi
Phần trước của luận án đã trình bày các kết quả nghiên cứu về điều khiển ổn
định (tĩnh) các hệ thống khả tuyến tính hóa phản hồi trạng thái (khi hệ có bậc
tương đối đầy đủ) và khả tuyến tính hóa phản hồi vào-ra (khi hệ có bậc tương
đối thiếu) bằng phương pháp thay thế ước lượng các hàm trạng thái trong các
trường hợp để nghiệm của hệ sai số bị chặn theo yêu cầu. Phương pháp được
xây dựng dựa trên đặc tính bền vững của hệ sai số bằng cách đưa thêm thành
phần bù liên tục vào luật điều khiển phản hồi nhằm loại trừ các thành phần
không rõ xuất hiện trên đầu vào của hệ và để hệ sai số vòng kín bị chặn tới hạn
đều. Ngoài ra lưu ý là luật điều khiển phản hồi trong các trường hợp phân tích ở
trên (Định lý 1 trang 29 và Định lý 3 trang 71) là tĩnh (không thích nghi) và bao
gồm thành phần tuyến tính hóa và thành phần ổn định.
Tuy nhiên trong nhiều ứng dụng thực tế, xu hướng thiết kế thay thế luật điều
khiển tĩnh bằng luật điều khiển thích nghi ngày càng tăng cho dù việc thay thế
có phức tạp hơn. Lý do là mặc dù luật điều khiển tĩnh có thể nâng cao tính bền
vững của hệ vòng kín nhưng do dùng hệ số khuếch đại phản hồi lớn nên có thể
dẫn đến tới hạn của cơ cấu chấp hành hoặc kích thích động học chưa biết khác
gây ra mất ổn định của hệ. Mặt khác các kết quả trong phần trên còn cho thấy
việc sử dụng luật điều khiển tĩnh không đảm bảo rằng hệ sai số 0E .
Nhằm tiếp tục mở rộng phạm vi áp dụng của phương pháp, trong chương
này luận án đi vào xây dựng mô hình toán học của luật điều khiển phản hồi
động (thích nghi) dựa trên luật điều khiển phản hồi tĩnh (3-13) sử dụng bộ xấp
- 97 -
xỉ mờ nơron trong phương pháp thay thế ước lượng hàm trạng thái (Định lý 3
trang 71). Hướng điều khiển thích nghi cho phép phát triển bộ điều khiển bền
vững hơn so với bộ điều khiển không thích nghi trình bày trong chương trước.
Như chúng ta đã biết, mục tiêu của điều khiển thích nghi là điều khiển ổn
định các hệ thống có các đặc tính không rõ. Mặc dù có nhiều định nghĩa khác
nhau, tuy nhiên trong luận án này hệ điều khiển thích nghi được hiểu theo định
nghĩa sau ([68]): “Hệ điều khiển thích nghi là hệ điều khiển có các tham số có
thể chỉnh định được cũng như có một cơ chế để chỉnh định các tham số này”.
Như vậy theo cách định nghĩa trên có thể hiểu hệ điều khiển thích nghi gồm hai
vòng phản hồi, một vòng phản hồi thông thường và một vòng dùng để chỉnh
định tham số, trong đó vòng chỉnh định tham số có thể đáp ứng chậm hơn so với
vòng phản hồi thông thường.
Thực tế luật điều khiển thích nghi được xây dựng theo một trong hai phương
pháp: trực tiếp hoặc gián tiếp. Đối với phương pháp điều khiển thích nghi trực
tiếp, các tham số trong luật điều khiển được thay đổi trực tiếp trong quá trình
điều khiển để tạo thành hệ vòng kín ổn định còn trong phương pháp điều khiển
thích nghi gián tiếp, thành phần luật điều khiển ổn định được ước lượng trước
(tùy theo dạng của các thành phần không rõ trong hệ) và sau đó mới kết hợp lại
để tạo thành luật điều khiển chung.
Nhằm phát triển phương pháp thay thế ước lượng hàm trạng thái cho phép
tổng hợp bộ điều khiển thích nghi trực tiếp dựa trên bộ điều khiển tĩnh đã xây
dựng trong các chương trước, chương này của luận án sẽ đi vào phân tích các
vấn đề để xác định luật điều khiển thích nghi và chỉnh định tham số phù hợp
cho giải quyết bài toán bám đã nêu ở trên. Phần lớn dựa trên lý thuyết điều
khiển thích nghi trực tiếp phân tích dùng hệ sai số được trình bày trong tài liệu
[57], các kết quả trong chương này là tổng hợp các cơ sở toán học để có thể xây
dựng bộ điều khiển thích nghi trực tiếp phù hợp trong phương pháp thay thế ước
lượng hàm trạng thái sử dụng bộ xấp xỉ mờ nơron.
- 98 -
4.1.2. Vấn đề và cơ sở toán học xây dựng bộ điều khiển thích nghi trực tiếp
Đối với điều khiển thích nghi trực tiếp, phương pháp thiết kế xuất phát từ cơ
sở toán học chung ([57]) dùng để giải quyết lớp bài toán quy được về dạng ổn
định hệ sai số ( , )E t x có phương trình động học:
( , ) α( , ) β( )E t t u x x x (4-1)
với x là véctơ trạng thái của hệ và với giả thiết rằng tồn tại luật điều khiển tĩnh
( )su u z có z đo được để với hàm Lyapunov ( , )sV t E giảm dần, không bị
chặn theo tia (radially unbounded) luôn có 1 2s sV m V m , 1 0m , 2 0m
theo quỹ đạo (4-1). Lưu ý là dạng tổng quát của hệ sai số (4-1) bao trùm toàn bộ
các hệ sai số được lập trong bài toán bám của hệ khả tuyến tính hóa phản hồi
trạng thái và khả tuyến tính hóa phản hồi vào-ra đã phân tích trong phần trước
do trong mỗi trường hợp véctơ trạng thái x trong phương trình (4-1) được xem
tương ứng là x và ,T
T T x q .
Với giả thiết trên, vấn đề đặt ra trong phương pháp của luận án là cần tìm
luật điều khiển phản hồi động (hay luật điều khiển thích nghi)
ˆ, ( )a s du u u t z θ với su là luật điều khiển phản hồi tĩnh, ˆ, ( )du tz θ là
thành phần bù động và ˆ( )tθ là tham số chỉnh định được của hệ thích nghi cũng
như xác định được cơ chế chỉnh định tham số ˆ ˆ( , , , )t uθ x θ để với thành phần
bù động du , luật điều khiển thích nghi au sẽ đảm bảo hệ sai số vòng kín ổn
định. Từ đó có thể xác định được bộ điều khiển thích nghi để E và , x θ bị
chặn. Lưu ý ký hiệu luật điều khiển phản hồi tĩnh su trong mỗi trường hợp của
phương pháp (theo Định lý 1 trang 29 và Định lý 3 trang 71) tương ứng sẽ là
su u như (2-28) hoặc s cu u u như (3-13).
Tuy nhiên do thành phần bù liên tục cu theo (3-12) chứa bộ xấp xỉ
( , , )F u x θ có tham số chỉnh định được nên có thể dùng làm thành phần bù
động du trong cả hai trường hợp nếu xác định được luật chỉnh định tham số phù
- 99 -
hợp. Khi đó luật điều khiển thích nghi của phương pháp thay thế ước lượng hàm
trạng thái sẽ là a du u u .
Trong lý thuyết điều khiển thích nghi trực tiếp, một trong những phương
pháp thiết kế là sử dụng bộ xấp xỉ tuyến tính đối với tham số và chỉnh định (
-modification) hoặc chỉnh định ( -modification) được trình bày trong [57],
[32]. Các kết quả này cũng cho thấy nếu tồn tại bộ điều khiển tĩnh ổn định thì
cũng tồn tại bộ điều khiển thích nghi ổn định nếu tồn tại miền tham số của bộ
xấp xỉ để xấp xỉ được au với độ chính xác cần thiết. Như vậy luôn tồn tại bộ
điều khiển thích nghi trực tiếp ổn định nếu tồn tại bộ điều khiển tĩnh ổn định và
lựa chọn được cấu trúc bộ xấp xỉ phù hợp.
Ngoài ra để đảm bảo rằng các quỹ đạo trạng thái nằm trong miền hợp lệ mà
ở đó phép xấp xỉ được thiết lập hay zz , ta có thể sử dụng Định lý 7.1 trong
[57] để phân tích. Định lý 7.1 ([57]) cho biết nếu : p qV là hàm khả
vi liên tục thỏa mãn:
1 1 2 2( ) ( ) ( , ) ( ) ( )V E θ θ θ E θ θE Δ E Δ E Δ (4-2)
với 1 1 2 2, , , K E θ E θ và giả thiết rằng với hệ sai số được lập, tồn tại luật
điều khiển u v được thiết lập sao cho khi b EE và/hoặc bθ θΔ đều có
0V thì B EE với t , trong đó ký hiệu
11 0: max ,p
rB V V E EE E , 0V là giá trị ban đầu hay 0 (0)V V và
2 2( ) ( )rV b b E E θ θ .
Định lý 7.1 ([57]) được chứng minh như sau:
Nếu rV V thì từ 2 2 2 2( ) ( ) ( ) ( )V b b E θ θ E E θ θE Δ suy ra
b EE và/hoặc bθ θΔ nên theo giả thiết dẫn đến 0V . Xét các trường hợp
đối với 0V : Nếu 0 rV V thì do V là hàm xác định dương và không thể tăng lớn
hơn rV nên 0 ( ) rV t V với t . Trường hợp 0 rV V thì 0V cho đến khi
- 100 -
rV V do vậy 00 ( ) max , rV t V V với t . Mặt khác từ (4-2) biết rằng
1 0( ) ( ) max , rV t V V E E nên suy ra 11 0max , rV V EE .
Như vậy Định lý 7.1 ([57]) được dùng để phân tích miền hợp lệ mà trong đó
quỹ đạo của E và x được phép di chuyển khi sử dụng bộ điều khiển thích nghi.
Áp dụng trong trường hợp hệ sai số, từ Giả thiết 1 do ( , )t xx E với
( , )tx E là hàm không giảm dần đối với E nên xx với t , trong đó:
11 0: sup , max ,n
rt
t V V
x x Ex x . (4-3)
▲
Ngoài ra trong phân tích luật điều khiển thích nghi, thông thường hàm
Lyapunov được chọn có dạng chính phương chứa ma trận đối xứng xác định
dương (Lưu ý là ma trận số thực đối xứng luôn có các giá trị riêng thực). Bổ đề
6 dưới đây (được tổng hợp từ các tài liệu [38], [70]) cho thấy các tính chất của
ma trận đối xứng xác định dương nên có thể sử dụng để lập và phân tích ma trận
đối xứng xác định dương dùng trong dạng chính phương của hàm Lyapunov và
trong luật chỉnh định tham số.
Bổ đề 6 :
1) Nếu A là ma trận đối xứng xác định dương thì A có thể phân tích duy nhất
thành T T A U DU C C với 1 2/C D U , U là ma trận tam giác trên và D
là ma trận chéo có các phần tử trên đường chéo dương.
2) Nếu A là ma trận đối xứng xác định dương có các giá trị riêng phân biệt thì
A có thể phân tích thành T T A U DU C C với 1 2/C D U trong đó U là
ma trận unita và D là ma trận chéo chứa các giá trị riêng của A .
Chứng minh
Chứng minh Bổ đề 6 có thể tham khảo ở mục 5.6 trang 152 phần Phụ lục.
▲
- 101 -
4.2. Điều khiển mờ nơron thích nghi trực tiếp các hệ thống khả tuyến
tính hóa phản hồi
4.2.1. Hệ khả tuyến tính hóa phản hồi trạng thái
Đối với trường hợp hệ khả tuyến tính phản hồi trạng thái như đã trình bày ở
trên, vấn đề đặt ra là với luật điều khiển thích nghi a du u u trong đó u định
nghĩa như (2-28) và:
ˆ( , , ) ˆbsig , ( , , )d
F uu EF u
g
x θ
x θ
(4-4)
là thành phần bù động, θ̂ là véctơ tham số điều chỉnh hay:
1 ( ) 1 ˆ ˆ( ) ( ) ( , , ) bsig , ( , , )n Tau g r f F u EF u
x η e x x θ x θ (4-5)
ta cần tìm luật chỉnh định tham số ˆ ˆ( , , , )t uθ x θ để hệ sai số vòng kín ổn định.
Sau đây ký hiệu:
( , , )F F u x θ , ( , , )F F u x θ , ˆˆ ( , , )F F u x θ (4-6)
và giả thiết tồn tại miền véctơ tham số θ thỏa mãn F xấp xỉ ( , )dxn u x với
sai số bị chặn bởi (3-14) với xx , uu và θθ trong đó θθ là
véctơ tham số tốt nhất tìm được của bộ xấp xỉ mờ nơron được dùng trong luật
điều khiển tĩnh (3-13). Ngoài ra cũng giả thiết rằng với các điều kiện ràng buộc
đối với trạng thái và đầu vào của hệ, ta có thể xác định được E sao cho khi
EE thì luôn có xx và uu (phương pháp xác định như đã trình bày
trong Chương 3).
Khi đó nếu F là bộ xấp xỉ tuyến tính đối với tham số thì áp dụng phương
pháp chỉnh định và sử dụng luật chỉnh định tham số như trong [57] dẫn đến
phát biểu của Định lý 4 dưới đây về luật điều khiển thích nghi trong phương
pháp thay thế ước lượng hàm trạng thái để hệ sai số vòng kín ổn định.
- 102 -
Định lý 4 : (Điều khiển thích nghi với bộ xấp xỉ tuyến tính) Luật điều khiển
thích nghi và chỉnh định tham số sau:
1 ( ) 1 ˆ ˆbsig( , )
ˆˆ ˆ
n Ta
T
u u g r f F EF
FE
η e
θ A θ θθ
với 0 1 , 0 , A là ma trận đối xứng xác định dương,
F là bộ xấp xỉ tuyến tính đối với tham số,
(4-7)
bảo đảm nghiệm của phương trình động học hệ sai số (2-20) bị chặn bởi
EE B với EB định nghĩa như (4-10).
Chứng minh
Thay luật điều khiển (4-7) vào phương trình động học (2-20) dẫn đến:
( ) ( , )d dxnE E g u u x x
Chọn hàm Lyapunov:
112
Ta sV V θ θΔ A Δ (4-8)
với ˆ θΔ θ θ , 212sV E , A là ma trận đối xứng xác định dương thì:
1
2 1
2
1
2
1
ˆ ˆ
ˆˆ ˆbsig ,
ˆ
1 ˆ ˆ ˆsign( ) bsig( , )
ˆ
Ta s
Td dxn
dxn
T
T
V V
E Egu E F F F F
EFE EF E F EF
E F F
E E W EF EF EF
E F F
θ θ
θ θ
θ θ
θ θ
Δ A Δ
Δ A Δ
Δ A Δ
Δ A Δ
- 103 -
Do giả thiết F là bộ xấp xỉ tuyến tính đối với tham số nên theo (3-5) có thể
viết ˆ ( , )TF F u θΔ φ x với ˆ
( , )T Fu
φ xθ
, ngoài ra do ˆθΔ θ nên đạo hàm
của hàm Lyapunov theo quỹ đạo động học của hệ sai số biến đổi được tiếp như
sau:
2
1
222
2
_ max
1 ˆμ ( , )
ˆ ˆˆ
1 1 1 ˆμ ( , )2 2 2
ˆ ˆˆ
1 ˆμ ( , )2
a E
T TT
E
T TT T
Ts E
V E E W EF
F FE E
WE W E EF
F FE E
WV
θ θ
θ θ θ
θ
Δ Δ A A θ θθ θ
Δ Δ Δ θ θθ θ
Δ θ θ
Mặt khác ta có:
22
22
22
ˆ
12
2 2 2
2 2
T T
T
θ θ θ
θθ θ
θ
Δ θ θ Δ Δ θ θ
θ θΔΔ Δ θ θ θ θ
θ θΔ
nên suy ra:
222
_ max
2
1μ ( , )
2 2 2
2
a s E
s
WV V
V m
θ
θ
θ θΔ
Δ
(4-9)
- 104 -
với
22
_ maxμ ( , )0
2 2
EWm
θ θ.
Chọn 211 min( ) θ θ θΔ A Δ , 21
2 max( ) θ θ θΔ A Δ và
1 2( ) ( ) ( )E E sE E V E là các hàm thuộc lớp K thì:
1 1 2 2( ) ( ) , ( ) ( )E a EE V E E θ θ θ θ θΔ Δ Δ
Khi đó 0aV khi 2
02
Em và/hoặc
2
02
m θΔ hay khi
11
2E E
mE b
và/hoặc
2mb
θ θΔ nên áp dụng Định lý 7.1 ([57])
suy ra EE B với t , trong đó:
11
2 2
1 12 1 max
: max (0),
( ) ( )
2
E E a r
r E E
E E
B E E V V
V b b
m m
θ θ
A
(4-10)
với (0)aV là giá trị ban đầu nên Định lý 4 được chứng minh.
▲
Kết quả của Định lý 4 cho thấy rV có thể thiết lập nhỏ tùy ý bằng cách chọn
, và A thích hợp nên nếu chọn (0)aV đủ nhỏ thì có thể đảm bảo chọn được
E EB theo yêu cầu. Như vậy khi EE B thì cũng luôn có xx và
uu . Lưu ý ˆ θ θ là thành phần nâng cao tính bền vững của hệ vòng kín
trong luật chỉnh định tham số (4-7).
Ngoài ra một vấn đề trong áp dụng phương pháp chỉnh định là khi E
nhỏ thì thành phần ˆ θ θ có tác động quyết định đến luật chỉnh định tham số
θ̂
trong (4-7) và do đó θ̂ có xu hướng tiến đến θ . Như vậy nếu θ không phải là
- 105 -
véctơ tham số tối ưu tìm được thì E có thể tăng trở lại. Vấn đề này có thể giải
quyết bằng phương pháp chỉnh định trình bày trong [32], [57]. Áp dụng
phương pháp trong trường hợp này, luật điều chỉnh tham số (4-7) có thể viết:
ˆ ˆ( )
TF
E E
θ A θ θθ
(4-11)
với ( ) 0E là thành phần nâng cao tính bền vững cho hệ vòng kín. Ví dụ nếu
chọn ( )E E với 0 thì khi E nhỏ có thể giảm được ảnh hưởng của
thành phần bền vững trong luật chỉnh định tham số nêu trên.
▲
Trường hợp bộ xấp xỉ F không tuyến tính đối với tham số, ta có thể áp
dụng phương pháp trình bày trong [57] bổ sung thành phần ổn định vào luật
điều khiển thích nghi trong phương pháp thay thế ước lượng hàm trạng thái để
bù sai lệch do đặc tính phi tuyến của bộ xấp xỉ gây nên như phát biểu của Bổ đề
7 dưới đây.
Bổ đề 7 : (Điều khiển thích nghi với bộ xấp xỉ phi tuyến) Luật điều khiển thích
nghi và chỉnh định tham số sau:
41 ( ) 1 ˆˆ ˆbsig( , )
ˆˆ ˆ
n Ta
T
u u g r f F EF E
FE
η e θ θ
θ A θ θθ
với 0 1 , 0 , 0 , A là ma trận đối xứng xác định dương,
F là bộ xấp xỉ phi tuyến đối với tham số,
(4-12)
bảo đảm nghiệm của phương trình động học hệ sai số (2-20) bị chặn bởi
EE B với EB định nghĩa như (4-15).
- 106 -
Chứng minh
Thay luật điều khiển (4-12) vào phương trình động học (2-20) dẫn đến
phương trình động học của hệ sai số vòng kín:
4
ˆ( ) ( , )d dxnE E g u E u x θ θ x . (4-13)
Tiếp tục chọn hàm Lyapunov như (4-8) thì đạo hàm theo quỹ đạo động học
hệ sai số (4-13) sẽ là:
1
42 2 1ˆ
Ta s
Td dxn
V V
E Egu E E
θ θ
θ θ
Δ A Δ
θ θ Δ A Δ
Do giả thiết bộ xấp xỉ là phi tuyến đối với tham số nên theo (3-7) có thể viết
ˆˆ F
F F
θΔθ
với 2
L θΔ , 0L là hằng số Lipschitz. Biết rằng
2 2 22 2x y x y nên:
2 2 22 ˆ ˆ2 2L L L L θΔ θ θ θ θ θ θ θ θ
2 2ˆ
ˆˆ 2F
E F F E L E
θΔ θ θ θ θθ
.
Ngoài ra do:
2 2 24 2 22 ˆ ˆ ˆ2L L L
E L E E
θ θ θ θ θ θ
và 22
ˆ2 2
T θ
θ
θ θΔΔ θ θ
suy ra đạo hàm của hàm Lyapunov có thể
biến đổi như sau:
- 107 -
42 2 1
42 2
2 2
22
222
1 ˆˆ ˆμ ( , )
ˆ1 ˆˆμ ( , )
ˆˆ ˆ2
21 1
22 2 2
1 ˆμ ( , )
Ta E
E
TT T
E
V E E W EF E E F F
FE E W EF E E
FL E E
W L
E W L E
EF E
θ θ
θ
θ θ
θ θ Δ A Δ
θ θ Δθ
θ θ θ θ Δ Δ θ θθ
θ θ
θ θ
224 22 ˆ ˆ2
2 2L E
θ
θ θΔθ θ θ θ
hay:
22
_ max
2 22
2
21
μ ( , )2
2 2
2
a s E
s
W L
V V
L
V m
θ
θ
θ θ
θ θ Δ
Δ
(4-14)
với
22 2
2_ max
2 μ ( , )0
2 2
EW L
Lm
θ θ θ θ
.
Khi đó tương tự như trường hợp bộ xấp xỉ tuyến tính đối với tham số, áp
dụng Định lý 7.1 ([57]) trong trường hợp này suy ra EE B với t , trong đó:
11
1 12 2 2 1 max
: max (0),
2( ) ( )
E E a r
r E E E E
B E E V V
m mV b b
θ θ A
(4-15)
với (0)aV là giá trị ban đầu nên Bổ đề 7 được chứng minh.
▲
- 108 -
Lưu ý là kết quả (4-15) có dạng giống như kết quả (4-10) nhưng thành phần
m trong hai trường hợp khác nhau. Ngoài ra kết quả trên cũng cho thấy có thể
chọn các giá trị , , và A thích hợp để rV nhỏ tùy ý nên nếu (0)aV chọn
đủ nhỏ thì có thể tìm được E EB theo yêu cầu sao cho khi EE B thì luôn
có x , u nằm trong miền hợp lệ của xx và uu .
Một ghi chú khác, nếu chọn A là ma trận đối xứng xác định dương có các
giá trị riêng phân biệt thì theo Bổ đề 6, A còn có thể phân tích thành
T T A U DU C C với 1 2/C D U trong đó U là ma trận unita và D là ma trận
chéo chứa các giá trị riêng phân biệt của A . Tính chất này cho phép lập ma trận
A cũng như tính toán giá trị riêng lớn nhất của 1
A đơn giản theo công thức
1 1max min A D để xác định EB trong các kết quả (4-10) và (4-15).
4.2.2. Hệ khả tuyến tính hóa phản hồi vào-ra
Xét trường hợp hệ khả tuyến tính phản hồi vào-ra có dạng (2-3) thỏa mãn
Giả thiết 2 và giả thiết tín hiệu mẫu ( )r t và các đạo hàm của tín hiệu mẫu đến
bậc n bị chặn và đo được. Nếu tồn tại θ sao cho bộ xấp xỉ tuyến tính đối với
tham số ( , , , )F u x q θ xấp xỉ ( , , )dxn u x q với sai số bị chặn bởi (3-14) với
,( , ) x qx q , uu và θθ trong đó θθ là véctơ tham số tốt nhất tìm
được của bộ xấp xỉ mờ nơron được dùng trong luật điều khiển tĩnh (3-17), khi
đó tương tự như trường hợp hệ khả tuyến tính hóa phản hồi trạng thái và áp
dụng phương pháp chỉnh định với luật chỉnh định tham số đề xuất trong [57]
suy ra luật điều khiển và chỉnh định tham số thích nghi sau:
1 ( ) 1 ˆ ˆ( , ) ( , ) bsig( , )
ˆˆ ˆ
n Ta
T
u g r f F EF
FE
x q η e x q
θ A θ θθ
- 109 -
với ký hiệu ˆˆ ( , , , )F F u x q θ sẽ đảm bảo nghiệm của hệ sai số (2-78) bị chặn
hay E luôn nằm trong EB định nghĩa như (4-10).
Trường hợp sử dụng bộ xấp xỉ phi tuyến đối với tham số, áp dụng Bổ đề 7
dẫn đến luật điều khiển thích nghi và chỉnh định tham số:
41 ( ) 1 ˆˆ ˆ( , ) ( , ) bsig( , )
ˆˆ ˆ
n Ta
T
u u g r f F EF E
FE
x q η e x q θ θ
θ A θ θθ
với 0 sẽ đảm bảo nghiệm của hệ sai số (2-78) bị chặn nằm trong EB định
nghĩa như (4-15). Lưu ý là trong cả hai trường hợp, nếu (0)aV chọn đủ nhỏ thì
cũng có thể chọn các giá trị , , và A thích hợp để E EE B và do đó
đảm bảo được x , u luôn nằm trong miền hợp lệ của xx , uu .
- 110 -
4.3. Tổng hợp thiết kế bộ điều khiển thích nghi trực tiếp ổn định
Tóm lại, các bước tổng hợp bộ điều khiển thích nghi trực tiếp ổn định trong
phương pháp thay thế ước lượng hàm trạng thái như sau:
1. Áp dụng Định lý 3 và theo phương pháp chỉnh định , xác định bộ điều
khiển ổn định tĩnh đảm bảo rằng tồn tại θ để bộ xấp xỉ mờ nơron F
thay thế F trong luật điều khiển phản hồi (3-13) (trường hợp hệ khả
tuyến tính hóa trạng thái) hoặc (3-17) (trường hợp hệ khả tuyến tính hóa
vào-ra) thỏa mãn điều kiện của Định lý 3 với θθ . Chọn véctơ tham
số tốt nhất θ làm giá trị tham số khởi tạo ban đầu.
2. Xác định các điều kiện giới hạn về trạng thái và đầu vào của hệ, từ đó xác
định E sao cho khi EE thì quỹ đạo trạng thái và đầu vào luôn nằm
trong miền hợp lệ của xx và uu (phương pháp xác định như đã
trình bày trong Chương 3).
Xác định luật điều khiển thích nghi và chỉnh định tham số theo Định lý 4
(trường hợp sử dụng bộ xấp xỉ tuyến tính đối với tham số) hoặc theo Bổ đề 7
(trường hợp bộ xấp xỉ phi tuyến đối với tham số). Chọn các tham số tham số
điều khiển ban đầu phù hợp trong mỗi trường hợp để E EB và do đó cũng
đảm bảo rằng xx và uu .
Lưu ý là chỉ có thể thiết kế bộ điều khiển thích nghi trực tiếp ổn định nếu tồn
tại bộ điều khiển tĩnh ổn định thỏa mãn điều kiện của Định lý 3. Ngoài ra do đặc
điểm của phương pháp thay thế ước lượng hàm trạng thái là xấp xỉ sai lệch do
phép thay thế (và các thành phần bất định khác) gây nên bằng bộ xấp xỉ mờ
nơron duy nhất trong mỗi phương trình động học trạng thái của hệ phi tuyến nên
thích hợp sử dụng điều khiển thích nghi trực tiếp để phát triển bộ điều khiển
động. Việc phát triển bộ điều khiển thích nghi gián tiếp là không cần thiết và
làm luật điều khiển thích nghi phức tạp hơn do phải sử dụng cùng lúc nhiều bộ
xấp xỉ và kết hợp lại trong luật điều khiển chung (trong mỗi phương trình động
học trạng thái của hệ phi tuyến).
- 111 -
4.4. Mô hình điều khiển thích nghi trên hệ thống điều khiển công nghiệp
4.4.1. Giới thiệu chung
Như mục tiêu đặt ra ban đầu của luận án, nhằm đưa ra khả năng áp dụng của
phương pháp đề xuất trên hệ thống điều khiển công nghiệp điển hình, sau đây
trình bày một số bộ phần mềm phát triển mờ nơron và vấn đề trong xây dựng
mô hình phần mềm điều khiển thích nghi trên hệ thống điều khiển công nghiệp.
Có thể thấy, các hãng tự động hóa lớn trên thế giới hiện nay như Siemens
(Đức), Rockwell Automation (Hoa Kỳ), Schneider Electric (Pháp), Omron
(Nhật Bản), ... đều cung cấp các bộ phần mềm phát triển hệ mờ và mạng nơron
cho các sản phẩm của riêng mình. Điểm mạnh của các phần mềm này là các
môđun phần mềm thời gian thực (runtime) được tối ưu hóa cao, kiểm tra chặt
chẽ và dễ dàng kết nối, trao đổi dữ liệu trực tuyến với các môđun phần mềm
khác do hãng phát triển. Tuy nhiên do thiết kế đóng nên đa phần chỉ cho phép
thực hiện các cấu trúc điều khiển cơ bản với một số tùy chọn trên chủng loại
thiết bị cụ thể. Điển hình như NeuroSystems của Siemens ([89], [90]) chỉ hỗ trợ
các kiểu mạng “cứng” như MLP, RBF và NFN dưới dạng các khối hàm và khối
dữ liệu cho các bộ điều khiển họ SIMATIC S7-300, S7-400 hoặc thư viện phần
mềm thời gian thực cho WinCC của hãng. Ngoài ra các chức năng tính toán, mô
phỏng và đồ họa nhìn chung còn chưa được tốt.
Trong khi đó nhiều hãng chuyên về phần mềm lại cung cấp các sản phẩm
phần mềm hỗ trợ thiết kế linh hoạt hệ mờ và mạng nơron cho nhiều chủng loại
thiết bị điều khiển khả trình (PLC) và vi điều khiển khác nhau. Một số bộ phần
mềm điển hình như FuzzyTech của Inform GmbH (http://www.fuzzytech.com),
NeuroSolutions và NeuroSolutions for Matlab của NeuroDimension Inc. ([58],
http://www.neurosolutions.com), Matlab của MathWorks
(http://www.mathworks.com), VisSim của Visual Solutions
(http://www.vissim.com) là các công cụ phần mềm mạnh về thiết kế, tính toán,
giao diện đồ họa và mô phỏng. Tuy nhiên để thiết kế ứng dụng điều khiển công
nghiệp trên các bộ phần mềm nêu trên không đơn giản do thiếu công cụ trợ giúp
- 112 -
tính toán, kiểm tra hoạt động trực tuyến cũng như người dùng có thể gặp phải
một số vấn đề về khả năng hỗ trợ mã lệnh CPU và mức độ hoàn chỉnh của trình
biên dịch.
Một phương pháp nhằm áp dụng các mô hình hoặc thuật toán điều khiển
phức tạp trên các hệ thống điều khiển công nghiệp là sử dụng các bộ phần mềm
mạnh nêu trên để tính toán, mô phỏng hoạt động của thiết kế và từ đó chuyển
sang lập trình ứng dụng phù hợp trên thiết bị được chọn. Ví dụ như đối với
phương pháp đề xuất trong luận án, để thực hiện cấu trúc điều khiển mờ nơron
dựa trên điều khiển mờ Sugeno (mô hình ANFIS) hoặc kết hợp với cấu trúc
điều khiển thích nghi xây dựng trong luận án đòi hỏi phải xây dựng được các
môđun phần mềm thời gian thực riêng phù hợp với chủng loại PLC được sử
dụng. Ngoài ra do các hệ thống điều khiển công nghiệp tiên tiến hiện nay có cấu
trúc phân cấp nên cần thiết phải xây dựng một mô hình phần mềm ứng dụng cho
phép thực hiện cấu trúc điều khiển đề xuất trong luận án trên mô hình phân cấp
này cũng như trợ giúp quá trình lấy số liệu đo phục vụ thiết kế, tính toán tham
số điều khiển.
Phần tiếp theo trình bày cấu trúc phần mềm ứng dụng điều khiển mờ nơron
(luật điều khiển tĩnh và động) cho hệ thống tự động hóa SIMATIC S7 với các
môđun phần mềm hỗ trợ chạy trên nền SIMATIC WinCC của hãng Siemens.
Để tận dụng các ưu điểm của các bộ phần mềm tính toán, mô phỏng mạnh đã
nêu ở trên cũng như rút ngắn thời gian thiết kế hệ thống, việc chỉnh định ngoại
tuyến, xác định tham số điều khiển ban đầu luận án đề xuất sử dụng các công cụ
trợ giúp trong Matlab và NeuroSolutions. Các kết quả đã được nhóm tác giả
thực hiện trong một số đề tài cấp bộ do nghiên cứu sinh làm chủ nhiệm đề tài
([12], [14]).
- 113 -
4.4.2. Mô hình phần mềm ứng dụng và khả năng áp dụng trên hệ thống điều
khiển công nghiệp
Mô hình chung
Hình 11 trình bày mô hình điều khiển thích nghi xây dựng trên hệ thống điều
khiển công nghiệp điển hình của hãng Siemens với các thành phần gồm:
- IPC-Server: trong hệ thống phân cấp, IPC-Server được dùng là máy tính
công nghiệp có nhiệm vụ quản lý và xử lý các dữ liệu nhận về từ các hệ
thống điều khiển (PLC/IPC) cũng như cung cấp dữ liệu (theo yêu cầu, thông
qua các dịch vụ) cho các máy tính trạm (PC-Clients). Để thực hiện truyền
thông trong các phân cấp, IPC-Server được hỗ trợ các dạng truyền thông qua
fieldbus (như IE, Profibus hoặc MPI) để kết nối với PLC. Trong mô hình
thích nghi được xây dựng, IPC-Server còn có nhiệm vụ giám sát, thu thập dữ
liệu phục vụ quá trình chỉnh định tham số ngoại tuyến (off-line) để xác định
các tham số ban đầu của bộ xấp xỉ trước khi nạp xuống thiết bị điều khiển
thời gian thực PLC (hoặc Soft-PLC). Phần mềm SCADA sử dụng trên IPC-
Server là SIMATIC WinCC của hãng Siemens.
- PLC/Soft-PLC: PLC là thiết bị điều khiển khả trình thời gian thực các quá
trình công nghiệp thông qua các đầu vào/ra (I/O) trong khi Soft-PLC là một
dạng PLC “mềm” (phần mềm giả hoạt động PLC trên IPC) cho phép thực
hiện và xử lý các tác vụ như một PLC thực thụ. Trong cả hai trường hợp,
môđun phần mềm điều khiển thích nghi trên PLC/Soft-PLC nhận các tham
số ban đầu từ IPC-Server và thực hiện thuật toán điều khiển thích nghi với
chức năng chỉnh định trực tuyến được kích hoạt bởi IPC-Server trong quá
trình hoạt động. PLC trong mô hình thiết kế là dòng SIMATIC S7-300/400
còn Soft-PLC được dùng là bộ phần mềm WinAC RTX của hãng Siemens.
- I/O: là các môđun đầu vào/ra số/tương tự, trong đó Central I/O là các môđun
đầu vào/ra trung tâm có kết nối trực tiếp với bus nội bộ của PLC và DP-I/O
là các môđun vào /ra phân tán được kết nối với PLC/Soft-PLC thông qua bus
trường (như Profibus-DP/PA).
- 114 -
- Processes/Plants: các quá trình, thiết bị, máy móc cần giám sát, điều khiển
trong dây chuyền công nghệ.
Hình 11 : Điều khiển thích nghi trong hệ thống điều khiển công nghiệp
Truyền thông và trao đổi dữ liệu trong mô hình
Truyền thông trong mô hình có thể phân thành 2 nhóm sau:
- Truyền thông giữa IPC-Server với PLC/Soft-PLC: đây là đường truyền trong
phân cấp vùng (cell level) có chu kỳ vòng quét chậm, khoảng 100ms. Các
bus trường có thể sử dụng trong thiết kế là Industrial Ethernet (IE), Profibus
(PB) hoặc MPI (Multi-Point Inteface) của Siemens.
- Truyền thông giữa PLC/Soft-PLC với DP-I/O: sử dụng đường truyền trong
phân cấp trường (field level) có chu kỳ vòng quét nhanh dưới 10ms. Bus
trường thiết kế sử dụng trong phân cấp này là Profibus-DP/PA.
Fieldbus (IE/PB/MPI)
Mạng công nghiệp phân tán (Profibus-DP/PA)
IPC-Server
Phần mềm
SCADA và chỉnh
định tham số
ngoại tuyến (Offline)
PLC/Soft-PLC
Điều khiển
(mờ nơron) và
chỉnh định
tham số trực tuyến (Online)
DP I/O
DP I/O
DP I/O
Processes/Plants
Central I/O
Các module
vào/ra số/tương tự
- 115 -
Hoạt động của mô hình phần mềm điều khiển thích nghi
Hoạt động của phần mềm điều khiển thích nghi trên hệ thống điều khiển
công nghiệp được minh họa thông qua việc xác lập bộ xấp xỉ mờ nơron (NF)
trong luật điều khiển tĩnh hoặc thích nghi. Hình 12 mô tả các thành phần chính
và đường đi của dữ liệu trong quá trình thiết lập các tham số làm việc của hệ
thống, theo đó gồm các bước sau:
Hình 12 : Sơ đồ đường đi dữ liệu trong mô hình điều khiển thích nghi
- Xác định các trạng thái (đo được) của quá trình điều khiển (các đầu vào/ra).
Xác định cấu trúc NF sẽ sử dụng (trong thiết kế sử dụng cấu trúc ANFIS),
phương pháp tạo dữ liệu phục vụ luyện mạng cũng như thời gian lấy mẫu.
- Thực hiện quá trình thu lưu dữ liệu phục vụ quá trình học ngoại tuyến bằng
cách PLC/Soft-PLC tạo các tín hiệu đầu vào quá trình theo phương pháp đã
định và thu các đáp ứng (các đầu ra) của quá trình. Các dữ liệu này được lấy
mẫu theo chu kỳ đặt và chuyển vào vùng dữ liệu nhớ đệm tạm thời (buffer)
để truyền về cơ sở dữ liệu (CSDL) trên IPC-Server.
PLC/Soft-PLC
IPC-Server
Processes/Plants
Điều khiển thích nghi
Tham số, chế độ đ/k
Phần mềm SCADA
Chỉnh định ngoại tuyến
Chỉnh định trực tuyến
Điều khiển đối tƣợng
Tham số thiết kế, chế độ điều khiển
Cơ sở dữ liệu
(WinCC UserArchive)
Bộ đệm dữ
liệu tạm thời
- 116 -
- Thực hiện quá trình học ngoại tuyến bằng số liệu thu được trong quá trình
trước nhằm xác định được các tham số hoạt động của hệ thống cũng như có
thể mô phỏng hoạt động của quá trình. Các tham số sau khi luyện đáp ứng
các điều kiện thiết kế sẽ được nạp xuống PLC/Soft-PLC để khởi tạo hệ thống
NF.
- Trong quá trình hoạt động, hệ thống NF chuyển từ chế độ tĩnh (luật điều
khiển tĩnh) sang chế độ động (luật điều khiển thích nghi) cho phép tự động
chỉnh định trực tuyến các tham số.
Cấu trúc và hoạt động chung của các môđun phần mềm hệ thống NF
Với mô hình hệ thống NF thiết kế, phần mềm hệ thống NF có thể phân thành
các môđun chính sau (Hình 13):
- PC-NF Manager: Môđun phần mềm quản lý và điều khiển hoạt động của
các môđun phần mềm khác trên IPC-Server.
- PLC-NF Manager: Môđun phần mềm quản lý và điều khiển hoạt động của
các môđun phần mềm trên PLC/Soft-PLC.
- Process I/O Data Acquisition: Môđun phần mềm trên IPC-Server có nhiệm
vụ điều khiển quá trình trao đổi, cập nhật dữ liệu quá trình cần thiết từ
PLC/Soft-PLC và lưu trữ vào CSDL (Process Data) nhằm cung cấp cho quá
trình học ngoại tuyến (offline learning) để xác định các trọng số ban đầu của
hệ NF.
- Process I/O Data Transmission: Môđun phần mềm trên PLC/Soft-PLC có
nhiệm vụ cập nhật dữ liệu quá trình theo chu kỳ vào Temporary Buffer và
cung cấp cho IPC-Server lưu trữ. Hoạt động của môđun phần mềm này do
IPC-Server (Môđun Process I/O Data Acquisition) điều khiển.
- NF Offline Learning: Môđun luyện ngoại tuyến trên IPC-Server có cấu trúc
dựa trên hệ mờ và mạng nơron (trong thử nghiệm sử dụng cấu trúc ANFIS)
và tương đương với cấu trúc xây dựng trong NF Online (trên PLC) nhằm xác
định các tham số ban đầu của hệ thống NF (NF Data). Môđun được phát
- 117 -
triển trên môi trường Matlab và có thể tích hợp vào hệ thống NF chạy trên
nền WinCC.
- NF Online: Môđun NF điều chỉnh tham số trực tuyến có cấu trúc dựa trên hệ
mờ và mạng nơron (ANFIS) với các tham số ban đầu do IPC-Server thiết
lập.
Hình 13 : Các môđun phần mềm chính trong mô hình hệ thống NF
- NF Data Transmit: Môđun điều khiển quá trình cập nhật số liệu thiết lập hệ
thống NF (bên PLC/Soft-PLC).
PLC
IPC-Server
Process I/O Data
Acquisition Module
Proc. Data
PC-NF Manager
Common DB (UA)
NF Offline Learning Module
NF Data
Process I/O Data
Transmission Module
Temp. Buffer
PLC-NF Manager
System DB (DB1)
NF Controller
NF Online
Process Model
NF Data
NF Data Update
NF Data Transmit
Chiều trao đổi dữ liệu giữa các môđun chƣơng trình qua mạng PB và nội bộ
Chiều truy cập CSDL của các môđun phần mềm
Ký hiệu:
DP-I/O PI
- 118 -
- NF Data Update: Môđun thực hiện quá trình cập nhật, trao đổi và nhận các
tham số điều khiển từ IPC-Server.
- Process Model: Môđun phần mềm mô phỏng quá trình cần điều khiển phục
vụ thử nghiệm hoạt động của hệ thống NF.
Các môđun phần mềm xây dựng trên IPC-Server được thiết kế lập trình bằng
ngôn ngữ C-Script trong SIMATIC WinCC V5. Các môđun phần mềm trên
PLC/Soft-PLC được xây dựng trên ngôn ngữ SCL (Structured Control
Language) trong bộ phần mềm SIMATIC STEP7 Professional V5.2.
Có thể tham khảo một số cấu trúc môđun phần mềm như môđun cung cấp dữ
liệu quá trình (Process I/O Data Transmission) và môđun ANFIS trên
PLC/Soft-PLC trong mục 5.7 trang 155 phần Phụ lục.
Khả năng áp dụng trên các hệ thống điều khiển công nghiệp
Nhằm đánh giá khả năng và đưa ra các đề xuất khi áp dụng mô hình điều
khiển thích nghi của luận án trên các hệ thống điều khiển công nghiệp, luận án
sau đây trình bày kết quả chạy thử môđun ANFIS xây dựng trong luận án và so
sánh với các môđun phần mềm runtime FUZZY_20K và NEURO_20K của
hãng Siemens. Môđun phần mềm FUZZY_20K và NEURO_20K tương ứng
nằm trong các bộ phần mềm FuzzyControl++ ([88]) và NeuroSystems ([89]) do
hãng Siemens cung cấp cho phép thực hiện các tính toán thông minh trên cơ sở
hệ mờ và mạng nơron trên chủng loại PLC SIMATIC S7 của hãng.
Việc lựa chọn môđun ANFIS để phân tích và so sánh với các môđun runtime
của hãng Siemens là do các nguyên nhân sau:
- Môđun ANFIS là môđun quan trọng thực hiện vai trò bộ xấp xỉ vạn năng F
hoặc F̂ trong các luật điều khiển tĩnh (3-13) và luật điều khiển động (4-7)
của luận án.
- Môđun ANFIS là môđun tính toán phức tạp hơn cả trong luật điều khiển, đòi
hỏi thời gian xử lý và bộ nhớ lớn. Thông số hoạt động của môđun ANFIS
quyết định tính thời gian thực của hệ điều khiển.
- 119 -
- Các môđun phần mềm runtime FUZZY_20K và NEURO_20K của hãng
Siemens có thể thay thế được môđun ANFIS nếu được sử dụng như một bộ
xấp xỉ vạn năng thỏa mãn điều kiện sai số xấp xỉ bị chặn trong luận án (Định
lý 3 trang 71).
Bảng dưới đây tổng hợp các thông số hoạt động chính của các môđun phần
mềm runtime và có thể sử dụng để tính toán thời gian thực của ứng dụng điều
khiển NF trên PLC SIMATIC S7-400:
Môđun mờ
nơron runtime
Thông số cấu hình
IN: đầu vào, OUT: đầu ra,
MF: hàm liên thuộc, R: số
luật
Bộ nhớ cần thiết Thời gian thực
hiện (ms) trên
SIMATIC S7-
400
Chƣơng
trình
Dữ
liệu
FUZZY_20K
(Siemens Fuzzy
Control++ V5.0)
Hệ mờ: max. 8 IN (7MF), 4
OUT (9MF), 2000 R.
1.206
bytes
20.516
bytes
22ms - 154ms
tùy thuộc vào
số lượng I/O và
số luật.
NEURO_20K
(Siemens
NeuroSystems)
Mạng NFN: max. 8 IN
(7MF), 4 OUT (9MF),
2000 R.
Mạng MLP: max. 100 IN,
10 OUT, 2 lớp ẩn (50
nơron/lớp ẩn).
Mạng RBF: max. 100 IN,
10 OUT, 50 nơron/lớp ẩn.
2.210
bytes
20.612
bytes
3,3ms - 260ms
tùy thuộc vào
số lượng I/O và
số luật.
FB_NeuroFuzzy
(Môđun ANFIS
thử nghiệm
trong luận án)
Mạng ANFIS: max. 8 IN, 1
OUT, 7MF, 1500R.
4.448
bytes
61.006
bytes
nhỏ hơn 10ms
tùy thuộc vào
số lượng I/O và
số luật.
Môđun ANFIS trong luận án hiện chỉ áp dụng cho hệ có nhiều nhất 8 đầu
vào, 1 đầu ra với 1500 luật do giới hạn 64kB một khối dữ liệu trong SIMATIC
S7. Tuy nhiên có thể mở rộng số lượng các đầu vào/ra, số hàm liên thuộc trên
mỗi đầu vào/ra và số luật bằng cách thiết kế trên nhiều khối dữ liệu. So sánh với
- 120 -
các môđun của hãng Siemens cho thấy việc sử dụng môđun ANFIS yêu cầu bộ
nhớ lớn hơn do cấu trúc mạng ANFIS đòi hỏi việc tính toán phức tạp hơn. Do
đó trong trường hợp có thể thay thế mạng ANFIS bằng cấu trúc hệ mờ hoặc các
mạng nơron khác đơn giản hơn ta có thể sử dụng các môđun của Siemens nêu
trên. Ưu điểm của mạng ANFIS là có thể giải quyết tốt các trường hợp tổng
quát, thiếu tri thức về động học phi tuyến của đối tượng điều khiển.
Các thông số hoạt động của các môđun trên cho thấy để áp dụng mô hình
điều khiển thích nghi trên hệ thống điều khiển công nghiệp cần phải giải quyết
các hạn chế sau:
- Yêu cầu bộ nhớ lớn (đặc biệt là bộ nhớ dữ liệu) so với bộ nhớ thông thường
của các PLC hiện nay. Các ứng dụng NF lớn đòi hỏi việc lập trình phức tạp
do phải giải quyết các hạn chế về bộ nhớ và tổ chức dữ liệu thành nhiều
khối.
- Thời gian thực hiện phụ thuộc vào tốc độ thực thi của mỗi loại PLC, để đảm
bảo tính thời gian thực trong mỗi ứng dụng cần tính toán được thời gian này
và giải quyết được trong trường hợp chu kỳ xử lý không đáp ứng.
Do vậy để áp dụng môđun NF trong ứng dụng điều khiển thích nghi cần thiết
phải sử dụng PLC đủ mạnh có tốc độ xử lý nhanh và bộ nhớ lớn (ví dụ như đối
với PLC của Siemens, ít nhất là SIMATIC S7-400 CPU 414 trở lên có bộ nhớ
RAM 1.4MB, thời gian xử lý lệnh là 45ns đối với các lệnh thông thường và
135ns đối với lệnh tính toán dấu phảy động). Tuy nhiên Soft-PLC (ví dụ như
WinAC RTX 2008 của hãng Siemens) là sự lựa chọn tốt hơn cả do không phải
giải quyết vấn đề về thiếu bộ nhớ (chỉ giới hạn bởi bộ nhớ của PC) trong khi
thời gian xử lý nhanh (thời gian xử lý lệnh trong WinAC RTX 2008 trên máy
tính có bộ xử lý Pentium IV, 2.4GHz là 3-4ns).
Tóm lại, kết quả thử nghiệm trên cũng cho thấy luật điều khiển tĩnh và động
đề xuất trong luận án hoàn toàn có khả năng áp dụng được trên các hệ thống
điều khiển công nghiệp với chu kỳ xử lý có thể tính toán và đáp ứng được yêu
cầu thời gian thực của mỗi ứng dụng.
- 121 -
4.5. Kết luận
Chương 4 tiếp tục pháp triển phương pháp thay thế ước lượng hàm trạng thái
theo hướng áp dụng luật điều khiển thích nghi dựa trên luật điều khiển tĩnh đã
được xây dựng trong các chương trước. Để giải quyết vấn đề trên, tác giả lựa
chọn xây dựng bộ điều khiển thích nghi trực tiếp và áp dụng phương pháp chỉnh
định với luật chỉnh định tham số trình bày trong [57] cho thành phần bù động
dùng bộ xấp xỉ mờ nơron đề xuất trong phương pháp. Dựa trên giả thiết tồn tại
luật điều khiển tĩnh chứa bộ xấp xỉ mờ nơron thỏa mãn điều kiện của Định lý 3
và trong miền véctơ tham số θ , luận án cho biết cũng tồn tại luật điều khiển
động trên cơ sở bộ xấp xỉ đã nêu và bằng luật chỉnh định tham số đề xuất sẽ
đảm bảo hệ sai số vòng kín ổn định.
Nhằm lựa chọn bộ xấp xỉ mờ nơron tuyến tính hay phi tuyến đối với tham số
trong luật điều khiển thích nghi, luận án cũng xem xét và chỉ ra phương pháp
giải quyết trong mỗi trường hợp. Các kết quả này được trình bày dưới dạng
Định lý 4 trang 102 và Bổ đề 7 trang 105 trong trường hợp hệ khả tuyến tính
hóa phản hồi trạng thái (đối với trường hợp hệ khả tuyến tính hóa phản hồi vào-
ra cũng cho kết quả tương tự). Theo đó ta có thể lựa chọn các tham số điều
khiển phù hợp để hệ sai số E luôn nằm trong EB nhỏ tùy ý và do vậy trong
trường hợp cần đảm bảo giới hạn của trạng thái và đầu vào, ta có thể chọn
E EB để quỹ đạo trạng thái và đầu vào của hệ luôn nằm trong miền hợp lệ
thỏa mãn yêu cầu thiết kế. Các kết quả về điều khiển thích nghi trực tiếp trong
phương pháp được tác giả tổng hợp thành các bước trình bày trong mục 4.3.
Ngoài ra do đặc điểm tích hợp cao của các hệ thống điều khiển thông dụng
trong công nghiệp, luận án cũng đề xuất mô hình phần mềm cho phép xây dựng
và áp dụng luật điều khiển tĩnh và động trên hệ thống tự động hóa SIMATIC
của hãng Siemens. Tóm lại các kết quả trong Chương 4 cho phép phân tích và
thiết kế bộ điều khiển thích nghi trực tiếp ổn định trong phương pháp cũng như
phân tích khả năng áp dụng trên các hệ thống điều khiển công nghiệp tiên tiến.
- 122 -
KẾT LUẬN VÀ KIẾN NGHỊ
Các kết quả của luận án có thể tổng hợp lại như sau:
1. Thiết lập cơ sở toán học của phương pháp thay thế ước lượng hàm trạng
thái dựa trên lập hệ sai số thỏa mãn Giả thiết 1:
a. Hệ sai số (2-20) có nghiệm bị chặn tới hạn đều theo (2-26) nếu xác định
được các hàm thay thế ước lượng thỏa mãn điều kiện (2-34) (Định lý 1).
b. Hàm μ ( , , )E E định nghĩa như (2-61) có giá trị lớn nhất xác định bởi
công thức (2-63) (Bổ đề 3) dùng để phân tích tính bền vững của hệ vòng
kín đối với thành phần không rõ bị chặn xuất hiện trên đầu vào của hệ.
c. Thành phần bù liên tục (2-60) và (2-87) dựa trên hàm xíchma lưỡng cực
trong luật điều khiển phản hồi cho phép giảm trừ tác động của các thành
phần không rõ trên đầu vào của hệ lên hệ sai số (Bổ đề 4 và Định lý 2).
2. Đưa ra luật điều khiển sử dụng bộ xấp xỉ mờ nơron trong trường hợp tổng
quát để giải quyết vấn đề điều khiển ổn định tĩnh trong phương pháp:
a. Luật điều khiển tĩnh (3-13) chứa thành phần bù liên tục (3-12) với sai số
bộ xấp xỉ mờ nơron thỏa mãn (3-14) bảo đảm nghiệm của hệ sai số vòng
kín (2-20) bị chặn tới hạn đều (Định lý 3).
b. Điều kiện để quỹ đạo trạng thái của hệ luôn nằm trong miền hợp lệ của
không gian trạng thái là tham số điều khiển (nếu tồn tại) thỏa mãn (3-19).
Điều kiện để tín hiệu điều khiển luôn nằm trong miền hợp lệ của tín hiệu
đầu vào là biểu thức (3-22) được thỏa mãn (Bổ đề 5).
c. Điều kiện để luật điều khiển tĩnh (3-39) chứa thành phần bù liên tục
(3-38) điều khiển ổn định các hệ chuyển động hỗn loạn (chaotic systems)
có phương trình động học ở dạng tuyến tính hóa phản hồi chặt (3-25) là
điều kiện xấp xỉ (3-42) được thỏa mãn.
3. Phát triển bộ điều khiển thích nghi trực tiếp dựa trên phương pháp chỉnh
định để chỉnh định tham số của bộ xấp xỉ mờ nơron (là thành phần bù
- 123 -
động trong phương pháp) trong hai trường hợp bộ xấp xỉ tuyến tính và phi
tuyến đối với tham số:
a. Luật điều khiển thích nghi và chỉnh định tham số (4-7) với bộ xấp xỉ
tuyến tính bảo đảm nghiệm của phương trình động học hệ sai số (2-20) bị
chặn bởi EE B với EB định nghĩa như (4-10) (Định lý 4).
b. Luật điều khiển thích nghi và chỉnh định tham số (4-12) với bộ xấp xỉ phi
tuyến bảo đảm nghiệm của phương trình động học hệ sai số (2-20) bị
chặn bởi EE B với EB định nghĩa như (4-15) (Bổ đề 7).
4. Phân tích khả năng áp dụng phương pháp trên các hệ thống điều khiển công
nghiệp với PLC đủ mạnh, đặc biệt là Soft-PLC.
Ngoài việc tổng hợp một số kết quả nghiên cứu trình bày dưới dạng các bổ
đề (Bổ đề 1, Bổ đề 2, Bổ đề 6), luận án đã xây dựng và chứng minh được 04
định lý (Định lý 1, Định lý 2, Định lý 3, Định lý 4), 04 bổ đề (Bổ đề 3, Bổ đề 4,
Bổ đề 5, Bổ đề 7) và một số công thức tính toán làm cơ sở khoa học cho việc
xây dựng thuật toán và mô hình điều khiển trong phương pháp. Các kết quả liên
quan đến luận án đã được tác giả và các cộng sự công bố trong 04 bài báo tại
các Hội nghị chuyên ngành trong đó có 01 bài báo quốc tế.
Một số vấn đề tồn tại và hướng nghiên cứu, hoàn thiện tiếp của luận án đặt ra
cả về mặt lý thuyết và thực tiễn ứng dụng trong công nghiệp như sau:
- Mở rộng phương pháp cho kiểu điều khiển phản hồi đầu ra (output-feedback
control) khi chỉ có đầu ra và một số trạng thái đo được, các trạng thái còn lại
không đo được.
- Phân tích hệ trong miền thời gian rời rạc cho phép áp dụng phương pháp trên
các hệ điều khiển thời gian thực có tốc độ xử lý tính toán và lấy mẫu chậm.
- Nghiên cứu các phương pháp chọn hàm thay thế để sai số xấp xỉ bị chặn (là
điều kiện cần để áp dụng được phương pháp).
- Mở rộng phương pháp cho các hệ MIMO và hệ phi tuyến biến đổi theo thời
gian (time-variant).
- 124 -
CÁC CÔNG TRÌNH CÔNG BỐ LIÊN QUAN CỦA TÁC GIẢ
[1] Nguyễn Duy Hưng (2002), “Một số phương pháp học trong mạng nơron và xây
dựng mô hình nghiên cứu ứng dụng cho các hệ thống điều khiển công nghiệp”,
Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ V về Tự động hóa,
Hà Nội, tr.163–168.
[2] Nguyễn Duy Hưng (2005), “Phương pháp xây dựng hệ phần mềm điều khiển
Neurofuzzy cho hệ thống SIMATIC S7”, Tuyển tập các báo cáo khoa học Hội
nghị toàn quốc lần thứ VI về Tự động hóa, Hà Nội, tr.282–286.
[3] Nguyễn Duy Hưng, Nguyễn Thị Hương Lan, Nguyễn Tuấn Nam, Trịnh Hải
Thái (2005), “Cơ chế điều phối hoạt động trao đổi dữ liệu giữa các cấp trong
mạng phân tán Profibus-DP”, Thông báo khoa học Hội nghị toàn quốc lần thứ
VI về Tự động hóa, Hà Nội, tr.129–134.
[4] Nguyen Duy Hung and Nguyen Thi Huong Lan (2007), “An Estimated
Replacement Approach for Stable Control of a Class of Nonlinear Systems
with Unknown Functions of States”, Lecture Notes in Engineering and
Computer Science, World Congress on Engineering and Computer Science
WCECS 2007, San Francisco, USA, pp.822–827.
- 125 -
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Nguyễn Thúy Anh, Hoàng Minh, Nguyễn Ngọc San (2008), Ước lượng tham
số mô hình hệ động học, Nhà xuất bản Khoa học và Kỹ thuật, Hà Nội.
[2] Võ Lâm Chương, Lê Hoài Quốc (2005), “Xây dựng bộ điều khiển dựa trên luật
ứng xử cho robot tự hành”, Tuyển tập các báo cáo khoa học Hội nghị toàn
quốc lần thứ VI về Tự động hóa, tr.76-81.
[3] Phạm Hữu Đức Dục, Nguyễn Công Hiền (2005), “Ứng dụng của bộ điều khiển
nơron mờ trong điều khiển thích nghi vị trí động cơ một chiều”, Tuyển tập các
báo cáo khoa học Hội nghị toàn quốc lần thứ VI về Tự động hóa, tr.101–106.
[4] Phạm Hữu Đức Dục, Nguyễn Công Hiền (2005), “Nghiên cứu ứng dụng mạng
nơron mờ điều khiển thích nghi rôbốt hai khâu”, Tuyển tập các báo cáo khoa
học Hội nghị toàn quốc lần thứ VI về Tự động hóa, tr.107–112.
[5] Lê Bá Dũng (1998), “Một thuật toán chỉnh định bộ điều khiển mờ sử dụng
mạng neuron”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ III
về Tự động hóa, tr.85–91.
[6] Lê Bá Dũng (2005), “Mạng nơron thích nghi mờ cho nhận dạng hệ điều khiển”,
Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ VI về Tự động
hóa, tr.119–124.
[7] Nguyễn Thị Phương Hà, Trần Đăng Long (2005), “Điều khiển mờ thích nghi
trực tiếp động cơ điện một chiều”, Tuyển tập các báo cáo khoa học Hội nghị
toàn quốc lần thứ VI về Tự động hóa, tr.150–155.
[8] Đặng Xuân Hoài (1998), “Điều khiển thích nghi tập mờ đối với hệ phi tuyến
trên cơ sở xấp xỉ tuyến tính hóa vào-ra”, Tuyển tập các báo cáo khoa học Hội
nghị toàn quốc lần thứ III về Tự động hóa, tr.175–184.
[9] Nguyễn Quang Hoan (1996), “Một số thuật học của mạng nơron”, Tuyển tập
các báo cáo khoa học Hội nghị toàn quốc lần thứ II về Tự động hóa, tr.220–
229.
[10] Huỳnh Thái Hoàng, Nguyễn Thị Phương Hà, Nguyễn Thúc Loan (2002),
“Nhận dạng hệ hệ phi tuyến dùng logic mờ”, Tuyển tập các báo cáo khoa học
Hội nghị toàn quốc lần thứ V về Tự động hóa, tr.137–143.
[11] Huỳnh Thái Hoàng, Nguyễn Thúc Loan, Nguyễn Phương Hà (2005), “Điều
khiển mờ thích nghi trực tiếp hệ phi tuyến MIMO có đặc tính động học không”,
Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ VI về Tự động
hóa, tr.239–244.
- 126 -
[12] Nguyễn Duy Hưng (chủ nhiệm đề tài) và các cộng sự (2001), Nghiên cứu, thiết
kế hệ điều khiển mờ xây dựng trên cơ sở PLC ứng dụng trong công nghiệp,
Báo cáo kỹ thuật Đề tài cấp bộ (Bộ công nghiệp), Hà Nội.
[13] Nguyễn Duy Hưng, Phạm Hùng Cường, Nguyễn Nam Hải (2002), “Hệ thống
điều khiển thời gian thực trên nền máy tính PC và triển vọng ứng dụng”, Tuyển
tập các báo cáo khoa học Hội nghị toàn quốc lần thứ V về Tự động hóa,
tr.157–162.
[14] Nguyễn Duy Hưng (chủ nhiệm đề tài) và các cộng sự (2004), Nghiên cứu, xây
dựng hệ điều khiển Neurofuzzy trên cơ sở PLC cho các ứng dụng công nghiệp,
Báo cáo tổng kết khoa học và kỹ thuật Đề tài cấp bộ (Bộ công nghiệp), Hà Nội.
[15] Chu Văn Hỷ (1998), “Điều khiển thích nghi phi tuyến trên cơ sở mạng nơron
RBF”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ III về Tự
động hóa, tr.238–241.
[16] Cao Tiến Huỳnh (1998), “Về một phương pháp tổng hợp các hệ điều khiển có
chất lượng cao”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ
III về Tự động hóa, tr.226–232.
[17] Cao Tiến Huỳnh (2000), “Điều khiển trượt trên các mặt trượt mờ”, Tuyển tập
các báo cáo khoa học Hội nghị toàn quốc lần thứ IV về Tự động hóa, tr.237–
242.
[18] Cao Tiến Huỳnh (2005), “Tổng hợp hệ điều khiển trượt thích nghi cho các đối
tượng có trễ”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ VI
về Tự động hóa, tr.288–293.
[19] Lê Hùng Lân (1996), “Xác định mô hình bất định đối tượng nhận dạng trong
điều khiển robust”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ
II về Tự động hóa, tr.314–322.
[20] Phan Xuân Minh, Nguyễn Tiến Hiếu (2005), “Điều khiển thích nghi tay máy
trên cơ sở hệ mờ”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ
VI về Tự động hóa, tr.370–375.
[21] Phan Xuân Minh, Nguyễn Doãn Phước (1997), Lý thuyết điều khiển mờ, Nhà
xuất bản Khoa học và Kỹ thuật, Hà Nội.
[22] Lê Văn Ngự (1996), “Giới hạn chuyển động của người máy công nghiệp theo
quỹ đạo hình học cho trước”, Tuyển tập các báo cáo khoa học Hội nghị toàn
quốc lần thứ II về Tự động hóa, tr.386–390.
[23] Trần Quang Oánh, Nguyễn Văn Tiềm, Lê Hùng Lân (2002), “Điều khiển thích
nghi gián tiếp chuyển động trên cơ sở các bộ xấp xỉ mờ”, Tuyển tập các báo
cáo khoa học Hội nghị toàn quốc lần thứ V về Tự động hóa, tr.289–294.
[24] Phân viện Tự động hóa, Viện Công nghệ thông tin (1997), Các báo cáo về
nghiên cứu hệ điều khiển Fuzzy, Báo cáo Đề tài cấp nhà nước mã số KHCN 04-
09-04.
- 127 -
[25] Nguyễn Doãn Phước, Phan Xuân Minh (2000), Điều khiển tối ưu và bền vững,
Nhà xuất bản Khoa học và Kỹ thuật, Hà Nội.
[26] Nguyễn Doãn Phước (2005), “Một phương pháp thiết kế bộ điều khiển thích
nghi ổn định tiệm cận toàn cục cho bài toán điều khiển thích nghi kháng
nhiễu”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ VI về Tự
động hóa, tr.414–419.
[27] Nguyễn Doãn Phước (2005), “Thiết kế bộ điều khiển tuyến tính hóa chính xác
bằng phương pháp cuốn chiếu (backstepping)”, Tuyển tập các báo cáo khoa
học Hội nghị toàn quốc lần thứ VI về Tự động hóa, tr.420–425.
[28] Nguyễn Hoàng Phương, Bùi Công Cường, Nguyễn Doãn Phước, Phan Xuân
Minh, Chu Văn Hỷ (1998), Hệ mờ và ứng dụng, Nhà xuất bản khoa học và kỹ
thuật, Hà Nội.
[29] Thái Quang Vinh (2002), “Điều khiển bền vững theo chế độ trượt mờ cho các
hệ phức hợp nhiều thành phần”, Tuyển tập các báo cáo khoa học Hội nghị toàn
quốc lần thứ V về Tự động hóa, tr.456–461.
[30] Nguyễn Xuân Quỳnh, Lưu Hoàng Long (1996), “Hệ thống điều khiển số trong
tự động lái tàu thủy”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần
thứ II về Tự động hóa, tr.479–485.
[31] Thái Quang Vinh (2002), “Điều khiển bền vững theo chế độ trượt mờ cho các
hệ phức hợp nhiều thành phần”, Tuyển tập các báo cáo khoa học Hội nghị toàn
quốc lần thứ V về Tự động hóa, tr.456–461.
Tiếng Anh
[32] Alberto Isidori, Maria Domenica Di Benedetto (1996), “Feedback
Linearization of Nonlinear Systems”, The Control Handbook, Editor William
S. Levine, CRC Press and IEEE Press, pp.909–917.
[33] Alberto Isidori, Christopher I. Byrnes (1996), “Nonlinear Zero Dynamics”, The
Control Handbook, Editor William S. Levine, CRC Press and IEEE Press,
pp.917–923.
[34] Bart Kosko (1997), Fuzzy Engineering, Prentice Hall, USA.
[35] Bong-Jun Yang (2004), Adaptive Output Feedback Control of Flexible
Systems, Ph.D. Thesis, Georgia Institute of Technology.
[36] Bui Trong Tuyen, Pham Thuong Cat (2004), “An ANN-based method to
control Hand-eye Robot for tracking of moving objects”, The 8th
International
Conference on Mechatronics Technology, Hanoi, pp.195–199.
[37] C.Wang, S.S. Ge (2001), “Adaptive Backstepping Control of Uncertain Lorenz
System”, International Journal of Bifurcation and Chaos, Vol. 11, No. 4,
pp.1115–1119.
- 128 -
[38] Carl D. Meyer (2000), Matrix Analysis and Applied Linear Algebra, SIAM,
Philadelphia, USA.
[39] Chen Gang, Ye Dong, Che Rensheng (2007), "Developing Trend of Industrial
Fieldbus Control System”, The 8th
IEEE International Conference on
Electronic Measurement and Instruments, ICEMI '07, pp.1-765–1-768.
[40] Dong-Ling Tsay, Hung-Yuan Chung, and Ching-Jung Lee (1999), “The
Adaptive Control of Nonlinear Systems Using the Sugeno-Type of Fuzzy
Logic", IEEE Transactions on Fuzzy Systems, Vol. 7, No. 2, pp.225–229.
[41] F. Abdollahi and K. Khorasani (2006), “Stable Robust Adaptive Controller for
a Class of Nonlinear Systems”, The 2006 IEEE International Conference on
Control Applications, Germany, pp. 1825–1830.
[42] F.C. Chen, C.C. Liu (1994), “Adaptively controlling nonlinear continuous-time
systems using multilayer neural networks”, IEEE Transactions on Automatic
Control, Vol. 39, pp. 1306–1310.
[43] Feryâl Alayont (2005), Project on the Stone-Weierstrass Theorem, Integration
Workshop.
[44] F.L. Lewis, J. Camos, R. Selmic (2002), Neuro-Fuzzy Control of Industrial
Systems with Actuator Nonlinearities, Society for Industrial and Applied
Mathematics (SIAM), Philadelphia, USA.
[45] G. Conte, C.H. Moog, A.M. Perdon (1999), Nonlinear Control Systems: An
Algebraic Setting, Springer-Verlag, London, Great Britain.
[46] Gang Tao, Petar V. Kokotović (1996), Adaptive Control of Systems with
Actuator and Sensor Nonlinearities, John Wiley & Sons, Inc., New York,
USA.
[47] George J. Klir, Ute St. Clair, Bo Yuan (1997), Fuzzy Set Theory: Foundations
and Applications, Prentice Hall, New Jersey, USA.
[48] George J. Pappasy, John Lygeros and Datta N. Godbole (1995), Stabilization
and Tracking of Feedback Linearizable Systems under Input Constraints, The
34th
CDC Report, Intelligent Machines and Robotics Laboratory, University of
California at Berkeley.
[49] Graebe Stefan, Salgado Mario, Graham C. Goodwin, Mario Salgado, Stefan
Greabe (2000), Control System Design, Prentice Hall, New Jersey, USA.
[50] Hassan K. Khalil (2001), Nonlinear Systems, 3rd Edition, Prentice Hall, USA.
[51] Horacio J. Marquez (2003), Nonlinear Control Systems: Analysis and Design,
Wiley Interscience, USA.
[52] Hugang Han, Chun-Yi Su, and Yury Stepanenko (2001), “Adaptive Control of
a Class of Nonlinear Systems with Nonlinearly Parameterized Fuzzy
Approximators", IEEE Transactions on Fuzzy Systems, Vol. 9, No. 2, pp.315–
323.
- 129 -
[53] Indrani Kar and Laxmidhar Behera (2008), “Direct Adaptive Neural Control
Scheme for Discrete Time Affine Nonlinear Systems”, ISIC 2008 – IEEE
International Symposium on Intelligent Control, pp. 1097–1102.
[54] Jang-Hyun Park, Seong-Hwan Kim, Chae-Joo Moon (2006), “Adaptive Fuzzy
Controller for the Nonlinear System with Unknown Sign of the Input Gain",
International Journal of Control, Automation, and Systems, Vol. 4, No. 2, pp.
178–186.
[55] Jan Jantzen (2003), Neural and Neurofuzzy Control, Tech. report no 99-H 999,
Technical University of Denmark.
[56] Jeffrey T. Spooner, K.M. Passino (1996), “Stable adaptive control using fuzzy
systems and neural networks”, IEEE Transations on Fuzzy Systems, Vol. 4,
pp.339–359.
[57] Jeffrey T. Spooner, Mangredi Maggiore, Raúl Ordónez, Kelvin M. Passino
(2002), Stable Adaptive Control and Estimation for Nonlinear Systems: Neural
and Fuzzy Approximator Techniques, Wiley Interscience, USA.
[58] José C. Principe, Neil R. Euliano, W. Curt Lefebvre (2000), Neural and
Adaptive Systems: Fundamentals Through Simulations, John Wiley & Sons,
Inc., USA.
[59] Indrani Kar and Laxmidhar Behera (2006), “Neural Network Based Direct
Adaptive Control for a Class of Affine Nonlinear Systems”, The 2006 IEEE
International Symposium on Intelligent Control, Munich, Germany, pp.2030–
2035.
[60] Jun Nakanishi, Jay A. Farrell, and Stefan Schaal (2002), “A Locally Weighted
Learning Composite Adaptive Controller with Structure Adaptation”,
IEEE/RSJ International Conference on Intelligent Robots and Systems, pp.882–
889.
[61] Jun Nakanishi, Jay A. Farrell, and Stefan Schaal (2004), “Learning Composite
Adaptive Control for a Class of Nonlinear Systems”, The 2004 IEEE
International Conference on Robotics & Automation, New Orleans, LA,
pp.2647–2652.
[62] Jun Nakanishi, Jay A. Farrell, and Stefan Schaal (2005), “Composite adaptive
control with locally weighted statistical learning”, Elsevier Neural Networks,
vol. 18 (1), pp.71–90.
[63] Jun Nakanishi, Stefan Schaal (2004), “Feedback Error Learning and Nonlinear
Adaptive Control”, Elsevier Neural Networks, vol. 17 (10), pp.1453–1465.
[64] Jyh-Shing Roger Jang (1993), “Adaptive-Network-Based Fuzzy Inference
System”, IEEE Transactions on Systems, Man and Cybernetics, vol. 23(3),
pp.665–685.
- 130 -
[65] Jyh-Shing Roger Jang, Chuen-Tsai Sun (1995), “Neuro-Fuzzy Modeling and
Control”, The Proceedings of the IEEE, vol. 83(3), pp.378–406.
[66] Jyh-Shing Roger Jang, Chuen-Tsai Sun, Eiji Mizutani (1996), Neuro-Fuzzy and
Soft Computing: A Computational Approach to Learning and Machine
Intelligence, Prentice Hall, USA.
[67] Jyh-Shing Roger Jang, Mizutani E. (1996), “Levenberg-Marquardt method for
ANFIS learning”, Fuzzy Information Processing Society, NAFIPS 1996
Biennial Conference of the North American, pp.87-91.
[68] Karl J. Åström, Björn Wittenmark (1995), Adaptive Control, 2nd
Edition,
Addison-Wesley Publishing, USA.
[69] Karl J. Åström, Tore Hagglund (1995), PID Controllers: Theory, Design, and
Tuning, 2nd
Edition, Instrument Society of America, USA.
[70] Katsuhiko Ogata (1995), Modern Control Engineering, 2nd
Edition, Prentice
Hall, USA.
[71] Li Tieshan, Zou Zaojian, and Zhou Xiaoming (2008), “Adaptive NN Control
for a Class of Strict-feedback Nonlinear Systems”, American Control
Conference, Washington, USA, pp.81–86.
[72] Marios M. Polycarpou, Petros A. Ioannou (1991), Identification and Control of
Nonlinear Systems using Neural Network Models: Design and Stability
Analysis, Report 91-09-01.
[73] Marios M. Polycarpou, Petros A. Ioannou (1992), “Modeling, Identification
and Stable Adaptive Control of Continuous-time Nonlinear Dynamical System
using Neural Networks”, American Control Conference, Chicago, IL, pp. 36–
40.
[74] Matt Young (2006), The Stone-Weierstrass Theorem, MATH 328 Notes,
Queen's University at Kingston, Winter Term.
[75] Mehrdad Hojati and Saeed Gazor (2002), “Hybrid Adaptive Fuzzy
Identification and Control of Nonlinear Systems", IEEE Transactions on Fuzzy
Systems, Vol. 10, No. 2, pp.198–210.
[76] Michael A. Arbib (2003), The Handbook of Brain Theory and Neural
Networks, The MIT Press, USA.
[77] N.G.Nath and Nguyen N. San (1996), “On a New Approach to Parameter
Estimation of a Control System: Input-Error Approach”, The second Vietnam
Conference on Automation, pp.373–378.
[78] Nguyen Phung Quang (2004), “Nonlinear Control Structures: New Application
Perspective in Three-Phase AC Drives”, The 8th
International Conference on
Mechatronics Technology, Hanoi, pp.213–219.
- 131 -
[79] Nguyen Xuan Quynh, Do Khac Duc (1998), “A method to Design Robust
Adaptive Controller of Nonlinear First Order Systems”, The third Vietnam
Conference on Automation, pp.669–677.
[80] Nguyen Xuan Quynh, Do Khac Duc (1998), “Adaptive Control Law for a Class
of Uncertain Nonlinear Systems with Input Time Delay”, The third Vietnam
Conference on Automation, pp.73–84.
[81] Nguyen Xuan Quynh, Do Khac Duc (2000), “An Adaptive Controller for a
Class of Nonlinear Systems with Unknown Parameters Appearing
Nonlinearly”, The fourth Vietnam Conference on Automation, pp.384–389.
[82] Nguyen Xuan Quynh, Do Khac Duc (2000), “N-term Adaptive Control of a
Class of Uncertain Nonlinear Systems”, The fourth Vietnam Conference on
Automation, pp.390–395.
[83] Nguyen Xuan Quynh, Do Khac Duc, F.G. De Boer (2000), “Indirect Optimal
Adaptive Control of Nonlinear Systems”, The fourth Vietnam Conference on
Automation, pp.396–401.
[84] Richard Zurawski (2005), The Industrial Communication Technology
Handbook, CRC Press.
[85] R.M. Corless, G.H. Gonnet, D.E.G. Hare, D.J. Jeffrey (1996), “On the
Lambert's W Function”, Technical Report, Advances in Computational
Mathematics, Vol 5, pp.329–359.
[86] Robert Fullér (1995), Neural Fuzzy Systems, Ǻbo Akademi University.
[87] Saverio Mascolo, Giuseppe Grassi (1999), “Controlling Chaotic Dynamics
Using Backstepping Design With Application to the Lorenz System and Chua’s
Circuit”, International Journal of Bifurcation and Chaos, Vol. 9, No. 7,
pp.1425–1434.
[88] Siemens-AG (2003), FuzzyControl++, Version 5.0, User’s Manual.
[89] Siemens-AG (1998), NeuroSystems, User’s Manual, Version 1.0.
[90] Siemens-AG (1999), Recipes for Easy Applications of Neural Networks,
NeuroSystems-Cookbook.
[91] Simon Haykin (1999), Neural Networks A Comprehensive Foundation, 2nd
Edition, Prentice Hall, USA.
[92] Shouling He, Konrad Reif, Rolf Unbehauen (1998), “A Neural Approach for
Control of Nonlinear Systems with Feedback Linearization”, IEEE
Transactions on Neural Networks, Vol. 9, No. 6, pp.1409–1421.
[93] S.P. Moustakidis, G.A. Rovithakis, and J.B. Theocharis (2006), “An Adaptive
Neuro-Fuzzy Control Approach for Nonlinear Systems via Lyapunov Function
Derivative Estimation”, The 2006 IEEE International Symposium on Intelligent
Control, Munich, Germany, pp.1602–1607.
- 132 -
[94] S. Seshagiri and H. K. Khalil (2000), “Output feedback control of nonlinear
systems using RBF neural networks”, IEEE Transactions on Neural Networks,
Vol. 11, No. 1, pp. 69–79.
[95] S.S. Ge, C. C. Hang, Tao Zhang (1999), “Adaptive Neural Network Control of
Nonlinear Systems by State and Output Feedback", IEEE Transactions on
Systems, Man, and Cybernetics, Part B: Cybernetics, Vol. 29, No. 6.
[96] S.S. Ge, C.Wang, T.H.Lee (2000), “Adaptive Backstepping Control of a Class
of Chaotic Systems”, International Journal of Bifurcation and Chaos, Vol. 10,
No. 5, pp.1149–1156.
[97] Tianping Zhang and Shuzhi Sam Ge (2006), “Robust Adaptive Neural Control
of SISO Nonlinear Systems with Unknown Nonlinear Dead-Zone and
Completely Unknown Control Gain”, The 2006 IEEE International Symposium
on Intelligent Control, Munich, Germany, pp.88–93.
[98] T. John Koo (2001), “Stable Model Reference Adaptive Fuzzy Control of a
Class of Nonlinear Systems", IEEE Transactions on Fuzzy Systems, Vol. 9, No.
4, pp.624–636.
[99] Tomohisa Hayakawa (2003), Direct Adaptive Control for Nonlinear Uncertain
Dynamical Systems, Ph.D. Thesis, Georgia Institute of Technology.
[100] Tomohisa Hayakawa (2005), “A New Characterization on the Approximation
of Nonlinear Functions via Neural Networks: An Adaptive Control
Perspective”, The 44th
IEEE Conference on Decision and Control, and the
European Control Conference, Spain, pp.4117–4122.
[101] Tomohisa Hayakawa, Wassim M. Haddad, James M. Bailey, Naira
Hovakimyan (2005), “Passivity-Based Neural Network Adaptive Output
Feedback Control for Nonlinear Nonnegative Dynamical Systems", IEEE
Transactions on Neural Networks, Vol. 16, No. 2, pp.387–398.
[102] Tomohisa Hayakawa, Wassim M. Haddad, Naira Hovakimyan, VijaySekhar
Chellaboina (2005), “Neural Network Adaptive Control for Nonlinear
Nonnegative Dynamical Systems", IEEE Transactions on Neural Networks,
Vol. 16, No. 2, pp.399–413.
[103] Tomohisa Hayakawa, Wassim M. Haddad, and Naira Hovakimyan (2008),
“Neural Network Adaptive Control for a Class of Nonlinear Uncertain
Dynamical Systems with Asymptotic Stability Guarantees", IEEE Transactions
on Neural Networks, Vol. 19, No. 1, pp.80–89.
[104] T. Zhang, S. S. Ge, C. C. Hang (2000), “Stable Adaptive Control for a Class of
Nonlinear Systems using a Modified Lyapunov Function", IEEE Transactions
on Automatic Control, Vol. 45, No. 1, pp.129–132.
- 133 -
[105] Wenjie Dong, Yuanyuan Zhao, Jay A. Farrell (2008), “Tracking Control of
Nonaffine Systems: A Self-organizing Approximation Approach”, American
Control Conference, Washington, USA, pp. 69–74.
[106] Won Kee Son, Jin Young Choi, and Oh Kyu Kwon (2002), “Robust Predictive
Control of Uncertain Nonlinear System With Constrained Input", Transactions
on Control, Automation and Systems Engineering, Vol. 4, No. 4, pp.289–295.
[107] Yansheng Yang, Changjiu Zhou (2005), “Robust Adaptive Fuzzy Tracking
Control for a Class of Perturbed Strict-feedback Nonlinear Systems via Small-
gain Approach”, Elsevier Information Sciences, Vol. 170, pp.211–234.
[108] Yixin Diao, Kelvin M. Passino (2004), “Stable Adaptive Control of Feedback
Linearizable Time-varying Non-linear Systems with Application to Fault-
tolerant Engine Control”, International Journal of Control, Vol. 77, No. 17,
pp.1463–1480.
- 134 -
PHỤ LỤC
5.1. Một số thuật ngữ tiếng Anh
class K (hàm lớp K): ( )E K nếu : D đồng biến chặt trên 0,D r với
r và (0) 0 .
class K (hàm thuộc lớp K): ( )E K nếu K với 0,D và
lim ( )EE
.
class KL (hàm thuộc lớp KL ): Hàm liên tục : n thuộc lớp KL nếu
( , )t K x với mỗi t không đổi và giảm dần đối với t khi x không đổi và
( , )t K x khi t .
compact set/space (tập compac): Tập compac n x là tập con đóng (closed) và bị
chặn.
decrescent function (hàm giảm dần): Hàm liên tục ( , ) :V t Bh x ,
:nB hh x x (hoặc ( , ) : nV t x ) được gọi là giảm dần nếu
tồn tại hàm γ K định nghĩa trên 0,r với 0r định nghĩa trên 0, sao cho
( , ) γ( )V t x x với 0t và Bhx , 0h (hoặc nx ). Ngoài ra ( , )V t x giảm
dần khi và chỉ khi tồn tại hàm xác định dương trên Bh (hoặc trên
n ) để
( , ) w( )V t x x với mọi Bhx (hoặc nx ) và 0t
diffeomorphism (phép biến đổi vi đồng phôi): Phép biến đổi T : n n được
gọi là vi (đồng) phôi nếu tồn tại phép biến đổi ngược 1T với T , 1T là các hàm
trơn (smooth).
globally uniformly asymtotically stable (ổn định tiệm cận đều toàn cục): Gốc của hệ
(2-68) e x 0 là ổn định tiệm cận đều (hoặc đơn trị) toàn cục nếu là ổn định đều
toàn cục và với mọi 0 và 00t luôn tồn tại 00 không phụ thuộc vào 0t
và , ( ) 0T không phụ thuộc vào 0t
để cho ( , , )0 0t t e x x x với mọi
( )0t t T khi ( )0 e x x .
- 135 -
Lambert w function (hàm Lambert w): ([84]) Hàm Lambert w( )x là nghiệm của
phương trình w( )w( )
xx e x . Trong MATLAB hàm được gọi như sau
lambertw( )Y X .
radially unbounded (không bị chặn tia): Hàm liên tục ( , ) : nV t E được gọi
là không bị chặn theo tia nếu ( , ) 0V t 0 với 0t và tồn tại hàm γ K để
( , ) γ( )V t E E với 0t và nE .
Rayleigh-Ritz (bất đẳng thức Rayleigh-Ritz): Nếu : n nP là ma trận đối xứng và
nx thì ( ) ( )min maxT T T P x x x Px P x x .
relative degree (bậc tương đối): ([50], [51]) Hệ (2-1) có bậc tương đối n tại 0ξ nếu
2( ) ( ) ( ) 0nL h L L h L L h ξ ξ ξg g f g fξ ξ ξ ξ ξ với ξ trong lân cận của 0
ξ và
1 0( ) 0nL L h ξg fξ ξ, trong đó ký hiệu ( )L h ξfξ
là đạo hàm Lie – hay còn gọi là
đạo hàm của ( ) : n dh D ξ theo ( ) : n d n dD f ξξ – và
được định nghĩa như sau: ( )
( ) ( )h
L h
ξξ f ξf ξξξ
, 1( ) ( )k kL h L L h
ξ ξf f fξ ξ ξ với
2k . Ý nghĩa của bậc tương đối là số lần phải lấy đạo hàm của đầu ra theo quỹ
đạo động học của hệ để đầu vào xuất hiện rõ hay để ánh xạ đầu vào-đầu ra là tuyến
tính.
state feedback linearization (tuyến tính hóa phản hồi trạng thái): ([50], [51]) Hệ (2-1)
là khả tuyến tính hóa phản hồi trạng thái nếu tồn tại phép biến đổi ( )x T ξ xác
định trên U (chứa gốc tọa độ) và ( ) T 0 0 để chuyển hệ sang dạng thức
( ) ( )f g u x Ax b x x với ( , )A b là cặp điều khiển được ([49]).
uniformly bounded (tính bị chặn đều)
( , , )0 0t tx x được gọi là bị chặn đều hay bị chặn
đơn trị nếu với mỗi 0 và 00t luôn tồn tại ( ) 0 (không phụ thuộc vào
0t) để 0 x thì ( , , ) ( )0 0t t x x với mọi 00t t .
uniformly ultimately bounded (bị chặn tới hạn đều): Nghiệm ( , , )0 0t tx x được gọi là bị
chặn tới hạn đều nếu tồn tại 0B và với mỗi 0 , 00t luôn tồn tại ( ) 0T
(không phụ thuộc vào 0t
) để 0 x thì ( , , )0 0t t Bx x với mọi ( )0t t T .
unitary matrix (ma trận unita): U là ma trận unita nếu 1 * U U với ký hiệu
*U là
chuyển vị liên hợp phức của U. Trường hợp ma trận số thực thì 1 T U U .
- 136 -
5.2. Bổ đề 1 trang 23
Để chứng minh hệ sai số (2-16) thỏa mãn Giả thiết 1 ta cần chỉ ra hàm số
( , ) :t E x có tính chất bị chặn với E bị chặn và không giảm dần đối
với E khi t không đổi để ( , )t E xx với mọi t .
Từ định nghĩa hệ sai số (2-16): ( 1)( , ) T nE E nE t x r x k d với 1 1, ,T
E nk k k
và
( 2)1 2 1, , ,
Τn
E nx r x r x r
d ta có:
2 2
( 1)( 2) ( 2)
1 1
( 1)
1 2 1
0
0
1
0 0
0 0
1
T nE E E nn n
n n
n Tn E E
E
n
x r x r
x rx r x r
x r
E
k k k
d k d
k d
Id
Đặt
1 2 1
0
0
nk k k
k
IA
và 1
0
0
1
n
b
dẫn đến phương trình động
học đối với Ed như sau:
E E E kd A d b (5-1)
với kA là Hurwitz do 1 21 1
n nns k s k là Hurwitz.
Biết nghiệm của phương trình vi phân tuyến tính (5-1) là:
( )
0
( ) e (0) e ( )t
t tE Et E d
k kA A
d d b (5-2)
Do kA là Hurwitz nên luôn tìm được các số dương 1p và 2p để 21e e
t -p tpkA
bằng phương pháp sau:
- 137 -
Phương trình trạng thái (5-1) khi 0E có nghiệm là ( ) e (0)t
E Et kAd d . Đặt
( ) TE EV t d Pd với P là ma trận đối xứng xác định dương thỏa mãn
( )T k kPA A P I thì 2
( )T T TE E E E EV k kd PA A P d d d d .
Áp dụng bất đẳng thức Rayleigh-Ritz với min max( ), ( ) P P tương ứng là các giá trị
riêng nhỏ nhất và lớn nhất của P :
min max
min max
( ) ( )
( ) ( )
T TTE E E EE E
V VV
d Pd d Pdd d
P P
P P
Giải bất phương trình vế phải max ( )
VV
P ta được max/ ( )
(0)t
V V e
P
, mặt khác
thay vào bất đẳng thức vế trái sẽ có:
max
max
2 / ( )
min min
/ 2 ( )
min
(0)
( ) ( )
(0) (0)
( )
tE
TtE E
E
V Ve
e
P
P
dP P
d Pdd
P
Do vậy nếu chọn 1min
(0) (0)
( )
TE Ep
d Pd
P và 2
max
1
2 ( )p
P thì 2
1e et -p t
pkA.
Từ kết quả trên và (5-2) suy ra:
2 2 ( )1 1
0
( ) e (0) e ( ) ( , )E
t-p t -p t
E E dt p p E d t E
d d (5-3)
Mặt khác từ định nghĩa hệ sai số có thể viết:
( 1)
E E E
n T Tn E E E Ex r E E
d d dx r x r
k d k d
Do rr và từ (5-3) nên ta xác định được hàm x cần tìm để ( , )t E xx như
sau:
- 138 -
1
1
1
1 ( , ) ( , )E
E
TE E
TE E E
TE E E
TE E
n
ii
E
r E
r E
r E
r E k t E t E
d x
dx r
k d
d k d
d k d
k d
(5-4)
Rõ ràng là ( , )t E x tìm được trong (5-4) thỏa mãn tính chất là hàm số bị chặn khi
E bị chặn và không giảm dần đối với E khi t không đổi nên Bổ đề 1 đã được
chứng minh.
- 139 -
5.3. Bổ đề 3 trang 40 và kết quả (2-64)
Do μ ( , , ) sign( )bsig( , )E E E E E với 0 1 là hàm chẵn nên ta chỉ
cần xét hàm μ ( , , ) bsig( , )E E E E với 0E hay:
1 ( 1)
μ ( , , )1
E
E E
eE E
e
Tính đạo hàm của μ ( , , )E E theo E thu được:
2
2
2
2
2
2
2
( 1) 1 ( 1) (1 )μ
1
1 ( 1)
1
( 1) ( 1) ( 1)
1
( 1) ( 1) ( 1) ( 1) 1
1
( 1) 2( ) 1
1
E E E
EE
E E
E
E
E
E
E
E E
E
e E e ed
dE e
e E e
e
E E e
e
E E e
e
e E e
e
2
( , )
1 x
f x
e
trong đó ký hiệu 2( , ) ( 1) 2( ) 1x xf x e x e và x E .
Để tìm cực trị của μE cần thiết giải phương trình:
( , ) 0f x (5-5)
với 0 1 . Phương pháp khảo sát hàm số ( , )f x dưới đây chứng minh rằng
phương trình (5-5) trên luôn có nghiệm duy nhất.
Từ đạo hàm:
- 140 -
2( , ) 2( 1) 2 ( )
2 ( 1) ( 1)
x x x
x x
df x e e x e
dx
e x e
cho thấy ( , ) 0d
f xdx
khi và chỉ khi x là nghiệm của phương trình:
( 1) ( 1) xx e (5-6)
Để giải phương trình (5-6), ta sử dụng kết quả của Bổ đề 8 dưới đây:
Bổ đề 8 : Nghiệm của phương trình xx b ae với 0a là w( )bx b ae
với w( )x là hàm Lambert.
Chứng minh Bổ đề 8 từ biến đổi /( )x a x ax bx b ae e
a a và áp dụng Bổ đề 2
(trang 34) như sau:
/w ( ) log( ) w
log( )
w .
a b a a b
a
b
e e aex b b
a a a ae
x b ae
(5-7)
▲
Thay ( 1)a , 1b dẫn đến nghiệm của phương trình (5-6) là:
( 1)0
( 1)0
( 1) w ( 1)
1 w ( 1) 1 w(p)
x x e
x e
(5-8)
trong đó ký hiệu ( 1)p ( 1)e . Do
( 1)p(2 ) 0
de
d
nên p luôn giảm
dần đối với 0,1 và p(1) p( ) p(0) hay 2p 2 ,1e e
.
Khi đó ( , )f x chỉ có một điểm cực trị duy nhất (kết quả phân tích dưới đây cho
thấy đó là điểm cực tiểu) tại 0 0,x f với 0x xác định theo (5-8) và:
- 141 -
0 0
0 0
20
22( 1) ( 1)
w(p) w(p)
2
2( 1) ( 1)
( 1) ( 1)
2 2
,
( 1) 2( ) 1
1 1( 1) 2 ( 1) w(p) 1
w(p) w(p)( 1) 2 1 w(p) 1
( 1) ( 1)
w (p) w(p) w (p)2 1 w(p) 1
1 1
x x
f f x
e x e
e ee e
e ee e
2
22
2w(p) 1
1
w(p) 1.
1
Do hàm Lambert là đồng biến chặt trên 1 e, nên 2
w(2 ) w(p) w(1 )e e ,
suy ra 0 1x và 0 0f . Mặt khác ( ,0) 4 0f , ( , ) 1 0f nên ( , )f x
luôn cắt trục hoành chỉ tại một điểm mx nằm trong khoảng 00, x và 0f là giá trị cực
tiểu của hàm số ( , )f x . Lưu ý là
2
( , )μ
1E
x
d f x
dE e
nên kết quả trên cũng cho
phép suy ra tại mm
xE
, μE đạt giá trị lớn nhất bằng _ maxμ ( , ) μ ( , , )E E mE ,
ngoài ra do _ maxμ ( , ,0) 0 μ ( , , ) μ ( , )E E m EE nên giá trị lớn nhất là
dương.
Để tính giá trị lớn nhất này ta có thể sử dụng phương pháp giải trên MATLAB.
Dưới đây là mã code chương trình viết trên m-file để tạo ra đồ thị μ ( , , )E E trong
các trường hợp 5 , 10 và giá trị được chọn trong mỗi trường hợp là 1, 0.9
và 0.5 (Hình 4 trang 41):
% mu_E_max; VIELINA–NDH, 2006
function mu_E_max() clear all
global xm ym step=0.01; xmax=2;
a=0; rho1=1; rho2=0.9; rho3=0.5;
kappa=5; subplot(1,2,1); plot_mu(xmax, step, a, rho1, rho2, rho3, kappa);
kappa=10; subplot(1,2,2); plot_mu(xmax, step, a, rho1, rho2, rho3, kappa);
function Y=bsig(K,A,E) Y=(2/(1+exp(-K*(E-A))) - 1);
- 142 -
function Y=f_mu(K,A,B,E) Y=abs(E)*(B-sign(E)*bsig(K,A,E));
function Y=f_mu_em(K,B)
str=sprintf('(%4.2f+1)*exp(-2*x)+2*(%4.2f-x)*exp(-x)+%4.2f-1=0',B,B,B);
Y=solve(str)/K;
function plotf_mu(kappa, a, rho, w, color) global xm ym
em=double(f_mu_em(kappa,rho)); %E_m fe=f_mu(kappa,a,rho,em); %mu_E_max
s=sprintf('\\fontsize{10}\\it%5.4f',fe);
text(xm(1)-0.03,fe,s, 'Color', color, 'HorizontalAlignment', 'Right'); line([xm(1),em],[fe,fe], 'LineStyle', '-.', 'Color', color);
sprintf('mu(%f,%i,%5.4f)\t= %5.4f',rho,kappa,em,fe) % prints mu_E_max
function plot_mu(xmax, step, a, rho1, rho2, rho3, kappa)
global xm ym x=[-xmax:step:xmax]';
for i=1:size(x,1) y1(i)=f_mu(kappa,a,rho1,x(i));
y2(i)=f_mu(kappa,a,rho2,x(i)); y3(i)=f_mu(kappa,a,rho3,x(i));
end;
handle=plot(x,y1,'-r',x,y2,'-b',x,y3,'-k','LineWidth',1); xlabel('\fontsize{10}\it\bfE'); ylabel('\fontsize{15}\bf\mu\fontsize{10}_{E}');
grid on;
if kappa==5
xlim([-1 1]); ylim([-0.04 0.12]); set(gca,'XTick',[-1:0.5:1]);
x1=0.52; x2=0.56; x3=0.25;
title('\fontsize{15}\bf\it\kappa\fontsize{10}\rm\bf = 5');
else if kappa==10 xlim([-0.5 0.5]); ylim([-0.02 0.06]); set(gca,'XTick',[-0.5:0.25:0.5]);
x1=0.26; x2=0.28; x3=0.125;
title('\fontsize{15}\bf\it\kappa\fontsize{10}\rm\bf = 10'); end
end
text(x1,f_mu(kappa,a,rho1,x1),'\fontsize{10}\leftarrow \it\rho\rm\fontsize{9} = 1', 'Color','r'); text(x2,f_mu(kappa,a,rho2,x2),'\fontsize{10}\leftarrow \it\rho\rm\fontsize{9} = 0.9',
'Color','b'); text(x3,f_mu(kappa,a,rho3,x3),'\fontsize{10}\leftarrow \it\rho\rm\fontsize{9} = 0.5',
'Color','k');
e=exp(1); w=1+lambertw(1/e); xm=xlim; ym=ylim;
plotf_mu(kappa, a, rho1, w, 'r')
plotf_mu(kappa, a, rho2, w, 'b') plotf_mu(kappa, a, rho3, w, 'k')
- 143 -
5.4. Tuyến tính hóa phƣơng trình động lực học (3-23)
Đặt 1 4 1 1 2 2,.., , , ,T q q q q ξ , khi đó phương trình động lực học (3-23) và đầu
ra có thể viết dưới dạng:
1 2
2 1 1 3
3 4
4 1 3
1
sin ( )
( )
a b
c du
y
(5-9)
với MgL
aI
, k
bI
, k
cJ
và 1
dJ
hoặc:
( ) ( )
( )
u
y h
ξ ξξ f ξ g ξ
ξ
(5-10)
với
2
1 1 3
4
1 3
sin ( )( )
( )
a b
c
ξf ξ ,
0
0( )
0
d
ξg ξ và 1( )h ξ .
Hệ (5-10) có điểm cân bằng tại ξ 0 và có bậc đầy đủ 4n do từ:
2
21 1 3
2
31 2 1 2 4
3
42 1 1
22 1
( )( ) 1,0,0,0
( )( ) 0,1,0,0 sin ( )
( )( ) cos ,0, ,0 cos ( )
( )( ) sin , cos ,0,
sin cos
hL h
L hL h a b
L hL h a b b a b
L hL h a a b b
a a
ξ
ξ
ξ
ξ
ξ
ξ
ξ
f ξ ξ
f
f ξ ξ
f
f ξ ξ
f
f ξ ξ
ξξ f f
ξ
ξξ f f
ξ
ξξ f f
ξ
ξξ f f
ξ
1 1 1 3 1 3sin ( ) ( )b a b bc
ta có:
- 144 -
2
21
3
32 1 1
( )( ) 1,0,0,0 0
( )( ) 0,1,0,0 0
( )( ) cos ,0, ,0 0
( )( ) sin , cos ,0, 0
hL h
L hL L h
L hL L h a b b
L hL L h a a b b bd
ξ
ξ
ξ ξ
ξ
ξ ξ
ξ
ξ ξ
g ξ ξ
f
g f ξ ξ
f
g f ξ ξ
f
g f ξ ξ
ξξ g g
ξ
ξξ g g
ξ
ξξ g g
ξ
ξξ g g
ξ
Như vậy có thể sử dụng phép biến đổi vi đồng phôi 1 4( ) T ( ), ,T ( )T
T ξ ξ ξ với
1ξ T x để xác định:
1 1 1
2 2 22
3 3 1 1 3
34 4 2 1 2 4
( )T
( )T
( )T sin ( )
T cos ( )( )
hx
L hx
L hx a b
x a bL h
ξ
ξ
ξ
f
f
f
ξ
ξ
xξ
ξ
4 22 1 1 1 1 3 1 3
22 1 1 3 1 3 1 1
22 1 1 3
3
( ) ( ) sin cos sin ( ) ( )
1sin cos ( sin )
sin cos
( ) ( )
f L h a a b a b bc
ax x a x b x bc x x a x bxb
a x c x a x b c x
g L L h bd
ξ
ξ ξ
f
g f
x ξ
x ξ
và biểu diễn hệ ở dạng tuyến tính hóa phản hồi trạng thái chuẩn tắc:
1 2
2 3
3 4
24 2 1 1 3
1
sin cos
x x
x x
x x
x a x c x a x b c x bdu
y x
(5-11)
Kết quả trên cho thấy nếu giả thiết ξ là véctơ trạng thái đo được thì x cũng tính
được qua phép biến đổi x T ξ nêu trên.
- 145 -
5.5. Chƣơng trình mô phỏng ví dụ điều khiển tay rôbốt trang 79
% Robot Link Control Simulation; VIELINA–NDH, 2006
%function RobotSim1()
clear all;
global T_min T_step T_max fig a b c d a2 b2 c2 d2
nlStateFeedback_siso = ...
struct('Name','Nonlinear State-feedback Linearizable SISO Model', ...
'N', 0, 'CTRMode', '', ... % Control Mode
'fx', [], 'gx', [], 'hx', [], ... % Plant Model parameters
'fxa', [], 'gxa', [], 'hxa', [], ... % Plant Model Approximation
'FX', [], 'X',[],'W', [], 'Dg',[], 'Df', [], ... % Neural Network Approximator
'Fdxn', [], ... % Neural Network Approximator
'SatLim', 1, 'uLow', -1, 'uHigh', 1, ... % Saturation limiter
'RateLim', 1, 'duLow', -1, 'duHigh', 1, ... % Rate limiter
'K', [], 'eta', 1, 'ETA', [], 'kappa', [], ...
'alpha', 0, 'rho', 0, 'theta', 0, ... % Control parameters
'tempData', [], 'tempData2', []); % Testing data templates
% Nonlinear state-feedback linearizable SISO plant model:
% dx1/dt = x2
% dx2/dt = x3
% dx[N-1] = xN
% dxN/dt = f(x) + g(x)*u
% y = h(x)
% where x = [x1; x2; ...; xN] (state vector)
% u: plant input; y: plant output
% Parameters:
% N: Number of continuous states
% fx, gx, hx: f(x), g(x), h(x) respectively
% fxa, gxa, hxa: known functions for replacement of f(x), g(x), h(x) respectively
RefModel_siso = struct( 'Name','SISO Reference Model','Formula', '');
% Simulation Settings --------------------------------------------------
T_min=0; T_max=50; T_step=0.01;
T=T_min:T_step:T_max; % Simulation time interval, fix step
T_Ref=[T_min:T_step/5:T_max]; % Reference signal's sampling time interval
flag='';
options = odeset('RelTol',1e-3,'AbsTol',1e-4);
% Plant Model Definition -----------------------------------------------
nlPlant=nlStateFeedback_siso; % Defines Plant Model
nlPlant.N=4; % Number of states (x)
nlPlant.fx='(a*(x(:,2).^2-c).*sin(x(:,1))-a*(cos(x(:,1))+b+c).*x(:,3))';
nlPlant.gx='b*d';
nlPlant.hx='x(:,1)';
- 146 -
nlPlant.K=poly([-0.5 -0.8 -1]);
nlPlant.eta=200;
nlPlant.ETA(1)=nlPlant.eta*nlPlant.K(1);
for i=2:nlPlant.N
nlPlant.ETA(i)=nlPlant.K(i-1)+nlPlant.eta*nlPlant.K(i);
end
nlPlant.kappa=0; % static feedback control law applies
I=0.04; J=0.04; k=0.8; L=0.1; M=6; g=9.8;
a=M*g*L/I; b=k/I; c=k/J; d=1/J;
% Reference Signal Definition -------------------------------------------------------
RefSignal='FORMULA'; % Defines Reference Signal Type
fig=0;
RefModel=RefModel_siso;
RefModel.Formula='pi*sin(0.5*t).*cos(0.1*t)/3'; % Reference signal
Ref=fRefGen(RefModel.Formula, T_Ref'); % Ref=[t Ref(t)]
s=sprintf('r(t)=%s',RefModel.Formula);
dr = fDeriv(Ref(:,1:2), nlPlant.N+1); % Reference data & its derrivatives
r = [Ref(1:size(dr,1),1:2) dr(:,2:nlPlant.N+1)];
% R = [t r(t) dr(t)/dt..d^(N)r(t)/dt^N]
rt=fxt(r,0,'approx'); % rt=[t r dr/dt ...]
X0=[0 0 0 0];
% Trains approximator ---------------------------------------------------------------
nlPlant.u='5.15*sin(0.25*t)-0.95*sin(t)'; % u for testing (maybe varies)
nlPlant.fxa='(-a2*c2.*sin(x(:,1))-a2*(b2+c2).*x(:,3))';
nlPlant.gxa='b2*d2';
nlPlant.hxa=nlPlant.hx;
nlPlant.X='[x uxa]';
a2=a; b2=b*0.9; c2=1.1*c; d2=1.3*d;
T1=T;
nlPlant = fStateFeedback2(T1, X0, options, 'train', nlPlant, r);
nlPlant.W
save data;
% Tests the trained controller -------------------------------------------------------
%function RobotSim2()
clear all;
load data;
T2=T;
- 147 -
nlPlant.kappa=1;
nlPlant.rho=1; % 0<rho<=1
nlPlant = fStateFeedback2(T2, X0, options, 'approx', nlPlant, r);
Error=[nlPlant.W; nlPlant.Df; nlPlant.Dg]
pause
nlPlant.kappa=1;
nlPlant.rho=0.8; % 0<rho<=1
nlPlant = fStateFeedback2(T2, X0, options, 'approx', nlPlant, r);
Error=[nlPlant.W; nlPlant.Df; nlPlant.Dg]
% ----- Backstepping ----------------------------------------------------------------
function [y]= fStateFeedback2(T, X0, options, flag, Plant, r)
% flag={'exact','approx','learn'}
global T_min T_step T_max fig a b c d a2 b2 c2 d2
stime='\fontsize{12}\itt\rm [s]';
sk=sprintf('\\fontsize{15}\\it\\kappa\\rm\\fontsize{12} = %.0f',Plant.kappa);
if Plant.kappa~=0
sk=sprintf('%s, \\fontsize{15}\\it\\rho\\rm\\fontsize{12} = %.1f',sk,Plant.rho);
end
N=Plant.N; s='';
t=[]; x=[]; y=[]; z=[];
[t,x] = ode45(@fdx_statefb2, T, X0(1:N), options, {flag, 'deriv'}, Plant, r); % x=[x1..xN]
for i=1:length(t)
y(i,:) = feval(@fdx_statefb2, t(i), x(i,:), {flag, 'output'}, Plant, r); % y=[h(x) ufb E e1..eN]
if strcmp(flag,'train')
z(i,:) = feval(@fdx_statefb2, t(i), x(i,:), {flag, 'trndata'}, Plant, r);
end
end
Plant.tempData=[t y(:,1) y(:,2) x]; % Saves data for later testing [t h(x) ufb x]
ufb=y(:,2);
fig=fig+1; figure(fig); clf;
plot(t,y(:,3),'-r', t,y(:,4),'-b') % Plots E, e1
if N>1
hold on;
plot(t,y(:,5),'-g') % Plots e2
hold off;
end
%s=sprintf('\\fontsize{12}Error system - \\bf%s\\rm mode', flag);
title(sk); xlabel(stime); ylabel('\fontsize{12}\itE');
- 148 -
fig=fig+1; figure(fig); clf;
plot(t(:,1),x(:,1),'-r', t(:,1),x(:,2),'-b', t(:,1),x(:,3),'-g', t(:,1),x(:,4),'-m') % Plots r(t), y(t)
title(sk); xlabel(stime); ylabel('\fontsize{12}\bfx');
fig=fig+1; figure(fig); clf;
plot(r(:,1),r(:,2),'-r', t,y(:,1),'-b') % Plots r(t), y(t)
rt=fxt(r,t,'approx'); % rt=[t r dr/dt ...]
title(sk); xlabel(stime); ylabel('\fontsize{12}\itr\rm, \ity');
ylim([-1.2 1.2]);
s1='\fontsize{11}\leftarrowReference signal';
text(r(3.9/T_step*5,1),r(3.9/T_step*5,2),s1,'Color','r');
s2='\fontsize{11}\leftarrowPlant''s output'; text(t(1.8/T_step),y(1.8/T_step,1),s2,'Color','b');
fig=fig+1; figure(fig); clf; plot(t,y(:,2),'-r') % Plots ufb
%s=sprintf('\\fontsize{12}Control signal - \\bf%s\\rm mode', flag);
title(sk); xlabel(stime); ylabel('\fontsize{12}\itu');
switch flag
case 'train' % Sets and trains approximators
Plant.Fdxn=[]; trData=[]; X=[]; Y=[]; Z=[];
MF_No=2; MF_Type='gbellmf'; Epoch_No=10;
uxa=y(:,2); X=eval(Plant.X);
Z=z(:,2); % Z=dxN/dt
trData=[X Z];
crAnfis=genfis1(trData, MF_No, MF_Type)
% Generates an FIS structure from data used as initial conditions for anfis training
Plant.Fdxn = anfis(trData, crAnfis, Epoch_No)
% Training routine for Sugeno-type FIS
Y=evalfis(X, Plant.Fdxn);
Plant.W=[norm(Z-Y) abs(max(Z-Y))]; % abs(max(Z-Y));
fig=fig+1; figure(fig); clf;
plot(t,Z,'-r',t,Y,'-b') % Plots u(t)=uN
s1='\fontsize{15}\Delta\fontsize{11}_{dxn}';
s=sprintf('\\fontsize{11}Trained ANFIS Approximator - %s',s1);
title(s); xlabel(stime); ylabel(s1);
case 'approx'
uxa=y(:,2); X=eval(Plant.X);
fx=eval(Plant.fx); fxa=eval(Plant.fxa);
Plant.Df=[norm(fxa-fx) abs(max(fxa-fx))];
gx=eval(Plant.gx); gxa=eval(Plant.gxa);
Plant.Dg=[norm(gxa-gx) abs(max(gxa-gx))];
- 149 -
Delta_f=fxa-fx; Delta_g=gxa-gx;
fig=fig+1; figure(fig); clf;
plot(t,Delta_f,'-r',t,Delta_g,'-b') % Plots u(t)=uN
s1='\fontsize{13}\Delta\fontsize{12}\it_{f}\rm(\bfx\rm)';
s2='\fontsize{13}\Delta\fontsize{12}\it_{g}\rm(\bfx\rm)';
title(sk); xlabel(stime); ylabel(sprintf('%s, %s',s1,s2));
s=sprintf('\\leftarrow%s',s1); text(t(6/T_step),Delta_f(6/T_step),s,'Color','r');
s=sprintf('\\downarrow%s',s2); text(15,Delta_g+10,s,'Color','b');
end
y=Plant;
% ----- Nonlinear Plant Model ---------------------------------------------------------
function [y] = fdx_statefb2(t, x, flag, Plant, rData)
% rData=[t r dr/dt .. (d^N)r/dt^N]: Reference database
% flag meanings:
% 'exact' & 'deriv': exact model states derivative
% 'exact' & '
% ALL VECTORS MUST BE ROW VECTORS !!!
% MATRIX ROW : indicates one record of variable(s)
% MATRIX COLUMN: indicates one variable in time steps
global a b c d a2 b2 c2 d2
N=Plant.N; ETA=Plant.ETA(:)'; K=Plant.K(1:N); K=K(:);
u=[]; y=[]; t=t(:);x=x(:)';
rt=fxt(rData,t,'approx');
e=x-rt(:,2:N+1); E=e*K;
fx=eval(Plant.fx); gx=eval(Plant.gx); hx=eval(Plant.hx);
fxa=eval(Plant.fxa); gxa=eval(Plant.gxa); hxa=eval(Plant.hxa);
[t E]
switch flag{1} % Control mode
case 'exact'
ufb = (rt(:,N+2)-e*ETA'-fx)./gx; % Feedback control law
case 'approx'
uxa = (rt(:,N+2)-e*ETA'-fxa)./gxa; % Approx. control law
X=eval(Plant.X); Phi=(evalfis(X, Plant.Fdxn));
Edxn=E*Phi;
if (0)
ufb = uxa-abs(Phi)*bsig(Plant.kappa,E,0)./gxa; % Feedback control law
else
ufb = uxa-Phi*bsig(Plant.kappa,Edxn,0)/Plant.rho./gxa; % Feedback control law
end
case 'test' % Testing model with tempData
- 150 -
ut=fxt(Plant.tempData,t,'approx'); ufb=ut(:,3);
case 'train' % Archiving data for approximator trainning
uxa = (rt(:,N+2)-e*ETA'-fxa)./gxa; % Approx. control law
ufb=uxa;
otherwise
error(['Unhandled Control Type = ', flag{1}]);
end
switch flag{2}
case 'deriv' % y=[dx1/dt..dxN/dt]
y=[x(:,2:N) fx+gx.*ufb]';
case 'output' % y=[h(x) ufb E e1..eN delta_dxn]
if strcmp(flag{1},'approx')
y=[hxa ufb E e (fxa-fx+(gxa-gx).*uxa)];
else
y=[hx ufb E e (fxa-fx+(gxa-gx).*ufb)];
end
case 'trndata' % y=[r delta_dxn]
y=[rt(:,2) (fxa-fx+(gxa-gx).*uxa)];
otherwise
error(['Unhandled Return Type = ', flag{2}]);
end
% ----- Reference r(t) signal Generator ------------------------------------------------
function [Ref] = fRefGen(RefSignal, tRef)
% Reference signal r(t) Generator
% Ref = [tRef yRef] ; max(size(Ref))=2
t=tRef;
Ref = [tRef eval(RefSignal)];
% ----- Derrivative calculation ----------------------------------------------------------
function [y] = fDeriv(xData, p)
% Calculates derrivatives up to p power of xData
% xData=[t x1 .. x(N-1)]: xdata matrix (M rows, N columns)
% y = [t dx1/dt..dx(N-1)/dt ... (d^p)x1/dt^p..(d^p)x(N-1)/dt^p];
% size(y)=[M-p 1+(N-1)*p]
[M N]=size(xData);
t=xData(:,1); dt=diff(t); x=[]; %x=xData(:,2:N);
for i=1:p
k=(i-1)*(N-1);
for j=1:N-1
x(1:M-i,k+j)=diff(xData(1:M,j+1),i) ./ (dt(1:M-i).^i);
end
end
y = [t(1:M-p) x(1:M-p,:)];
- 151 -
% ----- Function values calculation -----------------------------------------------------
function [y] = fxt(xData, t, flag)
% Calculation of x1(t)..xN(t) based on specification data stored in xData (t>=0)
% t: time (row or column vector) for calculation of xi(t)
% xData=[t x1(t) .. xN(t)]: xdata matrix
% y = [t x1~(t) .. xN~(t)]; max(size(Ref))=N+1
% flag: mode of calculation (now works with 'approx' only)
[M N] = size(xData); K=length(t); t=t(:);
for i=1:K
ti=t(i); j=1;
while (xData(j,1)<=ti & j<M) j=j+1; end
if (j==M) k=j; else k=j-1; end
xt=xData(k,:); dt=ti-xt(1,1);
if dt>0
switch flag % currently works with 'approx' only
case 'approx'
for j=2:N-1
xt(1,j)=xt(1,j)+xt(1,j+1)*dt;
end
otherwise
;
end
end
y(i,:)=[ti xt(2:N)];
end
% ----- bipolar sigmoidal function calculation -----------------------------------------
function f=bsig(kappa,E,A)
kappa=kappa(:); E=E(:); A=A(1);
f=2./(1+exp(-kappa.*(E-A))) - 1;
- 152 -
5.6. Bổ đề 6 trang 100
Trƣờng hợp 1
Do A là ma trận xác định dương nên theo [38] luôn tồn tại phép phân tích LU (LU
factorization) duy nhất A LU với:
21
1 2
1 0 0
1 0
1n n
l
l l
L
,
11 12 1
22 20
0 0
n
n
nn
u u u
u u
u
U
tương ứng là các ma trận tam giác dưới (lower triangular matrix) và ma trận tam giác
trên (upper triangular matrix); 0, 1..iiu i n .
Mặt khác có thể phân tích:
11 12 11 1 11
22 2 22
0 0 1 / /
0 0 0 1 /*
0 0 0 0 1
n
n
nn
u u u u u
u u u
u
U
nên nếu ký hiệu lại
12 11 1 11
2 22
1 / /
0 1 /
0 0 1
n
n
u u u u
u u
U
và 11 22diag , , , nnu u uD thì
A có thể phân tích thành A LDU với các ma trận tam giác L , U đều có các số
hạng trên đường chéo bằng 1 và D là ma trận chéo.
Biết A đối xứng nên từ TA A suy ra T T T T T A LDU U D L U DL . Do phép
phân tích trên là duy nhất nên TL U hay
T T A U DU LDL .
Ma trận chéo D có các giá trị trên đường chéo dương nên A có thể phân tích:
1 2 1 2
1 2 1 2
T T / /
T/ /
T
A U DU U D D U
D U D U
C C
với 1/211 22diag , , , nnu u uD và
1 2/ T 1/2C D U D L là ma trận tam giác trên.
- 153 -
Trƣờng hợp 2
Nếu A có các giá trị riêng phân biệt thì ngoài phương pháp phân tích chung như
trên còn có thể phân tích theo phương pháp đường chéo hóa ma trận A bằng phép
biến đổi 1P AP D với
1
2
0 0
0 0
0 0 n
D
, 0 : 1..i i n là các giá trị riêng
phân biệt và
11 12 1
21 22 2
1 2
n
n
n n nn
p p p
p p p
p p p
1 2 nP P P P
là tập hợp đầy đủ các
véctơ riêng độc lập tuyến tính của A . Mặt khác ta có:
1 T T T
1 T T 1
A PDP P DP A
D P P DP P QDQ
DQ QD 0
với 1
T 1 T TQ P P P P Q là ma trận đối xứng.
Đặt
11 12 1
21 22 2
1 2
n
n
n n nn
q q q
q q q
q q q
Q
với | , 1..ij jiq q i j n , dẫn đến:
1 11 1 12 1 1 1 11 2 12 1
2 21 2 22 2 2 1 21 2 22 2
1 2 1 1 2 2
1 2 12 1 1
2 1 21 2 2
1 1 2
0 ( ) ( )
( ) 0 ( )
( ) ( )
n n n
n n n
n n n n n nn n n n nn
n n
n n
n n n n
q q q q q q
q q q q q q
q q q q q q
q q
q q
q q
DQ QD
2 0
0
Do Q đối xứng nên biểu thức trên chỉ đúng khi 0ijq với i j , ngoài ra do:
- 154 -
11
22
1/ 0 0
0 1/ 0
0 0 1/ nn
q
q
q
T1
TT 2
1 2 n
Tn
T T T1 1 1 2 1 n
T T T2 1 2 2 2 n
T T Tn 1 n 2 n n
P
PP P P P P
P
P P P P P P
P P P P P P
P P P P P P
nên , 1..i niP cũng là các vectơ trực giao. Như vậy nếu chọn 1Ti iP P hay T
P P I
và chọn TU P thì do 0 : 1..i i n nên có thể biến đổi A như sau:
T
T T 1/2 1/2
1/2 1/2
T
A U DU U D D U
D U D U
C C
với 1/2 1/2 TC D U D P , 1/2
1 2diag , , , n D và U là ma trận unita.
- 155 -
5.7. Một số môđun phần mềm trong mô hình phần mềm ứng dụng
Môđun phần mềm cung cấp dữ liệu quá trình cho IPC-Server
Hình 14 cho biết hoạt động của môđun phần mềm cung cấp dữ liệu quá trình
(Process I/O Data Transmission) và cấu trúc vùng bộ nhớ đệm với 2 nhiệm vụ chính
là lưu dữ liệu quá trình vào bộ đệm (kích hoạt bởi ngắt thời gian theo chu kỳ lấy mẫu)
và cung cấp dữ liệu trong bộ đệm theo yêu cầu cho PC-Server (điều khiển bởi PC-
Server thông qua giao thức truyền thông). Ngoài ra môđun còn bảo đảm quản lý được
vùng bộ nhớ đệm, xử lý các trường hợp đầy tràn vùng nhớ.
Hình 14 : Cấu trúc bộ đệm và dữ liệu quá trình cung cấp cho PC-Server
Môđun phần mềm được xây dựng tổng quát cho phép mỗi lần thực hiện truy cập
vào buffer có thể viết hoặc đọc nhiều bản ghi (records) với mỗi bản ghi chứa ít nhất 1
giá trị quá trình (dạng số thực 4 byte).
Ánh xạ
I/O Process
Image
Current Plant Record will be written to the Buffer
at sampling times
Data available
for PC reading
Rec i
pRecRd Current Plant
Record
Bộ đệm (FIFO)
REAL n
REAL 1
REAL n
REAL 1
REAL n
REAL 1
REAL n
Rec 1
Header
Rec m
pRecWr
Unused
Note:
n: Number of related I/Os (all in real number format) of the plant(s) have to be stored at sampling times.
m: Max. number of records available in the Buffer for temporary storage of plant data.
pRecRd: Pointer to the record for next reading from the Buffer.
pRecWr: Pointer to the next record for next writting to the Buffer.
REAL n
REAL ...
REAL 1
- 156 -
Môđun phần mềm ANFIS trên PLC
Đây là môđun phần mềm cơ bản trong mô hình hệ thống NF dựa trên mô hình
mạng ANFIS. Môđun phần mềm cho phép tùy chọn các tham số/kiểu hàm trong các
lớp mạng với các tùy chọn như sau:
Lớp 1: (Tính toán các đầu ra hàm liên thuộc) Môđun phần mềm hỗ trợ 2 dạng
hàm liên thuộc đầu vào chính là hàm liên thuộc dạng hình chuông (Bell) và hàm
Gauss. Số lượng các trọng số có thể điều chỉnh trong quá trình học của mỗi hàm
này tương ứng là 3 và 2 (ký hiệu từ w0 đến w2) như đẳng thức sau:
1
2
02
12
0
1 1( ) , ( ) exp
21
Bell Gaussw
x wA x B x
wx w
w
Lớp 2: (Tính vế đầu của các luật) Có thể lựa chọn các dạng t-norm và t-conorm
khác nhau cho tính toán như sau (mặc định t-norm=MIN và t-conorm=MAX)
t-norm:
MIN: MIN(a,b) = min(a,b)
Lukasiewicz LAND: LAND(a,b) = max(a+b1,0)
Probabilistic PAND: PAND(a,b) = ab
t-conorm:
MAX: MAX(a,b) = max(a,b)
Lukasiewicz LOR: LOR(a,b) = min(a+b,1)
Probabilistic POR: POR(a,b) = a+bab
Lớp 3: (Chuẩn hóa đầu ra vế đầu của các luật) Phép chuẩn hóa đầu ra các luật
được tính như sau:
1
, 1, ,ii N
jj
i N
Lớp 4: (Tính đầu ra của các luật) Đầu ra của mỗi luật được tính là tích của mức
tác động đã được chuẩn hóa của mỗi luật (theo cơ chế luật của Sugeno) với đầu ra
vế đầu của mỗi luật. Các trọng số trong lớp này có thể điều chỉnh trong quá trình
học.
Lớp 5: (Tính đầu ra của ANFIS) Mỗi đầu ra của ANFIS được tính trong lớp này
và là tổng của toàn bộ đầu ra của các luật.
Môđun phần mềm ANFIS được thiết kế cho dòng PLC SIMATIC S7-400 hoặc
WinAC RTX hiện cho phép thực hiện 8 đầu vào với mỗi đầu vào mờ có thể có nhiều
nhất tới 7 hàm liên thuộc (dạng Bell hoặc Gauss). Số lượng đầu ra lớn nhất cho phép
của hệ thống ANFIS là 1 đầu ra tuy nhiên có thể mở rộng khi cần.
- 157 -
Hình 15 : Các khối môđun phần mềm trên giao diện STEP7 V5