vỀ mỘt phƢƠng pháp tỔng hỢp hỆ ĐiỀu khiỂn mỜ · pdf filehình...

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ CÔNG THƢƠNG

VIỆN NGHIÊN CỨU ĐIỆN TỬ, TIN HỌC, TỰ ĐỘNG HÓA

NGUYỄN DUY HƢNG

VỀ MỘT PHƢƠNG PHÁP TỔNG HỢP HỆ

ĐIỀU KHIỂN MỜ DÙNG MẠNG NƠRON

ỨNG DỤNG TRONG CÔNG NGHIỆP

Chuyên ngành: Kỹ thuật Điện tử

Mã ngành: 62.52.70.01

LUẬN ÁN TIẾN SĨ KỸ THUẬT

HƯỚNG DẪN KHOA HỌC:

GS. TSKH. NGUYỄN XUÂN QUỲNH

HÀ NỘI – 2009

LỜI CẢM ƠN

Tác giả xin bày tỏ lời cảm ơn và lòng kính trọng đối với thầy hướng dẫn:

GS. TSKH. Nguyễn Xuân Quỳnh bởi những chỉ dẫn quý báu về phương pháp

luận và định hướng nghiên cứu để luận án được hoàn thành.

Tác giả cũng bày tỏ lời cảm ơn đối với Viện NC Điện tử, Tin học, Tự

động hóa – Bộ Công Thương đã tạo điều kiện thuận lợi về cơ sở vật chất và

thời gian để tác giả hoàn thành luận án.

Tác giả xin trân trọng cảm ơn các nhà khoa học và các đồng nghiệp đã

phản biện, lý luận, đóng góp các ý kiến xây dựng và trao đổi về các vấn đề lý

thuyết cũng như thực tiễn để luận án được hoàn thiện.

Cuối cùng tác giả xin bày tỏ lời cảm ơn sâu sắc nhất đến gia đình và người

thân đã luôn chia sẻ, gánh đỡ những khó khăn cũng như dành những tình cảm

và là nguồn cổ vũ, động viên tinh thần không thể thiếu đối với tác giả trong

suốt quá trình thực hiện luận án này.

LỜI CAM ĐOAN

Tôi xin cam đoan luận án này là công trình nghiên cứu khoa học của tôi và

không trùng lặp với bất kỳ công trình khoa học nào khác. Các số liệu trình

bày trong luận án đã được kiểm tra kỹ và phản ánh hoàn toàn trung thực. Các

kết quả nghiên cứu do tác giả đề xuất chưa từng được công bố trên bất kỳ tạp

chí nào đến thời điểm này ngoài những công trình của tác giả.

Hà Nội, ngày 15 tháng 9 năm 2009

Tác giả luận án

Nguyễn Duy Hưng

- i -

MỞ ĐẦU

Vấn đề điều khiển ổn định các hệ động học phi tuyến có phương trình động

học chuyển được về dạng tuyến tính hóa phản hồi trạng thái (state feedback

linearizable) hoặc tuyến tính hóa phản hồi vào-ra (input-output feedback

linearizable) có chứa các thành phần không rõ nhằm bám theo tín hiệu mẫu cho

trước với sai số bị chặn là mục tiêu giải quyết của luận án. Đây là vấn đề phức

tạp do đặc tính phi tuyến của động học cũng như của các thành phần chưa biết

trong phương trình động học của đối tượng. Các công trình nghiên cứu hiện nay

chủ yếu tìm cách giải quyết các vấn đề về điều khiển ổn định và bền vững hệ

phi tuyến có các thành phần bất định dựa trên điều khiển thích nghi, tuy nhiên

các phương pháp còn khá phức tạp và chưa chỉ rõ khả năng và mô hình áp dụng

trên các hệ thống điều khiển công nghiệp.

Nhằm đóng góp, đưa ra một phương pháp tổng hợp có khả năng áp dụng trên

các hệ thống điều khiển tự động tiên tiến hoạt động trong các phân cấp mạng

công nghiệp, tác giả trình bày một phương pháp tổng hợp mới dựa trên ý tưởng

thay thế ước lượng (không cần gần đúng như các phương pháp hiện nay) các

hàm trạng thái chưa biết bằng các hàm số đã biết, từ đó tìm cách xấp xỉ sai lệch

chung do phép thay thế ước lượng gây nên và thiết kế thành phần bù liên tục

nhằm triệt tiêu tác động này. Đặc điểm của phương pháp là sử dụng bộ xấp xỉ

vạn năng mờ nơron (xấp xỉ sai lệch nêu trên) làm thành phần bù trong luật điều

khiển phản hồi. Để xây dựng được một cơ sở toán học chứng minh cho phương

pháp đề xuất, luận án lần lượt phát triển phương pháp cho các trường hợp bù

tĩnh (luật điều khiển phản hồi tĩnh) và trường hợp bù động (luật điều khiển thích

nghi). Ngoài ra luận án còn phân tích và giải quyết một số vấn đề khác liên quan

đến các điều kiện giới hạn của quỹ đạo trạng thái và đầu vào của hệ phi tuyến

cũng như mở rộng phương pháp trong trường hợp hệ khả tuyến tính hóa phản

hồi chặt (strict-feedback linearizable system).

Ngoài cơ sở lý thuyết được chứng minh, luận án cũng phân tích và chỉ ra khả

năng áp dụng phương pháp trên các hệ thống điều khiển công nghiệp (PLC,

IPC) thông qua thử nghiệm trên một mô hình phần mềm ứng dụng được xây

dựng cho hệ thống SIMATIC S7 của hãng Siemens.

- ii -

Bố cục của luận án

Luận án chia thành 4 chương. Chương 1 trình bày tổng quan các vấn đề

trong điều khiển các hệ phi tuyến và ứng dụng, từ đó đưa ra mục tiêu và nội

dung nghiên cứu của luận án giới hạn vào các hệ khả tuyến tính hóa phản hồi có

chứa các thành phần không rõ trong bài toán bám theo tín hiệu mẫu bị chặn cho

trước.

Chương 2 trình bày chi tiết vấn đề cần giải quyết cũng như tổng quan các

nghiên cứu và các kết quả đã đạt được đến nay. Dựa trên phương pháp thiết kế

định nghĩa hệ sai số thỏa mãn giả thiết ban đầu, luận án xây dựng một số cơ sở

toán học (các định lý và bổ đề) để hình thành phương pháp mới theo hướng đơn

giản và có khả năng ứng dụng – được gọi là phương pháp thay thế ước lượng

hàm trạng thái – làm tiền đề phát triển các bộ điều khiển ổn định tĩnh và động

trong các chương tiếp theo.

Trong Chương 3, tác giả giới thiệu một số cơ sở toán học nhằm đưa ra luật

điều khiển tĩnh dùng bộ xấp xỉ vạn năng mờ nơron làm thành phần bù liên tục

để nghiệm của hệ sai số vòng kín bị chặn tới hạn đều (uniformly ultimately

bounded) cũng như trình bày phương pháp tính toán, xác định tham số điều

khiển và các điều kiện cần trong phương pháp để quỹ đạo trạng thái và tín hiệu

điều khiển bị chặn theo thiết kế. Ngoài ra Chương 3 còn tiếp tục mở rộng

phương pháp cho thiết kế bộ điều khiển ổn định tĩnh các hệ chuyển động hỗn

loạn (chaotic systems) có phương trình động học ở dạng tuyến tính hóa phản hồi

chặt.

Chương 4 tập trung vào giải quyết vấn đề bù động dựa trên luật điều khiển

tĩnh và sử dụng bộ xấp xỉ mờ nơron để xây dựng được bộ điều khiển thích nghi

ổn định cũng như trình bày mô hình phần mềm ứng dụng. Nhằm chứng minh

tính khả thi của phương pháp trong phát triển bộ điều khiển với thành phần bù

động, luận án sử dụng điều khiển thích nghi trực tiếp áp dụng phương pháp

chỉnh định để chỉnh định tham số của bộ xấp xỉ mờ nơron trong các trường

hợp bộ xấp xỉ tuyến tính và phi tuyến đối với tham số. Tác giả cũng đưa ra mô

hình phần mềm ứng dụng cho phép áp dụng các kiểu điều khiển tĩnh và động

trên các hệ thống điều khiển công nghiệp và phân tích khả năng ứng dụng trên

hệ thống tự động hóa SIMATIC S7 của hãng Siemens.

Phần cuối là kết luận và kiến nghị của luận án, tiếp theo sau là Phụ lục bao

gồm một số chứng minh và thiết kế.

- iii -

MỤC LỤC

CHƢƠNG 1: TỔNG QUAN ....................................................................................... 1

1.1. Đặt vấn đề ....................................................................................................... 1

1.2. Mục tiêu và nhiệm vụ nghiên cứu ................................................................ 9

CHƢƠNG 2: ĐIỀU KHIỂN ỔN ĐỊNH CÁC HỆ THỐNG KHẢ TUYẾN

TÍNH HÓA PHẢN HỒI BẰNG PHƢƠNG PHÁP THAY

THẾ ƢỚC LƢỢNG HÀM TRẠNG THÁI ...................................... 11

2.1. Giới thiệu chung ........................................................................................... 11

2.1.1. Đặt vấn đề ........................................................................................... 11

2.1.2. Biểu diễn các hệ thống khả tuyến tính hóa phản hồi .......................... 12

2.1.3. Vấn đề trong điều khiển ổn định các hệ khả tuyến tính hóa

phản hồi trạng thái ............................................................................. 15

2.2. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi

trạng thái bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái ......... 21

2.2.1. Cơ sở toán học của phương pháp ....................................................... 21

2.2.2. Tính bền vững của hệ vòng kín trong phương pháp ........................... 31

2.3. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi vào-

ra bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái ...................... 44

2.3.1. Bài toán điều khiển và cơ sở toán học ................................................ 44

2.3.2. Điều khiển ổn định bằng phương pháp thay thế ước lượng hàm

trạng thái ............................................................................................. 47

2.3.3. Tính bền vững của hệ vòng kín đối với thành phần không rõ

trong phương trình động học .............................................................. 51

2.4. Tổng hợp thiết kế bộ điều khiển tĩnh ổn định ........................................... 55

2.5. Kết luận ......................................................................................................... 56

CHƢƠNG 3: PHƢƠNG PHÁP THAY THẾ ƢỚC LƢỢNG HÀM

TRẠNG THÁI DÙNG BỘ XẤP XỈ MỜ NƠRON .......................... 58

3.1. Đặt vấn đề và cơ sở lý thuyết xây dựng phƣơng pháp ............................. 58

3.1.1. Giới thiệu chung.................................................................................. 58

3.1.2. Bộ xấp xỉ vạn năng .............................................................................. 59

3.1.3. Cơ sở toán học xây dựng các bộ xấp xỉ dùng hệ mờ và mạng

nơron ................................................................................................... 60

3.2. Thay thế ƣớc lƣợng hàm trạng thái ........................................................... 69

3.2.1. Cơ sở toán học của phương pháp ....................................................... 69

3.2.2. Xác định tham số bộ điều khiển .......................................................... 74

3.2.3. Mô phỏng điều khiển tay rôbốt ........................................................... 79

3.3. Thay thế ƣớc lƣợng hàm trạng thái mở rộng trong điều khiển ổn

định các hệ khả tuyến tính hóa phản hồi chặt ........................................... 84

- iv -

3.3.1. Phương pháp cuốn chiếu .................................................................... 84

3.3.2. Phương pháp thay thế ước lượng hàm trạng thái khi hệ chứa

các thành phần không rõ .................................................................... 85

3.4. Tổng hợp và kết luận ................................................................................... 93

CHƢƠNG 4: ĐIỀU KHIỂN THÍCH NGHI TRỰC TIẾP DÙNG HỆ MỜ

NƠRON TRONG PHƢƠNG PHÁP THAY THẾ ƢỚC

LƢỢNG HÀM TRẠNG THÁI ......................................................... 96

4.1. Giới thiệu chung ........................................................................................... 96

4.1.1. Sự cần thiết phát triển bộ điều khiển thích nghi ................................. 96

4.1.2. Vấn đề và cơ sở toán học xây dựng bộ điều khiển thích nghi

trực tiếp ............................................................................................... 98

4.2. Điều khiển mờ nơron thích nghi trực tiếp các hệ thống khả tuyến

tính hóa phản hồi ....................................................................................... 101

4.2.1. Hệ khả tuyến tính hóa phản hồi trạng thái ....................................... 101

4.2.2. Hệ khả tuyến tính hóa phản hồi vào-ra ............................................ 108

4.3. Tổng hợp thiết kế bộ điều khiển thích nghi trực tiếp ổn định ............... 110

4.4. Mô hình điều khiển thích nghi trên hệ thống điều khiển công

nghiệp .......................................................................................................... 111

4.4.1. Giới thiệu chung................................................................................ 111

4.4.2. Mô hình phần mềm ứng dụng và khả năng áp dụng trên hệ

thống điều khiển công nghiệp ........................................................... 113

4.5. Kết luận ....................................................................................................... 121

KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................. 122

CÁC CÔNG TRÌNH CÔNG BỐ LIÊN QUAN CỦA TÁC GIẢ......................... 124

TÀI LIỆU THAM KHẢO ....................................................................................... 125

PHỤ LỤC ............................................................................................................ 134

5.1. Một số thuật ngữ tiếng Anh ...................................................................... 134

5.2. Bổ đề 1 trang 23 .......................................................................................... 136

5.3. Bổ đề 3 trang 40 và kết quả (2-64) ........................................................... 139

5.4. Tuyến tính hóa phƣơng trình động lực học (3-23) ................................. 143

5.5. Chƣơng trình mô phỏng ví dụ điều khiển tay rôbốt trang 79 ............... 145

5.6. Bổ đề 6 trang 100 ........................................................................................ 152

5.7. Một số môđun phần mềm trong mô hình phần mềm ứng dụng ............ 155

- v -

MỤC LỤC HÌNH VẼ

Hình 1 : Hàm ε( , ) 1 sign( )bsig( , )E E E .......................................................... 33

Hình 2 : Hàm μ( , ) ε( , )E E E ............................................................................. 34

Hình 3 : Hàm Lambert w( )w( ) xx e x ....................................................................... 35

Hình 4 : Hàm μ ( , , ) sign( )bsig( , )E E E E E ........................................ 41

Hình 5 : Hàm ( , )mE và _ maxμ ( , ) μ ( , , )E E mE ................................... 41

Hình 6 : Hệ mờ MISO .................................................................................................. 63

Hình 7 : Mạng nơron 2 lớp ........................................................................................... 65

Hình 8 : Mô phỏng trong trường hợp không sử dụng thành phần bù .......................... 81

Hình 9 : Mô phỏng sử dụng thành phần bù tĩnh với 1 và 1.0 ...................... 82

Hình 10 : Mô phỏng sử dụng thành phần bù tĩnh với 1 và 0.8 .................... 83

Hình 11 : Điều khiển thích nghi trong hệ thống điều khiển công nghiệp .................. 114

Hình 12 : Sơ đồ đường đi dữ liệu trong mô hình điều khiển thích nghi .................... 115

Hình 13 : Các môđun phần mềm chính trong mô hình hệ thống NF ......................... 117

Hình 14 : Cấu trúc bộ đệm và dữ liệu quá trình cung cấp cho PC-Server ................. 155

Hình 15 : Các khối môđun phần mềm trên giao diện STEP7 V5 .............................. 157

- vi -

BẢNG CHỮ VIẾT TẮT

ABS Antilock Braking System

ANFIS Adaptive-Network-based Fuzzy Inference System

CNC Computerized Numerical Control

CSDL Cơ sở dữ liệu

DC Direct Current

DCS Distributed Control System

DVD Digital Video Disc

GUAS Globally Uniformly Asymtotically Stable

HD DVD High Density DVD

IE Industrial Ethernet

IEC International Electrotechnical Commission

IPC Industrial Personal Computer

ISPS Input-to-State Practically Stable

ISS Input-to-State Stable

KH&CN Khoa học và Công nghệ

LTI Linear Time Invariant

MIMO Multi-Input Multi-Output

MLP Multilayer Perceptron (Network)

NF/NFN Neuro-Fuzzy/Neuro-Fuzzy Network

PC Personal Computer

PID Proportional Integral Differential

PLC Programmable Logic Controller

R&D Research and Development

RBF Radial Basis Function Network

RBN Radial Basis Neural Network

SCADA Supervisory Control and Data Acquisition

SCL Structured Control Language

SISO Single-Input Single-Output

UAS Uniformly Asymtotically Stable

- 1 -

CHƢƠNG 1

TỔNG QUAN

1.1. Đặt vấn đề

Trong những thập kỷ gần đây, sự phát triển mạnh mẽ của khoa học và công

nghệ (KH&CN) trong các lĩnh vực công nghệ chế tạo, công nghệ vật liệu mới

và công nghệ thông tin đã cho ra đời các bộ vi xử lý mạnh, kích cỡ nhỏ gọn, tiêu

thụ điện năng thấp và giá thành hạ. Nhờ đó con người có thể tạo ra hàng loạt sản

phẩm công nghệ cao tinh vi và thông minh cũng như các sản phẩm công nghệ

cao này ngày càng trở nên phổ biến hơn và là một phần không thể thiếu trong sự

phát triển của xã hội văn minh hiện đại. Những thiết bị dân dụng công nghệ cao

như máy điện thoại di động, iPod, đầu đĩa HD DVD và Blu-ray hay máy giặt,

máy rửa bát, ... đã không còn xa lạ đối với nhiều người dân trong khi các thiết bị

khác như máy rút tiền tự động, máy bán hàng, bán vé tàu xe tự động, thiết bị trợ

giúp y tế, thiết bị dẫn đường, rôbốt giúp việc, ... đang trở nên gần gũi với con

người hơn bao giờ hết. Có thể nói sự phát triển của KH&CN đã và đang tạo ra

những thay đổi lớn trong xã hội loài người nhằm đáp ứng nhu cầu ngày một cao

của con người về môi trường và điều kiện sống.

Cùng với sự phát triển này là sự lớn mạnh của các ngành công nghiệp nhằm

khai thác và cung cấp các sản phẩm, dịch vụ có chất lượng tốt nhất với giá

thành hạ tới người tiêu dùng. Kinh nghiệm của các nước phát triển cho thấy việc

áp dụng KH&CN trong cải tiến, tạo ra các sản phẩm mới cũng như việc nâng

cao chất lượng, giảm chi phí sản xuất và hạ giá thành sản phẩm, dịch vụ có ý

nghĩa sống còn đối với mỗi nhà sản xuất nhưng ngược lại cũng đòi hỏi KH&CN

phải luôn đi trước một bước, đáp ứng được yêu cầu phát triển của nhà sản xuất

nói riêng và của xã hội nói chung. Mặc dù hiện nay thế giới đang phải đối mặt

với các vấn đề nghiêm trọng về khủng hoảng tài chính và tình trạng suy thoái

kinh tế toàn cầu ảnh hưởng lớn đến các hoạt động sản xuất, tuy nhiên đứng trên

quan điểm triết học thì bản chất của phát triển và phát triển là bản chất của xã

- 2 -

hội và do đó chúng ta hoàn toàn có thể tin tưởng rằng trong tương lai không xa,

việc các nền kinh tế được khôi phục và tiếp tục phát triển là tất yếu, trong đó

KH&CN vẫn là động lực để thúc đẩy phát triển kinh tế xã hội.

Tính phi tuyến và vai trò của lý thuyết điều khiển hiện đại

Trong sự phát triển của KH&CN, lý thuyết điều khiển hiện đại có vai trò hết

sức quan trọng để giải quyết nhiều vấn đề như nâng cao chất lượng điều khiển,

độ ổn định của hệ thống, tiết kiệm năng lượng hay như sử dụng máy móc thay

thế con người trong các ứng dụng điều khiển phức tạp hoặc nguy hại. Hàng loạt

các công trình nghiên cứu về điều khiển bền vững, điều khiển thích nghi, điều

khiển tối ưu hay điều khiển mờ và mạng nơron được công bố trong những năm

gần đây cho thấy sự quan tâm lớn của các nhà khoa học trên khắp thế giới và

những vấn đề, các hướng nghiên cứu phát triển trong lĩnh vực này ([35], [40],

[41], [42], [44], [46], [48], [52], [53], [54], [56], [57], [59], [60], [61], [62], [63],

[64], [65], [66], [67], [71], [73], [75], [77], [79], [80], [81], [82], [83], [92], [93],

[94], [95], [96], [98], [99], [100], [101], [102], [103], [104], [105], [106], [107],

[108]).

Như chúng ta đã biết, các hệ thống thực là các mô hình phi tuyến hết sức

phức tạp nên các phương pháp thiết kế kinh điển dựa trên điều khiển tuyến tính

trong nhiều trường hợp không đảm bảo được yêu cầu do đặc tính phi tuyến của

động học đối tượng điều khiển, đặc tuyến đầu đo hoặc cơ cấu chấp hành cũng

như tính chất không đầy đủ, chính xác của các mô hình thay thế (động học chưa

biết, nhiễu, điều kiện ban đầu).

Trong công nghiệp, đầu đo và cơ cấu chấp hành là những ví dụ rõ nhất về

tính phi tuyến. Tuy nhiên đặc tính phi tuyến còn thể hiện rõ trong các hệ cơ điện

(động cơ DC không chổi than, động cơ điện cảm ứng), tay máy, các hệ thống

trang bị trên ôtô (Power train, ABS, Precision Control), các quá trình hóa học,

sinh học và các hệ chuyển động hỗn loạn (chaos). Cần lưu ý rằng các hệ chuyển

động hỗn loạn là các hệ động học phi tuyến tiền định (deterministic) nghĩa là -

khác với ngẫu nhiên - động học tương lai của hệ thống được định nghĩa bởi các

- 3 -

điều kiện ban đầu nên hệ còn được xem là rất nhạy với các điều kiện ban đầu.

Ví dụ điển hình của hệ chuyển động hỗn loạn trong tự nhiên là thời tiết khí hậu

còn trong công nghiệp là các quá trình hóa học, sinh học, dòng chảy.

Ngoài ra một vấn đề khác cũng được đặt ra là rất nhiều hệ cần điều khiển có

các tham số không rõ (như hệ truyền động servo, rôbốt), có các tham số biến đổi

chậm (ví dụ như các tham số phụ thuộc vào nhiệt độ) hoặc có các tham số thay

đổi không dự đoán được (như các hệ thống năng lượng).

Để giải quyết các vấn đề phức tạp trên, lý thuyết điều khiển bền vững và

thích nghi được xem là các công cụ hữu hiệu. Thực tế hiện nay điều khiển thích

nghi đã được áp dụng thành công trong nhiều lĩnh vực như điều khiển rôbốt,

máy công cụ, CNC, điều khiển quá trình (hóa học, sinh học, ...), điều khiển

truyền động hay như điều khiển lái tàu, máy bay tự động. Tuy nhiên việc thiết

kế các bộ điều khiển phi tuyến nói chung và điều khiển thích nghi nói riêng là

không đơn giản và đặt ra hàng loạt vấn đề cần giải quyết như vấn đề về ổn định

hệ vòng kín, vấn đề điều khiển bám theo tín hiệu mẫu, vấn đề chống nhiễu hoặc

làm suy giảm nhiễu cũng như khi kết hợp các vấn đề trên với nhau. Giống như

trong điều khiển tuyến tính, phản hồi vẫn là chìa khóa để thiết kế các bộ điều

khiển phi tuyến nói chung. Về mặt lý thuyết, nếu toàn bộ các trạng thái của hệ

đo được khi đó ta nói đến điều khiển phản hồi trạng thái, còn trong trường hợp

chỉ có véctơ đầu ra đo được, điều khiển phản hồi đầu ra được áp dụng. Các

phương pháp thiết kế bộ điều khiển phi tuyến như tuyến tính hóa phản hồi

(feedback linearization), điều khiển tích phân (integral control), điều chỉnh định

trình khuếch đại (gain scheduling) là các phương pháp chủ đạo hiện nay ([32],

[45], [50], [51], [68]).

Điều khiển mờ nơron

Mặc dù các nghiên cứu về điều khiển phi tuyến đã có nhiều bước tiến quan

trọng, tuy nhiên vấn đề trở nên phức tạp hơn khi hệ phi tuyến có chứa các thành

phần không rõ làm mất ổn định hệ. Các đặc tính không rõ này có thể xuất phát

từ các nguồn như nhiễu đầu vào, động học chưa biết của đối tượng, sai số của

- 4 -

các mô hình thay thế hoặc tác động bên ngoài. Để điều khiển ổn định hệ, các

phương pháp thiết kế sử dụng điều khiển mờ nơron (hay còn gọi là điều khiển

mờ dùng mạng nơron) nhằm xấp xỉ các thành phần chưa biết từ đó tìm cách

giảm trừ tác động của các thành phần này để đạt được chất lượng điều khiển tốt

nhất. Việc áp dụng điều khiển mờ nơron còn cho phép phát triển các bộ điều

khiển thích nghi do tham số có thể chỉnh định được trực tuyến trong quá trình

hoạt động.

Cần lưu ý thêm rằng về mặt thuật ngữ, điều khiển mờ nơron trong luận án

còn được hiểu là điều khiển (phi tuyến) dựa trên cơ sở hệ mờ (fuzzy system),

mạng nơron nhân tạo (artificial neural network), mạng nơron mờ lai (hybrid

fuzzy neural network) hoặc hệ mờ nơron (neuro-fuzzy system).

Chúng ta biết rằng lý thuyết tập mờ đã được giới thiệu từ những năm 60 của

thế kỷ trước, tuy nhiên phải tới đầu thập kỷ 90 các hệ thống điều khiển mờ mới

thực sự được đưa vào ứng dụng trong đời sống và sản xuất. Hệ mờ đã chứng tỏ

được tính ưu việt so với các hệ điều khiển được dùng trước đó trong giải quyết

các bài toán như điều khiển quá trình sản xuất dựa trên kinh nghiệm vận hành,

điều khiển phi tuyến, điều khiển các thông số môi trường, các hệ thống dự báo

khí tượng, thủy văn. Trong công nghiệp, điều khiển mờ còn được nghiên cứu

kết hợp với điều khiển PID kinh điển nhằm tận dụng được các ưu điểm của cả

hai hệ thống, cho phép nâng cao chất lượng điều khiển ([21], [28], [34], [47],

[69], [86]). Hiện nay các hệ thống điều khiển mờ trong công nghiệp được phát

triển dựa trên cơ sở các môđun phần mềm cho các hệ thống thiết bị khả trình

(PLC), máy tính công nghiệp (IPC) cho phép giải quyết được nhiều bài toán

trước đây khó thực hiện được.

Mạng nơron nhân tạo thường được dùng để điều chỉnh các hàm liên thuộc

của các hệ mờ trong các thiết bị điều khiển. Mặc dù logic mờ có thể mã hóa trực

tiếp tri thức chuyên gia sử dụng các luật với các nhãn ngôn ngữ nhưng logic mờ

lại đòi hỏi nhiều thời gian thiết kế và chỉnh định các hàm liên thuộc để định

lượng các nhãn ngôn ngữ. Kỹ thuật luyện mạng nơron cho phép tự động hóa

- 5 -

quá trình này và giảm đáng kể thời gian, chi phí phát triển trong khi cải thiện

được tốc độ xử lý ([76], [86], [91]).

Mặc dù về lý thuyết các mạng nơron và các hệ thống mờ là tương đương

nhau theo nghĩa chúng có khả năng chuyển đổi được tuy nhiên trong thực tế mỗi

hệ thống lại có ưu và nhược điểm riêng. Đối với các mạng nơron, tri thức có thể

thu được tự động bởi thuật toán hồi quy nhưng quá trình luyện lại tương đối

chậm và việc phân tích mạng đã luyện là khó khăn. Ngoài ra ta cũng không có

khả năng rút ra được tri thức có dạng cấu trúc (các luật) từ mạng nơron đã luyện

cũng như không thể đưa thêm các thông tin đã biết vào trong mạng nơron để

đơn giản hóa quá trình luyện mạng.

Các hệ thống mờ tốt hơn theo nghĩa hoạt động của chúng có thể giải thích

được dựa trên các luật mờ và như vậy tốc độ thực thi của hệ có thể thay đổi

được bằng cách chỉnh định các luật. Tuy nhiên thông thường việc thu được tri

thức là khá khó khăn và việc phải chia biến đầu vào thành nhiều miền nên ứng

dụng của các hệ thống mờ bị giới hạn trong các vùng mà ở đó tri thức chuyên

gia phải có cũng như đa phần trong thực tế chỉ áp dụng được với số lượng các

biến đầu vào nhỏ.

Việc kết hợp các ưu điểm của hệ mờ và mạng nơron dẫn đến các hệ thống lai

với các cấu trúc được sử dụng rộng rãi là mạng nơron mờ lai (hybrid FNN) và

hệ mờ nơron (NFS). Trong lý thuyết điều khiển hiện đại, hệ mờ, mạng nơron và

sự kết hợp của hệ mờ với mạng nơron được coi là những công cụ đa năng để

giải quyết các vấn đề về phi tuyến và tính không chắc chắn trong điều khiển các

hệ phi tuyến nói chung.

Hệ thống điều khiển công nghiệp và xu hƣớng phát triển

Khái niệm hệ thống điều khiển công nghiệp thông thường được hiểu là các

hệ thống SCADA, các hệ điều khiển phân tán (DCS) và các thiết bị (logic) khả

trình (PLC). Về mặt thuật ngữ, SCADA là hệ thống máy tính phục vụ giám sát

và điều khiển một quá trình nào đó. Quá trình ở đây có thể là quá trình công

nghiệp (như chế tạo, sản xuất, tinh chế có chế độ hoạt động liên tục, gián đoạn

- 6 -

hay có tính chất theo mẻ hoặc lặp lại), cơ sở hạ tầng (như xử lý, cấp nước; xử lý,

thu hồi nước thải; các đường ống dẫn dầu, khí ga; phân phối và truyền dẫn điện;

các hệ thống thông tin) hoặc cơ sở tiện nghi (như tòa nhà, cảng hàng không, hải

cảng, trạm vũ trụ). Trong khi đó, DCS để chỉ các hệ điều khiển có các thành

phần điều khiển nằm phân tán (không tập trung) trong toàn hệ thống, trong đó

mỗi hệ con được điều khiển bởi một hoặc nhiều thành phần điều khiển. Trong

công nghiệp các hệ DCS giám sát và điều khiển các thiết bị phân tán được dùng

trong các nhà máy điện, lọc dầu, hóa chất, xử lý nước, nước thải, ... Một dạng

hệ điều khiển công nghiệp khác là PLC dùng trong tự động hóa các quá trình cơ

điện và các thiết bị điều khiển máy móc. PLC là một dạng máy tính số, so với

máy tính thông thường PLC được thiết kế để hoạt động ở dải nhiệt độ rộng hơn,

khả năng chống nhiễu cao, chịu được rung động và va đập tốt cũng như có tính

năng xử lý thời gian thực.

Tuy nhiên việc phân chia các hệ điều khiển công nghiệp nêu trên chỉ có ý

nghĩa tương đối mà không có ranh giới rõ ràng. Ngày nay nhiều hệ PLC có thể

thực thi nhiệm vụ của một hệ DCS nhỏ trong khi các hệ DCS lại có thể có các

hệ con hoạt động như các PLC thực thụ. Sự phát triển của KH&CN trong những

năm gần đây cho thấy xu hướng tích hợp các hệ thống điều khiển trên lại với

nhau để tạo ra các hệ thống mạnh, có tính mở và sử dụng các ngôn ngữ lập trình

bậc cao. PAC (Process Automation Control) là một ví dụ của xu hướng phát

triển này.

Trong hệ thống điều khiển công nghiệp, hệ thống mạng công nghiệp có một

vai trò quan trọng hiện tại cũng như trong tương lai. Nhờ sự phát triển nhanh

chóng của công nghệ thông tin và yêu cầu ngày càng cao của tự động hóa công

nghiệp mà việc sử dụng các mạng công nghiệp ngày một rộng rãi hơn. Tuy

nhiên khác với mạng thông tin, mạng công nghiệp phải đáp ứng được các yêu

cầu về tốc độ truyền thích hợp với giá thành tốt cũng như phải đảm bảo hoạt

động ổn định, tin cậy trong môi trường công nghiệp.

Hệ thống mạng công nghiệp thường được sử dụng theo mô hình phân cấp

tùy thuộc vào yêu cầu trao đổi dữ liệu giữa các thiết bị trong mạng (như đáp ứng

- 7 -

thời gian thực, độ lớn dữ liệu, dịch vụ truyền thông). Theo đó cấp trên cùng (gọi

là cấp nhà máy) được sử dụng để kết nối giữa các máy tính trong hệ thống quản

lý và điều hành hoạt động sản xuất của nhà máy (thông thường đòi hỏi thời gian

đáp ứng dữ liệu dưới 1s). Trong khi đó, cấp trung gian (cell/control level) dùng

để kết nối các bộ điều khiển (phân tán) với nhau cho thực thi các nhiệm vụ điều

khiển chung nên yêu cầu thời gian đáp ứng dữ liệu phải nhanh hơn (dưới

100ms). Dưới cùng là cấp trường (field level) thực hiện việc kết nối thiết bị điều

khiển với các I/O phân tán (đầu đo, cơ cấu chấp hành), do đó đáp ứng phải

nhanh hơn cả để đảm bảo bộ điều khiển xử lý được các I/O thời gian thực

(thông thường thời gian đáp ứng dưới 10ms).

Trao đổi dữ liệu trong hệ thống mạng công nghiệp được thực hiện thông qua

bus trường (fieldbus). Bus trường là tên gọi chung của họ các giao thức mạng

công nghiệp dùng trong các ứng dụng điều khiển phân tán thời gian thực và đã

được tiêu chuẩn hóa (tiêu chuẩn IEC 61158). Một số chuẩn bus trường có thể kể

ra như Foundation Fieldbus (H1, HSE), Profibus, ProfiNet IO, ControlNet, P-

Net, Interbus và WorldFIP. Tuy nhiên các chuẩn bus trường không tương thích

với nhau do được phát triển bởi các hãng riêng biệt nên khó khăn cho người sử

dụng lựa chọn công nghệ và thiết bị. Ngày nay cùng với việc Ethernet hỗ trợ

phần lớn các giao thức mạng và được dùng rộng rãi trong mạng thông tin dữ

liệu, Ethernet công nghiệp đang là sự lựa chọn phát triển số một của nhiều hãng

tự động hóa. Ethernet công nghiệp không chỉ sử dụng trong các phân cấp trên

mà đang có xu thế hướng tới cả phân cấp dưới (cấp trường). Có thể nói công

nghệ Ethernet hứa hẹn sẽ mang đến sự thay đổi lớn trong lĩnh vực điều khiển

công nghiệp ([39], [84]).

Tình hình nghiên cứu hiện nay trên thế giới và tại Việt Nam

Trong những năm gần đây vấn đề về thiết kế bộ điều khiển thích nghi cho

các hệ thống động học phi tuyến luôn là một trong các chủ đề chính trên các tạp

chí chuyên ngành về điều khiển, tự động hóa trên thế giới và ngày càng thu hút

được nhiều nhà khoa học tham gia nghiên cứu. Đã có nhiều bước tiến, kết quả

- 8 -

đạt được cả về mặt lý thuyết và thực tiễn ứng dụng ([41], [44], [45], [46], [50],

[51], [57], [59], [66], [97], [100]), đặc biệt theo hướng sử dụng hệ mờ và/hoặc

mạng nơron để xấp xỉ phương trình động học của đối tượng phi tuyến và dùng

các phương pháp tuyến tính hóa phản hồi trạng thái hoặc phản hồi đầu ra của hệ

thống ([35], [40], [45], [52], [54], [56], [57], [75], [94], [95], [98], [101], [102],

[106]) để thiết kế bộ điều khiển ổn định tĩnh. Để bộ điều khiển có đặc tính thích

nghi với những sai lệch không rõ khi hoạt động trực tuyến, các bộ điều khiển

được thiết kế sử dụng cấu trúc mạng nơron hoặc logic mờ với các luật để chỉnh

định các trọng số trong quá trình làm việc. Đây cũng là phương pháp thường

dùng để thiết kế các bộ điều khiển thích nghi trong các ứng dụng công nghiệp.

Đối với trong nước, các nghiên cứu về điều khiển mờ, mạng nơron nhân tạo

và hệ thống mờ nơron cũng đã được nhiều cơ sở KHCN tập trung nghiên cứu

trong nhiều năm trở lại đây ([2], [3], [4], [5], [6], [7], [8], [9], [10], [11], [12],

[13], [14], [15], [16], [17], [18], [20], [23], [24], [26], [27], [29], [30], [31], [36],

[78]) và đã có không ít công trình hướng tới việc ứng dụng được công bố nhưng

nhìn chung các kết quả đạt được còn khá khiêm tốn. Một số cơ sở như Viện NC

Điện tử, Tin học, Tự động hóa (VIELINA), Đại học Bách khoa Hà Nội, Đại học

Bách khoa thành phố Hồ Chí Minh, Phân viện Tự động hóa - Viện công nghệ

thông tin, Viện Tự động hóa Kỹ thuật quân sự, Học viện Công nghệ Bưu chính

Viễn thông, ... là những đơn vị đã có nhiều năm nghiên cứu về điều khiển mờ

nơron và đã có một số kết quả nhất định, tuy nhiên các nghiên cứu sâu rộng hơn

nhằm ứng dụng công nghệ này trong các hệ thống tự động hóa công nghiệp tiên

tiến còn là những bước đi ban đầu.

Vấn đề nghiên cứu và đóng góp chính của luận án

Những vấn đề còn tồn tại hiện nay cả về lý thuyết và thực tiễn ứng dụng

trong điều khiển các hệ phi tuyến có chứa các thành phần không rõ đòi hỏi

những nghiên cứu, phát triển tiếp nhằm giải quyết các vấn đề đã nêu. Trong

khuôn khổ của luận án, tác giả chọn hướng nghiên cứu áp dụng hệ mờ và mạng

nơron trong điều khiển các hệ động học phi tuyến tuy nhiên chỉ giới hạn vào các

- 9 -

hệ phi tuyến có phương trình động học chuyển được về dạng tuyến tính hóa

phản hồi có chứa các thành phần không rõ do đây là một trong những dạng điển

hình trong công nghiệp. Ngoài ra đây cũng là vấn đề chưa được giải quyết đầy

đủ trên thế giới ([40], [50], [52], [53], [54], [56], [57], [60], [61], [62], [63],

[72], [73], [75], [81], [92], [94], [95], [98], [104], [105]) cũng như có rất ít công

trình nghiên cứu trong nước được công bố ([14], [81]). Chương 2 sẽ trình bày

và phân tích rõ hơn những hạn chế trong các phương pháp giải hiện nay và ý

tưởng hình thành phương pháp mới nhằm tránh phải giải quyết các vấn đề trên.

Như vậy đóng góp chính của luận án là một phương pháp mới (gọi là

phương pháp thay thế ước lượng hàm trạng thái) cho phép tổng hợp bộ điều

khiển ổn định tĩnh và động các hệ thống khả tuyến tính hóa phản hồi trạng thái

và khả tuyến tính hóa phản hồi vào-ra có các thành phần không rõ trong phương

trình động học cho lớp bài toán điều khiển bám tín hiệu mẫu cho trước. Phương

pháp mới đưa ra cách thức phân tích được ảnh hưởng của phép thay thế lên hệ

sai số nhằm tránh phải giải quyết một số vấn đề thường gặp trong các phương

pháp giải hiện nay. Ngoài ra phương pháp có khả năng áp dụng được trên các hệ

thống điều khiển công nghiệp tiên tiến với PLC đủ mạnh hoặc sử dụng Soft-

PLC (như WinAC RTX của hãng Siemens).

1.2. Mục tiêu và nhiệm vụ nghiên cứu

Mục tiêu

Xây dựng phương pháp thay thế ước lượng hàm trạng thái trên cơ sở áp dụng

hệ mờ và mạng nơron cho phép tổng hợp bộ điều khiển ổn định tĩnh và động

(thích nghi) các hệ khả tuyến tính hóa phản hồi (feedback linearizable system)

có chứa các thành phần không rõ trong phương trình động học để giải quyết bài

toán điều khiển bám theo tín hiệu mẫu cho trước và có khả năng áp dụng trên

các hệ thống điều khiển công nghiệp.

Nhiệm vụ nghiên cứu

Với mục tiêu trên, nhiệm vụ nghiên cứu đặt ra của luận án như sau:

- 10 -

- Nghiên cứu các vấn đề trong điều khiển ổn định các hệ khả tuyến tính hóa

phản hồi có chứa các thành phần không rõ trong bài toán bám theo tín hiệu

mẫu cho trước, tập trung vào các hệ khả tuyến tính hóa phản hồi trạng thái

và khả tuyến tính hóa phản hồi vào-ra.

- Xây dựng cơ sở toán học của phương pháp tổng hợp mới nhằm giải quyết và

tránh được một số vấn đề trong các phương pháp hiện nay.

- Xây dựng luật điều khiển tĩnh và động trong phương pháp mới.

- Xây dựng mô hình phần mềm ứng dụng trên một hệ thống điều khiển công

nghiệp điển hình nhằm phân tích khả năng áp dụng của phương pháp.

Phƣơng pháp nghiên cứu

Xuất phát từ những vấn đề của các phương pháp giải và các hướng nghiên

cứu tiếp theo hiện nay, luận án chọn phương pháp nghiên cứu áp dụng hệ mờ và

mạng nơron trong điều khiển để giải quyết vấn đề phi tuyến và không rõ trong

phương trình động học của hệ. Liên quan đến vấn đề ổn định và tính bền vững

của hệ vòng kín, luận án lựa chọn một số cơ sở toán học để phân tích, xây dựng

và phát triển cơ sở toán học của phương pháp. Các cơ sở toán học chính gồm

phương pháp lập hệ sai số, phân tích ổn định hệ theo tiêu chuẩn Lyapunov, lý

thuyết xấp xỉ vạn năng mờ nơron và điều khiển thích nghi trực tiếp. Để thực

hiện ý tưởng của phương pháp (thay thế ước lượng các hàm trạng thái không

phải xấp xỉ gần đúng như nhiều phương pháp hiện nay), tác giả vận dụng một số

kết quả nghiên cứu đã được công bố gần đây và sử dụng các cơ sở toán học nêu

trên để từng bước chứng minh cách giải quyết các vấn đề trong phương pháp

tổng hợp nhằm đạt được mục tiêu và nội dung nghiên cứu đề ra. Ngoài ra một

số cơ sở toán học quan trọng xây dựng trong luận án cũng được tác giả lập trình

mô phỏng trên Matlab để kiểm tra lại tính chính xác của các kết quả đạt được.

- 11 -

CHƢƠNG 2

ĐIỀU KHIỂN ỔN ĐỊNH CÁC HỆ THỐNG KHẢ TUYẾN TÍNH

HÓA PHẢN HỒI BẰNG PHƯƠNG PHÁP THAY THẾ ƯỚC

LƯỢNG HÀM TRẠNG THÁI

2.1. Giới thiệu chung

2.1.1. Đặt vấn đề

Một trong những vấn đề cơ bản trong lý thuyết điều khiển là nghiên cứu sử

dụng phản hồi để làm thay đổi động học của đối tượng nhằm đạt được đặc tính

theo ý muốn. Đối với hệ tuyến tính bất biến theo thời gian (LTI) vấn đề này

được gọi là đặt điểm cực, còn trong trường hợp tổng quát của hệ phi tuyến vấn

đề được gọi là tuyến tính hóa phản hồi (feedback linearization).

Tuyến tính hóa phản hồi trong hệ phi tuyến là tìm cách (nếu có) thay đổi tọa

độ không gian trạng thái qua phép biến đổi vi đồng phôi (diffeomorphism) toàn

cục và sử dụng luật phản hồi tĩnh để biểu diễn hệ thống trong không gian trạng

thái mới, tuyến tính và điều khiển được ([32], [50], [51]). Tuy nhiên trong nhiều

trường hợp phép biến đổi vi đồng phôi chỉ xác định trong lân cận của điểm cần

xét, khi đó phép biến đổi được gọi là cục bộ.

Các phương pháp tuyến tính hóa phản hồi chủ yếu đưa về dạng tuyến tính

hóa phản hồi trạng thái hay còn gọi là tuyến tính hóa đầu vào-trạng thái hoặc

tuyến tính hóa đầy đủ trạng thái, trong đó toàn bộ phương trình trạng thái được

tuyến tính hóa và dạng tuyến tính hóa phản hồi vào-ra hay còn gọi là tuyến tính

hóa không đầy đủ trạng thái, trong đó chỉ có ánh xạ đầu vào - đầu ra và một

phần phương trình trạng thái được tuyến tính hóa.

Trong chương này của luận án, các nghiên cứu tập trung vào phương pháp

điều khiển ổn định các hệ phi tuyến đưa được về dạng tuyến tính hóa phản hồi

trạng thái có dạng (2-6) và mở rộng đối với các hệ khả tuyến tính hóa phản hồi

- 12 -

vào-ra dạng (2-3) có các đặc tính không rõ trong phương trình động học do đây

là một trong những bài toán điển hình trong công nghiệp.

2.1.2. Biểu diễn các hệ thống khả tuyến tính hóa phản hồi

Xét hệ phi tuyến SISO có phương trình động học và đầu ra biểu diễn được ở

dạng sau:

( ) ( )

( )

u

y h

ξ ξξ f ξ g ξ

ξ

(2-1)

với 1( ) , , , ,T n d

n n dt ξ là vectơ trạng thái, 0d ; ( )u t ,

( )y t tương ứng là đầu vào điều khiển và đầu ra của đối tượng;

( ) n dξf ξ , ( ) n dξg ξ , ( )h ξ là các hàm phi tuyến đối với đối số ξ và

khả vi với bậc bất kỳ (hàm trơn).

Giả thiết hệ (2-1) có ξ 0 là điểm cân bằng của ( )ξf ξ , hay ( ) ξf 0 0 và

( ) 0h 0 ; ngoài ra hệ có bậc tương đối (relative degree) bằng n tại ξ 0 . Khi

đó tồn tại lân cận n dU của ξ 0 và phép đổi tọa độ

1( ) T ( ), ,T ( )T

n dT ξ ξ ξ định nghĩa trên U với nx , dq , ( ) T 0 0

và:

1

2

1

T ( ) ( )

T ( ) ( )

T ( ) ( )

T ( )( ) 0; 1, ,

nn

i

h

L h

L h

i n n d

ξ

ξ

f

f

ξ

ξ ξ

ξ ξ

ξ ξ

ξg ξ

ξ

(2-2)

để biểu diễn hệ trong không gian trạng thái mới ở dạng tuyến tính hóa phản hồi

vào-ra chuẩn tắc như sau:

- 13 -

1 2

1

1

( , )

( , ) ( , )

n n

n

x x

x x

x f g u

y x

q π x q

x q x q

(2-3)

với

1 1

2 2

1

( )T

( )T

T ( )nn n

hx

L hx

x L h

ξ

ξ

f

f

ξ

ξ

x

ξ

,

1 1T ( )

T ( )

n

d n d

q

q

ξ

q

ξ

,

1( , )

( , )

( , )d

x q

π x q

x q

và ( , ) ( )nf L hξf

x q ξ , 1( , ) ( )ng L L hξ ξg fx q ξ trong đó 1

xξ T

q.

Nếu ký hiệu

0 1 0 0 0

0 0 1 0 0

0 0 0 0 1

0 0 0 0 0

A

,

0

0

1

b

,

1

0

0

c

với : n nA ,

: 1nb , : 1nc thì phương trình (2-3) có thể viết dưới dạng:

( , )

( , ) ( , )

.T

f g u

y

q π x q

x Ax b x q x q

xc

q

(2-4)

Chọn luật phản hồi 1( , ) ( , )u g f x q x q , hệ vòng kín sẽ có dạng:

( , )

.Ty

q π x q

x Ax b

xc

q

(2-5)

- 14 -

Phương trình (2-5) cho thấy hệ được phân tích thành hai hệ con gồm một hệ

con tuyến tính có chiều n , biểu diễn quan hệ vào-ra (còn gọi là hệ con ngoại

động học [50]) và một hệ con (phi tuyến) có chiều d nhưng không có tác động

tới đầu ra của hệ (hệ con nội động học). Ngoài ra hệ con tuyến tính nêu trên (hệ

con ngoại động học) là điều khiển được và quan sát được, có hàm truyền là

( ) 1 nH s s hay có điểm cực bội bậc n tại 0s .

Phương trình động học của hệ con (phi tuyến) trên (hệ con nội động học) khi

x 0 là ( , )q π 0 q được gọi là động học không (zero dynamics, [32], [33]) của

hệ thống. Động học không cho biết đầu ra của hệ (2-4) luôn bằng 0 khi các

trạng thái ban đầu của hệ là 0( , ) ( , )x q 0 q hay x 0 nhưng 0 (0)q q có thể

chọn tùy ý và đầu vào của hệ phải đặt bằng 1( ) , ( ) , ( )u t g t f t 0 q 0 q với

( )tq là nghiệm của phương trình động học không với điều kiện ban đầu

0(0) q q . Ngoài ra có thể nhận thấy với mỗi tập hợp điều kiện ban đầu

0( , ) ( , )x q 0 q luôn tồn tại một đầu vào duy nhất giữ cho đầu ra luôn bằng 0.

Như vậy động học không còn có thể xác định được bằng cách giữ cho đầu ra

luôn bằng 0 bởi đầu vào thích hợp mà không nhất thiết phải biến đổi hệ sang

dạng chuẩn tắc.

Đặc tính ổn định của động học không đóng vai trò quan trọng trong phương

pháp tuyến tính hóa phản hồi vào-ra. Trường hợp 0d hay bậc tương đối bằng

với bậc của hệ phi tuyến, khi đó phép tuyến tính hóa là đầy đủ nghĩa là toàn bộ

quan hệ vào-ra được tuyến tính hóa và do vậy vấn đề bền vững của hệ đã được

giải quyết. Tuy nhiên trong trường hợp 0d thì chỉ hệ con ngoại động học

được tuyến tính hóa, hệ con nội động học là phi tuyến và không quan sát được

từ đầu ra. Khi đó đặc tính ổn định của hệ con nội động học được xác định từ

động học không.

Giống như trường hợp hệ tuyến tính có toàn bộ các điểm cực và các điểm

không nằm bên nửa mặt phẳng phức trái gọi là hệ pha tối thiểu (minimum-phase

system, [70]), hệ phi tuyến (2-1) có động học không có điểm cân bằng q 0 là

- 15 -

ổn định tiệm cận cũng được gọi là hệ pha tối thiểu và có thể dùng phản hồi trạng

thái để ổn định tiệm cận hệ ([32]). Nếu động học không có điểm cân bằng

không ổn định tiệm cận thì phương pháp tuyến tính hóa vào-ra không có ý nghĩa

thực tiễn do không đưa ra được luật điều khiển thực. Mục 2.3 sẽ phân tích vấn

đề này thông qua một phương pháp thiết kế để ổn định hệ trong trường hợp hệ

có chứa thành phần không rõ.

Lưu ý là trường hợp 0d thì hệ còn có thể biểu diễn được cả dưới dạng

tuyến tính hóa phản hồi trạng thái được phân tích trong mục 2.1.3 dưới đây.

2.1.3. Vấn đề trong điều khiển ổn định các hệ khả tuyến tính hóa phản hồi

trạng thái

Xét hệ phi tuyến SISO biểu diễn được dưới dạng phương trình trạng thái và

đầu ra sau:

1 2

1

1

( ) ( )

n n

n

x x

x x

x f g u

y x

x x

(2-6)

với ( 1)1 2 1 1 1, , , , , ,

TT n nnx x x x x x

x là vectơ trạng thái giả thiết đo

được của hệ phi tuyến; ( )u t , ( )y t tương ứng là các đầu vào điều khiển

và đầu ra của đối tượng; ( )f x , ( )g x là các hàm số thực liên tục bị chặn

thỏa mãn các điều kiện sẽ được giả thiết sau trong mỗi trường hợp. Hệ (2-6) còn

có thể biểu diễn ở các dạng:

( ) ( 1) ( 1)1 1 1 11 1 1

1

( ) ( 1) ( 1)

( , , , ) ( , , , )

( , , , ) ( , , , )

n n n

n n n

x f x x x g x x x u

y x

y f y y y g y y y u

(2-7)

hoặc

- 16 -

1

( ) ( )x f g u

y x

x A b x x với

0

0 0

IA , 0, ,0,1

Tb . (2-8)

Rõ ràng để hệ (2-6) điều khiển được ta cần ( ) 0g x với mọi x trong miền

hợp lệ n x . Ngoài ra do ( )g x liên tục nên sau đây ta luôn giả thiết rằng

( ) 0g x với mọi xx mà không làm mất tính tổng quát do trường hợp

( ) 0g x ta chỉ cần đảo dấu tín hiệu đầu vào u .

Bài toán đặt ra ở đây là cần tìm luật điều khiển phản hồi bị chặn ( )u v z với

z là vectơ chứa các tín hiệu đo được thích hợp đối với phương pháp thiết kế sao

cho đầu ra của hệ luôn bám theo được tín hiệu mẫu ( )r t cho trước bị chặn hay

véctơ trạng thái x của hệ phải bám theo được véctơ tín hiệu mẫu

( 1)1 2, , , , , ,

TT nnr r r r r r

r với 1 1/i i

ir d r dt , 1..i n . Ngoài ra

cũng giả thiết rằng tín hiệu mẫu có đạo hàm đến bậc n đã biết và véctơ tín hiệu

mẫu bị chặn bởi Mrr .

Sau đây là tổng hợp một số phương pháp giải hiện nay và vấn đề của các

phương pháp giải này trong 2 trường hợp. Trường hợp 1 xem xét với giả thiết

toàn bộ phương trình động học của hệ cần phân tích đã biết trong khi Trường

hợp 2 sẽ phân tích hệ phi tuyến với giả thiết có các thành phần không rõ trong

phương trình động học của hệ và đây cũng chính là vấn đề cần giải quyết của

luận án. Mặc dù các vấn đề trong Trường hợp 1 đã được giải quyết và không

nằm trong nội dung phát triển mới của luận án, tuy nhiên để thuận tiện cho việc

trình bày và theo dõi, luận án xem xét vấn đề trong cả hai trường hợp.

Trƣờng hợp 1

Trường hợp ( )f x , ( )g x đã biết hoàn toàn, khi đó bằng phương pháp tuyến

tính hóa phản hồi kinh điển ([50], [51], [57]), đặt ( 1)

1 1 1, , ,T

ne e e

e x r

là sai số bám với ( 1), , ,T

nr r r

r thì động học của sai số bám là:

- 17 -

( )( ) ( ) nf g u r e x r Ae b x x (2-9)

Sử dụng luật điều khiển phản hồi:

1 ( )( ) ( ) n Tu g f r x x k e (2-10)

với 1 2, , ,Tnk k kk được chọn sao cho 1

1n n

nx k x k là đa thức

Hurwitz (có toàn bộ các nghiệm nằm bên nửa trái của mặt phẳng phức) dẫn đến

( )T T ke Ae bk e A bk e A e .

Chọn hàm Lyapunov TV e Pe với P là ma trận đối xứng xác định dương

thì ( )T T T TV k ke Pe e Pe e PA A P e . Rõ ràng là cần chọn P sao cho

T k kPA A P Q với Q cũng là ma trận đối xứng xác định dương để hệ vòng

kín ổn định và do đó lim 0t

e .

Trƣờng hợp 2

Trường hợp 2 có thể xem xét dưới nhiều điều kiện giả thiết khác nhau. Trước

tiên xét trường hợp giả thiết ( )f x đã biết và ( )g x là hàm phi tuyến chưa biết

hoặc có chứa thành phần chưa biết thỏa mãn ( ) 0Lg g x với xx , khi đó

phương pháp giải thông thường là thiết kế mặt trượt và luật điều khiển phản hồi

trạng thái để quỹ đạo trạng thái của hệ luôn chuyển động bám xung quanh mặt

trượt này ([50], [51]). Ngoài ra một khi trạng thái của hệ nằm trên mặt trượt thì

cần giữ để quỹ đạo trạng thái không thoát ra khỏi mặt trượt đó. Đối với bài toán

bám ở đây, ta cần thiết phải ổn định gốc của hệ phương trình sai số sau:

1 2

1

( )( ) ( )

n n

nn

e e

e e

e f g u r

x x

(2-11)

Nếu coi ne là đầu vào điều khiển của hệ 1n phương trình đầu tiên trong

(2-11) thì gốc của hệ được ổn định bởi luật điều khiển tuyến tính:

- 18 -

1 1 1 1n n ne k e k e

với 1 1.. nk k được chọn sao cho đa thức 11 1

n nnx k x k là Hurwitz. Khi

đó thiết kế mặt trượt là 1 1 1 1 0n n ns k e k e e thì:

( )1 2 1 ( ) ( ) n

n ns k e k e f g u r x x .

Bằng luật điều khiển phản hồi:

1 ( )1 2 1( ) ( ) n

n nu g k e k e f r v x x

với ( )g x là mô hình thay thế của ( )g x ta có thể biểu diễn s ở dạng:

( ) ( , , )s g v t v x x (2-12)

Giả thiết:

0( , , )

( )( )

t vv

g

xx

x, 00 1 (2-13)

với mọi ( , , ) 0,t v D x , nD trong đó ( ) x và 0 đã biết, khi đó

chọn ( )sign( )v s x với

1 0

sign( ) 0 0

1 0

s

s s

s

, 00

( )( )

1

xx , 0 0 và

hàm Lyapunov 21

2V s thì đạo hàm của V theo quỹ đạo động học (2-12) của

mặt trượt sẽ là:

0 0

0 00

0 0

( ) ( )sign( ) ( , , )

(1 )

(1 )1

(1 ) L

V ss sg s s t v

g s g s g s

g s

g s

x x x

Rõ ràng là với mô hình thay thế đáp ứng điều kiện giả thiết (2-13) nêu trên

thì sai số bám sẽ luôn tiến đến 0 khi t .

▲

- 19 -

Vấn đề trở nên phức tạp hơn trong trường hợp đặc tính phi tuyến của cả

( )f x và ( )g x đều chưa biết hoặc có chứa thành phần không rõ. Khi đó các

phương pháp giải chủ yếu theo hướng điều khiển thích nghi ([40], [50], [52],

[53], [54], [56], [57], [60], [61], [62], [63], [72], [73], [75], [81], [92], [94], [95],

[98], [104], [105]) có thể tổng hợp như dưới đây.

1. Tìm cách thay thế ( )g x bằng mô hình xấp xỉ gần đúng ( , )g x θ với θ là

véctơ tham số hay các trọng số ước lượng của mô hình.

Để đảm bảo mô hình gần đúng luôn đáp ứng ( , ) 0g x θ với xx , một

số phương pháp giải quyết như sau:

a) Chọn tham số khởi tạo ban đầu (0)θ gần nhất với giá trị tối ưu bằng

phương pháp luyện ngoại tuyến trước khi đưa vào hoạt động ([92]).

b) Sử dụng các thuật toán quy chiếu (projection) với một số giả thiết đã biết

khác về hệ cho phép xác định θ để ( , ) 0g x θ ([72], [73]).

c) Sử dụng mạng nơron hoặc hệ mờ để xấp xỉ đảo của ( )g x nếu Hg g với

Hg đã biết ([56]).

d) Thiết kế bộ điều khiển thích nghi có chứa thành phần điều khiển theo chế

độ trượt để giữ cho biên độ của tín hiệu điều khiển bị chặn ([50]).

e) Xây dựng hàm Lyapunov sửa đổi cho phép cấu trúc bộ điều khiển thích

nghi dựa trên hàm Lyapunov để tránh trường hợp 0 nêu trên ([81], [104]).

2. Đưa ra mô hình thay thế hỗn hợp các hàm ( )f x , ( )g x :

a) Sử dụng các mô hình cục bộ và xấp xỉ tuyến tính đối với tham số cũng

như dùng phương pháp quy chiếu tham số (parameter projection) để giải

quyết vấn đề ( ) 0g x với ( )g x là ước lượng của ( )g x trong mô hình

hỗn hợp ([53], [60], [61], [62]).

b) Dùng mô hình điều khiển mờ thích nghi bền vững giải quyết trường hợp

0 nêu trên thay cho sử dụng phương pháp quy chiếu tham số và chuyển

đổi liên tục tín hiệu đầu vào điều khiển ([54])

- 20 -

3. Thiết kế mô hình xấp xỉ tín hiệu điều khiển phản hồi (2-10) dùng mạng

nơron hoặc hệ mờ ([57]).

▲

Đặc điểm chung của các phương pháp giải hiện nay là sử dụng các mô hình

thay thế để xấp xỉ các thành phần không biết (với các điều kiện giả thiết về giới

hạn khác nhau) và phải giải quyết vấn đề ( , ) 0g x θ trong mô hình thay thế.

Ngoài ra do mô hình xấp xỉ có nhiều đầu vào (các trạng thái, sai số, tín hiệu

mẫu và các đạo hàm) nên phải xác định được tham số ban đầu để luật chỉnh

định tham số hoạt động đúng cũng như phần lớn đều giả thiết rằng mô hình xấp

xỉ đảm bảo sai số trong miền làm việc của quỹ đạo trạng thái. Mặc dù một số

kết quả nghiên cứu công bố gần đây ([53], [54], [71], [93], [103], [105]) đã giải

quyết được vấn đề xác định tham số và đơn giản hơn do luật điều khiển phản

hồi luôn đảm bảo không xảy ra ( ) 0g x tuy nhiên chỉ giới hạn trong các điều

kiện của tác giả. Về mặt ứng dụng, các tác giả không chỉ rõ mô hình thực tế nên

chưa đánh giá được tính khả thi của các phương pháp đề xuất khi áp dụng trên

thiết bị điều khiển công nghiệp.

Với những vấn đề đã nêu, luận án sau đây đi vào nghiên cứu, đề xuất một

phương pháp tiếp cận mới dựa trên ý tưởng thay thế ước lượng (không cần gần

đúng) các hàm trạng thái chưa biết và sử dụng hệ mờ và mạng nơron để giải

quyết vấn đề bù sai lệch do phép thay thế ước lượng gây nên. Phương pháp tiếp

cận mới nhằm đơn giản hóa việc thiết kế mô hình thay thế nhờ tránh phải giải

quyết một số vấn đề thường gặp trong các phương pháp nêu trên. Ngoài ra luận

án cũng xây dựng mô hình phần mềm ứng dụng nhằm thử nghiệm, đánh giá khả

năng áp dụng phương pháp trên các hệ thống điều khiển công nghiệp. Các cơ sở

lý thuyết để xây dựng phương pháp mới được tác giả sử dụng bao gồm phương

pháp phân tích dựa trên hệ sai số, điều khiển phi tuyến ổn định theo tiêu chuẩn

Lyapunov, lý thuyết xấp xỉ vạn năng mờ nơron và điều khiển thích nghi trực

tiếp được tác giả trích dẫn chủ yếu trong các tài liệu [32], [50], [51], [57], [66]

và [68].

- 21 -

2.2. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi trạng

thái bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái

2.2.1. Cơ sở toán học của phương pháp

Phương pháp thay thế ước lượng hàm trạng thái trong luận án được đề xuất

nhằm giải quyết bài toán đã nêu trên cơ sở phân tích tính bền vững của hệ vòng

kín cũng như theo hướng phát triển các bộ điều khiển thích nghi cho các ứng

dụng công nghiệp. Trước khi đi sâu vào cơ sở toán học của phương pháp, ta

xem xét một phương pháp tiếp cận khác ([57]) dựa trên định nghĩa hệ sai số

thỏa mãn Giả thiết 1 dưới đây có thể áp dụng cho các hệ phi tuyến SISO tổng

quát ở dạng:

( ) ( )

( )

u

y h

x f x g x

x

(2-14)

với 1 2( ) , , ,T n

nt x x x x là vectơ trạng thái; ( )u t , ( )y t là các đầu

vào điều khiển và đầu ra của đối tượng; ( ) nf x , ( ) ng x , ( )h x là các

hàm phi tuyến đối với đối số x của chúng và khả vi với bậc bất kỳ (hàm trơn).

Giả thiết 1: Hệ sai số ( , )tE x được định nghĩa sao cho E 0 thì ( ) ( )y t r t và

( , )t xx E với mọi t , : x là hàm số bị chặn với E bị chặn và

( , )t u x không giảm dần (nondecrescent) đối với u khi t không đổi.

Nếu Giả thiết 1 được thỏa mãn thì khi hệ sai số bị chặn cũng có nghĩa là quỹ

đạo trạng thái của hệ cũng bị chặn. Mặt khác nếu tồn tại tín hiệu ( )t E với

mọi t thì ( , )t xx do ( , )t x không giảm dần đối với . Như vậy

với Giả thiết 1, hệ sai số không chỉ là phép đo chất lượng của hệ vòng kín mà

còn cho biết đặc tính bị chặn đối với các trạng thái của hệ.

Ngoài ra với phương trình động học (2-14) và hệ sai số được chọn thỏa mãn

Giả thiết 1, ta có thể sử dụng động học của hệ thống để tính động học hệ sai số

như sau:

- 22 -

( , ) ( ) ( ) ( , ) ( )t u t ut t

E E E EE x x f x g x α x β x

x x . (2-15)

Phần tiếp theo cho thấy để giải quyết bài toán của hệ (2-6), ta luôn lập được

hệ sai số thích hợp thỏa mãn Giả thiết 1 mà không cần phải đưa thêm bất cứ

điều kiện ràng buộc nào khác.

Trƣờng hợp 1

Áp dụng phương pháp lập hệ sai số ([57]) trong giải bài toán của hệ (2-6)

trong trường hợp ( )f x , ( )g x xác định dẫn đến phương pháp giải sau đây. Định

nghĩa hệ sai số:

( 1)( , ) ,1

nT T TE E E nE t x r

x k e k e k d (2-16)

với ,1T TE

k k , 1 1, ,TE nk k k ,

( 2)

1 2 1, , ,Τ

nE nx r x r x r

d ,

e x r và 1 21 1

n nns k s k là Hurwitz. Lưu ý rằng E ở đây là đại

lượng vô hướng thay vì dùng vectơ e như phương pháp giải trình bày trong

phần trước. Giả sử hệ sai số (2-16) thỏa mãn Giả thiết 1, khi đó động học của hệ

sai số có dạng:

( )( ) ( ) ( , ) ( )T nE EE f r g u t u k d x x x x (2-17)

với ( )( , ) ( )T nE Et f r x k d x và ( ) ( )g x x .

Chọn hàm Lyapunov 21

2V E và sử dụng luật điều khiển:

1( ) ( , )u t E x x (2-18)

với 0 sẽ cho kết quả 2( , ) ( ) 2V E t u E V x x nên 0E là

điểm cân bằng ổn định theo hàm mũ (exponentially stable) của hệ sai số. Bổ đề

dưới đây (tổng hợp từ các kết quả trong [57]) cho thấy hệ sai số được định nghĩa

như trên (điểm cân bằng ổn định) thì cũng thỏa mãn Giả thiết 1.

- 23 -

Bổ đề 1 : Hệ sai số định nghĩa bởi (2-16) cho bài toán bám của hệ (2-6) thỏa

mãn Giả thiết 1.

Chứng minh bổ đề trên được trình bày trong Phụ lục mục 5.2 trang 136.

▲

Có thể thấy trong trường hợp này, các luật điều khiển phản hồi (2-10) và

(2-18) trong hai phương pháp về cơ bản là giống nhau do thành phần phản hồi

trong cả hai phương pháp đều tuyến tính. Tuy nhiên với phương pháp thiết kế

dựa trên hệ sai số có thể đưa thành phần phản hồi phi tuyến vào hệ sai số để

nâng tính bền vững của hệ vòng kín như sẽ thấy ở phần sau của luận án này.

Trƣờng hợp 2

Trước tiên ta xem lại Bổ đề 2.1 trong tài liệu [57] dùng để phân tích tính bị

chặn của hệ sai số được phát biểu như sau: Nếu ( , ) : nV t E là hàm

số xác định dương và 1 2V m V m với 1 0m , 2 0m là các hằng số bị chặn

thì 12 2

1 1

( , ) (0)m tm m

V t V em m

E với mọi 0t .

Chứng minh bổ đề bằng cách gọi 1 2m m và chọn (0) (0) 0V

thì 12 2

1 1

( ) (0)m tm m

t V em m

, mặt khác từ V (hay V luôn giảm nhanh

hơn hoặc bằng so với ) và (0) (0)V suy ra ( , ) ( )V t tE với 0t .

Lưu ý là bổ đề trên cũng cho biết 2 1V m m khi t và nếu

( , )V t E E với K E (hàm thuộc lớp K ) thì 12 1lim

tm m

E .

▲

Trường hợp ( )f x , ( )g x có chứa các thành phần không rõ, giả thiết rằng từ

số liệu đo và hiểu biết về hệ thống ta có thể tìm được các hàm số

( ) ( ) ( )ff f x x x , ( ) ( ) ( )gg g x x x để tính gần đúng được nx như sau:

- 24 -

( ) ( ) ( ) ( ) ( ) ( )

( , )

n f g

n dxn

x f g u u

x u

x x z x x z

x

(2-19)

với dxn n n f gx x u là sai số giữa tín hiệu xấp xỉ nx với tín hiệu nx

và dxn W , 0W cho trước với mọi x , u trong miền hợp lệ n x và

u . Tiếp tục định nghĩa hệ sai số như (2-16) trong Trường hợp 1, khi đó

đạo hàm của hệ sai số theo thời gian sẽ là:

( )

( )

( ) ( ) ( )

T nE E n

T nE E n dxn

T nE E dxn

E x r

x r

r f g u

k d

k d

k d x x

hay với ký hiệu ( )( , ) ( )T nE Et r f x k d x , ( ) ( )g x x thì:

( , ) ( ) ( , )dxnE t u u x x x (2-20)

Sử dụng luật điều khiển phản hồi:

1

1 ( )

( ) ( ) ( , )

( ) ( )T nE E

u t E

g r f E

z x x

x k d x (2-21)

với 0 và ,T Tt

z x là véctơ đo được thì phương trình động học của hệ sai

số trở thành:

( , )dxnE E u x . (2-22)

Lưu ý là z trong luật điều khiển phản hồi (2-21) chỉ chứa t xuất hiện rõ

trong trường hợp ( )r t có đạo hàm là hàm số có chứa t .

Chọn hàm Lyapunov xác định dương 21

2( )V E E và tính đạo hàm của V

theo (2-22) ta được:

- 25 -

2

212

22

2

1

2 2

2

dxnV EE E E

V E W E

WV W E

WV

(2-23)

Áp dụng Bổ đề 2.1 ([57]) với 1m , 2

22

Wm

dẫn đến V bị chặn và do đó

E cũng bị chặn:

2 2 2

2 2 2(0) 1 (0)

2 2 2

t t tH

W W WV V e e V e V

2

2

21 (0) .t t

HW

E e E e E

(2-24)

Kết quả (2-23) cho thấy 0V khi 2

22

WV

và từ (2-24):

2

22

1

lim2

Ht

m WV V

m

, 2

1

2lim Ht

m WE E

m

(2-25)

do vậy nếu đủ lớn thì có thể xác định HE trong chế độ xác lập nhỏ tùy ý.

Ngoài ra nếu phép xấp xỉ nx càng chính xác bao nhiêu (sai số xấp xỉ W càng

nhỏ) trong miền hợp lệ của x và u thì E hay giới hạn HE khi t của hệ

sai số càng nhỏ bấy nhiêu.

Biết rằng 0V khi 2

22

W WV V V E

hay 2

1

2m WE E

m ,

do đó ta còn có thể suy luận như sau: 0V V E E E V .

Như vậy nếu 0V V E với 0 (0)V V là V ban đầu tại 0t thì

0 V V E với mọi 0t do V là hàm số xác định dương nên không thể

- 26 -

tăng lớn hơn V E . Trường hợp 0V V E thì rõ ràng 0V cho đến khi

V V E . Tóm lại kết quả (2-24) còn có thể viết như sau:

0

0

0 max ,

max ,

V V V E

E E E

(2-26)

với mọi 0t , 0 (0)E E là giá trị ban đầu của hệ sai số tại 0t và 2

0 01

2V E

.

▲

Các kết quả trên cho thấy với luật điều khiển phản hồi (2-21) chất lượng của

hệ vòng kín chỉ phụ thuộc vào sai số xấp xỉ nx và không nhất thiết phải xác

định được chính xác các hàm ( )f x , ( )g x có chứa các thành phần không rõ. Nói

cách khác thay vì phải xấp xỉ gần đúng từng hàm ( )f x , ( )g x với sai số cần

thiết hoặc sử dụng các mô hình xấp xỉ như trong nhiều phương pháp khác ([40],

[52], [53], [54], [56], [60], [61], [62], [63], [72], [73], [75], [92], [94], [95], [98],

[103], [104], [105]), ta có thể xấp xỉ ( )f x , ( )g x với sai số tùy ý miễn sao sai số

xấp xỉ nx thỏa mãn dxn W trong miền hợp lệ của xx và uu (lưu ý

là điều kiện sai số xấp xỉ không cần đáp ứng ngoài miền hợp lệ).

Ngoài ra với mỗi 0W cho trước và với :u Mu u u u , 0Mu

luôn tồn tại các cặp hàm trạng thái ( )f x , ( )g x liên tục bị chặn đáp ứng điều

kiện xấp xỉ ví dụ như trường hợp các hàm thay thế thỏa mãn:

gM

W

u , 0 f g MW u (2-27)

do khi đó dxn f g f g Mu u W .

Tuy nhiên ngay cả trường hợp không xác định được cặp hàm thay thế thỏa

mãn hay cặp hàm thay thế không đáp ứng điều kiện sai số xấp xỉ (2-27) nêu trên

ta vẫn có thể áp dụng được phương pháp nếu như bù được sai số xấp xỉ do phép

- 27 -

ước lượng các thành phần không rõ gây nên. Trong thực tế có nhiều cách để xác

định cặp hàm thay thế từ số liệu đã biết về hệ thống ví dụ như ta có thể định

nghĩa trước hàm ( )f x và ( ) 0g x dựa trên các thành phần đã biết và tìm cách

bù sai số xấp xỉ do các thành phần không rõ gây nên thông qua luật điều khiển

phản hồi sao cho đạo hàm của V theo (2-22) thỏa mãn (2-23) hay

2

2

WV V

trong miền hợp lệ của x và u . Như vậy bài toán điều khiển để

hệ vòng kín ổn định trong trường hợp này trở thành bài toán xấp xỉ nx với độ

chính xác cần thiết và vấn đề đảm bảo các điều kiện về trạng thái và đầu vào

trong miền hợp lệ. Phương pháp giải quyết các vấn đề này sẽ được trình bày chi

tiết trong Chương 3.

Do đặc điểm của phương pháp là để xấp xỉ nx không nhất thiết phải xấp xỉ

riêng từng hàm trạng thái với sai số cần thiết mà có thể thay thế bằng cặp hàm

ước lượng như đã phân tích mà trong luận án này phương pháp được gọi là

phương pháp thay thế ước lượng hàm trạng thái. Phần sau của luận án sẽ phân

tích phương pháp thay thế ước lượng các hàm trạng thái sử dụng điều khiển mờ

nơron nhằm thích nghi với các thay đổi không rõ trong hệ sai số.

▲

Tính chất bị chặn tới hạn đều của hệ sai số

Giả sử tìm được cặp hàm trạng thái thay thế để điều kiện xấp xỉ nx được

thỏa mãn, khi đó tiếp tục biến đổi biểu thức:

1 1 1

1 1 1 1 1 11 1 1

1

1 1 1 1 1 1 2 11

( ) ( )

( ) , , ,

0

n n nT TE E i i i i i i i i

i i i

n

i i i ni

T

T

E

E k x r k x r k e k e

k k e k e k k k k

k d k e

e

k e η ek

ta có thể biểu diễn lại luật điều khiển phản hồi (2-21) như sau:

- 28 -

1 ( )( ) ( )n Tu u g r f x η e x (2-28)

với 1 1 2 1, , ,T

nk k k k η .

Do ( )( ) ( ) n Tnx f g u r x x η e nên:

( )1 1 1

1

,

,1 , ,

( )

dxn n n

Tn

TnT

dxn

u x x

e

e e e

e

x

η e

η

(2-29)

hay dxn cũng là hàm của 1e . Mặt khác từ phép chọn 1 1, , ,1Tnk k k để đa

thức 1 21 1

n nns k s k là Hurwitz nên các số hạng của

1,1 , , ,1Tn

η cũng lập thành đa thức Hurwitz:

11 2

11 1 2 1

11 2

( ) ( )

( )( ).

n nn

n nn

n

s s s

k k k s k s s

s k k s s

(2-30)

Biểu diễn quan hệ (2-29) qua phép biến đổi Laplace:

1 11 2

11 2

1( ) ( )

( )

1( )

( )( )

n

dxnn

E s E sk k s s

ss k k s s

(2-31)

với 1( )E s , ( )E s và ( )dxn s tương ứng là biến đổi Laplace của 1( , )e t x , ( , )E t x

và 1( )dxn e suy ra:

- 29 -

11 1

11 1

1 1lim lim lim

1lim lim

1lim lim

dxnt t t

dxnt t

dxnt t

e Ek k

We

k k

WE

(2-32)

hay với luật điều khiển phản hồi (2-28), giới hạn sai số bám đầu ra 1e y r

trong chế độ xác lập bị chặn phụ thuộc vào các giá trị 1, , k W được chọn

trong thiết kế. Lưu ý là 1 ik s chính là giá trị tuyệt đối của tích toàn bộ các

nghiệm của đa thức Hurwitz (2-30). Ngoài ra do ( )n Tnx r η e nên điều kiện

xấp xỉ còn có thể viết dưới dạng:

( )n Tdxn nr x W η e (2-33)

Như vậy trong bài toán bám của hệ phi tuyến (2-6) ở trường hợp 2, bằng

phương pháp lập hệ sai số (2-16) và sử dụng luật điều khiển phản hồi (2-21),

nếu ta coi E là trạng thái của hệ sai số thì kết hợp các kết quả trên, dẫn đến phát

biểu của Định lý 1 dưới đây về tính chất bị chặn của nghiệm của phương trình

động học hệ sai số (2-20) trong phương pháp thay thế ước lượng hàm trạng thái.

Định lý 1 : Phương trình động học hệ sai số (2-20) có nghiệm bị chặn tới hạn

đều (uniformly ultimately bounded) theo (2-26) và giới hạn sai số bám đầu ra

trong chế độ xác lập theo (2-32), nếu xác định được các hàm số liên tục, bị

chặn ( ) 0g x và ( )f x để với luật điều khiển phản hồi tĩnh (2-28) thì điều kiện:

( )n Tnr x W η e (2-34)

luôn thỏa mãn với mọi n xx , uu và 0W cho trước.

- 30 -

Chứng minh

Theo định lý về điều kiện bị chặn tới hạn đều ([51], [57]), việc chứng minh

nghiệm của phương trình động học (2-20) với luật điều khiển phản hồi (2-28) bị

chặn tới hạn đều (hay bị chặn cuối đồng đều) thực chất là phải chỉ ra được các

hàm số 1 2( ), ( )E E K (hàm lớp K ) và 3( )E K (hàm lớp K ) xác

định trên 0, thỏa mãn:

1 2

3

( ) ( ) ( )

( ) ( )

E V E E

VV E E E

E

(2-35)

với E R và ( )V E là hàm số khả vi liên tục xác định trên E R .

Chọn 21

1 2 2( ) ( ) ( )E E V E E là các hàm lớp K , ta cần tìm

3( )E K thỏa mãn (2-35) khi E R . Từ (2-23) có thể biến đổi tiếp như sau:

2 2

2

1

( ) (1 )2 2

( ) (1 )2

W WV E V V V

WE V

với 0 1 nên nếu chọn 3 1( ) ( )E E thì

2

3( ) ( ) (1 )2

WV E E V

. Để 3( ) ( )V E E cần thiết

2

22(1 )

WV

hay khi 1

WE R

.

Rõ ràng các hàm 1 2 3( ), ( ), ( ), ( )E E E V E được chọn như trên luôn

thỏa mãn điều kiện (2-35) nên Định lý 1 đã được chứng minh.

▲

- 31 -

2.2.2. Tính bền vững của hệ vòng kín trong phương pháp

Nâng cao tính bền vững của hệ vòng kín

Phương pháp thay thế ước lượng hàm trạng thái nêu trên xuất phát từ giả

thiết thành phần sai số dxn W bị chặn với 0W cho trước, từ đó sử dụng

luật điều khiển phản hồi trạng thái tĩnh (2-28) để 2

2

WV V

và do đó hệ

vòng kín có sai số E cũng bị chặn theo (2-26). Ngoài ra quan hệ (2-32) cho

thấy luôn tồn tại sai số đầu ra có quan hệ tỷ lệ thuận với sai số xấp xỉ trong chế

độ xác lập. Nhằm tìm cách bù trừ ảnh hưởng của sai số xấp xỉ, sau đây tiếp tục

phân tích phương pháp theo hướng nâng cao tính bền vững của hệ vòng kín để

giải quyết vấn đề này.

Kết quả dưới đây cho thấy nếu tồn tại hàm 1Φ( , ) : nu x thỏa mãn

điều kiện ( , )dxn u x với xx , uu thì về lý thuyết có thể loại trừ

hoàn toàn ảnh hưởng của sai số xấp xỉ dxn trong phương trình động học sai số

(2-20) bằng cách đưa thêm thành phần bù cu vào luật điều khiển phản hồi, hay

cu u u với 1 ( )( ) ( )n Tu g r f x η e x , 1 1 2 1, , ,Tnk k k k η

là thành phần phản hồi theo (2-28).

Từ phương trình động học của hệ sai số:

( , ) ( )

( , ) ( ) ( )

( )

c dxn

c dxn

c dxn

E t u u

t u u

E u

x x

x x x

x

(2-36)

trong đó ( ) ( )( , ) ( ) ( )T n T n

E Et r f E r f x k d x η e x , ( ) ( )g x x dẫn

đến đạo hàm của hàm Lyapunov theo (2-36) sẽ là:

2 ( ) c dxnV EE E E u E x

- 32 -

Rõ ràng nếu xác định được cu để 0V với 0E thì hệ vòng kín sẽ ổn

định và loại trừ được giới hạn sai số bám đầu ra 1limt

e

trong (2-32). Từ bất

đẳng thức trên suy ra Φ( , )sign( )

( )c

E u Eu

x

x

với và

1 0

sign( ) 0 0

1 0

E

E E

E

luôn đáp ứng được yêu cầu này do:

2

2

2

( ) Φ( , )

( ) Φ sign( ) Φ

( ) 0 0.

cV E E u E u

E E E E

E E

x x

(2-37)

Khi đó với thành phần bù cu nêu trên, luật phản hồi (2-28) trở thành:

1 ( )( ) ( ) Φ( , )sign( )n Tcu u u g r f E u E x η e x x (2-38)

hay khi 0 có thể biểu diễn gọn lại dưới dạng:

1 ( )( ) ( ) Φ( , )sign( )n Tu g r f u E x η e x x (2-39)

Tuy nhiên kết quả (2-39) có chứa thành phần sign( )E không liên tục nên nếu

Φ( , )ux là hàm liên tục thì có thể thay thế gần đúng sign( )E bằng một hàm liên

tục để tín hiệu điều khiển là liên tục. Sau đây đề xuất và phân tích sử dụng hàm

xíchma lưỡng cực:

2 1

bsig( , ) 11 1

E

E E

eE

e e

(2-40)

trong phương pháp với 0 là hệ số góc tại điểm uốn 0E của hàm. Do

sign( ) lim bsig( , )E E

nên với thành phần bù:

Φ( , )

bsig( , )( )

cu

u E

x

x

(2-41)

luật điều khiển phản hồi sẽ liên tục và có dạng:

- 33 -

1 ( )( ) ( ) Φ( , )bsig( , )n Tu g r f u E x η e x x . (2-42)

Nếu ký hiệu:

ε( , ) 1 sign( )bsig( , )

μ( , ) ε( , )

E E E

E E E

(2-43)

thì 0 ε 1 (Hình 1) và:

2

2

2

Φ sign( )bsig( , ) Φ

Φ ε( , )

Φμ( , )

V E E E E E

E E E

E E

(2-44)

Hình 1 : Hàm ε( , ) 1 sign( )bsig( , )E E E

Biết rằng hàm xíchma lưỡng cực bsig( , ) bsig( , )E E là hàm lẻ nên

suy ra ε( , )E là hàm chẵn không âm và do đó μ( , ) μ( , )E E cũng là hàm

chẵn không âm (Hình 2). Như vậy để tìm cực đại của hàm μ( , )E ta chỉ cần xét

hàm μ ( , ) μ( , )E E với 0,E và 0 để tìm (các) điểm cực trị của

hàm μ , từ đó suy ra (các) điểm cực trị còn lại của μ( , )E đối xứng qua trục

tọa độ tung và xác định giá trị cực đại.

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

E

( ,E) = 1 - sign(E)bsig( ,E)

= 5

= 10

= 100

- 34 -

Hình 2 : Hàm μ( , ) ε( , )E E E

Từ μ ( , ) 1 bsig( , ) 21

E

E

EeE E E

e

, tính đạo hàm của μ theo E ta

được

2

2μ ( , ) 1

1

EE

E

d eE E e

dEe

hay hàm μ có cực trị (cũng là

cực đại) tại mE E là nghiệm của phương trình:

1 EE e . (2-45)

Để giải phương trình (2-45), ta dùng Bổ đề 2 sau:

Bổ đề 2 : Nghiệm của phương trình xx b a với 0a là

w ln( )

ln( )

ba ax b

a

với w( )x là hàm Lambert và ln( )a là logarit cơ số tự

nhiên của a .

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 10

0.02

0.04

0.06

0.08

0.1

0.12

E

(,E) = E. (,E)

= 5

= 10

= 100

0.1114

0.0557

0.0056

- 35 -

Có thể chứng minh Bổ đề 2 từ định nghĩa hàm Lambert ([85]) với

ln( )bx a a và lưu ý 1/ln( )ae a .

▲

Áp dụng Bổ đề 2 với 1/a e , 1b thu được nghiệm của phương trình

(2-45) là 1 w(1 / )mE e với w(1/ )e là hàm Lambert của 1/ e (Hình 3) và:

1 w(1/ )

1 w(1/ )

1 w(1/ ) 1.2785

0.5569μ ( , ) 2 2

11

m

m

m

E em

m mE e

eE

E e eE E

ee

(2-46)

Hình 3 : Hàm Lambert w( )w( ) xx e x

Như vậy μ( , )E nhận giá trị cực đại tại các điểm mE E . Ví dụ giá trị cực

đại của hàm μ( , )E trong các trường hợp minh họa trên Hình 2 tương ứng sẽ là

μ(5, 0.2557) 0.1114 , μ(10, 0.1278) 0.0557 và μ(100, 0.0128) 0.0056 .

Thay (2-46) vào (2-44) thu được:

2 0.5569

Φμ( , ) 2 Φ.mV E E V

(2-47)

-1 0 1 2 3 4 5-1

-0.5

0

0.5

1

1.5

x

w

(x)

w(x)ew(x)=x

e1/e

0.2785

-1/e

Lambert W Function

- 36 -

Kết quả (2-47) cho thấy 0V khi 0.5569

Φ2

V

hay 0.5569

ΦE

và áp

dụng Bổ đề 2.1 ([57]) với 1 2m , 20.5569

m

dẫn đến:

2 2 2

2 2 2 *

* *

0.5569Φ 1 (0)

2

0.5569Φ 1 (0)

0.5569lim lim .

t t

t tH

Ht t

V e V e

E e E e E

E E

(2-48)

Tóm lại, các kết quả trên cho thấy nếu xác định được hàm Φ( , )ux sao cho

2( , ) Φ( , )0.5569

dxn u u E

x x với xx , uu thì hệ vòng kín sẽ ổn

định; nếu 2Φ( , )0.5569

u E

x thì nghiệm của hệ sai số luôn bị chặn theo (2-48).

▲

Trường hợp Φ( , )u Wx , luật điều khiển phản hồi và giới hạn nghiệm của hệ

sai số sẽ là:

1 ( )

* *

( ) ( ) bsig( , )

0.5569lim .

n T

Ht

u g r f W E

E E W

x η e x

(2-49)

Khi đó từ các kết quả (2-25), (2-49) dẫn đến:

*

* *

0.5569

0.5569lim H

t H

E E

E E

E E W

(2-50)

- 37 -

hay với luật điều khiển phản hồi (2-49) có chứa thành phần bù bị chặn, giới hạn

của hệ sai số trong chế độ xác lập luôn nhỏ hơn so với trường hợp không có

thành phần bù ( *E E ) nếu hệ số góc được chọn thỏa mãn:

0.5569

0.5569W E

. (2-51)

Tính bền vững của hệ vòng kín đối với đặc tính không rõ trong hệ sai số

Các kết quả (2-48), (2-50) cho thấy bằng cách đưa thêm thành phần bù phản

hồi trong hệ vòng kín có thể bù trừ ảnh hưởng của sai số xấp xỉ do phép ước

lượng gây nên. Như vậy phương pháp này cũng có thể áp dụng đối với thành

phần không rõ xuất hiện trong phương trình động học của hệ sai số có dạng:

( , ) ( ) ( , )

( , ) ( ) ( ) ( , )

u dxn

dxn u

E t u t

t u t

x x x

x x x x

(2-52)

với ( , )u t x là thành phần không rõ.

Trường hợp thành phần không rõ ( , ) 0u t x , các kết quả (2-23), (2-47) ở

trên cho thấy luôn tồn tại luật điều khiển phản hồi u u để hệ vòng kín ổn định

có nghiệm bị chặn nhờ phương pháp phân tích sử dụng hàm Lyapunov xác định

dương 212

V E để đạo hàm theo quỹ đạo động học (2-52) của hệ sai số thỏa

mãn 1 2V m V m với 1 20, 0m m .

Giả thiết rằng ( , ) ( )u t x x với 0 là hằng số chưa biết bị chặn và

( ) : n x là hàm liên tục không âm bị chặn đã biết, khi đó sử dụng luật

điều khiển phản hồi trạng thái:

u u u (2-53)

với u là thành phần bù dẫn đến:

( , ) ( ) ( ) ( , )dxn uE t u t u x x x x

- 38 -

1 2

1 2

dxn u

u

V EE E Eu E E u

m V m E u

m V m E Eu

(2-54)

Kết quả (2-54) cho thấy nếu biết trước , thì tương tự như phương pháp đã

trình bày ở trên, với thành phần bù ( )sign( )u E x có thể loại trừ hoàn

toàn tác động của thành phần không rõ ( , )u t x do:

1 2

21 2

1 2

sign( )

1 sign ( )

.

V m V m E E E

m V m E E

m V m

(2-55)

Trường hợp sử dụng thành phần bù liên tục:

( )bsig( , )u E x (2-56)

với 0 là hệ số góc của hàm bsig( , )E tại 0E , đạo hàm:

1 2

1 2

1 2

sign( ) bsig( , )

1 sign( )bsig( , )

μ( , )

V m V m E E E E

m V m E E E

m V m E

(2-57)

với μ( , ) ε( , )E E E như (2-43). Áp dụng kết quả (2-46) cho thấy:

1 2

1 2

μ( , )

0.5569

mV m V m E

m V m

(2-58)

hay nếu chọn càng lớn thì có thể giảm được tương ứng mức độ tác động của

thành phần không rõ.

Tuy nhiên do không biết nên bằng phương pháp sử dụng thành phần bù

2Vu

E

với 0 như đề xuất trong [57] dẫn đến:

- 39 -

2 2 21 2

2 2

1 2

2

1 2

2 4

.4

V m V m E E

m V m E

m V m

(2-59)

Kết quả (2-59) cho biết có thể giảm tác động của thành phần không rõ bằng

cách cho nhận giá trị lớn, tuy nhiên phương pháp này khó áp dụng trong thực

tế vì thành phần bù tạo dao động lớn trong tín hiệu điều khiển khi E đổi dấu.

Sau đây luận án đề xuất sử dụng thành phần bù có dạng:

bsig( , )u E (2-60)

như đã trình bày trong phần trên, khi đó:

1 2

1 2

1 2

sign( ) bsig( , )

sign( )bsig( , ) .

V m V m E Eu

m V m E E E E

m V m E E E

Đặt 0

và:

μ ( , , ) sign( )bsig( , )E E E E E (2-61)

dẫn đến 0.5569

μ ( , , ) (ε 1) ( 1)E E E E

hay nếu tìm được

để 1 thì không những có thể giảm được tác động của thành phần

không rõ mà sai số do thành phần không rõ gây nên bị chặn không phụ thuộc

vào do:

1 2

1 2

0.5569( 1)

0.5569.

V m V m E

m V m

(2-62)

- 40 -

Ngoài ra có thể tính toán chính xác giá trị lớn nhất của hàm μ ( , , )E E

bằng phương pháp giải trên MATLAB nhờ Bổ đề 3 sau:

Bổ đề 3 : Hàm μ ( , , )E E định nghĩa như (2-61) với 0 1 , 0 có giá

trị lớn nhất bằng _ maxμ ( , ) 0E tại hai điểm đối xứng ( , )mE xác định

bởi:

_ maxμ ( , ) μ ( , , ) 0E E mE , 0mm

xE

(2-63)

với mx là nghiệm duy nhất của phương trình

2( 1) 2( ) 1 0x xe x e .

Chứng minh

Phương pháp chứng minh và chương trình tính toán giá trị lớn nhất trên

MATLAB được tác giả trình bày trong mục 5.3 trang 139 phần Phụ lục.

Lưu ý là với 1 thì μ (1, , ) μ( , )E E E theo (2-43) nên kết quả (2-46) là

trường hợp riêng của Bổ đề 3 và 1.2785 1.2785 0.5569

μ( , ) μ (1, , )E

.

Ngoài ra x E và với mỗi giá trị xác định trong khoảng (0, 1] và 0 ,

hàm μ ( , , )E E đạt cực đại và cũng là lớn nhất bằng _ maxμ ( , )E tại các

điểm ( , )mE là các hàm số của và .

▲

Hình 4 biểu diễn hàm μ ( , , )E E trong các trường hợp 5 , 10 và giá

trị được chọn trong mỗi trường hợp là 1, 0.9 và 0.5. Kết quả tính trong các

trường hợp trên Hình 4 như sau:

μ (1.0, 5, 0.2557) 0.1114 μ (1.0, 10, 0.1278) 0.0557

μ (0.9, 5, 0.2154) 0.0879 μ (0.9, 10, 0.1077) 0.0440

μ (0.5, 5, 0.1046) 0.0256 μ (0.5, 10, 0.0523) 0.0128

E E

E E

E E

(2-64)

- 41 -

Hình 4 : Hàm μ ( , , ) sign( )bsig( , )E E E E E

Hình 5 : Hàm ( , )mE và _ maxμ ( , ) μ ( , , )E E mE

-1 -0.5 0 0.5 1-0.04

-0.02

0

0.02

0.04

0.06

0.08

0.1

0.12

E

E

= 5

= 1

= 0.9

= 0.5

0.1114

0.0879

0.0256

-0.5 -0.25 0 0.25 0.5-0.02

-0.01

0

0.01

0.02

0.03

0.04

0.05

0.06

E

E

= 10

= 1

= 0.9

= 0.5

0.0557

0.0440

0.0128

0 0.2 0.4 0.6 0.8 10

0.2

0.4

0.6

0.8

1

1.2

1.4

= 1

Em

E_max

0.5

0.1278

0.5

0.5229

0.9

0.4396

0.9

1.0769

1.2785

0.5569

0 5 10 15 200

0.1

0.2

0.3

0.4

= 1

Em

E_max

0.1114

0.2557

0.0557

0.1278

- 42 -

Hình 5 biểu diễn đồ thị của _ maxμE trong các trường hợp đặc biệt 1 và

1 . Ngoài ra có thể ước lượng tọa độ điểm cực đại từ đồ thị bên trái trên

Hình 5 ( 1 ). Ví dụ để tính điểm cực đại của hàm với 0.9 và 5 , từ đồ

thị Hình 5 bên trái suy ra:

(0.9,1) 1.0769

(0.9,5) 0.21545

mm

EE

_ max

_ max

μ (0.9,1) 0.4396μ (0.9,5) 0.0879

5

EE

Như vậy so với (2-62) ta thu được kết quả mạnh hơn như sau:

1 2 _ max ( , )EV m V m . (2-65)

Tổng hợp các kết quả trên, trong trường hợp hệ sai số (2-52) có chứa thành

phần không rõ bị chặn ( , ) ( )u t x x với 0 là hằng số bị chặn chưa biết

và ( ) : n x là hàm liên tục không âm bị chặn cho trước, dẫn đến phát

biểu của Bổ đề 4 dưới đây.

Bổ đề 4 : Nghiệm của phương trình động học hệ sai số (2-52) bị chặn tới hạn

đều (uniformly ultimately bounded) bởi luật điều khiển phản hồi u u u với

u là thành phần bù liên tục theo (2-60) và u là thành phần điều khiển ổn định

nếu 1 2V m V m với 212

V E , 1 20, 0m m khi 0u và .

Chứng minh

Để chứng minh nghiệm của hệ sai số vòng kín bị chặn tới hạn đều ta cần chỉ

ra các hàm số 1 2( ), ( )E E K và 3( )E K xác định trên 0, thỏa

mãn:

1 2

3

( ) ( ) ( )

( ) ( )

E V E E

VV E E E

E

(2-66)

- 43 -

với E R và ( )V E là hàm số khả vi liên tục xác định trên E R .

Sau đây chọn 21

1 2 2( ) ( ) ( )E E V E E là các hàm lớp K và từ

(2-65) biến đổi tiếp như sau:

1 2 _ max

1 1 2 _ max

1 1 1 2 _ max

( ) μ

(1 ) μ

( ) (1 ) μ

E

E

E

V E m V m

m V m V m

m E m V m

với 0 1 . Đặt 3 1 1( ) ( )E m E K suy ra 3( ) ( )V E E khi E R

với 2 _ max

1

2 μ

(1 )

EmR

m

và Bổ đề 4 được chứng minh.

Ngoài ra lưu ý là trường hợp ( )V E tổng quát ta có

2 _ max11

1

2 μ

(1 )

EmR

m

.

- 44 -

2.3. Điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi vào-ra

bằng phƣơng pháp thay thế ƣớc lƣợng hàm trạng thái

2.3.1. Bài toán điều khiển và cơ sở toán học

Trong phần trước, mục 2.2 đã trình bày và phân tích phương pháp thay thế

ước lượng hàm trạng thái trong điều khiển các hệ khả tuyến tính hóa phản hồi

trạng thái (không có thành phần hệ con phi tuyến nội động học q ). Sau đây luận

án phân tích khả năng áp dụng phương pháp thay thế ước lượng hàm trạng thái

trong điều khiển ổn định các hệ thống khả tuyến tính hóa phản hồi vào-ra có

phương trình động học và đầu ra biến đổi được về dạng chuẩn tắc (2-3) với Giả

thiết 2 như sau:

Giả thiết 2: Hệ (2-3) có:

1) bậc tương đối n và hệ con ( , )q π x q là ổn định đầu vào-trạng thái

(ISS) với x là đầu vào;

2) ( , )f x q , ( , )g x q là các hàm số thực bị chặn và ( , ) 0g x q với mọi ( , )x q

trong miền hợp lệ đóng n d xq ;

3) các trạng thái ( , )x q của hệ đo được.

Bài toán đặt ra là cần điều khiển ổn định (2-3) sao cho đầu ra của hệ bám

theo tín hiệu mẫu ( )r t với giả thiết ( )r t và các đạo hàm của tín hiệu mẫu đến

bậc n bị chặn và đo được. Vấn đề là mặc dù hệ con q không có tác động tới

đầu ra của hệ, tuy nhiên cho dù xác định được bộ điều khiển ổn định động học

của hệ con tuyến tính hóa x thì vẫn có thể xảy ra q nếu động học của hệ

con (phi tuyến) ( , )q π x q không ổn định. Như vậy để giải quyết bài toán, cần

thiết phải biết được đặc tính động học của hệ con phi tuyến. Nhằm đơn giản hóa

tính toán mà không làm mất đi tính thực tế nên phương pháp giải trong phần

này luôn giả thiết rằng hệ con phi tuyến ( , )q π x q là ổn định đầu vào-trạng

thái với x là đầu vào.

- 45 -

Theo định nghĩa, hệ ( , , )tx f x u với : 0, , ,n m n f liên tục phân

đoạn (piecewise continuous) đối với t và Lipschitz cục bộ đối với x và u được

gọi là ổn định đầu vào-trạng thái nếu tồn tại hàm β KL (hàm lớp KL) và

K (hàm lớp K) để với bất kỳ trạng thái ban đầu 0 0( )tx x và đầu vào bị

chặn ( )tu nào, luôn tồn tại nghiệm ( )tx với mọi 0t t và thỏa mãn:

0

0 0( ) ( ) , sup ( )t t

t t t t

x x u . (2-67)

Bất đẳng thức (2-67) cho thấy nếu hệ là ISS thì luôn đảm bảo rằng với bất kỳ

đầu vào ( )tu bị chặn nào, trạng thái ( )tx của hệ cũng bị chặn. Ngoài ra khi t

tăng dần thì trạng thái ( )tx sẽ bị chặn cuối (tới hạn) bởi hàm K do khi đó

0 0( ) , 0t t t x và nếu ( )tu hội tụ về 0 khi t thì ( )tx cũng hội tụ về

0 . Một tính chất khác của hệ ISS là khi ( )t u 0 thì do bất đẳng thức (2-67) rút

gọn thành 0 0( ) ,t t t x x nên suy ra hệ không cưỡng bức ( , , )tx f x 0 có

gốc tọa độ là ổn định tiệm cận đều.

Các Bổ đề 13.1 và 13.2 trong [50] cho biết trong trường hợp hệ con x có thể

ổn định được (dùng luật điều khiển phản hồi trạng thái) về dạng ( )T x A bk x

hay Tν k x trong (2-5) được chọn sao cho ( )TA bk là Hurwitz thì có thể

kết luận được đặc tính ổn định đối với điểm gốc tọa độ ; x q 0 của hệ (2-3)

tương ứng như sau: Gốc tọa độ của hệ (2-3) là ổn định tiệm cận nếu gốc của hệ

con ( , )q π 0 q (điểm q 0 ) ổn định tiệm cận và gốc của hệ (2-3) là ổn định

tiệm cận toàn cục nếu hệ con ( , )q π x q là ổn định đầu vào-trạng thái (ISS) với

x là đầu vào. Ngoài ra các kết quả trên còn xuất phát từ tính chất của các hệ

liên kết tầng (cascade) được trình bày trong [50], [51] và được tổng hợp lại như

dưới đây:

Hệ liên kết tầng phi tự trị (nonautonomous):

- 46 -

1 1

2 2

: ( , , )

: ( , )

t

t

q f q x

x f x

(2-68)

với 1 : 0, m n m f và 2 : 0, n n f là liên tục phân đoạn

đối với t và Lipschitz cục bộ đối với ;q x . Nếu hệ 1 – với x là đầu vào – là

ổn định đầu vào-trạng thái và điểm gốc của hệ 2 là ổn định tiệm cận đều toàn

cục (globally uniformly asymtotically stable) thì gốc tọa độ của hệ liên kết tầng

(2-68) cũng ổn định tiệm cận đều toàn cục.

Đối với trường hợp hệ liên kết tầng tự trị (autonomous):

1 1

2 2

: ( , )

: ( , )

q f q x

x f x u

(2-69)

nếu hệ 1 – với x là đầu vào – là ổn định đầu vào - trạng thái (cục bộ/toàn cục)

và điểm gốc của hệ 2 là ổn định tiệm cận (cục bộ/toàn cục) thì gốc tọa độ của

hệ liên kết tầng (2-69) cũng là ổn định tiệm cận (cục bộ/toàn cục).

▲

Do phương pháp xây dựng trong luận án dựa trên cơ sở lập hệ sai số thỏa

mãn Giả thiết 1 với các thành phần không rõ nên có thể dùng Định lý 6.1 trong

[57] để chứng minh các kết quả của luận án. Phát biểu của định lý này như sau:

Gọi ( , )tE x là hệ sai số thỏa mãn Giả thiết 1. Giả thiết rằng tồn tại bộ điều

khiển ( )u v z và hàm Lyapunov ( )V E sao cho ( ) ( )V E E E với K E và

0V theo quỹ đạo (2-3) khi rV V với mọi dq , nx và t . Nếu hệ

con ( , )q π x q với đầu vào x là ổn định đầu vào-trạng thái (ISS) thì bộ điều

khiển ( )u v z đảm bảo rằng x và q bị chặn đều.

Lưu ý rằng nếu hệ con q là ổn định đầu vào-trạng thái (ISS) cũng có nghĩa

là tồn tại hàm xác định dương Vq để:

1 2

3

( ) ( ) ( )

( ), ( )

V

V

q q q

q q

q q q

q q x (2-70)

- 47 -

với 1 2, K q q , 3, K q .

Định lý 6.1 ([57]) cho biết nếu bộ điều khiển được thiết kế để ổn định động

học x thì động học q cũng sẽ ổn định nếu thỏa mãn điều kiện (2-70). Ngoài ra

từ Định lý 6.1 ([57]) có thể suy ra hệ quả mạnh hơn của Định lý trong trường

hợp V kV thì E 0 là điểm cân bằng ổn định theo hàm số mũ trong khi có

thể q chỉ bị chặn. Lưu ý là khi x 0 thì điều kiện đối với Vq trong (2-70) trở

thành 3( )V q q q với mọi q dẫn đến nghiệm của động học không

( , )q π 0 q là ổn định tiệm cận toàn cục và hệ là pha cực tiểu (minimum phase).

Với các cơ sở toán học như đã trình bày ở trên, phần tiếp theo của luận án

cho thấy bằng phương pháp lập hệ sai số và thay thế ước lượng hàm trạng thái

đối với các thành phần không rõ tương tự như trong trường hợp hệ khả tuyến

tính phản hồi đầu vào-trạng thái (mục 2.2) và với giả thiết hệ con phi tuyến là

ISS thì vấn đề điều khiển trong trường hợp này luôn giải quyết được.

2.3.2. Điều khiển ổn định bằng phương pháp thay thế ước lượng hàm trạng

thái

Trƣờng hợp 1

Trường hợp ( , )f x q , ( , )g x q xác định, đặt e x r với ( 1), , ,T

nr r r

r

thì từ phương trình (2-4) suy ra:

( )

( , ) ( , )

( , ) ( , )

( , ) ( , ) n

f g u

f g u

f g u r

e x r

Ax b x q x q r

Ae Ar r b x q x q

Ae b x q x q

(2-71)

nên nếu chọn luật điều khiển phản hồi tĩnh theo [50]:

1 ( )( , ) ( , ) n Tu g f r x q x q k e (2-72)

với k được chọn sao cho ( )TA bk là Hurwitz thì hệ vòng kín trở thành:

- 48 -

( , )

( )

.

T

Ty

q π e r q

e A bk e

e rc

q

(2-73)

Áp dụng tính chất của hệ liên kết tầng và do giả thiết ban đầu hệ con

( , )q π x q là ổn định đầu vào-trạng thái (ISS) với x e r là đầu vào bị chặn

do Mrr bị chặn suy ra điểm gốc tọa độ của (2-73) là ổn định toàn cục.

Ngoài ra bằng phương pháp lập hệ sai số có thể giải quyết bài toán như sau

([57]). Định nghĩa hệ sai số:

( 1)( , , ) ,1 T T T nE E E nE t x r

x q k e k e k d (2-74)

với ,1T TE

k k , 1 1, ,TE nk k k ,

( 2)

1 2 1, , ,Τ

nE nx r x r x r

d ,

e x r và 1 21 1

n nns k s k là Hurwitz. Khi đó hệ sai số (2-74) thỏa

mãn Giả thiết 1 và phương trình động học của hệ sai số có dạng:

( , , ) ( , )E t u x q x q (2-75)

với ( )( , , ) ( , )T nt r f E Ex q k d x q , ( , ) ( , )g x q x q .


2V E và sử dụng luật điều khiển phản hồi tĩnh:

1( , ) ( , , )u t E x q x q (2-76)

với 0 dẫn đến E E và 2V E . Do giả thiết hệ con ( , )q π x q là ổn

định đầu vào-trạng thái (ISS) với x là đầu vào nên áp dụng hệ quả của Định lý

6.1 ([57]) suy ra 0E là điểm cân bằng ổn định theo hàm mũ của hệ sai số.

Trƣờng hợp 2

Trường hợp ( , )f x q , ( , )g x q có chứa các thành phần không rõ, giả thiết rằng

từ số liệu đo và hiểu biết về hệ thống ta có thể tìm được các hàm số

- 49 -

( , ) ( , ) ( , )ff f x q x q x q , ( , ) ( , ) ( , )gg g x q x q x q thay thế ( , )f x q ,

( , )g x q để tính gần đúng được nx như sau:

( , ) ( , ) ( ) ( , , )n n dxnx f g u x u x q x q z x q (2-77)

với ( , , ) ( , ) ( , ) ( )dxn n n f gu x x u x q x q x q z là sai số giữa tín hiệu xấp

xỉ nx với tín hiệu nx và dxn W , 0W cho trước với mọi ,x q trong miền

hợp lệ ,n d x q và uu .

Định nghĩa hệ sai số như (2-74) khi đó:

( , , ) ( , ) dxnE t u x q x q (2-78)

với ( )( , , ) ( , )T nt r f E Ex q k d x q , ( , ) ( , )g x q x q .

Sử dụng luật điều khiển phản hồi trạng thái tĩnh:

1

1 ( )

( ) ( , ) ( , , )

( , ) ( , )T n

u u t E

g r f E

E E

z x q x q

x q k d x q

(2-79)

với 1, ,T T T n dt

z x q và 0 thì phương trình động học của hệ sai số

vòng kín trở thành:

( , , )dxnE E u x q . (2-80)

Dùng hàm Lyapunov 21

2V E dẫn đến:

2

22

2

1

2 2

2

dxnV EE E E

WV W E

WV

(2-81)

hay 0V khi 2

22r

WV V

. Khi đó theo Định lý 6.1 ([57]) ta có x , q bị chặn

đều và tương tự như trong trường hợp hệ là khả tuyến tính hóa phản hồi đầu

- 50 -

vào-trạng thái, áp dụng Bổ đề 2.1 ([57]) với 1m , 2

22

Wm

dẫn đến V bị

chặn và do đó E cũng bị chặn theo biểu thức sau:

2 2 2

2 2 2

22

2

(0) 1 (0)2 2 2

1 (0) .

t t tH

t tH

W W WV V e e V e V

WE e E e E

(2-82)

hay:

0

0

0 max ,

max ,

V V V E

E E E

(2-83)

với 0 (0)E E , lim Ht

WE E

và

2

0 01

2V E .

Lưu ý là do T T E E Eη e k d với 1 1 2 1, , ,Tnk k k k η nên luật

điều khiển (2-79) có thể viết như sau:

1 ( )( , ) ( , )n Tu u g r f x q η e x q (2-84)

và điều kiện sai số xấp xỉ chung còn có thể biểu diễn dưới dạng:

( )n Tdxn nr x W η e (2-85)

Kết quả trên cho thấy ảnh hưởng của sai số xấp xỉ do phép thay thế ước

lượng các hàm trạng thái gây nên trong trường hợp hệ khả tuyến tính hóa phản

hồi vào-ra thỏa mãn Giả thiết 2 cũng có thể giảm trừ được bằng cách đưa thêm

thành phần bù phản hồi vào hệ vòng kín giống như trường hợp hệ khả tuyến

tính phản hồi đầu vào-trạng thái nhưng với điều kiện hệ con phi tuyến là ISS.

Phần tiếp theo cho thấy cũng với giả thiết này phương pháp hoàn toàn áp dụng

tương tự được trong trường hợp hệ có chứa thành phần không rõ trên đầu vào

của phương trình động học.

- 51 -

2.3.3. Tính bền vững của hệ vòng kín đối với thành phần không rõ trong

phương trình động học

Xét hệ có phương trình động học và đầu ra sau:

1 2

1

1

( , )

( , ) ( , ) ( , , )

n n

n u

x x

x x

x f g u t

y x

q π x q

x q x q x q

(2-86)

trong đó ( , , )u t x q là thành phần không rõ và ( , , ) ( , )u t x q x q với 0

là hằng số chưa biết bị chặn, ( , ) : n x q là hàm không âm đã biết.

Hệ con ( , )q π x q là ISS với x là đầu vào, các hàm ( , )f x q , ( , )g x q có chứa

các thành phần không rõ bị chặn và ( , ) 0g x q với mọi ( , )x q trong miền điều

khiển được n d xq như Giả thiết 2.

Trường hợp thành phần không rõ ( , , ) 0u t x q , tiếp tục với giả thiết rằng từ

số liệu đo ta có thể tìm được các hàm thay thế ước lượng để tính gần đúng được

nx như (2-77) thì bằng phương pháp lập hệ sai số (2-74) và sử dụng luật điều

khiển phản hồi u u như (2-84) dẫn đến x , q bị chặn đều nhờ phương pháp

phân tích sử dụng hàm Lyapunov xác định dương 21

2V E để đạo hàm theo

quỹ đạo động học (2-80) của hệ sai số thỏa mãn 1 2V m V m với

1 20, 0m m .

Với thành phần không rõ ( , , )u t x q thỏa mãn giả thiết nêu trên, tương tự

như đã trình bày trong phần trước ta có thể sử dụng thành phần bù u đưa vào

đầu điều khiển u u u để ổn định hệ sai số trong đó:

( , )bsig( , )u E x q (2-87)

- 52 -

với bsig( , )E là hàm xíchma lưỡng cực định nghĩa như (2-40), 0 và 0

là hệ số góc của hàm bsig( , )E tại 0E .

Khi đó động học của hệ sai số sẽ là:

( , , ) ( , ) ( , ) ( , , )dxn uE t u t u x q x q x q x q (2-88)

và đạo hàm của hàm Lyapunov theo quỹ đạo động học của hệ sai số phân tích

được thành:

1 2

1 2

1 2

1 2 E

1 2 E_max

sign( ) bsig( , )

sign( )bsig( , )

μ ( , , )

μ ( , ).

dxn u

u

V EE E Eu E E u

m V m E u

m V m E E E E

m V m E E E

m V m E

m V m

(2-89)

với 1 0

và Eμ ( , , )E định nghĩa như (2-61) đạt giá trị lớn nhất bằng

E_maxμ ( , ) có thể xác định nhờ Bổ đề 3 trang 40 hay nếu tìm được thì

theo Định lý 6.1 ([57]) ta có x , q bị chặn đều và sai số do thành phần không rõ

gây nên bị chặn không phụ thuộc vào . Như vậy trong trường hợp này kết quả

(2-89) cũng có dạng giống như kết quả (2-65) trong trường hợp hệ tuyến tính

hóa phản hồi trạng thái.

Tổng hợp lại dẫn đến phát biểu tổng quát của Định lý 2 như sau:

Định lý 2 : Hệ (2-86) có x và q bị chặn đều (uniformly bounded) bởi luật điều

khiển phản hồi u u u với u và u được định nghĩa như (2-84) và (2-87)

hay:

1 ( )( , ) ( , ) ( , )bsig( , )n Tu g r f E x q η e x q x q (2-90)

- 53 -

nếu trong đó ( , ) 0g x q , ( , )f x q là các hàm liên tục bị chặn thỏa mãn

( )n Tnr x W η e với mọi , n d xqx q , uu và 0W cho trước.

Chứng minh

Chứng minh Định lý 2 từ các kết quả nêu trên và Định lý 6.1 ([57]).

Sau đây chọn 21

1 2( ) ( )E V E E là hàm lớp K thì từ (2-89) biến đổi

tương tự như trong chứng minh 0 sẽ cho kết quả:

1 1 1 2 _ max( ) ( ) (1 ) μEV E m E m V m

với 0 1 nên suy ra đạo hàm của hàm Lyapunov 1 1( ) ( )V E m E khi

E R với 2 _ max

1

2 μ

(1 )

EmR

m

.

Kết quả trên tương đương 0V khi ( )rV V V R với mọi

, n d xqx q nên theo Định lý 6.1 ([57]), với giả thiết hệ con

( , )q π x q là ổn định đầu vào-trạng thái (ISS) với x là đầu vào suy ra luật điều

khiển (2-90) đảm bảo rằng x và q bị chặn đều và Định lý 2 được chứng minh.

▲

Một điểm cần lưu ý là các kết quả trên của phương pháp xuất phát từ giả

thiết toàn bộ trạng thái của hệ đo được. Tuy nhiên cũng có thể áp dụng phương

pháp trong các trường hợp đặc biệt khi một số trạng thái của hệ không đo được

như ví dụ sau. Xét hệ có phương trình động học và đầu ra:

1 2

1

1

( , )

( ) ( ) ( , , )

n n

n u

x x

x x

x f g u t

y x

q π x q

x x x q

(2-91)

- 54 -

trong đó ( , )q π x q là ISPS (Input-to-State Practically Stable) với x là đầu vào,

( , , )u t x q là thành phần không rõ có điều kiện ràng buộc như trong Định lý 2

và ( , ) x q không giảm dần đối với q , ngoài ra giả thiết rằng chỉ các trạng thái

x của hệ là đo được, các trạng thái q không đo được.

Tiếp tục áp dụng phương pháp trên với giả thiết từ số liệu đo ta có thể thay

thế được các hàm số ( )f x , ( )g x để tính gần đúng nx với sai số ( , )dxn u W x

với mọi n xx , uu và 0W cho trước. Khi đó với hệ sai số định

nghĩa như (2-74), nếu x , q đo được và nếu tìm được thì theo Định lý 2

hệ (2-91) có x , q bị chặn đều. Tuy nhiên do giả thiết trạng thái q của hệ không

đo được nên ta cần xác định u không phụ thuộc vào q .

Biết rằng hệ con phi tuyến ( , )q π x q là ISPS với x là đầu vào nên theo

điều kiện cần và đủ của hệ ISPS ([51], [57]) tồn tại hàm xác định dương ( )Vq q

để:

1 2( ) ( ) ( )

( , ) ( )

V

VcV d

q q q

qq

q q q

π x q xq

(2-92)

với 1 2, , K q q và 0c , 0d .

Từ (2-92) định nghĩa ( )c d x và chọn (0) ( )V q 0 để V q thì

1 11 1( ) ( )V q q qq . Do vậy nếu chọn 1

1, ( ) bsig( , )u E qx và

sử dụng luật phản hồi u u u

thì biến đổi như trên cũng dẫn đến

1 2 _ maxμEV m V m nên suy ra x và q bị chặn đều.

- 55 -

2.4. Tổng hợp thiết kế bộ điều khiển tĩnh ổn định

Tóm lại, các kết quả trình bày trong chương có thể tổng hợp lại thành các

bước tổng hợp bộ điều khiển tĩnh ổn định theo phương pháp thay thế ước lượng

hàm trạng thái như sau:

1. Biểu diễn phương trình động học và đầu ra của hệ ở dạng tuyến tính hóa

phản hồi trạng thái – phương trình (2-6) hoặc tuyến tính hóa phản hồi

vào-ra – phương trình (2-3). Xác định các thành phần không rõ và các

giới hạn.

2. Xác định tín hiệu mẫu cần bám, định nghĩa hệ sai số và chọn hàm

Lyapunov V . Sử dụng luật điều khiển phản hồi tĩnh theo (2-28) hoặc

(2-84) để 1 2V m V m . Xác định giá trị 0W cần đạt để chất lượng

hệ vòng kín thỏa mãn yêu cầu thiết kế.

3. Từ các dữ liệu đo và hiểu biết về hệ thống tìm cách xác định cặp hàm

thay thế f và g phù hợp sao cho sai số xấp xỉ nx thỏa mãn

( )n Tnr x W η e với mọi x trong miền đóng x và uu . Trường

hợp điều kiện sai số xấp xỉ không thỏa mãn thì có thể sử dụng thành phần

bù mờ nơron trong phương pháp thay thế ước lượng (chi tiết trình bày

trong Chương 3) để bù sai số do phép thay thế ước lượng gây nên.

4. Thiết kế thành phần bù liên tục bsig( , )u E đưa thêm vào đầu

điều khiển nhằm nâng cao tính bền vững của hệ đối với các thành phần

không rõ (nếu có) xuất hiện trên đầu vào của hệ. Sử dụng các công thức

(2-51), (2-65) và Bổ đề 3 (trang 40) để tính toán các tham số thành phần

bù liên tục đáp ứng sai lệch cho phép theo yêu cầu thiết kế.

- 56 -

2.5. Kết luận

Chương 2 trình bày các cơ sở toán học để hình thành phương pháp mới tổng

hợp bộ điều khiển ổn định tĩnh (không thích nghi) các hệ thống khả tuyến tính

hóa phản hồi trạng thái dạng (2-6) và khả tuyến tính hóa phản hồi vào-ra dạng

(2-3) có chứa các thành phần không rõ bị chặn trong các hàm trạng thái f và g

của phương trình động học.

Để giải quyết bài toán bám theo tín hiệu mẫu cho trước, không như các

phương pháp tìm cách xấp xỉ gần đúng các hàm trạng thái f và g chưa biết,

phương pháp mới đề xuất xây dựng trên cơ sở giả định rằng có thể tìm được cặp

hàm f và g thay thế ước lượng (không cần chính xác) các hàm trạng thái chưa

biết sao cho sai số xấp xỉ nx thỏa mãn điều kiện sai số trong miền trạng thái hợp

lệ (Chương tiếp theo của luận án sẽ giải quyết vấn đề khi điều kiện xấp xỉ không

thỏa mãn). Khi đó bằng cách lập hệ sai số thích hợp (Bổ đề 1 trang 23) và sử

dụng luật điều khiển phản hồi chứa cặp hàm thay thế tìm được sẽ đảm bảo

nghiệm của hệ sai số được lập bị chặn tới hạn đều và do đó sai số bám đầu ra

cũng như trạng thái của hệ bị chặn (Định lý 1 trang 29).

Mặt khác nhằm phân tích tính bền vững của hệ vòng kín trong phương pháp

đối với thành phần không rõ bị chặn xuất hiện trên đầu vào của hệ (như sai số

xấp xỉ, nhiễu đầu vào, ...), phương pháp chỉ ra rằng bằng cách đưa thêm thành

phần bù liên tục dựa trên hàm xíchma lưỡng cực (2-40) vào luật điều khiển phản

hồi (để tín hiệu điều khiển cũng liên tục) có thể giảm trừ được tác động của

thành phần không rõ gây nên. Với cơ sở toán học đã được tác giả xây dựng và

chứng minh là Bổ đề 3 (trang 40) dùng để xác định chính xác giá trị lớn nhất

của hàm μ ( , , )E E (định nghĩa như (2-61)) bằng phương pháp giải trên

MATLAB, tác giả chỉ ra công thức để tính toán tác động này lên hệ sai số và từ

đó cho phép xác định được tác động lên sai số bám đầu ra (Bổ đề 4 trang 42 và

Định lý 2 trang 52). Các kết quả này có ý nghĩa quan trọng trong thiết kế bộ

- 57 -

điều khiển áp dụng trong thực tế và là cơ sở để giải quyết vấn đề bù sai số khi

điều kiện xấp xỉ không được thỏa mãn trong các chương tiếp theo.

Tóm lại Chương 2 đưa ra cơ sở toán học và đề xuất một phương pháp mới

thiết kế bộ điều khiển ổn định tĩnh các hệ thống khả tuyến tính hóa phản hồi

trạng thái và khả tuyến tính hóa phản hồi vào-ra có các thành phần không rõ

trong phương trình động học cho lớp bài toán điều khiển bám tín hiệu mẫu là

dạng bài toán thông dụng trong các ứng dụng công nghiệp. Các bước để tổng

hợp bộ điều khiển ổn định tĩnh theo phương pháp được trình bày trong mục 2.4.

Mục tiêu của phương pháp hướng tới đơn giản hóa quá trình thiết kế và tìm

cách tránh được những vấn đề thường gặp trong các phương pháp hiện nay cũng

như có thể áp dụng trên các hệ thống điều khiển công nghiệp (PLC, IPC).

Tuy nhiên để phương pháp có tính ứng dụng cũng như được phân tích đầy

đủ, trong chương tiếp theo tác giả tiếp tục phát triển phương pháp để giải quyết

các vấn đề trong thiết kế luật điều khiển phản hồi tĩnh khi điều kiện xấp xỉ

không được thỏa mãn trong miền hợp lệ của x và u cũng như phân tích, xác

định tham số điều khiển để đáp ứng các điều kiện ràng buộc đối với quỹ đạo

trạng thái và đầu vào điều khiển của hệ phi tuyến. Ý tưởng của phương pháp là

xây dựng thêm thành phần bù phi tuyến trong luật điều khiển phản hồi sao cho

với luật điều khiển phản hồi mới, hệ sai số bị chặn như trong trường hợp điều

kiện xấp xỉ được thỏa mãn (hay tương đương như khi xác định được các hàm

thay thế thỏa mãn). Để thực hiện ý tưởng này phương pháp được xây dựng theo

hướng ứng dụng điều khiển mờ nơron do những ưu điểm của hệ mờ và mạng

nơron trong nhận dạng đặc tính phi tuyến của đối tượng.

- 58 -

CHƢƠNG 3

PHƯƠNG PHÁP THAY THẾ ƯỚC LƯỢNG HÀM TRẠNG

THÁI DÙNG BỘ XẤP XỈ MỜ NƠRON

3.1. Đặt vấn đề và cơ sở lý thuyết xây dựng phƣơng pháp

3.1.1. Giới thiệu chung

Một trong những vấn đề của phương pháp thay thế ước lượng hàm trạng thái

là từ số liệu đo và hiểu biết về hệ thống phải xác định được các hàm số ước

lượng thay thế sao cho sai số xấp xỉ nx luôn đáp ứng yêu cầu thiết kế. Các kết

quả trong Định lý 1 (trang 29) và Định lý 2 (trang 52) đều giả thiết rằng có thể

tìm được các hàm số liên tục, bị chặn f và 0g sao cho sai số xấp xỉ nx thỏa

mãn dxn W với xx , uu . Tuy nhiên nếu điều kiện xấp xỉ không

được đáp ứng hay nói cách khác nếu không tìm được các hàm ước lượng thay

thế thỏa mãn yêu cầu thì rõ ràng không thể áp dụng phương pháp.

Ngoài ra một vấn đề khác cần xem xét là việc xác định tham số điều khiển

(nếu tồn tại) để bộ điều khiển ổn định tĩnh đáp ứng được các điều kiện ràng

buộc đối với quỹ đạo trạng thái và đầu vào trong suốt quá trình hoạt động, ví dụ

như cần giữ x và u tương ứng luôn nằm trong miền hợp lệ x và u . Vấn đề

này có ý nghĩa quan trọng nếu xét ở góc độ ứng dụng để trả lời cho câu hỏi là

nếu chỉ xác định được các hàm số thay thế thỏa mãn điều kiện xấp xỉ trong một

miền nào đó không bao phủ miền hợp lệ thì có thể thiết kế bộ điều khiển ổn

định tĩnh thỏa mãn yêu cầu thiết kế hay không.

Như vậy để mở rộng phạm vi ứng dụng và phát triển phương pháp, các vấn

đề trên cần được xem xét và giải quyết. Đây cũng là mục tiêu đặt ra trong

Chương 3 này của luận án.

Như đã nêu, do những ưu điểm của hệ mờ và mạng nơron trong nhận dạng

đặc tính phi tuyến của đối tượng mà phương pháp được xây dựng theo hướng

ứng dụng điều khiển mờ nơron để xây dựng thành phần bù phi tuyến trong luật

- 59 -

điều khiển phản hồi tĩnh. Phần sau của luận án sẽ cho thấy vấn đề này được giải

quyết nhờ các bộ xấp xỉ vạn năng (universal approximators) trong lý thuyết xấp

xỉ hàm số. Lưu ý là các nghiên cứu và đề xuất trong chương này chủ yếu tập

trung giải quyết tiếp các vấn đề còn tồn tại của phương pháp trong thiết kế bộ

điều khiển ổn định tĩnh. Vấn đề xây dựng luật điều khiển phản hồi động (hay

thích nghi) sẽ được phát triển trong chương tiếp theo.

3.1.2. Bộ xấp xỉ vạn năng

Sau đây ký hiệu ( , )F x θ là bộ xấp xỉ với pθ là vectơ tham số chỉnh định

được và pF là tập hợp của toàn bộ các giá trị tham số hợp lệ của bộ xấp

xỉ. Nếu gọi ( , ) : , 0pFF p x θ θ là lớp hàm chứa toàn bộ các hàm

có dạng ( , )F x θ , F θ với 0p bất kỳ, khi đó khái niệm xấp xỉ đều hay

xấp xỉ đơn trị (uniformly approximation) được định nghĩa như sau:

Định nghĩa 1 : Hàm :f D có thể xấp xỉ đều (hay xấp xỉ đơn trị) trên

nD bởi các hàm thuộc lớp nếu với 0 luôn tồn tại ( )F x để

sup ( ) ( )D

F f

x

x x .

Lưu ý là định nghĩa trên cho biết việc chọn ( )F x có thể phụ thuộc vào và

giá trị 0p ở trên là số lượng tham số cần thiết của ( )F x để đảm bảo sai số

xấp xỉ bị chặn hay sup ( ) ( )D

F f

x

x x . Ngoài ra ký hiệu ( )F x rút gọn để chỉ

vectơ tham số θ xác định và không phải là đối tượng cần quan tâm.

Trong lý thuyết xấp xỉ hàm số, bộ xấp xỉ vạn năng có vai trò quan trọng do

chúng cho biết có thể xấp xỉ lớp hàm số nào đó với độ chính xác bất kỳ. Định

nghĩa bộ xấp xỉ vạn năng được phát biểu dựa trên khái niệm xấp xỉ đều như sau:

Định nghĩa 2 : Cấu trúc lớp hàm 1 được gọi là bộ xấp xỉ vạn năng đối với các

hàm thuộc lớp hàm 2 nếu mỗi hàm 2f đều có thể xấp xỉ đều bởi 1 .

- 60 -

Nếu ký hiệu ( , )c n D là tập hợp của toàn bộ các hàm số liên tục vô hướng

định nghĩa trên miền đóng nD , khi đó có thể sử dụng một trong số các bộ

xấp xỉ vạn năng thông dụng sau ([34], [44], [57], [66], [76], [91]) để xấp xỉ các

hàm liên tục:

- Các hàm định nghĩa lớp hàm bước nhảy; mạng nơron 2 lớp với các nút ẩn có

hàm kích hoạt theo ngưỡng hoặc hàm kích hoạt xíchma : 0,1 và nút

đầu ra tuyến tính đều là các bộ xấp xỉ vạn năng các hàm liên tục vô hướng

(1, )cf D , ,D a b .

- Các đa thức định nghĩa lớp hàm

0 10

( ) : , , , , 0p

ip i p

i

g x a x a a a p

với :g D, D

(Định lý Weiertrass); các hàm định nghĩa lớp hàm

1

( ) cos( ) : , ,m

T na i i i i i i

i

g a c a c

x b x b ; hệ mờ với hàm liên

thuộc Gauss, phương pháp giải mờ điểm trọng tâm COG; mạng nơron 2 lớp

với các nút ẩn có hàm kích hoạt xíchma và nút đầu ra tuyến tính đều là các

bộ xấp xỉ vạn năng các hàm liên tục vô hướng ( , )cf n D , nD .

Việc chứng minh cấu trúc của một lớp hàm là bộ xấp xỉ vạn năng đối với các

hàm thuộc lớp hàm khác thông thường theo định nghĩa, tuy nhiên có một công

cụ chứng minh hữu hiệu là sử dụng kết quả của Định lý Stone-Weierstrass có

thể tham khảo trong các tài liệu [43], [57], [66], [74].

3.1.3. Cơ sở toán học xây dựng các bộ xấp xỉ dùng hệ mờ và mạng nơron

Như đã trình bày, các bộ xấp xỉ vạn năng với số lượng tham số chọn đủ lớn

có thể xấp xỉ bất kỳ hàm liên tục nào với độ chính xác tùy ý trên tập compac

(compact set), ngoài ra do khả năng chỉnh định trực tuyến (on-line) mà chúng

còn được dùng trong các bộ điều khiển thích nghi. Các nghiên cứu dùng bộ xấp

xỉ làm bộ điều khiển thích nghi chủ yếu theo hướng dùng hệ mờ ([52], [57],

- 61 -

[73], [98], [104]), dùng mạng nơron ([54], [57], [91], [92], [104], [108]) hoặc

kết hợp dùng hệ mờ và mạng nơron ([44], [55], [66], [86]).

Mặc dù về lý thuyết có thể sử dụng bất kỳ bộ xấp xỉ nào thỏa mãn yêu cầu

trong phương pháp ví dụ như các bộ xấp xỉ mờ với hàm liên thuộc Gauss,

phương pháp giải mờ COG; mạng nơron 2 lớp với các nút ẩn có hàm kích hoạt

xíchma và nút đầu ra tuyến tính hoặc mạng thích nghi ANFIS. Tuy nhiên không

dễ dàng chỉ ra cấu trúc bộ xấp xỉ tối ưu trong từng trường hợp do phụ thuộc vào

số liệu đo có được, đặc tính phi tuyến của đối tượng và các điều kiện giới hạn.

Thông thường việc thiết kế bộ xấp xỉ vạn năng có kích cỡ cấu trúc nhỏ nhất

thỏa mãn yêu cầu về sai số xấp xỉ cũng cần nhiều thời gian để thử và kiểm

nghiệm do với cấu trúc bộ xấp xỉ vạn năng cho trước chỉ đảm bảo rằng sai số

xấp xỉ bị chặn bởi 0FW còn không thể xác định được giá trị FW này nhỏ

chừng nào. Tuy nhiên có điều chắc chắn rằng cần phải tăng kích cỡ cấu trúc của

bộ xấp xỉ và lựa chọn tham số điều chỉnh cho phù hợp để đạt được sai số xấp xỉ

nhỏ tùy ý.

Ngoài ra những vấn đề về nghiên cứu lựa chọn giữa bộ xấp xỉ tuyến tính hay

phi tuyến đối với tham số có cùng kích cỡ cấu trúc (hay số lượng tham số), vấn

đề về phương pháp chỉnh định tham số trong bộ xấp xỉ phi tuyến hay xác định

cấu trúc bộ xấp xỉ tốt nhất đều là những chủ đề đang được nghiên cứu ([57]) và

nằm ngoài phạm vi nghiên cứu của luận án này. Tuy nhiên do những ưu điểm

của hệ mờ và mạng nơron trong xử lý phi tuyến và chỉnh định tham số trực

tuyến mà luận án chỉ xem xét các bộ xấp xỉ được xây dựng dựa trên hệ mờ và

mạng nơron. Phần sau sẽ cho thấy các bộ xấp xỉ mờ nơron có thể dùng trong cả

bộ điều khiển ổn định tĩnh và bộ điều khiển ổn định động (thích nghi) và là cơ

sở để giải quyết vấn đề điều khiển ổn định trong phương pháp đề xuất. Dưới

đây trình bày biểu diễn toán học một số cấu trúc hệ mờ và mạng nơron được

dùng làm các bộ xấp xỉ vạn năng cũng như một số vấn đề về sử dụng và tối ưu

hóa các bộ xấp xỉ mờ nơron.

- 62 -

Biểu diễn toán học bộ xấp xỉ mờ

Xét hệ mờ MISO là ánh xạ phi tuyến từ vectơ đầu vào 1, ,T n

nx x x

tới đầu ra y (Hình 6). Trong lý thuyết logic mờ và tập mờ ([34], [47], [86]),

phép mờ hóa các đầu vào sử dụng toán tử mờ hóa có chức năng chuyển các dữ

liệu rõ thành các tập mờ và cơ sở luật mờ với giả thiết gồm p luật mờ được

biểu diễn dưới dạng tập hợp của các mô tả mờ (fuzzy implications) sau:

iR : (1

1

ijA VÀ 2

2

ijA VÀ ... VÀ ni

njA ) kiB (3-1)

với 1..i p . Ký hiệu A B chỉ mô tả mờ hay phát biểu điều kiện NẾU A THÌ

B và ,ij kA B là các tập mờ được định nghĩa như sau:

, ( ) :

, ( ) :

ij

k

ij i i iA

k B

A x x x

B y y y

với , 0,1ikj

BA tương ứng là các hàm liên thuộc thứ j và thứ k của đầu

vào ix và đầu ra y .

Vấn đề căn bản của hệ mờ nằm trong cơ chế suy diễn mờ (fuzzy inference)

và phương pháp giải mờ (defuzzification) dùng để tính toán đầu ra rõ của hệ mờ

khi đầu vào rõ cho trước trên cơ sở luật mờ đã biết. Cơ chế suy diễn mờ này

được xây dựng trên luật hợp thành của suy diễn. Để tính vế đầu trong (3-1) ta có

thể sử dụng bất kỳ t-norm ([86]) nào như t-norm nhỏ nhất

( , ) min{ , }MINT a b a b , tích đại số ( , )PANDT a b ab , hàm Lukasiewicz

( , ) max{ 1, 0}LANDT a b a b , ... Trường hợp sử dụng t-norm nhỏ nhất MINT

khi đó mô tả mờ (3-1) có thể viết dưới dạng tích Đềcác

1 2

1 2

i i ni

nj j j kiA A A B và vế đầu của (3-1) được tính như sau:

1 2 1 2

1 2 1 2

1 2( ) min ( ), ( ), , ( )n nj j j j j ji i ni i i ni

nA A A A A Ax x x

x

.

- 63 -

Hình 6 : Hệ mờ MISO

Để tính mô tả mờ của mỗi luật hay đầu ra của mỗi luật có thể dùng các toán

tử mô tả mờ (t-norm hoặc t-conorm) ([86]). Một số toán tử mô tả mờ thông

dụng gồm Zadeh max{1 , min{ , }}x y x x y , Lukasiewicz

min{1, 1 }x y x y , Mamdani min{ , }x y x y và Larsen x y xy

([28], [76], [86]). Trường hợp sử dụng toán tử mô tả mờ Mamdani thì đầu ra của

luật thứ i ( iR ), ký hiệu là , ( , ) : ,i

ni CC y y y x x được xác định

như sau:

1 2 1 2

1 2 1 2

( , ) ( , ) min ( ), ( )n ni kikij j j j j ji i ni i i ni

C BA A A B A A Ay y y

x x x

Cuối cùng để tính đầu ra của hệ mờ ta có thể sử dụng một phương pháp giải

mờ như giải mờ điểm trọng tâm COG (Center Of Gravity) sau:

1

1

( , )

( , )

( , )

i

i

p

i Ci z

p

Ci z

c z dz

y F

z dz

x

x θ

x

(3-2)

x1

x2

xn

y

Đầu vào rõ

(crisp inputs)

Đầu ra rõ

(crisp output)

Cơ sở luật mờ

(Fuzzy Rule-Base)

Đầu vào

mờ hóa

Kết luận

mờ

. .

.

Cơ chế suy diễn mờ (Fuzzy Inference

Mechanism)

Giả

i m

ờ

(Defu

zzific

ation)

Mờ

hó

a

(Fuzzific

ation)

- 64 -

với ic là trọng tâm của ( )ki

By đối với luật thứ i . Thông thường ta chọn

( )ki

By đối xứng qua trục thẳng đứng qua đỉnh để ic là điểm giữa của ( )

kiB

y

. Phương trình (3-2) chính là mô hình của hệ mờ Mamdani với phương pháp

giải mờ COG và được dùng làm bộ xấp xỉ mờ ( , )F x θ với 1, ,T

pc c θ .

Biểu diễn toán học bộ xấp xỉ nơron

Xét mạng nơron nhân tạo truyền thẳng 1p lớp với đầu ra có hàm kích hoạt

tuyến tính trong đó 0,1.. 1,p p lần lượt chỉ số thứ tự từ lớp đầu vào, (các) lớp

ẩn (khi 2p ) đến lớp đầu ra. Nếu ký hiệu:

ix , jy : tương ứng là các đầu vào và đầu ra của mạng với 1..i n , 1..j m ;

iL : là số lượng nơron trong lớp ẩn thứ i (khi 2p ) với 1.. 1i p ;

ijkw : là trọng số từ nút mạng thứ k trong lớp 1i tới nút mạng thứ j

trong lớp i với 1..i p , 1.. 1

1..

iL i pj

m i p

,

1.. 1

1.. 1i

n ik

L i p

;

ij : là giá trị ngưỡng của nút mạng thứ j trong lớp i với 1..i p ,

1.. 1

1..

iL i pj

m i p

;

ij : là hàm kích hoạt nút mạng thứ j trong lớp ẩn i với 1.. 1i p ,

1.. ij L ;

thì đầu ra của nơron thứ j trong lớp ẩn i (khi 2p ), ký hiệu là ,i jo với

1.. 1i p , 1.. ij L và đầu ra của mạng ry với 1..r m là:

- 65 -

1

1 1 1

1

1

1

1

1 1i

n

j jk k jki

j Li i i ij jk k j

k

w x i

o

w o i p

, 1

1 1

1

1

1

1

2p

n

rs s rs

r Lp p prs s r

s

w x p

y

w o p

Hình 7 : Mạng nơron 2 lớp

Hình 7 biểu diễn mạng nơron truyền thẳng 2 lớp ( 2p ) có n đầu vào, m

đầu ra tuyến tính và L nút ẩn. Mô hình của mạng được viết như sau:

2 1 1 2

1 1

L n

i ij j jk k j ij k

y w w x

(3-3)

với 1..i m . Trường hợp mạng chỉ có một đầu ra ( 1m ) với hàm kích hoạt

xíchma 2

1sig( )

1 xx

e

trong lớp ẩn thì có thể dùng mạng làm bộ xấp xỉ vạn

năng các hàm liên tục vô hướng ( ) : nf x hay:

i : Hàm kích hoạt nút mạng

thứ i trong lớp ẩn 1

11

21

2m 1

L

211w

21Lw

21mw

2mLw

111w

112w

11nw

11Lw

12Lw

1Lnw

L nút ẩn n đầu vào

xn

x1

x2

1

1

2

n

L

y1 1

ym m

m đầu ra

Lớp đầu vào (Lớp 0)

Lớp ẩn (Lớp 1)

Lớp đầu ra (Lớp 2)

- 66 -

2 1 1 21 1 1

1 1

( , ) sigL n

j jk k jj k

F y w w x

x θ (3-4)

Bộ xấp xỉ mờ nơron

Có nhiều kết quả nghiên cứu nhằm kết hợp được các ưu điểm của hệ mờ và

mạng nơron trong xây dựng cấu trúc bộ xấp xỉ ([86]). Một trong những kết quả

nghiên cứu khả quan là hệ suy diễn mờ dựa trên mạng thích nghi ANFIS

(Adaptive-Network-based Fuzzy Inference System) do Jang đề xuất ([64], [65],

[66], [86]). Đây là một cấu trúc mạng nơron lai dựa trên mô hình hệ mờ Takagi-

Sugeno có luật mờ được cho dưới dạng mô tả mờ sau:

iR : 1 2

1 2 ( )i i ni

nj j j iA A A g x

Mạng ANFIS sử dụng hàm tuyến tính 1

( )n

i ij jj

g a x

x , hàm liên thuộc đầu

vào hình chuông và đã được chứng minh là một bộ xấp xỉ vạn năng các hàm phi

tuyến.

Biểu diễn toán học các bộ xấp xỉ tuyến tính và phi tuyến đối với tham số

Các bộ xấp xỉ (mờ nơron) có thể biểu diễn dưới dạng tuyến tính hoặc phi

tuyến đối với tham số. Bộ xấp xỉ được gọi là tuyến tính đối với tham số nếu

biểu diễn được dưới dạng:

( , ) ( )TF x θ θ φ x hay ( , )

( )TF

x θφ x

θ (3-5)

trong đó ( )φ x là véctơ hàm của x và θ là véctơ tham số đầu vào biểu diễn

tuyến tính trong hàm số của bộ xấp xỉ. Ví dụ bộ xấp xỉ mờ nơron tuyến tính đối

với tham số như hệ mờ theo công thức (3-2) và mạng nơron RBN (Radial Basis

NN). Trường hợp bộ xấp xỉ dùng hệ mờ theo (3-2) nếu 1, ,T

pc c θ thì

- 67 -

1( , )

( ) ( ), , ( )Tp

F

x θφ x x x

θ với

1

( , )

( )

( , )

i

i

C

zi p

Ci z

z dz

z dz

x

x

x

nên có thể

biểu diễn ( , ) ( )TF x θ θ φ x là dạng tuyến tính đối với tham số.

Trường hợp ( , )

( , )TF

x θφ x θ

θ hay ( , )φ x θ có chứa véctơ tham số θ như

trường hợp bộ xấp xỉ dựa trên mạng nơron đa lớp biểu diễn trong (3-4), bộ xấp

xỉ được gọi là phi tuyến đối với tham số do ( , )F x θ là hàm phi tuyến của tham

số θ :

( , ) ( , )TF x θ θ φ x θ . (3-6)

Tuyến tính hóa các bộ xấp xỉ

Các bộ xấp xỉ phi tuyến đối với tham số thường đơn giản hơn (về kích cỡ và

số lượng tham số) so với các bộ xấp xỉ tuyến tính để đạt được độ chính xác xấp

xỉ tương đương nhau. Đối với luật điều khiển phản hồi tĩnh trong phương pháp

thay thế ước lượng hàm trạng thái, vấn đề sử dụng bộ xấp xỉ tuyến tính hay phi

tuyến đối với tham số không được đặt ra do chỉ cần bộ xấp xỉ đảm bảo sai số

cần thiết trong miền hợp lệ. Tuy nhiên để chỉnh định tham số của bộ xấp xỉ

trong luật điều khiển phản hồi động, việc sử dụng bộ xấp xỉ tuyến tính hay phi

tuyến đối với tham số có ý nghĩa quan trọng. Mặc dù các kết quả nghiên cứu

của luận án trong chương sau cho phép áp dụng một trong hai dạng bộ xấp xỉ,

tuy nhiên cũng có thể tuyến tính hóa bộ xấp xỉ phi tuyến đối với tham số tùy

theo mỗi ứng dụng.

Vấn đề tuyến tính hóa bộ xấp xỉ được trình bày trong [57]. Kết quả này cho

biết nếu bộ xấp xỉ là liên tục Lipschitz đối với tham số chỉnh định (không kể là

biểu diễn được ở dạng tuyến tính hay phi tuyến) thì đều có thể viết như sau:

* *( , )( , ) ( , ) ( , ) ( , , )F

FF F

θ

x θx θ x θ x θ Δ x θ θ

θ (3-7)

- 68 -

trong đó θ là tham số hiện thời, * arg min sup ( , ) ( )F f

θ x

θ x

θ x θ x là tham số

tối ưu, * θΔ θ θ , *( , , ) ( ) θx θ θ Δ với 0

( )lim 0

θ

θ

Δ θ

Δ

Δ. Ngoài ra

*( , , ) x θ θ bị chặn bởi 2*( , , ) L θx θ θ Δ với L là hằng số Lipschitz, do vậy

nếu tìm được luật chỉnh định θ để giảm được 2

θΔ thì θ có xu hướng tiến về

*θ và ( , )F x θ sẽ tiến đến

*( , )F x θ . Như vậy nếu 2

θΔ bị chặn thì sai số xấp xỉ

cũng bị chặn. Đây chính là cơ sở để xây dựng luật chỉnh định tham số trong

chương tiếp theo.

Tối ƣu hóa các bộ xấp xỉ mờ nơron

Vấn đề tối ưu hóa các bộ xấp xỉ mờ nơron nói chung là tìm cách tối thiểu

hóa hàm giá trị (cost function) 2

( ) sup ( ) ( , )J f F

xx

θ x x θ với p θθ là

véctơ của p tham số chỉnh định được của hệ mờ hoặc mạng nơron hay cần tìm

tham số chỉnh định tối ưu *θθ từ số liệu đo để * arg min ( )J

θθ

θ θ .

Như vậy để sai số xấp xỉ nhỏ theo yêu cầu, số liệu đo phải đủ lớn và bao phủ

được toàn bộ miền hợp lệ x . Tuy nhiên trong thực tế đa phần không thể lựa

chọn được cách phân bố số liệu đo trong x cũng như không thể thay đổi số

liệu đo để cải thiện độ chính xác mà chỉ có thể sử dụng trực tiếp số lượng hữu

hạn các số liệu đo có được. Đây thực sự là vấn đề phức tạp và trong nhiều

trường hợp phương pháp tối ưu hóa không đảm bảo đáp ứng được yêu cầu về

sai số xấp xỉ. Thông thường để tìm véctơ tham số chỉnh định tối ưu *θθ từ

các số liệu đo có được có thể áp dụng thuật toán bình phương nhỏ nhất (Least

Squares) tuyến tính (batch, recursive) hoặc phi tuyến (gradient, conjugate

gradient, line search, Levenberg-Marquardt) được trình bày trong các tài liệu

[57], [58], [66], [68], [76], [86], [91].

- 69 -

3.2. Thay thế ƣớc lƣợng hàm trạng thái

3.2.1. Cơ sở toán học của phương pháp

Trƣờng hợp hệ khả tuyến tính hóa phản hồi trạng thái

Trước tiên xét trường hợp hệ khả tuyến tính hóa phản hồi trạng thái. Khi đó

phương pháp thay thế ước lượng hàm trạng thái trong luận án sử dụng bộ xấp xỉ

vạn năng để thay thế thành phần chưa biết trong phương trình trạng thái của hệ

phi tuyến sao cho sai số xấp xỉ nx của hệ thỏa mãn yêu cầu dxn W trong

miền hợp lệ của xx , uu và với 0W cho trước để E bị chặn theo

(2-26) hay 0max ,E E E với 0 (0)E E và W

E

.

Xuất phát từ thực tế trong nhiều trường hợp dạng của ( )f x , ( )g x đã biết (ví

dụ như 1 2( ) ( ) ( )f f f x x x , 1( ) ( )g cgx x với 1( )f x , 1( )g x là các hàm liên

tục đã biết; 2 ( )f x và c là hàm số và hằng số chưa biết) hoặc có thể ước lượng

được nên phương pháp xây dựng theo hướng thay thế ( )f x , ( )g x tương ứng

bởi các hàm liên tục ( )f x và ( ) 0g x bị chặn đã biết và tìm cách bù sai lệch

do phép thay thế gây nên để kết quả cuối cùng sai số E bị chặn theo (2-26).

Giả sử phép thay thế trên dẫn đến điều kiện xấp xỉ không thỏa mãn hay:

( , ) ( ) ( ) ( ) ( )dxn u f f g g u W x x x x x (3-8)

với W W trong miền xx , uu và u là luật điều khiển phản hồi theo

(2-28). Khi đó như đã phân tích trong mục 2.2.2 trang 31, nếu ta xác định được

hàm 1Φ( , ) : nu x thỏa mãn điều kiện ( , )dxn u x với xx ,

uu thì có thể bù được ảnh hưởng của sai số xấp xỉ dxn bằng cách sử dụng

luật điều khiển phản hồi cu u u theo (2-39) hoặc (2-42) để E bị chặn theo

(2-26).

- 70 -

Điều này cũng có nghĩa là nếu xấp xỉ được dxn trong miền hợp lệ của x và

u bởi bộ xấp xỉ vạn năng 1( , , ) : n pF u x θ với pθ là véctơ tham

số chỉnh định được của bộ xấp xỉ và tìm được véctơ tham số θ thỏa mãn:

( , , ) ( , )dxnF u u W x θ x (3-9)

với 0W thì vấn đề sai số xấp xỉ nx nêu trên cũng sẽ được giải quyết bằng

cách thay thế Φ( , )ux bằng ( , , )F u x θ trong luật điều khiển phản hồi (2-39)

hoặc (2-42) hay với thành phần bù:

( , , )

sign( )( )

c

F uu E

g

x θ

x

hoặc

( , , )bsig( , )

( )c

F uu E

g

x θ

x

(3-10)

có thể giảm trừ được ảnh hưởng của sai số trong phép thay thế như đã phân tích

trong Chương 2.

Như vậy vấn đề xấp xỉ nx với sai số W lại trở thành vấn đề xấp xỉ dxn với

sai số W trong phương pháp. Do nx có thể tính được từ các số liệu đo nên với

giả thiết số liệu đo đầy đủ, dxn theo công thức (3-8) luôn xấp xỉ được bởi bộ

xấp xỉ vạn năng ( , , )F u x θ các hàm liên tục vô hướng thuộc lớp hàm

,( 1, )c un x trong miền đóng 1

,n

u x với sai số bất kỳ. Lưu ý là dxn

còn có thể viết như sau:

( , ) ( ) ( )dxn nu f g u x x x x (3-11)

Tuy nhiên do ( , , )F u x θ không liên tục nên với thành phần bù (3-10), tín

hiệu điều khiển cũng không liên tục. Để giải quyết vấn đề này tác giả đề xuất sử

dụng thành phần bù liên tục có dạng:

( , , )

bsig , ( , , )( )

cF u

u EF ug

x θ

x θx

(3-12)

với 0 1 , 0 và u định nghĩa như (2-28) khi đó tín hiệu điều khiển phản

hồi được tính như sau:

- 71 -

1 ( ) 1

( ) ( ) ( , , ) bsig , ( , , )

c

n T

u u u

g r f F u EF u

x η e x x θ x θ

(3-13)

Phát biểu của Định lý 3 dưới đây giải quyết vấn đề còn tồn tại của phương

pháp trong trường hợp ( ) 0g x và ( )f x thay thế không thỏa mãn điều kiện

(2-34) và được gọi là Định lý 1 mở rộng trong trường hợp điều kiện (2-34)

không được đáp ứng.

Định lý 3 : (Định lý 1 mở rộng) Điều kiện để phương trình động học hệ sai số

(2-20) với luật điều khiển phản hồi tĩnh (3-13) có nghiệm bị chặn tới hạn đều

theo (2-26) là bộ xấp xỉ vạn năng 1( , , ) : n pF u x θ xấp xỉ (3-11) với

sai số W bị chặn bởi:

2_ max

20 μ ( , )EW W

(3-14)

trong miền hợp lệ của xx và uu , trong đó _ maxμ ( , )E tính theo

công thức (2-63) và W là sai số thiết kế theo (2-34).

Chứng minh

Để chứng minh Định lý 3 ta cần chỉ ra rằng bằng luật điều khiển phản hồi

(3-13) chứa đại lượng bù (3-12) thì đạo hàm của hàm Lyapunov cũng thỏa mãn

(2-23).

Ký hiệu ( , , )F F u x θ và ( , , )F F u x θ thì từ phương trình động học

của hệ sai số ( ) ( , )c dxnE E g u u x x suy ra:

2

2

2

( ) ( , )

1bsig( , )

1sign( ) bsig( , )

c dxn

dxn

dxn

V E Eg u E u

E EF EF E

E E F E EF

x x

- 72 -

Do sign( )sign( ) sign( )E F EF và dxn dxnF F W hay

dxn F W nên:

2

2

22

2

_ max

1sign( )sign( ) bsig( , )

1sign( ) bsig( , )

1 1μ ( , )

2 2

1μ ( , )

2

E

E

V E E W E F E F EF

E E W EF EF EF

WV W E EF

WV

(3-15)

với μ ( , , )E E được định nghĩa như (2-61) và _ maxμ ( , , ) μ ( , )E EE với

mọi thỏa mãn 0 1 , 0 và E theo Bổ đề 3 trang 40.

Rõ ràng để 0max ,E E E như (2-26), cần có 2

2

WV V

như

(2-23) nên từ (3-15) suy ra sai số của bộ xấp xỉ vạn năng dxnF W cũng

như phải đáp ứng điều kiện:

2_ max

20 μ ( , )EW W

,

2

_ maxμ ( , )2

EW

nên Định lý 3 được chứng minh.

Lưu ý trường hợp 1 , ta có _ max1.2785 0.5569

μ (1, ) μ (1, , )E E

nên điều kiện trên trở thành:

2 1.11380 W W

,

2

1.1138

W

▲

- 73 -

Trƣờng hợp hệ khả tuyến tính hóa phản hồi vào-ra

Tương tự như trên, xét trường hợp hệ là khả tuyến tính hóa phản hồi vào-ra

dạng (2-4) có hệ con phi tuyến là ISS và thỏa mãn Giả thiết 2. Nếu ( , )f x q ,

( , ) 0g x q là các hàm số thay thế liên tục bị chặn cho trước không thỏa mãn

điều kiện (2-85) nhưng thỏa mãn:

( , , ) ( , ) ( , ) ( , ) ( , )dxn u f f g g u W x q x q x q x q x q

với W W trong miền ,( , ) n d x qx q , uu và u là luật điều khiển

phản hồi theo (2-84) thì có thể sử dụng thành phần bù:

( , , , )

bsig , ( , , , )( , )

cF u

u EF ug

x q θ

x q θx q

(3-16)

với 0 1 , 0 để với luật điều khiển phản hồi tĩnh cu u u hay:

( ) 1( , ) ( , , , ) bsig , ( , , , )

( , )

c

n T

u u u

r f F u EF u

g

η e x q x q θ x q θ

x q

(3-17)

ta có x , q bị chặn đều theo Định lý 6.1 ([57]) tương tự như đã trình bày ở trên.

Lưu ý là trong trường hợp này ( , , )dxn u x q được xấp xỉ bởi bộ xấp xỉ vạn

năng 1( , , , ) : n d pF u x q θ các hàm liên tục vô hướng thuộc lớp hàm

, ,( 1, )c un d x q trong miền đóng 1

, ,n d

u x q với pθ là véctơ

tham số chỉnh định được và θ là véctơ tham số cần tìm thỏa mãn:

( , , , ) ( , , )dxnF u u W x q θ x q (3-18)

với W là sai số cần đạt thỏa mãn (3-14).

- 74 -

3.2.2. Xác định tham số bộ điều khiển

Các kết quả trong phần trước đã đề cập đến việc chọn tham số điều khiển

trong một số trường hợp tuy nhiên từ trước đến giờ ta luôn giả thiết rằng từ các

số liệu đo và dữ liệu đã biết về hệ thống đủ để thiết kế được bộ xấp xỉ đảm bảo

sai số xấp xỉ theo yêu cầu trong miền hợp lệ của n xx và uu . Tuy

nhiên trong thực tế miền hợp lệ x , u ở đây thực chất là miền mà bộ xấp xỉ

tìm được phải đảm bảo được sai số xấp xỉ theo yêu cầu và do vậy cần thiết kế

bộ điều khiển sao cho x và u không vượt ra ngoài x và u .

Nhằm xác định tham số điều khiển và các điều kiện cần trong phương pháp

đảm bảo các yêu cầu bị chặn trong miền hợp lệ của không gian trạng thái và tín

hiệu điều khiển, sau đây trình bày phương pháp tính toán. Để đơn giản các

phương pháp chỉ phân tích áp dụng cho trường hợp hệ khả tuyến tính hóa phản

hồi trạng thái. Trường hợp hệ khả tuyến tính hóa phản hồi vào-ra có thể áp dụng

các bước tính toán tương tự.

Xác định tham số điều khiển để quỹ đạo trạng thái bị chặn

Giả thiết rằng bằng phương pháp thay thế ước lượng như trên, luật điều

khiển phản hồi (2-28) đảm bảo sai số dxn W chỉ trong miền xx , uu

và : , 0nM Mx x x x x là siêu cầu chứa gốc tọa độ. Bài toán đặt ra

là cần xác định tham số điều khiển 1 1 2 1, , ,T

nk k k k η và các điều

kiện giới hạn khác để quỹ đạo trạng thái của hệ luôn nằm trong x hay Mxx

, 0Mx cho trước với mọi 0t . Khi đó cần xác định được E sao cho khi

EE thì xx .

Định lý 1 (trang 29) cho biết nếu điều kiện sai số được đảm bảo trong miền

hợp lệ của xx , uu thì hệ sai số có nghiệm bị chặn bởi (2-26). Như vậy

nếu định nghĩa 0: max ,E E E E E thì E chính là miền chứa

- 75 -

toàn bộ quỹ đạo của hệ sai số E hay EE với 0t . Do E luôn nằm trong

E nên không cần thiết phải có 0V khi E không nằm trong E hay khi

EE .

Mặt khác do hệ sai số được lập thỏa mãn Giả thiết 1 (Bổ đề 1 trang 23) nên

từ kết quả chứng minh trong mục 5.2 trang 136 phần Phụ lục, suy ra x bị chặn

bởi:

1

1

1 ( , )E

n

M ii

r E k t E

dx

với 2 2 ( )1 1

0

( , ) e (0) e ( )E

t-p t -p t

Et E p p E d d d và 1p , 2p được chọn

thỏa mãn 21e e

t -p tpkA .

Nếu chọn 0 0E thì từ (2-26) suy ra E E và:

2 2( ) 1 11

2 20

11

21

( , ) e 1

1

E

t-p t p t

n

M ii

p W p Wt E p E d e

p p

W p Wr k

p

d

x

Do vậy để Mxx cần thiết chọn các tham số điều khiển thỏa mãn:

1

2 11

2

1

( )

n

ii

M M

p p kW

p x r

(3-19)

Xác định tham số điều khiển để tín hiệu đầu vào điều khiển bị chặn

Sau đây xét bài toán điều khiển với điều kiện đầu vào (3-13) cần giữ trong

miền :u Mu u u , 0Mu hay Mu u cần đảm bảo với 0t .

Ngoài ra cũng giả thiết rằng 0 ( )Lg g x .

- 76 -

Dựa theo phương pháp tính toán trình bày trong [48] áp dụng trong trường

hợp này, bổ đề sau cho biết điều kiện và cũng là cách xác định tham số điều

khiển trong phương pháp thay thế ước lượng hàm trạng thái để luật điều khiển

phản hồi trong Định lý 3 bị chặn.

Bổ đề 5 : (Tính bị chặn của luật điều khiển) Luật điều khiển phản hồi (3-13)

đảm bảo uu với :u Mu u u nếu ML

W Wu

g

và điều kiện

(3-22) được thỏa mãn.

Chứng minh

Nếu ( )f x , ( )g x là các hàm liên tục Lipschitz cục bộ thì có thể xác định

được các hằng số fK , gK để:

( ) ( )

( ) ( )

f

g

f f K

g g K

x x x x

x x x x

với , xx x . Mặt khác từ (3-13) và do x e r nên có thể phân tích:

( )

( )

1( ) ( , , ) bsig , ( , , )

( )

( ) ( ) ( ) bsig( , ) ( )

( ) ( ) ( )

n T

n T

r f F u EF u

ug

r f f f F EF g

g g g

η e x x θ x θ

x

η e e r r r r

r r e r

Với giả thiết 0 ( )Lg g x tiếp tục biến đổi được như sau:

- 77 -

( )

( )

( )

( ) ( ) ( ) bsig( , )

( ) ( ) ( ) ( )

( ) ( )1

( )

( )1

( ) ( ) ( ) ( ) ( )

( )

( )

n T

nf g

n

fL L

r f f f F EFu

g g g g

g g

g

FK Kr f

g g g g g

r f W WK

g g g

r r e r η e

r r r r

e r r

e r

e eη er

r r r r e r

erη

r

1 g

L

Kg

e

do dxn dxnF F W F W W và W W là sai số xấp xỉ

thực nx do phép thay thế gây nên theo (3-8).

Như vậy để Mu u cần thiết:

( ) ( )

( )1

nM

fL L

gL

r f u W WK u

g g gK

g

erη

er

(3-20)

Từ (2-26) ta có 0max ,TE E E k e nên

0( ) max , Mt K E E e e , 0Me . Khi đó định nghĩa:

1

M Mf

M L Lg

L

u e W WM K

e g gK

g

η

(3-21)

thì M u và nếu 0M thì điều kiện (3-20) luôn thỏa mãn. Để 0M cần có:

2

1

0

M MM g f

L L L

M Mg f f g M

L L L L

e e W Wu K K

g g g

e W W e W WK K K K u

g g g g

η

η η

- 78 -

là dạng bất phương trình bậc hai 2 0Az Bz C với 0g fA K K η ,

0f gL

W WB K K

g

η

, ML

W WC u

g

và 0M

L

ez

g . Gọi 1 2z z là

hai nghiệm của đa thức bậc hai nêu trên thì bất phương trình có nghiệm

1 2z z z .

Do nếu 0C thì đa thức bậc hai trên có hai nghiệm thực không dương nên

cần thiết 0C hay ML

W Wu

g

để đa thức có một nghiệm dương. Khi đó:

2

0 24

0 max ,2L

K B B ACz E E z

g A

và như vậy để 0M cần chọn:

2

04

max ,2

LB B AC gE E

A K

và

( ) ( )

( )

nr fM

g

r

r

(3-22)

để tín hiệu điều khiển luôn nằm trong u hay Mu u .

Kết quả trên chứng minh cho phát biểu của Bổ đề 5. Lưu ý là Bổ đề 5 không

chỉ cho phép tính toán tham số của bộ điều khiển (nếu tồn tại) để tín hiệu điều

khiển bị chặn trong u mà còn là cơ sở để kết luận có thể điều khiển bám theo

tín hiệu mẫu cho trước với sai số thiết kế và các điều kiện ban đầu được chọn

của hệ sai số hay không.

▲

- 79 -

3.2.3. Mô phỏng điều khiển tay rôbốt

Để minh họa sau đây là một ví dụ áp dụng phương pháp trong điều khiển tay

rôbốt theo quỹ đạo định trước. Để đơn giản, xét mô hình đơn thanh nối (flexible

single-link) có phương trình động lực học như sau ([50]):

1 1 1 2

2 1 2

sin ( ) 0

( )

Iq MgL q k q q

Jq k q q u

(3-23)

với 1q , 2q tương ứng là vị trí góc quay của thanh nối và trục động cơ; I , J là

mômen quán tính của thanh nối và trục động cơ; k là hệ số đàn hồi; g là gia tốc

trọng trường; M là khối lượng thanh nối; L là khoảng cách từ trục tới trọng

tâm của thanh nối và u là lực quay đầu vào của motor. Các số liệu cho trước

gồm: 20.04Nms /radI J , 0.8Nm/radk , 0.1mL , 6kgM , 29.8m/sg

. Bài toán đặt ra là cần điều khiển vị trí góc quay 1q hay 1y q theo quỹ đạo r

định trước.

Phương trình động lực học (3-23) và đầu ra có thể chuyển về dạng tuyến tính

hóa phản hồi trạng thái sau (xem chi tiết trong mục 5.4 trang 143 phần Phụ lục):

1 2

2 3

3 4

24 2 1 1 3

1

sin cos

x x

x x

x x

x a x c x a x b c x bdu

y x

(3-24)

với MgL

aI

, k

bI

, k

cJ

, 1

dJ

chính là dạng quen thuộc (2-6) với

22 1 1 3( ) sin cosf a x c x a x b c x x và ( )g bdx .

Sau đây giả thiết rằng các trạng thái của hệ (3-24) đo được, trong khi ( )f x ,

( )g x chưa biết đầy đủ. Ta cần điều khiển vị trí góc quay của thanh nối theo quỹ

đạo định trước ( ) sin(0.5 )cos(0.1 )3

r t t t

với trạng thái ban đầu (0) x 0 .

- 80 -

Để mô phỏng phương pháp đề xuất, sau đây thay thế các hàm trạng thái chưa

biết bằng các hàm số 2 2 1 2 2 2 3( ) sin ( )f a c x a b c x x và 2 2( )g b dx với

2a a , 2 0.9b b , 2 1.1c c , 2 1.3d d . Phép thay thế trên dẫn đến sai số lớn

trong điều khiển bám theo tín hiệu mẫu như kết quả mô phỏng trên Hình 8. Các

đồ thị trên Hình 8 này, theo thứ tự biểu diễn đồ thị theo thời gian sai lệch của

phép thay thế ( ) ( )f f f x x , ( ) ( )g g g x x ; tín hiệu đầu vào điều khiển

u (khi không có thành phần bù); tín hiệu mẫu ( )r t và đáp ứng đầu ra.

Để thiết kế thành phần bù trong phương pháp, mô phỏng sử dụng bộ xấp xỉ

mờ nơron ANFIS với 5 đầu vào (bao gồm véctơ trạng thái x và đầu vào điều

khiển u ). Như vậy cùng với giả thiết số liệu đo là đầy đủ, bộ xấp xỉ mờ nơron

ANFIS luôn xấp xỉ được dxn với sai số nhỏ tùy ý. Tuy nhiên để kích cỡ bộ xấp

xỉ không quá lớn và tốc độ mô phỏng nhanh hơn, ta có thể chấp nhận sai số xấp

xỉ lớn hơn bằng cách mỗi đầu vào ANFIS chỉ sử dụng 2 hàm liên thuộc dạng

hình chuông (hàm gbellmf trong MATLAB V6.5) để xấp xỉ ( , )dxn u x và sẽ

chọn các tham số và để chất lượng điều khiển đáp ứng được yêu cầu thiết

kế.

Hình 9 và Hình 10 tương ứng biểu diễn kết quả mô phỏng điều khiển khi sử

dụng thành phần bù là bộ xấp xỉ mờ nơron ANFIS đã luyện nêu trên trong luật

điều khiển phản hồi tĩnh (3-13) với 1 , 1.0 và 1 , 0.8 . Tương tự

như trường hợp mô phỏng không có thành phần bù, các đồ thị trong Hình 9 và

Hình 10 theo thứ tự biểu diễn đồ thị thời gian của sai lệch do phép thay thế gây

ra; tín hiệu đầu vào điều khiển cu u u có chứa thành phần bù; tín hiệu mẫu

( )r t và đáp ứng đầu ra trong mỗi trường hợp. Chất lượng điều khiển tốt hơn

trong trường hợp 0.8 so với trường hợp 1.0 minh họa cho việc sử dụng

hàm _ maxμ ( , )E để phân tích giới hạn bị chặn của hệ sai số trong phương

pháp.

Có thể tham khảo toàn bộ mã code chương trình mô phỏng viết trên Matlab

V6.5 trong mục 5.4 trang 143 phần Phụ lục.

- 81 -

Hình 8 : Mô phỏng trong trường hợp không sử dụng thành phần bù

0 5 10 15 20 25 30 35 40 45 50-300

-200

-100

0

100

200

300 = 0

t [s]

f(x), g(x

)

f(x)

g(x)

0 5 10 15 20 25 30 35 40 45 50-2

-1.5

-1

-0.5

0

0.5

1

1.5

2 = 0

t [s]

u

0 5 10 15 20 25 30 35 40 45 50

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

= 0

t [s]

r, y

Reference signal

Plant's output

- 82 -

Hình 9 : Mô phỏng sử dụng thành phần bù tĩnh với 1 và 1.0

0 5 10 15 20 25 30 35 40 45 50-300

-200

-100

0

100

200

300 = 1, = 1.0

t [s]

f(x), g(x

)

f(x)

g(x)

0 5 10 15 20 25 30 35 40 45 50-3

-2

-1

0

1

2

3

4

5 = 1, = 1.0

t [s]

u

0 5 10 15 20 25 30 35 40 45 50

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

= 1, = 1.0

t [s]

r, y

Reference signal

Plant's output

- 83 -

Hình 10 : Mô phỏng sử dụng thành phần bù tĩnh với 1 và 0.8

0 5 10 15 20 25 30 35 40 45 50-300

-200

-100

0

100

200

300 = 1, = 0.8

t [s]

f(x), g(x

)

f(x)

g(x)

0 5 10 15 20 25 30 35 40 45 50-3

-2

-1

0

1

2

3

4

5

6

7 = 1, = 0.8

t [s]

u

0 5 10 15 20 25 30 35 40 45 50

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

= 1, = 0.8

t [s]

r, y

Reference signal

Plant's output

- 84 -

3.3. Thay thế ƣớc lƣợng hàm trạng thái mở rộng trong điều khiển ổn

định các hệ khả tuyến tính hóa phản hồi chặt

3.3.1. Phương pháp cuốn chiếu

Phương pháp thay thế ước lượng hàm trạng thái có thể áp dụng trong trường

hợp hệ khả tuyến tính hóa phản hồi chặt (strict-feedback system) có phương

trình động học và đầu ra ở dạng:

1 1 1 1 1 2

1 1 1 1 1 1 1

1

( ) ( )

( , , ) ( , , )

( ) ( )

n n n n n n

n n n

x f x g x x

x f x x g x x x

x f g u

y x

x x

(3-25)

trong đó 1, ,Tnx xx là các trạng thái đo được của hệ; if , ig ( 1..i n ) là

các hàm trơn liên tục bị chặn và 0ig với xx .

Dạng biểu diễn phản hồi chặt có thể gặp trong phân tích phần lớn các hệ

chuyển động hỗn loạn (chaotic systems) như trong công nghiệp hóa chất điều

khiển nồng độ pha trộn của các thành phần hóa học hoặc các chuyển động dòng

chảy. Một số ví dụ về các mô hình chuyển động hỗn loạn và phương pháp điều

khiển gồm Duffling oscillator ([96]), van der Pol oscillator ([50]), Brusselator

([107]) và Lorenz ([37], [87]).

Phương pháp thiết kế bộ điều khiển ổn định tĩnh để đầu ra của hệ luôn bám

theo tín hiệu mẫu ( )r t bị chặn cho trước trong trường hợp các hàm trạng thái if

, ig đã biết (trường hợp 1) dựa trên phương pháp cuốn chiếu (integrator

backstepping) được trình bày chi tiết trong [51], [57]. Theo đó bằng cách lập hệ

sai số cho các hệ con lần lượt từ hệ con 1x để hình thành nên hệ sai số chung

của toàn hệ 1, ,TnE EE với 1 1E x r và 1i i iE x u , 2..i n trong

đó:

1 1 1i i i i ii

i

f u g E Eu

g

, 0

- 85 -

thì phương trình động học của hệ sai số có thể chuyển về dạng tổng quát sau:

( , ) ( )t u E α x β x

với

1 1 2

2 2 1 1

1

( , )

( )

n n n n n

n n

E g E

tg E E g E

u f

α x

x

và

0

( )0

( )ng

β x

x

.

Sử dụng luật điều khiển phản hồi 1 1 1( )

( )

n n n n n

n

f u E g Eu

g

x

x

và

chọn hàm Lyapunov 2

1

1

2

n

n ii

V E

sẽ dẫn đến 2n nV V nên suy ra E 0 là

điểm cân bằng ổn định theo hàm số mũ và E bị chặn. Ngoài ra do hệ sai số

được lập thỏa mãn Giả thiết 1 nên E bị chặn cũng có nghĩa là x bị chặn nên

bài toán bám trong trường hợp 1 đã được giải quyết.

3.3.2. Phương pháp thay thế ước lượng hàm trạng thái khi hệ chứa các

thành phần không rõ

Trƣờng hợp điều kiện sai số xấp xỉ thỏa mãn

Sau đây xét trường hợp tổng quát khi các hàm trạng thái ( )i if x , ( )i ig x (

1..i n ) đều chứa thành phần chưa biết (trường hợp 2) nhưng với giả thiết rằng

từ các số liệu đo và hiểu biết về hệ thống ta có thể xác định được các cặp hàm

( )i if x , ( )i ig x thay thế tương ứng sao cho sai số xấp xỉ ix thỏa mãn:

( , ) ( ) ( ) ( ) ( )dxi i i i i i i i i i i i iu f f g g u W x x x x x (3-26)

với xx , ii uu và 0iW cho trước, trong đó ký hiệu 1[ , , ]Ti ix xx ,

1..i n và n x x . Khi đó tiếp tục áp dụng phương pháp cuốn chiếu như trong

trường hợp 1, ta có thể lần lượt định nghĩa các hệ con để hình thành hệ sai số

chung của toàn hệ như sau:

- 86 -

Hệ con 1x :

1 1 1 1 1 1 1 1 1 1( ) ( ) ( ) ( ) dxx f x g x u f x g x u

Định nghĩa hệ sai số cho hệ con 1x là 1 1E E x r , khi đó động học của

hệ sai số sẽ là 1 1 1 1 1 1( ) ( ) dxE f x g x u r với 2u x là đầu vào ảo. Chọn

hàm Lyapunov 21 1

1

2V V E và sử dụng luật điều khiển phản hồi ảo:

11 1 1 1u u g r f E

dẫn đến 1 1 1dxE E và đạo hàm của V theo quỹ đạo động học của hệ sai

số có thể biến đổi như sau:

1 1 1 1 1 1 1

21 1 1

2 21

1 1 1

21

1

( ) ( ) ( )

1

2 2

2

dx

dx

V E E f x g x u r

E E

WV W E

WV

nên áp dụng Bổ đề 2.1 ([57]) với 1m , 2

12

2

Wm

dẫn đến 1V V bị chặn và

do đó 1E E cũng bị chặn.

Hệ con 2x :

1 1 1 1 1 2 1 1 1 1 2 1

2 2 1 2 2 1 2 2 1 2 2 1 2 2

( ) ( ) ( ) ( )

( , ) ( , ) ( , ) ( , )

dx

dx

x f x g x x f x g x x

x f x x g x x u f x x g x x u

Định nghĩa hệ sai số cho hệ con 2x là 1 2,T

E EE với 1 1E x r ,

2 2 1E x u , 3u x là đầu vào ảo mới, khi đó:

- 87 -

1 1 1 2 1 1 1

1 1 1 1 1 2

1 1 2 1

dx

dx

dx

E f g x u u r

f g u r g E

E g E


21 1 2 2

1

1( ) ( ) ( )

2i

i

V V E V E E

E thì:

1 21 2

1 2

1 1 1 2 1 2 2 1

1 1 1 2 2 2 2 2 1

21

1 1 1 2 2 2 2 2 1

( )

( )

2

dx

dx

dx

V VV E E

E E

E E g E E x u

V E g E E E f g u u

WV g E E E f g u u

E

Sử dụng luật phản hồi:

12 2 2 1 1 1 2u u g f u g E E

dẫn đến 2 2 2 2 1 1 1 2 2dx dxE f g u u g E E và:

221

1 2 2 2

2 2 21 2

1 2 2 2

22

1

( )2

1

2 2 2

1

2

dx

ii

WV V E E

W WV V W E

V W

E

nên theo Bổ đề 2.1 ([57]) với 1m , 2

22

1

1

2i

i

m W

sẽ có ( )V E bị chặn và do

đó E cũng bị chặn.

- 88 -

Hệ nx :

1 1 1 1 1 2 1

2 2 1 2 2 1 2 3 2

1 1 1 1 1 1 1 ( 1)

1

( ) ( )

( , ) ( , )

( , , ) ( , , )

( ) ( )

dx

dx

n n n n n n dx n

n n n dxn

x f x g x x

x f x x g x x x

x f x x g x x x

x f g u

y x

x x

(3-27)

Bằng cách lập và tính toán lần lượt từng hệ con dẫn đến hệ sai số cho toàn hệ

được lập như sau:

1 1

2 2 1

1n n n

E x r

E x u

E x u

E

(3-28)

với 1 1, , nu u là các đầu vào ảo của các hệ con 1x đến 1nx sẽ được định nghĩa

sau. Chọn hàm Lyapunov 22

1 1

1 1( )

2 2

n n

i ii i

V V E

E E thì đạo hàm của V

theo quỹ đạo động học của hệ sai số sẽ là 1 1

( )n n

ii i i

ii i

VV E E E

E

E và có thể

biến đổi tiếp như sau:

1 1 1 2 1 1 1

1

1 12

1

1 1 1 1 1 1 1 2

1

1 12

1

( ) ( )

( )

dx

n

i i i i i i dxi ii

n n n dxn n

dx

n

i i i i dxi i i i ii

n n n dxn n

V E f g x u u r

E f g x u u u

E f g u u

E f g u r g E E

E f g u u g E E

E f g u u

E

- 89 -

Sử dụng luật phản hồi:

11 1 1 1 1

12 2 2 2 1 1 1 2

11 1 1 1 2 2 2 1

11 1 1

n n n n n n n n

n n n n n n n

u u g f r E

u u g f u g E E

u u g f u g E E

u u g f u g E E

(3-29)

dẫn đến phương trình động học của hệ sai số:

1 1 2 1

1 1 2 2 3 2

2 2 1 1 ( 1)

1 1

dx

dx

n n n n n dx n

n n n dxn

E g E

g E E g E

g E E g E

g E E

E

(3-30)

và đạo hàm của V theo quỹ đạo động học của hệ sai số:

2

1

2 2

1

22

1

( )

1

2 2

1

2 2

n

i i dxii

ni

i i ii

n

ii

V E E

WV W E

V W V

E

W

(3-31)

với 1, ,TnW WW là véctơ sai số xấp xỉ cho phép.

Áp dụng Bổ đề 2.1 ([57]) với 1m ,

2

22

m

W

sẽ có ( )V E bị chặn và do

đó E cũng bị chặn:

- 90 -

2

2

22

2

1 (0)2

1 (0)

t tH

t tH

V e V e V

e e E

W

WE E

(3-32)

Ngoài ra trong chế độ xác lập:

2

2lim

2H

tV V

W, lim H

tE E

W (3-33)

và tương tự như kết quả (2-26), ta còn có thể biểu diễn (3-32) như sau:

0

0

0 max ,

max ,

V V V E

E

E E (3-34)

với mọi 0t , 0 (0)E E là giá trị ban đầu của hệ sai số tại 0t và 2

0 01

2V E

.

▲

Lưu ý là để tính nu u cần thực hiện lần lượt các phép tính:

1 1 1 2 2 2 1 1 1, , ,n n n n nE u u E u u E u u E u u

và phương trình động học (3-30) của hệ sai số còn có thể viết ở dạng ma trận và

véctơ sau:

11

21 2

( 1)2 1

1

0 0

0

0

0 0

dx

dx

dx nn n

n dxn

d

g

g g

g g

g

x

E E

GE Δ

(3-35)

trong đó G là ma trận đối xứng lệch, dxΔ là véctơ sai số xấp xỉ các đạo hàm

trạng thái của hệ.

- 91 -

Trƣờng hợp điều kiện sai số xấp xỉ không thỏa mãn

Xét trường hợp tổng quát khi toàn bộ sai số xấp xỉ ix không thỏa mãn điều

kiện (3-26) hay giả thiết:

( , ) ( ) ( ) ( ) ( )dxi i i i i i i i i i i i iu f f g g u W x x x x x (3-36)

với xx , ii uu là các luật điều khiển phản hồi theo (3-29) và i iW W ,

1..i n . Khi đó tồn tại các bộ xấp xỉ vạn năng 1( , , ) : ipii i i iF u

x θ

để xấp xỉ được ( , )dxi i iu x bị chặn với sai số bất kỳ trong miền hợp lệ của ix

và iu . Sau đây ký hiệu ( , , )i i i i iF F u x θ , ( , , )i i i i iF F u x θ , iθ là các

véctơ tham số của các bộ xấp xỉ vạn năng thỏa mãn:

( , , ) ( , )i i i i dxi i i iF u u W x θ x (3-37)

với 0iW là sai số xấp xỉ của các bộ xấp xỉ vạn năng nêu trên và 1..i n .

Tiếp tục lập hệ sai số như (3-28) và áp dụng kết quả của Định lý 3 (trang 71)

bằng cách sử dụng các thành phần bù có dạng:

bsig( , )( )

iic i i

i i

Fu E F

g

x

(3-38)

với 0 1i , 0 trong luật điều khiển phản hồi i i icu u u trong đó bsig

là hàm xíchma lưỡng cực định nghĩa như (2-40) dẫn đến:

11 1 1 1 1 1 1 1

11 1 1

11 1 1

c c

i i ic i i i i i i i ic

n nc n n n n n n n nc

u u u g f r E g u

u u u g f u g E E g u

u u u g f u g E E g u

(3-39)

Khi đó phương trình động học của hệ sai số sẽ là:

- 92 -

1 1 2 1 1 1

1 1 2 2 3 2 2 2

2 2 1 1 ( 1) 1 ( 1)

1 1

dx c

dx c

n n n n n dx n n n c

n n n dxn n nc

E g E g u

g E E g E g u

g E E g E g u

g E E g u

E

(3-40)

và đạo hàm của V theo quỹ đạo động học của hệ sai số:

2

1

2

1

( )

1sign( ) bsig( , )

n

i i dxi i i ici

n

i i i dxi i i i iii

V E E E g u

E E F E E F

E

Do dxi i i dxi i dxi i iF F W F W nên:

2

1

1( ) sign( ) bsig( , )

n

i i i dxi i i i iii

V E E F E E F

E

với μ ( , , )E i E được định nghĩa như (2-61) và _ maxμ ( , , ) μ ( , )E i E iE

với 0 1i , 0 và E (Bổ đề 3 trang 40) hay:

2E_max

1

μ ( , )

2

ni

ii

V V

W (3-41)

trong đó ký hiệu 1, ,T

nW W W là véctơ sai số xấp xỉ của các bộ xấp xỉ

vạn năng iF như (3-37).

Để 0max ,EE E như (3-34) ta cần có

2

2V V

W theo (3-31)

nên từ (3-41) suy ra:

2 2E_max

1

μ ( , )

2 2

ni

ii

W W

hay sai số của các bộ xấp xỉ vạn năng W và cần chọn phải đáp ứng các điều

kiện sau:

- 93 -

2 E_max

1

μ ( , )2

ni

ii

W W (3-42)

và

2

E_max1 1

μ ( , )2

n n

i ii i

W

với 1, ,T

nW WW là véctơ sai số xấp xỉ theo thiết kế.

▲

Lưu ý là nếu chọn i với 1..i n thì (3-41) có thể rút gọn:

2

E_maxμ ( , )2

nV V

W

và điều kiện (3-42) trở thành:

2

E_max2

μ ( , )n

W W và

2

E_maxμ ( , )2 n

W.

3.4. Tổng hợp và kết luận

Chương 3 phát triển phương pháp thay thế ước lượng hàm trạng thái để giải

quyết vấn đề còn tồn tại trong Định lý 1 (trang 29) khi điều kiện sai số xấp xỉ

(2-34) không được thỏa mãn. Phương pháp dùng bộ xấp xỉ vạn năng mờ nơron

để xấp xỉ sai số gây nên bởi phép thay thế trong miền hợp lệ đóng của không

gian trạng thái và đầu vào, từ đó sử dụng thành phần bù liên tục (3-12) dựa trên

hàm xíchma lưỡng cực (2-40) đưa vào luật điều khiển phản hồi nhằm giảm trừ

tác động của sai số và để bảo đảm nghiệm của hệ sai số vòng kín bị chặn tới hạn

đều theo yêu cầu thiết kế (Định lý 3 trang 71).

Mặt khác nhằm xác định tham số điều khiển và các điều kiện cần trong

phương pháp đảm bảo các yêu cầu bị chặn trong miền hợp lệ của không gian

trạng thái và tín hiệu điều khiển, luận án đã đưa ra phương pháp tính toán trong

mỗi trường hợp trình bày dưới dạng công thức (3-19) và Bổ đề 5 (trang 76).

- 94 -

Ngoài ra luận án cũng chỉ ra rằng với một số điều kiện ràng buộc có thể áp

dụng phương pháp thay thế ước lượng hàm trạng thái để thiết kế bộ điều khiển

ổn định tĩnh các hệ chuyển động hỗn loạn (chaotic systems) thường gặp trong

công nghiệp hóa chất như điều khiển nồng độ pha trộn của các thành phần hóa

học hoặc các chuyển động dòng chảy có phương trình động học ở dạng tuyến

tính hóa phản hồi chặt (kết quả (3-38), (3-39) và (3-42)).

Phương pháp thay thế ước lượng đề xuất có các đặc điểm sau:

- Bộ điều khiển tĩnh có đặc tính bền vững và tín hiệu điều khiển liên tục nên

có thể áp dụng trong điều khiển công nghiệp.

- Quá trình thiết kế không cần phải xây dựng mô hình phức tạp hoặc xấp xỉ

chính xác từng hàm trạng thái không rõ trong phương trình động học do

phương pháp chỉ xấp xỉ chung các đại lượng không rõ dựa trên tri thức đã

biết về hệ thống.

- Có thể giảm trừ được tác động của nhiễu hoặc động học chưa biết khác trong

phương trình động học nhờ phương pháp bù sai lệch được xấp xỉ trong miền

hợp lệ của không gian trạng thái và đầu vào.

- Không phải giải quyết vấn đề ( ) 0g x (như nhiều phương pháp đã nêu trong

phần tổng hợp ở đầu Chương 2) do có thể chọn ( )g x trước để tránh trường

hợp này ngay từ ban đầu.

- Số lượng đầu vào bộ xấp xỉ vạn năng được xác định trước, lớn nhất là 1n

với n là số trạng thái của hệ.

Các kết quả trình bày trong chương này có thể tổng hợp lại thành các bước

tổng hợp bộ điều khiển ổn định tĩnh theo phương pháp thay thế ước lượng hàm

trạng thái khi điều kiện xấp xỉ không thỏa mãn như sau:

1. Dựa trên các số liệu đo và hiểu biết về hệ, tìm cách lập các hàm trạng thái

liên tục bị chặn ( )f x , ( ) 0g x tốt nhất có thể thay thế ( )f x , ( )g x chứa

các thành phần không rõ. Xác định các điều kiện ràng buộc về trạng thái

và đầu vào cần đáp ứng theo yêu cầu thiết kế, sử dụng các kết quả (3-19)

- 95 -

và Bổ đề 5 để xác định E sao cho khi EE thì luôn có xx và

uu .

2. Lựa chọn cấu trúc bộ xấp xỉ mờ nơron 1( , , ) : n pF u x θ phù

hợp để xấp xỉ ( ) ( )dxn nf g u x x x với pθ là véctơ tham số

chỉnh định, u là luật điều khiển phản hồi không chứa thành phần bù như

(2-28) và chuẩn bị cơ sở dữ liệu đo cần thiết dùng để luyện ngoại tuyến

bộ xấp xỉ mờ nơron trong miền hợp lệ của x và u .

3. Chỉnh định ngoại tuyến bộ xấp xỉ mờ nơron ( , , )F u x θ , xác định tham số

θ của bộ xấp xỉ mờ nơron đáp ứng điều kiện ( , , ) dxnF u W x θ với

sai số cần đạt thỏa mãn (3-14) trong miền hợp lệ của xx và uu

(hay trong miền hợp lệ của EE , lưu ý điều kiện sai số xấp xỉ không

cần đáp ứng ngoài miền hợp lệ). Trường hợp bộ xấp xỉ không đáp ứng

được yêu cầu thiết kế, cần thiết quay lại các bước 1, 2 ở trên để thay đổi

lại phép chọn các hàm f , g và/hoặc mở rộng cấu trúc (hay số lượng

tham số chỉnh định được) của bộ xấp xỉ mờ nơron.

4. Sử dụng bộ xấp xỉ mờ nơron tìm được thỏa mãn yêu cầu làm thành phần

bù trong luật điều khiển phản hồi (3-13).

Như vậy, những kết quả đạt được trong Chương 3 đủ để thiết kế bộ điều

khiển ổn định tĩnh cho bài toán đã nêu. Tuy nhiên do bộ điều khiển là tĩnh nên

luật điều khiển phản hồi chỉ đảm bảo sai số bị chặn theo yêu cầu thiết kế và do

vậy trong nhiều trường hợp, khi phải thiết kế bộ điều khiển bền vững hơn như

yêu cầu sai số giảm dần về 0 trong chế độ xác lập, ta cần thiết phải áp dụng luật

điều khiển động (thích nghi). Vấn đề mở rộng phương pháp theo hướng áp dụng

luật điều khiển thích nghi cho yêu cầu thiết kế này là mục tiêu giải quyết trong

chương tiếp theo của luận án.

- 96 -

CHƢƠNG 4

ĐIỀU KHIỂN THÍCH NGHI TRỰC TIẾP DÙNG HỆ MỜ

NƠRON TRONG PHƯƠNG PHÁP THAY THẾ ƯỚC LƯỢNG

HÀM TRẠNG THÁI

4.1. Giới thiệu chung

4.1.1. Sự cần thiết phát triển bộ điều khiển thích nghi

Phần trước của luận án đã trình bày các kết quả nghiên cứu về điều khiển ổn

định (tĩnh) các hệ thống khả tuyến tính hóa phản hồi trạng thái (khi hệ có bậc

tương đối đầy đủ) và khả tuyến tính hóa phản hồi vào-ra (khi hệ có bậc tương

đối thiếu) bằng phương pháp thay thế ước lượng các hàm trạng thái trong các

trường hợp để nghiệm của hệ sai số bị chặn theo yêu cầu. Phương pháp được

xây dựng dựa trên đặc tính bền vững của hệ sai số bằng cách đưa thêm thành

phần bù liên tục vào luật điều khiển phản hồi nhằm loại trừ các thành phần

không rõ xuất hiện trên đầu vào của hệ và để hệ sai số vòng kín bị chặn tới hạn

đều. Ngoài ra lưu ý là luật điều khiển phản hồi trong các trường hợp phân tích ở

trên (Định lý 1 trang 29 và Định lý 3 trang 71) là tĩnh (không thích nghi) và bao

gồm thành phần tuyến tính hóa và thành phần ổn định.

Tuy nhiên trong nhiều ứng dụng thực tế, xu hướng thiết kế thay thế luật điều

khiển tĩnh bằng luật điều khiển thích nghi ngày càng tăng cho dù việc thay thế

có phức tạp hơn. Lý do là mặc dù luật điều khiển tĩnh có thể nâng cao tính bền

vững của hệ vòng kín nhưng do dùng hệ số khuếch đại phản hồi lớn nên có thể

dẫn đến tới hạn của cơ cấu chấp hành hoặc kích thích động học chưa biết khác

gây ra mất ổn định của hệ. Mặt khác các kết quả trong phần trên còn cho thấy

việc sử dụng luật điều khiển tĩnh không đảm bảo rằng hệ sai số 0E .

Nhằm tiếp tục mở rộng phạm vi áp dụng của phương pháp, trong chương

này luận án đi vào xây dựng mô hình toán học của luật điều khiển phản hồi

động (thích nghi) dựa trên luật điều khiển phản hồi tĩnh (3-13) sử dụng bộ xấp

- 97 -

xỉ mờ nơron trong phương pháp thay thế ước lượng hàm trạng thái (Định lý 3

trang 71). Hướng điều khiển thích nghi cho phép phát triển bộ điều khiển bền

vững hơn so với bộ điều khiển không thích nghi trình bày trong chương trước.

Như chúng ta đã biết, mục tiêu của điều khiển thích nghi là điều khiển ổn

định các hệ thống có các đặc tính không rõ. Mặc dù có nhiều định nghĩa khác

nhau, tuy nhiên trong luận án này hệ điều khiển thích nghi được hiểu theo định

nghĩa sau ([68]): “Hệ điều khiển thích nghi là hệ điều khiển có các tham số có

thể chỉnh định được cũng như có một cơ chế để chỉnh định các tham số này”.

Như vậy theo cách định nghĩa trên có thể hiểu hệ điều khiển thích nghi gồm hai

vòng phản hồi, một vòng phản hồi thông thường và một vòng dùng để chỉnh

định tham số, trong đó vòng chỉnh định tham số có thể đáp ứng chậm hơn so với

vòng phản hồi thông thường.

Thực tế luật điều khiển thích nghi được xây dựng theo một trong hai phương

pháp: trực tiếp hoặc gián tiếp. Đối với phương pháp điều khiển thích nghi trực

tiếp, các tham số trong luật điều khiển được thay đổi trực tiếp trong quá trình

điều khiển để tạo thành hệ vòng kín ổn định còn trong phương pháp điều khiển

thích nghi gián tiếp, thành phần luật điều khiển ổn định được ước lượng trước

(tùy theo dạng của các thành phần không rõ trong hệ) và sau đó mới kết hợp lại

để tạo thành luật điều khiển chung.

Nhằm phát triển phương pháp thay thế ước lượng hàm trạng thái cho phép

tổng hợp bộ điều khiển thích nghi trực tiếp dựa trên bộ điều khiển tĩnh đã xây

dựng trong các chương trước, chương này của luận án sẽ đi vào phân tích các

vấn đề để xác định luật điều khiển thích nghi và chỉnh định tham số phù hợp

cho giải quyết bài toán bám đã nêu ở trên. Phần lớn dựa trên lý thuyết điều

khiển thích nghi trực tiếp phân tích dùng hệ sai số được trình bày trong tài liệu

[57], các kết quả trong chương này là tổng hợp các cơ sở toán học để có thể xây

dựng bộ điều khiển thích nghi trực tiếp phù hợp trong phương pháp thay thế ước

lượng hàm trạng thái sử dụng bộ xấp xỉ mờ nơron.

- 98 -

4.1.2. Vấn đề và cơ sở toán học xây dựng bộ điều khiển thích nghi trực tiếp

Đối với điều khiển thích nghi trực tiếp, phương pháp thiết kế xuất phát từ cơ

sở toán học chung ([57]) dùng để giải quyết lớp bài toán quy được về dạng ổn

định hệ sai số ( , )E t x có phương trình động học:

( , ) α( , ) β( )E t t u x x x (4-1)

với x là véctơ trạng thái của hệ và với giả thiết rằng tồn tại luật điều khiển tĩnh

( )su u z có z đo được để với hàm Lyapunov ( , )sV t E giảm dần, không bị

chặn theo tia (radially unbounded) luôn có 1 2s sV m V m , 1 0m , 2 0m

theo quỹ đạo (4-1). Lưu ý là dạng tổng quát của hệ sai số (4-1) bao trùm toàn bộ

các hệ sai số được lập trong bài toán bám của hệ khả tuyến tính hóa phản hồi

trạng thái và khả tuyến tính hóa phản hồi vào-ra đã phân tích trong phần trước

do trong mỗi trường hợp véctơ trạng thái x trong phương trình (4-1) được xem

tương ứng là x và ,T

T T x q .

Với giả thiết trên, vấn đề đặt ra trong phương pháp của luận án là cần tìm

luật điều khiển phản hồi động (hay luật điều khiển thích nghi)

ˆ, ( )a s du u u t z θ với su là luật điều khiển phản hồi tĩnh, ˆ, ( )du tz θ là

thành phần bù động và ˆ( )tθ là tham số chỉnh định được của hệ thích nghi cũng

như xác định được cơ chế chỉnh định tham số ˆ ˆ( , , , )t uθ x θ để với thành phần

bù động du , luật điều khiển thích nghi au sẽ đảm bảo hệ sai số vòng kín ổn

định. Từ đó có thể xác định được bộ điều khiển thích nghi để E và , x θ bị

chặn. Lưu ý ký hiệu luật điều khiển phản hồi tĩnh su trong mỗi trường hợp của

phương pháp (theo Định lý 1 trang 29 và Định lý 3 trang 71) tương ứng sẽ là

su u như (2-28) hoặc s cu u u như (3-13).

Tuy nhiên do thành phần bù liên tục cu theo (3-12) chứa bộ xấp xỉ

( , , )F u x θ có tham số chỉnh định được nên có thể dùng làm thành phần bù

động du trong cả hai trường hợp nếu xác định được luật chỉnh định tham số phù

- 99 -

hợp. Khi đó luật điều khiển thích nghi của phương pháp thay thế ước lượng hàm

trạng thái sẽ là a du u u .

Trong lý thuyết điều khiển thích nghi trực tiếp, một trong những phương

pháp thiết kế là sử dụng bộ xấp xỉ tuyến tính đối với tham số và chỉnh định (

-modification) hoặc chỉnh định ( -modification) được trình bày trong [57],

[32]. Các kết quả này cũng cho thấy nếu tồn tại bộ điều khiển tĩnh ổn định thì

cũng tồn tại bộ điều khiển thích nghi ổn định nếu tồn tại miền tham số của bộ

xấp xỉ để xấp xỉ được au với độ chính xác cần thiết. Như vậy luôn tồn tại bộ

điều khiển thích nghi trực tiếp ổn định nếu tồn tại bộ điều khiển tĩnh ổn định và

lựa chọn được cấu trúc bộ xấp xỉ phù hợp.

Ngoài ra để đảm bảo rằng các quỹ đạo trạng thái nằm trong miền hợp lệ mà

ở đó phép xấp xỉ được thiết lập hay zz , ta có thể sử dụng Định lý 7.1 trong

[57] để phân tích. Định lý 7.1 ([57]) cho biết nếu : p qV là hàm khả

vi liên tục thỏa mãn:

1 1 2 2( ) ( ) ( , ) ( ) ( )V E θ θ θ E θ θE Δ E Δ E Δ (4-2)

với 1 1 2 2, , , K E θ E θ và giả thiết rằng với hệ sai số được lập, tồn tại luật

điều khiển u v được thiết lập sao cho khi b EE và/hoặc bθ θΔ đều có

0V thì B EE với t , trong đó ký hiệu

11 0: max ,p

rB V V E EE E , 0V là giá trị ban đầu hay 0 (0)V V và

2 2( ) ( )rV b b E E θ θ .

Định lý 7.1 ([57]) được chứng minh như sau:

Nếu rV V thì từ 2 2 2 2( ) ( ) ( ) ( )V b b E θ θ E E θ θE Δ suy ra

b EE và/hoặc bθ θΔ nên theo giả thiết dẫn đến 0V . Xét các trường hợp

đối với 0V : Nếu 0 rV V thì do V là hàm xác định dương và không thể tăng lớn

hơn rV nên 0 ( ) rV t V với t . Trường hợp 0 rV V thì 0V cho đến khi

- 100 -

rV V do vậy 00 ( ) max , rV t V V với t . Mặt khác từ (4-2) biết rằng

1 0( ) ( ) max , rV t V V E E nên suy ra 11 0max , rV V EE .

Như vậy Định lý 7.1 ([57]) được dùng để phân tích miền hợp lệ mà trong đó

quỹ đạo của E và x được phép di chuyển khi sử dụng bộ điều khiển thích nghi.

Áp dụng trong trường hợp hệ sai số, từ Giả thiết 1 do ( , )t xx E với

( , )tx E là hàm không giảm dần đối với E nên xx với t , trong đó:

11 0: sup , max ,n

rt

t V V

x x Ex x . (4-3)

▲

Ngoài ra trong phân tích luật điều khiển thích nghi, thông thường hàm

Lyapunov được chọn có dạng chính phương chứa ma trận đối xứng xác định

dương (Lưu ý là ma trận số thực đối xứng luôn có các giá trị riêng thực). Bổ đề

6 dưới đây (được tổng hợp từ các tài liệu [38], [70]) cho thấy các tính chất của

ma trận đối xứng xác định dương nên có thể sử dụng để lập và phân tích ma trận

đối xứng xác định dương dùng trong dạng chính phương của hàm Lyapunov và

trong luật chỉnh định tham số.

Bổ đề 6 :

1) Nếu A là ma trận đối xứng xác định dương thì A có thể phân tích duy nhất

thành T T A U DU C C với 1 2/C D U , U là ma trận tam giác trên và D

là ma trận chéo có các phần tử trên đường chéo dương.

2) Nếu A là ma trận đối xứng xác định dương có các giá trị riêng phân biệt thì

A có thể phân tích thành T T A U DU C C với 1 2/C D U trong đó U là

ma trận unita và D là ma trận chéo chứa các giá trị riêng của A .

Chứng minh

Chứng minh Bổ đề 6 có thể tham khảo ở mục 5.6 trang 152 phần Phụ lục.

▲

- 101 -

4.2. Điều khiển mờ nơron thích nghi trực tiếp các hệ thống khả tuyến

tính hóa phản hồi

4.2.1. Hệ khả tuyến tính hóa phản hồi trạng thái

Đối với trường hợp hệ khả tuyến tính phản hồi trạng thái như đã trình bày ở

trên, vấn đề đặt ra là với luật điều khiển thích nghi a du u u trong đó u định

nghĩa như (2-28) và:

ˆ( , , ) ˆbsig , ( , , )d

F uu EF u

g

x θ

x θ

(4-4)

là thành phần bù động, θ̂ là véctơ tham số điều chỉnh hay:

1 ( ) 1 ˆ ˆ( ) ( ) ( , , ) bsig , ( , , )n Tau g r f F u EF u

x η e x x θ x θ (4-5)

ta cần tìm luật chỉnh định tham số ˆ ˆ( , , , )t uθ x θ để hệ sai số vòng kín ổn định.

Sau đây ký hiệu:

( , , )F F u x θ , ( , , )F F u x θ , ˆˆ ( , , )F F u x θ (4-6)

và giả thiết tồn tại miền véctơ tham số θ thỏa mãn F xấp xỉ ( , )dxn u x với

sai số bị chặn bởi (3-14) với xx , uu và θθ trong đó θθ là

véctơ tham số tốt nhất tìm được của bộ xấp xỉ mờ nơron được dùng trong luật

điều khiển tĩnh (3-13). Ngoài ra cũng giả thiết rằng với các điều kiện ràng buộc

đối với trạng thái và đầu vào của hệ, ta có thể xác định được E sao cho khi

EE thì luôn có xx và uu (phương pháp xác định như đã trình bày

trong Chương 3).

Khi đó nếu F là bộ xấp xỉ tuyến tính đối với tham số thì áp dụng phương

pháp chỉnh định và sử dụng luật chỉnh định tham số như trong [57] dẫn đến

phát biểu của Định lý 4 dưới đây về luật điều khiển thích nghi trong phương

pháp thay thế ước lượng hàm trạng thái để hệ sai số vòng kín ổn định.

- 102 -

Định lý 4 : (Điều khiển thích nghi với bộ xấp xỉ tuyến tính) Luật điều khiển

thích nghi và chỉnh định tham số sau:

1 ( ) 1 ˆ ˆbsig( , )

ˆˆ ˆ

n Ta

T

u u g r f F EF

FE

η e

θ A θ θθ

với 0 1 , 0 , A là ma trận đối xứng xác định dương,

F là bộ xấp xỉ tuyến tính đối với tham số,

(4-7)

bảo đảm nghiệm của phương trình động học hệ sai số (2-20) bị chặn bởi

EE B với EB định nghĩa như (4-10).

Chứng minh

Thay luật điều khiển (4-7) vào phương trình động học (2-20) dẫn đến:

( ) ( , )d dxnE E g u u x x

Chọn hàm Lyapunov:

112

Ta sV V θ θΔ A Δ (4-8)

với ˆ θΔ θ θ , 212sV E , A là ma trận đối xứng xác định dương thì:

1

2 1

2

1

2

1

ˆ ˆ

ˆˆ ˆbsig ,

ˆ

1 ˆ ˆ ˆsign( ) bsig( , )

ˆ

Ta s

Td dxn

dxn

T

T

V V

E Egu E F F F F

EFE EF E F EF

E F F

E E W EF EF EF

E F F

θ θ

θ θ

θ θ

θ θ

Δ A Δ

Δ A Δ

Δ A Δ

Δ A Δ

- 103 -

Do giả thiết F là bộ xấp xỉ tuyến tính đối với tham số nên theo (3-5) có thể

viết ˆ ( , )TF F u θΔ φ x với ˆ

( , )T Fu

φ xθ

, ngoài ra do ˆθΔ θ nên đạo hàm

của hàm Lyapunov theo quỹ đạo động học của hệ sai số biến đổi được tiếp như

sau:

2

1

222

2

_ max

1 ˆμ ( , )

ˆ ˆˆ

1 1 1 ˆμ ( , )2 2 2

ˆ ˆˆ

1 ˆμ ( , )2

a E

T TT

E

T TT T

Ts E

V E E W EF

F FE E

WE W E EF

F FE E

WV

θ θ

θ θ θ

θ

Δ Δ A A θ θθ θ

Δ Δ Δ θ θθ θ

Δ θ θ

Mặt khác ta có:

22

22

22

ˆ

12

2 2 2

2 2

T T

T

θ θ θ

θθ θ

θ

Δ θ θ Δ Δ θ θ

θ θΔΔ Δ θ θ θ θ

θ θΔ

nên suy ra:

222

_ max

2

1μ ( , )

2 2 2

2

a s E

s

WV V

V m

θ

θ

θ θΔ

Δ

(4-9)

- 104 -

với

22

_ maxμ ( , )0

2 2

EWm

θ θ.

Chọn 211 min( ) θ θ θΔ A Δ , 21

2 max( ) θ θ θΔ A Δ và

1 2( ) ( ) ( )E E sE E V E là các hàm thuộc lớp K thì:

1 1 2 2( ) ( ) , ( ) ( )E a EE V E E θ θ θ θ θΔ Δ Δ

Khi đó 0aV khi 2

02

Em và/hoặc

2

02

m θΔ hay khi

11

2E E

mE b

và/hoặc

2mb

θ θΔ nên áp dụng Định lý 7.1 ([57])

suy ra EE B với t , trong đó:

11

2 2

1 12 1 max

: max (0),

( ) ( )

2

E E a r

r E E

E E

B E E V V

V b b

m m

θ θ

A

(4-10)

với (0)aV là giá trị ban đầu nên Định lý 4 được chứng minh.

▲

Kết quả của Định lý 4 cho thấy rV có thể thiết lập nhỏ tùy ý bằng cách chọn

, và A thích hợp nên nếu chọn (0)aV đủ nhỏ thì có thể đảm bảo chọn được

E EB theo yêu cầu. Như vậy khi EE B thì cũng luôn có xx và

uu . Lưu ý ˆ θ θ là thành phần nâng cao tính bền vững của hệ vòng kín

trong luật chỉnh định tham số (4-7).

Ngoài ra một vấn đề trong áp dụng phương pháp chỉnh định là khi E

nhỏ thì thành phần ˆ θ θ có tác động quyết định đến luật chỉnh định tham số

θ̂

trong (4-7) và do đó θ̂ có xu hướng tiến đến θ . Như vậy nếu θ không phải là

- 105 -

véctơ tham số tối ưu tìm được thì E có thể tăng trở lại. Vấn đề này có thể giải

quyết bằng phương pháp chỉnh định trình bày trong [32], [57]. Áp dụng

phương pháp trong trường hợp này, luật điều chỉnh tham số (4-7) có thể viết:

ˆ ˆ( )

TF

E E

θ A θ θθ

(4-11)

với ( ) 0E là thành phần nâng cao tính bền vững cho hệ vòng kín. Ví dụ nếu

chọn ( )E E với 0 thì khi E nhỏ có thể giảm được ảnh hưởng của

thành phần bền vững trong luật chỉnh định tham số nêu trên.

▲

Trường hợp bộ xấp xỉ F không tuyến tính đối với tham số, ta có thể áp

dụng phương pháp trình bày trong [57] bổ sung thành phần ổn định vào luật

điều khiển thích nghi trong phương pháp thay thế ước lượng hàm trạng thái để

bù sai lệch do đặc tính phi tuyến của bộ xấp xỉ gây nên như phát biểu của Bổ đề

7 dưới đây.

Bổ đề 7 : (Điều khiển thích nghi với bộ xấp xỉ phi tuyến) Luật điều khiển thích

nghi và chỉnh định tham số sau:

41 ( ) 1 ˆˆ ˆbsig( , )

ˆˆ ˆ

n Ta

T

u u g r f F EF E

FE

η e θ θ

θ A θ θθ

với 0 1 , 0 , 0 , A là ma trận đối xứng xác định dương,

F là bộ xấp xỉ phi tuyến đối với tham số,

(4-12)

bảo đảm nghiệm của phương trình động học hệ sai số (2-20) bị chặn bởi

EE B với EB định nghĩa như (4-15).

- 106 -

Chứng minh

Thay luật điều khiển (4-12) vào phương trình động học (2-20) dẫn đến

phương trình động học của hệ sai số vòng kín:

4

ˆ( ) ( , )d dxnE E g u E u x θ θ x . (4-13)

Tiếp tục chọn hàm Lyapunov như (4-8) thì đạo hàm theo quỹ đạo động học

hệ sai số (4-13) sẽ là:

1

42 2 1ˆ

Ta s

Td dxn

V V

E Egu E E

θ θ

θ θ

Δ A Δ

θ θ Δ A Δ

Do giả thiết bộ xấp xỉ là phi tuyến đối với tham số nên theo (3-7) có thể viết

ˆˆ F

F F

θΔθ

với 2

L θΔ , 0L là hằng số Lipschitz. Biết rằng

2 2 22 2x y x y nên:

2 2 22 ˆ ˆ2 2L L L L θΔ θ θ θ θ θ θ θ θ

2 2ˆ

ˆˆ 2F

E F F E L E

θΔ θ θ θ θθ

.

Ngoài ra do:

2 2 24 2 22 ˆ ˆ ˆ2L L L

E L E E

θ θ θ θ θ θ

và 22

ˆ2 2

T θ

θ

θ θΔΔ θ θ

suy ra đạo hàm của hàm Lyapunov có thể

biến đổi như sau:

- 107 -

42 2 1

42 2

2 2

22

222

1 ˆˆ ˆμ ( , )

ˆ1 ˆˆμ ( , )

ˆˆ ˆ2

21 1

22 2 2

1 ˆμ ( , )

Ta E

E

TT T

E

V E E W EF E E F F

FE E W EF E E

FL E E

W L

E W L E

EF E

θ θ

θ

θ θ

θ θ Δ A Δ

θ θ Δθ

θ θ θ θ Δ Δ θ θθ

θ θ

θ θ

224 22 ˆ ˆ2

2 2L E

θ

θ θΔθ θ θ θ

hay:

22

_ max

2 22

2

21

μ ( , )2

2 2

2

a s E

s

W L

V V

L

V m

θ

θ

θ θ

θ θ Δ

Δ

(4-14)

với

22 2

2_ max

2 μ ( , )0

2 2

EW L

Lm

θ θ θ θ

.

Khi đó tương tự như trường hợp bộ xấp xỉ tuyến tính đối với tham số, áp

dụng Định lý 7.1 ([57]) trong trường hợp này suy ra EE B với t , trong đó:

11

1 12 2 2 1 max

: max (0),

2( ) ( )

E E a r

r E E E E

B E E V V

m mV b b

θ θ A

(4-15)

với (0)aV là giá trị ban đầu nên Bổ đề 7 được chứng minh.

▲

- 108 -

Lưu ý là kết quả (4-15) có dạng giống như kết quả (4-10) nhưng thành phần

m trong hai trường hợp khác nhau. Ngoài ra kết quả trên cũng cho thấy có thể

chọn các giá trị , , và A thích hợp để rV nhỏ tùy ý nên nếu (0)aV chọn

đủ nhỏ thì có thể tìm được E EB theo yêu cầu sao cho khi EE B thì luôn

có x , u nằm trong miền hợp lệ của xx và uu .

Một ghi chú khác, nếu chọn A là ma trận đối xứng xác định dương có các

giá trị riêng phân biệt thì theo Bổ đề 6, A còn có thể phân tích thành

T T A U DU C C với 1 2/C D U trong đó U là ma trận unita và D là ma trận

chéo chứa các giá trị riêng phân biệt của A . Tính chất này cho phép lập ma trận

A cũng như tính toán giá trị riêng lớn nhất của 1

A đơn giản theo công thức

1 1max min A D để xác định EB trong các kết quả (4-10) và (4-15).

4.2.2. Hệ khả tuyến tính hóa phản hồi vào-ra

Xét trường hợp hệ khả tuyến tính phản hồi vào-ra có dạng (2-3) thỏa mãn

Giả thiết 2 và giả thiết tín hiệu mẫu ( )r t và các đạo hàm của tín hiệu mẫu đến

bậc n bị chặn và đo được. Nếu tồn tại θ sao cho bộ xấp xỉ tuyến tính đối với

tham số ( , , , )F u x q θ xấp xỉ ( , , )dxn u x q với sai số bị chặn bởi (3-14) với

,( , ) x qx q , uu và θθ trong đó θθ là véctơ tham số tốt nhất tìm

được của bộ xấp xỉ mờ nơron được dùng trong luật điều khiển tĩnh (3-17), khi

đó tương tự như trường hợp hệ khả tuyến tính hóa phản hồi trạng thái và áp

dụng phương pháp chỉnh định với luật chỉnh định tham số đề xuất trong [57]

suy ra luật điều khiển và chỉnh định tham số thích nghi sau:

1 ( ) 1 ˆ ˆ( , ) ( , ) bsig( , )

ˆˆ ˆ

n Ta

T

u g r f F EF

FE

x q η e x q

θ A θ θθ

- 109 -

với ký hiệu ˆˆ ( , , , )F F u x q θ sẽ đảm bảo nghiệm của hệ sai số (2-78) bị chặn

hay E luôn nằm trong EB định nghĩa như (4-10).

Trường hợp sử dụng bộ xấp xỉ phi tuyến đối với tham số, áp dụng Bổ đề 7

dẫn đến luật điều khiển thích nghi và chỉnh định tham số:

41 ( ) 1 ˆˆ ˆ( , ) ( , ) bsig( , )

ˆˆ ˆ

n Ta

T

u u g r f F EF E

FE

x q η e x q θ θ

θ A θ θθ

với 0 sẽ đảm bảo nghiệm của hệ sai số (2-78) bị chặn nằm trong EB định

nghĩa như (4-15). Lưu ý là trong cả hai trường hợp, nếu (0)aV chọn đủ nhỏ thì

cũng có thể chọn các giá trị , , và A thích hợp để E EE B và do đó

đảm bảo được x , u luôn nằm trong miền hợp lệ của xx , uu .

- 110 -

4.3. Tổng hợp thiết kế bộ điều khiển thích nghi trực tiếp ổn định

Tóm lại, các bước tổng hợp bộ điều khiển thích nghi trực tiếp ổn định trong

phương pháp thay thế ước lượng hàm trạng thái như sau:

1. Áp dụng Định lý 3 và theo phương pháp chỉnh định , xác định bộ điều

khiển ổn định tĩnh đảm bảo rằng tồn tại θ để bộ xấp xỉ mờ nơron F

thay thế F trong luật điều khiển phản hồi (3-13) (trường hợp hệ khả

tuyến tính hóa trạng thái) hoặc (3-17) (trường hợp hệ khả tuyến tính hóa

vào-ra) thỏa mãn điều kiện của Định lý 3 với θθ . Chọn véctơ tham

số tốt nhất θ làm giá trị tham số khởi tạo ban đầu.

2. Xác định các điều kiện giới hạn về trạng thái và đầu vào của hệ, từ đó xác

định E sao cho khi EE thì quỹ đạo trạng thái và đầu vào luôn nằm

trong miền hợp lệ của xx và uu (phương pháp xác định như đã

trình bày trong Chương 3).

Xác định luật điều khiển thích nghi và chỉnh định tham số theo Định lý 4

(trường hợp sử dụng bộ xấp xỉ tuyến tính đối với tham số) hoặc theo Bổ đề 7

(trường hợp bộ xấp xỉ phi tuyến đối với tham số). Chọn các tham số tham số

điều khiển ban đầu phù hợp trong mỗi trường hợp để E EB và do đó cũng

đảm bảo rằng xx và uu .

Lưu ý là chỉ có thể thiết kế bộ điều khiển thích nghi trực tiếp ổn định nếu tồn

tại bộ điều khiển tĩnh ổn định thỏa mãn điều kiện của Định lý 3. Ngoài ra do đặc

điểm của phương pháp thay thế ước lượng hàm trạng thái là xấp xỉ sai lệch do

phép thay thế (và các thành phần bất định khác) gây nên bằng bộ xấp xỉ mờ

nơron duy nhất trong mỗi phương trình động học trạng thái của hệ phi tuyến nên

thích hợp sử dụng điều khiển thích nghi trực tiếp để phát triển bộ điều khiển

động. Việc phát triển bộ điều khiển thích nghi gián tiếp là không cần thiết và

làm luật điều khiển thích nghi phức tạp hơn do phải sử dụng cùng lúc nhiều bộ

xấp xỉ và kết hợp lại trong luật điều khiển chung (trong mỗi phương trình động

học trạng thái của hệ phi tuyến).

- 111 -

4.4. Mô hình điều khiển thích nghi trên hệ thống điều khiển công nghiệp

4.4.1. Giới thiệu chung

Như mục tiêu đặt ra ban đầu của luận án, nhằm đưa ra khả năng áp dụng của

phương pháp đề xuất trên hệ thống điều khiển công nghiệp điển hình, sau đây

trình bày một số bộ phần mềm phát triển mờ nơron và vấn đề trong xây dựng

mô hình phần mềm điều khiển thích nghi trên hệ thống điều khiển công nghiệp.

Có thể thấy, các hãng tự động hóa lớn trên thế giới hiện nay như Siemens

(Đức), Rockwell Automation (Hoa Kỳ), Schneider Electric (Pháp), Omron

(Nhật Bản), ... đều cung cấp các bộ phần mềm phát triển hệ mờ và mạng nơron

cho các sản phẩm của riêng mình. Điểm mạnh của các phần mềm này là các

môđun phần mềm thời gian thực (runtime) được tối ưu hóa cao, kiểm tra chặt

chẽ và dễ dàng kết nối, trao đổi dữ liệu trực tuyến với các môđun phần mềm

khác do hãng phát triển. Tuy nhiên do thiết kế đóng nên đa phần chỉ cho phép

thực hiện các cấu trúc điều khiển cơ bản với một số tùy chọn trên chủng loại

thiết bị cụ thể. Điển hình như NeuroSystems của Siemens ([89], [90]) chỉ hỗ trợ

các kiểu mạng “cứng” như MLP, RBF và NFN dưới dạng các khối hàm và khối

dữ liệu cho các bộ điều khiển họ SIMATIC S7-300, S7-400 hoặc thư viện phần

mềm thời gian thực cho WinCC của hãng. Ngoài ra các chức năng tính toán, mô

phỏng và đồ họa nhìn chung còn chưa được tốt.

Trong khi đó nhiều hãng chuyên về phần mềm lại cung cấp các sản phẩm

phần mềm hỗ trợ thiết kế linh hoạt hệ mờ và mạng nơron cho nhiều chủng loại

thiết bị điều khiển khả trình (PLC) và vi điều khiển khác nhau. Một số bộ phần

mềm điển hình như FuzzyTech của Inform GmbH (http://www.fuzzytech.com),

NeuroSolutions và NeuroSolutions for Matlab của NeuroDimension Inc. ([58],

http://www.neurosolutions.com), Matlab của MathWorks

(http://www.mathworks.com), VisSim của Visual Solutions

(http://www.vissim.com) là các công cụ phần mềm mạnh về thiết kế, tính toán,

giao diện đồ họa và mô phỏng. Tuy nhiên để thiết kế ứng dụng điều khiển công

nghiệp trên các bộ phần mềm nêu trên không đơn giản do thiếu công cụ trợ giúp

- 112 -

tính toán, kiểm tra hoạt động trực tuyến cũng như người dùng có thể gặp phải

một số vấn đề về khả năng hỗ trợ mã lệnh CPU và mức độ hoàn chỉnh của trình

biên dịch.

Một phương pháp nhằm áp dụng các mô hình hoặc thuật toán điều khiển

phức tạp trên các hệ thống điều khiển công nghiệp là sử dụng các bộ phần mềm

mạnh nêu trên để tính toán, mô phỏng hoạt động của thiết kế và từ đó chuyển

sang lập trình ứng dụng phù hợp trên thiết bị được chọn. Ví dụ như đối với

phương pháp đề xuất trong luận án, để thực hiện cấu trúc điều khiển mờ nơron

dựa trên điều khiển mờ Sugeno (mô hình ANFIS) hoặc kết hợp với cấu trúc

điều khiển thích nghi xây dựng trong luận án đòi hỏi phải xây dựng được các

môđun phần mềm thời gian thực riêng phù hợp với chủng loại PLC được sử

dụng. Ngoài ra do các hệ thống điều khiển công nghiệp tiên tiến hiện nay có cấu

trúc phân cấp nên cần thiết phải xây dựng một mô hình phần mềm ứng dụng cho

phép thực hiện cấu trúc điều khiển đề xuất trong luận án trên mô hình phân cấp

này cũng như trợ giúp quá trình lấy số liệu đo phục vụ thiết kế, tính toán tham

số điều khiển.

Phần tiếp theo trình bày cấu trúc phần mềm ứng dụng điều khiển mờ nơron

(luật điều khiển tĩnh và động) cho hệ thống tự động hóa SIMATIC S7 với các

môđun phần mềm hỗ trợ chạy trên nền SIMATIC WinCC của hãng Siemens.

Để tận dụng các ưu điểm của các bộ phần mềm tính toán, mô phỏng mạnh đã

nêu ở trên cũng như rút ngắn thời gian thiết kế hệ thống, việc chỉnh định ngoại

tuyến, xác định tham số điều khiển ban đầu luận án đề xuất sử dụng các công cụ

trợ giúp trong Matlab và NeuroSolutions. Các kết quả đã được nhóm tác giả

thực hiện trong một số đề tài cấp bộ do nghiên cứu sinh làm chủ nhiệm đề tài

([12], [14]).

- 113 -

4.4.2. Mô hình phần mềm ứng dụng và khả năng áp dụng trên hệ thống điều

khiển công nghiệp

Mô hình chung

Hình 11 trình bày mô hình điều khiển thích nghi xây dựng trên hệ thống điều

khiển công nghiệp điển hình của hãng Siemens với các thành phần gồm:

- IPC-Server: trong hệ thống phân cấp, IPC-Server được dùng là máy tính

công nghiệp có nhiệm vụ quản lý và xử lý các dữ liệu nhận về từ các hệ

thống điều khiển (PLC/IPC) cũng như cung cấp dữ liệu (theo yêu cầu, thông

qua các dịch vụ) cho các máy tính trạm (PC-Clients). Để thực hiện truyền

thông trong các phân cấp, IPC-Server được hỗ trợ các dạng truyền thông qua

fieldbus (như IE, Profibus hoặc MPI) để kết nối với PLC. Trong mô hình

thích nghi được xây dựng, IPC-Server còn có nhiệm vụ giám sát, thu thập dữ

liệu phục vụ quá trình chỉnh định tham số ngoại tuyến (off-line) để xác định

các tham số ban đầu của bộ xấp xỉ trước khi nạp xuống thiết bị điều khiển

thời gian thực PLC (hoặc Soft-PLC). Phần mềm SCADA sử dụng trên IPC-

Server là SIMATIC WinCC của hãng Siemens.

- PLC/Soft-PLC: PLC là thiết bị điều khiển khả trình thời gian thực các quá

trình công nghiệp thông qua các đầu vào/ra (I/O) trong khi Soft-PLC là một

dạng PLC “mềm” (phần mềm giả hoạt động PLC trên IPC) cho phép thực

hiện và xử lý các tác vụ như một PLC thực thụ. Trong cả hai trường hợp,

môđun phần mềm điều khiển thích nghi trên PLC/Soft-PLC nhận các tham

số ban đầu từ IPC-Server và thực hiện thuật toán điều khiển thích nghi với

chức năng chỉnh định trực tuyến được kích hoạt bởi IPC-Server trong quá

trình hoạt động. PLC trong mô hình thiết kế là dòng SIMATIC S7-300/400

còn Soft-PLC được dùng là bộ phần mềm WinAC RTX của hãng Siemens.

- I/O: là các môđun đầu vào/ra số/tương tự, trong đó Central I/O là các môđun

đầu vào/ra trung tâm có kết nối trực tiếp với bus nội bộ của PLC và DP-I/O

là các môđun vào /ra phân tán được kết nối với PLC/Soft-PLC thông qua bus

trường (như Profibus-DP/PA).

- 114 -

- Processes/Plants: các quá trình, thiết bị, máy móc cần giám sát, điều khiển

trong dây chuyền công nghệ.

Hình 11 : Điều khiển thích nghi trong hệ thống điều khiển công nghiệp

Truyền thông và trao đổi dữ liệu trong mô hình

Truyền thông trong mô hình có thể phân thành 2 nhóm sau:

- Truyền thông giữa IPC-Server với PLC/Soft-PLC: đây là đường truyền trong

phân cấp vùng (cell level) có chu kỳ vòng quét chậm, khoảng 100ms. Các

bus trường có thể sử dụng trong thiết kế là Industrial Ethernet (IE), Profibus

(PB) hoặc MPI (Multi-Point Inteface) của Siemens.

- Truyền thông giữa PLC/Soft-PLC với DP-I/O: sử dụng đường truyền trong

phân cấp trường (field level) có chu kỳ vòng quét nhanh dưới 10ms. Bus

trường thiết kế sử dụng trong phân cấp này là Profibus-DP/PA.

Fieldbus (IE/PB/MPI)

Mạng công nghiệp phân tán (Profibus-DP/PA)

IPC-Server

Phần mềm

SCADA và chỉnh

định tham số

ngoại tuyến (Offline)

PLC/Soft-PLC

Điều khiển

(mờ nơron) và

chỉnh định

tham số trực tuyến (Online)

DP I/O

DP I/O

DP I/O

Processes/Plants

Central I/O

Các module

vào/ra số/tương tự

- 115 -

Hoạt động của mô hình phần mềm điều khiển thích nghi

Hoạt động của phần mềm điều khiển thích nghi trên hệ thống điều khiển

công nghiệp được minh họa thông qua việc xác lập bộ xấp xỉ mờ nơron (NF)

trong luật điều khiển tĩnh hoặc thích nghi. Hình 12 mô tả các thành phần chính

và đường đi của dữ liệu trong quá trình thiết lập các tham số làm việc của hệ

thống, theo đó gồm các bước sau:

Hình 12 : Sơ đồ đường đi dữ liệu trong mô hình điều khiển thích nghi

- Xác định các trạng thái (đo được) của quá trình điều khiển (các đầu vào/ra).

Xác định cấu trúc NF sẽ sử dụng (trong thiết kế sử dụng cấu trúc ANFIS),

phương pháp tạo dữ liệu phục vụ luyện mạng cũng như thời gian lấy mẫu.

- Thực hiện quá trình thu lưu dữ liệu phục vụ quá trình học ngoại tuyến bằng

cách PLC/Soft-PLC tạo các tín hiệu đầu vào quá trình theo phương pháp đã

định và thu các đáp ứng (các đầu ra) của quá trình. Các dữ liệu này được lấy

mẫu theo chu kỳ đặt và chuyển vào vùng dữ liệu nhớ đệm tạm thời (buffer)

để truyền về cơ sở dữ liệu (CSDL) trên IPC-Server.

PLC/Soft-PLC

IPC-Server

Processes/Plants

Điều khiển thích nghi

Tham số, chế độ đ/k

Phần mềm SCADA

Chỉnh định ngoại tuyến

Chỉnh định trực tuyến

Điều khiển đối tƣợng

Tham số thiết kế, chế độ điều khiển

Cơ sở dữ liệu

(WinCC UserArchive)

Bộ đệm dữ

liệu tạm thời

- 116 -

- Thực hiện quá trình học ngoại tuyến bằng số liệu thu được trong quá trình

trước nhằm xác định được các tham số hoạt động của hệ thống cũng như có

thể mô phỏng hoạt động của quá trình. Các tham số sau khi luyện đáp ứng

các điều kiện thiết kế sẽ được nạp xuống PLC/Soft-PLC để khởi tạo hệ thống

NF.

- Trong quá trình hoạt động, hệ thống NF chuyển từ chế độ tĩnh (luật điều

khiển tĩnh) sang chế độ động (luật điều khiển thích nghi) cho phép tự động

chỉnh định trực tuyến các tham số.

Cấu trúc và hoạt động chung của các môđun phần mềm hệ thống NF

Với mô hình hệ thống NF thiết kế, phần mềm hệ thống NF có thể phân thành

các môđun chính sau (Hình 13):

- PC-NF Manager: Môđun phần mềm quản lý và điều khiển hoạt động của

các môđun phần mềm khác trên IPC-Server.

- PLC-NF Manager: Môđun phần mềm quản lý và điều khiển hoạt động của

các môđun phần mềm trên PLC/Soft-PLC.

- Process I/O Data Acquisition: Môđun phần mềm trên IPC-Server có nhiệm

vụ điều khiển quá trình trao đổi, cập nhật dữ liệu quá trình cần thiết từ

PLC/Soft-PLC và lưu trữ vào CSDL (Process Data) nhằm cung cấp cho quá

trình học ngoại tuyến (offline learning) để xác định các trọng số ban đầu của

hệ NF.

- Process I/O Data Transmission: Môđun phần mềm trên PLC/Soft-PLC có

nhiệm vụ cập nhật dữ liệu quá trình theo chu kỳ vào Temporary Buffer và

cung cấp cho IPC-Server lưu trữ. Hoạt động của môđun phần mềm này do

IPC-Server (Môđun Process I/O Data Acquisition) điều khiển.

- NF Offline Learning: Môđun luyện ngoại tuyến trên IPC-Server có cấu trúc

dựa trên hệ mờ và mạng nơron (trong thử nghiệm sử dụng cấu trúc ANFIS)

và tương đương với cấu trúc xây dựng trong NF Online (trên PLC) nhằm xác

định các tham số ban đầu của hệ thống NF (NF Data). Môđun được phát

- 117 -

triển trên môi trường Matlab và có thể tích hợp vào hệ thống NF chạy trên

nền WinCC.

- NF Online: Môđun NF điều chỉnh tham số trực tuyến có cấu trúc dựa trên hệ

mờ và mạng nơron (ANFIS) với các tham số ban đầu do IPC-Server thiết

lập.

Hình 13 : Các môđun phần mềm chính trong mô hình hệ thống NF

- NF Data Transmit: Môđun điều khiển quá trình cập nhật số liệu thiết lập hệ

thống NF (bên PLC/Soft-PLC).

PLC

IPC-Server

Process I/O Data

Acquisition Module

Proc. Data

PC-NF Manager

Common DB (UA)

NF Offline Learning Module

NF Data

Process I/O Data

Transmission Module

Temp. Buffer

PLC-NF Manager

System DB (DB1)

NF Controller

NF Online

Process Model

NF Data

NF Data Update

NF Data Transmit

Chiều trao đổi dữ liệu giữa các môđun chƣơng trình qua mạng PB và nội bộ

Chiều truy cập CSDL của các môđun phần mềm

Ký hiệu:

DP-I/O PI

- 118 -

- NF Data Update: Môđun thực hiện quá trình cập nhật, trao đổi và nhận các

tham số điều khiển từ IPC-Server.

- Process Model: Môđun phần mềm mô phỏng quá trình cần điều khiển phục

vụ thử nghiệm hoạt động của hệ thống NF.

Các môđun phần mềm xây dựng trên IPC-Server được thiết kế lập trình bằng

ngôn ngữ C-Script trong SIMATIC WinCC V5. Các môđun phần mềm trên

PLC/Soft-PLC được xây dựng trên ngôn ngữ SCL (Structured Control

Language) trong bộ phần mềm SIMATIC STEP7 Professional V5.2.

Có thể tham khảo một số cấu trúc môđun phần mềm như môđun cung cấp dữ

liệu quá trình (Process I/O Data Transmission) và môđun ANFIS trên

PLC/Soft-PLC trong mục 5.7 trang 155 phần Phụ lục.

Khả năng áp dụng trên các hệ thống điều khiển công nghiệp

Nhằm đánh giá khả năng và đưa ra các đề xuất khi áp dụng mô hình điều

khiển thích nghi của luận án trên các hệ thống điều khiển công nghiệp, luận án

sau đây trình bày kết quả chạy thử môđun ANFIS xây dựng trong luận án và so

sánh với các môđun phần mềm runtime FUZZY_20K và NEURO_20K của

hãng Siemens. Môđun phần mềm FUZZY_20K và NEURO_20K tương ứng

nằm trong các bộ phần mềm FuzzyControl++ ([88]) và NeuroSystems ([89]) do

hãng Siemens cung cấp cho phép thực hiện các tính toán thông minh trên cơ sở

hệ mờ và mạng nơron trên chủng loại PLC SIMATIC S7 của hãng.

Việc lựa chọn môđun ANFIS để phân tích và so sánh với các môđun runtime

của hãng Siemens là do các nguyên nhân sau:

- Môđun ANFIS là môđun quan trọng thực hiện vai trò bộ xấp xỉ vạn năng F

hoặc F̂ trong các luật điều khiển tĩnh (3-13) và luật điều khiển động (4-7)

của luận án.

- Môđun ANFIS là môđun tính toán phức tạp hơn cả trong luật điều khiển, đòi

hỏi thời gian xử lý và bộ nhớ lớn. Thông số hoạt động của môđun ANFIS

quyết định tính thời gian thực của hệ điều khiển.

- 119 -

- Các môđun phần mềm runtime FUZZY_20K và NEURO_20K của hãng

Siemens có thể thay thế được môđun ANFIS nếu được sử dụng như một bộ

xấp xỉ vạn năng thỏa mãn điều kiện sai số xấp xỉ bị chặn trong luận án (Định

lý 3 trang 71).

Bảng dưới đây tổng hợp các thông số hoạt động chính của các môđun phần

mềm runtime và có thể sử dụng để tính toán thời gian thực của ứng dụng điều

khiển NF trên PLC SIMATIC S7-400:

Môđun mờ

nơron runtime

Thông số cấu hình

IN: đầu vào, OUT: đầu ra,

MF: hàm liên thuộc, R: số

luật

Bộ nhớ cần thiết Thời gian thực

hiện (ms) trên

SIMATIC S7-

400

Chƣơng

trình

Dữ

liệu

FUZZY_20K

(Siemens Fuzzy

Control++ V5.0)

Hệ mờ: max. 8 IN (7MF), 4

OUT (9MF), 2000 R.

1.206

bytes

20.516

bytes

22ms - 154ms

tùy thuộc vào

số lượng I/O và

số luật.

NEURO_20K

(Siemens

NeuroSystems)

Mạng NFN: max. 8 IN

(7MF), 4 OUT (9MF),

2000 R.

Mạng MLP: max. 100 IN,

10 OUT, 2 lớp ẩn (50

nơron/lớp ẩn).

Mạng RBF: max. 100 IN,

10 OUT, 50 nơron/lớp ẩn.

2.210

bytes

20.612

bytes

3,3ms - 260ms

tùy thuộc vào


số luật.

FB_NeuroFuzzy

(Môđun ANFIS

thử nghiệm

trong luận án)

Mạng ANFIS: max. 8 IN, 1

OUT, 7MF, 1500R.

4.448

bytes

61.006

bytes

nhỏ hơn 10ms

tùy thuộc vào


số luật.

Môđun ANFIS trong luận án hiện chỉ áp dụng cho hệ có nhiều nhất 8 đầu

vào, 1 đầu ra với 1500 luật do giới hạn 64kB một khối dữ liệu trong SIMATIC

S7. Tuy nhiên có thể mở rộng số lượng các đầu vào/ra, số hàm liên thuộc trên

mỗi đầu vào/ra và số luật bằng cách thiết kế trên nhiều khối dữ liệu. So sánh với

- 120 -

các môđun của hãng Siemens cho thấy việc sử dụng môđun ANFIS yêu cầu bộ

nhớ lớn hơn do cấu trúc mạng ANFIS đòi hỏi việc tính toán phức tạp hơn. Do

đó trong trường hợp có thể thay thế mạng ANFIS bằng cấu trúc hệ mờ hoặc các

mạng nơron khác đơn giản hơn ta có thể sử dụng các môđun của Siemens nêu

trên. Ưu điểm của mạng ANFIS là có thể giải quyết tốt các trường hợp tổng

quát, thiếu tri thức về động học phi tuyến của đối tượng điều khiển.

Các thông số hoạt động của các môđun trên cho thấy để áp dụng mô hình

điều khiển thích nghi trên hệ thống điều khiển công nghiệp cần phải giải quyết

các hạn chế sau:

- Yêu cầu bộ nhớ lớn (đặc biệt là bộ nhớ dữ liệu) so với bộ nhớ thông thường

của các PLC hiện nay. Các ứng dụng NF lớn đòi hỏi việc lập trình phức tạp

do phải giải quyết các hạn chế về bộ nhớ và tổ chức dữ liệu thành nhiều

khối.

- Thời gian thực hiện phụ thuộc vào tốc độ thực thi của mỗi loại PLC, để đảm

bảo tính thời gian thực trong mỗi ứng dụng cần tính toán được thời gian này

và giải quyết được trong trường hợp chu kỳ xử lý không đáp ứng.

Do vậy để áp dụng môđun NF trong ứng dụng điều khiển thích nghi cần thiết

phải sử dụng PLC đủ mạnh có tốc độ xử lý nhanh và bộ nhớ lớn (ví dụ như đối

với PLC của Siemens, ít nhất là SIMATIC S7-400 CPU 414 trở lên có bộ nhớ

RAM 1.4MB, thời gian xử lý lệnh là 45ns đối với các lệnh thông thường và

135ns đối với lệnh tính toán dấu phảy động). Tuy nhiên Soft-PLC (ví dụ như

WinAC RTX 2008 của hãng Siemens) là sự lựa chọn tốt hơn cả do không phải

giải quyết vấn đề về thiếu bộ nhớ (chỉ giới hạn bởi bộ nhớ của PC) trong khi

thời gian xử lý nhanh (thời gian xử lý lệnh trong WinAC RTX 2008 trên máy

tính có bộ xử lý Pentium IV, 2.4GHz là 3-4ns).

Tóm lại, kết quả thử nghiệm trên cũng cho thấy luật điều khiển tĩnh và động

đề xuất trong luận án hoàn toàn có khả năng áp dụng được trên các hệ thống

điều khiển công nghiệp với chu kỳ xử lý có thể tính toán và đáp ứng được yêu

cầu thời gian thực của mỗi ứng dụng.

- 121 -

4.5. Kết luận

Chương 4 tiếp tục pháp triển phương pháp thay thế ước lượng hàm trạng thái

theo hướng áp dụng luật điều khiển thích nghi dựa trên luật điều khiển tĩnh đã

được xây dựng trong các chương trước. Để giải quyết vấn đề trên, tác giả lựa

chọn xây dựng bộ điều khiển thích nghi trực tiếp và áp dụng phương pháp chỉnh

định với luật chỉnh định tham số trình bày trong [57] cho thành phần bù động

dùng bộ xấp xỉ mờ nơron đề xuất trong phương pháp. Dựa trên giả thiết tồn tại

luật điều khiển tĩnh chứa bộ xấp xỉ mờ nơron thỏa mãn điều kiện của Định lý 3

và trong miền véctơ tham số θ , luận án cho biết cũng tồn tại luật điều khiển

động trên cơ sở bộ xấp xỉ đã nêu và bằng luật chỉnh định tham số đề xuất sẽ

đảm bảo hệ sai số vòng kín ổn định.

Nhằm lựa chọn bộ xấp xỉ mờ nơron tuyến tính hay phi tuyến đối với tham số

trong luật điều khiển thích nghi, luận án cũng xem xét và chỉ ra phương pháp

giải quyết trong mỗi trường hợp. Các kết quả này được trình bày dưới dạng

Định lý 4 trang 102 và Bổ đề 7 trang 105 trong trường hợp hệ khả tuyến tính

hóa phản hồi trạng thái (đối với trường hợp hệ khả tuyến tính hóa phản hồi vào-

ra cũng cho kết quả tương tự). Theo đó ta có thể lựa chọn các tham số điều

khiển phù hợp để hệ sai số E luôn nằm trong EB nhỏ tùy ý và do vậy trong

trường hợp cần đảm bảo giới hạn của trạng thái và đầu vào, ta có thể chọn

E EB để quỹ đạo trạng thái và đầu vào của hệ luôn nằm trong miền hợp lệ

thỏa mãn yêu cầu thiết kế. Các kết quả về điều khiển thích nghi trực tiếp trong

phương pháp được tác giả tổng hợp thành các bước trình bày trong mục 4.3.

Ngoài ra do đặc điểm tích hợp cao của các hệ thống điều khiển thông dụng

trong công nghiệp, luận án cũng đề xuất mô hình phần mềm cho phép xây dựng

và áp dụng luật điều khiển tĩnh và động trên hệ thống tự động hóa SIMATIC

của hãng Siemens. Tóm lại các kết quả trong Chương 4 cho phép phân tích và

thiết kế bộ điều khiển thích nghi trực tiếp ổn định trong phương pháp cũng như

phân tích khả năng áp dụng trên các hệ thống điều khiển công nghiệp tiên tiến.

- 122 -

KẾT LUẬN VÀ KIẾN NGHỊ

Các kết quả của luận án có thể tổng hợp lại như sau:

1. Thiết lập cơ sở toán học của phương pháp thay thế ước lượng hàm trạng

thái dựa trên lập hệ sai số thỏa mãn Giả thiết 1:

a. Hệ sai số (2-20) có nghiệm bị chặn tới hạn đều theo (2-26) nếu xác định

được các hàm thay thế ước lượng thỏa mãn điều kiện (2-34) (Định lý 1).

b. Hàm μ ( , , )E E định nghĩa như (2-61) có giá trị lớn nhất xác định bởi

công thức (2-63) (Bổ đề 3) dùng để phân tích tính bền vững của hệ vòng

kín đối với thành phần không rõ bị chặn xuất hiện trên đầu vào của hệ.

c. Thành phần bù liên tục (2-60) và (2-87) dựa trên hàm xíchma lưỡng cực

trong luật điều khiển phản hồi cho phép giảm trừ tác động của các thành

phần không rõ trên đầu vào của hệ lên hệ sai số (Bổ đề 4 và Định lý 2).

2. Đưa ra luật điều khiển sử dụng bộ xấp xỉ mờ nơron trong trường hợp tổng

quát để giải quyết vấn đề điều khiển ổn định tĩnh trong phương pháp:

a. Luật điều khiển tĩnh (3-13) chứa thành phần bù liên tục (3-12) với sai số

bộ xấp xỉ mờ nơron thỏa mãn (3-14) bảo đảm nghiệm của hệ sai số vòng

kín (2-20) bị chặn tới hạn đều (Định lý 3).

b. Điều kiện để quỹ đạo trạng thái của hệ luôn nằm trong miền hợp lệ của

không gian trạng thái là tham số điều khiển (nếu tồn tại) thỏa mãn (3-19).

Điều kiện để tín hiệu điều khiển luôn nằm trong miền hợp lệ của tín hiệu

đầu vào là biểu thức (3-22) được thỏa mãn (Bổ đề 5).

c. Điều kiện để luật điều khiển tĩnh (3-39) chứa thành phần bù liên tục

(3-38) điều khiển ổn định các hệ chuyển động hỗn loạn (chaotic systems)

có phương trình động học ở dạng tuyến tính hóa phản hồi chặt (3-25) là

điều kiện xấp xỉ (3-42) được thỏa mãn.

3. Phát triển bộ điều khiển thích nghi trực tiếp dựa trên phương pháp chỉnh

định để chỉnh định tham số của bộ xấp xỉ mờ nơron (là thành phần bù

- 123 -

động trong phương pháp) trong hai trường hợp bộ xấp xỉ tuyến tính và phi

tuyến đối với tham số:

a. Luật điều khiển thích nghi và chỉnh định tham số (4-7) với bộ xấp xỉ

tuyến tính bảo đảm nghiệm của phương trình động học hệ sai số (2-20) bị

chặn bởi EE B với EB định nghĩa như (4-10) (Định lý 4).

b. Luật điều khiển thích nghi và chỉnh định tham số (4-12) với bộ xấp xỉ phi

tuyến bảo đảm nghiệm của phương trình động học hệ sai số (2-20) bị

chặn bởi EE B với EB định nghĩa như (4-15) (Bổ đề 7).

4. Phân tích khả năng áp dụng phương pháp trên các hệ thống điều khiển công

nghiệp với PLC đủ mạnh, đặc biệt là Soft-PLC.

Ngoài việc tổng hợp một số kết quả nghiên cứu trình bày dưới dạng các bổ

đề (Bổ đề 1, Bổ đề 2, Bổ đề 6), luận án đã xây dựng và chứng minh được 04

định lý (Định lý 1, Định lý 2, Định lý 3, Định lý 4), 04 bổ đề (Bổ đề 3, Bổ đề 4,

Bổ đề 5, Bổ đề 7) và một số công thức tính toán làm cơ sở khoa học cho việc

xây dựng thuật toán và mô hình điều khiển trong phương pháp. Các kết quả liên

quan đến luận án đã được tác giả và các cộng sự công bố trong 04 bài báo tại

các Hội nghị chuyên ngành trong đó có 01 bài báo quốc tế.

Một số vấn đề tồn tại và hướng nghiên cứu, hoàn thiện tiếp của luận án đặt ra

cả về mặt lý thuyết và thực tiễn ứng dụng trong công nghiệp như sau:

- Mở rộng phương pháp cho kiểu điều khiển phản hồi đầu ra (output-feedback

control) khi chỉ có đầu ra và một số trạng thái đo được, các trạng thái còn lại

không đo được.

- Phân tích hệ trong miền thời gian rời rạc cho phép áp dụng phương pháp trên

các hệ điều khiển thời gian thực có tốc độ xử lý tính toán và lấy mẫu chậm.

- Nghiên cứu các phương pháp chọn hàm thay thế để sai số xấp xỉ bị chặn (là

điều kiện cần để áp dụng được phương pháp).

- Mở rộng phương pháp cho các hệ MIMO và hệ phi tuyến biến đổi theo thời

gian (time-variant).

- 124 -

CÁC CÔNG TRÌNH CÔNG BỐ LIÊN QUAN CỦA TÁC GIẢ

[1] Nguyễn Duy Hưng (2002), “Một số phương pháp học trong mạng nơron và xây

dựng mô hình nghiên cứu ứng dụng cho các hệ thống điều khiển công nghiệp”,

Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ V về Tự động hóa,

Hà Nội, tr.163–168.

[2] Nguyễn Duy Hưng (2005), “Phương pháp xây dựng hệ phần mềm điều khiển

Neurofuzzy cho hệ thống SIMATIC S7”, Tuyển tập các báo cáo khoa học Hội

nghị toàn quốc lần thứ VI về Tự động hóa, Hà Nội, tr.282–286.

[3] Nguyễn Duy Hưng, Nguyễn Thị Hương Lan, Nguyễn Tuấn Nam, Trịnh Hải

Thái (2005), “Cơ chế điều phối hoạt động trao đổi dữ liệu giữa các cấp trong

mạng phân tán Profibus-DP”, Thông báo khoa học Hội nghị toàn quốc lần thứ

VI về Tự động hóa, Hà Nội, tr.129–134.

[4] Nguyen Duy Hung and Nguyen Thi Huong Lan (2007), “An Estimated

Replacement Approach for Stable Control of a Class of Nonlinear Systems

with Unknown Functions of States”, Lecture Notes in Engineering and

Computer Science, World Congress on Engineering and Computer Science

WCECS 2007, San Francisco, USA, pp.822–827.

- 125 -

TÀI LIỆU THAM KHẢO

Tiếng Việt

[1] Nguyễn Thúy Anh, Hoàng Minh, Nguyễn Ngọc San (2008), Ước lượng tham

số mô hình hệ động học, Nhà xuất bản Khoa học và Kỹ thuật, Hà Nội.

[2] Võ Lâm Chương, Lê Hoài Quốc (2005), “Xây dựng bộ điều khiển dựa trên luật

ứng xử cho robot tự hành”, Tuyển tập các báo cáo khoa học Hội nghị toàn

quốc lần thứ VI về Tự động hóa, tr.76-81.

[3] Phạm Hữu Đức Dục, Nguyễn Công Hiền (2005), “Ứng dụng của bộ điều khiển

nơron mờ trong điều khiển thích nghi vị trí động cơ một chiều”, Tuyển tập các

báo cáo khoa học Hội nghị toàn quốc lần thứ VI về Tự động hóa, tr.101–106.

[4] Phạm Hữu Đức Dục, Nguyễn Công Hiền (2005), “Nghiên cứu ứng dụng mạng

nơron mờ điều khiển thích nghi rôbốt hai khâu”, Tuyển tập các báo cáo khoa

học Hội nghị toàn quốc lần thứ VI về Tự động hóa, tr.107–112.

[5] Lê Bá Dũng (1998), “Một thuật toán chỉnh định bộ điều khiển mờ sử dụng

mạng neuron”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ III

về Tự động hóa, tr.85–91.

[6] Lê Bá Dũng (2005), “Mạng nơron thích nghi mờ cho nhận dạng hệ điều khiển”,

Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ VI về Tự động

hóa, tr.119–124.

[7] Nguyễn Thị Phương Hà, Trần Đăng Long (2005), “Điều khiển mờ thích nghi

trực tiếp động cơ điện một chiều”, Tuyển tập các báo cáo khoa học Hội nghị

toàn quốc lần thứ VI về Tự động hóa, tr.150–155.

[8] Đặng Xuân Hoài (1998), “Điều khiển thích nghi tập mờ đối với hệ phi tuyến

trên cơ sở xấp xỉ tuyến tính hóa vào-ra”, Tuyển tập các báo cáo khoa học Hội

nghị toàn quốc lần thứ III về Tự động hóa, tr.175–184.

[9] Nguyễn Quang Hoan (1996), “Một số thuật học của mạng nơron”, Tuyển tập

các báo cáo khoa học Hội nghị toàn quốc lần thứ II về Tự động hóa, tr.220–

229.

[10] Huỳnh Thái Hoàng, Nguyễn Thị Phương Hà, Nguyễn Thúc Loan (2002),

“Nhận dạng hệ hệ phi tuyến dùng logic mờ”, Tuyển tập các báo cáo khoa học

Hội nghị toàn quốc lần thứ V về Tự động hóa, tr.137–143.

[11] Huỳnh Thái Hoàng, Nguyễn Thúc Loan, Nguyễn Phương Hà (2005), “Điều

khiển mờ thích nghi trực tiếp hệ phi tuyến MIMO có đặc tính động học không”,

Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ VI về Tự động

hóa, tr.239–244.

- 126 -

[12] Nguyễn Duy Hưng (chủ nhiệm đề tài) và các cộng sự (2001), Nghiên cứu, thiết

kế hệ điều khiển mờ xây dựng trên cơ sở PLC ứng dụng trong công nghiệp,

Báo cáo kỹ thuật Đề tài cấp bộ (Bộ công nghiệp), Hà Nội.

[13] Nguyễn Duy Hưng, Phạm Hùng Cường, Nguyễn Nam Hải (2002), “Hệ thống

điều khiển thời gian thực trên nền máy tính PC và triển vọng ứng dụng”, Tuyển

tập các báo cáo khoa học Hội nghị toàn quốc lần thứ V về Tự động hóa,

tr.157–162.

[14] Nguyễn Duy Hưng (chủ nhiệm đề tài) và các cộng sự (2004), Nghiên cứu, xây

dựng hệ điều khiển Neurofuzzy trên cơ sở PLC cho các ứng dụng công nghiệp,

Báo cáo tổng kết khoa học và kỹ thuật Đề tài cấp bộ (Bộ công nghiệp), Hà Nội.

[15] Chu Văn Hỷ (1998), “Điều khiển thích nghi phi tuyến trên cơ sở mạng nơron

RBF”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ III về Tự

động hóa, tr.238–241.

[16] Cao Tiến Huỳnh (1998), “Về một phương pháp tổng hợp các hệ điều khiển có

chất lượng cao”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ

III về Tự động hóa, tr.226–232.

[17] Cao Tiến Huỳnh (2000), “Điều khiển trượt trên các mặt trượt mờ”, Tuyển tập

các báo cáo khoa học Hội nghị toàn quốc lần thứ IV về Tự động hóa, tr.237–

242.

[18] Cao Tiến Huỳnh (2005), “Tổng hợp hệ điều khiển trượt thích nghi cho các đối

tượng có trễ”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ VI

về Tự động hóa, tr.288–293.

[19] Lê Hùng Lân (1996), “Xác định mô hình bất định đối tượng nhận dạng trong

điều khiển robust”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ

II về Tự động hóa, tr.314–322.

[20] Phan Xuân Minh, Nguyễn Tiến Hiếu (2005), “Điều khiển thích nghi tay máy

trên cơ sở hệ mờ”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ

VI về Tự động hóa, tr.370–375.

[21] Phan Xuân Minh, Nguyễn Doãn Phước (1997), Lý thuyết điều khiển mờ, Nhà

xuất bản Khoa học và Kỹ thuật, Hà Nội.

[22] Lê Văn Ngự (1996), “Giới hạn chuyển động của người máy công nghiệp theo

quỹ đạo hình học cho trước”, Tuyển tập các báo cáo khoa học Hội nghị toàn

quốc lần thứ II về Tự động hóa, tr.386–390.

[23] Trần Quang Oánh, Nguyễn Văn Tiềm, Lê Hùng Lân (2002), “Điều khiển thích

nghi gián tiếp chuyển động trên cơ sở các bộ xấp xỉ mờ”, Tuyển tập các báo

cáo khoa học Hội nghị toàn quốc lần thứ V về Tự động hóa, tr.289–294.

[24] Phân viện Tự động hóa, Viện Công nghệ thông tin (1997), Các báo cáo về

nghiên cứu hệ điều khiển Fuzzy, Báo cáo Đề tài cấp nhà nước mã số KHCN 04-

09-04.

- 127 -

[25] Nguyễn Doãn Phước, Phan Xuân Minh (2000), Điều khiển tối ưu và bền vững,

Nhà xuất bản Khoa học và Kỹ thuật, Hà Nội.

[26] Nguyễn Doãn Phước (2005), “Một phương pháp thiết kế bộ điều khiển thích

nghi ổn định tiệm cận toàn cục cho bài toán điều khiển thích nghi kháng

nhiễu”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần thứ VI về Tự

động hóa, tr.414–419.

[27] Nguyễn Doãn Phước (2005), “Thiết kế bộ điều khiển tuyến tính hóa chính xác

bằng phương pháp cuốn chiếu (backstepping)”, Tuyển tập các báo cáo khoa

học Hội nghị toàn quốc lần thứ VI về Tự động hóa, tr.420–425.

[28] Nguyễn Hoàng Phương, Bùi Công Cường, Nguyễn Doãn Phước, Phan Xuân

Minh, Chu Văn Hỷ (1998), Hệ mờ và ứng dụng, Nhà xuất bản khoa học và kỹ

thuật, Hà Nội.

[29] Thái Quang Vinh (2002), “Điều khiển bền vững theo chế độ trượt mờ cho các

hệ phức hợp nhiều thành phần”, Tuyển tập các báo cáo khoa học Hội nghị toàn

quốc lần thứ V về Tự động hóa, tr.456–461.

[30] Nguyễn Xuân Quỳnh, Lưu Hoàng Long (1996), “Hệ thống điều khiển số trong

tự động lái tàu thủy”, Tuyển tập các báo cáo khoa học Hội nghị toàn quốc lần

thứ II về Tự động hóa, tr.479–485.

[31] Thái Quang Vinh (2002), “Điều khiển bền vững theo chế độ trượt mờ cho các

hệ phức hợp nhiều thành phần”, Tuyển tập các báo cáo khoa học Hội nghị toàn

quốc lần thứ V về Tự động hóa, tr.456–461.

Tiếng Anh

[32] Alberto Isidori, Maria Domenica Di Benedetto (1996), “Feedback

Linearization of Nonlinear Systems”, The Control Handbook, Editor William

S. Levine, CRC Press and IEEE Press, pp.909–917.

[33] Alberto Isidori, Christopher I. Byrnes (1996), “Nonlinear Zero Dynamics”, The

Control Handbook, Editor William S. Levine, CRC Press and IEEE Press,

pp.917–923.

[34] Bart Kosko (1997), Fuzzy Engineering, Prentice Hall, USA.

[35] Bong-Jun Yang (2004), Adaptive Output Feedback Control of Flexible

Systems, Ph.D. Thesis, Georgia Institute of Technology.

[36] Bui Trong Tuyen, Pham Thuong Cat (2004), “An ANN-based method to

control Hand-eye Robot for tracking of moving objects”, The 8th

International

Conference on Mechatronics Technology, Hanoi, pp.195–199.

[37] C.Wang, S.S. Ge (2001), “Adaptive Backstepping Control of Uncertain Lorenz

System”, International Journal of Bifurcation and Chaos, Vol. 11, No. 4,

pp.1115–1119.

- 128 -

[38] Carl D. Meyer (2000), Matrix Analysis and Applied Linear Algebra, SIAM,

Philadelphia, USA.

[39] Chen Gang, Ye Dong, Che Rensheng (2007), "Developing Trend of Industrial

Fieldbus Control System”, The 8th

IEEE International Conference on

Electronic Measurement and Instruments, ICEMI '07, pp.1-765–1-768.

[40] Dong-Ling Tsay, Hung-Yuan Chung, and Ching-Jung Lee (1999), “The

Adaptive Control of Nonlinear Systems Using the Sugeno-Type of Fuzzy

Logic", IEEE Transactions on Fuzzy Systems, Vol. 7, No. 2, pp.225–229.

[41] F. Abdollahi and K. Khorasani (2006), “Stable Robust Adaptive Controller for

a Class of Nonlinear Systems”, The 2006 IEEE International Conference on

Control Applications, Germany, pp. 1825–1830.

[42] F.C. Chen, C.C. Liu (1994), “Adaptively controlling nonlinear continuous-time

systems using multilayer neural networks”, IEEE Transactions on Automatic

Control, Vol. 39, pp. 1306–1310.

[43] Feryâl Alayont (2005), Project on the Stone-Weierstrass Theorem, Integration

Workshop.

[44] F.L. Lewis, J. Camos, R. Selmic (2002), Neuro-Fuzzy Control of Industrial

Systems with Actuator Nonlinearities, Society for Industrial and Applied

Mathematics (SIAM), Philadelphia, USA.

[45] G. Conte, C.H. Moog, A.M. Perdon (1999), Nonlinear Control Systems: An

Algebraic Setting, Springer-Verlag, London, Great Britain.

[46] Gang Tao, Petar V. Kokotović (1996), Adaptive Control of Systems with

Actuator and Sensor Nonlinearities, John Wiley & Sons, Inc., New York,

USA.

[47] George J. Klir, Ute St. Clair, Bo Yuan (1997), Fuzzy Set Theory: Foundations

and Applications, Prentice Hall, New Jersey, USA.

[48] George J. Pappasy, John Lygeros and Datta N. Godbole (1995), Stabilization

and Tracking of Feedback Linearizable Systems under Input Constraints, The

34th

CDC Report, Intelligent Machines and Robotics Laboratory, University of

California at Berkeley.

[49] Graebe Stefan, Salgado Mario, Graham C. Goodwin, Mario Salgado, Stefan

Greabe (2000), Control System Design, Prentice Hall, New Jersey, USA.

[50] Hassan K. Khalil (2001), Nonlinear Systems, 3rd Edition, Prentice Hall, USA.

[51] Horacio J. Marquez (2003), Nonlinear Control Systems: Analysis and Design,

Wiley Interscience, USA.

[52] Hugang Han, Chun-Yi Su, and Yury Stepanenko (2001), “Adaptive Control of

a Class of Nonlinear Systems with Nonlinearly Parameterized Fuzzy

Approximators", IEEE Transactions on Fuzzy Systems, Vol. 9, No. 2, pp.315–

323.

- 129 -

[53] Indrani Kar and Laxmidhar Behera (2008), “Direct Adaptive Neural Control

Scheme for Discrete Time Affine Nonlinear Systems”, ISIC 2008 – IEEE

International Symposium on Intelligent Control, pp. 1097–1102.

[54] Jang-Hyun Park, Seong-Hwan Kim, Chae-Joo Moon (2006), “Adaptive Fuzzy

Controller for the Nonlinear System with Unknown Sign of the Input Gain",

International Journal of Control, Automation, and Systems, Vol. 4, No. 2, pp.

178–186.

[55] Jan Jantzen (2003), Neural and Neurofuzzy Control, Tech. report no 99-H 999,

Technical University of Denmark.

[56] Jeffrey T. Spooner, K.M. Passino (1996), “Stable adaptive control using fuzzy

systems and neural networks”, IEEE Transations on Fuzzy Systems, Vol. 4,

pp.339–359.

[57] Jeffrey T. Spooner, Mangredi Maggiore, Raúl Ordónez, Kelvin M. Passino

(2002), Stable Adaptive Control and Estimation for Nonlinear Systems: Neural

and Fuzzy Approximator Techniques, Wiley Interscience, USA.

[58] José C. Principe, Neil R. Euliano, W. Curt Lefebvre (2000), Neural and

Adaptive Systems: Fundamentals Through Simulations, John Wiley & Sons,

Inc., USA.

[59] Indrani Kar and Laxmidhar Behera (2006), “Neural Network Based Direct

Adaptive Control for a Class of Affine Nonlinear Systems”, The 2006 IEEE

International Symposium on Intelligent Control, Munich, Germany, pp.2030–

2035.

[60] Jun Nakanishi, Jay A. Farrell, and Stefan Schaal (2002), “A Locally Weighted

Learning Composite Adaptive Controller with Structure Adaptation”,

IEEE/RSJ International Conference on Intelligent Robots and Systems, pp.882–

889.

[61] Jun Nakanishi, Jay A. Farrell, and Stefan Schaal (2004), “Learning Composite

Adaptive Control for a Class of Nonlinear Systems”, The 2004 IEEE

International Conference on Robotics & Automation, New Orleans, LA,

pp.2647–2652.

[62] Jun Nakanishi, Jay A. Farrell, and Stefan Schaal (2005), “Composite adaptive

control with locally weighted statistical learning”, Elsevier Neural Networks,

vol. 18 (1), pp.71–90.

[63] Jun Nakanishi, Stefan Schaal (2004), “Feedback Error Learning and Nonlinear

Adaptive Control”, Elsevier Neural Networks, vol. 17 (10), pp.1453–1465.

[64] Jyh-Shing Roger Jang (1993), “Adaptive-Network-Based Fuzzy Inference

System”, IEEE Transactions on Systems, Man and Cybernetics, vol. 23(3),

pp.665–685.

- 130 -

[65] Jyh-Shing Roger Jang, Chuen-Tsai Sun (1995), “Neuro-Fuzzy Modeling and

Control”, The Proceedings of the IEEE, vol. 83(3), pp.378–406.

[66] Jyh-Shing Roger Jang, Chuen-Tsai Sun, Eiji Mizutani (1996), Neuro-Fuzzy and

Soft Computing: A Computational Approach to Learning and Machine

Intelligence, Prentice Hall, USA.

[67] Jyh-Shing Roger Jang, Mizutani E. (1996), “Levenberg-Marquardt method for

ANFIS learning”, Fuzzy Information Processing Society, NAFIPS 1996

Biennial Conference of the North American, pp.87-91.

[68] Karl J. Åström, Björn Wittenmark (1995), Adaptive Control, 2nd

Edition,

Addison-Wesley Publishing, USA.

[69] Karl J. Åström, Tore Hagglund (1995), PID Controllers: Theory, Design, and

Tuning, 2nd

Edition, Instrument Society of America, USA.

[70] Katsuhiko Ogata (1995), Modern Control Engineering, 2nd

Edition, Prentice

Hall, USA.

[71] Li Tieshan, Zou Zaojian, and Zhou Xiaoming (2008), “Adaptive NN Control

for a Class of Strict-feedback Nonlinear Systems”, American Control

Conference, Washington, USA, pp.81–86.

[72] Marios M. Polycarpou, Petros A. Ioannou (1991), Identification and Control of

Nonlinear Systems using Neural Network Models: Design and Stability

Analysis, Report 91-09-01.

[73] Marios M. Polycarpou, Petros A. Ioannou (1992), “Modeling, Identification

and Stable Adaptive Control of Continuous-time Nonlinear Dynamical System

using Neural Networks”, American Control Conference, Chicago, IL, pp. 36–

40.

[74] Matt Young (2006), The Stone-Weierstrass Theorem, MATH 328 Notes,

Queen's University at Kingston, Winter Term.

[75] Mehrdad Hojati and Saeed Gazor (2002), “Hybrid Adaptive Fuzzy

Identification and Control of Nonlinear Systems", IEEE Transactions on Fuzzy

Systems, Vol. 10, No. 2, pp.198–210.

[76] Michael A. Arbib (2003), The Handbook of Brain Theory and Neural

Networks, The MIT Press, USA.

[77] N.G.Nath and Nguyen N. San (1996), “On a New Approach to Parameter

Estimation of a Control System: Input-Error Approach”, The second Vietnam

Conference on Automation, pp.373–378.

[78] Nguyen Phung Quang (2004), “Nonlinear Control Structures: New Application

Perspective in Three-Phase AC Drives”, The 8th

International Conference on

Mechatronics Technology, Hanoi, pp.213–219.

- 131 -

[79] Nguyen Xuan Quynh, Do Khac Duc (1998), “A method to Design Robust

Adaptive Controller of Nonlinear First Order Systems”, The third Vietnam


[80] Nguyen Xuan Quynh, Do Khac Duc (1998), “Adaptive Control Law for a Class

of Uncertain Nonlinear Systems with Input Time Delay”, The third Vietnam


[81] Nguyen Xuan Quynh, Do Khac Duc (2000), “An Adaptive Controller for a

Class of Nonlinear Systems with Unknown Parameters Appearing

Nonlinearly”, The fourth Vietnam Conference on Automation, pp.384–389.

[82] Nguyen Xuan Quynh, Do Khac Duc (2000), “N-term Adaptive Control of a

Class of Uncertain Nonlinear Systems”, The fourth Vietnam Conference on

Automation, pp.390–395.

[83] Nguyen Xuan Quynh, Do Khac Duc, F.G. De Boer (2000), “Indirect Optimal

Adaptive Control of Nonlinear Systems”, The fourth Vietnam Conference on

Automation, pp.396–401.

[84] Richard Zurawski (2005), The Industrial Communication Technology

Handbook, CRC Press.

[85] R.M. Corless, G.H. Gonnet, D.E.G. Hare, D.J. Jeffrey (1996), “On the

Lambert's W Function”, Technical Report, Advances in Computational

Mathematics, Vol 5, pp.329–359.

[86] Robert Fullér (1995), Neural Fuzzy Systems, Ǻbo Akademi University.

[87] Saverio Mascolo, Giuseppe Grassi (1999), “Controlling Chaotic Dynamics

Using Backstepping Design With Application to the Lorenz System and Chua’s

Circuit”, International Journal of Bifurcation and Chaos, Vol. 9, No. 7,

pp.1425–1434.

[88] Siemens-AG (2003), FuzzyControl++, Version 5.0, User’s Manual.

[89] Siemens-AG (1998), NeuroSystems, User’s Manual, Version 1.0.

[90] Siemens-AG (1999), Recipes for Easy Applications of Neural Networks,

NeuroSystems-Cookbook.

[91] Simon Haykin (1999), Neural Networks A Comprehensive Foundation, 2nd

Edition, Prentice Hall, USA.

[92] Shouling He, Konrad Reif, Rolf Unbehauen (1998), “A Neural Approach for

Control of Nonlinear Systems with Feedback Linearization”, IEEE

Transactions on Neural Networks, Vol. 9, No. 6, pp.1409–1421.

[93] S.P. Moustakidis, G.A. Rovithakis, and J.B. Theocharis (2006), “An Adaptive

Neuro-Fuzzy Control Approach for Nonlinear Systems via Lyapunov Function

Derivative Estimation”, The 2006 IEEE International Symposium on Intelligent

Control, Munich, Germany, pp.1602–1607.

- 132 -

[94] S. Seshagiri and H. K. Khalil (2000), “Output feedback control of nonlinear

systems using RBF neural networks”, IEEE Transactions on Neural Networks,

Vol. 11, No. 1, pp. 69–79.

[95] S.S. Ge, C. C. Hang, Tao Zhang (1999), “Adaptive Neural Network Control of

Nonlinear Systems by State and Output Feedback", IEEE Transactions on

Systems, Man, and Cybernetics, Part B: Cybernetics, Vol. 29, No. 6.

[96] S.S. Ge, C.Wang, T.H.Lee (2000), “Adaptive Backstepping Control of a Class

of Chaotic Systems”, International Journal of Bifurcation and Chaos, Vol. 10,

No. 5, pp.1149–1156.

[97] Tianping Zhang and Shuzhi Sam Ge (2006), “Robust Adaptive Neural Control

of SISO Nonlinear Systems with Unknown Nonlinear Dead-Zone and

Completely Unknown Control Gain”, The 2006 IEEE International Symposium

on Intelligent Control, Munich, Germany, pp.88–93.

[98] T. John Koo (2001), “Stable Model Reference Adaptive Fuzzy Control of a

Class of Nonlinear Systems", IEEE Transactions on Fuzzy Systems, Vol. 9, No.

4, pp.624–636.

[99] Tomohisa Hayakawa (2003), Direct Adaptive Control for Nonlinear Uncertain

Dynamical Systems, Ph.D. Thesis, Georgia Institute of Technology.

[100] Tomohisa Hayakawa (2005), “A New Characterization on the Approximation

of Nonlinear Functions via Neural Networks: An Adaptive Control

Perspective”, The 44th

IEEE Conference on Decision and Control, and the

European Control Conference, Spain, pp.4117–4122.

[101] Tomohisa Hayakawa, Wassim M. Haddad, James M. Bailey, Naira

Hovakimyan (2005), “Passivity-Based Neural Network Adaptive Output

Feedback Control for Nonlinear Nonnegative Dynamical Systems", IEEE

Transactions on Neural Networks, Vol. 16, No. 2, pp.387–398.

[102] Tomohisa Hayakawa, Wassim M. Haddad, Naira Hovakimyan, VijaySekhar

Chellaboina (2005), “Neural Network Adaptive Control for Nonlinear

Nonnegative Dynamical Systems", IEEE Transactions on Neural Networks,

Vol. 16, No. 2, pp.399–413.

[103] Tomohisa Hayakawa, Wassim M. Haddad, and Naira Hovakimyan (2008),

“Neural Network Adaptive Control for a Class of Nonlinear Uncertain

Dynamical Systems with Asymptotic Stability Guarantees", IEEE Transactions

on Neural Networks, Vol. 19, No. 1, pp.80–89.

[104] T. Zhang, S. S. Ge, C. C. Hang (2000), “Stable Adaptive Control for a Class of

Nonlinear Systems using a Modified Lyapunov Function", IEEE Transactions

on Automatic Control, Vol. 45, No. 1, pp.129–132.

- 133 -

[105] Wenjie Dong, Yuanyuan Zhao, Jay A. Farrell (2008), “Tracking Control of

Nonaffine Systems: A Self-organizing Approximation Approach”, American

Control Conference, Washington, USA, pp. 69–74.

[106] Won Kee Son, Jin Young Choi, and Oh Kyu Kwon (2002), “Robust Predictive

Control of Uncertain Nonlinear System With Constrained Input", Transactions

on Control, Automation and Systems Engineering, Vol. 4, No. 4, pp.289–295.

[107] Yansheng Yang, Changjiu Zhou (2005), “Robust Adaptive Fuzzy Tracking

Control for a Class of Perturbed Strict-feedback Nonlinear Systems via Small-

gain Approach”, Elsevier Information Sciences, Vol. 170, pp.211–234.

[108] Yixin Diao, Kelvin M. Passino (2004), “Stable Adaptive Control of Feedback

Linearizable Time-varying Non-linear Systems with Application to Fault-

tolerant Engine Control”, International Journal of Control, Vol. 77, No. 17,

pp.1463–1480.

- 134 -

PHỤ LỤC

5.1. Một số thuật ngữ tiếng Anh

class K (hàm lớp K): ( )E K nếu : D đồng biến chặt trên 0,D r với

r và (0) 0 .

class K (hàm thuộc lớp K): ( )E K nếu K với 0,D và

lim ( )EE

.

class KL (hàm thuộc lớp KL ): Hàm liên tục : n thuộc lớp KL nếu

( , )t K x với mỗi t không đổi và giảm dần đối với t khi x không đổi và

( , )t K x khi t .

compact set/space (tập compac): Tập compac n x là tập con đóng (closed) và bị

chặn.

decrescent function (hàm giảm dần): Hàm liên tục ( , ) :V t Bh x ,

:nB hh x x (hoặc ( , ) : nV t x ) được gọi là giảm dần nếu

tồn tại hàm γ K định nghĩa trên 0,r với 0r định nghĩa trên 0, sao cho

( , ) γ( )V t x x với 0t và Bhx , 0h (hoặc nx ). Ngoài ra ( , )V t x giảm

dần khi và chỉ khi tồn tại hàm xác định dương trên Bh (hoặc trên

n ) để

( , ) w( )V t x x với mọi Bhx (hoặc nx ) và 0t

diffeomorphism (phép biến đổi vi đồng phôi): Phép biến đổi T : n n được

gọi là vi (đồng) phôi nếu tồn tại phép biến đổi ngược 1T với T , 1T là các hàm

trơn (smooth).

globally uniformly asymtotically stable (ổn định tiệm cận đều toàn cục): Gốc của hệ

(2-68) e x 0 là ổn định tiệm cận đều (hoặc đơn trị) toàn cục nếu là ổn định đều

toàn cục và với mọi 0 và 00t luôn tồn tại 00 không phụ thuộc vào 0t

và , ( ) 0T không phụ thuộc vào 0t

để cho ( , , )0 0t t e x x x với mọi

( )0t t T khi ( )0 e x x .

- 135 -

Lambert w function (hàm Lambert w): ([84]) Hàm Lambert w( )x là nghiệm của

phương trình w( )w( )

xx e x . Trong MATLAB hàm được gọi như sau

lambertw( )Y X .

radially unbounded (không bị chặn tia): Hàm liên tục ( , ) : nV t E được gọi

là không bị chặn theo tia nếu ( , ) 0V t 0 với 0t và tồn tại hàm γ K để

( , ) γ( )V t E E với 0t và nE .

Rayleigh-Ritz (bất đẳng thức Rayleigh-Ritz): Nếu : n nP là ma trận đối xứng và

nx thì ( ) ( )min maxT T T P x x x Px P x x .

relative degree (bậc tương đối): ([50], [51]) Hệ (2-1) có bậc tương đối n tại 0ξ nếu

2( ) ( ) ( ) 0nL h L L h L L h ξ ξ ξg g f g fξ ξ ξ ξ ξ với ξ trong lân cận của 0

ξ và

1 0( ) 0nL L h ξg fξ ξ, trong đó ký hiệu ( )L h ξfξ

là đạo hàm Lie – hay còn gọi là

đạo hàm của ( ) : n dh D ξ theo ( ) : n d n dD f ξξ – và

được định nghĩa như sau: ( )

( ) ( )h

L h

ξξ f ξf ξξξ

, 1( ) ( )k kL h L L h

ξ ξf f fξ ξ ξ với

2k . Ý nghĩa của bậc tương đối là số lần phải lấy đạo hàm của đầu ra theo quỹ

đạo động học của hệ để đầu vào xuất hiện rõ hay để ánh xạ đầu vào-đầu ra là tuyến

tính.

state feedback linearization (tuyến tính hóa phản hồi trạng thái): ([50], [51]) Hệ (2-1)

là khả tuyến tính hóa phản hồi trạng thái nếu tồn tại phép biến đổi ( )x T ξ xác

định trên U (chứa gốc tọa độ) và ( ) T 0 0 để chuyển hệ sang dạng thức

( ) ( )f g u x Ax b x x với ( , )A b là cặp điều khiển được ([49]).

uniformly bounded (tính bị chặn đều)

( , , )0 0t tx x được gọi là bị chặn đều hay bị chặn

đơn trị nếu với mỗi 0 và 00t luôn tồn tại ( ) 0 (không phụ thuộc vào

0t) để 0 x thì ( , , ) ( )0 0t t x x với mọi 00t t .

uniformly ultimately bounded (bị chặn tới hạn đều): Nghiệm ( , , )0 0t tx x được gọi là bị

chặn tới hạn đều nếu tồn tại 0B và với mỗi 0 , 00t luôn tồn tại ( ) 0T

(không phụ thuộc vào 0t

) để 0 x thì ( , , )0 0t t Bx x với mọi ( )0t t T .

unitary matrix (ma trận unita): U là ma trận unita nếu 1 * U U với ký hiệu

*U là

chuyển vị liên hợp phức của U. Trường hợp ma trận số thực thì 1 T U U .

- 136 -

5.2. Bổ đề 1 trang 23

Để chứng minh hệ sai số (2-16) thỏa mãn Giả thiết 1 ta cần chỉ ra hàm số

( , ) :t E x có tính chất bị chặn với E bị chặn và không giảm dần đối

với E khi t không đổi để ( , )t E xx với mọi t .

Từ định nghĩa hệ sai số (2-16): ( 1)( , ) T nE E nE t x r x k d với 1 1, ,T

E nk k k

và

( 2)1 2 1, , ,

Τn

E nx r x r x r

d ta có:

2 2

( 1)( 2) ( 2)

1 1

( 1)

1 2 1

0

0

1

0 0

0 0

1

T nE E E nn n

n n

n Tn E E

E

n

x r x r

x rx r x r

x r

E

k k k

d k d

k d

Id

Đặt

1 2 1

0

0

nk k k

k

IA

và 1

0

0

1

n

b

dẫn đến phương trình động

học đối với Ed như sau:

E E E kd A d b (5-1)

với kA là Hurwitz do 1 21 1

n nns k s k là Hurwitz.

Biết nghiệm của phương trình vi phân tuyến tính (5-1) là:

( )

0

( ) e (0) e ( )t

t tE Et E d

k kA A

d d b (5-2)

Do kA là Hurwitz nên luôn tìm được các số dương 1p và 2p để 21e e

t -p tpkA

bằng phương pháp sau:

- 137 -

Phương trình trạng thái (5-1) khi 0E có nghiệm là ( ) e (0)t

E Et kAd d . Đặt

( ) TE EV t d Pd với P là ma trận đối xứng xác định dương thỏa mãn

( )T k kPA A P I thì 2

( )T T TE E E E EV k kd PA A P d d d d .

Áp dụng bất đẳng thức Rayleigh-Ritz với min max( ), ( ) P P tương ứng là các giá trị

riêng nhỏ nhất và lớn nhất của P :

min max

min max

( ) ( )

( ) ( )

T TTE E E EE E

V VV

d Pd d Pdd d

P P

P P

Giải bất phương trình vế phải max ( )

VV

P ta được max/ ( )

(0)t

V V e

P

, mặt khác

thay vào bất đẳng thức vế trái sẽ có:

max

max

2 / ( )

min min

/ 2 ( )

min

(0)

( ) ( )

(0) (0)

( )

tE

TtE E

E

V Ve

e

P

P

dP P

d Pdd

P

Do vậy nếu chọn 1min

(0) (0)

( )

TE Ep

d Pd

P và 2

max

1

2 ( )p

P thì 2

1e et -p t

pkA.

Từ kết quả trên và (5-2) suy ra:

2 2 ( )1 1

0

( ) e (0) e ( ) ( , )E

t-p t -p t

E E dt p p E d t E

d d (5-3)

Mặt khác từ định nghĩa hệ sai số có thể viết:

( 1)

E E E

n T Tn E E E Ex r E E

d d dx r x r

k d k d

Do rr và từ (5-3) nên ta xác định được hàm x cần tìm để ( , )t E xx như

sau:

- 138 -

1

1

1

1 ( , ) ( , )E

E

TE E

TE E E

TE E E

TE E

n

ii

E

r E

r E

r E

r E k t E t E

d x

dx r

k d

d k d

d k d

k d

(5-4)

Rõ ràng là ( , )t E x tìm được trong (5-4) thỏa mãn tính chất là hàm số bị chặn khi

E bị chặn và không giảm dần đối với E khi t không đổi nên Bổ đề 1 đã được

chứng minh.

- 139 -

5.3. Bổ đề 3 trang 40 và kết quả (2-64)

Do μ ( , , ) sign( )bsig( , )E E E E E với 0 1 là hàm chẵn nên ta chỉ

cần xét hàm μ ( , , ) bsig( , )E E E E với 0E hay:

1 ( 1)

μ ( , , )1

E

E E

eE E

e

Tính đạo hàm của μ ( , , )E E theo E thu được:

2

2

2

2

2

2

2

( 1) 1 ( 1) (1 )μ

1

1 ( 1)

1

( 1) ( 1) ( 1)

1

( 1) ( 1) ( 1) ( 1) 1

1

( 1) 2( ) 1

1

E E E

EE

E E

E

E

E

E

E

E E

E

e E e ed

dE e

e E e

e

E E e

e

E E e

e

e E e

e

2

( , )

1 x

f x

e

trong đó ký hiệu 2( , ) ( 1) 2( ) 1x xf x e x e và x E .

Để tìm cực trị của μE cần thiết giải phương trình:

( , ) 0f x (5-5)

với 0 1 . Phương pháp khảo sát hàm số ( , )f x dưới đây chứng minh rằng

phương trình (5-5) trên luôn có nghiệm duy nhất.

Từ đạo hàm:

- 140 -

2( , ) 2( 1) 2 ( )

2 ( 1) ( 1)

x x x

x x

df x e e x e

dx

e x e

cho thấy ( , ) 0d

f xdx

khi và chỉ khi x là nghiệm của phương trình:

( 1) ( 1) xx e (5-6)

Để giải phương trình (5-6), ta sử dụng kết quả của Bổ đề 8 dưới đây:

Bổ đề 8 : Nghiệm của phương trình xx b ae với 0a là w( )bx b ae

với w( )x là hàm Lambert.

Chứng minh Bổ đề 8 từ biến đổi /( )x a x ax bx b ae e

a a và áp dụng Bổ đề 2

(trang 34) như sau:

/w ( ) log( ) w

log( )

w .

a b a a b

a

b

e e aex b b

a a a ae

x b ae

(5-7)

▲

Thay ( 1)a , 1b dẫn đến nghiệm của phương trình (5-6) là:

( 1)0

( 1)0

( 1) w ( 1)

1 w ( 1) 1 w(p)

x x e

x e

(5-8)

trong đó ký hiệu ( 1)p ( 1)e . Do

( 1)p(2 ) 0

de

d

nên p luôn giảm

dần đối với 0,1 và p(1) p( ) p(0) hay 2p 2 ,1e e

.

Khi đó ( , )f x chỉ có một điểm cực trị duy nhất (kết quả phân tích dưới đây cho

thấy đó là điểm cực tiểu) tại 0 0,x f với 0x xác định theo (5-8) và:

- 141 -

0 0

0 0

20

22( 1) ( 1)

w(p) w(p)

2

2( 1) ( 1)

( 1) ( 1)

2 2

,

( 1) 2( ) 1

1 1( 1) 2 ( 1) w(p) 1

w(p) w(p)( 1) 2 1 w(p) 1

( 1) ( 1)

w (p) w(p) w (p)2 1 w(p) 1

1 1

x x

f f x

e x e

e ee e

e ee e

2

22

2w(p) 1

1

w(p) 1.

1

Do hàm Lambert là đồng biến chặt trên 1 e, nên 2

w(2 ) w(p) w(1 )e e ,

suy ra 0 1x và 0 0f . Mặt khác ( ,0) 4 0f , ( , ) 1 0f nên ( , )f x

luôn cắt trục hoành chỉ tại một điểm mx nằm trong khoảng 00, x và 0f là giá trị cực

tiểu của hàm số ( , )f x . Lưu ý là

2

( , )μ

1E

x

d f x

dE e

nên kết quả trên cũng cho

phép suy ra tại mm

xE

, μE đạt giá trị lớn nhất bằng _ maxμ ( , ) μ ( , , )E E mE ,

ngoài ra do _ maxμ ( , ,0) 0 μ ( , , ) μ ( , )E E m EE nên giá trị lớn nhất là

dương.

Để tính giá trị lớn nhất này ta có thể sử dụng phương pháp giải trên MATLAB.

Dưới đây là mã code chương trình viết trên m-file để tạo ra đồ thị μ ( , , )E E trong

các trường hợp 5 , 10 và giá trị được chọn trong mỗi trường hợp là 1, 0.9

và 0.5 (Hình 4 trang 41):

% mu_E_max; VIELINA–NDH, 2006

function mu_E_max() clear all

global xm ym step=0.01; xmax=2;

a=0; rho1=1; rho2=0.9; rho3=0.5;

kappa=5; subplot(1,2,1); plot_mu(xmax, step, a, rho1, rho2, rho3, kappa);

kappa=10; subplot(1,2,2); plot_mu(xmax, step, a, rho1, rho2, rho3, kappa);

function Y=bsig(K,A,E) Y=(2/(1+exp(-K*(E-A))) - 1);

- 142 -

function Y=f_mu(K,A,B,E) Y=abs(E)*(B-sign(E)*bsig(K,A,E));

function Y=f_mu_em(K,B)

str=sprintf('(%4.2f+1)*exp(-2*x)+2*(%4.2f-x)*exp(-x)+%4.2f-1=0',B,B,B);

Y=solve(str)/K;

function plotf_mu(kappa, a, rho, w, color) global xm ym

em=double(f_mu_em(kappa,rho)); %E_m fe=f_mu(kappa,a,rho,em); %mu_E_max

s=sprintf('\\fontsize{10}\\it%5.4f',fe);

text(xm(1)-0.03,fe,s, 'Color', color, 'HorizontalAlignment', 'Right'); line([xm(1),em],[fe,fe], 'LineStyle', '-.', 'Color', color);

sprintf('mu(%f,%i,%5.4f)\t= %5.4f',rho,kappa,em,fe) % prints mu_E_max

function plot_mu(xmax, step, a, rho1, rho2, rho3, kappa)

global xm ym x=[-xmax:step:xmax]';

for i=1:size(x,1) y1(i)=f_mu(kappa,a,rho1,x(i));

y2(i)=f_mu(kappa,a,rho2,x(i)); y3(i)=f_mu(kappa,a,rho3,x(i));

end;

handle=plot(x,y1,'-r',x,y2,'-b',x,y3,'-k','LineWidth',1); xlabel('\fontsize{10}\it\bfE'); ylabel('\fontsize{15}\bf\mu\fontsize{10}_{E}');

grid on;

if kappa==5

xlim([-1 1]); ylim([-0.04 0.12]); set(gca,'XTick',[-1:0.5:1]);

x1=0.52; x2=0.56; x3=0.25;

title('\fontsize{15}\bf\it\kappa\fontsize{10}\rm\bf = 5');

else if kappa==10 xlim([-0.5 0.5]); ylim([-0.02 0.06]); set(gca,'XTick',[-0.5:0.25:0.5]);

x1=0.26; x2=0.28; x3=0.125;

title('\fontsize{15}\bf\it\kappa\fontsize{10}\rm\bf = 10'); end

end

text(x1,f_mu(kappa,a,rho1,x1),'\fontsize{10}\leftarrow \it\rho\rm\fontsize{9} = 1', 'Color','r'); text(x2,f_mu(kappa,a,rho2,x2),'\fontsize{10}\leftarrow \it\rho\rm\fontsize{9} = 0.9',

'Color','b'); text(x3,f_mu(kappa,a,rho3,x3),'\fontsize{10}\leftarrow \it\rho\rm\fontsize{9} = 0.5',

'Color','k');

e=exp(1); w=1+lambertw(1/e); xm=xlim; ym=ylim;

plotf_mu(kappa, a, rho1, w, 'r')

plotf_mu(kappa, a, rho2, w, 'b') plotf_mu(kappa, a, rho3, w, 'k')

- 143 -

5.4. Tuyến tính hóa phƣơng trình động lực học (3-23)

Đặt 1 4 1 1 2 2,.., , , ,T q q q q ξ , khi đó phương trình động lực học (3-23) và đầu

ra có thể viết dưới dạng:

1 2

2 1 1 3

3 4

4 1 3

1

sin ( )

( )

a b

c du

y

(5-9)

với MgL

aI

, k

bI

, k

cJ

và 1

dJ

hoặc:

( ) ( )

( )

u

y h

ξ ξξ f ξ g ξ

ξ

(5-10)

với

2

1 1 3

4

1 3

sin ( )( )

( )

a b

c

ξf ξ ,

0

0( )

0

d

ξg ξ và 1( )h ξ .

Hệ (5-10) có điểm cân bằng tại ξ 0 và có bậc đầy đủ 4n do từ:

2

21 1 3

2

31 2 1 2 4

3

42 1 1

22 1

( )( ) 1,0,0,0

( )( ) 0,1,0,0 sin ( )

( )( ) cos ,0, ,0 cos ( )

( )( ) sin , cos ,0,

sin cos

hL h

L hL h a b

L hL h a b b a b

L hL h a a b b

a a

ξ

ξ

ξ

ξ

ξ

ξ

ξ

f ξ ξ

f

f ξ ξ

f

f ξ ξ

f

f ξ ξ

ξξ f f

ξ

ξξ f f

ξ

ξξ f f

ξ

ξξ f f

ξ

1 1 1 3 1 3sin ( ) ( )b a b bc

ta có:

- 144 -

2

21

3

32 1 1

( )( ) 1,0,0,0 0

( )( ) 0,1,0,0 0

( )( ) cos ,0, ,0 0

( )( ) sin , cos ,0, 0

hL h

L hL L h

L hL L h a b b

L hL L h a a b b bd

ξ

ξ

ξ ξ

ξ

ξ ξ

ξ

ξ ξ

g ξ ξ

f

g f ξ ξ

f

g f ξ ξ

f

g f ξ ξ

ξξ g g

ξ

ξξ g g

ξ

ξξ g g

ξ

ξξ g g

ξ

Như vậy có thể sử dụng phép biến đổi vi đồng phôi 1 4( ) T ( ), ,T ( )T

T ξ ξ ξ với

1ξ T x để xác định:

1 1 1

2 2 22

3 3 1 1 3

34 4 2 1 2 4

( )T

( )T

( )T sin ( )

T cos ( )( )

hx

L hx

L hx a b

x a bL h

ξ

ξ

ξ

f

f

f

ξ

ξ

xξ

ξ

4 22 1 1 1 1 3 1 3

22 1 1 3 1 3 1 1

22 1 1 3

3

( ) ( ) sin cos sin ( ) ( )

1sin cos ( sin )

sin cos

( ) ( )

f L h a a b a b bc

ax x a x b x bc x x a x bxb

a x c x a x b c x

g L L h bd

ξ

ξ ξ

f

g f

x ξ

x ξ

và biểu diễn hệ ở dạng tuyến tính hóa phản hồi trạng thái chuẩn tắc:

1 2

2 3

3 4

24 2 1 1 3

1

sin cos

x x

x x

x x

x a x c x a x b c x bdu

y x

(5-11)

Kết quả trên cho thấy nếu giả thiết ξ là véctơ trạng thái đo được thì x cũng tính

được qua phép biến đổi x T ξ nêu trên.

- 145 -

5.5. Chƣơng trình mô phỏng ví dụ điều khiển tay rôbốt trang 79

% Robot Link Control Simulation; VIELINA–NDH, 2006

%function RobotSim1()

clear all;

global T_min T_step T_max fig a b c d a2 b2 c2 d2

nlStateFeedback_siso = ...

struct('Name','Nonlinear State-feedback Linearizable SISO Model', ...

'N', 0, 'CTRMode', '', ... % Control Mode

'fx', [], 'gx', [], 'hx', [], ... % Plant Model parameters

'fxa', [], 'gxa', [], 'hxa', [], ... % Plant Model Approximation

'FX', [], 'X',[],'W', [], 'Dg',[], 'Df', [], ... % Neural Network Approximator

'Fdxn', [], ... % Neural Network Approximator

'SatLim', 1, 'uLow', -1, 'uHigh', 1, ... % Saturation limiter

'RateLim', 1, 'duLow', -1, 'duHigh', 1, ... % Rate limiter

'K', [], 'eta', 1, 'ETA', [], 'kappa', [], ...

'alpha', 0, 'rho', 0, 'theta', 0, ... % Control parameters

'tempData', [], 'tempData2', []); % Testing data templates

% Nonlinear state-feedback linearizable SISO plant model:

% dx1/dt = x2

% dx2/dt = x3

% dx[N-1] = xN

% dxN/dt = f(x) + g(x)*u

% y = h(x)

% where x = [x1; x2; ...; xN] (state vector)

% u: plant input; y: plant output

% Parameters:

% N: Number of continuous states

% fx, gx, hx: f(x), g(x), h(x) respectively

% fxa, gxa, hxa: known functions for replacement of f(x), g(x), h(x) respectively

RefModel_siso = struct( 'Name','SISO Reference Model','Formula', '');

% Simulation Settings --------------------------------------------------

T_min=0; T_max=50; T_step=0.01;

T=T_min:T_step:T_max; % Simulation time interval, fix step

T_Ref=[T_min:T_step/5:T_max]; % Reference signal's sampling time interval

flag='';

options = odeset('RelTol',1e-3,'AbsTol',1e-4);

% Plant Model Definition -----------------------------------------------

nlPlant=nlStateFeedback_siso; % Defines Plant Model

nlPlant.N=4; % Number of states (x)

nlPlant.fx='(a*(x(:,2).^2-c).*sin(x(:,1))-a*(cos(x(:,1))+b+c).*x(:,3))';

nlPlant.gx='b*d';

nlPlant.hx='x(:,1)';

- 146 -

nlPlant.K=poly([-0.5 -0.8 -1]);

nlPlant.eta=200;

nlPlant.ETA(1)=nlPlant.eta*nlPlant.K(1);

for i=2:nlPlant.N

nlPlant.ETA(i)=nlPlant.K(i-1)+nlPlant.eta*nlPlant.K(i);

end

nlPlant.kappa=0; % static feedback control law applies

I=0.04; J=0.04; k=0.8; L=0.1; M=6; g=9.8;

a=M*g*L/I; b=k/I; c=k/J; d=1/J;

% Reference Signal Definition -------------------------------------------------------

RefSignal='FORMULA'; % Defines Reference Signal Type

fig=0;

RefModel=RefModel_siso;

RefModel.Formula='pi*sin(0.5*t).*cos(0.1*t)/3'; % Reference signal

Ref=fRefGen(RefModel.Formula, T_Ref'); % Ref=[t Ref(t)]

s=sprintf('r(t)=%s',RefModel.Formula);

dr = fDeriv(Ref(:,1:2), nlPlant.N+1); % Reference data & its derrivatives

r = [Ref(1:size(dr,1),1:2) dr(:,2:nlPlant.N+1)];

% R = [t r(t) dr(t)/dt..d^(N)r(t)/dt^N]

rt=fxt(r,0,'approx'); % rt=[t r dr/dt ...]

X0=[0 0 0 0];

% Trains approximator ---------------------------------------------------------------

nlPlant.u='5.15*sin(0.25*t)-0.95*sin(t)'; % u for testing (maybe varies)

nlPlant.fxa='(-a2*c2.*sin(x(:,1))-a2*(b2+c2).*x(:,3))';

nlPlant.gxa='b2*d2';

nlPlant.hxa=nlPlant.hx;

nlPlant.X='[x uxa]';

a2=a; b2=b*0.9; c2=1.1*c; d2=1.3*d;

T1=T;

nlPlant = fStateFeedback2(T1, X0, options, 'train', nlPlant, r);

nlPlant.W

save data;

% Tests the trained controller -------------------------------------------------------

%function RobotSim2()

clear all;

load data;

T2=T;

- 147 -

nlPlant.kappa=1;

nlPlant.rho=1; % 0<rho<=1

nlPlant = fStateFeedback2(T2, X0, options, 'approx', nlPlant, r);

Error=[nlPlant.W; nlPlant.Df; nlPlant.Dg]

pause

nlPlant.kappa=1;

nlPlant.rho=0.8; % 0<rho<=1

nlPlant = fStateFeedback2(T2, X0, options, 'approx', nlPlant, r);

Error=[nlPlant.W; nlPlant.Df; nlPlant.Dg]

% ----- Backstepping ----------------------------------------------------------------

function [y]= fStateFeedback2(T, X0, options, flag, Plant, r)

% flag={'exact','approx','learn'}

global T_min T_step T_max fig a b c d a2 b2 c2 d2

stime='\fontsize{12}\itt\rm [s]';

sk=sprintf('\\fontsize{15}\\it\\kappa\\rm\\fontsize{12} = %.0f',Plant.kappa);

if Plant.kappa~=0

sk=sprintf('%s, \\fontsize{15}\\it\\rho\\rm\\fontsize{12} = %.1f',sk,Plant.rho);

end

N=Plant.N; s='';

t=[]; x=[]; y=[]; z=[];

[t,x] = ode45(@fdx_statefb2, T, X0(1:N), options, {flag, 'deriv'}, Plant, r); % x=[x1..xN]

for i=1:length(t)

y(i,:) = feval(@fdx_statefb2, t(i), x(i,:), {flag, 'output'}, Plant, r); % y=[h(x) ufb E e1..eN]

if strcmp(flag,'train')

z(i,:) = feval(@fdx_statefb2, t(i), x(i,:), {flag, 'trndata'}, Plant, r);

end

end

Plant.tempData=[t y(:,1) y(:,2) x]; % Saves data for later testing [t h(x) ufb x]

ufb=y(:,2);

fig=fig+1; figure(fig); clf;

plot(t,y(:,3),'-r', t,y(:,4),'-b') % Plots E, e1

if N>1

hold on;

plot(t,y(:,5),'-g') % Plots e2

hold off;

end

%s=sprintf('\\fontsize{12}Error system - \\bf%s\\rm mode', flag);

title(sk); xlabel(stime); ylabel('\fontsize{12}\itE');

- 148 -


plot(t(:,1),x(:,1),'-r', t(:,1),x(:,2),'-b', t(:,1),x(:,3),'-g', t(:,1),x(:,4),'-m') % Plots r(t), y(t)

title(sk); xlabel(stime); ylabel('\fontsize{12}\bfx');


plot(r(:,1),r(:,2),'-r', t,y(:,1),'-b') % Plots r(t), y(t)

rt=fxt(r,t,'approx'); % rt=[t r dr/dt ...]

title(sk); xlabel(stime); ylabel('\fontsize{12}\itr\rm, \ity');

ylim([-1.2 1.2]);

s1='\fontsize{11}\leftarrowReference signal';

text(r(3.9/T_step*5,1),r(3.9/T_step*5,2),s1,'Color','r');

s2='\fontsize{11}\leftarrowPlant''s output'; text(t(1.8/T_step),y(1.8/T_step,1),s2,'Color','b');

fig=fig+1; figure(fig); clf; plot(t,y(:,2),'-r') % Plots ufb

%s=sprintf('\\fontsize{12}Control signal - \\bf%s\\rm mode', flag);

title(sk); xlabel(stime); ylabel('\fontsize{12}\itu');

switch flag

case 'train' % Sets and trains approximators

Plant.Fdxn=[]; trData=[]; X=[]; Y=[]; Z=[];

MF_No=2; MF_Type='gbellmf'; Epoch_No=10;

uxa=y(:,2); X=eval(Plant.X);

Z=z(:,2); % Z=dxN/dt

trData=[X Z];

crAnfis=genfis1(trData, MF_No, MF_Type)

% Generates an FIS structure from data used as initial conditions for anfis training

Plant.Fdxn = anfis(trData, crAnfis, Epoch_No)

% Training routine for Sugeno-type FIS

Y=evalfis(X, Plant.Fdxn);

Plant.W=[norm(Z-Y) abs(max(Z-Y))]; % abs(max(Z-Y));


plot(t,Z,'-r',t,Y,'-b') % Plots u(t)=uN

s1='\fontsize{15}\Delta\fontsize{11}_{dxn}';

s=sprintf('\\fontsize{11}Trained ANFIS Approximator - %s',s1);

title(s); xlabel(stime); ylabel(s1);

case 'approx'

uxa=y(:,2); X=eval(Plant.X);

fx=eval(Plant.fx); fxa=eval(Plant.fxa);

Plant.Df=[norm(fxa-fx) abs(max(fxa-fx))];

gx=eval(Plant.gx); gxa=eval(Plant.gxa);

Plant.Dg=[norm(gxa-gx) abs(max(gxa-gx))];

- 149 -

Delta_f=fxa-fx; Delta_g=gxa-gx;


plot(t,Delta_f,'-r',t,Delta_g,'-b') % Plots u(t)=uN

s1='\fontsize{13}\Delta\fontsize{12}\it_{f}\rm(\bfx\rm)';

s2='\fontsize{13}\Delta\fontsize{12}\it_{g}\rm(\bfx\rm)';

title(sk); xlabel(stime); ylabel(sprintf('%s, %s',s1,s2));

s=sprintf('\\leftarrow%s',s1); text(t(6/T_step),Delta_f(6/T_step),s,'Color','r');

s=sprintf('\\downarrow%s',s2); text(15,Delta_g+10,s,'Color','b');

end

y=Plant;

% ----- Nonlinear Plant Model ---------------------------------------------------------

function [y] = fdx_statefb2(t, x, flag, Plant, rData)

% rData=[t r dr/dt .. (d^N)r/dt^N]: Reference database

% flag meanings:

% 'exact' & 'deriv': exact model states derivative

% 'exact' & '

% ALL VECTORS MUST BE ROW VECTORS !!!

% MATRIX ROW : indicates one record of variable(s)

% MATRIX COLUMN: indicates one variable in time steps

global a b c d a2 b2 c2 d2

N=Plant.N; ETA=Plant.ETA(:)'; K=Plant.K(1:N); K=K(:);

u=[]; y=[]; t=t(:);x=x(:)';

rt=fxt(rData,t,'approx');

e=x-rt(:,2:N+1); E=e*K;

fx=eval(Plant.fx); gx=eval(Plant.gx); hx=eval(Plant.hx);

fxa=eval(Plant.fxa); gxa=eval(Plant.gxa); hxa=eval(Plant.hxa);

[t E]

switch flag{1} % Control mode

case 'exact'

ufb = (rt(:,N+2)-e*ETA'-fx)./gx; % Feedback control law

case 'approx'

uxa = (rt(:,N+2)-e*ETA'-fxa)./gxa; % Approx. control law

X=eval(Plant.X); Phi=(evalfis(X, Plant.Fdxn));

Edxn=E*Phi;

if (0)

ufb = uxa-abs(Phi)*bsig(Plant.kappa,E,0)./gxa; % Feedback control law

else

ufb = uxa-Phi*bsig(Plant.kappa,Edxn,0)/Plant.rho./gxa; % Feedback control law

end

case 'test' % Testing model with tempData

- 150 -

ut=fxt(Plant.tempData,t,'approx'); ufb=ut(:,3);

case 'train' % Archiving data for approximator trainning

uxa = (rt(:,N+2)-e*ETA'-fxa)./gxa; % Approx. control law

ufb=uxa;

otherwise

error(['Unhandled Control Type = ', flag{1}]);

end

switch flag{2}

case 'deriv' % y=[dx1/dt..dxN/dt]

y=[x(:,2:N) fx+gx.*ufb]';

case 'output' % y=[h(x) ufb E e1..eN delta_dxn]

if strcmp(flag{1},'approx')

y=[hxa ufb E e (fxa-fx+(gxa-gx).*uxa)];

else

y=[hx ufb E e (fxa-fx+(gxa-gx).*ufb)];

end

case 'trndata' % y=[r delta_dxn]

y=[rt(:,2) (fxa-fx+(gxa-gx).*uxa)];

otherwise

error(['Unhandled Return Type = ', flag{2}]);

end

% ----- Reference r(t) signal Generator ------------------------------------------------

function [Ref] = fRefGen(RefSignal, tRef)

% Reference signal r(t) Generator

% Ref = [tRef yRef] ; max(size(Ref))=2

t=tRef;

Ref = [tRef eval(RefSignal)];

% ----- Derrivative calculation ----------------------------------------------------------

function [y] = fDeriv(xData, p)

% Calculates derrivatives up to p power of xData

% xData=[t x1 .. x(N-1)]: xdata matrix (M rows, N columns)

% y = [t dx1/dt..dx(N-1)/dt ... (d^p)x1/dt^p..(d^p)x(N-1)/dt^p];

% size(y)=[M-p 1+(N-1)*p]

[M N]=size(xData);

t=xData(:,1); dt=diff(t); x=[]; %x=xData(:,2:N);

for i=1:p

k=(i-1)*(N-1);

for j=1:N-1

x(1:M-i,k+j)=diff(xData(1:M,j+1),i) ./ (dt(1:M-i).^i);

end

end

y = [t(1:M-p) x(1:M-p,:)];

- 151 -

% ----- Function values calculation -----------------------------------------------------

function [y] = fxt(xData, t, flag)

% Calculation of x1(t)..xN(t) based on specification data stored in xData (t>=0)

% t: time (row or column vector) for calculation of xi(t)

% xData=[t x1(t) .. xN(t)]: xdata matrix

% y = [t x1~(t) .. xN~(t)]; max(size(Ref))=N+1

% flag: mode of calculation (now works with 'approx' only)

[M N] = size(xData); K=length(t); t=t(:);

for i=1:K

ti=t(i); j=1;

while (xData(j,1)<=ti & j<M) j=j+1; end

if (j==M) k=j; else k=j-1; end

xt=xData(k,:); dt=ti-xt(1,1);

if dt>0

switch flag % currently works with 'approx' only

case 'approx'

for j=2:N-1

xt(1,j)=xt(1,j)+xt(1,j+1)*dt;

end

otherwise

;

end

end

y(i,:)=[ti xt(2:N)];

end

% ----- bipolar sigmoidal function calculation -----------------------------------------

function f=bsig(kappa,E,A)

kappa=kappa(:); E=E(:); A=A(1);

f=2./(1+exp(-kappa.*(E-A))) - 1;

- 152 -

5.6. Bổ đề 6 trang 100

Trƣờng hợp 1

Do A là ma trận xác định dương nên theo [38] luôn tồn tại phép phân tích LU (LU

factorization) duy nhất A LU với:

21

1 2

1 0 0

1 0

1n n

l

l l

L

,

11 12 1

22 20

0 0

n

n

nn

u u u

u u

u

U

tương ứng là các ma trận tam giác dưới (lower triangular matrix) và ma trận tam giác

trên (upper triangular matrix); 0, 1..iiu i n .

Mặt khác có thể phân tích:

11 12 11 1 11

22 2 22

0 0 1 / /

0 0 0 1 /*

0 0 0 0 1

n

n

nn

u u u u u

u u u

u

U

nên nếu ký hiệu lại

12 11 1 11

2 22

1 / /

0 1 /

0 0 1

n

n

u u u u

u u

U

và 11 22diag , , , nnu u uD thì

A có thể phân tích thành A LDU với các ma trận tam giác L , U đều có các số

hạng trên đường chéo bằng 1 và D là ma trận chéo.

Biết A đối xứng nên từ TA A suy ra T T T T T A LDU U D L U DL . Do phép

phân tích trên là duy nhất nên TL U hay

T T A U DU LDL .

Ma trận chéo D có các giá trị trên đường chéo dương nên A có thể phân tích:

1 2 1 2

1 2 1 2

T T / /

T/ /

T

A U DU U D D U

D U D U

C C

với 1/211 22diag , , , nnu u uD và

1 2/ T 1/2C D U D L là ma trận tam giác trên.

- 153 -

Trƣờng hợp 2

Nếu A có các giá trị riêng phân biệt thì ngoài phương pháp phân tích chung như

trên còn có thể phân tích theo phương pháp đường chéo hóa ma trận A bằng phép

biến đổi 1P AP D với

1

2

0 0

0 0

0 0 n

D

, 0 : 1..i i n là các giá trị riêng

phân biệt và

11 12 1

21 22 2

1 2

n

n

n n nn

p p p

p p p

p p p

1 2 nP P P P

là tập hợp đầy đủ các

véctơ riêng độc lập tuyến tính của A . Mặt khác ta có:

1 T T T

1 T T 1

A PDP P DP A

D P P DP P QDQ

DQ QD 0

với 1

T 1 T TQ P P P P Q là ma trận đối xứng.

Đặt

11 12 1

21 22 2

1 2

n

n

n n nn

q q q

q q q

q q q

Q

với | , 1..ij jiq q i j n , dẫn đến:

1 11 1 12 1 1 1 11 2 12 1

2 21 2 22 2 2 1 21 2 22 2

1 2 1 1 2 2

1 2 12 1 1

2 1 21 2 2

1 1 2

0 ( ) ( )

( ) 0 ( )

( ) ( )

n n n

n n n

n n n n n nn n n n nn

n n

n n

n n n n

q q q q q q

q q q q q q

q q q q q q

q q

q q

q q

DQ QD

2 0

0

Do Q đối xứng nên biểu thức trên chỉ đúng khi 0ijq với i j , ngoài ra do:

- 154 -

11

22

1/ 0 0

0 1/ 0

0 0 1/ nn

q

q

q

T1

TT 2

1 2 n

Tn

T T T1 1 1 2 1 n

T T T2 1 2 2 2 n

T T Tn 1 n 2 n n

P

PP P P P P

P

P P P P P P

P P P P P P

P P P P P P

nên , 1..i niP cũng là các vectơ trực giao. Như vậy nếu chọn 1Ti iP P hay T

P P I

và chọn TU P thì do 0 : 1..i i n nên có thể biến đổi A như sau:

T

T T 1/2 1/2

1/2 1/2

T

A U DU U D D U

D U D U

C C

với 1/2 1/2 TC D U D P , 1/2

1 2diag , , , n D và U là ma trận unita.

- 155 -

5.7. Một số môđun phần mềm trong mô hình phần mềm ứng dụng

Môđun phần mềm cung cấp dữ liệu quá trình cho IPC-Server

Hình 14 cho biết hoạt động của môđun phần mềm cung cấp dữ liệu quá trình

(Process I/O Data Transmission) và cấu trúc vùng bộ nhớ đệm với 2 nhiệm vụ chính

là lưu dữ liệu quá trình vào bộ đệm (kích hoạt bởi ngắt thời gian theo chu kỳ lấy mẫu)

và cung cấp dữ liệu trong bộ đệm theo yêu cầu cho PC-Server (điều khiển bởi PC-

Server thông qua giao thức truyền thông). Ngoài ra môđun còn bảo đảm quản lý được

vùng bộ nhớ đệm, xử lý các trường hợp đầy tràn vùng nhớ.

Hình 14 : Cấu trúc bộ đệm và dữ liệu quá trình cung cấp cho PC-Server

Môđun phần mềm được xây dựng tổng quát cho phép mỗi lần thực hiện truy cập

vào buffer có thể viết hoặc đọc nhiều bản ghi (records) với mỗi bản ghi chứa ít nhất 1

giá trị quá trình (dạng số thực 4 byte).

Ánh xạ

I/O Process

Image

Current Plant Record will be written to the Buffer

at sampling times

Data available

for PC reading

Rec i

pRecRd Current Plant

Record

Bộ đệm (FIFO)

REAL n

REAL 1

REAL n

REAL 1

REAL n

REAL 1

REAL n

Rec 1

Header

Rec m

pRecWr

Unused

Note:

n: Number of related I/Os (all in real number format) of the plant(s) have to be stored at sampling times.

m: Max. number of records available in the Buffer for temporary storage of plant data.

pRecRd: Pointer to the record for next reading from the Buffer.

pRecWr: Pointer to the next record for next writting to the Buffer.

REAL n

REAL ...

REAL 1

- 156 -

Môđun phần mềm ANFIS trên PLC

Đây là môđun phần mềm cơ bản trong mô hình hệ thống NF dựa trên mô hình

mạng ANFIS. Môđun phần mềm cho phép tùy chọn các tham số/kiểu hàm trong các

lớp mạng với các tùy chọn như sau:

Lớp 1: (Tính toán các đầu ra hàm liên thuộc) Môđun phần mềm hỗ trợ 2 dạng

hàm liên thuộc đầu vào chính là hàm liên thuộc dạng hình chuông (Bell) và hàm

Gauss. Số lượng các trọng số có thể điều chỉnh trong quá trình học của mỗi hàm

này tương ứng là 3 và 2 (ký hiệu từ w0 đến w2) như đẳng thức sau:

1

2

02

12

0

1 1( ) , ( ) exp

21

Bell Gaussw

x wA x B x

wx w

w

Lớp 2: (Tính vế đầu của các luật) Có thể lựa chọn các dạng t-norm và t-conorm

khác nhau cho tính toán như sau (mặc định t-norm=MIN và t-conorm=MAX)

t-norm:

MIN: MIN(a,b) = min(a,b)

Lukasiewicz LAND: LAND(a,b) = max(a+b1,0)

Probabilistic PAND: PAND(a,b) = ab

t-conorm:

MAX: MAX(a,b) = max(a,b)

Lukasiewicz LOR: LOR(a,b) = min(a+b,1)

Probabilistic POR: POR(a,b) = a+bab

Lớp 3: (Chuẩn hóa đầu ra vế đầu của các luật) Phép chuẩn hóa đầu ra các luật

được tính như sau:

1

, 1, ,ii N

jj

i N

Lớp 4: (Tính đầu ra của các luật) Đầu ra của mỗi luật được tính là tích của mức

tác động đã được chuẩn hóa của mỗi luật (theo cơ chế luật của Sugeno) với đầu ra

vế đầu của mỗi luật. Các trọng số trong lớp này có thể điều chỉnh trong quá trình

học.

Lớp 5: (Tính đầu ra của ANFIS) Mỗi đầu ra của ANFIS được tính trong lớp này

và là tổng của toàn bộ đầu ra của các luật.

Môđun phần mềm ANFIS được thiết kế cho dòng PLC SIMATIC S7-400 hoặc

WinAC RTX hiện cho phép thực hiện 8 đầu vào với mỗi đầu vào mờ có thể có nhiều

nhất tới 7 hàm liên thuộc (dạng Bell hoặc Gauss). Số lượng đầu ra lớn nhất cho phép

của hệ thống ANFIS là 1 đầu ra tuy nhiên có thể mở rộng khi cần.

- 157 -

Hình 15 : Các khối môđun phần mềm trên giao diện STEP7 V5

vỀ mỘt phƢƠng pháp tỔng hỢp hỆ ĐiỀu khiỂn mỜ · pdf filehình...

Documents