luan an ly thuyet tap tho
TRANSCRIPT
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 1/100
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆ N KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
VIỆN CÔNG NGHỆ THÔNG TIN
NGUYỄN ĐỨ C THUẦN
PHỦ TẬP THÔVÀ ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG
TẬP LUẬT QUYẾT ĐỊNH
LUẬN ÁN TIẾN SĨ TOÁN HỌC
HÀ NỘI - 2010
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 2/100
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆ N KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
VIỆN CÔNG NGHỆ THÔNG TIN
NGUYỄN ĐỨ C THUẦN
PHỦ TẬP THÔ VÀĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG
TẬP LUẬT QUYẾT ĐỊNH
Chuyên ngành: BẢO ĐẢM TOÁN HỌC CHO MÁY TÍNHVÀ HỆ THỐNG TÍNH TOÁN
Mã số: 62.46.35.01
LUẬ N ÁN TIẾ N SĨ TOÁN HỌC
NGƯỜI HƯỚ NG DẪ N KHOA HỌC:
1. PGS.TSKH NGUYỄ N XUÂN HUY2. PGS.TS LÊ HẢI KHÔI
HÀ NỘI - 2010
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 3/100
LỜI CÁM Ơ N
Không thể nói hết bằng lờ i lòng biết ơ n sâu sắc của tác giả đến ngườ i thầy
hướ ng dẫn PGS.TSKH Nguyễn Xuân Huy, ngườ i đã hướ ng dẫn và động viên tác giả
vượ t qua những khó khăn trong học thuật để có đượ c k ết quả này. Từ thầy, tác giả đã
học đượ c nhiều điều quí giá trong nghiên cứu khoa học, trong giảng dạy và ứng xử đờ i
thườ ng. Tác giả cũng nhận đượ c sự trao đổi chuyên môn, định hướ ng ban đầu của
PGS.TS Lê Hải Khôi về nội dung luận án. Kính xin ghi nhận tất cả những đặc ân đó
của Quý Thầy.
Tác giả xin cám ơ n Viện Công nghệ Thông tin, Tr ườ ng Đại học Nha Trang đã
giúp đỡ và tạo điều kiện thuận lợ i cho tác giả trong suốt thờ i gian học tậ p và nghiên
cứu. Tác giả xin cám ơ n PGS.TS Vũ Đức Thi, PGS.TS Đoàn Văn Ban, TS. Nguyễn
Thanh Tùng, TS. Tr ần Thái Sơ n, TS. Đỗ Văn Thành đã có nhiều ý kiến đóng góp quý
báu để tác giả hoàn thiện luận án.
Tác giả xin chân thành cám ơ n sự giúp đỡ về mặt chuyên môn cũng như tình
cảm chân thành, những lờ i động viên quý báu của Quý Thầy Cô cùng các đồng nghiệ p
thuộc Khoa Công nghệ Thông Tin-Tr ườ ng Đại học Nha trang, Khoa Công nghệ Thông
tin-Tr ườ ng Đại học Khoa học Huế. Xin cám ơ n sự hỗ tr ợ tinh thần của những ngườ i bạn lớ p 12C1-Nguyễn Huệ- Huế, lớ p Toán K5-ĐH Tổng hợ p Huế. Đặc biệt, xin cám
ơ n anh Đào Văn Tuyết, là ngườ i anh, ngườ i bạn đồng hành trong thờ i gian nghiên cứu
sinh, đã có những chia sẻ về kinh nghiệm và chuyên môn quý báu.
Xin cám ơ n tất cả mọi ngườ i đã hỗ tr ợ cho tác giả hoàn thành luận án này!
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 4/100
Kính dâng lên Ba m ẹ ,
ng ườ i đ ã sinh thành và nuôi d ưỡ ng
để con có ngày hôm nay.
Thân t ặ ng v ợ , và hai con,
nh ữ ng ng ườ i đ ã chia s ẻ m ọ i khó kh ă n,
là ch ỗ d ự a v ữ ng ch ắ c v ề tinh th ầ n
và v ậ t ch ấ t trong su ố t c ả cu ộ c đờ i.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 5/100
LỜI CAM ĐOAN
Tác giả xin khẳng định tất cả các k ết quả đượ c trình bày trong luận án là
của riêng tác giả, không sao chép từ bất k ỳ một công trình nào khác. Nếu có điều
gì không trung thực, tác giả xin chịu hoàn toàn trách nhiệm.
Tác giả
Nguyễn Đức Thuần
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 6/100
i
Mục lục
Mục lục i
Danh mục các thuật ngữ iv
Bảng các ký hiệu vi
Danh sách bảng và hình vẽ viii
Mở đầu 1
Chươ ng 1 CÁC KHÁI NIỆM CƠ BẢN ............................................................. 7
1.1 Hệ thống thông tin và tậ p thô .................................................................................... 7
1.1.1 Hệ thống thông tin .................................................................................... 7
1.1.2 Quan hệ không phân biệt đượ c .................................................................. 7
1.1.3 Tậ p thô ..................................................................................................... 9
1.1.4 Các tính chất của xấ p xỉ ...........................................................................10
1.1.5 Độ chính xác của xấ p xỉ...........................................................................11
1.1.6 Bảng quyết định .......................................................................................111.1.7 Rút gọn và nhân .......................................................................................13
1.1.8 Ma tr ận phân biệt đượ c và hàm phân biệt đượ c ........................................13
1.1.9 Luật quyết định ........................................................................................14
1.1.10Phụ thuộc độ k .........................................................................................14
1.2 Phủ tậ p thô .............................................................................................................. 15
1.2.1 Phủ và không gian xấ p xỉ phủ ..................................................................15
1.2.2 Thuật toán tìm rút gọn của một phủ .........................................................16
1.2.3 Các phép xấ p xỉ dựa vào phủ tậ p thô ........................................................17
1.2.4 Phép xấ p xỉ phủ tậ p thô loại 1 ..................................................................17
1.2.5 Phép xấ p xỉ phủ tậ p thô loại 2 ..................................................................18
1.2.6 Phép xấ p xỉ phủ tậ p thô loại 3 ..................................................................18
1.3 Ánh xạ đóng ............................................................................................................ 19
1.4 Không gian topo ...................................................................................................... 19
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 7/100
ii
1.5 K ết luận Chươ ng 1 .................................................................................................. 20
Chươ ng 2 PHỦ TẬP THÔ ................................................................................21
2.1 Tính chất của xấ p xỉ phủ loại 1, 2, 3 ....................................................................... 22
2.1.1 Xấ p xỉ phủ tậ p thô loại 1 ..........................................................................22
2.1.2 Xấ p xỉ phủ tậ p thô loại 2 ..........................................................................23
2.1.3 Xấ p xỉ phủ tậ p thô loại 3 ..........................................................................25
2.2 Mối quan hệ giữa ba loại phủ tậ p thô...................................................................... 26
2.3 Một số tính chất về xấ p xỉ phủ loại 2 ...................................................................... 26
2.4 Tính chất ánh xạ đóng của ba phép xấ p xỉ trên dựa vào phủ.................................. 27
2.4.1 Tính chất ánh xạ đóng của ba phép xấ p xỉ phủ trên ứng vớ i phủ đơ n vị....28
2.4.2 Tính chất ánh xạ đóng của ba phép xấ p xỉ phủ trên ứng vớ i phủ tựa điểm 28
2.4.3 Tính chất ánh xạ đóng của ba phép xấ p xỉ phủ trên ứng vớ i nửa thu gọn ..29
2.5 Mối quan hệ giữa các phép xấ p xỉ phủ dựa vào không gian topo .......................... 30
2.5.1 Quan hệ hai ngôi và không gian topo .......................................................30
2.5.2 Mối quan hệ giữa các xấ p xỉ dựa vào không gian topo .............................31
2.6 Rút gọn tậ p thuộc tính dựa vào họ phủ tậ p thô ....................................................... 352.6.1 Một số khái niệm và k ết quả cơ sở ...........................................................37
2.6.2 Rút gọn tậ p thuộc tính các hệ thống quyết định nhất quán và không nhất
quán ................................................................................................................38
2.6.3 Một số k ết quả liên quan giữa họ phủ và phủ suy dẫn ..............................39
2.7 Thuật toán FC_Reduct rút gọn tậ p thuộc tính dựa vào họ phủ tậ p thô ................... 41
2.7.1 Thuật toán FC_Reduct rút gọn thuộc tính của họ quyết định phủ tậ p thô ..43
2.7.2 Đánh giá độ phức tạ p thuật toán FC_Reduct ............................................44
2.8 Ứ ng dụng thuật toán FC_Reduct cho bài toán xử lý thông tin dạy và học tại Đ.H
Nha Trang ...................................................................................................................... 48
2.8.1 Giớ i thiệu bài toán ...................................................................................48
2.8.2 Ứ ng dụng thuật toán FC_Reduct rút gọn tậ p thuộc tính ............................49
2.9 K ết luận chươ ng 2 ................................................................................................... 50
Chươ ng 3 ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG TẬP LUẬT QUYẾT ĐỊNH ......51
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 8/100
iiii
3.1 Hạn chế của các độ đo cổ điển trên các bảng quyết định ....................................... 51
3.2 Độ đo hiệu năng của tậ p luật quyết định của Yuhua Qian và cộng sự ................... 54
3.3 Đề xuất độ đo hiệu năng của tậ p luật quyết định .................................................... 55
3.4 Ứ ng dụng hệ độ đo cho bài toán xử lý thông tin dạy và học tại Đ.H Nha Trang 64
3.5 K ết luận chươ ng 3 ................................................................................................... 64
K ết luận....................................................................................................................6
Danh mục công trình đã công bố ........................................................................67
Tài liệu tham khảo ..............................................................................................6
Phụ lục 1 ...............................................................................................................7
Phụ lục 2 ...............................................................................................................8
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 9/100
iv
DANH MỤC THUẬT NGỮ
(phủ ) Đơ n vị Unary
(phủ ) N ử a thu g ọn Semi reduct
(phủ ) T ự a đ iể m Pointwise-covered
Ánh xạ đ óng Closure mapping
Bảng quyế t định Decsion table
Bao đ óng của một t ậ p A Closure of a sub
C-miề n khẳ ng định d ươ ng của D C-positive region of DC ơ sở , tiề n cơ sở Base, subbase
Độ chính xác của xấ p xỉ Accuracy of approximation
Độ đ o độ chắ c chắ n Certainty measure
Độ hỗ tr ợ Support measure
Độ nhấ t quán Consistency measure
H ệ quyế t định nhấ t quán Consistent decision system
H ệ quyế t định nhấ t quán ng ượ c Conversely consistent decision system
H ệ quyế t định phủ không nhấ t quán Inconsistent covering decision system
H ệ thố ng thông tin Information system
H ệ thố ng thông tin không đầ y đủ Incomplete information system
H ọ phủ t ậ p thô Family of covering rough
Khai thác d ữ liệu vă n bản Text mining
Không gian topo Topologi
Không gian xấ p xỉ phủ Covering approximation space
Láng giề ng phải Right neighborhood
Láng giề ng trái Left neighborhood
Luật quyế t định Decision rule
Luật quyế t định ng ượ c Inverse decision rule
Lý thuyế t t ậ p mờ Fuzzy set theory
Lý thuyế t t ậ p thô Rough
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 10/100
v
Ma tr ận phân biệt đượ c Discernibility matrix
Mô t ả t ố i thiể u Minimal description
Phân hoạch Partition
Phân tích khái niệm hình thứ c Formal concept analysis
Phần trong của t ậ p A Interior of a sub
Phép xấ p xỉ d ướ i/trên Lower/Upper approximation
Phép xấ p xỉ phủ d ướ i/trên Covering lower/upper approximation
Phủ Covering
Phủ suy d ẫ n Induced Cover
Phủ t ậ p thô Coverin
Quan hệ B-không phân biệt đượ c B-indiscernibility relation
Quan hệ dung sai Tolerance relation
Quan hệ hai ngôi Binary relation
Quan hệ phản xạ Reflexive relation
Quan hệ t ươ ng đươ ng Equivalence relation
Quan hệ t ươ ng t ự Similarity relationT ậ p đ óng Closed set
T ậ p mở Open set
T ậ p thươ ng Quotient set
T ậ p vũ tr ụ / t ậ p phổ d ụng Universe
Tính đồng biế n Monotone
Tính l ũ y đẳ ng Idempotency
Tính phản xạ (của ánh xạ đ óng) Extension
Tính toán hat Granular computing
Y phụ thuộc độ k vào X Y depends on X in degree k
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 11/100
vi
BẢNG KÝ HIỆU
Ký hiệu Ý nghĩ a trang p quan hệ bộ phận trên họ {U/B|BÍA} 9
RX R- xấ p xỉ dướ i của tậ p X 9
RX R-xấ p xỉ trên của tậ p X 9
k X Y ¾¾® tậ p thuộc tính Y phụ thuộc độ k vào tậ p thuộc
tính X 14
( )a T độ đo độ chắc chắn do Yuhua Qian đề xuất 54
( )b T độ đo độ nhất quán do Yuhua Qian đề xuất 55
( )g T độ đo độ hỗ tr ợ do Yuhua Qian đề xuất 55
( )ta T độ đo độ chắc chắn do luận án đề xuất 55
( )tb T độ đo độ nhất quán do luận án đề xuất 55
m(Z ij ) độ chắc chắn của luật quyết định Z ij 14
a B(X)
đại lượ ng đo sự chính xác của tậ p xấ p xỉ X đối
vớ i phân hoạch trên B ( R = IND( B)) 11
b P cơ sở của không gian topo (U , t ) đượ c xây dựng
từ tậ p quan hệ hai ngôi P 31
(U, R) không gian xấ p xỉ xác định bở i quan hệ hai ngôi R 30
(X,t ) không gian topo xác định bở i topo t và tậ p X 20
[u]B lớ p tươ ng đươ ng của u trong quan hệ IND( B) 8~
A bao đóng của tậ p A 20~X, X C phần bù của tậ p X 32
A0 , Int(A) phần trong của tậ p A 20
aC (U/D)độ đo độ chắc chắn ( Pawlak ) của bảng quyết
định T = (U ,C È D)52
BN B(X) B-miền biên của X 9
C C (D) độ đo độ nhất quán (Pawlak) của T = (U ,C È D) 54
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 12/100
vii
FL(X),SL(X),TL(X) xấ p xỉ phủ dướ i loại 1, 2, 3 ( K.hiệu chung CL(X)) 17
CORE(C) nhân của tậ p thuộc tính điều kiện C 13
des(X i )mô tả của lớ p tươ ng đươ ng X i (điều kiện đặc
tr ưng của lớ p X i)14
FH(X)( FH C (X)) xấ p xỉ phủ trên loại 1 ( sinh bở i phủ C ) của X 17
IND( B) quan hệ B-không phân biệt đượ c 8
l R(x) láng giềng trái của x 30
M( T ) ma tr ận phân biệt đượ c của T 13
Md(x) mô tả tối thiểu của x 15 NEG B(X) B-miền âm của X 9
P (U) tậ p tất cả các tậ p con của U 17
POS B(D) B-miền khẳng định dươ ng của D 10
POS B(X) B-vùng dươ ng của X 9
RED(C) tậ p tất cả rút gọn của C 13
reduct(C) rút gọn của tậ p thuộc tính C 16
r R(x) láng giềng phải của x 30
S = (U , A) hệ thống thông tin 7
s(Z ij ) độ hỗ tr ợ của luật quyết định Z ij 14
SH(X)(SH C (X)) xấ p xỉ phủ trên loại 2 ( sinh bở i phủ C ) của X 17
T = (U, C È D) bảng quyết định 12
TH(X)(TH C (X)) xấ p xỉ phủ trên loại 1 ( sinh bở i phủ C ) của X 17
u(a) giá tr ị của đối tượ ng u ứng vớ i thuộc tính a 13
U/IND(B), U/Btậ p thươ ng xác định bở i quan hệ tươ ng đươ ng
IND( B)8
Z ij:des(X i )® des(Y j ) luật quyết định xác định bở i X i , Y j 14
X + , X + Các phép xấ p xỉ dướ i, trên tậ p X định ngh ĩ a trên
không gian topo của W.Zhu31
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 13/100
viii
C + X, C + X Các phép xấ p xỉ dướ i, trên tậ p X định ngh ĩ a trên
không gian topo của Xu, Zhang31
, X X Các phép xấ p xỉ dướ i, trên tậ p X định ngh ĩ a trên
không gian topo của Yao31
,ò R X òò R X Các phép xấ p xỉ dướ i, trên tậ p X định ngh ĩ a trên
không gian topo của Yao (cảm sinh từ quan hệ R 31
X t , X t Các phép xấ p xỉ dướ i, trên tậ p X định ngh ĩ a trên
không gian topo của A.M. Kozae và cộng sự 31
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 14/100
ix
DANH SÁCH BẢNG & HÌNH
Bảng 1.1 Bảng d ữ liệu bệnh Cúm 8
Bảng 1.2 Bảng quyế t định 12
Bảng 1.3 Các phép xấ p xỉ d ự a vào phủ t ậ p thô
Bảng 2.1 Điề u kiện để các phép xấ p xỉ phủ trên bằ ng nhau 26
Bảng 2.2 Tính chấ t ánh xạ đ óng ứ ng vớ i ba phép xấ p xỉ phủ 28
Bảng 2.3 Tính chấ t ánh xạ đ óng của ba phép xấ p xỉ phủ trên
sinh bở i ba loại phủ
29
Bảng 2.4 Các phép xấ p xỉ phủ định nghĩ a trên không gian topo 31
Bảng 2.5 Bảng phân loại theo đ ánh giá của ba chuyên gia 36
Bảng 2.6 K ế t quả rút g ọn t ậ p thuộc tính của Cheng Degang &
thuật toán FC_Reduct
48
Bảng 3.1 Mô t ả các t ậ p d ữ liệu thự c nghiệm 61
Bảng 3.2 S ố liệu chỉ ra sự khác biệt của C C (D), b , tb đố i vớ i d ữ
liệu Tic-tac-toe
61
Bảng 3.3 S ố liệu chỉ ra sự khác biệt của C C (D), b , tb đố i vớ i d ữ
liệu Dermatology
62
Bảng 3.4 S ố liệu chỉ ra sự khác biệt của C C (D), b , tb đố i vớ i d ữ
liệu Nursery
62
Hình 1.1 Minh họa t ậ p thô
Hình 1.2 Thuật toán tìm một thu g ọn của một phủ 16 Hình 3.1 S ự biế n thiên của các độ đ o nhấ t quán tb , b , C C (D)
trên d ữ liệu Tic-tac-toe
62
Hình 3.2 S ự biế n thiên của các độ đ o nhấ t quán tb , b , C C (D)
trên d ữ liệu Dermatology
63
Hình 3.3 S ự biế n thiên của các độ đ o nhấ t quán tb , b , C C (D)
trên d ữ liệu Nursery
63
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 15/100
1
MỞ ĐẦU
Trong thờ i gian gần đây, để xử lý các hệ thống thông tin bao hàm yếu tố mơ
hồ, không đầy đủ và r ờ i r ạc, các nhà nghiên cứu đã đề xuất nhiều phươ ng pháp
khác vớ i phươ ng pháp logic cổ điển, ví dụ lý thuyết tậ p mờ ( Fuzzy set theory), lý
thuyết tậ p thô ( Rough set theory), tính toán hạt (Granular computing ) hay phân tích
khái niệm hình thức ( Formal concept analysis) … Trong các phươ ng pháp này,
phươ ng pháp tậ p thô đượ c nhiều nhóm khoa học trên thế giớ i quan tâm nghiên cứu
và phát triển. Điều này có thể lý giải là do lý thuyết tậ p thô đượ c xây dựng trên một
nền toán học vững chắc, cung cấ p những công cụ hữu ích để giải quyết các bài toán
phân lớ p dữ liệu, phát hiện luật …, đặc biệt là phục vụ cho việc nghiên cứu các hệ
thống thông minh, khai phá dữ liệu.
Ý tưở ng chính của lý thuyết tậ p thô lần đầu tiên đượ c nhà toán học Ba Lan
Z.Pawlak đề xuất. Bài báo kinh điển nổi tiếng của ông là Rough Sets, xuất bản vào
năm 1982 [26]. Tiế p theo sau đó, các nhà khoa học khắ p nơ i trên thế giớ i đóng góp
nhiều thành tựu quan tr ọng nhằm phát triển lý thuyết tậ p thô và ứng dụng. Một số
bài toán trong l ĩ nh vực như ngân hàng, tài chính, y học … đã đượ c giải quyết thành
công nhờ công cụ tậ p thô.
Kiến thức cơ sở của lý thuyết tậ p thô cổ điển là các phép toán xấ p xỉ trên,
xấ p xỉ dướ i dựa trên phân hoạch đượ c tạo bở i một quan hệ tươ ng đươ ng. Chính kiến
thức cơ sở này làm cho việc tiế p cận tậ p thô là đơ n giản, dễ hiểu. Tuy nhiên, cũng
chính điều này đã làm hạn chế ứng dụng của phươ ng pháp tậ p thô - do lớ p quan hệ
tươ ng đươ ng và phân hoạch là không lớ n (Lin, 1998; Zakowski, 1983).
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 16/100
2
Nhiều mở r ộng thú vị và ý ngh ĩ a dựa trên sự mở r ộng khái niệm quan hệ
tươ ng đươ ng và phân hoạch [6, 10, 12, 21] hay phối hợ p vớ i các phươ ng pháp khác.
Chúng ta có thể thấy sự tiế p cận mở r ộng này qua tổng k ết của T.Y.Lin
Không gian topo
Hệ thống láng giềng Phủ
Quan hệ hai ngôiTậ p thô
Nhát cắt - a
Các hướ ng tiế p cận mở r ộng t ậ p thô
Đố i vớ i mở r ộng t ậ p thô theo hướ ng thay đổ i quan hệ t ươ ng đươ ng :
Zakowski (1983) đề xuất sử dụng quan hệ phản xạ (quan hệ t ươ ng t ự ). Skowron,
Stepaniuk (1996), Kryszkiewicz (1998) đề xuất và có nhiều nghiên cứu về quan hệ
dung sai [21, 43], Stefanowski (1999) phát hiện những khác biệt của quan hệ tươ ng
tự và quan hệ dung sai. Wybraniec-Skardowska (1989), Yao và Lin (1995) [44, 45]
xem xét các mô hình tậ p thô suy dẫn từ các quan hệ hai ngôi khác nhau. Không
giống như mô hình tậ p thô của Pawlak, sự khác biệt chủ yếu của những nghiên cứu
này xuất phát từ mối quan hệ trên tậ p phổ dụng, nhưng không xét ngữ cảnh của các
hệ thống thông tin.
Vớ i hướ ng mở r ộng thay đổi quan hệ tươ ng đươ ng bở i một quan hệ hai ngôi
khác, chúng ta cần lưu ý đến quan hệ dung sai ứng vớ i mô hình tậ p thô dung sai dotính ứng dụng r ộng rãi của nó. Điều lý thú là có nhiều k ết quả lý thuyết cũng như
ứng dụng trên mô hình này của các tác giả Việt Nam như: Hồ Tú Bảo, Nguyễn
Ngọc Bình (2000, 2002) đề xuất các thuật toán phân cụm trong khai thác dữ liệu
văn bản (Text Mining ), Ngô Chi Lăng (2005) đề xuất một phươ ng pháp phân cụm
các phục vụ tìm kiếm Web, Nguyễn Hùng Sơ n (1997) vớ i các k ết quả lý thuyết toán
học liên quan…
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 17/100
3
Tiế p cận mở r ộng mô hình t ậ p thô bằ ng nớ i l ỏng phân hoạch bở i một phủ
khở i đầu do các tác giả W. Zakowski (1983), J.A. Pomykala (1987), Y.Y.Yao
(1991), W.Zhu và F.Y. Wang (2002), E.Tsang, D.Cheng, J. Lee, D. Yeung (2004)
đề xuất và phát triển. Phươ ng pháp này hứa hẹn nhiều tiềm năng cho khai thác các
hệ thống thông tin không đầy đủ [13, 15, 17, 25, 28].
Sự thay đổi phân hoạch bằng một phủ dẫn đến nhiều tính chất khác biệt của
các phép xấ p xỉ dướ i, xấ p xỉ trên. Vì thế, có r ất nhiều bài toán cần quan tâm khi
nghiên cứu tiế p cận mở r ộng này có thể liệt kê như sau:
- Tìm đ iề u kiện để hai phủ cùng sinh ra các phép xấ p xỉ
Do hai phân hoạch khác nhau sẽ dẫn đến hai xấ p xỉ trên, hai xấ p xỉ dướ i khác
nhau. Trong khi đó, hai phủ khác nhau có thể dẫn đến các xấ p xỉ trên, xấ p xỉ dướ i
như nhau.
- Rút g ọn yế u t ố d ư thừ a trong một phủ
Nếu loại bỏ một phần tử của một phân hoạch, phần còn lại của phân hoạch
không còn là một phân hoạch nữa. Điều đó có ngh ĩ a là không có vấn đề dư thừa
trong một phân hoạch. Tuy nhiên, đối vớ i một phủ khi loại bỏ một phân tử của phủ,
tậ p các phần tử còn lại có thể vẫn còn là một phủ. Hơ n thế, phủ mớ i và phủ cũ cùng
sinh ra các phép xấ p xỉ. Bài toán rút gọn yếu tố dư thừa trong một phủ cũng dẫn đến
bài toán quan tr ọng là rút gọn tậ p thuộc tính của một hệ thống thông tin. Chen
Degang và cộng sự [8] đã đề xuất một thuật toán tìm tất cả các rút gọn tậ p thuộc tính
dựa vào họ phủ. Công cụ chính của thuật toán là dựa vào ma tr ận không phân biệt. Tuy
nhiên, bài toán rút gọn tậ p thuộc tính là NP-khó, trong thực tế ngườ i ta chỉ cần tìm một
rút gọn nhằm thu gọn kích thướ c của hệ thống thông tin.
- Tìm đ iề u kiện của phủ để phép xấ p xỉ d ướ i và phép xấ p xỉ trên là đố i ng ẫ u
Các phép toán xấ p xỉ dướ i và xấ p xỉ trên trong mô hình lý thuyết tậ p thô của
Pawlak là đối ngẫu. Điều đó có ngh ĩ a là phép xấ p xỉ dướ i xác định duy nhất phép
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 18/100
4
xấ p xỉ trên và ngượ c lại. Trong mô hình lý thuyết tậ p thô dựa vào phủ, các phép xấ p
xỉ dướ i và xấ p xỉ trên không là đối ngẫu của nhau.
- Phát hiện mố i quan hệ của các phép xấ p xỉ trên, xấ p xỉ d ướ i cùng đượ c
định nghĩ a trên cùng một phủ
Nghiên cứu sự mở r ộng tậ p thô bằng hướ ng tiế p cận phủ để giải quyết các
bài toán đã nêu, nhiều tác giả có các phươ ng pháp tiế p cận dựa trên các công cụ
toán học khá thú vị: Y.Y.Yao tiế p cận bằng cách nghiên cứu cấu trúc đại số của các
phủ thông qua các quan hệ hai ngôi suy dẫn ra chúng [44], Zakowski nghiên cứu tậ p
tiên đề của các phép xấ p xỉ, W. Zhu, F.Y Wang [36, 38, 40], A.M. Kozae, AA. AboKhadra, T.Medhat [9], Keyun Qin, Yan Gao, and Zheng Pei và nhiều tác giả khác
[19, 20, 21, 22, 29, 31, 33, 34, 42] khảo sát phủ bằng phươ ng pháp topo…Tuy các
công cụ toán học để phục vụ nghiên cứu phủ khá phong phú, cũng như sự quan tâm
đông đảo của các nhà tin học, một số bài toán cơ bản của phủ t ậ p thô vẫ n còn mở
và thách thứ c [36, 38, 40].
Một lớ p đặc biệt các hệ thống thông tin có vai trò quan tr ọng trong nhiều ứngdụng là bảng quyết định. Việc nghiên cứu rút trích luật có từ các bảng quyết định
khi dữ liệu lớ n là bài toán khó. Đóng góp lớ n trong l ĩ nh vực này có thể k ể đến các
nhóm tác giả Skowron A., Rauser C. (1992) và Hu X., Han J. & Lin T.Y (2004).
Ngoài việc rút trích các tậ p luật, việc xây d ự ng các độ đ o để l ượ ng giá hiệu nă ng
các t ậ p luật cũng là bài toán quan tr ọng . Trong thờ i gian gần đây, các tác giả của
Trung quốc đặc biệt là nhóm tác giả Yuhua Qian, Jiye Liang, Deyeu Li, Haiyun
Zhang, Chuangyin Dang [46, 47, 48] đã có nhiều đóng góp cho bài toán này.
Vớ i mong muốn phát triển, mở r ộng lý thuyết tậ p thô và ứng dụng. Mục tiêu
của luận án là tiế p tục nghiên cứu về phủ tậ p thô và các độ đo đánh giá hiệu năng
tậ p luật quyết định. Đây là vấn đề nghiên cứu mang tính thờ i sự, đã và đang đượ c
các nhà khoa học quan tâm. Nội dung luận án tậ p trung vào các vấn đề sau:
Khảo sát, phân tích các loại phủ t ậ p thô. Phát hiện tính chấ t và mố i quan hệ
giữ a các loại phủ.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 19/100
5
Phát hiện các tính chấ t của ánh xạ đ óng ứ ng vớ i các phép xấ p xỉ trên, xấ p xỉ
d ướ i đượ c xây d ự ng trên các mô hình t ậ p thô d ự a vào phủ.
Đề xuấ t thuật toán rút g ọn t ậ p thuộc tính d ự a vào phủ.
Xây d ự ng độ đ o đ ánh giá hiệu nă ng t ậ p luật quyế t định rút trích đượ c t ừ các
bảng quyế t định.
Xây d ự ng ứ ng d ụng trên mô hình lý thuyế t t ậ p thô mở r ộng và cổ đ iể n.
Về cấu trúc, luận án gồm ba chươ ng, phần k ết luận, các công trình đã công bố,
tài liệu tham khảo và phần phụ lục.
- Chươ ng thứ nhất trình bày các khái niệm cơ sở liên quan đến tậ p thô, phủ và
ánh xạ đóng. Những khái niệm này đượ c trình bày cô đọng, là cơ sở toán học để trình
bày các k ết quả trong các chươ ng sau.
- Chươ ng thứ hai trình bày những k ết quả đạt đượ c liên quan đến phủ tậ p thô:
Điều kiện để hai phủ sinh ra cùng một phép xấ p xỉ phủ trên loại 2 (định lý 2.13,
hệ quả 2.1, mệnh đề 2.1). Mối liên hệ, tính chất của các phép xấ p xỉ dựa vào các loại phủ này và ánh xạ đóng (mệnh đề 2.2-2.4). Một số điều kiện để các phép xấ p xỉ phủ là
đồng nhất khi tiế p cận bằng không gian topo.
Thuật toán rút gọn tậ p thuộc tính dựa vào một họ phủ đượ c đề xuất: Thuật toán
FC_Reduct . Độ phức tạ p của thuật toán là O(|D||U |2) tươ ng đươ ng vớ i các thuật toán tìm
một rút gọn tậ p thuộc tính trong lý thuyết tậ p thô cổ điển.
Trong chươ ng, luận án còn giớ i thiệu một ứng dụng thực tế của thuật toánFC_Reduct cho bài toán xử lý thông tin dạy và học tại Đại học Nha Trang.
- Chươ ng thứ ba, độ đo mớ i đánh giá hiệu năng tậ p luật quyết định rút trích từ
một bảng quyết định đượ c trình bày. Độ đo độ nhất quán mớ i của luận án khắc phục
đượ c nhượ c điểm của các độ đo đã có. Ngoài ra, k ết quả việc thử nghiệm độ đo đượ c đề
xuất trên các tậ p dữ liệu của UCI đã minh chứng tính ưu việt của độ đo.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 20/100
6
Phần K ết luận tóm tắt những k ết quả đạt đượ c và những vấn đề cần nghiên cứu
tiế p theo.
Phần phụ lục trình bày phần mềm thử nghiệm ứng dụng các k ết quả đạt đượ c
cho bài toán hỗ tr ợ việc xử lý thông tin dạy và học tại Đại học Nha Trang.
Các kết quả chính của luận án Công bố
- Điều kiện để hai phủ cùng sinh ramột xấ p xỉ phủ loại 2.
- K ỷ yế u H ội nghị khoa học k ỷ niệm 25 nă mthành l ậ p Viện C ơ học và Tin học ứ ng d ụng Tp. HCM. Nxb Khoa học T ự nhiên và Công
nghệ.
- Điều kiện để các phép xấ p xỉ phủ làđồng nhất (tiế p cận không gian topo)
-International journal of Computer Theoryand Engineering (IJCTE). Vol 1(5) 601-604
- Thuật toán rút gọn tậ p thuộc tính dựavào họ phủ tậ p thô.
- T ạ p chí Khoa học và Công nghệ Đ.H Đà N ẵ ng. 4(33) 64-69- International journal of Computer Theoryand Engineering (IJCTE). Vol 2(2) 180-184
- Độ đo đánh giá hiệu năng tậ p luậtquyết định trong lý thuyết tậ p thô.
- International Journal of Computer Electrical Engineering (IJCEE). Vol 1(4)447- 451
- Ứ ng dụng các k ết quả xử lý thông tindạy và học tại ĐH Nha Trang
- Đề tài NCKH cấ p tr ườ ng TR2009-13-
15NCS
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 21/100
7
Chươ ng 1
CÁC KHÁI NIỆM CƠ BẢ N
1.1 Hệ thống thông tin và tập thô
1.1.1 Hệ thống thông tin
Một tậ p dữ liệu có thể biểu diễn dướ i dạng một bảng, trên đó mỗi hàng biểu diễn
thông tin ứng vớ i một đối tượ ng, mỗi cột biểu diễn một thuộc tính có thể đo đượ c của
mỗi đối tượ ng (do các chuyên gia hay ng ườ i sử d ụng cung cấ p). Bảng này đượ c gọi là
một hệ thống thông tin. Hình thức hơ n, hệ thống thông tin là một cặ p S = (U, A), U là
một tậ p hữu hạn khác r ỗng các đối tượ ng gọi là tậ p vũ tr ụ hay là tậ p phổ dụng, A là một
tậ p hữu hạn khác r ỗng các thuộc tính. Vớ i mỗi u U Î và aÎ A, ta ký hiệu u(a) là giá tr ị
của đối tượ ng u tại thuộc tính a. Nếu gọi I a là tậ p tất cả giá tr ị của thuộc tính a, thì u(a) Î
I a vớ i mọi uÎU . Bây giờ , nếu B = {b1 , b2 , ..,bk } Í A, ta ký hiệu bộ các giá tr ị u(bi) bở i
u( B). Như vậy, nếu u và v là hai đối tượ ng, thì ta sẽ viết u( B) = v( B) nếu u(bi) = v(bi), vớ i
mọi i =1, 2, .., k .
1.1.2 Quan hệ không phân biệt đượ c
Xét hệ thống thông tin S = (U , A), vớ i mỗi tậ p thuộc tính B Í A tạo ra
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 22/100
8
một quan hệ hai ngôi trên U , ký hiệu IND( B)
IND( B) = {( , ) | ( ) ( ), }u v U U u a v a a BÎ ́ = " Î
IND( B) đượ c gọi là quan hệ B_không phân biệt đượ c. Dễ kiểm chứng đây là một
quan hệ tươ ng đươ ng trên U . Vớ i mọi đối tượ ng uÎU , lớ p tươ ng đươ ng của u trong
quan hệ IND( B) đượ c kí hiệu bở i [u] B. Tậ p thươ ng xác định bở i quan hệ IND( B)
đượ c ký hiệu U/IND(B) hay U/B, tức là U/IND(B) = U/B = {[u] B | uÎU }
Ví dụ 1.1 Xét hệ thống thông tin cho ở bảng 1.1
U Đau đầu Đau cơ Nhiệt độ Cúm
x1 Không Có Cao Có
x2 Có Không Cao Có
x3 Có Có R ất cao Có
x4 Không Có Bình thườ ng Không
x5 Có Không Cao Không
x6 Không Có R ất cao Có
Bảng 1.1 Bảng d ữ liệu bệnh cúm
Trong đó: U = {x1, x2, x3, x4, x5, x6}.
A = {Đau đầu, Đau cơ , Nhiệt độ, Cúm}.
Trong bảng, các bệnh nhân x2 , x3 và x5 không phân biệt đượ c đối vớ i thuộc tính
Đau đầu, bệnh nhân x3 và x6 không phân biệt đượ c đối vớ i thuộc tính Đau cơ , Cúm và
bệnh nhân x2 , x5 không phân biệt đượ c đối vớ i thuộc tính Đau đầu, Đau cơ và Nhiệt độ.
Do đó:
IND({Đau đầu}) = {{ x1 , x4 , x6 },{ x2 , x3 , x5}}
IND({Đau cơ }) = {{ x1 , x3 , x4 , x6 }, { x2 , x5}},
IND({Nhiệt độ}) = {{ x1 , x2 , x5}, { x3 , x6 }, { x4}},
IND({Cúm}) = {{ x1 , x2 , x3 , x6 }, { x4 , x5}},
IND({Đau đầu, Đau cơ }) = {{ x1 , x4 , x6 }, { x2 , x5}, { x3}}.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 23/100
9
Xét hệ thống thông tin S = (U, A), một quan hệ bộ phận p xác định trên họ {U/B
| B Í A} đượ c định ngh ĩ a:
U/P p U/Q nếu và chỉ nếu / , / :i j i j P U P Q U Q P Q" Î $ Î Í . Khi đó ta nói Q là thô
hơ n P hay P là mịn hơ n Q.
1.1.3 Tập thô
Trong lý thuyết tậ p thô, để biểu diễn một tậ p hợ p bằng tri thức đượ c cho xác
định bở i một tậ p thuộc tính, ngườ i ta định ngh ĩ a hai phép xấ p xỉ:
Cho một hệ thống thông tin S = (U , A), vớ i mỗi tậ p con X Í U và B Í A, ký hiệu
R = IND( B), ta có 2 tậ p con sau
[ ]
[ ]
( ) { | }
( ) { | }
B
B
R X u U u X
R X u U u X
= Î Í
= Î Ç ¹ Æ
( ), ( ) R X R X lần lượ t gọi là R-xấ p xỉ dướ i và R- xấ p xỉ trên của tậ p X.
Tậ p ( ) R X bao gồm tất cả các phần tử của U chắc chắn thuộc vào X .Tậ p ( ) R X bao gồm các phần tử của U có khả năng đượ c phân loại vào
những phần tử thuộc X ứng vớ i quan hệ R.
Từ hai tậ p xấ p xỉ ngườ i ta định ngh ĩ a các tậ p:
BN B( X ) = ( ) ( ) R X R X - : B- miề n biên của X .
POS B( X ) = ( ) R X : B-vùng d ươ ng của X.
NEG B( X ) = ( )U R X - : B-vùng âm của X.Ký hiệu tậ p thươ ng của IND( B) trên U là U/B, các xấ p xỉ trên và dướ i của X
có thể viết lại:
( ) R X = È{W Î U/B | W Í X }
( ) R X = È{ W Î U/B | W Ç X ≠ Æ }
Trong tr ườ ng hợ p BN B( X ) ¹ Æ, X đượ c gọi là tập thô, ngượ c lại X đượ c gọi
là tập rõ.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 24/100
10
X
( ) R X
( ) R X
BNB( X )
NEGB( X )
Hình 1.1 Minh họa t ậ p thô
Đối vớ i một hệ thống thông tin S = (U , A), B, D Í A, ký hiệu R = IND( B), ngườ i
ta gọi B-miền khẳng định dươ ng của D là tậ p đượ c xác định như sau
/
( ) ( ( )) B
V U D
POS D R V Î
= U
Rõ ràng ( ) B POS D là tậ p tất cả các đối tượ ng u sao cho vớ i mọi v U Î mà
( ) ( )u B v B= ta đều có ( ) ( )u D v D= . Nói cách khác, [ ] [ ]( ) { | } B B D POS D u U u u= Î Í .
1.1.4 Các tính chất của xấp xỉ Định lý 1.1. [34] Cho một hệ thống thông tin S = (U , A), " X, Y Í U và B Í
A, đặt R = IND( B). Khi đó:
(1L) ( ) R U U =
(1H) ( ) R U U =
(2L) ( ) R Æ = Æ
(2H) ( ) R Æ = Æ
(3L) ( ) R X X Í
(3H) ( ) R X X Ê
(4L) ( ) ( ) ( ) R X Y R X R Y Ç = Ç
(4H) ( ) ( ) ( ) R X Y R X R Y È = È
(5L) ( ) ( ) RR X R X =
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 25/100
11
(5H) ( ) ( ) RR X R X =
(6) ( ) R U X U RX - = -
( ) R U X U RX - = -
(7L) ( ) ( ) X Y R X R Y Í Þ Í
(7H) ( ) ( ) X Y R X R Y Í Þ Í
(8L) ( ( )) ( ) R U R X U R X - = -
(8H) ( ( )) ( ) R U R X U R X - = -
(9L) / , ( ) K U R R K K " Î = (9H) / , ( ) K U R R K K " Î =
Tính chất (3L), (4L) và (8L) là những tính chất đặc tr ưng cho phép xấ p xỉ dướ i,
điều đó có ngh ĩ a là những tính chất khác của phép xấ p xỉ dướ i có thể suy dẫn từ ba tính
chất này. Tươ ng tự, (3H), (4H) và (8H) là những tính chất đặc tr ưng của phép xấ p xỉ
trên.
1.1.5 Độ chính xác của xấp xỉ
Cho một hệ thống thông tin S = (U , A), vớ i mỗi tậ p con X Í U và B Í A, đặt
R = IND( B), đại lượ ng đo sự chính xác của tậ p xấ p xỉ X đối vớ i phân hoạch trên B
là giá tr ị
( )( ( ))( )
( ( )) ( ) R
R X Card R X X
Card R X R X a = =
Trong đó card( X ) = | X | là lực lượ ng ( số phần t ử ) của tậ p X . Rõ ràng
0 ( ) 1 R X a£ £ . Nếu ( ) 1 R
X a = , ta nói X là chính xác đối vớ i R, còn ( ) 1 R X a < , X
đượ c gọi là thô đối vớ i R.
1.1.6 Bảng quyết định
Bảng quyết định là một hệ thống thông tin có dạngT = (U , A), trong đó tậ p
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 26/100
12
thuộc tính A đượ c chia thành hai tậ p thuộc tính r ờ i nhau C và D, C đượ c gọi là tậ p
thuộc tính điều kiện, còn D là tậ p thuộc tính quyết định. Tức là T = (U , C È D), vớ i
C Ç D = Æ. Trong tr ườ ng hợ p không sợ bị nhầm lẫn ngườ i ta còn ký hiệu T = (U ,C , D).
Ví dụ 1.2 Hệ thống thông tin S = (U , A) biểu diễn cơ sở tri thức về bệnh cúm
đượ c thể hiện trong bảng 1.1 là một bảng quyết địnhT = (U , C È D)
Trong đó: U = { x1 , x2 , x3 , x4 , x5 , x6 }.
A = {Đau đầu, Đau cơ , Nhiệt độ, Cúm}.
Tậ p thuộc tính điều kiện C = {Đau đầu, Đau cơ , Nhiệt độ}Tậ p thuộc tính quyết định D ={Cúm}
U Đau đầu Đau cơ Nhiệt độ Cúm x1 Không Có Cao Có
x2 Có Không Cao Có
x3 Có Có R ất cao Có
x4 Không Có Bình thườ ng Không x5 Có Không Cao Không
x6 Không Có R ất cao Có
Bảng 1.2 Bảng quyế t định
Cho một bảng quyết định T = (U , C È D), giả sử U/C = { X 1 , X 2 ,.., X m} và U/D =
{Y 1 , Y 2 ,.., Y n}. Một lớ p X iÎU/C đượ c gọi là nhất quán nếu u(d ) = v(d ), "u,vÎ X i, "d Î D,
lúc này cũng có thể viết u( D) = v( D) = X i(D); một lớ p Y jÎU/D đượ c gọi là nhất quán
ngượ c nếu u(a) = v(a), "u,vÎY j, "aÎC .
Một bảng quyết định T = (U , C È D) là nhất quán nếu mọi lớ p X iÎU/C là nhất
quán, ngượ c lại T đượ c gọi là không nhất quán. Dễ thấy nếu U/C p U/D thì T = (U ,
C È D) là nhất quán.
Tươ ng tự, nếu U/Dp
U/C , thì T là nhất quán ngượ c.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 27/100
13
Có thể thấy bảng quyết định là nhất quán khi và chỉ khi POS C ( D) = U .
Trong tr ườ ng hợ p bảng không nhất quán thì POS C ( D) chính là tậ p con cực đại
của U sao cho phụ thuộc hàm C ® D đúng.
1.1.7 Rút gọn và nhân
Xét một bảng quyết định T = (U , C È D).
Tậ p thuộc tính R Í C đượ c gọi là một rút g ọn của C nếu POS R(D)=POS C (D).
Nhân của tậ p thuộc tính điều kiện C ký hiệu CORE (C ) đượ c định ngh ĩ a
CORE(C ) = ÇRED(C )
Ở đây, RED(C ) là tậ p hợ p tất cả rút gọn của C .
Ngoài ra, ngườ i ta cũng định ngh ĩ a rút gọn C-miền khẳng định dươ ng của D:
Nếu B Í C thỏa
{ }
1. ( ) ( )
2. , ( ) ( ) B C
C C a
POS D POS D
a B POS D POS D-
=
" Î ¹
B đượ c gọi là rút gọn C-miền khẳng định dươ ng của D.
1.1.8 Ma trận phân biệt đượ c và hàm phân biệt đượ c
Xét bảng quyết định T = (U , C È D), vớ i U = {u1 , u2 , .., un}. Ma tr ận phân biệt
đượ c của T ký hiệu M(T) = ij( )n nm ´ là một ma tr ận đối xứng, trong đó mỗi phần tử của
nó là một tậ p thuộc tính đượ c xác định như sau [26, 30, 32, 34]
ij
{ | ( ) ( )} , ( ) ( ), ( ) ( )
i j i j
i j
c C u c u c u D u Dm
u D u D
Î ¹ ¹ìï= íÆ =ïî
Hàm phân biệt đượ c f Τ là một hàm boole, đượ c xác định từ ma tr ận phân
biệt M(T) [1, 26, 32] như sau
ij( ) )(ii j
f u mT¹
= ÚÙ , vớ i mỗi iu U Î
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 28/100
14
trong đó, mỗi thuộc tính đượ c đặt tươ ng ứng một biến logic cùng tên và
(1) Ú mij là biểu thức tuyển của tất cả các biến c Î mij, nếu mij ¹Æ,
(2) Ú mij = true, nếu mij = Æ và ui( D) = u j( D),
(3) Ú mij = false, nếu mij = Æ và ui( D) ¹ u j( D).
1.1.9 Luật quyết định
Cho T = (U , C È D) là một bảng quyết định, giả sử U/C = { X 1 , X 2 , .., X m} và U/D
= {Y 1 , Y 2 , .., Y n}. Nếu X iÇY j≠Æ, ký hiệu des( X i), des(Y j) lần lượ t là các mô tả của các lớ p
tươ ng đươ ng ứng vớ i X i, Y j. Một luật quyết định xác định bở i X i , Y j có dạng
: ( ) ( )ij i j Z des X des Y ®
Độ đo độ chắc chắn và độ hỗ tr ợ của luật quyết định Z ij đượ c định ngh ĩ a như
sau [48]
( ) /ij i j i Z X Y X m = Ç và ( ) /ij i j
Z X Y U = Ç
Ở đây |.| là bản số hay lực lượ ng của một tậ p hợ p. Rõ ràng giá tr ị của
( ), ( )ij ij Z s Z m của luật quyết định Z ij r ơ i vào đoạn
1
,1U
é ù
ê úë û . Để thuận tiện trong trình
bày ký hiệu | Z ij| đượ c sử dụng thay cho i j X Y Ç .
1.1.10 Phụ thuộc độ k
Cho hệ thống thông tin S = (U , A), X, Y Í A. Chúng ta nói r ằng tậ p thuộc tính Y
phụ thuộc độ k Î[0,1] vào tậ p thuộc tính X, ký hiệu k X Y ¾® , vớ i k đượ c xác định như
sau [26, 32]
( )( ( ))( )
X X POS Y card POS Y
k card U U
= =
Khi 0 X Y ¾¾® , chúng ta sẽ viết X ® Y và 1 X Y ¾® đượ c viết X ®Y .
Dễ thấy r ằng phụ thuộc độ k là sự tổng quát hóa của phụ thuộc hàm và1 X Y ¾¾® là phụ thuộc hàm đã biết trong CSDL quan hệ.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 29/100
15
1.2 Phủ tập thô
1.2.1 Phủ và không gian xấp xỉ phủ
Các định nghĩ a và tính chấ t cơ sở về phủ của t ậ p thô đượ c trích t ừ các tài liệu
[37, 38, 39, 40]
Định ngh ĩ a 1.2.1 ( Phủ)
Cho U là một tậ p phổ dụng, C là họ các tậ p con khác r ỗng của U , khi ÈC = U , C
đượ c gọi là một phủ của U .
Dễ thấy, một phân hoạch của U là một phủ của U , vì vậy khái niệm phủ là mở
r ộng của khái niệm phân hoạch.
Định ngh ĩ a 1.2.2 ( Không gian xấ p xỉ phủ)
Cho U là một tậ p phổ dụng, C là 1 phủ của U . Cặ p thứ tự (U , C ) đượ c gọi là một
không gian xấ p xỉ phủ (CAS).
Định ngh ĩ a 1.2.3 (Mô t ả t ố i thiể u - Minimal description)
Cho một không gian xấ p xỉ phủ (U , C ), họ các tậ p hợ p đượ c xác định bở i xÎU :
Md ( x) = { K ÎC ç xÎ K Ù ("S ÎC Ù xÎS Ù S Í K Þ K = S )} đượ c gọi là mô tả tối
thiểu của x.
Định ngh ĩ a 1.2.4 ( N ử a thu g ọn - Semi Reduct )
Cho một không gian xấ p xỉ phủ (U , C ), C đượ c gọi là ( phủ) nửa thu gọn hay nửa
không dư thừa nếu nó thỏa điều kiện sau
" K 1, K 2Î C và K 1 Í K 2 Þ K 1 = K 2.
Định ngh ĩ a 1.2.5 ( Đơ n vị - Unary)
Cho một không gian xấ p xỉ phủ (U , C ) , C đượ c gọi là ( phủ) đơ n vị nếu " xÎU,
|Md( x)| = 1.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 30/100
16
Định ngh ĩ a 1.2.6 ( Phủ t ự a đ iể m-pointwise-covered )
Cho một không gian xấ p xỉ phủ (U , C ), C đượ c gọi là phủ tựa điểm nếu " K ÎC và xÎ K thì K Í ÈMd( x).
Định ngh ĩ a 1.2.7 ( Phần t ử loại đượ c của một phủ)
Cho một không gian xấ p xỉ phủ (U , C ) và K ÎC . Nếu K là hợ p của một số tậ p hợ p
nào đó của C - { K } , chúng ta nói r ằng K là một phần tử loại đượ c của C , ngượ c lại K
là phần tử không loại đượ c.
Định ngh ĩ a 1.2.8 ( Phủ rút g ọn đượ c)
Cho một không gian xấ p xỉ phủ (U , C ). Nếu mọi phần tử của C là phần tử không
loại đượ c thì C là phủ không rút gọn đượ c, ngượ c lại C là phủ rút gọn đượ c.
Định ngh ĩ a 1.2.9 ( Rút g ọn của một phủ)
Cho một không gian xấ p xỉ phủ (U , C ). Một phủ không rút gọn có đượ c từ việc
loại bỏ các phần tử rút gọn đượ c của C gọi là rút gọn của phủ C , ký hiệu reduct(C ).
Mệnh đề 1.2.1 Cho C là một phủ của U , K ÎC . K là phần tử loại đượ c trong C ,
và K 1ÎC – { K }, K 1 là một phần tử loại đượ c trong C khi và chỉ khi nó là phần tử loại
đượ c trong C – { K }.
1.2.2 Thuật toán tìm rút gọn của một phủ
Thuật toán tìm một rút gọn của một phủ cho tr ướ c do W. Zhu và F.Y Wang đề
xuất [40] . Ý tưở ng chính của thuật toán là vét cạn loại bỏ tất cả các phần tử là hợ p một
số các phần tử còn lại của phủ. Đáng lưu ý, việc loại bỏ này chưa chú ý đến ngữ ngh ĩ a
thông tin của hệ thống.
Thuật toán: set reductOfCovering (set C )
{set reduct(C ) = C ;for(i = 1; i £ n; i++) {
set temp = Æ;for ( j=1; j £ n; j++){ iff( K j Ì K i) {
temp = temp È K j; } }
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 31/100
17
iff (temp == K i) {reduct (C ) = reduct (C ) – { K i};}}
return reduct(C );}
Hình 1.2. Thuật toán tìm một thu g ọn của một phủ
1.2.3 Các phép xấp xỉ dự a vào phủ tập thô
Cho một không gian xấ p xỉ phủ (U, C ). Một tậ p X Í U , xấ p xỉ phủ dướ i, xấ p xỉ
phủ trên loại 1, 2, 3 của X đượ c định ngh ĩ a [36, 37, 38]
Tên phép xấp xỉ Biểu thứ c xác định Ký hiệu
Xấ p xỉ phủ dướ i loại 1, 2, 3
lần lượ t là X * = X = X# È { K Î C | K Í X }
FL( X ), SL( X ), TL( X )
Ký hiệu chung: CL( X )
Xấ p xỉ phủ trên loại 1: X * X * È (È {Md( x)| xÎ X-X *}) FH ( X )
Xấ p xỉ phủ trên loại 2 : X È { K ÎC | K Ç X ¹Æ } SH ( X )
Xấ p xỉ phủ trên loại 3 : X # È {Md( x) | xÎ X } TH ( X )
Bảng 1.3 Các phép xấ p xỉ d ự a vào phủ t ậ p thô
Trong phần trình bày tiế p theo, ký hiệu: P (U ) là tậ p hợ p chứa tất cả các tậ p
con của U : P (U ) = { X | X Í U }; Ø là phép phủ định mệnh đề; ~ X = U - X = X C .
1.2.4 Phép xấp xỉ phủ tập thô loại 1
Định ngh ĩ a 1.2.10 [36, 37, 38] (CL và FH) Cho C là một phủ của U , các phép
toán CL và FH : P (U ) ® P (U ) đượ c định ngh ĩ a: " X Í U,
CL( X ) = È{ K ÎC ç K Í X }
FH ( X ) = CL( X ) È (È{ K Î Md( x) ç xÎ X - CL( X ) })
Chúng ta gọi CL là phép xấ p xỉ phủ dướ i và FH là phép xấ p xỉ phủ trên loại 1
của X đượ c sinh bở i C .
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 32/100
18
Một số tính chất của xấ p xỉ dướ i, xấ p xỉ trên của Pawlak không còn đúng đối vớ i
phép xấ p xỉ phủ dướ i và phép xấ p xỉ phủ trên loại 1. Đặc biệt là tính đối ngẫu và đơ n
điệu của phép xấ p xỉ phủ trên [37], cụ thể là
(4L) CL( X ÇY ) ¹ CL( X )ÇCL(Y )
(4H) FH ( X ÈY ) ¹ FH( X )ÈFH(Y )
(6) CL( X ) ¹ ~(~ FH ( X ))
FH ( X ) ¹ ~(~ CL( X ))
(7H) Ø( X Í Y Þ FH ( X ) Í FH (Y ))
(8L) CL(~CL( X )) ¹ ~CL( X )
(8H) FH (~ FH ( X )) ¹ ~ FH ( X )
1.2.5 Phép xấp xỉ phủ tập thô loại 2
Định ngh ĩ a 1.2.11 (SH) [36, 37, 38] Cho C là một phủ của U . Phép xấ p xỉ phủ
trên loại 2 đượ c sinh bở i C ký hiệu SH đượ c định ngh ĩ a:
" X ÍU , SH ( X ) = È{ K ÎC , K Ç X ¹Æ}
Phép phủ xấ p xỉ trên loại 2 chưa chắc thỏa các tính chất (5H), (6), (8H), và (9H).
Có thể thấy qua phản ví dụ
Ví dụ 1.4 [36] Cho U = {a, b, c, d }, K 1 = {a,b}, K 2 = {a, b, c}, K 3 = {c,d }, và
C = { K 1 , K 2 , K 3}. C là một phủ của U .
(5H) Nếu X = {a, b}, chúng ta có SH ( X ) = {a, b, c}. Tuy nhiên, SH ({a, b, c}) =
{a, b, c, d }, vì vậy SH (SH ( X )) ¹ SH ( X ).
(6) Nếu X = {a ,b}, chúng ta có CL( X ) = {a, b}. Tuy nhiên, SH ((~ X )) = SH ({c, d}) =
{a, b, c, d }, vì vậy CL( X ) ¹ ~SH ((~ X )).
(8H) Cho X = {a}, SH ( X ) = {a, b} và SH ((~SH( X ))) ¹ ~SH ({c, d }) = {a, b, c,
d }, vì vậy SH ((~SH ( X ))) ¹ ~SH ( X ).
(9H) Lấy K = K 2 = {a, b, c}, chúng ta có SH ( K ) = U ¹ K.
1.2.6 Phép xấp xỉ phủ tập thô loại 3
Định ngh ĩ a 1.2.12 (TH) [38, 40] Cho C là một phủ của U . Phép xấ p xỉ phủ trên
loại 3 đượ c sinh bở i C ký hiệu TH định ngh ĩ a: TH ( X ) = È{Md( x) | xÎ X }.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 33/100
19
Phép xấ p xỉ phủ trên loại 3 chưa chắc thỏa các tính chất (5H), (6), (8H) và (9H),
Có thể thấy qua phản ví dụ
Phản ví dụ 1.1 [38] U = {a, b, c}, C = {{a,b}, {b,c}},
(5H) X = {a}, TH ( X ) = {a, b}, TH (TH ( X )) = {a, b, c}
(6) X = {a}, CL(~ X ) = {b, c}, TH ( X ) = {a, b}, ~TH ( X ) = {c}
(8H) X = {a}, ~TH ( X ) = {a, b}, TH (~TH ( X )) = U ,
(9H) K = {a, b}ÎC , TH ( K ) = U .
1.3 Ánh xạ đóng
Toán tử D: P (U ) ® P (U ) đượ c gọi là một ánh xạ đóng nếu D thỏa các tính chất
sau: " X,Y ÍU,
(Cl1) X Í D( X ) (tính phản xạ)
(Cl2) X Í Y Þ D( X ) Í D(Y ) (tính đồng biế n)
(Cl3) D(D( X )) = D( X ) (tính l ũ y đẳ ng )
Mặc dù tính chất đặc tr ưng của một ánh xạ đóng khá đơ n giản nhưng có nhiều
ứng dụng đượ c đề cậ p trong cơ sở dữ liệu dựa trên khái niệm ánh xạ đóng [5]. Hệ tiên
đề đặc tr ưng của phép xấ p xỉ dướ i trong lý thuyết tậ p thô cổ điển chỉ ra r ằng nó là một
ánh xạ đóng [40]. Vì vậy, tìm xem các phép xấ p xỉ phủ thỏa mãn tính chất nào của ánh
xạ đóng là một mục tiêu của luận án. K ết quả tìm đượ c sẽ là cơ sở cho việc k ế thừa
những k ết quả đã có của ánh xạ đóng, nhất là các luật sinh thể hiện mối quan hệ giữa
các thuộc tính. Các tính chất đặc tr ưng về ánh xạ đóng có thể tham khảo trong [5].
1.4 Không gian topo
Các khái niệm cơ bản trong phần này đượ c trích d ẫ n t ừ [6, 7, 18, 34].
Xét tậ p hợ p X , một họ t các tậ p con của X gọi là một topo trên X nếu thỏa các
điều kiện: 1. X và Æ thuộc t
2. Hợ p tùy ý các tậ p thuộc t là thuộc t
3. Giao của hữu hạn các tậ p thuộc t là thuộc t .
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 34/100
20
Một tậ p X cùng một topo trên X gọi là một không gian topo. Để chỉ rõ t là topo
trên X ta viết ( X , t ). Trên một không gian topo ( X , t ), ta có các khái niệm cơ bản sau:
T ậ p mở , t ậ p đ óng: Tậ p GÎt đượ c gọi là tậ p mở của X . Tậ p con F của X đượ c
gọi là tậ p đóng nếu X-F là tậ p mở .
Lân cận: Xét xÎ X , tậ p con V của X đượ c gọi là một lân cận của x nếu tồn tại
một tậ p mở G sao cho xÎG Ì V . Nếu lân cận V của x là một tậ p mở thì V đượ c gọi là
một lân cận mở của x.
Bao đ óng: Xét A Í X , ta gọi bao đóng của A ký hiệu°
là giao tất cả các tậ pđóng chứa A. ° A = Ç{ F Í X : A Í F và F là t ậ p đ óng }
Phần trong: Cho A Í X , ta gọi phần trong của A ký hiệu Int( A) hay A0 là hợ p
tất cả các tậ p mở đượ c chứa trong A. A0 = È{G Í U : G Í A và G là t ậ p mở }
Biên: biên của tậ p A trong topo t là tậ p hợ p ° 0b A A= - .
C ơ sở và tiề n cơ sở (Base, subbase):
Một họ con b của t đượ c gọi là một cơ sở của t nếu mọi tậ p thuộc t đều bằng
hợ p của một họ các tậ p thuộc b . Nói cách khác, họ con b của t là cơ sở của t nếu:
"GÎt , " xÎG , $ V Îb : xÎ V Ì G.
Một họ con s của t gọi là một tiền cơ sở của t nếu họ tất cả các giao hữu hạn
của các tậ p thuộc s là một cơ sở của t . Như vậy họ con s của t là tiền cơ sở của t nếu
"GÎt , " xÎG , $ W 1, W 2, .., W n Îs : xÎ W 1 Ç W 2 Ç .. Ç W n Ì G.1.5 K ết luận Chươ ng 1
Chươ ng này đã trình bày một số khái niệm cơ bản nhất trong lý thuyết tậ p thô
như hệ thống thông tin, bảng quyết định, quan hệ không phân biệt đượ c, luật quyết định,
phụ thuộc hàm xấ p xỉ … Các khái niệm liên quan đến phủ tậ p thô, ánh xạ đóng, không
gian topo trình bày khá cô đọng, là cơ sở toán học cần thiết để nắm bắt và trình bày các
k ết quả trong các chươ ng sau.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 35/100
21
Chươ ng 2
PHỦ TẬP THÔ
Chươ ng này tậ p trung nghiên cứu sự mở r ộng tậ p thô theo hướ ng thay đổi phân
hoạch bở i phủ. Phươ ng pháp tiế p cận là khảo sát tính chất toán học của các phép xấ p xỉ
ứng vớ i ba loại phủ do W. Zhu và F.Y Wang đề xuất [37, 38, 40] và các phép xấ p xỉ dựa vào phủ đượ c tiế p cận bằng công cụ toán học là không gian topo của một số tác giả
khác [6, 18, 39, 44] để chỉ ra mối quan hệ giữa các phép xấ p xỉ. Cuối chươ ng, luận án
đề xuất thuật toán rút gọn tậ p thuộc tính dựa vào họ phủ tậ p thô FC_Reduct và ứng dụng.
Trong các bài báo công bố k ết quả nghiên cứu của mình [37, 38], W. Zhu và F.Y
Wang đã đưa ra hệ tiên đề cho phép xấ p xỉ phủ dướ i và khẳng định tính mở của bài toán
tìm tính chất đặc tr ưng của các phép xấ p xỉ phủ trên (loại 1, 2, 3). K ế thừa, phát triển
những k ết quả này, luận án đóng góp một số điều kiện để hai phủ sinh cùng xác định
một phép xấ p xỉ phủ loại 2. Tính chất ánh xạ đóng của các phép xấ p xỉ phủ loại 1, 2, 3
cũng đượ c khảo sát nhằm có thể sử dụng các k ết quả ứng dụng của ánh xạ đóng vào các
tậ p cơ sở dữ liệu.
Khi mở r ộng tậ p thô dựa vào phủ, nhiều tác giả tiế p cận theo hướ ng không gian
topo. Trong chươ ng này, luận án trình bày điều kiện để một số phép xấ p xỉ dựa vào phủ
tiế p cận bằng không gian topo là đồng nhất.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 36/100
22
Vớ i mục đích rút gọn tậ p thuộc tính dựa vào họ phủ tậ p thô, luận án đề xuất thuật
toán FC_Reduct có độ phức tạ p là thờ i gian đa thức (O(|D||U |2)) theo kích thướ c của dữ
liệu. K ết quả của thuật toán này là sự khai thác các khái niệm do Cheng Degang và cộng
sự công bố [8]. Minh chứng cho tính thực tiễn, FC_Reduct đã đượ c cài đặt để xử lý
thông tin dạy và học tại Đại hoc Nha Trang cho k ết quả tốt.
Trong phần tiế p theo, để phân biệt các phép xấ p xỉ ứ ng vớ i các phủ khác
nhau, ký hiệu FH C , SH C , TH C l ần l ượ t là phép xấ p xỉ phủ trên loại 1, 2, 3 sinh bở i
phủ C ; FLC , SLC , TLC l ần l ượ t là phép xấ p xỉ phủ d ướ i loại 1, 2, 3 sinh bở i phủ C .
2.1 Tính chất của xấp xỉ phủ loại 1, 2, 3
2.1.1 Xấp xỉ phủ tập thô loại 1
A. S ự phụ thuộc xấ p xỉ d ướ i và xấ p xỉ trên loại 1
W. Zhu và F.Y. Wang [38] đã chỉ ra mối quan hệ giữa xấ p xỉ phủ dướ i và xấ p xỉ
phủ trên loại 1 thông qua các định lý
Định lý 2.1 [38] Cho C 1 và C 2 là hai phủ của U , C 1 và C 2 sinh ra cùng phép xấ p
xỉ phủ dướ i (loại 1, 2, 3) nếu và chỉ nếu reduct(C 1) = reduct(C 2).
Định lý 2.2 [38] Cho C 1 và C 2 là hai phủ của U , C 1 và C 2 sinh ra cùng phép xấ p
xỉ phủ trên loại 1 nếu và chỉ nếu reduct(C 1) = reduct(C 2).
Định lý 2.3 [38] Cho C 1, C 2 là hai phủ của U , C 1 và C 2 sinh ra cùng phép xấ p xỉ
phủ dướ i loại 1 khi và chỉ khi chúng cùng sinh ra xấ p xỉ phủ trên loại 1.
B. Tiên đề cho phép xấ p xỉ phủ d ướ i
Định lý 2.4 [37, 40] Cho U là một tậ p khác r ỗng. Nếu tồn tại 1 phép toán L:
P (U ) ® P (U ) thỏa các tính chất sau: " X, Y Í U,
(1L) L(U ) = U
(3L) L( X ) Í X
(5L) L(L( X )) = L( X )
(7L) X ÍY Þ L( X ) Í L(Y )
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 37/100
23
thì tồn tại một phủ C của U mà phép xấ p xỉ phủ dướ i CL đượ c sinh bở i C là L. Hơ n
thế, bốn tính chất trên của phép xấ p xỉ phủ dướ i là độc lậ p. ((1L)-(7L) là ký hiệu thứ
t ự các tính chấ t của phép xấ p xỉ phủ d ướ i đượ c viế t ở 1.1.4).
C. Tiên đề cho phép xấ p xỉ phủ trên loại 1
Các tính chất (1L) đến (9H) trong 1.1.4 là cơ bản và đầy đủ cho các phép xấ p xỉ
dướ i, phép xấ p xỉ trên trong tậ p thô cổ điển. Định lý 2.4 chỉ ra r ằng các tính chất (1L),
(2L), (3L), (7L) cũng là đầy đủ đối vớ i các phép toán xấ p xỉ phủ dướ i. Tuy nhiên, các
tính chất (1H), (2H), (3H) và (5H) chưa đủ để đặc tr ưng cho các phép xấ p xỉ trên loại 1.
Điều này có thể thấy đượ c qua ví dụ
Ví dụ 2.1 [38, 40] Một phép toán H : P (U ) ® P (U ) thỏa các tính chất (1H),
(2H), (3H) và (5H) nhưng không tồn tại một phủ C của U màH là một phép xấ p xỉ phủ
trên loại 1 sinh ra bở i C .
Cho U = {a, b, c}. Định ngh ĩ a H : P (U ) ® P (U ) như sau
H (Æ) = Æ, H ({a}) = {a},H ({b}) = {b}, vớ i mọi X Í U , X ≠ {a}, X ≠ {b},H ( X ) = U .
Hiển nhiên H thỏa các tính chất (1H), (2H), (3H) và (5H), nhưng không tồn tại
phủ C nào của U màH là phép xấ p xỉ phủ trên loại 1 sinh ra bở i C . Thật vậy, nếu có thì
phủ C phải có 2 phần tử {a} và {b}. Trong tr ườ ng hợ p này, FH ({a,b}) = {a,b} ¹ {a,b,c}
=H ({a,b}). Do đóH không là phép xấ p xỉ phủ trên loại 1 sinh ra bở i C .
Bài toán tìm hệ tiên đề cho xấp xỉ phủ trên loại 1 vẫn còn là bài toán mở .
2.1.2 Xấp xỉ phủ tập thô loại 2
Tươ ng tự như xấ p xỉ phủ tậ p thô loại 1, các tính chất quan tr ọng của xấ p xỉ phủ
tậ p thô loại 2 đượ c công bố trong [37, 38, 40]. Định ngh ĩ a xấ p xỉ phủ dướ i tậ p thô loại 2
có cùng định ngh ĩ a vớ i xấ p xỉ phủ dướ i tậ p thô loại 1, sự khác biệt là ở xấ p xỉ phủ trên.
A. M ố i quan hệ giữ a xấ p xỉ phủ d ướ i và xấ p xỉ phủ trên t ậ p thô loại 2
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 38/100
24
Khái niệm rút gọn phủ tỏ ra không hữu dụng trong mối quan hệ giữa xấ p xỉ phủ
dướ i và xấ p xỉ phủ trên loại 2.
Ví dụ 2.2 [40] C và reduct (C ) không sinh ra cùng các phép toán xấ p xỉ phủ trên
loại 2: Cho U = {a, b}, K 1 = {a}, K 2 = { b} , K 3 = {a, b}, C = { K 1 , K 2 , K 3}, reduct(C ) =
{ K 1 , K 2}. Ta có:
SH C (Æ) = Æ và SH C ( X ) = U , " X , Æ Ì X Í U mà SH reduct( C ) ( X ) = X , " X Í U .
Định lý 2.5 [40] Phép xấ p xỉ phủ dướ i và xấ p xỉ phủ trên loại 2 không xác định
duy nhất lẫn nhau.
Phản ví dụ 2.1 Hai phủ sinh ra cùng xấ p xỉ phủ d ướ i loại 2, như ng không sinh
ra cùng xấ p xỉ phủ trên loại 2: Xét U = {a, b, c}, K 1 = {a, b}, K 2 = {c}, K 3 = {a, b, c},
C 1={ K 1 , K 2} và C 2 = { K 1 , K 2 , K 3}, X = {a,b} thì
{ } { } { }1 2 1 2( ) ( ) , , , ( ) , ,SL X SL X a b SH a b SH X a b c= = = ¹ =
C C C C
Phản ví dụ 2.2 Hai phủ sinh ra cùng xấ p xỉ phủ trên loại 2, như ng không sinh
ra cùng xấ p xỉ phủ d ướ i loại 2: Xét U = {a, b, c}, K 1 ={a, b}, K 2 = {c}, K 3 = {a, b, c},
C 1 = { K 1 , K 2 , K 3} và C 2 = { K 3}, X = {a,b}, thì
1 2( ) ( ) { , , }SH X SH X a b c= =
C C ;1 2( ) { , } ( )SL X a b SL X = ¹ = Æ
C C .
B. Tiên đề cho các phép xấ p xỉ phủ trên loại 2
Tươ ng tự như xấ p xỉ phủ trên loại 1, các tính chất đặc tr ưng mà xấ p xỉ phủ trênloại 2 có đượ c là chưa đủ để tạo thành hệ tiên đề đặc tr ưng.
Ví dụ 2.6 [38, 40] Một phép toán H : P (U ) ® P (U ) thỏa các tính chất (1H),
(2H), (3H), (4H) và (7H) nhưng không tồn tại một phủ C của U màH là một phép xấ p
xỉ phủ trên loại 2 đượ c sinh bở i C .
Lấy U = {a, b}, định ngh ĩ a H : P (U ) ® P (U ) như sau
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 39/100
25
H (Æ) = Æ, H ({a}) = {a, b}, H ({a, b}) = {a, b} và H ({b}) = {b}. U có bốn
phủ: {{a, b}}; {{a}, {b}}; {{a}, {a, b}}; {{b}, {a, b}}, nhưng không có phủ nào nhận
H làm xấ p xỉ phủ trên loại 2.
Bài toán tìm hệ tiên đề cho xấp xỉ phủ trên loại 2 vẫn còn là bài toán mở .
2.1.3 Xấp xỉ phủ tập thô loại 3
A. S ự phụ thuộc xấ p xỉ phủ d ướ i và xấ p xỉ phủ trên loại 3
Định lý 2.6 [38, 40] Cho C là phủ của U thì C và reduct(C ) sinh ra cùng các
phép xấ p xỉ phủ dướ i và xấ p xỉ phủ trên loại 3.
Định lý 2.7 [38, 40] Cho C 1, C 2 là hai phủ của U , nếu reduct (C 1) = reduct(C 2),
thì C 1 và C 2 sinh ra cùng xấ p xỉ phủ trên loại 3.
Chú ý 2.1: Điều ngượ c lại định lý trên là không đúng, ta có phản ví dụ
Phản ví dụ 2.3 Cho U = {a, b, c}, K 1 = {a, b}, K 2 = {b, c}, K 3 = {a, c}, K 4={a, b,
c}, C 1 = { K 1 , K 2 , K 3} and C 2 = { K 4}. Nếu X = Æ thì xấ p xỉ phủ trên loại 3 sinh ra bở i hai
phủ C 1 và C 2 đều là X # = {a ,b, c}, nhưng reduct(C 1) = C 1 ¹ reduct(C 2) = C 2.
Định lý 2.8 [38, 40] Cho C 1, C 2 là các phủ của U , nếu C 1 và C 2 sinh ra cùng xấ p
xỉ phủ dướ i thì chúng cũng sinh ra cùng xấ p xỉ phủ trên loại 3.
B. Tiên đề cho các phép xấ p xỉ phủ trên loại 3
Cũng giống như phép phủ xấ p xỉ trên loại 1 và loại 2. Phép phủ xấ p xỉ trên loại 3chưa thể tiên đề hóa do nhiều tính chất đặc tr ưng của phép phủ xấ p xỉ trên không thỏa.
Phản ví dụ 2.4 [40] Một phép toán thỏa (1H), (2H), (3H), (4H), và (7H) nhưng
không là xấ p xỉ phủ trên loại 3. Cho U = {a, b, c}. Định ngh ĩ a H : P (U ) ® P (U ) như
sau: H (Æ) = Æ, H ({a}) = {a, b}, H ({b}) = {b, c}, H ({c}) = {c}, H ({a, b}) = U ,
H ({b, c}) = {b, c}, H ({a, c}) = U , H (U ) = U . Hiển nhiên H thỏa (1H), (2H), (3H),
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 40/100
26
(4H), và (7H), nhưng rõ ràng không có một phủ C nào của U mà sinh ra H là phép xấ p
xỉ phủ trên loại 3.
Bài toán tìm hệ tiên đề cho phép xấp xỉ trên phủ loại 3 vẫn còn là bài toán mở .
2.2 Mối quan hệ giữ a ba loại phủ tập thô
Từ định ngh ĩ a của ba phép toán xấ p xỉ phủ tậ p thô, vớ i một phủ C của U và
X ÍU , ta luôn có FH ( X ) Í TH ( X ) Í SH ( X ). W. Zhu và F.Y Wang đã công bố
Định lý 2.9 [40] FH = TH nếu và chỉ nếu C là phủ đơ n vị.
Định lý 2.10 [40] TH = SH nếu và chỉ nếu C là phủ tựa điểm.Định lý 2.11 [40] FH = SH nếu và chỉ nếu C là một phân hoạch.
Định lý 2.12 [40] Nếu một phủ C của U là phủ nửa thu gọn thì C cũng là phủ tựa
điểm của U .
Ta có thể tóm tắt các định lý 2.9 – 2.12 vớ i bảng sau
FH TH SH
C là một đơ n v ị Û FH = TH
C là phủ t ự a đ i ể m Û TH = SH
C là một nử a thu g ọn Þ TH = SH
C là một phân hoạch Û FH = TH = SH
Bảng 2.1 Điề u kiện để các phép xấ p xỉ phủ trên bằ ng nhau
2.3 Một số tính chất về xấp xỉ phủ loại 2
Định lý 2.13 Cho C 1 , C 2 là các phủ của U , C 1 và C 2 cùng xác định xấ p xỉ phủ
dướ i và xấ p xỉ phủ trên loại 2 nếu chúng thỏa các điều kiện sau:
1. reduct(C 1) = reduct(C 2)
2. C 1 và C 2 là các phủ nửa thu gọn
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 41/100
27
Chứ ng minh Do định lý 2.1, 2.7 từ reduct(C 1) = reduct(C 2) ta có:
1 2
1 2
( )TH TH aTL TL
=ìïí=ïî
C C
C C
và cùng vớ i giả thiết (2): C 1 và C 2 là các phủ nửa thu gọn nên
1 1TH SH =
C C và2 2
TH SH =C C (b) ( xem bảng 2.1).
Từ (a), (b), ta có1 2
SH SH =C C
; Hiển nhiên,1 2 1 2
TL TL SL SL= = =C C C C
Nói cách khác, C 1
và C 2 sinh ra cùng xấ p xỉ dướ i và xấ p xỉ trên phủ loại 2.
Hệ quả 2.1 Cho C 1, C 2 là các phủ của U , C 1 và C 2 sinh ra cùng xấ p xỉ dướ i và
xấ p xỉ trên phủ loại 2, nếu chúng thỏa các điều kiện sau
1. reduct(C 1) = reduct(C 2)
2. C 1 và C 2 là các phủ tựa điểm
Chứ ng minh: K ết quả đượ c suy dẫn tr ực tiế p từ định lý 2.12 và 2.13.
Mệnh đề 2.1 Cho C là một phủ của U , C và reduct(C ) chưa chắc sinh ra cùng
xấ p xỉ trên loại 2 (ngay cả khi reduct( C ) là một phân hoạch).
Chứ ng minh Tính chất trên có thể thấy qua phản ví dụ sau
Phản ví dụ 2.5 Cho U = {a, b, c}, K 1 = {a}, K 2 = {b}, K 3 = {c}, K 4 = {a, b, c}, C
= { K 1 , K 2 , K 3, K 4}. Ta có reduct(C ) = { K 1 ,K 2 ,K 3}. Nếu X = {c}, thì
( ) 3{ , , } reduct X a b c X K = ¹ =C C
2.4 Tính chất ánh xạ đóng của ba phép xấp xỉ trên dự a vào phủ
Trong phần này sẽ trình bày nhữ ng tính chấ t của ánh xạ đ óng mà các phép xấ p
xỉ phủ trên loại 1, 2, 3 có đượ c ứ ng vớ i phủ nử a thu g ọn, phủ t ự a đ iể m, phủ đơ n vị .
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 42/100
28
Các k ết quả của W. Zhu và F.Y. Wang trong [37, 38, 40] có thể tổng k ết
FH TH
Luôn thỏa- phản xạ - lũy đẳng
- phản xạ - đồng biến
- phản xạ - đồng biến
Không thỏa - đồng biến - lũy đẳng - lũy đẳng
Bảng 2.2 Tính chấ t của ánh xạ đ óng ứ ng vớ i ba phép xấ p xỉ phủ
2.4.1 Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứ ng vớ i phủ
đơ n vị Mệnh đề 2.2 Cho C là một phủ của U , nếu C là ( phủ) đơ n vị thì FH sinh bở i C
thỏa tính chất: " X,Y Í U , X Í Y Þ FH ( X ) Í FH (Y ) (tính đồng biế n)
và TH sinh bở i C thỏa: TH (TH ( X )) = TH ( X ) (tính l ũ y đẳ ng )
Chứ ng minh Từ bảng tổng k ết 2.1, nếu C là ( phủ) đơ n vị thì FH = TH. Do
TH thỏa tính đồng biến, FH thỏa tính lũy đẳng (bảng 2.2), nên khi C là ( phủ) đơ n vị
FH thỏa tính đơ n điệu và TH thỏa tính lũy đẳng. Tuy nhiên, SH chưa chắc thỏa tính
lũy đẳng nếu C là ( phủ) đơ n vị.
Phản ví dụ 2.6 Cho U = {a, b, c, d }, K 1 = {a, b}, K 2 = {a, d, c}, K 3 = {a, b, d }, C
= { K 1 , K 2 , K 3}. C là một phủ đơ n vị của U . Vớ i X = {c}, chúng ta có SH ( X ) = È { K |
K ÎC , K Ç X ¹ Æ } = {a, d, c} ¹ SH (SH ( X )) = {a, b, c, d }.
2.4.2 Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứ ng vớ i phủ
tự a điểm
Mệnh đề 2.3 Cho C là một phủ của U . Nếu C là phủ tựa điểm thì FH sinh bở i
C thỏa tính chất: " X,Y Í U, X Í Y Þ FH ( X ) Í FH (Y ) (tính đồng biế n)
Chứ ng minh Từ định ngh ĩ a của phủ tựa điểm và FH . Nếu C là một phủ tựa
điểm chúng ta có FH ( X ) = È{Md( x)| x Î X }. Dễ dàng thấy r ằng
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 43/100
29
" X,Y Í U, X Í Y Þ FH C ( X ) Í FH C (Y ) (tính đồng biế n).
Phản ví dụ tiế p theo chỉ ra khi C là một phủ tựa điểm của U nhưng TH , SH
không thỏa tính lũy đẳng.
Phản ví dụ 2.7 Cho U = {a, b, c, d } , K 1 = {a, b} , K 2 = {a, c} , K 3 = {b, d } ,
K 4 = {d }. C = { K 1 , K 2 , K 3 , K 4 }. C là một phủ tựa điểm của U. V ớ i X = {a} , chúng ta
có TH ( X ) = SH ( X ) = {a, b, c} ¹ SH (SH ( X )) = {a, b, c, d }.
2.4.3 Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứ ng vớ i phủ
nử a thu gọn
Mệnh đề 2.4 Cho C là một phủ của U, nếu C là phủ nửa thu gọn thì TH , SH sinh
bở i C chưa chắc thỏa tính lũy đẳng.
Chứ ng minh Do C là phủ nửa thu gọn thì C cũng là phủ tựa điểm, nên phản ví dụ
2.7 cũng chỉ ra r ằng nếu C là một phủ nửa thu gọn của U thì TH và SH chưa chắc thỏa
tính lũy đẳng.
Hệ quả 2.2 Cho C là một phủ của U , nếu C là một phủ nửa thu gọn thì FH là
đơ n điệu.
Chứ ng minh Do định lý 2.12 và mệnh đề 2.3.
Ta có thể tổng k ết tính chất ánh xạ đóng của các phép xấ p xỉ FH , SH , TH
sinh bở i ba loại phủ như sau
Phủ đơ n vị
Phủ tựa điểm
Phủ nửa thu gọn
FH Ánh xạ đóng Ánh xạ đóng Ánh xạ đóng
SH Ánh xạ đóng - -
TH - - -
Bảng 2.3 Tính chấ t ánh xạ đ óng của ba phép xấ p xỉ phủ trên sinh bở i ba loại phủ
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 44/100
30
2.5 Mối quan hệ giữ a các phép xấp xỉ phủ dự a vào không gian topo
Nhiề u tác giả trên cơ sở lý thuyế t không gian topo đ ã đề xuấ t các phép xấ p xỉ d ự a vào phủ. Trong phần này, luận án trình bày một số đ iề u kiện để các phép xấ p xỉ
d ự a vào phủ do Y.Yao, W. Zhu, và A.M . Kozae và cộng sự đề xuấ t là đồng nhấ t.
2.5.1 Quan hệ hai ngôi và không gian topo
a. Không gian topo đượ c xây d ự ng t ừ một quan hệ hai ngôi
Giả sử R là một quan hệ hai ngôi tùy ý xác định trên U , cặ p (U, R) đượ c gọi là
một không gian xấ p xỉ xác định bở i quan hệ hai ngôi R. Ứ ng vớ i R, có thể định ngh ĩ a
láng giềng trái, phải của một phần tử x thuộc U lần lượ t như sau
lR ( x) = { y | yÎU , yRx} và r R ( x) = { y | yÎU , xRy}
Xây dựng topo t1 sử dụng R-láng giềng phải (t ươ ng t ự , topo t 2 sử d ụng R-láng
giề ng trái), chúng ta xem họ S1 = {r R ( x) | x Î U } là một tiền cơ sở của topo t1 và ký hiệu
S x = {G Î S1| x ÎG}. Topo t1đượ c gọi là cảm sinh từ quan hệ hai ngôi R.
b. Không gian topo đượ c xây d ự ng t ừ một họ phủ
Một hệ thống thông tin S = (U, A), U là một tậ p hữu hạn khác r ỗng các đối
tượ ng, A là một tậ p hữu hạn khác r ỗng các thuộc tính. Vớ i mỗi thuộc tính aÎ A xác định
một quan hệ hai ngôi Ra trên U xU như sau
"u,vÎ U, u Ra v khi và chỉ khi u(a)Çv(a) ≠ Æ
Vớ i định ngh ĩ a này, Ra xác định một phủ C a của U là một topo cảm sinh từ quan
hệ hai ngôi Ra. Vớ i tất cả các thuộc tính thuộc A, chúng ta sẽ có một topo tS đượ c sinh
từ tiền cơ sở aa AS
ÎU . Trong đó, S a là một tiền cơ sở của topo ta.
Nếu (U , t S ) là một không gian topo đượ c xây dựng từ một họ phủ {C a | "a Î A}
sinh ra từ tậ p các quan hệ { Ra | "a Î A} thì t S đượ c gọi là phủ đượ c sản sinh từ hệ thống
thông tin S.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 45/100
31
c. Khái niệm rút g ọn không gian topo sản sinh t ừ một t ậ p các quan hệ hai ngôi
Trong [34] khái niệm rút gọn không gian topo sản sinh từ một tậ p các quan hệ
hai ngôi đượ c đề xuất:
Xét không gian topo (U , t ) sinh ra từ tậ p các quan hệ hai ngôi RA, ký hiệu b RA là
cơ sở của (U , t ).
Cho RA là một lớ p các quan hệ hai ngôi, P Í RA, r Î P , r đượ c gọi là không cần
thiết trong P nếu và chỉ nếu: b P = b (P-r). Tậ p M đượ c gọi là một rút gọn của P, nếu và
chỉ nếu (i) b P = b M , (ii) b P-{r} ¹ b M , "r ÎM
d. Danh sách các phép xấ p xỉ đ ã đượ c các tác giả định nghĩ a
Cho (U, C ) là một không gian xấ p xỉ phủ. N( x) = Ç{ K ÎC | xÎ K } là một lân cận
của x. Ký hiệu X C cho phần bù của X đối vớ i U, có ngh ĩ a là X
C = U - X .
(U , t ) là một không gian topo sử dụng các R-láng giềng phải.
Luận án sẽ khảo sát các phép xấ p xỉ sau
W.Zhu (1) X + = È{ K ÎC | K Í X } X
+= X + È { N (x) | xÎ X – X +}
Xu, Zhang (2)
C + X = { xÎU | (ÇMd( x)) Í X } C + X = { xÎU | (ÇMd( x))Ç X ≠Æ }
Yao (3)
( )( )
R Rr x X
X r xÍ
= U (( ) )C C X X =
Yao (4){ | ( ) } R
R X x U r x X = Î Íò Ñ { | ( ) } R
R X x U r x X = Î Ç ¹ Æòò Ò
A.M . Kozae, A.A. Abo Khadra, T. Medhat (5)
0 X X t = { : đóng}t = Ç Í Í Ù X F U X F F
Bảng 2.4 Các phép xấ p xỉ phủ định nghĩ a trên không gian topo
2.5.2 Mối quan hệ giữ a các xấp xỉ dự a vào không gian topo
Mệnh đề 2.5 [13] Nếu R, R -1 là 2 quan hệ hai ngôi trên U đượ c định ngh ĩ a:
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 46/100
32
xR y nếu và chỉ nếu y Î N( x) và yR -1 x nếu và chỉ nếu xR y thì
(1) R thỏa tính phản xạ và bắc cầu
(2) R
C X X + = òò Ò và R
C X X + = ò Ñ , " X ÍU
(3) Ngượ c lại, đối vớ i mỗi quan hệ hai ngôi thỏa tính phản xạ và bắc
cầu R trên U thì tồn tại một không gian xấ p xỉ phủ (U , C ) thỏa R
C X X + = òò Ò và
RC X X + = ò Ñ , X U " Í
(4) X + = 1 R X
-òò Ò , X U " Í
(5) ( ) R x X C X l X
+
Î= U và ( ), R x X
X r x X U +
Î= " ÍU
(6) Nếu C X + += vớ i mọi X ÍU , thì R là một quan hệ tươ ng đươ ng
trên U , do đó C X + += là các phép xấ p xỉ trên cổ điển Pawlak.
Định lý 2.14 [13] Giả sử C là một phủ đơ n vị của U , thì tồn tại R là quan hệ hai
ngôi có tính phản xạ và bắc cầu trên U thỏa Md( x) = {r R( x)}, ở đây r R(x) là R-láng giềng
phải của phần tử xÎU . Ngượ c lại, nếu R là một quan hệ hai ngôi có tính phản xạ và tính
bắc cầu trên U , thì C = {r R( x)| xÎU } là một phủ đơ n vị của U và Md( x) = {r R( x)},"xÎU.
Bây giờ xét hai tậ p con đáng chú ý của P (U ):
G= { X | X Î P (U ), R X = Æòò Ò } và H= { X Î P (U ) | $Y Î P (U ),
R X Y = òò Ò }
Mệnh đề 2.6 Nếu R có tính bắc cầu thì
1. R X òò Ò có tính lũy đẳng
2. GÇH = Æ
Chứ ng minh (1) Nếu R có tính bắc cầu, vớ i mọi X ÍU , ta có:
: ( ) : ( ) R R R
x U x X r x X y y r x y X " Î Î Û Ç ¹ Æ Û $ Î Ù Îòò Ò
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 47/100
33
Do đó, , ( ) : R R R R R
x U x X r x X y U y X xRy" Î Î Û Ç ¹ Æ Û $ Î Î Ùòò òò òò òò Ò Ò Ò Ò
, X xRyÛ $ Î (vì R có tính bắc cầu) R X Û Î òò Ò . Nói cách khác, R
òò Ò có tính lũyđẳng.
(2) Giả sử X = GÇ H , thì tồn tại Y Î P (U ) thỏa R
X Y = òò Ò và R X = Æòò Ò . Do đó,
R R R R X Y Y X = = = = Æòò òò òò òò Ò Ò Ò Ò .
Trong phần sau, xét một phủ đặc biệt C = t S .Ở đây (U , t S ) là một không gian
topo đượ c xây dựng trong 2.5.1 a. Hiển nhiên mệnh đề 2.5 vẫn còn đúng. Ngoài ra, tacòn có một số k ết quả sau
Mệnh đề 2.7 Cho (U , t ) là một không gian topo cảm sinh bở i quan hệ hai ngôi
R. Nếu R là một quan hệ hai ngôi có tính phản xạ thì hai phép xấ p xỉ Yao (3) và Yao (4)
là đồng nhất.
Chứ ng minh Từ R là một quan hệ phản xạ, chúng ta có R
X X = ò Ñ , do đó có thể
viết { | ( ) }={ , ( ) }C C
R R X x U r x X x U r X X = Î Í Î Ç = Æ . Vì vậy,
( ) { | ( ) } { | ( ) }=C C C
R R R
X x U r x X x U r x X X = Î Ç = Æ = Î Ç ¹ Æ òò Ò .
Mệnh đề 2.8 Cho (U , t S ) là một không gian topo đượ c xây dựng như trong 2.5.1
b. Xét một phủ đặc biệt của U là C =t S , chúng ta có X + = X t , " X ÍU .
Chứ ng minh Dễ dàng thấy r ằng mọi K ÎC , C = t S , nên K là mở . K ết hợ p vớ i định
ngh ĩ a của X +, X t , ta có điều phải chứng minh.
Hệ quả 2.3 Cho (U,t) là một không gian topo đượ c cảm sinh bở i một quan
hệ hai ngôi R có tính phản xạ và bắc cầu. Xét phủ đơ n vị của U là C ={r R (x) | xÎU},
nếu t=C ta có
(1) R
X C X X X X t + += = = =ò Ñ
(2) RC X X + = òò Ò
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 48/100
34
(3) X X t =
Chứ ng minh
(1)(2): Theo định lý 2.14 phủ C thỏa điều kiện giả thiết hệ quả 2.3 là tồn tại,
và lúc này Md(x) = {r R (x)}, "xÎU nên (ÇMd(x))ÇX= ÆÛr R (x)ÇX=Æ. Vì vậy,
chúng ta có (1)(2) từ định ngh ĩ a của các phép xấ p xỉ (bảng 2.4).
(3) Từ định ngh ĩ a của X , ta có thể viết
( ) ( ) ( ( ))( ) ( ( )) ( ( )) ( ( ))C C C
R R R
C C C C C
R R Rr x X r x X X r x X r x r x r x
Í Í Í= = =U I I
Vớ i mỗi F là tậ p đóng ứng vớ i topo t, F có thể biểu diễn:
F = ( ( ( ))C
R
x L
r xÎU = ( ( ))C
R
x L
r xÎ
I , vớ i L là một tậ p con nào đó của U.
Nếu X Í F Þ X Í (r R (x))C, "xÎL. Vì vậy, từ định ngh ĩ a của X t = Ç{F Í U |
XÍF Ù F đóng} ta có cũng có thể viết( ( ))
( ( ))C R
C
R X r x X r x X t
Í= =I .
Như vậy, chúng ta đã chỉ ra mối quan hệ giữa các phép xấ p xỉ Zhu(1), Xu và
Zhang(2), Yao(4). Tuy nhiên, mối quan hệ giữa các xấ p xỉ của A.Mkozae và cộng sự
(5), Yao(3) và của các tác giả khác chưa đượ c trình bày. Điều này có thể thấy qua các
tính chất sau
Chú ý 2.2 Trong tr ườ ng hợ p tổng quát, , X X t là khác nhau. A.M. Kozae và
cộng sự đã phát biểu, xấ p xỉ của họ là tốt hơ n xấ p xỉ của Yao (3) [7] do xấ p xỉ của họ
làm giảm vùng biên bằng cách tăng xấ p xỉ dướ i và giảm xấ p xỉ trên. Tuy nhiên họ đã
không chứng minh, ta có thể thấy điều này quan nhận xét :
Cho (U , t S ) là một không gian topo đượ c xây dựng theo 2.5.1 b. Xét một phủ
của U là C = t S . Mọi tậ p con X Í P (U ), thì X X t Í . Thậy vậy, từ định ngh ĩ a của
X t , ta thấy nó là giao tất cả các tậ p đóng chứa X , mà X là tậ p đóng chứa X . Vì vậy,
X X t Í .
Từ đó ta có X X X X t t - Í - vì X X t = .
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 49/100
35
Vớ i các phủ là các topo đượ c xây dựng từ 2.5.1 b, việc rút gọn phủ là khó khăn.
Có thể sử dụng rút gọn đượ c đề xuất bở i Zhu và Wang để giải quyết vấn đề này [39].
Một ý tưở ng khác là tr ướ c khi xử lý các xấ p xỉ của Yao(3) hay A.M . Kozae,
A.A. Abo Khadra, T. Medhat (5), có thể rút gọn không gian topo theo 2.5.1 c.
Trong [13], Guilong Liu, Ying Sai có đề xuất khái niệm chuyển đổi phủ. Việc
chuyển đổi này có thể xem là một phươ ng pháp rút gọn phủ (do làm giảm số l ượ ng của
phủ). Phép chuyển đổi phủ đượ c định ngh ĩ a như sau
Gọi C(U ) là tậ p tất cả các phủ của U , định ngh ĩ a một phép chuyển đổi F từ C(U )
đến C(U ): F : C(U ) ® C(U ), vớ i C ÎC(U ) : F (C ) = C ’= {N( x) | xÎU }
Đối vớ i phép chuyển đổi phủ này các phép xấ p xỉ phủ trên , X C X + + và xấ p xỉ
phủ dướ i C X + là không đổi. Tuy nhiên, phép chuyển đổi này không bảo toàn không
gian topo. Nói khác hơ n, xấ p xỉ của Yao(3) và xấ p xỉ của A.M . Kozae và cộng sự (5)
không bảo toàn vớ i phép chuyển đổi này. Có thể thấy qua phản ví dụ
Giả sử U = {a, b, c, d }, topo t đượ c định ngh ĩ a trên U : C = t = {Æ, U , {d }, {c,
d }}, F (C )= {N(a) = U , N(b) = U , N(c) = {c, d }, N(d ) = {d }}. Dễ thấy F (C ) không còn là
một topo.
2.6 Rút gọn tập thuộc tính dự a vào họ phủ tập thô
Bài toán rút gọn tậ p thuộc tính là một bài toán quan tr ọng trong hệ thống thông
tin nói chung, lý thuyết tậ p thô nói riêng. Bài toán này thuộc lớ p NP-khó là do sự tổ hợ p
các thuộc tính [1, 4]. Trong hệ thống thông tin không đầy đủ, bài toán tìm rút gọn tối
thiểu tậ p thuộc tính cũng vẫn thuộc lớ p NP-khó. Nhiều tác giả đã phát triển các giải
thuật rút gọn tậ p thuộc tính trong lý thuyết tậ p thô cổ điển thành các giải thuật rút gọn
tậ p thuộc tính cho các hệ thống thông tin không đầy đủ trên cơ sở phủ tậ p thô [8, 10, 16,
17]. Việc xử lý một hệ thống thông tin không đầy đủ cũng đượ c nhiều tác giả tiế p cận
dựa trên họ phủ t ậ p thô. Đây là một hướ ng tiế p cận khá thú vị, có thể thấy qua ví dụ
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 50/100
36
Ví dụ 2.7 [10] Xét hệ thống đánh giá hệ thống lươ ng và trình độ chuyên môn
của một tổ công tác vớ i giả định: Tổ công tác có 9 thành viên ứng vớ i tậ p phổ dụng U =
{ x1 ,.. ,x9}, E = {Trình độ , Lươ ng } là tậ p hai thuộc tính liên quan. Các giá tr ị của thuộc
tính ‘Trình độ’ là {Giỏi, Khá, Tr_bình} và các giá tr ị của thuộc tính ‘Lươ ng’ là {Cao,
V ừ a, Thấ p}. Ba chuyên gia {A, B, C} sẽ tham gia đánh giá các thành viên như sau:
Đối vớ i thuộc tính “Trình độ”
A: Giỏi = { x1 , x4 , x5 , x7 }, Khá = { x2 , x8}, Tr_bình = { x3 , x6 , x9}
B: Giỏi = { x1 , x2 , x4 , x7 , x8}, Khá = { x5}, Tr_bình = { x3 , x6 , x9}
C: Giỏi = { x1 , x4 , x7 }, Khá = { x2 , x8}, Tr_bình = { x3 , x5 , x6 , x9 }
Đối vớ i thuộc tính “Lươ ng”
A: Cao = { x1 , x2 , x3}, Vừa = { x4 , x5 , x6 , x7 , x8}, Thấ p = { x9}
B: Cao = { x1 , x2 , x3}, Vừa = { x4 , x5 , x6 , x7 }, Thấ p = { x8 , x9}
C: Cao = { x1 , x2 , x3}, Vừa = { x4 , x5 , x6 , x8}, Thấ p = { x7 , x9}
Giả sử đánh giá của ba chuyên gia này có tầm quan tr ọng như nhau, để khỏi mất
mát thông tin, chúng ta cần hợ p các k ết quả đánh giá trong mỗi tiêu chí. Cụ thể,
- Phủ đặc tr ưng cho thuộc tính ‘Trình độ’ là
C 1= {C11={ x1 , x2 , x4 , x5 , x7 , x8} (Giỏi), C12= { x2 , x5 , x8} (Khá), C13 = { x3 , x5 , x6 , x9} (Tr_bình)}
- Phủ đặc tr ưng cho thuộc tính ‘Lươ ng’ là
C 2 = {C21={ x1 , x2 , x3} (Cao), C22 = { x4 , x3 , x6 , x7 , x8} (Vừa), C23 = { x7 , x8 , x9} (Thấ p)}
Có thể tổng k ết qua bảng sau
Lươ ng Trình độ
Giỏi Khá Tr_bình
Cao { x1 , x2} { x2} { x3}
Vừa { x4 , x5 , x7 , x8} { x5 , x8} { x5 , x6 }
Thấ p { x7 , x8} { x8} { x9}
Bảng 2.5 Bảng phân loại theo đ ánh giá của ba chuyên gia
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 51/100
37
Nói khác hơ n họ phủ đặc tr ưng cho cho hệ thống thông tin này là D={C 1, C 2 }.
Đối vớ i bài toán rút gọn tậ p thuộc tính của một họ phủ quyết định tậ p thô, Chen
Degang và cộng sự trong bài báo của mình [8] đã đề xuất một thuật toán tìm tất cả các
rút gọn. Ý tưở ng chính của thuật toán là dựa vào ma tr ận không phân biệt. Tuy nhiên,
bài toán rút gọn tậ p thuộc tính là NP-khó, nên đôi khi ngườ i ta chỉ tìm một rút gọn
(nhằ m thu g ọn kích thướ c của hệ thố ng thông tin). Vớ i mục tiêu đó, luận án trình bày
một thuật toán mớ i FC_Reduct tìm một rút gọn tối thiểu tậ p thuộc tính ứng vớ i một họ
phủ quyết định tậ p thô. Độ phức tạ p của thuật toán này là O(|D||U |2) tươ ng đươ ng vớ i
các thuật toán rút gọn tậ p thuộc tính trong lý thuyết tậ p thô cổ điển.
M ột số khái niệm và k ế t quả trong 2.6.1 do Cheng Degang và cộng sự đề xuấ t
2.6.1 Một số khái niệm và k ết quả cơ sở
Các khái niệm cở sở về một họ phủ quyết định tậ p thô và các k ết quả chính đượ c
đề cậ p trong [2, 8, 30]
A. Phủ suy d ẫ n
Vớ i C ={C 1 , C 2 , ..,C n} là một phủ của U . Vớ i mọi xÎU , đặt C x = Ç{C j | C jÎC ,
xÎC j}. Cov(C ) = {C x: xÎU } cũng là một phủ của U đượ c gọi là một phủ suy dẫn của C .
Khái niệm phủ suy dẫn của một họ phủ tậ p thô cũng đượ c định ngh ĩ a tươ ng tự:
Cho D = {C i | i=1,...,m} là một họ phủ của U . Vớ i mọi xÎU , đặt
i{ | ( ), }D = Ç Î Î x ix ix ixC C Cov x C C thì Cov(D) = {Dx: xÎU } cũng là một phủ của U
đượ c gọi là một phủ suy dẫn của D. Rõ ràng vớ i mỗi xÎU, Dx là giao tất cả các phần tử C i chứa x. Dx là tậ p tối thiểu
thuộc Cov(D) chứa x. Nếu mỗi phủ thuộc D là ứng vớ i một thuộc tính thì
{ | ( ), }C D = Ç Î Î x ix ix i ix
C C Cov x C , Cov(D) có thể xem là giao các phủ thuộc D. Nếu
mỗi phủ thuộc D là một phân hoạch, thì Cov(D) cũng là một phân hoạch và D x là một
lớ p tươ ng đươ ng chứa x, khi đó vớ i mọi x, y ÎU , nếu yÎDx thì D x Ê D y , vì vậy yÎD x
và xÎD y thì D x = D y.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 52/100
38
Lưu ý r ằng mỗi phần tử của Cov(D) không thể biểu diễn bằng hợ p các phần tử
còn lại thuộc Cov(D). Xét lại ví dụ 2.7 trên để minh họa ý ngh ĩ a của C x và D x.
Ví dụ 2.8 [8] Trong ví dụ 2.7 nếu đặt D = {C 1, C 2}, ở đây C 1 là ứng vớ i thuộc
tính ‘Trình độ” và C 2 là ứng vớ i thuộc tính ‘Lươ ng’, thì51 5 11 12 13{ }= x
C x C C C= Ç Ç ,
điều này đưa đến mô tả “Trình độ” có thể chấ p nhận của x5 là (Giỏi Ú Khá Ú Tr_bình).
8 xD = (C 11ÇC 12)Ç(C 22ÇC 23) đưa đến mô tả của x8 là {‘Trình độ’(Giỏi Ú Khá) Ù
‘Lươ ng’( Vừa Ú Thấ p)}.
Vớ i mỗi X Í U , xấ p xỉ dướ i và xấ p xỉ trên của X tươ ng ứng vớ i Cov(D) đượ cđịnh ngh ĩ a như sau
( ) { : },
( ) { : }
x x
x x
X X
X X
D = È D D Í
D = È D D Ç ¹ Æ
Ngoài ra, các miền dươ ng, âm, biên của X ứng vớ i D đượ c xác định tươ ng ứng
( ) ( ),
( ( ),
( ) ( ) ( )
POS X X
NEG U X
BN X X X
D
D
D
= D
- D
= D - D
Rõ ràng trong Cov(D), Dx là một lớ p tối thiểu chứa x.
2.6.2 Rút gọn tập thuộc tính các hệ thống quyết định nhất quán và
không nhất quán
Khi khảo sát một hệ quyết định ứng vớ i một họ phủ, hệ quyết định đượ c phân
thành hai loại: hệ thống quyết định nhất quán và hệ thống quyết định không nhất quán.
Gọi D = {C i : i=1,...,m} là một họ phủ của U , D là thuộc tính quyết định, U/D là
một phân hoạch trên U . Nếu " xÎU , $ D jÎU/D : Dx Í D j, khi đó hệ quyết định (U ,D, D)
đượ c gọi là hệ quyết định nhất quán và ký hiệu Cov(D)£U/D. Ngượ c lại, (U,D,D) đượ c
gọi là hệ quyết định không nhất quán. D-miền khẳng định dươ ng của D đượ c định ngh ĩ a
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 53/100
39
/
( ) ( ) X U D
POS D X DÎ
= DU
Một phủ không cần thiết của một họ phủ ứng vớ i hệ quyết định nhất quán và
không nhất quán đượ c xác định như sau
Xét (U , D, D = {d }) là một hệ quyết định nhất quán. Vớ i C iÎD, nếu Cov(D-{C i})
£ U/D thì C i thuộc D đượ c nói là không cần thiết đối vớ i D, ngượ c lại C i đượ c nói là cần
thiết đối vớ i D. Tậ p P Í D , Cov( P ) ={ P x| xÎU } thỏa Cov( P ) £ U/D, nếu mọi phần tử
thuộc P là cần thiết, có ngh ĩ a là "C iÎ P , Cov(D-{C i})£U/D là sai thì P đượ c gọi là một
rút gọn của D.
Tậ p tất cả các phần tử cần thiết trong D tươ ng ứng vớ i D đượ c gọi là nhân của D
ứng vớ i D, ký hiệu CoreD(D). Rút gọn tậ p thuộc tính của một hệ quyết định nhất quán là
một tậ p tối thiểu các thuộc tính điều kiện đảm bảo chắc chắn các luật quyết định là nhất
quán.
Xét một U là một tậ p hữu hạn các đối tượ ng và D = {C i | i=1,..,m} là một họ các
phủ của U , C iÎD, D là một thuộc tính quyết định tươ ng ứng vớ i D trên U và d : U ® Id
là hàm quyết định đượ c định ngh ĩ a d (u) = u( D), "uÎU . Ta có " xi , x j Î [u] D Û xi( D) =
x j( D) = u( D), vì vậy không nhầm lẫn có thể viết d ( xi) = d ( x j) = d ([u] D) = d (u).
Tươ ng tự như 1.1.6, một hệ quyết định phủ (U,D , D) là không nhất quán khi
POS D(D) ¹ U . Nếu { }( ) ( )C D D-= i POS D POS D , thì C i là phần tử trong D không cần thiết
tươ ng ứng vớ i D. Ngượ c lại, C i là phần tử cần thiết tươ ng ứng vớ i D. Vớ i mỗi P Í D,
nếu mọi phần tử trong P là phần tử cần thiết đối vớ i D, và POS P ( D) = POS D( D) thì P đượ c gọi là một rút gọn của D ứng vớ i D.
2.6.3 Một số k ết quả liên quan giữ a họ phủ và phủ suy dẫn
Trong phần trình bày sau, các ký hiệu bao hàm đượ c qui ướ c
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 54/100
40
A Ì B Û A Ø B; A Ë B Û A Í/ B
Định lý 2.15 [8] Giả sử U là tậ p phổ dụng hữu hạn và D = {C
i : i=1,..m} là mộthọ các phủ của U , các mệnh đề sau là đúng:
(1) Dx = Dy nếu và chỉ nếu vớ i mọi C iÎD ta có Cix= Ciy.
(2) Dx É Dy nếu và chỉ nếu vớ i mọi C iÎD ta có Cix Ê Ciy và tồn tại tối thiểu một
C k ÎD mà Ckx É Cky.
(3) Dx Ë Dy và Dy Ë Dx nếu và chỉ nếu tồn tại C i, C jÎD mà Cix Ì Ciy và C jx É C jy
hay tồn tại C k ÎD mà Ckx Ë Cky và Cky Ë Ckx.
Định lý 2.16 [8] Giả sử Cov(D)£U/D, C iÎD, C i là cần thiết có ngh ĩ a Cov(D-
C i})£U/D là sai nếu và chỉ nếu tồn tại ít nhất một cặ p xi , x jÎU thỏa d ([ xi] D) ¹ d ([ x j] D),
quan hệ giữa chúng tươ ng ứng vớ i D sẽ thay đổi sau khi C i bị loại bỏ khỏi D..
Định lý 2.17 [8] Giả sử Cov(D)£U/D, P Í D thì Cov( P )£U/D nếu và chỉ nếu vớ i
mọi cặ p xi , x jÎU thỏa d ([ xi] D) ¹ d ([ x j] D), quan hệ giữa xi , x j ứng vớ i D tươ ng đươ ng vớ i
quan hệ của chúng đối vớ i P , ngh ĩ a lài j x xD Ë D và
j i i j x x x x P P D Ë D Û Ë và j i x x P P Ë
Định lý 2.18 [8] Hệ quyết định không nhất quán (U , D, D ={d }) có các tính chất :
(1) " xiÎU , nếu ( )i x
POS DDD Ì thì [ ]i x i D
xD Í ; nếu ( )i x
POS DDD Ë thì
[ ],ik x k D
x U x" Î D Í là không đúng.
(2) , ( ) ( ) P P POS D POS DD" Í D = nếu và chỉ nếu ( ) ( ), / P X X X U D= D " Î .
(3) " P Í D, POS P ( D)= POS D( D) nếu và chỉ nếu " xiÎU , [ ] [ ]i i x i x i D D
x P xD Í Û Í
Trong phần tiế p theo, luận án trình bày cơ sở lý thuyế t và thuật toán FC_Reduct.
Thuật toán FC_Reduct rút g ọn t ậ p thuộc tính d ự a vào một họ phủ t ậ p thô của một hệ
quyế t định. M ặ c dù FC_Reduct phát triể n trên cơ sở lý thuyế t do Cheng Degang và
cộng sự đề xuấ t, như ng đ iể m khác biệt cần l ư u ý là FC_Reduct không d ự a vào ma tr ận
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 55/100
41
không phân biệt để rút g ọn t ậ p thuộc tính mà d ự a vào các tính chấ t đượ c phát hiện bở i
định lý 2.19, 2.20.
2.7 Thuật toán FC_Reduct rút gọn tập thuộc tính dự a vào họ
phủ tập thô
Nhận xét 2.1 Từ định ngh ĩ a của đại lượ ng Dx. Vớ i (U, D, D={d }) là một hệ
quyết định phủ nhất quán, d là hàm quyết định d : U ® I d xác định từ tậ p vũ tr ụ U vào
tậ p giá tr ị I d . Ta có các k ết quả sau
- Vớ i mỗi xi , x jÎU , nếu i j x xD Í D thì
( ) ([ ] ) ( ) ( ) ( ) ([ ] )i ji i D x x j j Dd x d x d d d x d x= = D = D = =
- Nếu ( ) ( )i jd x d x¹ thì
i j x xD Ç D = Æ có ngh ĩ a lài j x xD Ë D và
j i x xD Ë D .
Định lý 2.19 Cho (U , D, D = {d }) là một hệ quyết định phủ, P Í D, ta có:
a. (U , D, D = {d }) là một hệ quyết định phủ nhất quán khi và chỉ khi thỏa[ ] x D
x U x
xU
Î
D Ç=
Då
b. Giả sử Cov(D)£U/D, C iÎD, C i là không cần thiết khi và chỉ khi thỏa
( ) ( ) ( ) ( ) 0i j i j i j x x x x x x
xi U xj U
P P d d Î Î
D Ç D È Ç D - D =å å
Ở đây, Cov(D-{C i})={ P x | xÎU }, Cov(D)={Dx | xÎU }.
Chứ ng minh a.Từ định ngh ĩ a của một hệ nhất quán, ta có (U , D, D={d }) là một
hệ nhất quán nếu : [ ] x D x U x" Î D Í . Mà
[ ][ ] [ ] x D
x D x D x
x U x
x x x U
Î
D ÇD Í Û D Ç = D Û =
Då . Nói khác hơ n ta có a.
b. Đặt Cov(D - {C i}) = Cov ( P ) = { P x | xÎU }, Cov(D)={Dx | xÎU }
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 56/100
42
Nếu (U , D, D={d }) là một hệ nhất quán, theo định ngh ĩ a C i là không cần thiết
nếu và chỉ nếu Cov(D - {C i}) = Cov ( P ) £ U/D. Theo định lý 2.17, Cov( P )£U/D khi và
chỉ khi ,i j x x U " Î thỏa ([ ] ) ([ ] )i D j D
d x d x¹ phải có:
( ) ( )i j i j x x x x P P D Ç D = Æ Û Ç = Æ , điều này cũng có ngh ĩ a là
( ) ( ) ( ) ( ) 0i j i j i j x x x x x x
P P d d D Ç D È Ç D - D =
Chú ý r ằng, nếu xi , x j ÎU thỏa ([ ] ) ([ ] ) ( ) ( ) 0i ji D j D x x
d x d x d d = Û D - D =
(nhận xét 2.1). Điều đó cũng có ngh ĩ a là C ikhông cần thiết khi và chỉ khi
( ) ( ) ( ) ( ) 0i j i j i j x x x x x x
xi U xj U
P P d d Î Î
D Ç D È Ç D - D =å å
Định lý 2.20 Cho (U , D, D = {d }) là một hệ quyết định không nhất quán. P Í D,
POS P ( D) = POS D( D) nếu và chỉ nếu " xiÎU , ta có:
[ ] [ ]0i i
i i
x i D x i D
x x
x P x
P
D Ç Ç- =
D
Chứ ng minh Đây là k ết quả tr ực tiế p từ 3 tính chất của định lý 2.18. Từ điều
kiện (3) của định lý 2.18
, ( ) ( ) P P POS D POS DD" Í D = Û , [ ] [ ]
i ii x i D x i D x U x P x" Î D Í Û Í
điều này cũng có ngh ĩ a là
, [ ] [ ]i i i ii x i D x x i D x
x U x P x P " Î D Ç = D Û Ç =
[ ] [ ], 0i i
i i
x i D x i D
i
x x
x P x x U
P
D Ç ÇÛ " Î - =
D
Hay viết khác hơ n, ta có:
[ ] [ ]0i i
ii i
x i D x i D
x U x x
x P x
P Î
D Ç Ç- =
Då
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 57/100
43
2.7.1 Thuật toán FC_Reduct rút gọn thuộc tính của họ quyết định phủ
tập thô
Đầu vào: Cho hệ quyết định phủ T = (U , D, D = {d }).
Đầu ra: Một rút gọn tậ p thuộc tính RD of D..
Phươ ng pháp:
Bướ c 1: Tính
[ ] x D
x U x
xCI Î
D Ç= Då
Bướ c 2: If CI = |U | {T là một hệ quyế t định nhấ t quán} then goto Bướ c 3,
else goto Bướ c 5.
Bướ c 3: Tính Dx, d (Dx) , " xÎU .
Bướ c 4: begin
for each C i ÎD do
( ) ( ) ( ) ( ) 0i j i j i j
i j
x x x x x x
x U x U
if P P d d Î Î
D Ç D È Ç D - D =å å
then D:= D - {C i }; {ở đây D - {C i }= { P x | xÎU }}
endif
endfor
goto Bướ c 6.
end ;
Bướ c 5: begin
for each C i ÎD do
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 58/100
44
If [ ] [ ]
0 j j
j
j j
x j D x j D
x U x x
x P x
P Î
D Ç -- =
Då
then D:= D - {C i }; {ở đây D - {C i }= { P x | xÎU }}
endif
endfor
end;
Bướ c 6: RD= D; thuật toán k ết thúc.
2.7.2 Đánh giá độ phứ c tạp thuật toán FC_Reduct
Thuật toán này có độ phức tạ p là đa thức theo |U |. Thật vậy,
Bướ c 1, độ phức tạ p tính CI là O(|U |).
Bướ c 2, độ phức tạ p là O(1).
Bướ c 3, độ phức tạ p là O(|U |)
Bướ c 4, độ phức tạ p tính åå() là O(|U |2), do đó độ phức tạ p của bướ c này là
O(|D||U |2), vì i=1..|D|.
Bướ c 5, tươ ng tự độ phức tạ p ở bướ c 3, độ phức tạ p là O(|D||U |2).
Bướ c 6, độ phức tạ p O(1).
Vì vậy, độ phức tạ p của cả giải thuật là O(|D||U |2) (ở đ ây chúng ta bỏ qua thờ i
gian tính ,
i i x x P D
vớ i i= 1..|D|).
Ví d ụ minh họa
a. Ví d ụ khi hệ thố ng quyế t đị nh phủ là nhấ t quán
Giả sử U = { x1 , x2 , .., x9}, D = {C i | i=1..4}, và
C 1={{ x1 , x2 , x4 , x5 , x7 , x8},{ x2 , x3 , x5 , x6 , x8 , x9}},
C 2={{ x1 , x2 , x3 , x4 , x5 , x6 },{ x4 , x5 , x6 , x7 , x8 , x9}},
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 59/100
45
C 3={{ x1 , x2 , x3},{ x4 , x5 , x6 , x7 , x8 , x9},{ x8 , x9}},
C 4={{ x1 , x2 , x4 , x5},{ x2 , x3 , x5 , x6 },{ x7 , x8},{ x5 , x6 , x8 , x9}}
U/D={{ x1 , x2 , x3}, { x4 , x5 , x6 }, { x7 , x8 , x9}}
Trong trình bày sau, viết iD thay choi xD và P i thay cho
i x P (viế t thu g ọn)
Bướ c 1:
D1={ x1 , x2}, D2={ x2}, D3={ x2 , x3}, giả định d(D1) = d(D2) = d(D3) = 1,
vì D1, D2, D3Í{ x1 , x2 , x3}
D4={ x4 , x5}, D5={ x5}, D6={ x5 , x6 }, giả định d(D4) = d(D5) = d(D6) = 2,vì D4, D5, D6Í { x4 , x5 , x6 }
D7={ x7 , x8}, D8={ x8}, D9={ x8 , x9}, giả định d(D7) = d(D8) = d(D9) = 3,
vì D7, D8, D9Í { x7 , x8 , x9}
CI = 9Þ S là một hệ nhất quán.
Bướ c 2: P = D - {C 1}:
P1={ x1 , x2}, P2={ x2}, P3={ x2 , x3}, P4={ x4 , x5}, P5={ x5},P6={ x5 , x6 }, P7={ x7 , x8}, P8={ x8}, P9={ x8 , x9}
( ) ( ) ( ) ( ) 0i i j i j
i j
x xj x x x x
x U x U
P P d d Î Î
D Ç D È Ç D - D =å å
D=D - {C 1}={C 2, C 3, C 4}; C 1 là không cần thiết nên loại bỏ.
Bướ c 3: P = D - {C 2}
P1={ x
1 , x
2}, P
2={ x
2}, P
3={ x
2 , x
3},
P4={ x4 , x5}, P5={ x5}, P6={ x5 , x6 }, P7={ x7 , x8}, P8={ x8}, P9={ x8 , x9}
( ) ( ) ( ) ( ) 0i j i j i j
i j
x x x x x x
x U x U
P P d d Î Î
D Ç D È Ç D - D =å å
D=D - {C 2}= {C 3, C 4}; C 2 là không cần thiết nên loại bỏ.
Bướ c 4: P = D - {C 3}:
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 60/100
46
P1={ x1 , x2 , x4 , x5}, P2={ x2}, P3={ x2 , x3 , x5 , x6 }, P4={ x4 , x5}, P5={ x5},
P6={ x5 , x6 }, P7={ x4 , x5 , x7 , x8}, P8={ x5 , x8}, P9={ x5 , x6 , x8 , x9}
( ) ( ) ( ) ( ) 0i j i j i j
i j
x x x x x x
x U x U
P P d d Î Î
D Ç D È Ç D - D ¹å å
(có thể thấy:(D1ÇD4)=Æ, nhưng (P1ÇP4)¹Æ, |d (D1)-d (D4)|≠0) do đó C 3 là cần
thiết không thể loại bỏ: D={C 3, C 4}.
Bướ c 5: P = D - {C 4}
P1={ x1 , x2 , x3}, P2={ x1 , x2 , x3}, P3={ x1 , x2 , x3}, P4={ x4 , x5 , x6 , x7 , x8 , x9},
P5={x4, x5, x6, x7, x8, x9}, P6={x4, x5, x6, x7, x8, x9}
P7={x7, x8, x9}, P8={x7, x8, x9}, P9={x7, x8, x9}
( ) ( ) ( ) ( ) 0i j i j i j
i j
x x x x x x
x U x U
P P d d Î Î
D Ç D È Ç D - D ¹å å
(có thể thấy:(D6ÇD7)=Æ, nhưng (P6ÇP7)¹Æ, |d (D6)-d (D7)|≠0) do đó C 4 là cần
thiết không thể loại bỏ: D={C 3, C 4}.
Bướ c 6: RD= {C 3, C 4} là một rút gọn họ phủ tậ p thô. Ứ ng vớ i rút gọn này 2
thuộc tính tươ ng ứng vớ i C 1, C 2 bị loại bỏ.
b. Ví d ụ về một hệ quyế t đị nh phủ không nhấ t quán
Giả sử U ={ x1 , x2 , x3 , x4 , x5 , x6 , x7 , x8 , x9 , x10} và D ={C i, i=1..4}
C 1 ={{ x1 , x2 , x3 , x4 , x6 , x7 , x8 , x9 , x10},{ x3 , x4 , x6 , x7 },{ x3 , x4 , x5 , x6 , x7 }}
C 2 ={{ x1 , x2 , x3 , x4 , x5 , x6 , x7 },{ x6 , x7 , x8 , x9},{ x10}}
C 3 ={{ x1 , x2 , x3 , x6 , x8 , x9 , x10},{ x2 , x3 , x4 , x5 , x6 , x7 , x9}}
C 4 ={{ x1 , x2 , x3 , x6 },{ x2 , x3 , x4 , x5 , x6 , x7 },{ x6 , x8 , x9 , x10},{ x6 , x7 , x9}}
U/D={{ x1 , x2 , x3 , x6 }, { x4 , x5 , x7 }, { x8 , x9 , x10}}
Trong trình bày sau, viếti
D thay choi x
D và P i thay choi x
P (viế t thu g ọn)
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 61/100
47
Bướ c 1:
∆1={ x1 , x2 , x3 , x6 }; ∆2={ x2 , x3 , x6 }; ∆3={ x3 , x6 };
∆4={ x3 , x4 , x6 , x7 }; ∆5={ x3 , x4 , x5 , x6 , x7 };∆6={ x6 };
∆7={ x6 , x7 }; ∆8={ x6 , x8 , x9}; ∆9={ x6 , x9}; ∆10={ x10};
CI ¹ 9Þ S là một thống không nhất quán.
Bướ c 2: P = D – {C 1}:
P1={ x1 , x2 , x3 , x6 }; P2=P3={ x2 , x3 , x6 }; P4=P5={ x2 , x3 , x4 , x5 , x6 , x7 };P6={ x6 };
P7={ x6 , x7 }; P8={ x6 , x8 , x9}; P9= { x6 , x9}; P10={ x10};
[ ] [ ]0i i
i i i
x i D x i D
x U x x
x P x
P Î
D Ç Ç- =
Då
∆=∆ - {C 1}={C 2, C 3, C 4}. C 1 là không cần thiết.
Bướ c 3: P = D – {C 2}
P1={ x1 , x2 , x3 , x6 }; P2=P3={ x2 , x3 , x6 }; P4=P5={ x2 , x3 , x4 , x5 , x6 , x7 }; P6={ x6 };
P7={ x2 , x3 , x4 , x5 , x6 , x7 }; P8={ x6 , x8 , x9 , x10}; P9= { x6 , x9}; P10={ x6 , x8 , x9 , x10}
[ ] [ ]0i i
i i i
x i D x i D
x U x x
x P x
P Î
D Ç Ç- ¹
Då
C 2 là cần thiết trong ∆={C 2, C 3, C 4}.
Bướ c 4: P = D – {C 3}
P1={ x1 , x2 , x3 , x6 }; P2=P3={ x2 , x3 , x6 }; P4=P5={ x2 , x3 , x4 , x5 , x6 , x7 };
P6={ x6 }; P7={ x6 , x7 };
P8=P9= { x6 , x8 , x9 }; P10={ x10}
[ ] [ ]0i i
i
i i
x i D x i D
x U x x
x P x
P Î
D Ç Ç- =
Då
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 62/100
48
∆=∆ - {C 3}={C 2, C 4}. C 3 là không cần thiết.
Bướ c 5: P = D – {C 4}
P1= P2=P3= P4=P5={ x1 , x2 , x3 , x4 , x5 , x6 , x7 }
P6= P7={ x6 , x7 }; P8=P9= { x6 , x7 , x8 , x9 }; P10={ x10}
[ ] [ ]0i i
i i i
x i D x i D
x U x x
x P x
P Î
D Ç Ç- ¹
Då
C 4 là cần thiết trong ∆={C 2, C 4}.
Bướ c 6: RD = {C 2,C 4} là một rút gọn có ngh ĩ a là C 1, C 3 bị loại bỏ.
So sánh k ết quả tìm đượ c vớ i k ết quả của Chen Degang, ta có bảng tổng k ết
Bảng 2.6 K ế t quả rút g ọn t ậ p thuộc tính của Chen Degang và thuật toán FC_Reduct
2.8 Ứ ng dụng thuật toán FC_Reduct cho bài toán xử lý thông
tin dạy và học tại Đ.H Nha Trang
2.8.1 Giớ i thiệu bài toán
Hàng năm để nâng cao chất lượ ng giảng dạy tại Đại học Nha Trang, phòng
Kiểm định chất lượ ng đào tạo của tr ườ ng sẽ phát phiếu khảo sát chất lượ ng của mỗi
môn học đến sinh viên ( phụ l ục). Biểu mẫu cũng như nội dung khảo sát đượ c nhà
tr ườ ng thông qua dựa vào các tiêu chí giáo dục đại học do nhóm chuyên gia giáo dục
soạn thảo. Mỗi một phiếu khảo sát thu về, Trung tâm Nghiên cứu & Phát triển Công
nghệ Phần mềm ĐH Nha Trang (TTNCPTPM) xử lý: nhận dạng và chuyển qua dữ liệu
K ế t quả của thuật toán Chen Degang K ế t quả Thuật toán FC_Reduct
Ví d ụ hệ quyế t định phủ nhấ t quán
Red(D) = {{C 3, C 4}, {C 2, C 3}} RD = {C 3, C 4}
Ví d ụ về hệ quyế t định không nhấ t quán
Red(D) = {{C 2, C 4}, {C 2, C 3}} RD = {C 2,C 4}
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 63/100
49
số (lưu tr ữ dướ i dạng *.mdb). Sau đó, căn cứ vào các tiêu chí đánh giá, phần mềm của
TTNCPTPM k ết xuất k ết quả đánh giá chất lượ ng giảng dạy của giáo viên. Trong các
niên học vừa qua, những k ết quả thu đượ c từ phần mềm của TTNCPTPM đã giúp cho
nhà tr ườ ng bướ c đầu phân loại chất lượ ng giảng dạy của giáo viên và thông tin học tậ p
của sinh viên.
Trên cơ sở nghiên cứu về lý thuyết tậ p thô, chúng tôi muốn xây dựng một
phần mềm ứng dụng rút trích tậ p luật quyết định từ dữ liệu khảo sát. K ết quả thu
đượ c sẽ là một kênh tham khảo thú vị, vì k ết quả rút trích luật này dựa trên mô hình
toán học độc lậ p vớ i mô hình do nhóm chuyên gia giáo dục đề xuất.
2.8.2 Ứ ng dụng thuật toán FC_Reduct rút gọn tập thuộc tính
Từ một bảng quyết định có nhiều đối tượ ng, tậ p luật quyết định rút trích đượ c là
r ất lớ n. Để thu gọn tậ p luật quyết định mà không làm mất đi tính đặc tr ưng của bảng
quyết định, một trong những phươ ng án là rút gọn tậ p thuộc tính. Việc rút gọn tậ p thuộc
tính cũng dùng để đánh giá sự độc lậ p của các tiêu chí khảo sát. Nếu số thuộc tính rút
gọn càng lớ n, chứng tỏ các tiêu chí của bảng khảo sát có sự dư thừa bất hợ p lý. Đây làthông tin cần thiết giúp nhóm chuyên gia giáo dục hiệu chỉnh các tiêu chí của phiếu
khảo sát chất lượ ng.
Do đánh giá của các sinh viên cùng một tiêu chí đối vớ i cùng một giảng viên là
khác nhau (mỗ i tiêu chí đượ c đ ánh giá theo 4 mứ c: Giỏi, Khá, Đạt, Không ý kiế n),
tươ ng tự như ví dụ 2.7, nếu xem mỗi một sinh viên tham gia đánh giá là một chuyên gia,
mỗi giáo viên là một đối tượ ng cần đánh giá, chúng ta sẽ có một họ phủ ứng vớ i tậ p tiêuchí khảo sát. Thuật toán FC_Reduct đượ c dùng để rút gọn tậ p tiêu chí (thuộc tính). K ết
quả là số lượ ng các tiêu chí không cần thiết có thể rút gọn là 0. Điều này cho thấy tậ p
tiêu chí của nhóm chuyên gia giáo dục đề xuất là không có sự dư thừa, có thể triển khai
thực nghiệm trong thờ i gian tớ i. Cần lưu ý r ằng, nhóm tiêu chí này đượ c nhóm chuyên
gia tham khảo từ các tiêu chí của nướ c ngoài. Thuật toán đã cài đặt trong phần mềm
Rsedu 1.0 (tham khảo phụ l ục 1) và thử nghiệm trên dữ liệu UCI.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 64/100
50
2.9 K ết luận chươ ng 2
Chươ ng này luận án trình bày những k ết quả đạt đượ c liên quan đến phủ tậ p thô.Cụ thể là:
Một số tính chất cơ bản về rút gọn và phép phủ xấ p xỉ trên của ba loại phủ tậ p
thô: Nửa thu gọn (Semi-reduced ), Phủ tựa điểm ( Pointwise-covered ), Đơ n vị (Unary).
Điề u kiện để hai phủ sinh ra cùng một phép xấ p xỉ trên loại 2 đượ c đề xuất và chứng
minh (định lý 2.13, hệ quả 2.1, mệnh đề 2.1). M ố i liên hệ , tính chấ t của các phép xấ p xỉ
d ự a vào các loại phủ này và ánh xạ đ óng cũng đượ c phát hiện (mệnh đề 2.2-2.4, hệ quả
2.2). Chươ ng này cũng trình bày một số đ iề u kiện để các phép xấ p xỉ là đồng nhấ t khi
tiế p cận bằ ng không gian topo (mệnh đề 2.6-2.8, hệ quả 2.3).
Thuật toán mớ i rút gọn tậ p thuộc tính dựa vào một họ phủ: Thuật toán
FC_Reduct đượ c đề xuất. Độ phức tạ p của thuật toán tươ ng đươ ng vớ i các thuật toán
tìm một rút gọn tậ p thuộc tính trong lý thuyết tậ p thô cổ điển: O(|D||U |2). Ứ ng dụng thực
tế thuật toán cho bài toán xử lý thông tin dạy và học tại Đại học Nha Trang đượ c trình
bày cho thấy khả năng ứng dụng và tính đúng đắn của thuật toán.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 65/100
51
Chươ ng 3
ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂ NGTẬP LUẬT QUYẾT ĐỊ NH
Trong những năm gần đây, rút trích và đánh giá hiệu năng của tậ p luật quyết
định đã tr ở bài toán đượ c nhiều ngườ i quan tâm [9, 15, 41, 46, 47, 48]. Các độ đo cổ
điển của một số tác giả có một số nhượ c điểm hoặc là áp dụng cho mỗi luật đơ n, hoặc là
khi giá tr ị độ đo độ chắc chắn bằng 0 thì sẽ không có một luật quyết định nào của bảng
quyết định là đượ c chấ p nhận. Yuhua Qian và cộng sự đã phân tích, đề xuất ba độ đo
mớ i khắc phục nhượ c điểm này. Nhiều bài báo của họ công bố về tính chất của ba độ đo
mớ i này r ất đáng quan tâm [46, 47, 48]. Tuy có đượ c nhiều tính chất khá tốt, nhưng các
độ đo của họ có công thức khá phức tạ p. Đáng lưu ý là độ đo độ nhất quán của YuhuaQian và cộng sự có hạn chế là không đồng biến như độ đo cổ điển. Dựa vào ý tưở ng của
nhóm tác giả Nguyễn Thanh Tùng và Nông Thị Hoa [4], luận án đề xuất độ đo mớ i
khắc phục đượ c nhượ c điểm độ đo của nhóm tác giả trên.
3.1 Hạn chế của các độ đo cổ điển trên các bảng quyết định
Cho T = (U , C È D) là một bảng quyết định, C là tậ p thuộc tính điều kiện, D là
tậ p thuộc tính quyết định. Giả sử U/C = { X 1 , X 2 ,.., X m}, F =U/D = {Y 1 , Y 2 , .., Y n}. Khi
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 66/100
52
X iÎU/C , Y jÎU/D và X iÇY j ¹ Æ. Ký hiệu des( X i) và des(Y j) lần lượ t là các mô t ả của các
l ớ p t ươ ng đươ ng ứng X i , Y j trong bảng quyết định T.
Một luật quyết định có dạng Z ij : des(X i ) ® des(Y j ).
Các độ đo lượ ng giá một luật Z ij quyết định đượ c đề xuất [26]:
- Độ đo độ chắc chắn ( ) /ij i j i Z X Y X m = Ç
- Độ đo độ hỗ tr ợ ( ) /ij i j Z X Y U = Ç
Các độ đo này chỉ định ngh ĩ a cho các luật quyết định đơ n, không phù hợ p cho
việc đánh giá hiệu năng của một tậ p luật quyết định.
Ký hiệu C-xấ p xỉ dướ i, C-xấ p xỉ trên của F lần lượ t là
1 2 1 2{ , ,.., }; { , ,.., }n nCF CY CY CY CF CY CY CY = = . Trong đó,
{ | [ ] }; { | [ ] , }i C i i C i iCY x U x Y F CY x U x Y Y F = È Î Í Î = È Î Ç ¹ Æ Î , 1£ i £ n.
Độ đo chắc chắn xấ p xỉ của F xác định bở i C do Pawlak đề xuất [26] là
/
/
( ) i
i
iY U D
C
iY U D
CY a F
CY
Î
Î
= åå
Trong một số tr ườ ng hợ p, aC ( F ) đượ c dùng để đo độ chắc chắn của một bảng
quyết định. Tuy nhiên, hạn chế của độ đo này có thể thấy qua ví dụ sau
Ví dụ 3.1 [48] Cho T1= (U , C È D1) và T2 = (U , C È D2) là hai bảng quyết định
trên cùng tậ p phổ dụng U . Giả sử r ằng
U/C = {{e1 , e2}, {e1 , e4 , e5}, {e6 , e7 }}.
U/D1= {{e1}, {e2 , e3 , e4}, {e5 , e6 }, {e7 }}
U/D2={{e1, e3 }, {e2 , e4,e6 }, {e5}, {e7 }}
Khi đó, sáu luật quyết định đượ c rút trích từ T1 và độ đo độ chắc chắn, đô đo độ
hỗ tr ợ của mỗi một luật xác định như sau
r 1: des({e1 ,e2}) ® des({e1}), 1 1
1 1( ) , ( ) ;
2 7
r s r m = =
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 67/100
53
r 2: des({e1 ,e2}) ® des({e2}), 2 2
1 1( ) , ( ) ;
2 7r s r m = =
r 3: des({e3 ,e4 ,e5}) ® des({e3 ,e4}), 3 32 2( ) , ( ) ;3 7r s r m = =
r 4: des({e3 ,e4 ,e5}) ® des({e5}), 4 4
1 1( ) , ( ) ;
3 7r s r m = =
r 5: des({e6 ,e7 }) ® des({e6 }), 5 5
1 1( ) , ( ) ;
2 7r s r m = =
r 6 : des({e6 ,e7 }) ® des({e7 }), 6 6
1 1( ) , ( ) ;
2 7r s r m = =
Hơ n thế, bảy luật đượ c rút trích từ T2 và độ đo độ chắc chắn, độ đo độ hỗ tr ợ của
mỗi một luật xác định như sau
r’ 1: des({e1 ,e2}) ® des({e1}),, ,1 1
1 1( ) , ( ) ;
2 7r s r m = =
r’ 2: des({e1 ,e4 ,e5}) ® des({e2}),, ,2 2
1 1( ) , ( ) ;
3 7r s r m = =
r’ 3: des({e1 ,e2}) ® des({e2}),, ,3 3
1 1( ) , ( ) ;
2 7r s r m = =
r’ 4: des({e3 ,e4 ,e5}) ® des({e4}), , ,4 4
1 1( ) , ( ) ;3 7r s r m = =
r’ 5: des({e6 ,e7 }) ® des({e6 }),, ,5 5
1 1( ) , ( ) ;
2 7r s r m = =
r’ 6 : des({e3 ,e4 ,e5}) ® des({e5}),, ,6 6
1 1( ) , ( ) ;
3 7r s r m = =
r’ 7 : des({e6 ,e7 }) ® des({e7 }),, ,7 7
1 1( ) , ( ) ;
2 7r s r m = =
Theo công thức tính độ chắc chắn, ta có:
/1
/
0( / ) 0
2 5 5 2i
i
iY U D
C
iY U D
CY a U D
CY
Î
Î
= = =+ + +
åå
2
2
/2
/
0( / ) 0
5 7 3 2i
i
iY U D
C
iY U D
CY a U D
CY
Î
Î
= = =+ + +
åå
Điều đó nói r ằng 1 2( / ) ( / ) 0.C C a U D a U D= =
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 68/100
54
Bây giờ , chúng ta xem xét giá tr ị trung bình độ đo độ chắc chắn của mỗi tậ p luật
rút trích đượ c từ T1, T2:
6
1
1 1 1 1 2 1 1 1 1( ) ( )
6 6 2 2 3 3 2 2 2i
i
r m=
= + + + + + =å và
6,
1
1 1 1 1 1 1 1 1 1 3( ) ( )
6 7 2 3 2 3 2 3 2 7i
i
r m=
= + + + + + + =å
Điều này có thể nói bảng quyết định T1 có giá tr ị trung bình độ chắc chắn cao
hơ n T2, nhưng độ đo độ chắc chắn aC (.) không thể hiện đượ c điều đó.
Trong [26], độ đo độ nhất quán cổ điển cũng đượ c định ngh ĩ a
1( )
n
i
iC
CY
C DU
==å
Tươ ng tự như độ đo độ chắc chắn, độ đo độ nhất quán này cũng không biểu diễn
tốt độ nhất quán của bảng quyết định vì chỉ xem xét các giá tr ị xấ p xỉ dướ i. Vì vậy, cần
đề xuất một độ đo lượ ng giá hiệu năng khác thay thế cho các độ đo cổ điển này.
3.2 Độ đo hiệu năng của tập luật quyết định của Yuhua Qian
và cộng sự
Yuhua Qian và cộng sự [48] đã đề xuất 3 độ đo: độ chắc chắn (certainty
measure), độ nhất quán (consistency measure) và độ hỗ tr ợ ( support measure) nhằm
khắc phục nhượ c điểm và thay thế cho các độ đo cổ điển.
Định ngh ĩ a 3.1 [48] Cho T = (U , C È D) là một bảng quyết định và RULE = { Z ij |
Z ij:des( X i)® des(Y j), X iÎU/C , Y jÎU/D, i=1..m, j=1..n}, độ đo độ chắc chắn a của T
đượ c định ngh ĩ a
2
1 1 1 1
( ) ( ) ( )m n m n
i j
ij iji j i j i
X Y s Z Z
U X a m
= = = =
Ç= =åå ååT
Độ đ o độ nhấ t quán b của S đượ c định nghĩ a
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 69/100
55
1 1
4( ) [1 ( )(1 ( ))]
i N mi
i j ij iji ji
X X Y Z Z
U X b m m
= =
= - Ç -å åT
Độ đ o độ hỗ tr ợ g của S đượ c định nghĩ a
2
22
1 1 1 1
( ) ( )m n m n
i j
iji j i j
X Y s Z
U g
= = = =
Ç= =åå ååT
Trong đó m( Z ij) và s( Z ij) lần lượ t là độ đo độ chắc chắn, độ hỗ tr ợ của luật Z ij.
3.3 Đề xuất độ đo hiệu năng của tập luật quyết định
Luận án đề xuất độ đo độ chắc chắn và độ đo độ nhất quán đượ c như sau
Định ngh ĩ a 3.2 Cho T = (U , C È D) là một bảng quyết định và RULE={ Z ij |
Z ij:des( X i)® des(Y j), X iÎU/C , Y jÎU/D, i=1..m, j=1..n}.
Độ đ o độ chắ c chắ n ta đượ c định nghĩ a
1 1( ) 1
C m n
i j i j
i j i
X Y X Y X U
ta= =
Ç Ç= - ååT
Độ đ o độ nhấ t quán tb của S đượ c định nghĩ a
1 1
( ) 11
C m n
i j i j
i j i
X Y X Y n
n X U tb
= =
Ç Ç= -
-ååT
Chú ý 3.1 Về độ đo độ hỗ tr ợ , đề nghị sử dụng lại độ đo do của nhóm tác giả
Yuhua Qian và cộng sự, do công thứ c có một số thành phần con tham gia độ đ o mớ i,
thuận tiện khi lậ p trình đánh giá đồng thờ i ba độ đo này.
Định lý 3.1 Cho T = (U , C È D) là một bảng quyết định, và RULE ={ Z ij | Z ij:
des(X i ) ® des(Y j ), X iÎU/C , Y jÎU/D}, độ đo độ chắc chắn ta của T chính là độ đo a.
Chứ ng minh Dễ dàng thấy r ằngC
i j i i j X Y X X Y Ç = - Ç . Dođó, ta có:
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 70/100
56
1 1 1 1
( ) 1 1 ( )C m n m n
i ji j i j i i j
i j i ji i
X Y X Y X Y X X Y
X U X U ta
= = = =
ÇÇ Ç - Ç= - = -åå ååT =
2 2
1 1 1 1 1 1
1 ( ) 1m n m n m n
i j i j i j i j
i j i j i ji i
X Y X Y X Y X Y
U X U U X U = = = = = =
Ç Ç Ç Ç- - = - +åå åå åå .
Từ
1 1
1m n
i j
i j
X Y
U = =
Ç=åå
Ta có
2 2
1 1 1 1 1 1
1m n m n m n
i j i j i j
i j i j i ji i
X Y X Y X Y
U X U X U = = = - = =
Ç Ç Ç- + =åå åå åå = a( T ). (đ pcm)
Chú ý 3.2 Từ định lý 3.1, độ đo ta chính là độ đo a. Tuy nhiên, công thức
của ta có nhiều thành phần con chung vớ i các công thức độ đo khác, vì vậy việc sử
dụng ta thuận tiện hơ n.
Chúng ta có thể thấy các tính chất quan tr ọng của ta hay a trong [48]. Có thể
liệt kê như sauĐịnh lý 3.2 [48] (C ự c tr ị cho ta ) Cho T = (U, C È D) là một bảng quyết định và
RULE = { Z ij | Z ij: des(X i )® des(Y j ), X iÎU/C, Y jÎU/D}, ta có
- Vớ i mọi Z ijÎRULE, nếu m(Z ij ) = 1 thì độ đo ta( T ) đạt giá tr ị lớ n nhất là 1.
- Nếu m = 1 và n = |U|, thì ta( T ) đạt giá tr ị nhỏ nhất là1
U
Định lý 3.3 [48] Cho T1 = (U, C 1È D1) , T2 = (U, C 2È D2) là hai bảng nhất quán
ngượ c, nếu U/C 1 = U/C 2 và U/D2p U /D1 thì ta( T 1 )³ta( T 2 ).
Định lý 3.4 [48] Cho T1 = (U, C 1È D1) ,T2 = (U, C 2È D2) là hai bảng nhất quán
ngượ c, nếu U/D1 = U/D2 và U/C 2p U/C 1 thì ta( T 1 ) £ ta( T 2 ).
Định lý 3.5 [48] Cho T = (U, C ÈD) , T’ = (U, BÈ D) là hai bảng quyết định, T là
nhất quán, B ÍC. Nếu B là rút gọn C-miền khẳng định dươ ng của D thì ta( T ) = ta( T’ )
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 71/100
57
Định lý 3.6 [48] Cho T = (U , C È D), T’ = (U , BÈ D) là hai bảng quyết định, B Í
C . Nếu B là C-rút gọn miền khẳng định dươ ng của D thì ta( T ) ³ ta( T’ ).
Độ đ o độ nhấ t quán tb và một số tính chấ t
Định lý 3.7 (C ự c tr ị cho tb ) Cho T = (U , C È D) là một bảng quyết định và
RULE ={ Z ij | Z ij: des(X i ) ® des(Y j ), U/C = { X 1 , X 2 , .., X m}, U/D = {Y 1 , Y 2 , .., Y n} }
Vớ i mọi Z ijÎRULE, nếu m( Z ij) = 1 thì độ đo tb ( T ) đạt giá tr ị lớ n nhất là 1.
Nếu m = 1 và n = |U | thì tb ( T ) đạt giá tr ị nhỏ nhất là 0.
Chứ ng minh: (1) Từ m( Zij) = 1Û 1i j
i
X Y
X
Ç= Û 0
C
i j X Y
U
Ç=
Þ 0C
i ji j
i
X Y X Y
X U
ÇÇ= , "i, j
Þ 1 1
( ) 1 11
C m n
i ji j
i j i
X Y X Y n
n X U tb
= =
ÇÇ= - =
- ååT .
(2) Từ định ngh ĩ a của tb (T ), ta có thể viết như sau
1 1
( ) 11
C m ni ji j
i j i
X Y X Y n
n X U tb
= =
ÇÇ= -
- ååT
= 1 (1 ( )) 1 ( ( ) 1)1 1
n n
n nta ta- - = + -
- -T T
Nếum =1 và n = |U |, thì độ đo ta( T ) đạt giá tr ị cực tiểu là1 1
U n= (định lý 3.2).
Do đó, độ đo tb ( T ) có giá tr ị cực tiểu là 0.
min
1( ) 1 ( 1)( ) 0
1
n
n ntb = + - =
-T (đ pcm).
Tính đơ n đ iệu của độ đ o tb đố i vớ i bảng quyế t định nhấ t quán ng ượ c có thể thấ y
qua các định lý
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 72/100
58
Định lý 3.8 Cho T1 = (U , C 1È D1), T2 = (U , C 2È D2) là hai bảng nhất quán
ngượ c. Nếu U/C 1 = U/C 2 và U/D2p U/D1 thì tb ( T 1 ) ³ tb ( T 2 ).
Chứ ng minh Từ định ngh ĩ a 3.2 và định lý 3.3 có thể thấy đượ c tính đơ n điệu
của tb và ta là như nhau. Tuy vậy, ta có thể chứng minh tr ực tiế p
Từ U/C 1 = U/C 2, T1 và T2 là 2 bảng nhất quán ngượ c.
Giả sử U/C 1 = U/C 2 = { X 1 , X 2 ,.., X m} và U/D1 = {Y 1 , Y 2 ,.., Y n}
Nếu U/D2p U/D1, thì U/D2 =
1 1
( ) jt n
k
j k
Y = =
U U , ở đây
1 1
j
j
t
k
j j
k t
Y Y -= +
= U , đặt t0 = 0, tn= s, Zk =k
jY
Điều này dẫn đến U/D2 = { Z 1 , Z 2 ,.., Z s}.
Ta có:
1 11 1
( ) ( ) j j
j j
t t
C k k C
i j i j i j i j
k t k t
X X X Y X Y X Y - -= + = +
Ç Ç = Ç ÇU U
1 11 1
( ) ( ) j j
j j
t t k k C
i j i j
k t k t
X Y X Y - -= + = +
£ Ç ÇU U =1 1
( )i
i
t k k C
i j i jk t
X Y X Y -= +
Ç Çå
Do nếu
1 1 1 1 1
( )C k k C m n m n s
i j i j i j i j
i j i j k i i
X Y X Y X Y X Y
X U X U = = = = =
Ç Ç Ç Ç£åå ååå thì
1 1 1 1
1 1
1 1
C C m n m s
i j i j i k i k
i j i k i i
X Y X Y X Z X Z n n
n U X n U X = = = =
Ç Ç ÇÇ- ³ -
- -
åå åå
Nói cách khác, ta có tb (T 1) ³ tb (T 2). (đ pcm)
Bổ đề 3.1: Cho T =(U, C È D) là một bảng quyết định, và 2 tậ p khác r ỗng X,
Y Í U . Giả sử X =1
k
j
X =
U , X pÇ X q = Æ vớ i mọi p¹q, có ngh ĩ a { X 1 , X 2 , .., X k } là một
phân hoạch của X, thì
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 73/100
59
1
C C k
j j
j
X Y X Y X Y X Y
U X U X =
Ç ÇÇdz å
và dấu đẳng thức xảy ra nếu 0C
p q X Y X Y Ç Ç = , vớ i mọi p¹q và p,q = 1, 2, ..,k.
Chứ ng minh Tươ ng tự ý tưở ng của bổ đề 4.3 trong [6], ta có thể chứng minh bổ
đề như sau:
Từ X pÇ X q = Æ vớ i mọi p¹q, ta có:
1 1
1 1
1 1 1
k k C
C C i i k k
j j j
j j
C C k k k
j p j j
j p j
X Y X Y X Y X Y X Y Xj Y
U X U X U X
X Y X Y X Y X Y
U X U X
= =
= =
= = =
Ç ÇÇÇÇ Ç
= =
Ç Ç Ç Ç= ³
å å
åå å
U U
Rõ ràng, nếu 0C
p q X Y X Y Ç Ç = , vớ i mọi p¹q và p,q = 1, 2, ..,k, ta có đẳng thức.
Định lý 3.9 Cho T1 = (U , C 1È D1), T2 = (U , C 2È D2) là hai bảng nhất quán ngượ c.
Nếu U/D1 = U/D2 và U/C 2p
U/C 1 thì tb (T 1) £ tb (T 2).Chứ ng minh: Giả sử U/D2 = {Y 1 , Y 2 ,.., Y n},U/C 1 = { X 1 , X 2 ,.., X m},
Nếu X i =1 1
i
i
t k
i
k t
X -= +
U Þ U/C 2 =1
1
( )i
i
mt k
ik t i
X = +
=U U , đặt t0 = 0,
Từ bổ đề 3.1, vớ i mỗi j=1,..,n và i=1,..,m, ta có:
1 1i
C k k t
i j i j i j i j
k t i i
X Y X Y X Y X Y
U X U X -= +
Ç Ç Ç Ç³ å , đặt t0 = 0 thì
11 1 1 1 1
i
i
C k k C t m n m ni j i j i j i j
i j i j k t i i
X Y X Y X Y X Y
U X U X == = = = = +
Ç Ç Ç Ç³åå åå å
Vì vậy:
11 1 1 1 1
1 11 1
i
i
C k k Ct m n m ni j i j i j i j
i j i j k t i i
X Y X Y X Y X Y n n
n U X n U X== = = = = +
Ç Ç Ç Ç- £ -
- -åå åå å .
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 74/100
60
Nói khác hơ n tb (T 1) £ tb (T 2). (đ pcm)
Nhận xét 3.1 trong [48], Yuhua Qian và cộng sự đã công bố:
a. Cho T 1 = (U,C 1È D1 ), T 2 = (U,C 2È D2 ) là hai bảng nhấ t quán ng ượ c, nế u
U/C 1 = U/C 2 và U/D2p U/D1 thì b (T 1 )£ b (T 2 ) khi "m(Z ij )£
1
2 , và b (T 1 )³b (T 2 ) khi
"m(Z ij )³ 12
.
b. Cho T 1 = (U,C 1È D1 ), T 2 = (U,C 2È D2 ) là hai bảng nhấ t quán ng ượ c, nế u
U/D1 = U/D2 và U/C 2p U/C 1 thì b (T 1 )³ b (T 2 ) khi "m(Z ij )£
1
2 , và b (T 1 )£ b (T 2 ) khi
"m(Z ij )³ 12.
Do sự đơ n điệu của độ đo b là phụ thuộc vào giá tr ị của m. Từ định ngh ĩ a độ nhất
quán, nhất quán ngượ c ta thấy độ nhất quán, nhất quán ngượ c tỉ lệ thuận vớ i độ chắc
chắn. Nhưng k ết quả a, b không thỏa (Yuhua Qian và cộng sự cũng đ ã nhận xét đ iề u
hạn chế này[48]), vì vậy độ đo tb phù hợ p hơ n độ đo b , trong việc đánh giá độnhất quán.
Bổ đề 3.2 Cho T1 = (U , C È D), T2 = (U , BÈ D) là hai bảng quyết định, nếu C Í B
thì U/Bp U/C và tb (T 2)£tb (T 1), dấu đẳng thức xảy ra (tb (T 2) = tb (T 1)) khi T 1, T 2 là hai
bảng nhất quán.
Chứ ng minh: Chỉ cần xét tr ườ ng hợ p tb (T 2) = tb (T 1).
Khi U/Bp U/C ta có " X iÎU/C , X i có thể viết X i =1
it k
ik
X =
U , ở đây k
i X ÎU/B. Từ
bổ đề 3.1 nếu 0k l C
i j i j X Y X Y Ç Ç = , "i,j,k ¹l ta có tb (T 2) = tb (T 1).
Do 0k l C i j i j X Y X Y Ç Ç = nếu
0k l C
i j i j X Y X Y Ç Ç = (1) hay 0l k C
i j i j X Y X Y Ç Ç = (2)
Nếu (1) xảy ra thì 0k
i j X Y Ç = hoặc 0l C
i j X Y Ç = hoặc
0, 0k l C
i j i j X Y X Y Ç = Ç = .
Nếu 0k
i j X Y Ç = Þ 0k C
i j X Y Ç ¹ Þ 0l
i j X Y Ç = . Do ,k l
i i X X có vai trò như nhau
nên chúng ta có thể nói r ằng tb (T 2) = tb (T 1) khi $ j0, "k =1..t i,0
k
i j X Y Í . Nói khác hơ n
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 75/100
61
T 1 , T 2 là các bảng nhất quán. Trong tr ườ ng hợ p này ta cũng có ij ij( ) ( )k Z Z m m= , " j,k, ở
đây X i = 1
it k
ik
X =U .
Định lý 3.10 Cho T1 = (U , C È D), T2 = (U , BÈ D) là hai bảng quyết định, nếu T1
là bảng nhất quán, B Í C và B là một C- rút gọn miền khẳng định dươ ng của D thì
tb (T 2) = tb (T 1)
Chứ ng minh K ết quả của định lý đượ c suy ra tr ực tiế p định ngh ĩ a rút gọn miền
khẳng dươ ng và bổ đề 3.2.
Từ bổ đề 3.2, ta còn có định lý
Định lý 3.11 Cho T1 = (U , C È D), T2 = (U , BÈ D) là 2 bảng quyết định, nếu B Í
C và B là C-rút gọn miền khẳng định dươ ng của D thì tb (T 2)³tb (T 1)
Để minh họa cho sự khác nhau giữa các độ đo nhất quán tb , b và C C ( D), các độ
đo đượ c cài đặt thử nghiệm trên ba tậ p dữ liệu của UCI: Tic-tac-toe, Dermatology và
Nursery (thông tin liên quan đượ c mô t ả trong bảng 3.1). So sánh sự khác biệt các giá
tr ị của ba độ đo ứng vớ i 3 tậ p dữ liệu đượ c thể hiện trong bảng 3.2, bảng 3.3 và hình 3.1,
hình 3.2.
Tậ p dữ liệu Số mẫu Số Th.tính điều kiện Số lớ p quyết địnhTic-tac-toe 958 9 2Dermatology 366 33 6
Nursery 12960 8
Bảng 3. 1 Mô t ả các t ậ p d ữ liệu thử nghiệm
Độ đo Đặc tr ưng (Features)
1 2 3 4 5 6 7 8 9
)( Dcc 0.0000 0.0000 0.1253 0.1628 0.4186 0.7766 0.9436 1.0000 1.0000
b 0.1114 0.1322 0.2827 0.3300 0.5832 0.8000 0.9436 1.0000 1.0000
tb 0.1114 0.1322 0.2827 0.3300 0.5832 0.8000 0.9436 1.0000 1.0000
Bảng 3.2 S ố liệu chỉ ra sự khác biệt của )( Dcc , b và tb đố i vớ i t ậ p d ữ liệu Tic-tac-toe;
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 76/100
62
Độ đoĐặc tr ưng (features)
1 2 3 6 9 12 15 18 21 33
)( Dcc 0.0000 0.0109 0.0437 0.6066 0.8552 0.8962 0.9809 1.0000 1.0000 1.0000
b 0.3350 0.3164 0.2821 0.6826 0.8797 0.9153 0.9818 1.0000 1.0000 1.0000
tb 0.0854 0.1581 0.2960 0.7661 0.9148 0.9415 0.9891 1.0000 1.0000 1.0000
Bảng 3.3 S ố liệu chỉ ra sự khác biệt của )( Dcc , b và tb đố i vớ i t ậ p d ữ liệu Dermatology
Bảng 3.4: K ế t quả các độ đ o τβ ; β và cC trên t ậ p d ữ liệu Nursery
Độ đoĐặc tr ưng (Features)
1 2 3 4 5 6 7 8
)( Dcc 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 1.0000
b 0,1378 0,11119 0,11122 0,11126 0,1112 0,11111 0,11111 1.0000
tb 0,1782 0,2865 0,2904 0,3047 0,3262 0,34002 0,36613 1.0000
Hình 3.1 S ự biế n thiên của các độ đ o độ nhấ t quán: tb , b , )( Dcc
trên t ậ p d ữ liệu Tic-Tac-Toe
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 77/100
63
Hình 3.2 S ự biế n thiên của các độ đ o độ nhấ t quán: tb , b , )( Dcc ứ ng vớ i t ậ p d ữ liệu
Dermatology
Hình 3.3 S ự biế n thiên của các độ đ o độ nhấ t quán: tb , b , )( Dcc
trên t ậ p d ữ liệu Nursery
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 78/100
64
Có thể thấy từ 3 bảng 3.2-3.3, giá tr ị của độ đo nhất quán tb là lớ n nhất vớ i
cùng các cấu hình đượ c chọn. Tuy nhiên, tb và C C( D) là cùng đồng biến trên tất cả
các cấu hình đượ c chọn, nhưng b thì không. K ết quả là phù hợ p vớ i nhận xét 3.1.
3.4 Ứ ng dụng hệ độ đo cho bài toán xử lý thông tin dạy và học
tại Đ.H Nha Trang
Như đã trình bày trong 2.8.1, tậ p luật quyết định rút trích đượ c từ cơ sở dữ
liệu khảo sát chất lượ ng dạy và học tại Đại học Nha Trang đượ c đánh giá hiệu năng
theo độ đo do chúng tôi đề xuất. Các giá tr ị ứng vớ i các độ đo nhằm hỗ tr ợ nhómchuyên gia giáo dục đưa ra các k ết luận về thông tin dạy và học, đồng thờ i là cơ sở
để so sánh vớ i các k ết quả thu đượ c bằng phươ ng pháp thống kê mà các nhóm
chuyên gia giáo dục đã tiến hành tr ướ c đây. K ết quả thể hiện trong phụ lục 1.
3.5 K ết luận chươ ng 3
Chươ ng này trình bày một k ết quả của luận án. Cụ thể là hệ độ đo đánh giá
hiệu năng tậ p luật quyết định trong lý thuyết tậ p thô. Hệ độ đo mớ i so vớ i hệ độ đodo của Yuhua Qian và cộng sự về mặt toán học có những điểm tươ ng đồng, cả hai
hệ độ đo khắc phục đượ c nhượ c điểm của các hệ độ đo đã có. Ngoài ra, hệ độ đo
mớ i có ưu điểm là các công thức có nhiều thành phần chung giống nhau nên thuận
tiện hơ n khi lậ p trình xử lý đồng thờ i các độ đo. Đặc biệt, độ đo độ nhất quán mớ i
xử lý đượ c điểm hạn chế của độ đo độ nhất quán của Yuhua Qian và cộng sự là
không đồng biến theo độ nhất quán như độ đo cổ điển Pawlak. Việc minh họa bằng
cách cài đặt thử nghiệm các độ đo trên ba tậ p dữ liệu của UCI là Tic-Tac-toe,
Dermatology và Nursery đã cho thấy sự tươ ng quan và khác biệt của các độ đo.
Quá trình cài đặt và ứng dụng cụ thể vào bài toán xử lý thông tin dạy và học
tại tr ườ ng Đại học Nha Trang, các k ết quả thu đượ c sẽ hỗ tr ợ nâng cao chất lượ ng
khảo sát thông tin dạy và học hằng năm của tr ườ ng.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 79/100
65
K ẾT LUẬ N
Lý thuyết tậ p thô ngày càng đượ c nhiều ngườ i quan tâm nghiên cứu, phát
triển về mặt lý thuyết cũng như ứng dụng. Vớ i mong muốn đóng góp vào sự phát
triển và ứng dụng đó, luận án đã đưa ra một số k ết quả liên quan đến sự mở r ộng tậ p
thô theo hướ ng thay đổi phép phân hoạch bằng một phủ. Đồng thờ i, mối quan hệ
giữa các loại phủ và ánh xạ đóng cũng đượ c nghiên cứu và đề xuất. Một trong
những k ết quả quan tr ọng của luận án là xây dựng độ đo đánh giá hiệu năng của tậ p
luật quyết định, khắc phục đượ c những nhượ c điểm của các độ đo đã có. Cụ thể hơ n,
luận án đã thực hiện đượ c các k ết quả sau:
1. Khảo sát tính chất toán học của các phép xấ p xỉ ứng vớ i ba loại phủ do W.
Zhu, F.Y Wang đề xuất. Xác định điều kiện để hai phủ sinh cùng một phép xấ p xỉ
loại 2 (định lý 2.13, hệ quả 2.1, mệnh đề 2.1). Tiế p cận bằng không gian topo chỉ ra
điều kiện để các phép xấ p xỉ dựa vào phủ là đồng nhất (mệnh đề 2.6 – 2.8, hệ quả
2.3).
2. Xây dựng mối quan hệ giữa các xấ p xỉ dựa vào phủ vớ i, ánh xạ đóng cũng
đượ c trình bày. Đây là cơ sở để mở r ộng các phép xấ p xỉ cũng như k ết thừa các k ết
quả đã có nhằm ứng dụng tậ p thô hiệu quả hơ n (mệnh đề 2.2, 2.3, 2.4).
3. Đề xuất một thuật toán mớ i FC-Reduct để tìm một rút gọn tối thiểu tậ p
thuộc tính dựa vào một họ phủ quyết định tậ p thô. Cơ sở lý thuyết của thuật toán
này dựa trên 2 định lý 2.19, 2.20. Độ phức tạ p của thuật toán này là O(|D||U |2
),
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 80/100
66
tươ ng đươ ng vớ i các thuật toán tìm một rút gọn tậ p thuộc tính trong lý thuyết tậ p
thô cổ điển.
4. Xây dựng đượ c độ đo mớ i đánh giá hiệu năng của tậ p luật quyết định
trong lý thuyết tậ p thô. Các tính chất toán học liên quan độ đo mớ i đượ c chứng
minh qua các định lý từ 3.1 đến định lý 3.11. Điểm cần chú ý là hệ độ do chúng tôi
đề xuất có ưu điểm là các công thức có nhiều thành phần chung giống nhau nên
thuận tiện hơ n khi lậ p trình xử lý đồng thờ i các độ đo. Đặc biệt, độ đo độ nhất quán
xử lý đượ c điểm hạn chế của độ đo độ nhất quán của Yuhua Qian và cộng sự.
5. Thử nghiệm độ đo đánh giá hiệu năng dựa trên cơ sở dữ liệu của UCI. K ếtquả thử nghiệm minh chứng cho tính đúng đắn của độ đo về mặt toán học đã đượ c
chứng minh về mặt lý thuyết tr ướ c đó. Phần mềm rút trích tậ p luật quyết định hỗ tr ợ
công tác xử lý thông tin dạy và học tại Đại học Nha Trang đượ c xây dựng cũng
minh chứng thêm về khả năng ứng dụng của các k ết quả. ( Phần mề m còn có các
chứ c nă ng tính toán một số khái niệm trong lý thuyế t t ậ p thô như phụ thuộc độ k,
hiệu chỉ nh d ữ liệu, rút trích luật k ế t hợ p, ..vì vậ y, phần mề m có thể xem như là công
cụ minh họa phục vụ công tác giảng d ạ y).
Ngoài các k ết quả thu đượ c trong luận án, các vấn đề còn phải tiế p tục,
nghiên cứu và phát triển liên quan là
- Mối quan hệ giữa phủ tậ p thô và các không gian toán học, lớ p phụ thuộc
boolean dươ ng, CSDL quan hệ...
- Phối hợ p khái niệm tậ p thô vớ i các công cụ toán học xấ p xỉ khác như tậ p
mờ , xác suất, tậ p mơ hồ (vague set) ..dựa trên phủ tậ p thô.
- Ứ ng dụng tậ p thô trong Datamining.
- Xây dựng các phần mềm ứng dụng, giải quyết các bài toán thực tiễn dựa
vào lý thuyết tậ p thô mở r ộng.
›
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 81/100
67
DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ
[1]
Nguyễn Đức Thuần, Nguyễn Xuân Huy (2009), “CÁC XẤP XỈ TRÊN CỦA
CỦA PHỦ TẬP THÔ VÀ ÁNH XẠ ĐÓNG”. K ỷ yế u H ội Nghị Khoa H ọc
K ỷ Niệm 25 N ă m Thành Lậ p Viện C ơ học & Tin học Ứ ng d ụng Tp H ồ Chí
Minh. Nxb Khoa Học Tự Nhiên và Công Nghệ, 329-333.
[2]
Nguyễn Đức Thuần, Nguyễn Xuân Huy (2009), “RÚT GỌ N TẬP THUỘC
TÍNH CỦA HỆ QUYẾT ĐỊ NH DỰ A VÀO HỌ PHỦ TẬP THÔ, T ạ p chí
Khoa học & Công nghệ , Đ H Đà N ẵ ng . 4(33) 64-69.
Nguyen Duc Thuan, “A Family of Covering Rough Sets Based Algorithm
for Reduction of Attributes ”, International Journal of Computer Theory
and Engineering (IJCTE). Vol 2 (2) 180-184.
[3]
Nguyen Duc Thuan, Nguyen Xuan Huy (2009), “A New Measure to
Evaluate the Consistency of a Set of Decision Rules Extracted from a
Decision Table”, International Journal of Computer Electrical Engineering
(IJCEE). Vol 1(4) 447- 451.
[4]
Nguyen Duc Thuan (2009), “Covering Rough Sets From a Topological
Point of View”, International Journal of Computer Theory and Engineering
(IJCTE). Vol 1(4) 601-604
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 82/100
68
TÀI LIỆU THAM KHẢO
Tài liệu tiếng Việt
[1] Hoàng Thị Lan Giao (2007), T ậ p rút g ọn và bài toán phát hiện luật theo tiế pcận t ậ p thô, Luận án Tiến s ĩ Toán học, Viện Công Nghệ Thông Tin.
[2] Nguyễn Đức Thuần, Nguyễn Xuân Huy (2009), “Rút gọn tậ p thuộc tính củahệ quyết định dựa vào họ phủ tậ p thô, T ạ p chí Khoa học & Công nghệ , Đ H
Đà N ẵ ng , (4)33 (2009), 64-69.
[3] Nguyễn Đức Thuần, Nguyễn Xuân Huy (2009), “Các xấ p xỉ trên của phủ tậ pthô và ánh xạ đóng”. K ỷ yế u H ội Nghị Khoa H ọc K ỷ Niệm 25 N ă m Thành Lậ pViện C ơ học & Tin học Ứ ng d ụng Tp H ồ Chí Minh. Nxb Khoa Học Tự Nhiênvà Công Nghệ, 329-333.
[4] Nguyễn Thanh Tùng, Nông Thị Hoa (2008), M ột phươ ng pháp mớ i xây d ự ng
cây quyế t định sử d ụng lý thuyế t t ậ p thô, Một số vấn để chọn lọc của Côngnghệ Thông tin và Truyền thông, Huế, 12-13, 229-241.
[5] Nguyễn Xuân Huy (2006), Các phụ thuộc logic trong cơ sở d ữ Liệu, NXBThống Kê, Hà Nội.
Tài liệu tiếng Anh
[6] A.A Allam, M.Y. Bakeir and E.A Abo-Tabl (2008), “Some Methods for Generating Topologies by Relations”, Bull. Malays. Maths.Soc (2) 31(2008),35-45.
[7] A.M. Kozae, AA. Abo Khadra, T.Medhat (2007), “Topological Approach for Approximation Space (TAS)”, Proceeding of the 5th Internationa
Conference INFOS 2007 on Informatics and Systems 24-26 March 2007 ,
Faculty of Computers & Information Cairo University, Cairo, Egypt, 298:302.[8] Chen Degang, Wang Changzhong, Hu Quinghua (2007), “A New Approach
to Attribute Reduction of Consistent and Inconsistent Covering Rough Sets”, Information Sciences, 177, 3500-3518.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 83/100
69
[9] Dai dai, Jianpeng Wang (2007), “A New Extracting Rule Algorithm fromIncomplete Information Systems by Covering Rough Sets”. Proceeding of
International Conference on Intelligent Systems and Knowledg Engineering (ISKE 2007).
[10] E.F Lashin, A.M. Kozae, A.A.Abo Khadra, T.Medhat (2005), “Rough SetTheory for Topological Spaces”, International Journal of ApproximateReasoning, 40(2005) 35-43.
[11] Eric C.C.Tsang, Degang Chen, John W.T.Lee, Daniel S.Yeung (2004), “OnThe Upper Approximations of Covering Generalized Rough sets”,
Proceeding of the Third International Conference on Machine Learning
and Cybernetic, Shanghai, 26-29.[12] Gianpiero Cattaneo and Davide Ciucci (2004), “Algebraic Structures for
Rough Sets”, J.F. Peters et al. (Eds.): Transactions on Rough sets II , LNCS5390, 208-252.
[13] Guilong Liu and Ying Sai (2008), “A Comparison of Two Types of RoughSets Induced by Coverings”, Int.J.Aprrox. Reason, doi:10.1016/jijar.
[14] Guo-Yin Wang, Jun Zhao, Jiu-Jiang An, Yu Wu (2004), “Theoretical Studyon Attribute Reduction of Rough Set Theory: Comparision of algebra and
information views”, Proceedings of the Third IEEE InternationalConference on Cognitive Informatics (ICCI’04).
[15] Haiyan Yu, Daoping Wang (2007), “A Granular Computing Approach toInducing Rules in Incomplete Information Systems”. Proceeding of
International Conference on Intelligent Systems and Knowledg
Engineering (ISKE 2007).
[16] Journi Järvinen (2007), “Lattice Theory for Rough Sets”, J.F. Peters et al.(Eds.): Transactions on Rough sets VI , LNCS 4374, 400-498.
[17] Keyun Qin, Yan Gao, and Zheng Pei (2007), “On Covering Rough Sets”,J.F. Peters et al. (Eds.): Transactions on Rough sets VIII, LNCS 4481, pp.34-41.
[18] Lin, T.Y. (1988).” Neighborhood Systems and Approximation in RelationalDatabases and Knowledge Bases”. Proceedings of the 4th International
Symposium on Methodologies of Intelligent Systems.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 84/100
70
[19] Michiro Kondo and Wieslaw A.Dudek (2006), “Topological Structures of Rough sets induced by Equivalence Relations”, Journal of Advanced
Computational Intelligence and Intelligent Informatics, Vol. 10 No 5.
[20] Milan Vlach (2008), Algebraic and Topological Aspects of Rough SetTheory, Fourth International Workshop on Computational Intelligence &Applications, IEEE SMC Hiroshima Chapter, Hiroshima University, Japan,December 10&11.
[21] Ngo Chi Lang (2003), A Tolerance Rough Set Approach to Clustering Web
Search Results, Master Thesis in Computer Science, Warsaw UniversityFaculty of Mathematics, Informatics and Mechanics.
[22] Nguyen Duc Thuan (2009), “Covering Rough Sets From a TopologicalPoint of View”, International Journal of Computer Theory and Engineering
(IJCTE). Vol 1(4) 601-604.
[23] Nguyen Duc Thuan (2010), “A Family of Covering Rough Sets BasedAlgorithm for Reduction of Attributes ”, International Journal of
Computer Theory and Engineering (IJCTE). Vol 2(2) 180-184.
[24] Nguyen Duc Thuan, Nguyen Xuan Huy (2009), “A new measure to evaluatethe consistency of a set of decision rules extracted from a decision table”,
International Journal of Computer Electrical Engineering (IJCEE). Vol1(4) 447- 451.
[25] P.Samanta and Mihir K. Chakraborty (2008), “On Extention of Dependencey and Consistency Degree of Two Knowledges Represented byCovering”. J.F. Peters et al. (Eds.): Transactions on Rough sets IX , LNCS5390, 351-364.
[26] Pawlak. Z (1991), “Rough sets, Theoretical Aspects of Reasoning aboutData”, Kluwer Academic Publishers, London.
[27] Pawlak. Z (2002), “ Theory with Data using Rough Sets”. Proceedings of the 26th Annual International Computer Software and ApplicationsConference (COMPSAC ‘ 02).
[28] Qiang Shen, Richard Jensen (2007), “Rough Sets, Their Extensions andApplications”, International Journal of Automation and Computing ,04(1),100-106.
[29] QingE Wu, Tuo Wang, YongXuan Huang, and JiSheng Li (2008),“Topology Theory on Rough Sets”, IEEE Transactions on Systems, Man,and Cybernetics-Part B: Cybernetics, Vol. 38, No.1. Feb.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 85/100
71
[30] Ruizhi Wang, Duoqian Miao, Guirong Hu (2006), Descernibility Matrix Based Algorithm for Reduction of Attributes, IAT Workshops 2006, 477-480.
[31] Serkan Narl, Ahmet Z. Ozcelik (2008), “On Generalizing Rough Set Theoryvia using a Filter”, Int. J. Computational and Mathematical Science, 2;3©www.waset.org Summer 2008.
[32] Skowron A., Zhong N. (2000.), Rough Sets in KDD, Tutorial Notes.
[33] Taihe Fa and Daowu Pei (2007), “Topological Description of Rough setModels”, Fourth International Conference on Fuzzy System and Knowledge
Discovery (FSKD 2007).
[34] Tamer Medhat Mohammad Ibrahim (2007), Supra Topological Approach for Decision Making via Granular Computing , Thesis for the degree of Doctor of Philosophy, Tanta University.
[35] The UCI machine learning repository,<http://mlearn.ics.uci.edu/MLRepository.html>.
[36] W. Zhu (2006), “Properties of the Second Type of Covering-Based RoughSets”, Proceedings of the 2006 IEEE/ACM International Conference on WI-
IAT 2006 Workshops.
[37] W. Zhu, Fei-Yue Wang (2003), Reduction and Axiomization of CoveringGeneralized Rough sets, Information Sciences, vol. 152, 217-230.
[38] . Zhu, Fei Wang (2006), “Relationships Among Three Type of CoveringRough Sets”, IEEE GrC, Atlanda, USA, 43-48.
[39] W. Zhu, Fei-Yue Wang (2007), “Topological Properties in Covering-BasedRough sets”, FSKD ’07 Haikou, China, 24-27.
[40] W.Zhu, Fei-Yue Wang (2007), “On Three Type of Covering-Based Roughsets”, IEEE Transactions on Knowledge and Data Mining , Vol.19, No.8.
[41] Wei Wei, Jiye Liang, Yuhua Qian (2008), “Change Mechanism of aDecision Table’s Decision Performance Caused by Attribute Reductions”,Granular Computing, 2008, IEEE Internation Conference, 638 – 643.
[42] Wei-Jiang Liu (2004), “Topological Space Properties of Rough sets”,Proceedings of the Third International Conference on Machine Learningand Cybernetics, Shanghai, 26-29, August 2004.
[43] Xian-Jun Meng, Quing-Cai Chen, Xiao-Long Wang (2009), “A Tolerance
Rough Set Based Sematic Clustering Method for Web Search Results”,
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 86/100
72
Information Technology Journal, Vol. 4, 453-464.
[44] Y.Y. Yao, S.K.M. Wong (1995), “Generalization of Rough Sets Using
Relationships Between Attribute Values”, Proceedings of the 2nd Annual Joint Conference on Information Sciences, 30-33.
[45] Y.Y. Yao, Yan Zhao, Jue Wang (2006), “On Reduct ConstructionAlgorithms, Rough sets and Knowledge Technology”, First InternationalConference, RSKT2006, Proceedings, LNAI 4062, 207-304.
[46] Yuhua Qian, Chuangyin Dang, Jiye Liang, Haiyun Zhang, Jianmin Ma(2008), “On The Valuation of The Decision Performance of an IncompleteDecision Table”, Data & Knowledge Engineering , Vol. 65, 373-400.
[47] Yuhua Qian, Jiye Liang, Chuangyin Dang (2008), “ConverseApproximation and Rule Extraction from Decision Tables in Rough SetTheory”, Computers and Mathematics with Applications, Vol 55, 1754-1765.
[48] Yuhua Qian, Jiye Liang, Deyeu Li, Haiyun Zhang, Chuangyin Dang (2008),“Measures of Evaluating The Decision Performace of a Decision Table inRough Set Theory”, Information Sciences, Vol.178,181 – 202.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 87/100
73
Phụ lục 1: Xây dự ng phần mềm hỗ trợ rút trích luậtquyết định dự a vào lý thuyết tập thô
Hằng năm để nâng cao chất lượ ng giảng dạy tại Đại học Nha Trang, Phòng
Kiểm định chất lượ ng đào tạo của tr ườ ng sẽ phát phiếu khảo sát chất lượ ng của mỗi
môn học đến sinh viên. Biểu mẫu, cũng như nội dung khảo sát đượ c nhà tr ườ ng
thông qua, dựa vào các tiêu chí giáo dục đại học, do nhóm chuyên gia giáo dục đề
xuất. Mỗi một phiếu khảo sát thu về, đượ c Trung tâm Nghiên cứu & Phát triển
Công nghệ phần mềm ĐH Nha Trang (TTNCPTPM) xử lý: nhận dạng và chuyểnqua dữ liệu số (lưu tr ữ dướ i dạng *.mdb). Sau đó, căn cứ vào các tiêu chí đánh giá
(của nhóm chuyên gia đề xuất), phần mềm của TTNCPTPM k ết xuất k ết quả đánh
giá chất lượ ng giảng dạy của giáo viên. Trong các niên học vừa qua, những k ết quả
thu đượ c từ phần mềm của TTNCPTPM đã giúp cho nhà tr ườ ng bướ c đầu phân loại
chất lượ ng giảng dạy của giáo viên.
Trên cơ sở nghiên cứu về lý thuyết tậ p thô, chúng tôi muốn ứng dụng xây
dựng một phần mềm rút trích tậ p luật quyết định từ dữ liệu khảo sát. K ết quả thu
đượ c sẽ là một kênh tham khảo vì đượ c rút trích dựa trên mô hình toán học độc lậ p
vớ i mô hình do nhóm chuyên gia giáo dục đề xuất.
Cơ sở lý thuyết của phần mềm ngoài những thuật toán đã đượ c công bố,
chúng tôi sử dụng các thuật toán mớ i do chúng tôi đề xuất và công bố. Điểm đáng
lưu ý là một số thuật toán ở đây dựa vào lý thuyết tậ p thô mở r ộng dựa vào phủ tậ p
thô.
I. Cơ sở lý thuyết liên quan
a. Hiệu chỉ nh d ữ liệu:
Khi nhận dạng dữ liệu có thể có những mục trong phiếu khảo sát, phần mềm
nhận dạng không thể nhận biết đượ c do lỗi sinh viên đã đánh dấu không chính xác.
Tr ướ c đây, những phiếu có những mục “không rõ” này sẽ đượ c đánh dấu để loại bỏ
khi thống kê. Để xử lý tr ườ ng hợ p này, chúng tôi xem dữ liệu sau định dạng như là
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 88/100
74
một hệ thống thông tin không đầy đủ, và điền giá tr ị thích hợ p theo thuật toán của
nhóm tác giả Dai Dai, Jiangpeng Wang.
b. Rút g ọn t ậ p thuộc tính:
Như đã biết, từ một bảng quyết định có nhiều đối tượ ng, tậ p luật quyết định
rút trích đượ c là r ất lớ n. Để thu gọn tậ p luật quyết định mà không làm mất đi tính
đặc tr ưng của bảng quyết định, một trong những phươ ng án là thu gọn tậ p thuộc
tính. Tuy nhiên, việc rút gọn tậ p thuộc tính cũng dùng để đánh giá sự độc lậ p của
các tiêu chí khảo sát. Nếu số thuộc tính rút gọn càng lớ n, chứng tỏ các tiêu chí của
bảng khảo sát có sự dư thừa bất hợ p lý. Thuật toán đượ c sử dụng trong phần mềmnày trình bày ở chươ ng 3.
c. Rút trích t ậ p luật :
Sinh luật quyết định là một k ết quả quan tr ọng của phần mềm. Thuật toán sử
dụng để sinh luật dựa tiế p cận tính toán hạt của các tác giả Haiyan Yu và Daoping
Wang. Thuật toán đã đượ c công bố và so sánh vớ i các thuật toán rút trích dữ liệu
khác. Tính ưu việt của thuật toán là việc k ết xuất dữ liệu đượ c phân lớ p, tổ hợ p đơ n
giản). Trong phần mềm, chúng tôi còn rút trích luật k ết hợ p vớ i thuật toán apriori
cải biên: apriori_DT do chúng tôi đề xuất. Ngoài ra, phần mềm còn có chức năng
rút gọn tậ p luật k ết hợ p dựa vào thuật toán của Jiye Li.
d. Độ đ o độ chắ c chắ n, độ nhấ t quán, độ hỗ tr ợ của t ậ p luật quyế t định:
Nhằm đánh giá tậ p luật quyết định rút trích đượ c, ngườ i ta dựa vào độ đo độ
chắc chắn, độ nhất quán, độ hỗ tr ợ . Phần mềm đã sử dụng hệ độ đo do trình bày ở
chươ ng 4.
e. Tìm độ k của các phụ thuộc hàm xấ p xỉ
Tậ p luật quyết định, thể hiện mối quan hệ các tiêu chí đánh giá vớ i thuộc tính
quyết định (thuộc tính phân loại). Tậ p luật này là khá lớ n. Nhưng đáng lưu ý là tậ p
luật này không thể hiện mối quan hệ giữa các tiêu chí đánh giá. Việc nhận biệt mối
quan hệ giữa những tiêu chí đánh giá này khá quan tr ọng, hỗ tr ợ cho việc xây dựng,
bổ sung, hay loại bỏ các tiêu chí thích hợ p. Như đã biết, việc rút trích tất cả các phụ
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 89/100
75
thuộc này là bài toán NP-đầy đủ. Vì vậy, đôi khi ngườ i ta chỉ cần xác định độ k của
một phụ thuộc hàm xấ p xỉ ứng vớ i hai tậ p thuộc tính cho tr ướ c. Ở đây, phần mềm
chúng tôi có xây dựng chức năng cho phép chọn các thuộc tính cho tr ướ c này và
tính độ k của phụ thuộc hàm xấ p xỉ của hai thuộc tính đó.
Có thể tóm tắt những chức năng chính và thuật toán liên quan theo sơ đồ sau:
É
ð
Hình PL1 S ơ đồ chứ c nă ng và thuật toán xử lý d ữ liệu d ạ y & học t ại Đ H Nha Trang
Rút gọn tập thuộc tínhThuật toán của
Ng Đứ c Thuần, Ng X. Huy
Rút trích luật q.địnhThuật toán của
Haiyan Yu và Daoping Wang
Đánh giá tập luậtThuật toán của
Ng Đứ c Thuần, Ng X. Huy
Kiể m tra tính
độc l ậ p các tiêuchí khảo sát
Độ tin cậ y của
t ậ p luật
Hiệu chỉ nh tiêuchí khảo sát
(I)
(II)
Rút trích luật k ết hợ pThuật toán Apriori
cải biên
Cung cấ p tri thức về chất lượ ng dạy và học
Phiếu khảo sátđượ c thu hồi sau khisinh viên đánh giá
TTNC & PTCNPMnhận dạng và chuyển thành dữ
liệu số (*.mdb)
Đánh giá dự vào phươ ng pháp docác chuyên gia giáo dục đề xuất(Phần mềm TTNC&PTPM)
Hiệu chỉnh dữ liệuThuật toán của
Dai Dai, Jiangpeng Wang
(I)
Xác định độ k của cácphụ thuộc xấp xỉ
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 90/100
76
II. Một số k ết quả đạt đượ c
Phần mềm RSEdu ver 1.0 chúng tôi đã thử nghiệm trên số liệu khảo sát của
nhà tr ườ ng thu đượ c trong các niên học: - Phần mềm đã cho các k ết quả thực
nghiệm như sau:
Nội dung K ết quả
Số lượ ng bản ghi xử lý 13.434
Số lượ ng bản ghi đượ c hiệu chỉnh 1.734
Số lượ ng thuộc tính đượ c rút gọn 0
Số lượ ng luật quyết định rút trích 717.271
Đánh giá tậ p luật Màn hình minh họa
Một số màn hình k ết quả : Màn hình giao diện, Một số luật rút trích, Đồ thị
thể hiện các độ đo
Hình PL2-Giao diện của chươ ng trình
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 91/100
77
Hình PL3- Biểu đồ minh họa độ đo ta(.) và các độ đo cổ điển
Hình PL4- Biểu đồ minh họa độ đo tb(.) và các độ đo cổ điển
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 92/100
78
Hình PL5- Chức năng tính phụ thuộc độ k
Hình PL6- Chức năng rút trích tậ p luật
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 93/100
79
Hình PL7- Một k ết quả rút trích tậ p luật trên csdl
Thông tin dạy và học của Đ.H Nha Trang (vớ i 13.434 bản ghi)
M ột số k ế t quả ứ ng d ụng độ đ o độ chắ c chắ n, độ nhấ t quán, độ hỗ tr ợ :chươ ng 3)
Id Tiêu chí123456789
101112131415
16
GV truyền đạt rõ ràng, dễ hiểuGV thườ ng nêu vấn đề để SV suy ngh ĩ , trao đổiGV quan tâm tổ chức các hoạt động phát triển tư duy sáng tạo của SVGV có kiến thức sâu r ộng và cậ p nhậtGV sử dụng hiệu quả các phươ ng tiện dạy học (bảng viết, đèn chiếu,…)GV thực hiện đúng giờ lên lớ p và k ế hoạch giảng dạyGV có tác phong và cách ứng xử chuẩn mựcGV cho điểm công bằng, phản ánh đúng năng lực của SVGV nhiệt tình và có trách nhiệm trong giảng dạy
GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảoCảm thấy hứng thú trong giờ học Nắm đượ c mục đích, yêu cầu của học phần Nhận đượ c nhiều kiến thức bổ ích từ học phầnĐượ c GV giải thích đầy đủ và rõ ràng các thắc mắcĐượ c phát triển những k ỹ năng tổng quát (k ỹ năng học tậ p, giao tiế p, trình bày, làmviệc nhóm,...)Xế p loại
Bảng PL1: Danh sách các thuộc tính trong bảng quyết định của bài toán
Xủ lý Thông Tin Dạy & Học tại ĐHNT
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 94/100
80
Cơ sở dữ liệu của bài toán của bài toán có danh sách các tiêu chí tươ ng ứng
vớ i các thuộc tính từ 1 đến 15, và thuộc tính quyết định (16) Bảng PL1.
Hệ độ đo đượ c đề xuất trong chươ ng 3, đượ c ứng dụng đánh giá hiệu năng
quyết định của một bộ tiêu chí (tuỳ chọn bất k ỳ) lên thuộc tính quyết định (tuỳ
chọn) xế p loại của giáo viên. Để minh hoạ, trong phần này trình bày một k ết quả đo
hiệu năng quyết định giữa hai tậ p luật, một bao gồm tậ p thuộc tính thứ nhấ t gồm
các tiêu chí:
· GV truyền đạt rõ ràng, dễ hiểu
· GV có tác phong và cách ứng xử chuẩn mực
· GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo
và tậ p luật thứ hai gồm t ậ p thuộc tính thứ hai có các tiêu chí:
· GV truyền đạt rõ ràng, dễ hiểu
· GV thườ ng nêu vấn đề để SV suy ngh ĩ , trao đổi
· GV quan tâm tổ chức các hoạt động phát triển tư duy sáng tạo của SV
và tiêu chí quyết định là hiệu quả tiế p thu tri thức của sinh viên, cụ thể là
thuộc tính:
· Nhận đượ c nhiều kiến thức bổ ích từ học phần
Các k ết quả đánh giá tươ ng ứng cho hai tậ p thuộc tính đượ c trình bày lần
lượ t trong hình PL8, PL9:
Độ đo Tậ p thuộc tính điều kiện thứ nhất Tậ p thuộc tính điều kiện thứ hai
τα 0,414 0,418
τβ 0,218 0,225
γ 0,048 0,024
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 95/100
81
Hình PL8 : - K ết quả khảo sát hiệu năng quyết định vớ i tậ p thuộc tính thứ nhất
Hình PL9 : - K ết quả khảo sát hiệu năng quyết định vớ i tậ p thuộc tính thứ hai
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 96/100
82
K ế t quả rút trích luật k ế t hợ p:
Việc ứng dụng trên csdl bài toán KSCLGV ĐHNT nhằm mục tiêu khai thác
các luật k ết hợ p mạnh và có độ tin cậy cao trong toàn bộ dữ liệu. Trong khai thác
thực nghiệm, các ngưỡ ng hỗ tr ợ tối thiểu = 30% và ngưỡ ng tin cậy tối thiểu = 81%
đượ c lựa chọn. Vớ i các ngưỡ ng tối thiểu xác định tr ướ c, thuật toán khai thác luật
k ết hợ p Apriori DT đượ c thực thi bằng chươ ng trình RSedu v1.0. K ết quả thu đượ c
25 luật.
Thực nghiệm này không áp d ụng khuôn mẫ u luật trong quá trình khai thác
nhằm đem lại một cái nhìn toàn diện về các tri thức trên toàn bộ cơ sở dữ liệu phânloại giảng viên.
Id. Luật k ết hợ p Support(%) C
1If GV truyền đạt rõ ràng, dễ hiểu = Đồng ý then GV có tác phong và cáchứng xử chuẩn mực = Đồng ý
33,19481 81,66019
2If GV sử dụng hiệu quả các phươ ng tiện dạy học (bảng viết, đèn chiếu,…) =
Đồng ý then GV thực hiện đúng giờ lên lớ p và k ế hoạch giảng dạy = Đồng ý33,34441 81,86084
3If GV cho điểm công bằng, phản ánh đúng năng lực của SV = Đồng ý thenGV có tác phong và cách ứng xử chuẩn mực = Đồng ý 41,72207 83,45802
4If GV nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phong và cách ứng xử chuẩn mực = Đồng ý
54,18052 84,12698
5If Đượ c GV giải thích đầy đủ và rõ ràng các thắc mắc = Đồng ý then GV cótác phong và cách ứng xử chuẩn mực = Đồng ý
35,65492 83,09123
6If Xế p loại = Giỏi then GV có tác phong và cách ứng xử chuẩn mực = Đồngý 30,8012 89,19374
7 If Xế p loại = Giỏi then GV nhiệt tình và có trách nhiệm trong giảng dạy =Đồng ý
30,97573 89,69916
8If GV có kiến thức sâu r ộng và cậ p nhật = Đồng ý and GV thực hiện đúnggiờ lên lớ p và k ế hoạch giảng dạy = Đồng ý then GV có tác phong và cách
ứng xử chuẩn mực = Đồng ý
30,39395 82,71884
9If GV có kiến thức sâu r ộng và cậ p nhật = Đồng ý and GV nhiệt tình và cótrách nhiệm trong giảng dạy = Đồng ý then GV có tác phong và cách ứng xử chuẩn mực = Đồng ý
30,14461 85,60302
10If GV thực hiện đúng giờ lên lớ p và k ế hoạch giảng dạy = Đồng ý and GVcho điểm công bằng, phản ánh đúng năng lực của SV = Đồng ý then GV cótác phong và cách ứng xử chuẩn mực = Đồng ý
34,04225 86,0685
11If GV có tác phong và cách ứng xử chuẩn mực = Đồng ý and GV cho điểmcông bằng, phản ánh đúng năng lực của SV = Đồng ý then GV thực hiệnđúng giờ lên lớ p và k ế hoạch giảng dạy = Đồng ý
34,04225 81,59363
12
If GV thực hiện đúng giờ lên lớ p và k ế hoạch giảng dạy = Đồng ý and GV
nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phongvà cách ứng xử chuẩn mực = Đồng ý 45.07148 86,67093
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 97/100
83
13If GV có tác phong và cách ứng xử chuẩn mực = Đồng ý and GV nhiệt tìnhvà có trách nhiệm trong giảng dạy = Đồng ý then GV thực hiện đúng giờ lênlớ p và k ế hoạch giảng dạy = Đồng ý
45,07148 83,18761
14If GV cho điểm công bằng, phản ánh đúng năng lực của SV = Đồng ý andGV nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV thực hiệnđúng giờ lên lớ p và k ế hoạch giảng dạy = Đồng ý
31,27493 81,23921
15If GV cho điểm công bằng, phản ánh đúng năng lực của SV = Đồng ý andGV nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phong và cách ứng xử chuẩn mực = Đồng ý
33,55219 87,15458
16If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV thực hiện đúng giờ lên lớ p và k ế hoạch giảng dạy = Đồng ý then GV cótác phong và cách ứng xử chuẩn mực = Đồng ý
38,12334 82,75302
17If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV có tác phong và cách ứng xử chuẩn mực = Đồng ý then GV thực hiệnđúng giờ lên lớ p và k ế hoạch giảng dạy = Đồng ý
38,12334 82,24852
18If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV thực hiệnđúng giờ lên lớ p và k ế hoạch giảng dạy = Đồng ý
35,85439 81,15124
19If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phong và cách ứng xử chuẩn mực = Đồng ý
37,37533 84,59368
20If Cảm thấy hứng thú trong giờ học = Tươ ng đối đồng ý and GV có tác phong và cách ứng xử chuẩn mực = Đồng ý then GV thực hiện đúng giờ lênlớ p và k ế hoạch giảng dạy = Đồng ý
30,66822 81,61911
21If Đượ c GV giải thích đầy đủ và rõ ràng các thắc mắc = Đồng ý and GV cótác phong và cách ứng xử chuẩn mực = Đồng ý then GV nhiệt tình và có
trách nhiệm trong giảng dạy = Đồng ý
30,04488 84,26573
22If Đượ c GV giải thích đầy đủ và rõ ràng các thắc mắc = Đồng ý and GVnhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phongvà cách ứng xử chuẩn mực = Đồng ý
30,04488 86,69065
23
If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV thực hiện đúng giờ lên lớ p và k ế hoạch giảng dạy = Đồng ý and GV cótác phong và cách ứng xử chuẩn mực = Đồng ý then GV nhiệt tình và cótrách nhiệm trong giảng dạy = Đồng ý
31,19182 81,81818
24
If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV thực hiện đúng giờ lên lớ p và k ế hoạch giảng dạy = Đồng ý and GV nhiệttình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phong vàcách ứng xử chuẩn mực = Đồng ý
31,19182 86,99583
25
If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV có tác phong và cách ứng xử chuẩn mực = Đồng ý and GV nhiệt tình vàcó trách nhiệm trong giảng dạy = Đồng ý then GV thực hiện đúng giờ lên lớ pvà k ế hoạch giảng dạy = Đồng ý
31,19182 83,45564
Bảng PL2: Tậ p luật k ết hợ p khai thác trên cơ sở dữ liệu bài toán
Xử lý thông tin tại ĐHNT
Tuy nhiên, những k ết quả này không sử dụng tr ực tiế p các k ết quả của luận
án do chúng tôi phát hiện hoặc xây dựng, nên chúng tôi không trình bày chi tiết.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 98/100
84
III. K ết Luận
Đây là phần mềm ứng dụng, ngoài chức năng hỗ tr ợ việc đánh giá khảo sát
chất lượ ng giảng viên tại Đại học Nha Trang. Phần mềm cũng là k ết quả minh họa
cho những k ết quả nghiên cứu mở r ộng tậ p thô của nhóm chúng tôi. K ết quả thực
nghiệm cho thấy r ằng, các tiêu chí của bảng khảo sát chất lượ ng giảng viên độc lậ p;
ngoài ra tậ p luật quyết định bướ c đầu cho thấy những tiêu chí quan tr ọng ảnh hưở ng
đến việc phân loại giảng viên. Do phần mềm mớ i hoàn thiện, nên thờ i gian tớ i
chúng tôi sẽ nhờ các chuyên gia giáo dục học đánh giá và phản biện. Chúng tôi xin
mạnh dạn đánh giá các ưu nhượ c điểm của phần mềm như sau:Ư u đ iể m
- Đáp ứng nhu cầu thực nghiệm chính xác các k ết quả nghiên cứu lý thuyết
trên tậ p thô
- Giao diện chươ ng trình thân thiện
- Sử dụng k ỹ thuật lậ p trình Hướ ng đối tượ ng, các giải thuật đều đượ c viết
dướ i dạng các Lớ p và có thể biên dịch thành những thư viên liên k ết động (dll)nhằm mục đích cậ p nhật, nâng cấ p mở r ộng và sử dụng lại.
- Cấu hình liên k ết vớ i hệ quản tr ị csdl SQL 2005 thông qua tậ p tin XML; giúp
việc chỉnh sửa thông tin k ết nối tr ực quan và dễ dàng.
Nhượ c đ iể m
Bộ luật sinh ra cần tinh chỉnh để tối ưu về mặt số lượ ng.
Dữ liệu thủ nghiệm còn bé H ướ ng cải tiế n
Cải thiện các giải thuật tìm kiếm trên hệ thông tin lớ n nhằm tối ưu hóa tốc độ
Thêm chức năng cấu hình csdl cho phép thao tác trên csdl mẫu bất k ỳ
Tiế p tục mở r ộng để chươ ng trình tr ở thành một phần mềm thực nghiệm các
lý thuyết mớ i về tậ p thô.
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 99/100
85
Phụ lục 2: Phiếu thu thập thông tin dạy và học
(Do Phòng kiể m định chấ t l ượ ng giáo d ục Đ.H Nha Trang soạn thảo)
5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com
http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 100/100
BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜ NG ĐẠI HỌC NHA TRANG
PHIẾU THU THẬP THÔNG TIN DẠY & HỌC
(Dùng để lấy ý kiến sinh viên về giảng dạy học phần)
Tên học phần (HP): Học kỳ: Năm học:
Lớ p (của anh/chị): Khoa:
Họ và tên Giảng viên:
(Chú ý: SV không cần ghi tên của mình trong phiếu này, tô kín ô tròn đượ c lựa chọn)
I. THÔNG TIN VỀ BẢN THÂN
1. Giớ i tính: ○ Nam ○ N ữ
2. Tự đánh giá về mức độ tiếp thu của anh/chị đối vớ i HP này: ○ T ố t ○ Trung bình ○ Y ế u
3. Xếp loại học lực của anh/chị trong học kỳ vừa qua (nếu có): ○ Giỏi ○ Khá ○ Trung bình khá ○ Trung bình ○ Y ế u
4. Tỷ lệ thờ i gian tham dự lớ p học của anh/chị đối vớ i HP này: ○ X ấ p xỉ 100% ○ T ố i thiể u 80% ○ Dướ i 80%
5. Đối vớ i HP này, anh/chị thuộc diện: ○ H ọc lần 1 ○ H ọc lại
II. THÔNG TIN VỀ DẠY VÀ HỌC
Đ: Đồng ý TĐĐ: Tươ ng đối đồng ý KĐ: Không đồng ý N: Không có ý kiến
STT L ĩ nh vự c 1: Hoạt động giảng dạy Đ TĐĐ KĐ N
1 GV có phươ ng pháp truyền đạt tốt ○ ○ ○ ○ 2 GV thườ ng nêu vấn đề để SV suy ngh ĩ , trao đổi ○ ○ ○ ○ 3 GV quan tâm tổ chức các hoạt động nhóm sinh viên ○ ○ ○ ○ 4 GV quan tâm phát triển khả năng diễn đạt, tranh luận của SV ○ ○ ○ ○ 5 GV dạy kết hợ p vớ i giáo dục nhân cách, đạo đức ○ ○ ○ ○ 6 GV sử dụng hiệu quả các phươ ng tiện dạy học (bảng, đèn chiếu, mô hình,…) ○ ○ ○ ○ 7 GV thực hiện tốt thờ i gian lên lớ p và kế hoạch giảng dạy ○ ○ ○ ○ 8 GV tổ chức kiểm tra theo đúng Đề cươ ng chi tiết môn học ○ ○ ○ ○ 9 GV đưa ra lượ ng bài tập, thực hành hợ p lý ○ ○ ○ ○ 10 GV có hoặc giớ i thiệu giáo trình, bài giảng, tài liệu tham khảo tốt ○ ○ ○ ○
L ĩ nh vự c 2: Cảm nhận của bản thân Đ TĐĐ KĐ N
11 Cảm thấy hứng thú trong giờ học ○ ○ ○ ○ 12 Nắm đượ c mục đích, yêu cầu của học phần
○
○
○
○
13 Nhận đượ c nhiều kiến thức bổ ích từ học phần ○ ○ ○ ○ 14 Có đủ thông tin về kế hoạch giảng dạy và các tiêu chí đánh giá của học phần ○ ○ ○ ○ 15 Đượ c phát triển những kỹ năng tổng quát (kỹ năng học tập, giao tiếp, trình
bày, làm việc nhóm,...)○ ○ ○ ○
L ĩ nh vự c 3: Cơ sở vật chất phục vụ dạy và học Đ TĐĐ KĐ N
16 SV dễ dàng tiếp cận tài liệu học tập và tham khảo đượ c GV giớ i thiệu ○ ○ ○ ○ 17 Thư viện nhà trườ ng có đủ tài liệu tham khảo đối vớ i học phần ○ ○ ○ ○ 18 Phòng học có đủ các thiết bị hỗ trợ cần thiết cho giảng dạy ○ ○ ○ ○ 19 Phòng học đảm bảo yêu cầu về chỗ ngồi ○ ○ ○ ○ 20 Phòng học đảm bảo yêu cầu về ánh sáng, độ thông thoáng ○ ○ ○ ○
III. Ý KIẾN KHÁC1. Cảm nhận chung của anh/chị về chất lượ ng giảng dạy học phần này tại lớ p của anh/chị:
○ Rấ t t ố t ○ T ố t ○ Trung bình ○ Không t ố t
2. Theo anh/chị, để nâng cao hơ n nữa chất lượ ng của học phần này thì GV và Nhà trườ ng cần làm những gì?
2a. Góp ý cho GV:
2b. Góp ý cho Nhà trườ ng:
M u NXGD2/07