luan an ly thuyet tap tho

100
  B GIÁO D#C VÀ %ÀO T&O VI(  N KHOA H*C VÀ CÔNG NGH( VI(T NAM VIN CÔNG NGH THÔNG TIN NGUY#N %& C THU)N PH+ T.P THÔ %/ %O %ÁNH GIÁ HIU N1NG T.P LU.T QUY3T %5NH LU.N ÁN TI3N S7 TOÁN H9C N/I - 2010 

Upload: go-green

Post on 11-Jul-2015

413 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 1/100

 

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆ N KHOA HỌC

VÀ CÔNG NGHỆ VIỆT NAM

VIỆN CÔNG NGHỆ THÔNG TIN

NGUYỄN ĐỨ C THUẦN

PHỦ TẬP THÔVÀ ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG

TẬP LUẬT QUYẾT ĐỊNH

LUẬN ÁN TIẾN SĨ TOÁN HỌC

HÀ NỘI - 2010 

Page 2: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 2/100

 

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆ N KHOA HỌC

VÀ CÔNG NGHỆ VIỆT NAM

VIỆN CÔNG NGHỆ THÔNG TIN

NGUYỄN ĐỨ C THUẦN

PHỦ TẬP THÔ VÀĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG

TẬP LUẬT QUYẾT ĐỊNH

Chuyên ngành: BẢO ĐẢM TOÁN HỌC CHO MÁY TÍNHVÀ HỆ THỐNG TÍNH TOÁN

Mã số: 62.46.35.01

LUẬ N ÁN TIẾ N SĨ TOÁN HỌC

 NGƯỜI HƯỚ NG DẪ N KHOA HỌC:

1. PGS.TSKH NGUYỄ N XUÂN HUY2. PGS.TS LÊ HẢI KHÔI

HÀ NỘI - 2010 

Page 3: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 3/100

 

 

LỜI CÁM Ơ N

Không thể nói hết bằng lờ i lòng biết ơ n sâu sắc của tác giả đến ngườ i thầy

hướ ng dẫn PGS.TSKH Nguyễn Xuân Huy, ngườ i đã hướ ng dẫn và động viên tác giả 

vượ t qua những khó khăn trong học thuật để có đượ c k ết quả này. Từ thầy, tác giả đã

học đượ c nhiều điều quí giá trong nghiên cứu khoa học, trong giảng dạy và ứng xử đờ i

thườ ng. Tác giả cũng nhận đượ c sự trao đổi chuyên môn, định hướ ng ban đầu của

PGS.TS Lê Hải Khôi về nội dung luận án. Kính xin ghi nhận tất cả những đặc ân đó

của Quý Thầy.

Tác giả xin cám ơ n Viện Công nghệ Thông tin, Tr ườ ng Đại học Nha Trang đã

giúp đỡ và tạo điều kiện thuận lợ i cho tác giả trong suốt thờ i gian học tậ p và nghiên

cứu. Tác giả xin cám ơ n PGS.TS Vũ Đức Thi, PGS.TS Đoàn Văn Ban, TS. Nguyễn

Thanh Tùng, TS. Tr ần Thái Sơ n, TS. Đỗ Văn Thành đã có nhiều ý kiến đóng góp quý

 báu để tác giả hoàn thiện luận án.

Tác giả xin chân thành cám ơ n sự giúp đỡ về mặt chuyên môn cũng như tình

cảm chân thành, những lờ i động viên quý báu của Quý Thầy Cô cùng các đồng nghiệ p

thuộc Khoa Công nghệ Thông Tin-Tr ườ ng Đại học Nha trang, Khoa Công nghệ Thông

tin-Tr ườ ng Đại học Khoa học Huế. Xin cám ơ n sự hỗ tr ợ  tinh thần của những ngườ i bạn lớ  p 12C1-Nguyễn Huệ- Huế, lớ  p Toán K5-ĐH Tổng hợ  p Huế. Đặc biệt, xin cám

ơ n anh Đào Văn Tuyết, là ngườ i anh, ngườ i bạn đồng hành trong thờ i gian nghiên cứu

sinh, đã có những chia sẻ về kinh nghiệm và chuyên môn quý báu.

Xin cám ơ n tất cả mọi ngườ i đã hỗ tr ợ cho tác giả hoàn thành luận án này!

Page 4: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 4/100

 

 

Kính dâng lên Ba m ẹ ,

ng ườ i  đ  ã sinh thành và nuôi d ưỡ ng 

 để con có ngày hôm nay.

Thân t  ặ ng v ợ , và hai con,

nh ữ ng ng ườ i  đ  ã chia s ẻ m ọ i khó kh  ă n,

là ch ỗ d ự  a v ữ ng ch  ắ c v ề tinh th  ầ n 

và v  ậ t ch  ấ t trong su ố t c  ả cu ộ c  đờ i.

Page 5: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 5/100

 

 

LỜI CAM ĐOAN

Tác giả xin khẳng định tất cả các k ết quả đượ c trình bày trong luận án là

của riêng tác giả, không sao chép từ bất k ỳ một công trình nào khác. Nếu có điều

gì không trung thực, tác giả xin chịu hoàn toàn trách nhiệm.

Tác giả 

 Nguyễn Đức Thuần

Page 6: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 6/100

 

i

Mục lục

Mục lục i 

Danh mục các thuật ngữ  iv

Bảng các ký hiệu vi 

Danh sách bảng và hình vẽ  viii

Mở  đầu 1

Chươ ng 1 CÁC KHÁI NIỆM CƠ BẢN ............................................................. 7 

1.1 Hệ thống thông tin và tậ p thô .................................................................................... 7

1.1.1 Hệ thống thông tin .................................................................................... 7

1.1.2 Quan hệ không phân biệt đượ c .................................................................. 7

1.1.3 Tậ  p thô ..................................................................................................... 9

1.1.4 Các tính chất của xấ p xỉ ...........................................................................10

1.1.5 Độ chính xác của xấ p xỉ...........................................................................11

1.1.6 Bảng quyết định .......................................................................................111.1.7 Rút gọn và nhân .......................................................................................13

1.1.8 Ma tr ận phân biệt đượ c và hàm phân biệt đượ c ........................................13

1.1.9 Luật quyết định ........................................................................................14

1.1.10Phụ thuộc độ k .........................................................................................14

1.2 Phủ tậ p thô .............................................................................................................. 15

1.2.1 Phủ và không gian xấ p xỉ phủ ..................................................................15

1.2.2 Thuật toán tìm rút gọn của một phủ .........................................................16

1.2.3 Các phép xấ p xỉ dựa vào phủ tậ p thô ........................................................17

1.2.4 Phép xấ p xỉ phủ tậ p thô loại 1 ..................................................................17

1.2.5 Phép xấ p xỉ phủ tậ p thô loại 2 ..................................................................18

1.2.6 Phép xấ p xỉ phủ tậ p thô loại 3 ..................................................................18

1.3 Ánh xạ đóng ............................................................................................................ 19

1.4 Không gian topo ...................................................................................................... 19

Page 7: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 7/100

 

ii

1.5 K ết luận Chươ ng 1 .................................................................................................. 20

Chươ ng 2 PHỦ TẬP THÔ ................................................................................21 

2.1 Tính chất của xấ p xỉ phủ loại 1, 2, 3 ....................................................................... 22

2.1.1 Xấ p xỉ phủ tậ p thô loại 1 ..........................................................................22

2.1.2 Xấ p xỉ phủ tậ p thô loại 2 ..........................................................................23

2.1.3 Xấ p xỉ phủ tậ p thô loại 3 ..........................................................................25

2.2 Mối quan hệ giữa ba loại phủ tậ p thô...................................................................... 26

2.3 Một số tính chất về xấ p xỉ phủ loại 2 ...................................................................... 26

2.4 Tính chất ánh xạ đóng của ba phép xấ p xỉ trên dựa vào phủ.................................. 27

2.4.1 Tính chất ánh xạ đóng của ba phép xấ p xỉ phủ trên ứng vớ i phủ đơ n vị....28

2.4.2 Tính chất ánh xạ đóng của ba phép xấ p xỉ phủ trên ứng vớ i phủ tựa điểm 28

2.4.3 Tính chất ánh xạ đóng của ba phép xấ p xỉ phủ trên ứng vớ i nửa thu gọn ..29

2.5 Mối quan hệ giữa các phép xấ p xỉ phủ dựa vào không gian topo .......................... 30

2.5.1 Quan hệ hai ngôi và không gian topo .......................................................30

2.5.2 Mối quan hệ giữa các xấ p xỉ dựa vào không gian topo .............................31

2.6 Rút gọn tậ p thuộc tính dựa vào họ phủ tậ p thô ....................................................... 352.6.1 Một số khái niệm và k ết quả cơ sở ...........................................................37

2.6.2 Rút gọn tậ p thuộc tính các hệ thống quyết định nhất quán và không nhất

quán ................................................................................................................38

2.6.3 Một số k ết quả liên quan giữa họ phủ và phủ suy dẫn ..............................39

2.7 Thuật toán FC_Reduct rút gọn tậ p thuộc tính dựa vào họ phủ tậ p thô ................... 41

2.7.1 Thuật toán FC_Reduct rút gọn thuộc tính của họ quyết định phủ tậ p thô ..43

2.7.2 Đánh giá độ phức tạ p thuật toán FC_Reduct ............................................44

2.8 Ứ ng dụng thuật toán FC_Reduct cho bài toán xử lý thông tin dạy và học tại Đ.H

 Nha Trang ...................................................................................................................... 48

2.8.1 Giớ i thiệu bài toán ...................................................................................48

2.8.2 Ứ ng dụng thuật toán FC_Reduct rút gọn tậ p thuộc tính ............................49

2.9 K ết luận chươ ng 2 ................................................................................................... 50

Chươ ng 3 ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂNG TẬP LUẬT QUYẾT ĐỊNH ......51 

Page 8: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 8/100

 

iiii

3.1 Hạn chế của các độ đo cổ điển trên các bảng quyết định ....................................... 51

3.2 Độ đo hiệu năng của tậ p luật quyết định của Yuhua Qian và cộng sự ................... 54

3.3 Đề xuất độ đo hiệu năng của tậ p luật quyết định .................................................... 55

3.4 Ứ ng dụng hệ độ đo cho bài toán xử lý thông tin dạy và học tại Đ.H Nha Trang 64

3.5 K ết luận chươ ng 3 ................................................................................................... 64

K ết luận....................................................................................................................6

Danh mục công trình đã công bố ........................................................................67

Tài liệu tham khảo ..............................................................................................6

Phụ lục 1 ...............................................................................................................7

Phụ lục 2 ...............................................................................................................8 

Page 9: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 9/100

 

 

iv

DANH MỤC THUẬT NGỮ 

(phủ ) Đơ n vị Unary

(phủ ) N ử a thu g ọn Semi reduct 

(phủ ) T ự a đ iể m Pointwise-covered 

 Ánh xạ đ óng Closure mapping 

 Bảng quyế t định Decsion table

 Bao đ óng của một t ậ  p A Closure of a sub

C-miề n khẳ ng định d ươ ng của D C-positive region of DC ơ sở  , tiề n cơ sở  Base, subbase

 Độ chính xác của xấ  p xỉ  Accuracy of approximation

 Độ đ o độ chắ c chắ n Certainty measure

 Độ hỗ tr ợ  Support measure

 Độ nhấ t quán Consistency measure

 H ệ quyế t định nhấ t quán Consistent decision system

 H ệ quyế t định nhấ t quán ng ượ c Conversely consistent decision system

 H ệ quyế t định phủ không nhấ t quán  Inconsistent covering decision system

 H ệ thố ng thông tin Information system

 H ệ thố ng thông tin không đầ y đủ Incomplete information system

 H ọ phủ t ậ  p thô Family of covering rough

 Khai thác d ữ liệu vă n bản Text mining 

  Không gian topo Topologi

 Không gian xấ  p xỉ phủ Covering approximation space

 Láng giề ng phải Right neighborhood 

 Láng giề ng trái Left neighborhood 

 Luật quyế t định Decision rule

 Luật quyế t định ng ượ c Inverse decision rule

 Lý thuyế t t ậ p mờ  Fuzzy set theory

 Lý thuyế t t ậ  p thô Rough

Page 10: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 10/100

 

 

v

Ma tr ận phân biệt đượ c Discernibility matrix

Mô t ả t ố i thiể u Minimal description

 Phân hoạch Partition

 Phân tích khái niệm hình thứ c Formal concept analysis

 Phần trong của t ậ  p A Interior of a sub

 Phép xấ  p xỉ d ướ i/trên Lower/Upper approximation

 Phép xấ  p xỉ phủ d ướ i/trên Covering lower/upper approximation

 Phủ Covering 

 Phủ suy d ẫ n Induced Cover 

 Phủ t ậ  p thô Coverin

Quan hệ B-không phân biệt đượ c B-indiscernibility relation

Quan hệ dung sai Tolerance relation

Quan hệ hai ngôi Binary relation

Quan hệ phản xạ Reflexive relation

Quan hệ t ươ ng đươ ng Equivalence relation

Quan hệ t ươ ng t ự  Similarity relationT ậ p đ óng Closed set 

T ậ p mở  Open set 

T ậ p thươ ng Quotient set 

T ậ p vũ tr ụ / t ậ p phổ d ụng Universe

Tính đồng biế n Monotone

Tính l ũ y đẳ ng Idempotency

Tính phản xạ (của ánh xạ đ óng) Extension

Tính toán hat Granular computing 

Y phụ thuộc độ k vào X Y depends on X in degree k 

Page 11: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 11/100

 

 

vi

BẢNG KÝ HIỆU

 Ký hiệu Ý nghĩ a trang p   quan hệ bộ phận trên họ {U/B|BÍA} 9

 RX  R- xấ p xỉ dướ i của tậ p X 9

 RX  R-xấ p xỉ trên của tậ p X 9

k  X Y  ¾¾®  tậ p thuộc tính Y phụ thuộc độ k vào tậ p thuộc

tính X  14

( )a T    độ đo độ chắc chắn do Yuhua Qian đề xuất 54

( )b  T    độ đo độ nhất quán do Yuhua Qian đề xuất 55

( )g  T    độ đo độ hỗ tr ợ do Yuhua Qian đề xuất 55

( )ta T    độ đo độ chắc chắn do luận án đề xuất 55

( )tb  T    độ đo độ nhất quán do luận án đề xuất 55

m(Z ij ) độ chắc chắn của luật quyết định Z ij  14

a B(X)

đại lượ ng đo sự chính xác của tậ p xấ p xỉ X đối

vớ i phân hoạch trên B ( R = IND( B)) 11

b  P  cơ sở của không gian topo (U , t ) đượ c xây dựng

từ tậ p quan hệ hai ngôi P  31

(U, R) không gian xấ p xỉ xác định bở i quan hệ hai ngôi R  30

(X,t  ) không gian topo xác định bở i topo t và tậ p X   20

[u]B lớ  p tươ ng đươ ng của u trong quan hệ IND( B) 8~

 A  bao đóng của tậ p A  20~X, X C    phần bù của tậ p X   32

 A0 , Int(A)  phần trong của tậ p A  20

aC (U/D)độ đo độ chắc chắn ( Pawlak ) của bảng quyết

định T = (U ,C È D)52

 BN  B(X) B-miền biên của X   9

C C (D) độ đo độ nhất quán (Pawlak) của T = (U ,C È D) 54

Page 12: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 12/100

 

 

vii

 FL(X),SL(X),TL(X) xấ p xỉ phủ dướ i loại 1, 2, 3 ( K.hiệu chung CL(X))  17 

CORE(C) nhân của tậ p thuộc tính điều kiện C   13

des(X i )mô tả của lớ  p tươ ng đươ ng X i (điều kiện đặc

tr ưng của lớ  p X i)14

 FH(X)( FH C (X)) xấ p xỉ phủ trên loại 1 ( sinh bở i phủ C ) của X 17 

IND( B) quan hệ B-không phân biệt đượ c 8

l  R(x) láng giềng trái của x  30

M( T  ) ma tr ận phân biệt đượ c của T  13

Md(x) mô tả tối thiểu của x  15 NEG B(X) B-miền âm của X   9

 P (U) tậ p tất cả các tậ p con của U   17 

 POS  B(D) B-miền khẳng định dươ ng của D  10

 POS  B(X) B-vùng dươ ng của X   9

 RED(C) tậ p tất cả rút gọn của C   13

reduct(C) rút gọn của tậ p thuộc tính C   16 

r  R(x) láng giềng phải của x 30

S = (U , A) hệ thống thông tin 7 

 s(Z ij ) độ hỗ tr ợ của luật quyết định Z ij  14

SH(X)(SH C (X)) xấ p xỉ phủ trên loại 2 ( sinh bở i phủ C ) của X 17 

T = (U, C È  D)  bảng quyết định 12

TH(X)(TH C (X)) xấ p xỉ phủ trên loại 1 ( sinh bở i phủ C ) của X 17 

u(a) giá tr ị của đối tượ ng u ứng vớ i thuộc tính a  13

U/IND(B), U/Btậ p thươ ng xác định bở i quan hệ tươ ng đươ ng

IND( B)8

 Z ij:des(X i )®  des(Y  j ) luật quyết định xác định bở i X i , Y  j  14

 X + , X + Các phép xấ p xỉ dướ i, trên tậ p X định ngh ĩ a trên

không gian topo của W.Zhu31

Page 13: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 13/100

 

 

viii

C + X, C + X Các phép xấ p xỉ dướ i, trên tậ p X định ngh ĩ a trên

không gian topo của Xu, Zhang31

, X    X  Các phép xấ p xỉ dướ i, trên tậ p X định ngh ĩ a trên

không gian topo của Yao31

,ò  R X  òò  R X   Các phép xấ p xỉ dướ i, trên tậ p X định ngh ĩ a trên

không gian topo của Yao (cảm sinh từ quan hệ R 31

 X t   ,  X t   Các phép xấ p xỉ dướ i, trên tậ p X định ngh ĩ a trên

không gian topo của A.M. Kozae và cộng sự 31

Page 14: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 14/100

 

 

ix

DANH SÁCH BẢNG & HÌNH

Bảng 1.1  Bảng d ữ liệu bệnh Cúm 8

Bảng 1.2  Bảng quyế t định 12

Bảng 1.3 Các phép xấ  p xỉ d ự a vào phủ t ậ  p thô

Bảng 2.1  Điề u kiện để các phép xấ  p xỉ phủ trên bằ ng nhau 26 

Bảng 2.2 Tính chấ t ánh xạ đ óng ứ ng vớ i ba phép xấ  p xỉ phủ 28

Bảng 2.3 Tính chấ t ánh xạ đ óng của ba phép xấ  p xỉ phủ trên

 sinh bở i ba loại phủ 

29

Bảng 2.4 Các phép xấ  p xỉ phủ định nghĩ a trên không gian topo 31

Bảng 2.5  Bảng phân loại theo đ ánh giá của ba chuyên gia 36 

Bảng 2.6  K ế t quả rút g ọn t ậ p thuộc tính của Cheng Degang &

thuật toán FC_Reduct 

48

Bảng 3.1 Mô t ả các t ậ p d ữ liệu thự c nghiệm 61

Bảng 3.2 S ố liệu chỉ ra sự khác biệt của C C (D), b  , tb  đố i vớ i d ữ  

liệu Tic-tac-toe

61

Bảng 3.3 S ố liệu chỉ ra sự khác biệt của C C (D), b  , tb  đố i vớ i d ữ  

liệu Dermatology

62

Bảng 3.4 S ố liệu chỉ ra sự khác biệt của C C (D), b  , tb  đố i vớ i d ữ  

liệu Nursery

62

Hình 1.1 Minh họa t ậ  p thô

Hình 1.2 Thuật toán tìm một thu g ọn của một phủ 16 Hình 3.1 S ự biế n thiên của các độ đ o nhấ t quán tb  , b  , C C (D)

trên d ữ liệu Tic-tac-toe

62

Hình 3.2 S ự biế n thiên của các độ đ o nhấ t quán tb  , b  , C C (D)

trên d ữ liệu Dermatology

63

Hình 3.3 S ự biế n thiên của các độ đ o nhấ t quán tb  , b  , C C (D)

trên d ữ liệu Nursery

63

Page 15: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 15/100

 

1

MỞ ĐẦU

Trong thờ i gian gần đây, để xử lý các hệ thống thông tin bao hàm yếu tố mơ  

hồ, không đầy đủ và r ờ i r ạc, các nhà nghiên cứu đã đề xuất nhiều phươ ng pháp

khác vớ i phươ ng pháp logic cổ điển, ví dụ lý thuyết tậ p mờ  ( Fuzzy set theory), lý

thuyết tậ p thô ( Rough set theory), tính toán hạt (Granular computing ) hay phân tích

khái niệm hình thức (  Formal concept analysis) … Trong các phươ ng pháp này,

 phươ ng pháp tậ p thô đượ c nhiều nhóm khoa học trên thế giớ i quan tâm nghiên cứu

và phát triển. Điều này có thể lý giải là do lý thuyết tậ p thô đượ c xây dựng trên một

nền toán học vững chắc, cung cấ p những công cụ hữu ích để giải quyết các bài toán

 phân lớ  p dữ liệu, phát hiện luật …, đặc biệt là phục vụ cho việc nghiên cứu các hệ 

thống thông minh, khai phá dữ liệu.

Ý tưở ng chính của lý thuyết tậ p thô lần đầu tiên đượ c nhà toán học Ba Lan

Z.Pawlak đề xuất. Bài báo kinh điển nổi tiếng của ông là Rough Sets, xuất bản vào

năm 1982 [26]. Tiế p theo sau đó, các nhà khoa học khắ p nơ i trên thế giớ i đóng góp

nhiều thành tựu quan tr ọng nhằm phát triển lý thuyết tậ p thô và ứng dụng. Một số 

 bài toán trong l ĩ nh vực như ngân hàng, tài chính, y học … đã đượ c giải quyết thành

công nhờ công cụ tậ p thô.

Kiến thức cơ  sở của lý thuyết tậ  p thô cổ điển là các phép toán xấ p xỉ trên,

xấ p xỉ dướ i dựa trên phân hoạch đượ c tạo bở i một quan hệ tươ ng đươ ng. Chính kiến

thức cơ sở này làm cho việc tiế p cận tậ p thô là đơ n giản, dễ hiểu. Tuy nhiên, cũng

chính điều này đã làm hạn chế ứng dụng của phươ ng pháp tậ p thô - do lớ  p quan hệ 

tươ ng đươ ng và phân hoạch là không lớ n (Lin, 1998; Zakowski, 1983).

Page 16: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 16/100

 

2

 Nhiều mở  r ộng thú vị và ý ngh ĩ a dựa trên sự mở  r ộng khái niệm quan hệ 

tươ ng đươ ng và phân hoạch [6, 10, 12, 21] hay phối hợ  p vớ i các phươ ng pháp khác.

Chúng ta có thể thấy sự tiế p cận mở r ộng này qua tổng k ết của T.Y.Lin

Không gian topo

Hệ thống láng giềng Phủ 

Quan hệ hai ngôiTậ p thô

 Nhát cắt - a 

Các hướ ng tiế  p cận mở r ộng t ậ p thô

 Đố i vớ i mở  r ộng t ậ  p thô theo hướ ng thay đổ i quan hệ t ươ ng  đươ ng :

Zakowski (1983) đề xuất sử dụng quan hệ phản xạ (quan hệ t ươ ng t ự ). Skowron,

Stepaniuk (1996), Kryszkiewicz (1998) đề xuất và có nhiều nghiên cứu về quan hệ 

dung sai [21, 43], Stefanowski (1999) phát hiện những khác biệt của quan hệ tươ ng

tự và quan hệ dung sai. Wybraniec-Skardowska (1989), Yao và Lin (1995) [44, 45]

xem xét các mô hình tậ  p thô suy dẫn từ các quan hệ hai ngôi khác nhau. Không

giống như mô hình tậ p thô của Pawlak, sự khác biệt chủ yếu của những nghiên cứu

này xuất phát từ mối quan hệ trên tậ p phổ dụng, nhưng không xét ngữ cảnh của các

hệ thống thông tin.

Vớ i hướ ng mở r ộng thay đổi quan hệ tươ ng đươ ng bở i một quan hệ hai ngôi

khác, chúng ta cần lưu ý đến quan hệ dung sai ứng vớ i mô hình tậ p thô dung sai dotính ứng dụng r ộng rãi của nó. Điều lý thú là có nhiều k ết quả lý thuyết cũng như 

ứng dụng trên mô hình này của các tác giả Việt Nam như: Hồ Tú Bảo, Nguyễn

 Ngọc Bình (2000, 2002) đề xuất các thuật toán phân cụm trong khai thác dữ liệu

văn bản (Text Mining ), Ngô Chi Lăng (2005) đề xuất một phươ ng pháp phân cụm

các phục vụ tìm kiếm Web, Nguyễn Hùng Sơ n (1997) vớ i các k ết quả lý thuyết toán

học liên quan…

Page 17: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 17/100

 

3

Tiế  p cận mở  r ộng mô hình t ậ p thô bằ ng nớ i l ỏng phân hoạch bở i một phủ 

khở i đầu do các tác giả W. Zakowski (1983), J.A. Pomykala (1987), Y.Y.Yao

(1991), W.Zhu và F.Y. Wang (2002), E.Tsang, D.Cheng, J. Lee, D. Yeung (2004)

đề xuất và phát triển. Phươ ng pháp này hứa hẹn nhiều tiềm năng cho khai thác các

hệ thống thông tin không đầy đủ [13, 15, 17, 25, 28].

Sự thay đổi phân hoạch bằng một phủ dẫn đến nhiều tính chất khác biệt của

các phép xấ p xỉ dướ i, xấ p xỉ trên. Vì thế, có r ất nhiều bài toán cần quan tâm khi

nghiên cứu tiế p cận mở r ộng này có thể liệt kê như sau:

- Tìm đ iề u kiện để hai phủ cùng sinh ra các phép xấ  p xỉ  

Do hai phân hoạch khác nhau sẽ dẫn đến hai xấ p xỉ trên, hai xấ p xỉ dướ i khác

nhau. Trong khi đó, hai phủ khác nhau có thể dẫn đến các xấ p xỉ trên, xấ p xỉ dướ i

như nhau.

- Rút g ọn yế u t ố d ư thừ a trong một phủ 

 Nếu loại bỏ một phần tử của một phân hoạch, phần còn lại của phân hoạch

không còn là một phân hoạch nữa. Điều đó có ngh ĩ a là không có vấn đề dư thừa

trong một phân hoạch. Tuy nhiên, đối vớ i một phủ khi loại bỏ một phân tử của phủ,

tậ p các phần tử còn lại có thể vẫn còn là một phủ. Hơ n thế, phủ mớ i và phủ cũ cùng

sinh ra các phép xấ p xỉ. Bài toán rút gọn yếu tố dư thừa trong một phủ cũng dẫn đến

  bài toán quan tr ọng là rút gọn tậ  p thuộc tính của một hệ thống thông tin. Chen

Degang và cộng sự [8] đã đề xuất một thuật toán tìm tất cả các rút gọn tậ p thuộc tính

dựa vào họ phủ. Công cụ chính của thuật toán là dựa vào ma tr ận không phân biệt. Tuy

nhiên, bài toán rút gọn tậ p thuộc tính là NP-khó, trong thực tế ngườ i ta chỉ cần tìm một

rút gọn nhằm thu gọn kích thướ c của hệ thống thông tin.

- Tìm đ iề u kiện của phủ để phép xấ  p xỉ d ướ i và phép xấ  p xỉ trên là đố i ng ẫ u 

Các phép toán xấ p xỉ dướ i và xấ p xỉ trên trong mô hình lý thuyết tậ p thô của

Pawlak là đối ngẫu. Điều đó có ngh ĩ a là phép xấ p xỉ dướ i xác định duy nhất phép

Page 18: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 18/100

 

4

xấ p xỉ trên và ngượ c lại. Trong mô hình lý thuyết tậ p thô dựa vào phủ, các phép xấ p

xỉ dướ i và xấ p xỉ trên không là đối ngẫu của nhau.

- Phát hiện mố i quan hệ của các phép xấ  p xỉ  trên, xấ  p xỉ d ướ i cùng đượ c

định nghĩ a trên cùng một phủ 

 Nghiên cứu sự mở  r ộng tậ p thô bằng hướ ng tiế p cận phủ để giải quyết các

 bài toán đã nêu, nhiều tác giả có các phươ ng pháp tiế p cận dựa trên các công cụ 

toán học khá thú vị: Y.Y.Yao tiế p cận bằng cách nghiên cứu cấu trúc đại số của các

 phủ thông qua các quan hệ hai ngôi suy dẫn ra chúng [44], Zakowski nghiên cứu tậ p

tiên đề của các phép xấ p xỉ, W. Zhu, F.Y Wang [36, 38, 40], A.M. Kozae, AA. AboKhadra, T.Medhat [9], Keyun Qin, Yan Gao, and Zheng Pei và nhiều tác giả khác

[19, 20, 21, 22, 29, 31, 33, 34, 42] khảo sát phủ bằng phươ ng pháp topo…Tuy các

công cụ toán học để phục vụ nghiên cứu phủ khá phong phú, cũng như sự quan tâm

đông đảo của các nhà tin học, một số bài toán cơ bản của phủ t ậ p thô vẫ n còn mở  

và thách thứ c [36, 38, 40].

Một lớ  p đặc biệt các hệ thống thông tin có vai trò quan tr ọng trong nhiều ứngdụng là bảng quyết định. Việc nghiên cứu rút trích luật có từ các bảng quyết định

khi dữ liệu lớ n là bài toán khó. Đóng góp lớ n trong l ĩ nh vực này có thể k ể đến các

nhóm tác giả Skowron A., Rauser C. (1992) và Hu X., Han J. & Lin T.Y (2004).

 Ngoài việc rút trích các tậ p luật, việc  xây d ự ng các độ đ o để  l ượ ng giá hiệu nă ng 

các t ậ p luật cũng là bài toán quan tr ọng . Trong thờ i gian gần đây, các tác giả của

Trung quốc đặc biệt là nhóm tác giả Yuhua Qian, Jiye Liang, Deyeu Li, Haiyun

Zhang, Chuangyin Dang [46, 47, 48] đã có nhiều đóng góp cho bài toán này.

Vớ i mong muốn phát triển, mở r ộng lý thuyết tậ p thô và ứng dụng. Mục tiêu

của luận án là tiế p tục nghiên cứu về phủ tậ p thô và các độ đo đánh giá hiệu năng

tậ p luật quyết định. Đây là vấn đề nghiên cứu mang tính thờ i sự, đã và đang đượ c

các nhà khoa học quan tâm. Nội dung luận án tậ p trung vào các vấn đề sau:

 Khảo sát, phân tích các loại phủ t ậ p thô. Phát hiện tính chấ t và mố i quan hệ 

 giữ a các loại phủ.

Page 19: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 19/100

 

5

 Phát hiện các tính chấ t của ánh xạ đ óng ứ ng vớ i các phép xấ  p xỉ trên, xấ  p xỉ  

d ướ i đượ c xây d ự ng trên các mô hình t ậ p thô d ự a vào phủ.

 Đề xuấ t thuật toán rút g ọn t ậ p thuộc tính d ự a vào phủ.

 Xây d ự ng độ đ o đ ánh giá hiệu nă ng t ậ p luật quyế t định rút trích đượ c t ừ các

bảng quyế t định.

 Xây d ự ng ứ ng d ụng trên mô hình lý thuyế t t ậ p thô mở r ộng và cổ  đ iể n.

Về cấu trúc, luận án gồm ba chươ ng, phần k ết luận, các công trình đã công bố,

tài liệu tham khảo và phần phụ lục.

- Chươ ng thứ nhất trình bày các khái niệm cơ sở liên quan đến tậ p thô, phủ và

ánh xạ đóng. Những khái niệm này đượ c trình bày cô đọng, là cơ sở toán học để trình

 bày các k ết quả trong các chươ ng sau.

- Chươ ng thứ hai trình bày những k ết quả đạt đượ c liên quan đến phủ tậ p thô:

Điều kiện để hai phủ sinh ra cùng một phép xấ p xỉ phủ trên loại 2 (định lý 2.13,

hệ quả 2.1, mệnh đề 2.1).  Mối liên hệ, tính chất của các phép xấ p xỉ dựa vào các loại phủ này và ánh xạ đóng (mệnh đề 2.2-2.4). Một số điều kiện để các phép xấ p xỉ phủ là

đồng nhất khi tiế p cận bằng không gian topo.

Thuật toán rút gọn tậ p thuộc tính dựa vào một họ phủ đượ c đề xuất: Thuật toán

 FC_Reduct . Độ phức tạ p của thuật toán là O(|D||U |2) tươ ng đươ ng vớ i các thuật toán tìm

một rút gọn tậ p thuộc tính trong lý thuyết tậ p thô cổ điển.

Trong chươ ng, luận án còn giớ i thiệu một ứng dụng thực tế của thuật toánFC_Reduct cho bài toán xử lý thông tin dạy và học tại Đại học Nha Trang.

- Chươ ng thứ ba, độ đo mớ i đánh giá hiệu năng tậ p luật quyết định rút trích từ 

một bảng quyết định đượ c trình bày. Độ đo độ nhất quán mớ i của luận án khắc phục

đượ c nhượ c điểm của các độ đo đã có. Ngoài ra, k ết quả việc thử nghiệm độ đo đượ c đề 

xuất trên các tậ p dữ liệu của UCI đã minh chứng tính ưu việt của độ đo.

Page 20: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 20/100

 

6

Phần K ết luận tóm tắt những k ết quả đạt đượ c và những vấn đề cần nghiên cứu

tiế p theo.

Phần phụ lục trình bày phần mềm thử nghiệm ứng dụng các k ết quả đạt đượ c

cho bài toán hỗ tr ợ việc xử lý thông tin dạy và học tại Đại học Nha Trang.

Các kết quả chính của luận án Công bố 

- Điều kiện để hai phủ cùng sinh ramột xấ p xỉ phủ loại 2.

- K  ỷ yế u H ội nghị khoa học k  ỷ niệm 25 nă mthành l ậ p Viện C ơ học và Tin học ứ ng d ụng Tp. HCM. Nxb Khoa học T ự nhiên và Công 

nghệ.

- Điều kiện để các phép xấ p xỉ phủ làđồng nhất (tiế  p cận không gian topo)

-International journal of Computer Theoryand Engineering (IJCTE). Vol 1(5) 601-604

- Thuật toán rút gọn tậ p thuộc tính dựavào họ phủ tậ p thô.

- T ạ p chí Khoa học và Công nghệ  Đ.H  Đà N ẵ ng. 4(33) 64-69- International journal of Computer Theoryand Engineering (IJCTE). Vol 2(2) 180-184 

- Độ đo đánh giá hiệu năng tậ p luậtquyết định trong lý thuyết tậ p thô.

- International Journal of Computer   Electrical Engineering (IJCEE). Vol 1(4)447- 451

- Ứ ng dụng các k ết quả xử lý thông tindạy và học tại ĐH Nha Trang

- Đề tài NCKH cấ  p tr ườ ng TR2009-13-

15NCS 

Page 21: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 21/100

 

7

Chươ ng 1

CÁC KHÁI NIỆM CƠ BẢ N

1.1  Hệ thống thông tin và tập thô

1.1.1  Hệ thống thông tin

Một tậ p dữ liệu có thể biểu diễn dướ i dạng một bảng, trên đó mỗi hàng biểu diễn

thông tin ứng vớ i một đối tượ ng, mỗi cột biểu diễn một thuộc tính có thể đo đượ c của

mỗi đối tượ ng (do các chuyên gia hay ng ườ i sử d ụng cung cấ  p). Bảng này đượ c gọi là

một hệ thống thông tin. Hình thức hơ n, hệ thống thông tin là một cặ p S = (U, A), U là

một tậ p hữu hạn khác r ỗng các đối tượ ng gọi là tậ p vũ tr ụ hay là tậ p phổ dụng, A là một

tậ p hữu hạn khác r ỗng các thuộc tính. Vớ i mỗi u U Î và aΠA, ta ký hiệu u(a) là giá tr ị 

của đối tượ ng u tại thuộc tính a. Nếu gọi I a là tậ p tất cả giá tr ị của thuộc tính a, thì u(a) Π

 I a vớ i mọi uÎU . Bây giờ , nếu B = {b1 , b2 , ..,bk } Í  A, ta ký hiệu bộ các giá tr ị u(bi) bở i

u( B). Như vậy, nếu u và v là hai đối tượ ng, thì ta sẽ viết u( B) = v( B) nếu u(bi) = v(bi), vớ i

mọi i =1, 2, .., k .

1.1.2  Quan hệ không phân biệt đượ c

Xét hệ thống thông tin S = (U , A), vớ i mỗi tậ p thuộc tính B Í  A tạo ra

Page 22: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 22/100

 

8

một quan hệ hai ngôi trên U , ký hiệu IND( B)

IND( B) = {( , ) | ( ) ( ), }u v U U u a v a a BÎ ́ = " Î  

IND( B) đượ c gọi là quan hệ B_không phân biệt đượ c. Dễ kiểm chứng đây là một

quan hệ tươ ng đươ ng trên U . Vớ i mọi đối tượ ng uÎU , lớ  p tươ ng đươ ng của u trong

quan hệ IND( B) đượ c kí hiệu bở i [u] B. Tậ  p thươ ng xác định bở i quan hệ IND( B)

đượ c ký hiệu U/IND(B) hay U/B, tức là U/IND(B) = U/B = {[u] B | uÎU }

Ví dụ 1.1 Xét hệ thống thông tin cho ở bảng 1.1

U  Đau đầu Đau cơ  Nhiệt độ Cúm

 x1  Không Có Cao Có

 x2  Có Không Cao Có

 x3  Có Có R ất cao Có

 x4  Không Có Bình thườ ng Không

 x5  Có Không Cao Không

 x6   Không Có R ất cao Có

 Bảng 1.1 Bảng d ữ liệu bệnh cúm

Trong đó: U = {x1, x2, x3, x4, x5, x6}.

 A = {Đau đầu, Đau cơ , Nhiệt độ, Cúm}. 

Trong bảng, các bệnh nhân x2 , x3 và x5 không phân biệt đượ c đối vớ i thuộc tính

Đau đầu, bệnh nhân x3 và x6  không phân biệt đượ c đối vớ i thuộc tính Đau cơ , Cúm và

 bệnh nhân x2 , x5 không phân biệt đượ c đối vớ i thuộc tính Đau đầu, Đau cơ và Nhiệt độ.

Do đó:

IND({Đau đầu}) = {{ x1 , x4 , x6 },{ x2 , x3 , x5}}

IND({Đau cơ }) = {{ x1 , x3 , x4 , x6 }, { x2 , x5}},

IND({Nhiệt độ}) = {{ x1 , x2 , x5}, { x3 , x6 }, { x4}},

IND({Cúm}) = {{ x1 , x2 , x3 , x6 }, { x4 , x5}},

IND({Đau đầu, Đau cơ }) = {{ x1 , x4 , x6 }, { x2 , x5}, { x3}}.

Page 23: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 23/100

 

9

Xét hệ thống thông tin S = (U, A), một quan hệ bộ phận p xác định trên họ {U/B 

| B Í  A} đượ c định ngh ĩ a:

U/P p U/Q nếu và chỉ nếu / , / :i j i j P U P Q U Q P Q" Î $ Î Í . Khi đó ta nói Q là thô

hơ n P hay P là mịn hơ n Q.

1.1.3  Tập thô

Trong lý thuyết tậ  p thô, để biểu diễn một tậ p hợ  p bằng tri thức đượ c cho xác

định bở i một tậ p thuộc tính, ngườ i ta định ngh ĩ a hai phép xấ p xỉ:

Cho một hệ thống thông tin S = (U , A), vớ i mỗi tậ p con X Í U và B Í  A, ký hiệu

 R = IND( B), ta có 2 tậ p con sau

[ ]

[ ]

( ) { | }

( ) { | }

 B

 B

 R X u U u X  

 R X u U u X  

= Î Í

= Î Ç ¹ Æ 

( ), ( ) R X R X  lần lượ t gọi là R-xấ p xỉ dướ i và R- xấ p xỉ trên của tậ p X.

Tậ  p ( ) R X   bao gồm tất cả các phần tử của U chắc chắn thuộc vào X .Tậ  p ( ) R X    bao gồm các phần tử của U  có khả năng đượ c phân loại vào

những phần tử thuộc X   ứng vớ i quan hệ  R.

Từ hai tậ p xấ p xỉ ngườ i ta định ngh ĩ a các tậ p:

 BN  B( X ) = ( ) ( ) R X R X  - : B- miề n biên của X .

 POS  B( X ) = ( ) R X  : B-vùng d ươ ng của X.

 NEG B( X ) = ( )U R X - : B-vùng âm của X.Ký hiệu tậ p thươ ng của IND( B) trên U là U/B, các xấ p xỉ trên và dướ i của X  

có thể viết lại:

( ) R X  =  È{W Î U/B | W Í  X }

( ) R X  = È{ W Î U/B | W Ç X ≠ Æ } 

Trong tr ườ ng hợ  p BN  B( X ) ¹ Æ, X đượ c gọi là tập thô, ngượ c lại X  đượ c gọi

là tập rõ.

Page 24: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 24/100

 

10

( ) R X   

( ) R X   

BNB( X ) 

 NEGB( X ) 

Hình 1.1 Minh họa t ậ p thô

Đối vớ i một hệ thống thông tin S = (U , A), B, D Í  A, ký hiệu R = IND( B), ngườ i

ta gọi B-miền khẳng định dươ ng của D là tậ p đượ c xác định như sau

/

( ) ( ( )) B

V U D

 POS D R V  Î

= U  

Rõ ràng ( ) B POS D là tậ p tất cả các đối tượ ng u sao cho vớ i mọi v U Î mà

( ) ( )u B v B= ta đều có ( ) ( )u D v D= . Nói cách khác, [ ] [ ]( ) { | } B  B D POS D u U u u= Î Í .

1.1.4  Các tính chất của xấp xỉ Định lý 1.1. [34] Cho một hệ thống thông tin S = (U , A), " X, Y Í U và B Í 

 A, đặt R = IND( B). Khi đó:

(1L) ( ) R U U  =  

(1H) ( ) R U U  =  

(2L) ( ) R Æ = Æ  

(2H) ( ) R Æ = Æ  

(3L) ( ) R X X  Í  

(3H) ( ) R X X  Ê  

(4L) ( ) ( ) ( ) R X Y R X R Y  Ç = Ç  

(4H) ( ) ( ) ( ) R X Y R X R Y  È = È  

(5L) ( ) ( ) RR X R X  =  

Page 25: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 25/100

 

11

(5H) ( ) ( ) RR X R X  =  

(6) ( ) R U X U RX  - = - 

( ) R U X U RX  - = -  

(7L) ( ) ( ) X Y R X R Y  Í Þ Í  

(7H) ( ) ( ) X Y R X R Y  Í Þ Í  

(8L) ( ( )) ( ) R U R X U R X  - = -  

(8H) ( ( )) ( ) R U R X U R X  - = -  

(9L) / , ( ) K U R R K K  " Î =  (9H) / , ( ) K U R R K K  " Î =  

Tính chất (3L), (4L) và (8L) là những tính chất đặc tr ưng cho phép xấ p xỉ dướ i,

điều đó có ngh ĩ a là những tính chất khác của phép xấ p xỉ dướ i có thể suy dẫn từ ba tính

chất này. Tươ ng tự, (3H), (4H) và (8H) là những tính chất đặc tr ưng của phép xấ p xỉ 

trên.

1.1.5  Độ chính xác của xấp xỉ 

Cho một hệ thống thông tin S = (U , A), vớ i mỗi tậ p con X Í U và B Í  A, đặt

 R = IND( B), đại lượ ng đo sự chính xác của tậ p xấ p xỉ  X  đối vớ i phân hoạch trên B 

là giá tr ị 

( )( ( ))( )

( ( )) ( ) R

 R X Card R X   X 

Card R X    R X a = =  

Trong đó card( X ) = | X | là lực lượ ng ( số  phần t ử ) của tậ p  X . Rõ ràng

0 ( ) 1 R X a£ £ . Nếu ( ) 1 R

 X a = , ta nói X là chính xác đối vớ i R, còn ( ) 1 R X a < , X 

đượ c gọi là thô đối vớ i R.

1.1.6  Bảng quyết định

Bảng quyết định là một hệ thống thông tin có dạngT = (U , A), trong đó tậ p

Page 26: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 26/100

 

12

thuộc tính  A  đượ c chia thành hai tậ  p thuộc tính r ờ i nhau C và D, C  đượ c gọi là tậ p

thuộc tính điều kiện, còn  D là tậ  p thuộc tính quyết định. Tức là T = (U , C È D), vớ i

C Ç D = Æ. Trong tr ườ ng hợ  p không sợ bị nhầm lẫn ngườ i ta còn ký hiệu T = (U ,C , D).

Ví dụ 1.2 Hệ thống thông tin S = (U , A) biểu diễn cơ sở tri thức về bệnh cúm

đượ c thể hiện trong bảng 1.1 là một bảng quyết địnhT = (U , C È D)

Trong đó: U = { x1 , x2 , x3 , x4 , x5 , x6 }.

 A = {Đau đầu, Đau cơ , Nhiệt độ, Cúm}.

Tậ p thuộc tính điều kiện C = {Đau đầu, Đau cơ , Nhiệt độ}Tậ p thuộc tính quyết định D ={Cúm}

U  Đau đầu Đau cơ  Nhiệt độ Cúm x1  Không Có Cao Có

 x2  Có Không Cao Có

 x3  Có Có R ất cao Có

 x4  Không Có Bình thườ ng Không x5  Có Không Cao Không

 x6   Không Có R ất cao Có

 Bảng 1.2 Bảng quyế t định

Cho một bảng quyết định T = (U , C È D), giả sử U/C  = { X 1 , X 2 ,.., X m} và U/D =

{Y 1 , Y 2 ,.., Y n}. Một lớ  p X iÎU/C  đượ c gọi là nhất quán nếu u(d ) = v(d ), "u,vΠX i, "d Î D,

lúc này cũng có thể viết u( D) = v( D) =  X i(D); một lớ  p Y  jÎU/D đượ c gọi là nhất quán

ngượ c nếu u(a) = v(a), "u,vÎY  j, "aÎC .

Một bảng quyết định T = (U , C È D) là nhất quán nếu mọi lớ  p X iÎU/C là nhất

quán, ngượ c lại T đượ c gọi là không nhất quán. Dễ thấy nếu U/C   p  U/D thì T = (U ,

C È D) là nhất quán.

Tươ ng tự, nếu U/Dp

 U/C , thì T là nhất quán ngượ c.

Page 27: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 27/100

 

13

Có thể thấy bảng quyết định là nhất quán khi và chỉ khi POS C ( D) = U .

Trong tr ườ ng hợ  p bảng không nhất quán thì POS C ( D) chính là tậ p con cực đại

của U sao cho phụ thuộc hàm C ® D đúng.

1.1.7  Rút gọn và nhân

Xét một bảng quyết định  T = (U , C È D).

Tậ p thuộc tính R Í C  đượ c gọi là một rút g ọn của C nếu POS  R(D)=POS C (D).

 Nhân của tậ p thuộc tính điều kiện C ký hiệu CORE (C ) đượ c định ngh ĩ a

CORE(C ) = ÇRED(C )

Ở đây, RED(C ) là tậ p hợ  p tất cả rút gọn của C .

 Ngoài ra, ngườ i ta cũng định ngh ĩ a rút gọn C-miền khẳng định dươ ng của D:

 Nếu B Í C thỏa

{ }

1. ( ) ( )

2. , ( ) ( ) B C 

C C a

 POS D POS D

a B POS D POS D-

=

" Î ¹  

B đượ c gọi là rút gọn C-miền khẳng định dươ ng của D.

1.1.8  Ma trận phân biệt đượ c và hàm phân biệt đượ c

Xét bảng quyết định T = (U , C È D), vớ i U = {u1 , u2 , .., un}. Ma tr ận phân biệt

đượ c của T ký hiệu M(T) = ij( )n nm ´ là một ma tr ận đối xứng, trong đó mỗi phần tử của

nó là một tậ p thuộc tính đượ c xác định như sau [26, 30, 32, 34]

ij

{ | ( ) ( )} , ( ) ( ), ( ) ( )

i j i j

i j

c C u c u c u D u Dm

u D u D

Î ¹ ¹ìï= íÆ =ïî

 

Hàm phân biệt đượ c  f Τ là một hàm boole, đượ c xác định từ ma tr ận phân

 biệt M(T) [1, 26, 32] như sau

ij( ) )(ii j

 f u mT¹

= ÚÙ , vớ i mỗi iu U Î  

Page 28: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 28/100

 

14

trong đó, mỗi thuộc tính đượ c đặt tươ ng ứng một biến logic cùng tên và

(1) Ú mij là biểu thức tuyển của tất cả các biến c Î mij, nếu mij ¹Æ,

(2) Ú mij = true, nếu mij = Æ và ui( D) = u j( D),

(3) Ú mij = false, nếu mij = Æ và ui( D) ¹ u j( D).

1.1.9  Luật quyết định

Cho T = (U , C È D) là một bảng quyết định, giả sử U/C = { X 1 , X 2 , .., X m} và U/D 

= {Y 1 , Y 2 , .., Y n}. Nếu X iÇY  j≠Æ, ký hiệu des( X i), des(Y  j) lần lượ t là các mô tả của các lớ  p

tươ ng đươ ng ứng vớ i X i, Y  j. Một luật quyết định xác định bở i X i , Y  j có dạng

: ( ) ( )ij i j Z des X des Y  ®  

Độ đo độ chắc chắn và độ hỗ tr ợ của luật quyết định Z ij đượ c định ngh ĩ a như 

sau [48]

( ) /ij i j i Z X Y X  m = Ç và ( ) /ij i j

 Z X Y U  = Ç  

Ở  đây |.| là bản số hay lực lượ ng của một tậ p hợ   p. Rõ ràng giá tr ị của

( ), ( )ij ij Z s Z  m của luật quyết định Z ij r ơ i vào đoạn

1

,1U 

é ù

ê úë û . Để thuận tiện trong trình

 bày ký hiệu | Z ij| đượ c sử dụng thay cho i j X Y Ç .

1.1.10 Phụ thuộc độ k 

Cho hệ thống thông tin S = (U , A),  X, Y  Í  A. Chúng ta nói r ằng tậ p thuộc tính Y  

 phụ thuộc độ k Î[0,1] vào tậ p thuộc tính X, ký hiệu k  X Y  ¾® , vớ i k đượ c xác định như 

sau [26, 32]

( )( ( ))( )

 X  X  POS Y  card POS Y  

k card U U  

= =  

Khi 0 X Y  ¾¾® , chúng ta sẽ viết X  ® Y và 1 X Y  ¾®  đượ c viết X  ®Y .

Dễ thấy r ằng phụ thuộc độ k là sự tổng quát hóa của phụ thuộc hàm và1 X Y  ¾¾® là phụ thuộc hàm đã biết trong CSDL quan hệ.

Page 29: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 29/100

 

15

1.2  Phủ tập thô

1.2.1  Phủ và không gian xấp xỉ phủ 

Các định nghĩ a và tính chấ t cơ sở về phủ của t ậ p thô đượ c trích t ừ các tài liệu

[37, 38, 39, 40]

Định ngh ĩ a 1.2.1 ( Phủ)

Cho U là một tậ p phổ dụng, C  là họ các tậ p con khác r ỗng của U , khi ÈC = U , C  

đượ c gọi là một phủ của U .

Dễ thấy, một phân hoạch của U là một phủ của U , vì vậy khái niệm phủ là mở  

r ộng của khái niệm phân hoạch.

Định ngh ĩ a 1.2.2 ( Không gian xấ  p xỉ phủ)

Cho U là một tậ p phổ dụng, C  là 1 phủ của U . Cặ p thứ tự (U , C ) đượ c gọi là một

không gian xấ p xỉ phủ (CAS).

Định ngh ĩ a 1.2.3 (Mô t ả t ố i thiể u - Minimal description)

Cho một không gian xấ p xỉ phủ (U , C ), họ các tậ p hợ  p đượ c xác định bở i xÎU :

Md ( x) = { K ÎC  ç xΠK Ù ("S ÎC  Ù xÎS Ù S Í K Þ K = S )} đượ c gọi là mô tả tối

thiểu của x. 

Định ngh ĩ a 1.2.4 ( N ử a thu g ọn - Semi Reduct )

Cho một không gian xấ p xỉ phủ (U , C ), C  đượ c gọi là ( phủ) nửa thu gọn hay nửa

không dư thừa nếu nó thỏa điều kiện sau

" K 1, K 2ΠC và K 1 Í  K 2 Þ  K 1 = K 2.

Định ngh ĩ a 1.2.5 ( Đơ n vị - Unary) 

Cho một không gian xấ p xỉ phủ (U , C ) , C   đượ c gọi là ( phủ) đơ n vị nếu " xÎU,

|Md( x)| = 1.

Page 30: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 30/100

 

16

Định ngh ĩ a 1.2.6 ( Phủ t ự a đ iể m-pointwise-covered ) 

Cho một không gian xấ p xỉ phủ (U , C ), C   đượ c gọi là phủ tựa điểm nếu " K ÎC  và xΠK thì K Í  ÈMd( x). 

Định ngh ĩ a 1.2.7 ( Phần t ử loại đượ c của một phủ) 

Cho một không gian xấ p xỉ phủ (U , C ) và K ÎC . Nếu K là hợ  p của một số tậ p hợ  p

nào đó của C - { K } , chúng ta nói r ằng K  là một phần tử loại đượ c của C  , ngượ c lại K 

là phần tử không loại đượ c.

Định ngh ĩ a 1.2.8 ( Phủ rút g ọn đượ c) 

Cho một không gian xấ p xỉ phủ (U , C ). Nếu mọi phần tử của C là phần tử không

loại đượ c thì C   là phủ không rút gọn đượ c, ngượ c lại C  là phủ rút gọn đượ c.

Định ngh ĩ a 1.2.9 ( Rút g ọn của một phủ)

Cho một không gian xấ p xỉ phủ (U , C ). Một phủ không rút gọn có đượ c từ việc

loại bỏ các phần tử rút gọn đượ c của C  gọi là rút gọn của phủ C , ký hiệu reduct(C ).

Mệnh đề 1.2.1 Cho C   là một phủ của U , K ÎC . K là phần tử loại đượ c trong C ,

và K 1ÎC – { K }, K 1 là một phần tử loại đượ c trong C   khi và chỉ khi nó là phần tử loại

đượ c trong C   – { K }.

1.2.2  Thuật toán tìm rút gọn của một phủ 

Thuật toán tìm một rút gọn của một phủ cho tr ướ c do W. Zhu và F.Y Wang đề 

xuất [40] . Ý tưở ng chính của thuật toán là vét cạn loại bỏ tất cả các phần tử là hợ  p một

số các phần tử còn lại của phủ. Đáng lưu ý, việc loại bỏ này chưa chú ý đến ngữ ngh ĩ a

thông tin của hệ thống.

Thuật toán: set reductOfCovering (set C )

{set reduct(C ) = C ;for(i = 1; i £ n; i++) {

set temp = Æ;for ( j=1; j £ n; j++){ iff( K  j Ì K i) {

temp = temp È  K  j; } }

Page 31: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 31/100

 

17

iff (temp == K i) {reduct (C ) = reduct (C ) – { K i};}}

return reduct(C );}

Hình 1.2. Thuật toán tìm một thu g ọn của một phủ 

1.2.3  Các phép xấp xỉ dự a vào phủ tập thô

Cho một không gian xấ p xỉ phủ (U, C ). Một tậ p X  Í U , xấ p xỉ phủ dướ i, xấ p xỉ 

 phủ trên loại 1, 2, 3 của  X   đượ c định ngh ĩ a [36, 37, 38]

Tên phép xấp xỉ Biểu thứ c xác định Ký hiệu

Xấ p xỉ phủ dướ i loại 1, 2, 3

lần lượ t là X * = X = X# È { K Î C  | K Í X }

 FL( X ), SL( X ), TL( X )

Ký hiệu chung: CL( X )

Xấ p xỉ phủ trên loại 1: X *   X * È (È {Md( x)| xΠX-X *})  FH ( X )

Xấ p xỉ phủ trên loại 2 :  X   È { K ÎC | K Ç X ¹Æ }  SH ( X )

Xấ p xỉ phủ trên loại 3 : X #   È {Md( x) | xΠX } TH ( X )

Bảng 1.3 Các phép xấ  p xỉ d ự a vào phủ t ậ p thô

Trong phần trình bày tiế p theo, ký hiệu: P (U ) là tậ p hợ  p chứa tất cả các tậ p

con của U : P (U ) = { X | X  Í U }; Ø là phép phủ định mệnh đề; ~ X = U - X = X C  .

1.2.4  Phép xấp xỉ phủ tập thô loại 1

Định ngh ĩ a 1.2.10 [36, 37, 38] (CL và FH) Cho C  là một phủ của U , các phép

toán CL và FH :  P (U ) ®   P (U ) đượ c định ngh ĩ a: " X Í  U,

CL( X ) = È{ K ÎC   ç  K Í  X }

 FH ( X ) = CL( X ) È (È{ K Î Md( x) ç  xΠX - CL( X ) })

Chúng ta gọi CL là phép xấ p xỉ phủ dướ i và FH là phép xấ p xỉ phủ trên loại 1 

của X đượ c sinh bở i C . 

Page 32: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 32/100

 

18

Một số tính chất của xấ p xỉ dướ i, xấ p xỉ trên của Pawlak không còn đúng đối vớ i

 phép xấ p xỉ phủ dướ i và phép xấ p xỉ phủ trên loại 1. Đặc biệt là tính đối ngẫu và đơ n

điệu của phép xấ p xỉ phủ trên [37], cụ thể là

(4L) CL( X ÇY ) ¹ CL( X )ÇCL(Y )

(4H) FH ( X ÈY ) ¹ FH( X )ÈFH(Y )

(6) CL( X ) ¹  ~(~  FH ( X ))

 FH ( X ) ¹  ~(~ CL( X ))

(7H) Ø( X  Í Y  Þ  FH ( X ) Í  FH (Y ))

(8L) CL(~CL( X )) ¹ ~CL( X )

(8H) FH (~ FH ( X )) ¹ ~  FH ( X )

1.2.5  Phép xấp xỉ phủ tập thô loại 2

Định ngh ĩ a 1.2.11 (SH) [36, 37, 38] Cho C là một phủ của U . Phép xấ p xỉ phủ 

trên loại 2 đượ c sinh bở i C ký hiệu SH  đượ c định ngh ĩ a:

" X  ÍU , SH ( X ) = È{ K ÎC , K Ç X  ¹Æ}

Phép phủ xấ p xỉ trên loại 2 chưa chắc thỏa các tính chất (5H), (6), (8H), và (9H).

Có thể thấy qua phản ví dụ 

Ví dụ 1.4 [36] Cho U = {a, b, c, d }, K 1 = {a,b}, K 2 = {a, b, c}, K 3 = {c,d }, và

C = { K 1 , K 2 , K 3}. C  là một phủ của U .

(5H) Nếu X  = {a, b}, chúng ta có SH ( X ) = {a, b, c}. Tuy nhiên, SH ({a, b, c}) =

{a, b, c, d }, vì vậy SH (SH ( X )) ¹  SH ( X ).

(6) Nếu X = {a ,b}, chúng ta có CL( X ) = {a, b}. Tuy nhiên, SH ((~ X )) = SH ({c, d}) =

{a, b, c, d }, vì vậy CL( X ) ¹ ~SH ((~ X )).

(8H) Cho X  = {a}, SH ( X ) = {a, b} và SH ((~SH( X ))) ¹ ~SH ({c, d }) = {a, b, c,

d }, vì vậy SH ((~SH ( X ))) ¹ ~SH ( X ).

(9H) Lấy K = K 2 = {a, b, c}, chúng ta có SH ( K ) = U  ¹  K.

1.2.6  Phép xấp xỉ phủ tập thô loại 3

Định ngh ĩ a 1.2.12 (TH) [38, 40] Cho C   là một phủ của U . Phép xấ p xỉ phủ trên

loại 3 đượ c sinh bở i C ký hiệu TH  định ngh ĩ a: TH ( X ) = È{Md( x) | xΠX }.

Page 33: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 33/100

 

19

Phép xấ p xỉ phủ trên loại 3 chưa chắc thỏa các tính chất (5H), (6), (8H) và (9H),

Có thể thấy qua phản ví dụ 

Phản ví dụ 1.1 [38] U  = {a, b, c}, C = {{a,b}, {b,c}},

(5H) X  = {a}, TH ( X ) = {a, b}, TH (TH ( X )) = {a, b, c}

(6) X = {a}, CL(~ X ) = {b, c}, TH ( X ) = {a, b}, ~TH ( X ) = {c}

(8H) X = {a}, ~TH ( X ) = {a, b}, TH (~TH ( X )) = U ,

(9H) K = {a, b}ÎC , TH ( K ) = U .

1.3  Ánh xạ đóng

Toán tử D: P (U ) ®  P (U ) đượ c gọi là một ánh xạ đóng nếu D thỏa các tính chất

sau: "  X,Y  ÍU, 

(Cl1) X   Í D( X ) (tính phản xạ)

(Cl2) X   Í Y  Þ D( X ) Í D(Y ) (tính đồng biế n)

(Cl3) D(D( X )) = D( X ) (tính l ũ y đẳ ng )

Mặc dù tính chất đặc tr ưng của một ánh xạ đóng khá đơ n giản nhưng có nhiều

ứng dụng đượ c đề cậ p trong cơ sở dữ liệu dựa trên khái niệm ánh xạ đóng [5]. Hệ tiên

đề đặc tr ưng của phép xấ p xỉ dướ i trong lý thuyết tậ p thô cổ điển chỉ ra r ằng nó là một

ánh xạ đóng [40]. Vì vậy, tìm xem các phép xấ p xỉ phủ thỏa mãn tính chất nào của ánh

xạ đóng là một mục tiêu của luận án. K ết quả tìm đượ c sẽ là cơ sở cho việc k ế thừa

những k ết quả đã có của ánh xạ đóng, nhất là các luật sinh thể hiện mối quan hệ giữa

các thuộc tính. Các tính chất đặc tr ưng về ánh xạ đóng có thể tham khảo trong [5].

1.4  Không gian topo

Các khái niệm cơ bản trong phần này đượ c trích d ẫ n t ừ [6, 7, 18, 34].

Xét tậ p hợ  p X , một họ t các tậ p con của X gọi là một topo trên X  nếu thỏa các

điều kiện: 1. X và Æ thuộc t  

2. Hợ  p tùy ý các tậ p thuộc t là thuộc t  

3. Giao của hữu hạn các tậ p thuộc t  là thuộc t .

Page 34: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 34/100

 

20

Một tậ p X cùng một topo trên X gọi là một không gian topo. Để chỉ rõ t là topo

trên X  ta viết ( X , t ). Trên một không gian topo ( X , t ), ta có các khái niệm cơ bản sau:

T ậ p mở  , t ậ p đ óng: Tậ p GÎt   đượ c gọi là tậ p mở của X . Tậ p con F của X  đượ c

gọi là tậ p đóng nếu X-F là tậ p mở .

 Lân cận: Xét xΠX , tậ p con V của X  đượ c gọi là một lân cận của x nếu tồn tại

một tậ p mở  G sao cho xÎG Ì V . Nếu lân cận V của x là một tậ p mở thì V  đượ c gọi là

một lân cận mở của x.

 Bao đ óng: Xét A Í  X , ta gọi bao đóng của  A ký hiệu°

là giao tất cả các tậ pđóng chứa A. ° A = Ç{ F Í  X : A Í  F   và  F  là t ậ p đ óng }

 Phần trong: Cho A Í  X , ta gọi phần trong của A ký hiệu Int( A) hay A0 là hợ  p

tất cả các tậ p mở  đượ c chứa trong A.  A0 = È{G Í U : G Í   A và G là t ậ p mở }

 Biên: biên của tậ p A trong topo t   là tậ p hợ  p ° 0b A A= - .

C ơ sở và tiề n cơ sở (Base, subbase):

Một họ con b của t   đượ c gọi là một cơ sở  của t  nếu mọi tậ p thuộc t   đều bằng

hợ  p của một họ các tậ p thuộc b . Nói cách khác, họ con b của t là cơ  sở của t  nếu:

"GÎt , " xÎG , $ V Îb :  xΠV  Ì G.

Một họ con s của t gọi là một tiền cơ sở của t  nếu họ tất cả các giao hữu hạn

của các tậ p thuộc s là một cơ sở của t . Như vậy họ con s của t là tiền cơ sở của t  nếu

"GÎt , " xÎG , $ W 1, W 2, .., W n Îs :  xΠW 1 Ç W 2 Ç .. Ç W n Ì G.1.5  K ết luận Chươ ng 1

Chươ ng này đã trình bày một số khái niệm cơ bản nhất trong lý thuyết tậ p thô

như hệ thống thông tin, bảng quyết định, quan hệ không phân biệt đượ c, luật quyết định,

 phụ thuộc hàm xấ p xỉ … Các khái niệm liên quan đến phủ tậ p thô, ánh xạ đóng, không

gian topo trình bày khá cô đọng, là cơ sở toán học cần thiết để nắm bắt và trình bày các

k ết quả trong các chươ ng sau.

Page 35: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 35/100

 

21

Chươ ng 2

PHỦ TẬP THÔ

Chươ ng này tậ p trung nghiên cứu sự mở r ộng tậ p thô theo hướ ng thay đổi phân

hoạch bở i phủ. Phươ ng pháp tiế p cận là khảo sát tính chất toán học của các phép xấ p xỉ 

ứng vớ i ba loại phủ do W. Zhu và F.Y Wang đề xuất [37, 38, 40] và các phép xấ p xỉ dựa vào phủ đượ c tiế p cận bằng công cụ toán học là không gian topo của một số tác giả 

khác [6, 18, 39, 44] để chỉ ra mối quan hệ giữa các phép xấ p xỉ. Cuối chươ ng, luận án

đề xuất thuật toán rút gọn tậ p thuộc tính dựa vào họ phủ tậ p thô FC_Reduct và ứng dụng.

Trong các bài báo công bố k ết quả nghiên cứu của mình [37, 38], W. Zhu và F.Y

Wang đã đưa ra hệ tiên đề cho phép xấ p xỉ phủ dướ i và khẳng định tính mở của bài toán

tìm tính chất đặc tr ưng của các phép xấ p xỉ phủ trên (loại 1, 2, 3). K ế thừa, phát triển

những k ết quả này, luận án đóng góp một số điều kiện để hai phủ sinh cùng xác định

một phép xấ p xỉ phủ loại 2. Tính chất ánh xạ đóng của các phép xấ p xỉ phủ loại 1, 2, 3

cũng đượ c khảo sát nhằm có thể sử dụng các k ết quả ứng dụng của ánh xạ đóng vào các

tậ p cơ sở dữ liệu.

Khi mở r ộng tậ p thô dựa vào phủ, nhiều tác giả tiế p cận theo hướ ng không gian

topo. Trong chươ ng này, luận án trình bày điều kiện để một số phép xấ p xỉ dựa vào phủ 

tiế p cận bằng không gian topo là đồng nhất.

Page 36: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 36/100

 

22

Vớ i mục đích rút gọn tậ p thuộc tính dựa vào họ phủ tậ p thô, luận án đề xuất thuật

toán FC_Reduct có độ phức tạ p là thờ i gian đa thức (O(|D||U |2)) theo kích thướ c của dữ 

liệu. K ết quả của thuật toán này là sự khai thác các khái niệm do Cheng Degang và cộng

sự công bố [8]. Minh chứng cho tính thực tiễn, FC_Reduct đã đượ c cài đặt để xử lý

thông tin dạy và học tại Đại hoc Nha Trang cho k ết quả tốt.

Trong phần tiế   p theo, để phân biệt các phép xấ  p xỉ  ứ ng vớ i các phủ khác

nhau, ký hiệu FH C   , SH C   , TH C  l ần l ượ t là phép xấ  p xỉ phủ trên loại 1, 2, 3 sinh bở i

 phủ C ; FLC  , SLC  , TLC l ần l ượ t là phép xấ  p xỉ phủ d ướ i loại 1, 2, 3 sinh bở i phủ C .

2.1  Tính chất của xấp xỉ phủ loại 1, 2, 3

2.1.1  Xấp xỉ phủ tập thô loại 1

 A. S ự phụ thuộc xấ  p xỉ d ướ i và xấ  p xỉ trên loại 1

W. Zhu và F.Y. Wang [38] đã chỉ ra mối quan hệ giữa xấ p xỉ phủ dướ i và xấ p xỉ 

 phủ trên loại 1 thông qua các định lý

Định lý 2.1 [38] Cho C 1 và C 2 là hai phủ của U , C 1 và C 2 sinh ra cùng phép xấ p

xỉ phủ dướ i (loại 1, 2, 3) nếu và chỉ nếu reduct(C 1) = reduct(C 2). 

Định lý 2.2 [38] Cho C 1 và C 2 là hai phủ của U , C 1 và C 2 sinh ra cùng phép xấ p

xỉ phủ trên loại 1 nếu và chỉ nếu reduct(C 1) = reduct(C 2). 

Định lý 2.3 [38] Cho C 1, C 2 là hai phủ của U , C 1 và C 2 sinh ra cùng phép xấ p xỉ 

 phủ dướ i loại 1 khi và chỉ khi chúng cùng sinh ra xấ p xỉ phủ trên loại 1.

 B. Tiên đề cho phép xấ  p xỉ phủ d ướ i

Định lý 2.4 [37, 40] Cho U là một tậ p khác r ỗng. Nếu tồn tại 1 phép toán L:

 P (U ) ®  P (U ) thỏa các tính chất sau: " X, Y  Í U,

(1L) L(U ) = U  

(3L) L( X ) Í  X  

(5L) L(L( X )) = L( X )

(7L) X  ÍY  Þ L( X ) Í L(Y )

Page 37: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 37/100

 

23

thì tồn tại một phủ C của U mà phép xấ p xỉ phủ dướ i CL đượ c sinh bở i C là L. Hơ n

thế, bốn tính chất trên của phép xấ p xỉ phủ dướ i là độc lậ p. ((1L)-(7L) là ký hiệu thứ  

t ự các tính chấ t của phép xấ  p xỉ phủ d ướ i đượ c viế t ở 1.1.4).

C. Tiên đề cho phép xấ  p xỉ phủ trên loại 1

Các tính chất (1L) đến (9H) trong 1.1.4 là cơ bản và đầy đủ cho các phép xấ p xỉ 

dướ i, phép xấ p xỉ trên trong tậ p thô cổ điển. Định lý 2.4 chỉ ra r ằng các tính chất (1L),

(2L), (3L), (7L) cũng là đầy đủ đối vớ i các phép toán xấ p xỉ phủ dướ i. Tuy nhiên, các

tính chất (1H), (2H), (3H) và (5H) chưa đủ để đặc tr ưng cho các phép xấ p xỉ trên loại 1.

Điều này có thể thấy đượ c qua ví dụ 

Ví dụ 2.1 [38, 40]  Một phép toán H : P (U ) ®  P (U ) thỏa các tính chất (1H),

(2H), (3H) và (5H) nhưng không tồn tại một phủ C  của U màH là một phép xấ p xỉ phủ 

trên loại 1 sinh ra bở i C .

Cho U  = {a, b, c}. Định ngh ĩ a H : P (U ) ®  P (U ) như sau

H (Æ) = Æ, H ({a}) = {a},H ({b}) = {b}, vớ i mọi X  Í U , X ≠ {a}, X ≠ {b},H ( X ) = U .

Hiển nhiên H  thỏa các tính chất (1H), (2H), (3H) và (5H), nhưng không tồn tại

 phủ C nào của U màH  là phép xấ p xỉ phủ trên loại 1 sinh ra bở i C . Thật vậy, nếu có thì

 phủ C phải có 2 phần tử {a} và {b}. Trong tr ườ ng hợ  p này, FH ({a,b}) = {a,b} ¹ {a,b,c}

=H ({a,b}). Do đóH không là phép xấ p xỉ phủ trên loại 1 sinh ra bở i C .

Bài toán tìm hệ tiên đề cho xấp xỉ phủ trên loại 1 vẫn còn là bài toán mở .

2.1.2  Xấp xỉ phủ tập thô loại 2

Tươ ng tự như xấ p xỉ phủ tậ p thô loại 1, các tính chất quan tr ọng của xấ p xỉ phủ 

tậ p thô loại 2 đượ c công bố trong [37, 38, 40]. Định ngh ĩ a xấ p xỉ phủ dướ i tậ p thô loại 2

có cùng định ngh ĩ a vớ i xấ p xỉ phủ dướ i tậ p thô loại 1, sự khác biệt là ở xấ p xỉ phủ trên.

 A. M ố i quan hệ giữ a xấ  p xỉ phủ d ướ i và xấ  p xỉ phủ trên t ậ p thô loại 2

Page 38: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 38/100

 

24

Khái niệm rút gọn phủ tỏ ra không hữu dụng trong mối quan hệ giữa xấ p xỉ phủ 

dướ i và xấ p xỉ phủ trên loại 2.

Ví dụ 2.2 [40] C   và reduct (C ) không sinh ra cùng các phép toán xấ  p xỉ phủ trên

loại 2: Cho U = {a, b}, K 1 = {a}, K 2 = { b} , K 3 = {a, b}, C  = { K 1 , K 2 , K 3}, reduct(C ) =

{ K 1 , K 2}. Ta có:

SH C (Æ) = Æ và SH C ( X ) = U , " X , Æ Ì  X   Í U mà SH  reduct( C  ) ( X ) =  X , " X  Í  U .

Định lý 2.5 [40] Phép xấ p xỉ phủ dướ i và xấ p xỉ phủ trên loại 2 không xác định

duy nhất lẫn nhau.

Phản ví dụ 2.1  Hai phủ sinh ra cùng xấ  p xỉ phủ d ướ i loại 2, như ng không sinh

ra cùng xấ  p xỉ phủ trên loại 2: Xét U = {a, b, c}, K 1 = {a, b}, K 2 = {c}, K 3 = {a, b, c},

C 1={ K 1 , K 2} và C 2 = { K 1 , K 2 , K 3},  X = {a,b} thì

{ } { } { }1 2 1 2( ) ( ) , , , ( ) , ,SL X SL X a b SH a b SH X a b c= = = ¹ =

C C C C    

Phản ví dụ 2.2  Hai phủ sinh ra cùng xấ  p xỉ phủ trên loại 2, như ng không sinh

ra cùng xấ  p xỉ phủ d ướ i loại 2: Xét U = {a, b, c}, K 1 ={a, b}, K 2 = {c}, K 3 = {a, b, c},

C 1 = { K 1 , K 2 , K 3} và C 2 = { K 3},  X  = {a,b}, thì

1 2( ) ( ) { , , }SH X SH X a b c= =

C C  ;1 2( ) { , } ( )SL X a b SL X  = ¹ = Æ

C C  . 

 B. Tiên đề cho các phép xấ  p xỉ phủ trên loại 2

Tươ ng tự như xấ p xỉ phủ trên loại 1, các tính chất đặc tr ưng mà xấ p xỉ phủ trênloại 2 có đượ c là chưa đủ để tạo thành hệ tiên đề đặc tr ưng.

Ví dụ 2.6 [38, 40] Một phép toán H : P (U ) ®  P (U ) thỏa các tính chất (1H),

(2H), (3H), (4H) và (7H) nhưng không tồn tại một phủ C  của U  màH là một phép xấ p

xỉ phủ trên loại 2 đượ c sinh bở i C .

Lấy U  = {a, b}, định ngh ĩ a H : P (U ) ®  P (U ) như sau

Page 39: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 39/100

 

25

H (Æ) = Æ, H ({a}) = {a, b}, H ({a, b}) = {a, b} và H ({b}) = {b}. U có bốn

 phủ: {{a, b}}; {{a}, {b}}; {{a}, {a, b}}; {{b}, {a, b}}, nhưng không có phủ nào nhận

H làm xấ p xỉ phủ trên loại 2.

Bài toán tìm hệ tiên đề cho xấp xỉ phủ trên loại 2 vẫn còn là bài toán mở .

2.1.3  Xấp xỉ phủ tập thô loại 3

 A. S ự phụ thuộc xấ  p xỉ phủ d ướ i và xấ  p xỉ phủ trên loại 3

Định lý 2.6 [38, 40] Cho C   là phủ của U  thì C  và reduct(C ) sinh ra cùng các

 phép xấ p xỉ phủ dướ i và xấ p xỉ phủ trên loại 3.

Định lý 2.7 [38, 40] Cho C 1, C 2 là hai phủ của U , nếu reduct (C 1) = reduct(C 2),

thì C 1 và C 2 sinh ra cùng xấ p xỉ phủ trên loại 3. 

Chú ý 2.1: Điều ngượ c lại định lý trên là không đúng, ta có phản ví dụ 

Phản ví dụ 2.3 Cho U = {a, b, c}, K 1 = {a, b}, K 2 = {b, c}, K 3 = {a, c}, K 4={a, b,

c}, C 1 = { K 1 , K 2 , K 3} and C 2 = { K 4}. Nếu  X = Æ thì xấ p xỉ phủ trên loại 3 sinh ra bở i hai

 phủ C 1 và C 2 đều là  X # = {a ,b, c}, nhưng reduct(C 1) = C 1 ¹ reduct(C 2) = C 2.

Định lý 2.8 [38, 40] Cho C 1, C 2 là các phủ của U , nếu C 1 và C 2 sinh ra cùng xấ p

xỉ phủ dướ i thì chúng cũng sinh ra cùng xấ p xỉ phủ trên loại 3. 

 B. Tiên đề cho các phép xấ  p xỉ phủ trên loại 3

Cũng giống như phép phủ xấ p xỉ trên loại 1 và loại 2. Phép phủ xấ p xỉ trên loại 3chưa thể tiên đề hóa do nhiều tính chất đặc tr ưng của phép phủ xấ p xỉ trên không thỏa.

Phản ví dụ 2.4 [40] Một phép toán thỏa (1H), (2H), (3H), (4H), và (7H) nhưng

không là xấ p xỉ phủ trên loại 3. Cho U = {a, b, c}. Định ngh ĩ a H : P (U ) ®  P (U ) như 

sau: H (Æ) = Æ, H ({a}) = {a, b}, H ({b}) = {b, c}, H ({c}) = {c}, H ({a, b}) = U ,

H ({b, c}) = {b, c}, H ({a, c}) = U , H (U ) = U . Hiển nhiên H  thỏa (1H), (2H), (3H),

Page 40: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 40/100

 

26

(4H), và (7H), nhưng rõ ràng không có một phủ C nào của U mà sinh ra H  là phép xấ p

xỉ phủ trên loại 3.

Bài toán tìm hệ tiên đề cho phép xấp xỉ trên phủ loại 3 vẫn còn là bài toán mở .

2.2  Mối quan hệ giữ a ba loại phủ tập thô

Từ định ngh ĩ a của ba phép toán xấ p xỉ phủ tậ  p thô, vớ i một phủ C   của U và

 X ÍU , ta luôn có  FH ( X ) Í  TH ( X ) Í  SH ( X ). W. Zhu và F.Y Wang đã công bố 

Định lý 2.9 [40] FH  = TH nếu và chỉ nếu C là phủ đơ n vị.

Định lý 2.10 [40] TH  = SH nếu và chỉ nếu C là phủ tựa điểm.Định lý 2.11 [40] FH  = SH nếu và chỉ nếu C là một phân hoạch.

Định lý 2.12 [40] Nếu một phủ C  của U là phủ nửa thu gọn thì C cũng là phủ tựa

điểm của U . 

Ta có thể tóm tắt các định lý 2.9 – 2.12 vớ i bảng sau

  FH TH SH 

C là một đơ n v ị   Û   FH = TH  

C là phủ t ự a đ i ể m Û  TH = SH

C là một nử a thu g ọn Þ  TH = SH

C là một phân hoạch Û  FH = TH = SH

Bảng 2.1  Điề u kiện để các phép xấ  p xỉ phủ trên bằ ng nhau

2.3  Một số tính chất về xấp xỉ phủ loại 2

Định lý 2.13 Cho C 1 , C 2 là các phủ của U , C 1 và C 2 cùng xác định xấ p xỉ phủ 

dướ i và xấ p xỉ phủ trên loại 2 nếu chúng thỏa các điều kiện sau: 

1. reduct(C 1) = reduct(C 2)

2. C 1 và C 2 là các phủ nửa thu gọn

Page 41: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 41/100

 

27

Chứ ng minh Do định lý 2.1, 2.7 từ reduct(C 1) = reduct(C 2) ta có:

1 2

1 2

( )TH TH   aTL TL

=ìïí=ïî

C C 

C C 

 

và cùng vớ i giả thiết (2): C 1 và C 2 là các phủ nửa thu gọn nên

1 1TH SH  =

C C  và2 2

TH SH  =C C  (b) ( xem bảng 2.1).

Từ (a), (b), ta có1 2

SH SH  =C C 

; Hiển nhiên,1 2 1 2

TL TL SL SL= = =C C C C  

 Nói cách khác, C 1 

và C 2 sinh ra cùng xấ p xỉ dướ i và xấ p xỉ trên phủ loại 2.

Hệ quả 2.1 Cho C 1, C 2 là các phủ của U , C 1 và C 2 sinh ra cùng xấ p xỉ dướ i và

xấ p xỉ trên phủ loại 2, nếu chúng thỏa các điều kiện sau 

1. reduct(C 1) = reduct(C 2)

2. C 1 và C 2 là các phủ tựa điểm

Chứ ng minh: K ết quả đượ c suy dẫn tr ực tiế p từ định lý 2.12 và 2.13.

Mệnh đề 2.1 Cho C   là một phủ của U , C  và reduct(C ) chưa chắc sinh ra cùng

xấ p xỉ trên loại 2 (ngay cả khi reduct( C  ) là một phân hoạch). 

Chứ ng minh Tính chất trên có thể thấy qua phản ví dụ sau

Phản ví dụ 2.5 Cho U = {a, b, c}, K 1 = {a}, K 2 = {b}, K 3 = {c},  K 4 = {a, b, c}, C  

= { K 1 , K 2 , K 3, K 4}. Ta có reduct(C ) = { K 1 ,K 2 ,K 3}. Nếu X = {c}, thì

( ) 3{ , , } reduct  X a b c X K  = ¹ =C C   

2.4  Tính chất ánh xạ đóng của ba phép xấp xỉ trên dự a vào phủ 

Trong phần này sẽ trình bày nhữ ng tính chấ t của ánh xạ đ óng mà các phép xấ  p

 xỉ phủ trên loại 1, 2, 3 có đượ c ứ ng vớ i phủ nử a thu g ọn, phủ t ự a đ iể m, phủ đơ n vị .

Page 42: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 42/100

 

28

Các k ết quả của W. Zhu và F.Y. Wang trong [37, 38, 40] có thể tổng k ết

  FH TH

Luôn thỏa- phản xạ - lũy đẳng

- phản xạ - đồng biến

- phản xạ - đồng biến

Không thỏa - đồng biến - lũy đẳng - lũy đẳng

Bảng 2.2 Tính chấ t của ánh xạ đ óng ứ ng vớ i ba phép xấ  p xỉ phủ 

2.4.1  Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứ ng vớ i phủ 

đơ n vị Mệnh đề 2.2 Cho C   là một phủ của U , nếu C là ( phủ) đơ n vị thì FH sinh bở i C  

thỏa tính chất: " X,Y  Í U , X  Í Y  Þ  FH ( X ) Í  FH (Y ) (tính đồng biế n)

và TH sinh bở i C   thỏa: TH (TH ( X )) = TH ( X ) (tính l ũ y đẳ ng )

Chứ ng minh Từ bảng tổng k ết 2.1, nếu C là ( phủ) đơ n vị thì  FH = TH. Do

TH thỏa tính đồng biến, FH thỏa tính lũy đẳng (bảng 2.2), nên khi C là ( phủ) đơ n vị 

 FH thỏa tính đơ n điệu và TH thỏa tính lũy đẳng. Tuy nhiên, SH chưa chắc thỏa tính

lũy đẳng nếu C  là ( phủ) đơ n vị.

Phản ví dụ 2.6 Cho U = {a, b, c, d }, K 1 = {a, b}, K 2 = {a, d, c}, K 3 = {a, b, d }, C  

= { K 1 , K 2 , K 3}. C là một phủ đơ n vị của U . Vớ i X = {c}, chúng ta có SH ( X ) = È { K |

 K ÎC , K Ç X  ¹ Æ } = {a, d, c} ¹  SH (SH ( X )) = {a, b, c, d }.

2.4.2  Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứ ng vớ i phủ 

tự a điểm

Mệnh đề 2.3 Cho C  là một phủ của U . Nếu C  là phủ tựa điểm thì FH sinh bở i

C thỏa tính chất: " X,Y Í U, X Í Y Þ FH ( X ) Í  FH (Y ) (tính đồng biế n) 

Chứ ng minh Từ định ngh ĩ a của phủ tựa điểm và FH . Nếu C là một phủ tựa

điểm chúng ta có FH ( X ) = È{Md( x)| x Î X }. Dễ dàng thấy r ằng

Page 43: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 43/100

 

29

" X,Y Í U, X Í Y Þ FH C ( X ) Í  FH C (Y )  (tính đồng biế n). 

Phản ví dụ tiế p theo chỉ ra khi C   là một phủ tựa điểm của U nhưng TH , SH  

không thỏa tính lũy đẳng. 

Phản ví dụ 2.7 Cho U = {a, b, c, d } , K 1 = {a, b} , K 2 = {a, c} , K 3 = {b, d } ,

 K 4 = {d }. C  = { K 1 , K 2 , K 3 , K 4 }. C  là một phủ tựa điểm của U. V ớ i X = {a} , chúng ta

có TH ( X ) = SH ( X ) = {a, b, c} ¹  SH (SH ( X )) = {a, b, c, d }.

2.4.3  Tính chất ánh xạ đóng của ba phép xấp xỉ phủ trên ứ ng vớ i phủ 

nử a thu gọn

Mệnh đề 2.4 Cho C  là một phủ của U, nếu C  là phủ nửa thu gọn thì TH , SH sinh

 bở i C chưa chắc thỏa tính lũy đẳng.

Chứ ng minh Do C là phủ nửa thu gọn thì C cũng là phủ tựa điểm, nên  phản ví dụ 

2.7 cũng chỉ ra r ằng nếu C  là một phủ nửa thu gọn của  U  thì TH và SH chưa chắc thỏa

tính lũy đẳng.

Hệ quả 2.2 Cho C  là một phủ của U , nếu C  là một phủ nửa thu gọn thì FH  là

đơ n điệu.

Chứ ng minh Do định lý 2.12 và mệnh đề 2.3.

Ta có thể tổng k ết tính chất ánh xạ đóng của các phép xấ p xỉ  FH , SH , TH  

sinh bở i ba loại phủ như sau

Phủ đơ n vị 

Phủ tựa điểm

Phủ nửa thu gọn

 FH  Ánh xạ đóng Ánh xạ đóng Ánh xạ đóng

SH  Ánh xạ đóng - -

TH  - - -

Bảng 2.3 Tính chấ t ánh xạ đ óng của ba phép xấ  p xỉ phủ trên sinh bở i ba loại phủ 

Page 44: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 44/100

 

30

2.5  Mối quan hệ giữ a các phép xấp xỉ phủ dự a vào không gian topo

 Nhiề u tác giả trên cơ sở  lý thuyế t không gian topo đ ã đề xuấ t các phép xấ  p xỉ  d ự a vào phủ. Trong phần này, luận án trình bày một số  đ iề u kiện để các phép xấ  p xỉ  

d ự a vào phủ do Y.Yao, W. Zhu, và A.M . Kozae và cộng sự  đề xuấ t là đồng nhấ t.

2.5.1  Quan hệ hai ngôi và không gian topo

a. Không gian topo đượ c xây d ự ng t ừ một quan hệ hai ngôi

Giả sử  R là một quan hệ hai ngôi tùy ý xác định trên U , cặ p (U, R) đượ c gọi là

một không gian xấ p xỉ xác định bở i quan hệ hai ngôi R. Ứ ng vớ i R, có thể định ngh ĩ a

láng giềng trái, phải của một phần tử x thuộc U lần lượ t như sau

lR ( x) = { y | yÎU ,  yRx} và r R ( x) = { y | yÎU , xRy}

Xây dựng topo t1 sử dụng R-láng giềng phải (t ươ ng t ự  , topo t 2 sử d ụng R-láng 

 giề ng trái), chúng ta xem họ S1 = {r R ( x) | x ΠU } là một tiền cơ sở của topo t1 và ký hiệu

S  x = {G Î S1| x ÎG}. Topo t1đượ c gọi là cảm sinh từ quan hệ hai ngôi R.

b. Không gian topo đượ c xây d ự ng t ừ một họ phủ 

Một hệ thống thông tin S = (U, A), U  là một tậ p hữu hạn khác r ỗng các đối

tượ ng, A là một tậ p hữu hạn khác r ỗng các thuộc tính. Vớ i mỗi thuộc tính aΠA xác định

một quan hệ hai ngôi Ra trên U xU như sau

"u,vÎ U, u Ra v khi và chỉ khi u(a)Çv(a) ≠ Æ 

Vớ i định ngh ĩ a này, Ra xác định một phủ C a của U là một topo cảm sinh từ quan

hệ hai ngôi Ra. Vớ i tất cả các thuộc tính thuộc A, chúng ta sẽ có một topo tS đượ c sinh

từ tiền cơ sở   aa AS 

ÎU . Trong đó, S a  là một tiền cơ sở của topo ta.

 Nếu (U , t S ) là một không gian topo đượ c xây dựng từ một họ phủ {C a | "a Π A}

sinh ra từ tậ p các quan hệ { Ra | "a Π A} thì t S  đượ c gọi là  phủ đượ c sản sinh từ hệ thống

thông tin S.

Page 45: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 45/100

 

31

c. Khái niệm rút g ọn không gian topo sản sinh t ừ một t ậ p các quan hệ hai ngôi

Trong [34] khái niệm rút gọn không gian topo sản sinh từ một tậ p các quan hệ 

hai ngôi đượ c đề xuất:

Xét không gian topo (U , t ) sinh ra từ tậ p các quan hệ hai ngôi RA, ký hiệu b  RA là

cơ sở của (U , t ).

Cho RA là một lớ  p các quan hệ hai ngôi, P  Í  RA, r Î P , r  đượ c gọi là không cần

thiết trong P nếu và chỉ nếu: b  P = b  (P-r). Tậ p M đượ c gọi là một rút gọn của P, nếu và

chỉ nếu (i) b  P  = b M , (ii) b  P-{r} ¹  b M , "r ÎM  

d. Danh sách các phép xấ  p xỉ  đ ã đượ c các tác giả định nghĩ a

Cho (U, C ) là một không gian xấ p xỉ phủ. N( x) = Ç{ K ÎC | xΠK } là một lân cận

của x. Ký hiệu X C  cho phần bù của  X đối vớ i U, có ngh ĩ a là X 

C = U - X .

(U , t ) là một không gian topo sử dụng các R-láng giềng phải.

Luận án sẽ khảo sát các phép xấ p xỉ sau

W.Zhu (1) X + = È{ K ÎC | K  Í  X }  X 

+= X + È { N (x) | xΠ X –  X +}

 Xu, Zhang (2)

C + X = { xÎU | (ÇMd( x)) Í  X } C + X = { xÎU | (ÇMd( x))Ç  X ≠Æ }

Yao (3)

( )( )

 R Rr x X 

 X r xÍ

= U   (( ) )C C  X X =  

Yao (4){ | ( ) } R

 R X x U r x X  = Î Íò Ñ { | ( ) } R

 R X x U r x X  = Î Ç ¹ Æòò Ò  

 A.M . Kozae, A.A. Abo Khadra, T. Medhat (5)

0 X X t  =   { : đóng}t  = Ç Í Í Ù X F U X F F    

Bảng 2.4 Các phép xấ  p xỉ phủ định nghĩ a trên không gian topo

2.5.2  Mối quan hệ giữ a các xấp xỉ dự a vào không gian topo

Mệnh đề 2.5 [13] Nếu R, R -1 là 2 quan hệ hai ngôi trên U  đượ c định ngh ĩ a:

Page 46: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 46/100

 

32

 xR  y nếu và chỉ nếu y Î N( x) và  yR -1 x nếu và chỉ nếu xR  y thì

(1) R thỏa tính phản xạ và bắc cầu

(2) R

C X X + = òò Ò và R

C X X + = ò Ñ , " X ÍU  

(3) Ngượ c lại, đối vớ i mỗi quan hệ hai ngôi thỏa tính phản xạ và bắc

cầu R trên U  thì tồn tại một không gian xấ p xỉ phủ (U , C ) thỏa R

C X X + = òò Ò và

 RC X X + = ò Ñ ,  X U " Í  

(4) X + = 1 R X 

-òò Ò ,  X U " Í  

(5) ( ) R x X C X l X  

+

Î= U và ( ), R x X 

 X r x X U  +

Î= " ÍU  

(6) Nếu C X + += vớ i mọi  X ÍU , thì R là một quan hệ tươ ng đươ ng

trên U , do đó C X + += là các phép xấ p xỉ trên cổ điển Pawlak.

Định lý 2.14 [13] Giả sử C  là một phủ đơ n vị của U , thì tồn tại R là quan hệ hai

ngôi có tính phản xạ và bắc cầu trên U thỏa Md( x) = {r  R( x)}, ở  đây r  R(x) là R-láng giềng

 phải của phần tử  xÎU . Ngượ c lại, nếu R là một quan hệ hai ngôi có tính phản xạ và tính

 bắc cầu trên U , thì C = {r  R( x)| xÎU } là một phủ đơ n vị của U và Md( x) = {r  R( x)},"xÎU.

Bây giờ xét hai tậ p con đáng chú ý của P (U ):

G= { X | X Î P (U ), R X  = Æòò Ò } và H= { X Î P (U ) | $Y Î P (U ),

 R X Y = òò Ò }

Mệnh đề 2.6 Nếu R có tính bắc cầu thì

1. R X òò Ò có tính lũy đẳng

2. GÇH = Æ 

Chứ ng minh (1) Nếu R có tính bắc cầu, vớ i mọi X  ÍU , ta có:

: ( ) : ( ) R R R

 x U x X r x X y y r x y X  " Î Î Û Ç ¹ Æ Û $ Î Ù Îòò Ò  

Page 47: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 47/100

 

33

Do đó, , ( ) : R R R R R

 x U x X r x X y U y X xRy" Î Î Û Ç ¹ Æ Û $ Î Î Ùòò òò òò òò  Ò Ò Ò Ò  

, X xRyÛ $ Î (vì R có tính bắc cầu)  R X Û Î òò Ò . Nói cách khác,  R

òò Ò có tính lũyđẳng.

(2) Giả sử  X = GÇ H , thì tồn tại Y Î P (U ) thỏa R

 X Y = òò Ò và R X  = Æòò Ò . Do đó,

 R R R R X Y Y X  = = = = Æòò òò òò òò  Ò Ò Ò Ò .

Trong phần sau, xét một phủ đặc biệt C = t S  .Ở đây (U , t S ) là một không gian

topo đượ c xây dựng trong 2.5.1 a. Hiển nhiên mệnh đề 2.5 vẫn còn đúng. Ngoài ra, tacòn có một số k ết quả sau

Mệnh đề 2.7 Cho (U , t ) là một không gian topo cảm sinh bở i quan hệ hai ngôi

 R. Nếu R là một quan hệ hai ngôi có tính phản xạ thì hai phép xấ p xỉ Yao (3) và Yao (4)

là đồng nhất.

Chứ ng minh Từ  R là một quan hệ phản xạ, chúng ta có R

 X X = ò Ñ , do đó có thể 

viết { | ( ) }={ , ( ) }C C 

 R R X x U r x X x U r X X  = Î Í Î Ç = Æ . Vì vậy,

( ) { | ( ) } { | ( ) }=C C C 

 R R R

 X x U r x X x U r x X X  = Î Ç = Æ = Î Ç ¹ Æ òò Ò .

Mệnh đề 2.8 Cho (U , t S ) là một không gian topo đượ c xây dựng như trong 2.5.1

 b. Xét một phủ đặc biệt của U là C =t S , chúng ta có X + =  X t  , " X  ÍU .

Chứ ng minh Dễ dàng thấy r ằng mọi K ÎC , C = t S , nên K là mở . K ết hợ  p vớ i định

ngh ĩ a của X +,  X t  , ta có điều phải chứng minh.

Hệ quả 2.3 Cho (U,t) là một không gian topo đượ c cảm sinh bở i một quan

hệ hai ngôi R có tính phản xạ và bắc cầu. Xét phủ đơ n vị của U là C ={r R (x) | xÎU},

nếu t=C ta có

(1)  R

 X C X X X X  t + += = = =ò Ñ  

(2)   RC X X + = òò Ò  

Page 48: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 48/100

 

34

(3)  X X t =  

Chứ ng minh 

(1)(2): Theo định lý 2.14 phủ C thỏa điều kiện giả thiết hệ quả 2.3 là tồn tại,

và lúc này Md(x) = {r R (x)}, "xÎU nên (ÇMd(x))ÇX= ÆÛr R (x)ÇX=Æ. Vì vậy,

chúng ta có (1)(2) từ định ngh ĩ a của các phép xấ p xỉ (bảng 2.4).

(3) Từ định ngh ĩ a của  X , ta có thể viết

( ) ( ) ( ( ))( ) ( ( )) ( ( )) ( ( ))C C C 

 R R R

C C C C C

 R R Rr x X r x X X r x X r x r x r x

Í Í Í= = =U I I  

Vớ i mỗi F là tậ p đóng ứng vớ i topo t, F có thể biểu diễn:

F = ( ( ( ))C 

 R

 x L

r xÎU = ( ( ))C 

 R

 x L

r xÎ

I , vớ i L là một tậ p con nào đó của U.

 Nếu X Í F Þ X Í (r R (x))C, "xÎL. Vì vậy, từ định ngh ĩ a của  X t  = Ç{F Í U |

XÍF Ù F đóng} ta có cũng có thể viết( ( ))

( ( ))C  R

 R X r x X r x X  t 

Í= =I .

 Như vậy, chúng ta đã chỉ ra mối quan hệ giữa các phép xấ p xỉ Zhu(1), Xu và

Zhang(2), Yao(4). Tuy nhiên, mối quan hệ giữa các xấ p xỉ của A.Mkozae và cộng sự 

(5), Yao(3) và của các tác giả khác chưa đượ c trình bày. Điều này có thể thấy qua các

tính chất sau

Chú ý 2.2 Trong tr ườ ng hợ  p tổng quát, , X X t  là khác nhau. A.M. Kozae và

cộng sự đã phát biểu, xấ p xỉ của họ là tốt hơ n xấ p xỉ của Yao (3) [7] do xấ p xỉ của họ 

làm giảm vùng biên bằng cách tăng xấ p xỉ dướ i và giảm xấ p xỉ trên. Tuy nhiên họ đã

không chứng minh, ta có thể thấy điều này quan nhận xét :

Cho (U , t S ) là một không gian topo đượ c xây dựng theo 2.5.1 b. Xét một phủ 

của U  là C = t S .  Mọi tậ p con X   Í  P (U ), thì  X X t  Í . Thậy vậy, từ định ngh ĩ a của

 X t  , ta thấy nó là giao tất cả các tậ p đóng chứa  X , mà  X  là tậ p đóng chứa X . Vì vậy,

 X X t  Í .

Từ đó ta có  X X X X  t t - Í - vì  X X t  = .

Page 49: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 49/100

 

35

Vớ i các phủ là các topo đượ c xây dựng từ 2.5.1 b, việc rút gọn phủ là khó khăn.

Có thể sử dụng rút gọn đượ c đề xuất bở i Zhu và Wang để giải quyết vấn đề này [39].

Một ý tưở ng khác là tr ướ c khi xử lý các xấ p xỉ của Yao(3) hay A.M . Kozae,

A.A. Abo Khadra, T. Medhat (5), có thể rút gọn không gian topo theo 2.5.1 c.

Trong [13], Guilong Liu, Ying Sai có đề xuất khái niệm chuyển đổi phủ. Việc

chuyển đổi này có thể xem là một phươ ng pháp rút gọn phủ (do làm giảm số l ượ ng của

 phủ). Phép chuyển đổi phủ đượ c định ngh ĩ a như sau

Gọi C(U ) là tậ p tất cả các phủ của U , định ngh ĩ a một phép chuyển đổi F   từ C(U )

đến C(U ): F  : C(U ) ® C(U ), vớ i C  ÎC(U ) : F  (C ) = C ’= {N( x) | xÎU }

Đối vớ i phép chuyển đổi phủ này các phép xấ p xỉ phủ trên , X C X  + + và xấ p xỉ 

 phủ dướ i C X + là không đổi. Tuy nhiên, phép chuyển đổi này không bảo toàn không

gian topo. Nói khác hơ n, xấ p xỉ của Yao(3) và xấ p xỉ của A.M . Kozae và cộng sự (5)

không bảo toàn vớ i phép chuyển đổi này. Có thể thấy qua phản ví dụ 

Giả sử U = {a, b, c, d }, topo t đượ c định ngh ĩ a trên U : C = t = {Æ, U , {d }, {c,

d }}, F  (C )= {N(a) = U , N(b) = U , N(c) = {c, d }, N(d ) = {d }}. Dễ thấy F  (C ) không còn là

một topo.

2.6  Rút gọn tập thuộc tính dự a vào họ phủ tập thô

Bài toán rút gọn tậ p thuộc tính là một bài toán quan tr ọng trong hệ thống thông

tin nói chung, lý thuyết tậ p thô nói riêng. Bài toán này thuộc lớ  p NP-khó là do sự tổ hợ  p

các thuộc tính [1, 4]. Trong hệ thống thông tin không đầy đủ, bài toán tìm rút gọn tối

thiểu tậ p thuộc tính cũng vẫn thuộc lớ   p NP-khó. Nhiều tác giả đã phát triển các giải

thuật rút gọn tậ p thuộc tính trong lý thuyết tậ p thô cổ điển thành các giải thuật rút gọn

tậ p thuộc tính cho các hệ thống thông tin không đầy đủ trên cơ sở phủ tậ p thô [8, 10, 16,

17]. Việc xử lý một hệ thống thông tin không đầy đủ cũng đượ c nhiều tác giả tiế p cận

dựa trên họ phủ t ậ p thô. Đây là một hướ ng tiế p cận khá thú vị, có thể thấy qua ví dụ 

Page 50: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 50/100

 

36

Ví dụ 2.7 [10] Xét hệ thống đánh giá hệ thống lươ ng và trình độ chuyên môn

của một tổ công tác vớ i giả định: Tổ công tác có 9 thành viên ứng vớ i tậ p phổ dụng U =

{ x1 ,.. ,x9}, E = {Trình độ , Lươ ng } là tậ p hai thuộc tính liên quan. Các giá tr ị của thuộc

tính ‘Trình độ’ là {Giỏi, Khá, Tr_bình} và các giá tr ị của thuộc tính ‘Lươ ng’ là {Cao,

V ừ a, Thấ  p}. Ba chuyên gia {A, B, C} sẽ tham gia đánh giá các thành viên như sau:

Đối vớ i thuộc tính “Trình độ”

A: Giỏi = { x1 , x4 , x5 , x7 }, Khá = { x2 , x8}, Tr_bình = { x3 , x6  , x9}

B: Giỏi = { x1 , x2 , x4 , x7  , x8}, Khá = { x5}, Tr_bình = { x3 , x6  , x9}

C: Giỏi = { x1 , x4 , x7 }, Khá = { x2 , x8}, Tr_bình = { x3 , x5 , x6  , x9 }

Đối vớ i thuộc tính “Lươ ng”

A: Cao = { x1 , x2 , x3}, Vừa = { x4 , x5 , x6  , x7  , x8}, Thấ p = { x9}

B: Cao = { x1 , x2 , x3}, Vừa = { x4 , x5 , x6  , x7 }, Thấ p = { x8 , x9}

C: Cao = { x1 , x2 , x3}, Vừa = { x4 , x5 , x6  , x8}, Thấ p = { x7  , x9}

Giả sử đánh giá của ba chuyên gia này có tầm quan tr ọng như nhau, để khỏi mất

mát thông tin, chúng ta cần hợ  p các k ết quả đánh giá trong mỗi tiêu chí. Cụ thể,

- Phủ đặc tr ưng cho thuộc tính ‘Trình độ’ là

C 1= {C11={ x1 , x2 , x4 , x5 , x7  , x8} (Giỏi), C12= { x2 , x5 , x8} (Khá), C13 = { x3 , x5 , x6  , x9} (Tr_bình)}

- Phủ đặc tr ưng cho thuộc tính ‘Lươ ng’ là

C 2 = {C21={ x1 , x2 , x3} (Cao), C22 = { x4 , x3 , x6  , x7  , x8} (Vừa), C23 = { x7  , x8 , x9} (Thấ p)}

Có thể tổng k ết qua bảng sau

Lươ ng Trình độ 

Giỏi Khá Tr_bình

Cao { x1 , x2} { x2} { x3}

Vừa { x4 , x5 , x7  , x8} { x5 , x8} { x5 , x6 }

Thấ p { x7  , x8} { x8} { x9}

Bảng 2.5  Bảng phân loại theo đ ánh giá của ba chuyên gia 

Page 51: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 51/100

 

37

 Nói khác hơ n họ phủ đặc tr ưng cho cho hệ thống thông tin này là D={C 1, C 2 }.

Đối vớ i bài toán rút gọn tậ p thuộc tính của một họ phủ quyết định tậ p thô, Chen

Degang và cộng sự trong bài báo của mình [8] đã đề xuất một thuật toán tìm tất cả các

rút gọn. Ý tưở ng chính của thuật toán là dựa vào ma tr ận không phân biệt. Tuy nhiên,

 bài toán rút gọn tậ p thuộc tính là NP-khó, nên đôi khi ngườ i ta chỉ tìm một rút gọn

(nhằ m thu g ọn kích thướ c của hệ thố ng thông tin). Vớ i mục tiêu đó, luận án trình bày

một thuật toán mớ i FC_Reduct tìm một rút gọn tối thiểu tậ p thuộc tính ứng vớ i một họ 

 phủ quyết định tậ p thô. Độ phức tạ p của thuật toán này là O(|D||U |2) tươ ng đươ ng vớ i

các thuật toán rút gọn tậ p thuộc tính trong lý thuyết tậ p thô cổ điển.

M ột số khái niệm và k ế t quả trong 2.6.1 do Cheng Degang và cộng sự  đề xuấ t 

2.6.1  Một số khái niệm và k ết quả cơ sở  

Các khái niệm cở sở về một họ phủ quyết định tậ p thô và các k ết quả chính đượ c

đề cậ p trong [2, 8, 30]

 A. Phủ suy d ẫ n

Vớ i C ={C 1 , C 2 , ..,C n} là một phủ của U . Vớ i mọi xÎU , đặt C  x = Ç{C  j | C  jÎC , 

 xÎC  j}. Cov(C ) = {C  x: xÎU } cũng là một phủ của U  đượ c gọi là một phủ suy dẫn của C .

Khái niệm phủ suy dẫn của một họ phủ tậ p thô cũng đượ c định ngh ĩ a tươ ng tự:

Cho D = {C i  | i=1,...,m} là một họ phủ của U . Vớ i mọi  xÎU , đặt

i{ | ( ), }D = Ç Î Î x ix ix ixC C Cov x C  C  thì Cov(D) = {Dx:  xÎU } cũng là một phủ của U 

đượ c gọi là một phủ suy dẫn của D. Rõ ràng vớ i mỗi xÎU, Dx là giao tất cả các phần tử C i chứa x. Dx là tậ p tối thiểu

thuộc Cov(D) chứa  x. Nếu mỗi phủ thuộc D là ứng vớ i một thuộc tính thì

{ | ( ), }C D = Ç Î Î x ix ix i ix

C C Cov x C  , Cov(D) có thể xem là giao các phủ thuộc D. Nếu

mỗi phủ thuộc D là một phân hoạch, thì Cov(D) cũng là một phân hoạch và D x là một

lớ  p tươ ng đươ ng chứa x, khi đó vớ i mọi x, y ÎU , nếu yÎDx thì D x Ê D y , vì vậy  yÎD x 

và xÎD y thì D x = D y.

Page 52: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 52/100

 

38

Lưu ý r ằng mỗi phần tử của Cov(D) không thể biểu diễn bằng hợ  p các phần tử 

còn lại thuộc Cov(D). Xét lại ví dụ 2.7 trên để minh họa ý ngh ĩ a của C  x và D x.

Ví dụ 2.8 [8] Trong ví dụ 2.7 nếu đặt D = {C 1, C 2}, ở  đây C 1 là ứng vớ i thuộc

tính ‘Trình độ” và C 2 là ứng vớ i thuộc tính ‘Lươ ng’, thì51 5 11 12 13{ }= x

C x C C C= Ç Ç ,

điều này đưa đến mô tả “Trình độ” có thể chấ p nhận của x5 là (Giỏi Ú Khá Ú Tr_bình).

8 xD  = (C 11ÇC 12)Ç(C 22ÇC 23) đưa đến mô tả của  x8 là {‘Trình độ’(Giỏi Ú Khá) Ù 

‘Lươ ng’( Vừa Ú Thấ p)}.

Vớ i mỗi X Í U , xấ p xỉ dướ i và xấ p xỉ trên của X tươ ng ứng vớ i Cov(D) đượ cđịnh ngh ĩ a như sau

( ) { : },

( ) { : }

 x x

 x x

 X X 

 X X 

D = È D D Í

D = È D D Ç ¹ Æ 

 Ngoài ra, các miền dươ ng, âm, biên của X  ứng vớ i D đượ c xác định tươ ng ứng

( ) ( ),

( ( ),

( ) ( ) ( )

 POS X X  

 NEG U X  

 BN X X X  

D

D

D

= D

- D

= D - D

 

Rõ ràng trong Cov(D), Dx là một lớ  p tối thiểu chứa x.

2.6.2  Rút gọn tập thuộc tính các hệ thống quyết định nhất quán và

không nhất quán

Khi khảo sát một hệ quyết định ứng vớ i một họ phủ, hệ quyết định đượ c phân

thành hai loại: hệ thống quyết định nhất quán và hệ thống quyết định không nhất quán.

Gọi D = {C i : i=1,...,m} là một họ phủ của U , D là thuộc tính quyết định, U/D là

một phân hoạch trên U . Nếu " xÎU , $ D jÎU/D : Dx Í  D j, khi đó hệ quyết định (U ,D, D)

đượ c gọi là hệ quyết định nhất quán và ký hiệu Cov(D)£U/D. Ngượ c lại, (U,D,D) đượ c

gọi là hệ quyết định không nhất quán. D-miền khẳng định dươ ng của D đượ c định ngh ĩ a

Page 53: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 53/100

 

39

/

( ) ( ) X U D

 POS D X  DÎ

= DU  

Một phủ không cần thiết của một họ phủ ứng vớ i hệ quyết định nhất quán và

không nhất quán đượ c xác định như sau

Xét (U , D, D = {d }) là một hệ quyết định nhất quán. Vớ i C iÎD, nếu Cov(D-{C i})

£ U/D thì C i thuộc D đượ c nói là không cần thiết đối vớ i D, ngượ c lại C i đượ c nói là cần

thiết đối vớ i D. Tậ p P  Í D , Cov( P ) ={ P  x| xÎU } thỏa Cov( P ) £ U/D, nếu mọi phần tử 

thuộc P là cần thiết, có ngh ĩ a là "C iΠP , Cov(D-{C i})£U/D là sai thì P  đượ c gọi là một

rút gọn của D.

Tậ p tất cả các phần tử cần thiết trong D tươ ng ứng vớ i D đượ c gọi là nhân của D 

ứng vớ i D, ký hiệu CoreD(D). Rút gọn tậ p thuộc tính của một hệ quyết định nhất quán là

một tậ p tối thiểu các thuộc tính điều kiện đảm bảo chắc chắn các luật quyết định là nhất

quán.

Xét một U là một tậ p hữu hạn các đối tượ ng và D = {C i | i=1,..,m} là một họ các

 phủ của U , C iÎD,  D là một thuộc tính quyết định tươ ng ứng vớ i D trên U và d : U  ® Id  

là hàm quyết định đượ c định ngh ĩ a d (u) = u( D), "uÎU . Ta có " xi , x j Î [u] D Û  xi( D) =

 x j( D) = u( D), vì vậy không nhầm lẫn có thể viết d ( xi) = d ( x j) = d ([u] D) = d (u).

Tươ ng tự như 1.1.6, một hệ quyết định phủ  (U,D , D) là không nhất quán khi 

 POS D(D) ¹ U . Nếu  { }( ) ( )C D D-= i POS D POS D , thì C i là phần tử trong D không cần thiết

tươ ng ứng vớ i D. Ngượ c lại, C i là phần tử cần thiết tươ ng ứng vớ i D. Vớ i mỗi P Í D,

nếu mọi phần tử trong P   là  phần tử cần thiết đối vớ i D, và POS  P ( D) = POS D( D) thì P  đượ c gọi là một rút gọn của D ứng vớ i D.

2.6.3  Một số k ết quả liên quan giữ a họ phủ và phủ suy dẫn

Trong phần trình bày sau, các ký hiệu bao hàm đượ c qui ướ c

Page 54: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 54/100

 

40

A Ì B Û A Ø B; A Ë B Û A Í/ B

Định lý 2.15 [8] Giả sử U là tậ p phổ dụng hữu hạn và D = {C 

i : i=1,..m} là mộthọ các phủ của U , các mệnh đề sau là đúng:

(1) Dx = Dy nếu và chỉ nếu vớ i mọi C iÎD ta có Cix= Ciy.

(2) Dx É Dy nếu và chỉ nếu vớ i mọi C iÎD ta có Cix Ê Ciy và tồn tại tối thiểu một

C k ÎD mà Ckx É Cky.

(3) Dx Ë Dy và Dy Ë Dx nếu và chỉ nếu tồn tại C i, C  jÎD mà Cix Ì Ciy và C jx É C jy 

hay tồn tại C k ÎD mà Ckx Ë Cky và Cky Ë Ckx.

Định lý 2.16 [8] Giả sử Cov(D)£U/D, C iÎD, C i là cần thiết có ngh ĩ a Cov(D-

C i})£U/D là sai nếu và chỉ nếu tồn tại ít nhất một cặ p xi , x jÎU thỏa d ([ xi] D) ¹ d ([ x j] D),

quan hệ giữa chúng tươ ng ứng vớ i D sẽ thay đổi sau khi C i  bị loại bỏ khỏi D..

Định lý 2.17 [8] Giả sử Cov(D)£U/D, P Í D thì Cov( P )£U/D nếu và chỉ nếu vớ i

mọi cặ p xi , x jÎU thỏa d ([ xi] D) ¹ d ([ x j] D), quan hệ giữa xi , x j ứng vớ i D tươ ng đươ ng vớ i

quan hệ của chúng đối vớ i P , ngh ĩ a lài j x xD Ë D và

 j i i j x x x x P P D Ë D Û Ë và j i x x P P Ë  

Định lý 2.18 [8] Hệ quyết định không nhất quán (U , D, D ={d }) có các tính chất :

(1) " xiÎU , nếu ( )i x

 POS DDD Ì thì [ ]i x i  D

 xD Í ; nếu ( )i x

 POS DDD Ë thì

[ ],ik x k   D

 x U x" Î D Í là không đúng.

(2) , ( ) ( ) P  P POS D POS DD" Í D = nếu và chỉ nếu ( ) ( ), / P X X X U D= D " Î .

(3) " P Í D, POS  P ( D)= POS D( D) nếu và chỉ nếu " xiÎU , [ ] [ ]i i x i x i D D

 x P xD Í Û Í  

Trong phần tiế  p theo, luận án trình bày cơ sở lý thuyế t và thuật toán FC_Reduct.

Thuật toán FC_Reduct rút g ọn t ậ p thuộc tính d ự a vào một họ phủ t ậ p thô của một hệ 

quyế t định. M ặ c dù FC_Reduct phát triể n trên cơ sở lý thuyế t do Cheng Degang và

cộng sự  đề xuấ t, như ng đ iể m khác biệt cần l ư u ý là FC_Reduct không d ự a vào ma tr ận

Page 55: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 55/100

 

41

không phân biệt để rút g ọn t ậ p thuộc tính mà d ự a vào các tính chấ t đượ c phát hiện bở i

định lý 2.19, 2.20.

2.7  Thuật toán FC_Reduct rút gọn tập thuộc tính dự a vào họ 

phủ tập thô

Nhận xét 2.1 Từ định ngh ĩ a của đại lượ ng Dx. Vớ i (U, D,  D={d }) là một hệ 

quyết định phủ nhất quán, d là hàm quyết định d : U  ®  I d  xác định từ tậ p vũ tr ụ U vào

tậ p giá tr ị  I d . Ta có các k ết quả sau

- Vớ i mỗi xi , x jÎU , nếu i j x xD Í D thì

( ) ([ ] ) ( ) ( ) ( ) ([ ] )i ji i D x x j j Dd x d x d d d x d x= = D = D = =  

- Nếu ( ) ( )i jd x d x¹ thì

i j x xD Ç D = Æ có ngh ĩ a lài j x xD Ë D và

 j i x xD Ë D .

Định lý 2.19 Cho (U , D, D = {d }) là một hệ quyết định phủ, P Í D, ta có:

a. (U , D, D = {d }) là một hệ quyết định phủ nhất quán khi và chỉ khi thỏa[ ] x  D

 x U   x

 xU 

Î

D Ç=

Då  

 b. Giả sử Cov(D)£U/D, C iÎD, C i là không cần thiết khi và chỉ khi thỏa

( ) ( ) ( ) ( ) 0i j i j i j x x x x x x

 xi U xj U  

 P P d d  Î Î

D Ç D È Ç D - D =å å  

Ở đây, Cov(D-{C i})={ P  x | xÎU }, Cov(D)={Dx | xÎU }.

Chứ ng minh a.Từ định ngh ĩ a của một hệ nhất quán, ta có (U , D, D={d }) là một

hệ nhất quán nếu : [ ] x D x U x" Î D Í . Mà

[ ][ ] [ ]  x D

 x D x D x

 x U   x

 x x x U  

Î

D ÇD Í Û D Ç = D Û =

Då . Nói khác hơ n ta có a.

 b. Đặt Cov(D - {C i}) = Cov ( P ) = { P  x | xÎU }, Cov(D)={Dx | xÎU }

Page 56: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 56/100

 

42

 Nếu (U , D,  D={d }) là một hệ nhất quán, theo định ngh ĩ a C i là không cần thiết

nếu và chỉ nếu Cov(D - {C i}) = Cov ( P ) £ U/D. Theo định lý 2.17, Cov( P )£U/D khi và

chỉ khi ,i j x x U  " Î thỏa ([ ] ) ([ ] )i D j D

d x d x¹  phải có:

( ) ( )i j i j x x x x P P D Ç D = Æ Û Ç = Æ , điều này cũng có ngh ĩ a là

( ) ( ) ( ) ( ) 0i j i j i j x x x x x x

 P P d d  D Ç D È Ç D - D =  

Chú ý r ằng, nếu  xi , x j  ÎU  thỏa ([ ] ) ([ ] ) ( ) ( ) 0i ji D j D x x

d x d x d d  = Û D - D =  

(nhận xét 2.1). Điều đó cũng có ngh ĩ a là C ikhông cần thiết khi và chỉ khi

( ) ( ) ( ) ( ) 0i j i j i j x x x x x x

 xi U xj U  

 P P d d  Î Î

D Ç D È Ç D - D =å å  

Định lý 2.20 Cho (U , D, D = {d }) là một hệ quyết định không nhất quán. P Í D,

 POS  P ( D) =  POS D( D) nếu và chỉ nếu " xiÎU , ta có:

[ ] [ ]0i i

i i

 x i D x i D

 x x

 x P x

 P 

D Ç Ç- =

D

 

Chứ ng minh Đây là k ết quả tr ực tiế p từ 3 tính chất của định lý 2.18. Từ điều

kiện (3) của định lý 2.18

, ( ) ( ) P  P POS D POS DD" Í D = Û , [ ] [ ]

i ii x i D x i D x U x P x" Î D Í Û Í  

điều này cũng có ngh ĩ a là

, [ ] [ ]i i i ii x i D x x i D x

 x U x P x P  " Î D Ç = D Û Ç =  

[ ] [ ], 0i i

i i

 x i D x i D

i

 x x

 x P x x U 

 P 

D Ç ÇÛ " Î - =

Hay viết khác hơ n, ta có:

[ ] [ ]0i i

ii i

 x i D x i D

 x U   x x

 x P x

 P Î

D Ç Ç- =

Då  

Page 57: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 57/100

 

43

2.7.1  Thuật toán FC_Reduct rút gọn thuộc tính của họ quyết định phủ 

tập thô

 Đầu vào: Cho hệ quyết định phủ T = (U , D, D = {d }).

 Đầu ra: Một rút gọn tậ p thuộc tính RD of  D..

 Phươ ng pháp:

Bướ c 1: Tính

[ ] x  D

 x U   x

 xCI Î

D Ç= Då 

Bướ c 2: If  CI = |U | {T là một hệ quyế t định nhấ t quán} then goto Bướ c 3,

else goto Bướ c 5.

Bướ c 3: Tính Dx, d (Dx) , " xÎU .

Bướ c 4: begin 

 for each C i ÎD do 

( ) ( ) ( ) ( ) 0i j i j i j

i j

 x x x x x x

 x U x U  

if P P d d  Î Î

D Ç D È Ç D - D =å å  

then D:= D - {C i }; {ở  đây D - {C i }= { P  x | xÎU }}

endif 

endfor  

 goto Bướ c 6.

end ;

Bướ c 5: begin 

 for each C i ÎD do 

Page 58: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 58/100

 

44

 If  [ ] [ ]

0 j j

 j

 j j

 x j D x j D

 x U   x x

 x P x

 P Î

D Ç -- =

Då  

then  D:= D - {C i }; {ở  đây D - {C i }= { P  x | xÎU }}

endif 

endfor 

end;

Bướ c 6: RD= D; thuật toán k ết thúc.

2.7.2  Đánh giá độ phứ c tạp thuật toán FC_Reduct

Thuật toán này có độ phức tạ p là đa thức theo |U |. Thật vậy,

Bướ c 1, độ phức tạ p tính CI là O(|U |).

Bướ c 2, độ phức tạ p là O(1).

Bướ c 3, độ phức tạ p là O(|U |)

Bướ c 4, độ phức tạ p tính åå() là O(|U |2), do đó độ phức tạ p của bướ c này là

O(|D||U |2), vì i=1..|D|.

Bướ c 5, tươ ng tự độ phức tạ p ở bướ c 3, độ phức tạ p là O(|D||U |2).

Bướ c 6, độ phức tạ p O(1).

Vì vậy, độ phức tạ p của cả giải thuật là O(|D||U |2) (ở  đ ây chúng ta bỏ qua thờ i

 gian tính ,

i i x x P D

 vớ i i= 1..|D|). 

Ví d ụ minh họa

a. Ví d ụ khi hệ thố ng quyế t đị nh phủ là nhấ t quán

Giả sử U = { x1 , x2 , .., x9}, D = {C i | i=1..4}, và

C 1={{ x1 , x2 , x4 , x5 , x7  , x8},{ x2 , x3 , x5 , x6  , x8 , x9}},

C 2={{ x1 , x2 , x3 , x4 , x5 , x6 },{ x4 , x5 , x6  , x7  , x8 , x9}},

Page 59: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 59/100

 

45

C 3={{ x1 , x2 , x3},{ x4 , x5 , x6  , x7  , x8 , x9},{ x8 , x9}},

C 4={{ x1 , x2 , x4 , x5},{ x2 , x3 , x5 , x6 },{ x7  , x8},{ x5 , x6  , x8 , x9}}

U/D={{ x1 , x2 , x3}, { x4 , x5 , x6 }, { x7  , x8 , x9}}

Trong trình bày sau, viết iD thay choi xD và  P i thay cho

i x P  (viế t thu g ọn)

Bướ c 1:

D1={ x1 , x2}, D2={ x2}, D3={ x2 , x3}, giả định d(D1) = d(D2) = d(D3) = 1,

vì D1, D2, D3Í{ x1 , x2 , x3}

D4={ x4 , x5}, D5={ x5}, D6={ x5 , x6 }, giả định d(D4) = d(D5) = d(D6) = 2,vì D4, D5, D6Í { x4 , x5 , x6 }

D7={ x7  , x8}, D8={ x8}, D9={ x8 , x9}, giả định d(D7) = d(D8) = d(D9) = 3,

vì D7, D8, D9Í { x7  , x8 , x9}

CI = 9Þ S là một hệ nhất quán.

Bướ c 2: P = D - {C 1}:

P1={ x1 , x2}, P2={ x2}, P3={ x2 , x3}, P4={ x4 , x5}, P5={ x5},P6={ x5 , x6 }, P7={ x7  , x8}, P8={ x8}, P9={ x8 , x9}

( ) ( ) ( ) ( ) 0i i j i j

i j

 x xj x x x x

 x U x U  

 P P d d  Î Î

D Ç D È Ç D - D =å å  

D=D - {C 1}={C 2, C 3, C 4}; C 1 là không cần thiết nên loại bỏ.

Bướ c 3: P = D - {C 2}

P1={ x

1 , x

2}, P

2={ x

2}, P

3={ x

2 , x

3},

P4={ x4 , x5}, P5={ x5}, P6={ x5 , x6 }, P7={ x7  , x8}, P8={ x8}, P9={ x8 , x9}

( ) ( ) ( ) ( ) 0i j i j i j

i j

 x x x x x x

 x U x U  

 P P d d  Î Î

D Ç D È Ç D - D =å å  

D=D - {C 2}= {C 3, C 4}; C 2 là không cần thiết nên loại bỏ.

Bướ c 4: P = D - {C 3}:

Page 60: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 60/100

 

46

P1={ x1 , x2 , x4 , x5}, P2={ x2}, P3={ x2 , x3 , x5 , x6 }, P4={ x4 , x5}, P5={ x5},

P6={ x5 , x6 }, P7={ x4 , x5 , x7  , x8}, P8={ x5 , x8}, P9={ x5 , x6  , x8 , x9}

( ) ( ) ( ) ( ) 0i j i j i j

i j

 x x x x x x

 x U x U  

 P P d d  Î Î

D Ç D È Ç D - D ¹å å  

(có thể thấy:(D1ÇD4)=Æ, nhưng (P1ÇP4)¹Æ, |d (D1)-d (D4)|≠0) do đó C 3 là cần

thiết không thể loại bỏ: D={C 3, C 4}.

Bướ c 5: P = D - {C 4}

P1={ x1 , x2 , x3}, P2={ x1 , x2 , x3}, P3={ x1 , x2 , x3}, P4={ x4 , x5 , x6  , x7  , x8 , x9},

P5={x4, x5, x6, x7, x8, x9}, P6={x4, x5, x6, x7, x8, x9}

P7={x7, x8, x9}, P8={x7, x8, x9}, P9={x7, x8, x9}

( ) ( ) ( ) ( ) 0i j i j i j

i j

 x x x x x x

 x U x U  

 P P d d  Î Î

D Ç D È Ç D - D ¹å å  

(có thể thấy:(D6ÇD7)=Æ, nhưng (P6ÇP7)¹Æ, |d (D6)-d (D7)|≠0) do đó C 4 là cần

thiết không thể loại bỏ: D={C 3, C 4}.

Bướ c 6: RD= {C 3, C 4} là một rút gọn họ phủ tậ  p thô. Ứ ng vớ i rút gọn này 2

thuộc tính tươ ng ứng vớ i C 1, C 2 bị loại bỏ. 

b. Ví d ụ về một hệ quyế t đị nh phủ không nhấ t quán

Giả sử U ={ x1 , x2 , x3 , x4 , x5 , x6  , x7  , x8 , x9 , x10} và D ={C i, i=1..4}

C 1 ={{ x1 , x2 , x3 , x4 , x6  , x7  , x8 , x9 , x10},{ x3 , x4 , x6  , x7 },{ x3 , x4 , x5 , x6  , x7 }}

C 2 ={{ x1 , x2 , x3 , x4 , x5 , x6  , x7 },{ x6  , x7  , x8 , x9},{ x10}}

C 3 ={{ x1 , x2 , x3 , x6  , x8 , x9 , x10},{ x2 , x3 , x4 , x5 , x6  , x7  , x9}}

C 4 ={{ x1 , x2 , x3 , x6 },{ x2 , x3 , x4 , x5 , x6  , x7 },{ x6  , x8 , x9 , x10},{ x6  , x7  , x9}}

U/D={{ x1 , x2 , x3 , x6 }, { x4 , x5 , x7 }, { x8 , x9 , x10}}

Trong trình bày sau, viếti

D thay choi x

D và  P i thay choi x

 P  (viế t thu g ọn)

Page 61: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 61/100

 

47

Bướ c 1:

∆1={ x1 , x2 , x3 , x6 }; ∆2={ x2 , x3 , x6 }; ∆3={ x3 , x6 };

∆4={ x3 , x4 , x6  , x7 }; ∆5={ x3 , x4 , x5 , x6  , x7 };∆6={ x6 };

∆7={ x6  , x7 }; ∆8={ x6  , x8 , x9}; ∆9={ x6  , x9}; ∆10={ x10};

CI ¹ 9Þ S là một thống không nhất quán.

Bướ c 2: P = D – {C 1}:

P1={ x1 , x2 , x3 , x6 }; P2=P3={ x2 , x3 , x6 }; P4=P5={ x2 , x3 , x4 , x5 , x6  , x7 };P6={ x6 };

P7={ x6  , x7 }; P8={ x6  , x8 , x9}; P9= { x6  , x9}; P10={ x10}; 

[ ] [ ]0i i

i i i

 x i D x i D

 x U   x x

 x P x

 P Î

D Ç Ç- =

 

∆=∆ - {C 1}={C 2, C 3, C 4}. C 1 là không cần thiết.

Bướ c 3: P = D – {C 2}

P1={ x1 , x2 , x3 , x6 }; P2=P3={ x2 , x3 , x6 }; P4=P5={ x2 , x3 , x4 , x5 , x6  , x7 }; P6={ x6 };

P7={ x2 , x3 , x4 , x5 , x6  , x7 }; P8={ x6  , x8 , x9 , x10}; P9= { x6  , x9}; P10={ x6  , x8 , x9 , x10} 

[ ] [ ]0i i

i i i

 x i D x i D

 x U   x x

 x P x

 P Î

D Ç Ç- ¹

 

C 2 là cần thiết trong ∆={C 2, C 3, C 4}.

Bướ c 4: P = D – {C 3}

P1={ x1 , x2 , x3 , x6 }; P2=P3={ x2 , x3 , x6 }; P4=P5={ x2 , x3 , x4 , x5 , x6  , x7 };

P6={ x6 }; P7={ x6  , x7 };

P8=P9= { x6  , x8 , x9 }; P10={ x10} 

[ ] [ ]0i i

i

i i

 x i D x i D

 x U   x x

 x P x

 P Î

D Ç Ç- =

 

Page 62: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 62/100

 

48

∆=∆ - {C 3}={C 2, C 4}. C 3 là không cần thiết.

Bướ c 5: P = D – {C 4}

P1= P2=P3= P4=P5={ x1 , x2 , x3 , x4 , x5 , x6  , x7 }

P6= P7={ x6  , x7 }; P8=P9= { x6  , x7  , x8 , x9 }; P10={ x10} 

[ ] [ ]0i i

i i i

 x i D x i D

 x U   x x

 x P x

 P Î

D Ç Ç- ¹

 

C 4 là cần thiết trong ∆={C 2, C 4}.

Bướ c 6: RD = {C 2,C 4} là một rút gọn có ngh ĩ a là C 1, C 3 bị loại bỏ.

So sánh k ết quả tìm đượ c vớ i k ết quả của Chen Degang, ta có bảng tổng k ết

Bảng 2.6  K ế t quả rút g ọn t ậ p thuộc tính của Chen Degang và thuật toán FC_Reduct  

2.8  Ứ ng dụng thuật toán FC_Reduct cho bài toán xử  lý thông

tin dạy và học tại Đ.H Nha Trang

2.8.1  Giớ i thiệu bài toán

Hàng năm để nâng cao chất lượ ng giảng dạy tại Đại học Nha Trang, phòng

Kiểm định chất lượ ng đào tạo của tr ườ ng sẽ phát phiếu khảo sát chất lượ ng của mỗi

môn học đến sinh viên ( phụ l ục). Biểu mẫu cũng như nội dung khảo sát đượ c nhà

tr ườ ng thông qua dựa vào các tiêu chí giáo dục đại học do nhóm chuyên gia giáo dục

soạn thảo. Mỗi một phiếu khảo sát thu về, Trung tâm Nghiên cứu & Phát triển Công

nghệ Phần mềm ĐH Nha Trang (TTNCPTPM) xử lý: nhận dạng và chuyển qua dữ liệu

 K ế t quả của thuật toán Chen Degang K ế t quả Thuật toán FC_Reduct 

Ví d ụ hệ quyế t định phủ nhấ t quán

Red(D) = {{C 3, C 4}, {C 2, C 3}} RD = {C 3, C 4}

Ví d ụ về hệ quyế t định không nhấ t quán

Red(D) = {{C 2, C 4}, {C 2, C 3}} RD = {C 2,C 4}

Page 63: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 63/100

 

49

số (lưu tr ữ dướ i dạng *.mdb). Sau đó, căn cứ vào các tiêu chí đánh giá, phần mềm của

TTNCPTPM k ết xuất k ết quả đánh giá chất lượ ng giảng dạy của giáo viên. Trong các

niên học vừa qua, những k ết quả thu đượ c từ phần mềm của TTNCPTPM đã giúp cho

nhà tr ườ ng bướ c đầu phân loại chất lượ ng giảng dạy của giáo viên và thông tin học tậ p

của sinh viên.

Trên cơ  sở nghiên cứu về lý thuyết tậ p thô, chúng tôi muốn xây dựng một

 phần mềm ứng dụng rút trích tậ p luật quyết định từ dữ liệu khảo sát. K ết quả thu

đượ c sẽ là một kênh tham khảo thú vị, vì k ết quả rút trích luật này dựa trên mô hình

toán học độc lậ p vớ i mô hình do nhóm chuyên gia giáo dục đề xuất.

2.8.2  Ứ ng dụng thuật toán FC_Reduct rút gọn tập thuộc tính

Từ một bảng quyết định có nhiều đối tượ ng, tậ p luật quyết định rút trích đượ c là

r ất lớ n. Để thu gọn tậ p luật quyết định mà không làm mất đi tính đặc tr ưng của bảng

quyết định, một trong những phươ ng án là rút gọn tậ p thuộc tính. Việc rút gọn tậ p thuộc

tính cũng dùng để đánh giá sự độc lậ p của các tiêu chí khảo sát. Nếu số thuộc tính rút

gọn càng lớ n, chứng tỏ các tiêu chí của bảng khảo sát có sự dư thừa bất hợ  p lý. Đây làthông tin cần thiết giúp nhóm chuyên gia giáo dục hiệu chỉnh các tiêu chí của phiếu

khảo sát chất lượ ng.

Do đánh giá của các sinh viên cùng một tiêu chí đối vớ i cùng một giảng viên là

khác nhau (mỗ i tiêu chí đượ c đ ánh giá theo 4 mứ c: Giỏi, Khá,  Đạt, Không ý kiế n),

tươ ng tự như ví dụ 2.7, nếu xem mỗi một sinh viên tham gia đánh giá là một chuyên gia,

mỗi giáo viên là một đối tượ ng cần đánh giá, chúng ta sẽ có một họ phủ ứng vớ i tậ p tiêuchí khảo sát. Thuật toán FC_Reduct đượ c dùng để rút gọn tậ p tiêu chí (thuộc tính). K ết

quả là số lượ ng các tiêu chí không cần thiết có thể rút gọn là 0. Điều này cho thấy tậ p

tiêu chí của nhóm chuyên gia giáo dục đề xuất là không có sự dư thừa, có thể triển khai

thực nghiệm trong thờ i gian tớ i. Cần lưu ý r ằng, nhóm tiêu chí này đượ c nhóm chuyên

gia tham khảo từ các tiêu chí của nướ c ngoài. Thuật toán đã cài đặt trong phần mềm

Rsedu 1.0 (tham khảo phụ l ục 1) và thử nghiệm trên dữ liệu UCI.

Page 64: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 64/100

 

50

2.9  K ết luận chươ ng 2

Chươ ng này luận án trình bày những k ết quả đạt đượ c liên quan đến phủ tậ p thô.Cụ thể là:

Một số tính chất cơ bản về rút gọn và phép phủ xấ p xỉ trên của ba loại phủ tậ p

thô: Nửa thu gọn (Semi-reduced ), Phủ tựa điểm ( Pointwise-covered ), Đơ n vị (Unary).

 Điề u kiện để hai phủ sinh ra cùng một phép xấ  p xỉ trên loại 2 đượ c đề xuất và chứng

minh (định lý 2.13, hệ quả 2.1, mệnh đề 2.1). M ố i liên hệ , tính chấ t của các phép xấ  p xỉ  

d ự a vào các loại phủ này và ánh xạ đ óng cũng đượ c phát hiện (mệnh đề 2.2-2.4, hệ quả 

2.2). Chươ ng này cũng trình bày một số  đ iề u kiện để các phép xấ  p xỉ là đồng nhấ t khi

tiế  p cận bằ ng không gian topo (mệnh đề 2.6-2.8, hệ quả 2.3).

Thuật toán mớ i rút gọn tậ  p thuộc tính dựa vào một họ phủ: Thuật toán

FC_Reduct đượ c đề xuất. Độ phức tạ p của thuật toán tươ ng đươ ng vớ i các thuật toán

tìm một rút gọn tậ p thuộc tính trong lý thuyết tậ p thô cổ điển: O(|D||U |2). Ứ ng dụng thực

tế thuật toán cho bài toán xử lý thông tin dạy và học tại Đại học Nha Trang đượ c trình

 bày cho thấy khả năng ứng dụng và tính đúng đắn của thuật toán.

Page 65: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 65/100

 

51

Chươ ng 3

ĐỘ ĐO ĐÁNH GIÁ HIỆU NĂ NGTẬP LUẬT QUYẾT ĐỊ NH

Trong những năm gần đây, rút trích và đánh giá hiệu năng của tậ  p luật quyết

định đã tr ở bài toán đượ c nhiều ngườ i quan tâm [9, 15, 41, 46, 47, 48]. Các độ đo cổ 

điển của một số tác giả có một số nhượ c điểm hoặc là áp dụng cho mỗi luật đơ n, hoặc là

khi giá tr ị độ đo độ chắc chắn bằng 0 thì sẽ không có một luật quyết định nào của bảng

quyết định là đượ c chấ p nhận. Yuhua Qian và cộng sự đã phân tích, đề xuất ba độ đo

mớ i khắc phục nhượ c điểm này. Nhiều bài báo của họ công bố về tính chất của ba độ đo

mớ i này r ất đáng quan tâm [46, 47, 48]. Tuy có đượ c nhiều tính chất khá tốt, nhưng các

độ đo của họ có công thức khá phức tạ p. Đáng lưu ý là độ đo độ nhất quán của YuhuaQian và cộng sự có hạn chế là không đồng biến như độ đo cổ điển. Dựa vào ý tưở ng của

nhóm tác giả Nguyễn Thanh Tùng và Nông Thị Hoa [4], luận án đề xuất độ đo mớ i

khắc phục đượ c nhượ c điểm độ đo của nhóm tác giả trên.

3.1  Hạn chế của các độ đo cổ điển trên các bảng quyết định

Cho T = (U , C È D) là một bảng quyết định, C là tậ p thuộc tính điều kiện, D là

tậ p thuộc tính quyết định. Giả sử U/C = { X 1 , X 2  ,.., X m}, F =U/D = {Y 1 , Y 2 , .., Y n}. Khi

Page 66: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 66/100

 

52

 X iÎU/C , Y  jÎU/D và X iÇY  j ¹ Æ. Ký hiệu des( X i) và des(Y  j) lần lượ t là các mô t ả của các

l ớ  p t ươ ng đươ ng  ứng X i , Y  j trong bảng quyết định T.

Một luật quyết định có dạng Z ij : des(X i ) ® des(Y  j ).

Các độ đo lượ ng giá một luật Z ij  quyết định đượ c đề xuất [26]:

-  Độ đo độ chắc chắn ( ) /ij i j i Z X Y X  m = Ç  

-  Độ đo độ hỗ tr ợ   ( ) /ij i j Z X Y U  = Ç  

Các độ đo này chỉ định ngh ĩ a cho các luật quyết định đơ n, không phù hợ  p cho

việc đánh giá hiệu năng của một tậ p luật quyết định.

Ký hiệu C-xấ p xỉ dướ i, C-xấ p xỉ trên của F lần lượ t là

1 2 1 2{ , ,.., }; { , ,.., }n nCF CY CY CY CF CY CY CY  = = . Trong đó,

{ | [ ] }; { | [ ] , }i C i i C i iCY x U x Y F CY x U x Y Y F  = È Î Í Î = È Î Ç ¹ Æ Î , 1£ i £ n.

Độ đo chắc chắn xấ p xỉ của F xác định bở i C do Pawlak đề xuất [26] là

/

/

( ) i

i

iY U D

iY U D

CY a F 

CY 

Î

Î

= åå

 

Trong một số tr ườ ng hợ  p, aC ( F ) đượ c dùng để đo độ chắc chắn của một bảng

quyết định. Tuy nhiên, hạn chế của độ đo này có thể thấy qua ví dụ sau

Ví dụ 3.1 [48] Cho T1= (U , C È  D1) và T2 = (U , C È  D2) là hai bảng quyết định

trên cùng tậ p phổ dụng U . Giả sử r ằng

U/C = {{e1 , e2}, {e1 , e4 , e5}, {e6  , e7 }}.

U/D1= {{e1}, {e2 , e3 , e4}, {e5 , e6 }, {e7 }}

U/D2={{e1, e3 }, {e2 , e4,e6 }, {e5}, {e7 }}

Khi đó, sáu luật quyết định đượ c rút trích từ T1 và độ đo độ chắc chắn, đô đo độ 

hỗ tr ợ của mỗi một luật xác định như sau

r 1: des({e1 ,e2}) ® des({e1}), 1 1

1 1( ) , ( ) ;

2 7

r s r m = =  

Page 67: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 67/100

 

53

r 2: des({e1 ,e2}) ® des({e2}), 2 2

1 1( ) , ( ) ;

2 7r s r m = =  

r 3: des({e3 ,e4 ,e5}) ® des({e3 ,e4}), 3 32 2( ) , ( ) ;3 7r s r m = =  

r 4: des({e3 ,e4 ,e5}) ® des({e5}), 4 4

1 1( ) , ( ) ;

3 7r s r m = =  

r 5: des({e6  ,e7 }) ® des({e6 }), 5 5

1 1( ) , ( ) ;

2 7r s r m = =  

r 6 : des({e6  ,e7 }) ® des({e7 }), 6 6

1 1( ) , ( ) ;

2 7r s r m = =  

Hơ n thế, bảy luật đượ c rút trích từ T2 và độ đo độ chắc chắn, độ đo độ hỗ tr ợ của

mỗi một luật xác định như sau

r’ 1: des({e1 ,e2}) ® des({e1}),, ,1 1

1 1( ) , ( ) ;

2 7r s r m = =  

r’ 2: des({e1 ,e4 ,e5}) ® des({e2}),, ,2 2

1 1( ) , ( ) ;

3 7r s r m = =  

r’ 3: des({e1 ,e2}) ® des({e2}),, ,3 3

1 1( ) , ( ) ;

2 7r s r m = =  

r’ 4: des({e3 ,e4 ,e5}) ® des({e4}), , ,4 4

1 1( ) , ( ) ;3 7r s r m = =  

r’ 5: des({e6  ,e7 }) ® des({e6 }),, ,5 5

1 1( ) , ( ) ;

2 7r s r m = =  

r’ 6 : des({e3 ,e4 ,e5}) ® des({e5}),, ,6 6

1 1( ) , ( ) ;

3 7r s r m = =  

r’ 7 : des({e6  ,e7 }) ® des({e7 }),, ,7 7

1 1( ) , ( ) ;

2 7r s r m = =  

Theo công thức tính độ chắc chắn, ta có:

/1

/

0( / ) 0

2 5 5 2i

i

iY U D

iY U D

CY a U D

CY 

Î

Î

= = =+ + +

åå

 

2

2

/2

/

0( / ) 0

5 7 3 2i

i

iY U D

iY U D

CY a U D

CY 

Î

Î

= = =+ + +

åå

 

Điều đó nói r ằng 1 2( / ) ( / ) 0.C C a U D a U D= =  

Page 68: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 68/100

 

54

Bây giờ , chúng ta xem xét giá tr ị trung bình độ đo độ chắc chắn của mỗi tậ p luật

rút trích đượ c từ T1, T2:

6

1

1 1 1 1 2 1 1 1 1( ) ( )

6 6 2 2 3 3 2 2 2i

i

r m=

= + + + + + =å và

6,

1

1 1 1 1 1 1 1 1 1 3( ) ( )

6 7 2 3 2 3 2 3 2 7i

i

r m=

= + + + + + + =å  

Điều này có thể nói bảng quyết định T1 có giá tr ị trung bình độ chắc chắn cao

hơ n T2, nhưng độ đo độ chắc chắn aC (.) không thể hiện đượ c điều đó.

Trong [26], độ đo độ nhất quán cổ điển cũng đượ c định ngh ĩ a

1( )

n

i

iC 

CY 

C DU 

==å

 

Tươ ng tự như độ đo độ chắc chắn, độ đo độ nhất quán này cũng không biểu diễn

tốt độ nhất quán của bảng quyết định vì chỉ xem xét các giá tr ị xấ p xỉ dướ i. Vì vậy, cần

đề xuất một độ đo lượ ng giá hiệu năng khác thay thế cho các độ đo cổ điển này.

3.2  Độ đo hiệu năng của tập luật quyết định của Yuhua Qian

và cộng sự  

Yuhua Qian và cộng sự [48] đã đề xuất 3 độ  đo: độ chắc chắn (certainty

measure), độ nhất quán (consistency measure) và độ hỗ tr ợ  (  support measure) nhằm

khắc phục nhượ c điểm và thay thế cho các độ đo cổ điển.

Định ngh ĩ a 3.1 [48] Cho T = (U , C È D) là một bảng quyết định và RULE = { Z ij |

 Z ij:des( X i)® des(Y  j),  X iÎU/C , Y  jÎU/D, i=1..m, j=1..n}, độ đo độ chắc chắn a của T 

đượ c định ngh ĩ a

2

1 1 1 1

( ) ( ) ( )m n m n

i j

ij iji j i j i

 X Y  s Z Z  

U X a m

= = = =

Ç= =åå ååT   

 Độ đ o độ nhấ t quán b của S đượ c định nghĩ a

Page 69: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 69/100

 

55

1 1

4( ) [1 ( )(1 ( ))]

i N mi

i j ij iji ji

 X  X Y Z Z  

U X b m m

= =

= - Ç -å åT   

 Độ đ o độ hỗ tr ợ  g  của S đượ c định nghĩ a

2

22

1 1 1 1

( ) ( )m n m n

i j

iji j i j

 X Y  s Z 

U g 

= = = =

Ç= =åå ååT   

Trong đó m( Z ij) và s( Z ij) lần lượ t là độ đo độ chắc chắn, độ hỗ tr ợ của luật Z ij.

3.3  Đề xuất độ đo hiệu năng của tập luật quyết định

Luận án đề xuất độ đo độ chắc chắn và độ đo độ nhất quán đượ c như sau

Định ngh ĩ a 3.2 Cho T = (U , C È D) là một bảng quyết định và RULE={ Z ij  |

 Z ij:des( X i)® des(Y  j), X iÎU/C , Y  jÎU/D, i=1..m, j=1..n}.

 Độ đ o độ chắ c chắ n ta đượ c định nghĩ a

1 1( ) 1

C m n

i j i j

i j i

 X Y X Y   X U 

ta= =

Ç Ç= - ååT   

 Độ đ o độ nhấ t quán tb của S đượ c định nghĩ a

1 1

( ) 11

C m n

i j i j

i j i

 X Y X Y  n

n X U tb 

= =

Ç Ç= -

-ååT   

Chú ý 3.1 Về độ đo độ hỗ tr ợ , đề nghị sử dụng lại độ đo do của nhóm tác giả 

Yuhua Qian và cộng sự, do công thứ c có một số thành phần con tham gia độ đ o mớ i, 

thuận tiện khi lậ p trình đánh giá đồng thờ i ba độ đo này.

Định lý 3.1 Cho T = (U , C È D) là một bảng quyết định, và RULE ={ Z ij | Z ij:

des(X i ) ® des(Y  j ),  X iÎU/C , Y  jÎU/D}, độ đo độ chắc chắn ta của T chính là độ đo a. 

Chứ ng minh Dễ dàng thấy r ằngC 

i j i i j X Y X X Y  Ç = - Ç . Dođó, ta có:

Page 70: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 70/100

 

56

1 1 1 1

( ) 1 1 ( )C m n m n

i ji j i j i i j

i j i ji i

 X Y  X Y X Y X X Y  

 X U X U  ta

= = = =

ÇÇ Ç - Ç= - = -åå ååT  =

2 2

1 1 1 1 1 1

1 ( ) 1m n m n m n

i j i j i j i j

i j i j i ji i

 X Y X Y X Y X Y  

U X U U X U  = = = = = =

Ç Ç Ç Ç- - = - +åå åå åå .

Từ 

1 1

1m n

i j

i j

 X Y 

U = =

Ç=åå

 Ta có

2 2

1 1 1 1 1 1

1m n m n m n

i j i j i j

i j i j i ji i

 X Y X Y X Y  

U X U X U  = = = - = =

Ç Ç Ç- + =åå åå åå = a( T  ). (đ pcm)

Chú ý 3.2 Từ định lý 3.1, độ đo ta chính là độ đo a. Tuy nhiên, công thức

của ta  có nhiều thành phần con chung vớ i các công thức độ đo khác, vì vậy việc sử 

dụng ta  thuận tiện hơ n.

Chúng ta có thể thấy các tính chất quan tr ọng của ta  hay a  trong [48]. Có thể 

liệt kê như sauĐịnh lý 3.2 [48] (C ự c tr ị cho ta ) Cho T = (U, C È D) là một bảng quyết định và 

RULE  = { Z ij | Z ij: des(X i )® des(Y  j ), X iÎU/C, Y  jÎU/D}, ta có 

- Vớ i mọi Z ijÎRULE, nếu m(Z ij ) = 1 thì độ đo ta( T  ) đạt giá tr ị lớ n nhất là 1. 

- Nếu m = 1 và n = |U|, thì ta( T  ) đạt giá tr ị nhỏ nhất là1

U  

Định lý 3.3 [48] Cho T1 = (U, C 1È D1) , T2 = (U, C 2È D2) là hai bảng nhất quán

ngượ c, nếu U/C 1 = U/C 2 và U/D2p U /D1 thì ta( T 1 )³ta( T 2 ).

Định lý 3.4 [48] Cho T1 = (U, C 1È D1) ,T2 = (U, C 2È D2) là hai bảng nhất quán

ngượ c, nếu U/D1 = U/D2 và U/C 2p U/C 1 thì ta( T 1 ) £  ta( T 2 ).

Định lý 3.5 [48] Cho T = (U, C ÈD) , T’ = (U, BÈ D) là hai bảng quyết định, T là

nhất quán, B ÍC. Nếu B là rút gọn C-miền khẳng định dươ ng của D thì ta( T  ) = ta( T’  ) 

Page 71: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 71/100

 

57

Định lý 3.6 [48] Cho T = (U , C È D), T’ = (U , BÈ D) là hai bảng quyết định, B Í 

C . Nếu B là C-rút gọn miền khẳng định dươ ng của D thì ta( T  ) ³  ta( T’  ).

 Độ đ o độ nhấ t quán tb  và một số tính chấ t 

Định lý 3.7 (C ự c tr ị cho tb )  Cho T = (U , C È D) là một bảng quyết định và

RULE ={ Z ij | Z ij: des(X i ) ® des(Y  j ), U/C = { X 1 , X 2 , .., X m}, U/D = {Y 1 , Y 2 , .., Y n} }

Vớ i mọi Z ijÎRULE, nếu m( Z ij) = 1 thì độ đo tb ( T  ) đạt giá tr ị lớ n nhất là 1.

 Nếu m = 1 và n = |U | thì tb ( T  ) đạt giá tr ị nhỏ nhất là 0.

Chứ ng minh: (1) Từ m( Zij) = 1Û 1i j

i

 X Y 

 X 

Ç=  Û 0

i j X Y 

Ç=  

Þ 0C 

i ji j

i

 X Y  X Y 

 X U 

ÇÇ= , "i, j 

Þ 1 1

( ) 1 11

C m n

i ji j

i j i

 X Y  X Y n

n X U tb 

= =

ÇÇ= - =

- ååT  .

(2) Từ định ngh ĩ a của tb (T ), ta có thể viết như sau

1 1

( ) 11

C m ni ji j

i j i

 X Y  X Y n

n X U tb 

= =

ÇÇ= -

- ååT   

= 1 (1 ( )) 1 ( ( ) 1)1 1

n n

n nta ta- - = + -

- -T T   

 Nếum =1 và n = |U |, thì độ đo ta( T  ) đạt giá tr ị cực tiểu là1 1

U n= (định lý 3.2).

Do đó, độ đo tb ( T  ) có giá tr ị cực tiểu là 0.

min

1( ) 1 ( 1)( ) 0

1

n

n ntb  = + - =

-T  (đ pcm).

Tính đơ n đ iệu của độ đ o tb  đố i vớ i bảng quyế t định nhấ t quán ng ượ c có thể thấ  y

qua các định lý

Page 72: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 72/100

 

58

Định lý 3.8 Cho T1 = (U , C 1È D1), T2 = (U , C 2È D2) là hai bảng nhất quán

ngượ c. Nếu U/C 1 = U/C 2 và U/D2p U/D1 thì tb ( T 1 ) ³ tb ( T 2 ). 

Chứ ng minh Từ định ngh ĩ a 3.2 và định lý 3.3 có thể thấy đượ c tính đơ n điệu

của tb  và ta là như nhau. Tuy vậy, ta có thể chứng minh tr ực tiế p

Từ U/C 1 = U/C 2, T1 và T2 là 2 bảng nhất quán ngượ c.

Giả sử U/C 1  = U/C 2 = { X 1 , X 2 ,.., X m} và U/D1 = {Y 1 , Y 2 ,.., Y n}

 Nếu U/D2p U/D1, thì U/D2 =

1 1

( ) jt n

 j k 

Y = =

U U , ở  đây

1 1

 j

 j

 j j

k t 

Y Y -= +

= U , đặt t0 = 0, tn= s, Zk =k 

 jY   

Điều này dẫn đến U/D2 = { Z 1 , Z 2 ,.., Z  s}.

Ta có:

1 11 1

( ) ( ) j j

 j j

t t 

C k k C  

i j i j i j i j

k t k t  

 X X X Y X Y X Y  - -= + = +

Ç Ç = Ç ÇU U  

1 11 1

( ) ( ) j j

 j j

t t k k C 

i j i j

k t k t  

 X Y X Y  - -= + = +

£ Ç ÇU U =1 1

( )i

i

t k k C 

i j i jk t 

 X Y X Y  -= +

Ç Çå  

Do nếu

1 1 1 1 1

( )C k k C  m n m n s

i j i j i j i j

i j i j k  i i

 X Y X Y X Y X Y  

 X U X U  = = = = =

Ç Ç Ç Ç£åå ååå thì

1 1 1 1

1 1

1 1

C C m n m s

i j i j i k i k 

i j i k  i i

 X Y X Y    X Z  X Z n n

n U X n U X  = = = =

Ç Ç ÇÇ- ³ -

- -

åå åå  

 Nói cách khác, ta có tb (T 1) ³ tb (T 2). (đ pcm)

Bổ đề 3.1: Cho T =(U, C È D) là một bảng quyết định, và 2 tậ p khác r ỗng X,

Y  Í U . Giả sử  X =1

 j

 X =

U , X  pÇ X q = Æ vớ i mọi p¹q, có ngh ĩ a { X 1 , X 2 , .., X k } là một

 phân hoạch của X, thì

Page 73: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 73/100

 

59

1

C C k 

 j j

 j

 X Y X Y   X Y  X Y 

U X U X  =

Ç ÇÇdz å  

và dấu đẳng thức xảy ra nếu 0C 

 p q X Y X Y  Ç Ç = , vớ i mọi p¹q và p,q = 1, 2, ..,k.

Chứ ng minh Tươ ng tự ý tưở ng của bổ đề 4.3 trong [6], ta có thể chứng minh bổ 

đề như sau:

Từ  X  pÇ X q = Æ vớ i mọi p¹q, ta có:

1 1

1 1

1 1 1

k k C 

C C  i i k k 

 j j j

 j j

C C k k k 

 j p j j

 j p j

 X Y X Y   X Y  X Y  X Y Xj Y  

U X U X U X  

 X Y X Y X Y X Y  

U X U X  

= =

= =

= = =

Ç ÇÇÇÇ Ç

= =

Ç Ç Ç Ç= ³

å å

åå å

U U

 

Rõ ràng, nếu 0C 

 p q X Y X Y  Ç Ç = , vớ i mọi p¹q và p,q = 1, 2, ..,k, ta có đẳng thức.

Định lý 3.9 Cho T1 = (U , C 1È D1), T2 = (U , C 2È D2) là hai bảng nhất quán ngượ c.

 Nếu U/D1 = U/D2 và U/C 2p

U/C 1 thì tb (T 1) £ tb (T 2).Chứ ng minh: Giả sử U/D2 = {Y 1 , Y 2 ,.., Y n},U/C 1 = { X 1 , X 2 ,.., X m},

 Nếu X i =1 1

i

i

t k 

i

k t 

 X -= +

U Þ U/C 2 =1

1

( )i

i

mt  k 

ik t i

 X = +

=U U , đặt t0 = 0,

Từ bổ đề 3.1, vớ i mỗi j=1,..,n và i=1,..,m, ta có:

1 1i

C k k t 

i j i j i j i j

k t i i

 X Y X Y X Y X Y  

U X U X  -= +

Ç Ç Ç Ç³ å , đặt t0 = 0 thì

11 1 1 1 1

i

i

C k k C  t m n m ni j i j i j i j

i j i j k t  i i

 X Y X Y X Y X Y  

U X U X  == = = = = +

Ç Ç Ç Ç³åå åå å  

Vì vậy:

11 1 1 1 1

1 11 1

i

i

C k k Ct m n m ni j i j i j i j

i j i j k t  i i

 X Y X Y X Y X Y  n n

n U X n U X== = = = = +

Ç Ç Ç Ç- £ -

- -åå åå å .

Page 74: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 74/100

 

60

 Nói khác hơ n tb (T 1) £ tb (T 2). (đ pcm)

Nhận xét 3.1 trong [48], Yuhua Qian và cộng sự đã công bố:

a. Cho T 1 = (U,C 1È  D1  ), T 2 = (U,C 2È  D2  ) là hai bảng nhấ t quán ng ượ c, nế u

U/C 1 = U/C 2 và U/D2p U/D1 thì b (T 1 )£   b (T 2  ) khi "m(Z ij )£ 

1

2  , và b (T 1 )³b (T 2  ) khi

"m(Z ij )³  12

.

b. Cho T 1 = (U,C 1È  D1  ), T 2 = (U,C 2È  D2  ) là hai bảng nhấ t quán ng ượ c, nế u

U/D1 = U/D2 và U/C 2p U/C 1 thì b (T 1 )³   b (T 2  ) khi "m(Z ij )£ 

1

2  , và b (T 1 )£   b (T 2  ) khi

"m(Z ij )³   12.

Do sự đơ n điệu của độ đo b là phụ thuộc vào giá tr ị của m. Từ định ngh ĩ a độ nhất

quán, nhất quán ngượ c ta thấy độ nhất quán, nhất quán ngượ c tỉ lệ thuận vớ i độ chắc

chắn. Nhưng k ết quả a, b không thỏa (Yuhua Qian và cộng sự cũng đ ã nhận xét đ iề u

hạn chế này[48]), vì vậy độ đo tb  phù hợ  p hơ n độ đo b , trong việc đánh giá độnhất quán.

Bổ đề 3.2 Cho T1 = (U , C È D), T2 = (U , BÈ D) là hai bảng quyết định, nếu C Í  B 

thì U/Bp U/C và tb (T 2)£tb (T 1), dấu đẳng thức xảy ra (tb (T 2) = tb (T 1)) khi T 1, T 2 là hai

 bảng nhất quán.

Chứ ng minh: Chỉ cần xét tr ườ ng hợ  p tb (T 2) = tb (T 1).

Khi U/Bp U/C  ta có " X iÎU/C , X i có thể viết X i =1

it k 

ik 

 X =

U , ở  đây k 

i X  ÎU/B. Từ 

 bổ đề 3.1 nếu 0k l C 

i j i j X Y X Y  Ç Ç = , "i,j,k ¹l ta có tb (T 2) = tb (T 1).

Do 0k l C i j i j X Y X Y  Ç Ç = nếu

0k l C 

i j i j X Y X Y  Ç Ç = (1) hay 0l k C 

i j i j X Y X Y  Ç Ç = (2)

 Nếu (1) xảy ra thì 0k 

i j X Y Ç = hoặc 0l C 

i j X Y Ç = hoặc

0, 0k l C 

i j i j X Y X Y  Ç = Ç = .

 Nếu 0k 

i j X Y Ç = Þ  0k C 

i j X Y Ç ¹ Þ 0l 

i j X Y Ç = . Do ,k l 

i i X X  có vai trò như nhau

nên chúng ta có thể nói r ằng tb (T 2) = tb (T 1) khi $ j0, "k =1..t i,0

i j X Y Í . Nói khác hơ n

Page 75: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 75/100

 

61

T 1 , T 2 là các bảng nhất quán. Trong tr ườ ng hợ  p này ta cũng có ij ij( ) ( )k  Z Z m m= , " j,k,  ở  

đây X i = 1

it k 

ik 

 X =U .

Định lý 3.10 Cho T1 = (U , C È D), T2 = (U , BÈ D) là hai bảng quyết định, nếu T1 

là bảng nhất quán,  B Í C và  B là một C- rút gọn miền khẳng định dươ ng của  D thì

tb (T 2) = tb (T 1)

Chứ ng minh K ết quả của định lý đượ c suy ra tr ực tiế p định ngh ĩ a rút gọn miền

khẳng dươ ng và bổ đề 3.2.

Từ bổ đề 3.2, ta còn có định lý

Định lý 3.11 Cho T1 = (U , C È D), T2 = (U , BÈ D) là 2 bảng quyết định, nếu B Í 

C và B là C-rút gọn miền khẳng định dươ ng của D thì tb (T 2)³tb (T 1)

Để minh họa cho sự khác nhau giữa các độ đo nhất quán tb , b và C C ( D), các độ 

đo đượ c cài đặt thử nghiệm trên ba tậ p dữ liệu của UCI: Tic-tac-toe, Dermatology và

 Nursery (thông tin liên quan đượ c mô t ả trong bảng 3.1). So sánh sự khác biệt các giá

tr ị của ba độ đo ứng vớ i 3 tậ p dữ liệu đượ c thể hiện trong bảng 3.2, bảng 3.3 và hình 3.1,

hình 3.2.

Tậ p dữ liệu Số mẫu Số Th.tính điều kiện Số lớ  p quyết địnhTic-tac-toe 958 9 2Dermatology 366 33 6

  Nursery 12960 8

Bảng 3. 1 Mô t ả các t ậ p d ữ liệu thử nghiệm

Độ đo Đặc tr ưng (Features)

1 2 3 4 5 6 7 8 9

)( Dcc   0.0000 0.0000 0.1253 0.1628 0.4186 0.7766 0.9436 1.0000 1.0000

b  0.1114 0.1322 0.2827 0.3300 0.5832 0.8000 0.9436 1.0000 1.0000

tb  0.1114 0.1322 0.2827 0.3300 0.5832 0.8000 0.9436 1.0000 1.0000

Bảng 3.2 S ố liệu chỉ ra sự khác biệt của )( Dcc  , b và tb  đố i vớ i t ậ p d ữ liệu Tic-tac-toe; 

Page 76: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 76/100

 

62

Độ đoĐặc tr ưng (features)

1 2 3 6 9 12 15 18 21 33

)( Dcc   0.0000 0.0109 0.0437 0.6066 0.8552 0.8962 0.9809 1.0000 1.0000 1.0000

b  0.3350 0.3164 0.2821 0.6826 0.8797 0.9153 0.9818 1.0000 1.0000 1.0000

tb  0.0854 0.1581 0.2960 0.7661 0.9148 0.9415 0.9891 1.0000 1.0000 1.0000

Bảng 3.3 S ố liệu chỉ ra sự khác biệt của )( Dcc  , b và tb  đố i vớ i t ậ p d ữ liệu  Dermatology

Bảng 3.4: K ế t quả các độ đ o τβ ; β và cC trên t ậ p d ữ liệu Nursery

Độ đoĐặc tr ưng (Features)

1 2 3 4 5 6 7 8

)( Dcc   0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 1.0000

b  0,1378 0,11119 0,11122 0,11126 0,1112 0,11111 0,11111 1.0000

tb  0,1782 0,2865 0,2904 0,3047 0,3262 0,34002 0,36613 1.0000

Hình 3.1  S ự biế n thiên của các độ đ o độ nhấ t quán: tb  , b  , )( Dcc  

trên t ậ p d ữ liệu Tic-Tac-Toe

Page 77: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 77/100

 

63

Hình 3.2 S ự biế n thiên của các độ đ o độ nhấ t quán: tb  , b  , )( Dcc ứ ng vớ i t ậ p d ữ liệu

 Dermatology

Hình 3.3  S ự biế n thiên của các độ đ o độ nhấ t quán: tb  , b  , )( Dcc  

trên t ậ p d ữ liệu Nursery

Page 78: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 78/100

 

64

Có thể thấy từ 3 bảng 3.2-3.3, giá tr ị của độ đo nhất quán tb là lớ n nhất vớ i

cùng các cấu hình đượ c chọn. Tuy nhiên, tb và C C( D) là cùng đồng biến trên tất cả 

các cấu hình đượ c chọn, nhưng b  thì không. K ết quả là phù hợ  p vớ i nhận xét 3.1.

3.4  Ứ ng dụng hệ độ đo cho bài toán xử lý thông tin dạy và học

tại Đ.H Nha Trang

 Như đã trình bày trong 2.8.1, tậ p luật quyết định rút trích đượ c từ cơ  sở dữ 

liệu khảo sát chất lượ ng dạy và học tại Đại học Nha Trang đượ c đánh giá hiệu năng

theo độ đo do chúng tôi đề xuất. Các giá tr ị ứng vớ i các độ đo nhằm hỗ tr ợ nhómchuyên gia giáo dục đưa ra các k ết luận về thông tin dạy và học, đồng thờ i là cơ sở  

để so sánh vớ i các k ết quả thu đượ c bằng phươ ng pháp thống kê mà các nhóm

chuyên gia giáo dục đã tiến hành tr ướ c đây. K ết quả thể hiện trong phụ lục 1.

3.5  K ết luận chươ ng 3

Chươ ng này trình bày một k ết quả của luận án. Cụ thể là hệ độ đo đánh giá

hiệu năng tậ p luật quyết định trong lý thuyết tậ p thô. Hệ độ đo mớ i so vớ i hệ độ đodo của Yuhua Qian và cộng sự về mặt toán học có những điểm tươ ng đồng, cả hai

hệ độ đo khắc phục đượ c nhượ c điểm của các hệ độ đo đã có. Ngoài ra, hệ độ đo

mớ i có ưu điểm là các công thức có nhiều thành phần chung giống nhau nên thuận

tiện hơ n khi lậ p trình xử lý đồng thờ i các độ đo. Đặc biệt, độ đo độ nhất quán mớ i

xử lý đượ c điểm hạn chế của độ đo độ nhất quán của Yuhua Qian và cộng sự là

không đồng biến theo độ nhất quán như độ đo cổ điển Pawlak. Việc minh họa bằng

cách cài đặt thử nghiệm các độ  đo trên ba tậ p dữ liệu của UCI là Tic-Tac-toe,

Dermatology và Nursery đã cho thấy sự tươ ng quan và khác biệt của các độ đo.

Quá trình cài đặt và ứng dụng cụ thể vào bài toán xử lý thông tin dạy và học

tại tr ườ ng Đại học Nha Trang, các k ết quả thu đượ c sẽ hỗ tr ợ nâng cao chất lượ ng

khảo sát thông tin dạy và học hằng năm của tr ườ ng.

Page 79: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 79/100

 

65

K ẾT LUẬ N

Lý thuyết tậ p thô ngày càng đượ c nhiều ngườ i quan tâm nghiên cứu, phát

triển về mặt lý thuyết cũng như ứng dụng. Vớ i mong muốn đóng góp vào sự phát

triển và ứng dụng đó, luận án đã đưa ra một số k ết quả liên quan đến sự mở r ộng tậ p

thô theo hướ ng thay đổi phép phân hoạch bằng một phủ. Đồng thờ i, mối quan hệ 

giữa các loại phủ và ánh xạ  đóng cũng đượ c nghiên cứu và đề xuất. Một trong

những k ết quả quan tr ọng của luận án là xây dựng độ đo đánh giá hiệu năng của tậ p

luật quyết định, khắc phục đượ c những nhượ c điểm của các độ đo đã có. Cụ thể hơ n,

luận án đã thực hiện đượ c các k ết quả sau:

1. Khảo sát tính chất toán học của các phép xấ p xỉ ứng vớ i ba loại phủ do W.

Zhu, F.Y Wang đề xuất. Xác định điều kiện để hai phủ sinh cùng một phép xấ p xỉ 

loại 2 (định lý 2.13, hệ quả 2.1, mệnh đề 2.1). Tiế p cận bằng không gian topo chỉ ra

điều kiện để các phép xấ p xỉ dựa vào phủ là đồng nhất (mệnh đề 2.6 – 2.8, hệ quả 

2.3).

2. Xây dựng mối quan hệ giữa các xấ p xỉ dựa vào phủ vớ i, ánh xạ đóng cũng

đượ c trình bày. Đây là cơ sở  để mở r ộng các phép xấ p xỉ cũng như k ết thừa các k ết

quả đã có nhằm ứng dụng tậ p thô hiệu quả hơ n (mệnh đề 2.2, 2.3, 2.4).

3. Đề xuất một thuật toán mớ i FC-Reduct để tìm một rút gọn tối thiểu tậ p

thuộc tính dựa vào một họ phủ quyết định tậ p thô. Cơ sở  lý thuyết của thuật toán

này dựa trên 2 định lý 2.19, 2.20. Độ phức tạ p của thuật toán này là O(|D||U |2

),

Page 80: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 80/100

 

66

tươ ng đươ ng vớ i các thuật toán tìm một rút gọn tậ p thuộc tính trong lý thuyết tậ p

thô cổ điển.

4. Xây dựng đượ c độ  đo mớ i đánh giá hiệu năng của tậ  p luật quyết định

trong lý thuyết tậ  p thô. Các tính chất toán học liên quan độ đo mớ i đượ c chứng

minh qua các định lý từ 3.1 đến định lý 3.11. Điểm cần chú ý là hệ độ do chúng tôi

đề xuất có ưu điểm là các công thức có nhiều thành phần chung giống nhau nên

thuận tiện hơ n khi lậ p trình xử lý đồng thờ i các độ đo. Đặc biệt, độ đo độ nhất quán

xử lý đượ c điểm hạn chế của độ đo độ nhất quán của Yuhua Qian và cộng sự.

5. Thử nghiệm độ đo đánh giá hiệu năng dựa trên cơ sở dữ liệu của UCI. K ếtquả thử nghiệm minh chứng cho tính đúng đắn của độ đo về mặt toán học đã đượ c

chứng minh về mặt lý thuyết tr ướ c đó. Phần mềm rút trích tậ p luật quyết định hỗ tr ợ  

công tác xử lý thông tin dạy và học tại Đại học Nha Trang đượ c xây dựng cũng

minh chứng thêm về khả năng ứng dụng của các k ết quả. ( Phần mề m còn có các

chứ c nă ng tính toán một số khái niệm trong lý thuyế t t ậ p thô như phụ thuộc độ k,

hiệu chỉ nh d ữ liệu, rút trích luật k ế t hợ  p, ..vì vậ y, phần mề m có thể xem như là công 

cụ minh họa phục vụ công tác giảng d ạ y).

  Ngoài các k ết quả thu đượ c trong luận án, các vấn đề còn phải tiế p tục,

nghiên cứu và phát triển liên quan là

-  Mối quan hệ giữa phủ tậ p thô và các không gian toán học, lớ  p phụ thuộc

 boolean dươ ng, CSDL quan hệ...

-  Phối hợ  p khái niệm tậ p thô vớ i các công cụ toán học xấ p xỉ khác như tậ p

mờ , xác suất, tậ p mơ hồ (vague set) ..dựa trên phủ tậ p thô.

-  Ứ ng dụng tậ p thô trong Datamining.

-  Xây dựng các phần mềm ứng dụng, giải quyết các bài toán thực tiễn dựa

vào lý thuyết tậ p thô mở r ộng.

› 

Page 81: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 81/100

 

67

DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ 

[1]

 Nguyễn Đức Thuần, Nguyễn Xuân Huy (2009), “CÁC XẤP XỈ TRÊN CỦA

CỦA PHỦ TẬP THÔ VÀ ÁNH XẠ ĐÓNG”. K  ỷ yế u H ội Nghị Khoa H ọc

 K  ỷ Niệm 25 N ă m Thành Lậ p Viện C ơ học & Tin học Ứ ng d ụng Tp H ồ Chí 

Minh. Nxb Khoa Học Tự Nhiên và Công Nghệ, 329-333.

[2]

 Nguyễn Đức Thuần, Nguyễn Xuân Huy (2009), “RÚT GỌ N TẬP THUỘC

TÍNH CỦA HỆ QUYẾT ĐỊ NH DỰ A VÀO HỌ PHỦ TẬP THÔ, T ạ p chí 

 Khoa học & Công nghệ , Đ H  Đà N ẵ ng . 4(33) 64-69.

 Nguyen Duc Thuan, “A Family of Covering Rough Sets Based Algorithm

for Reduction of Attributes ”, International Journal of Computer Theory

and Engineering (IJCTE). Vol 2 (2) 180-184. 

[3]

 Nguyen Duc Thuan, Nguyen Xuan Huy (2009), “A New Measure to

Evaluate the Consistency of a Set of Decision Rules Extracted from a

Decision Table”, International Journal of Computer Electrical Engineering 

(IJCEE). Vol 1(4) 447- 451. 

[4]

 Nguyen Duc Thuan (2009), “Covering Rough Sets From a Topological

Point of View”, International Journal of Computer Theory and Engineering 

(IJCTE). Vol 1(4) 601-604

Page 82: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 82/100

 

68

TÀI LIỆU THAM KHẢO

Tài liệu tiếng Việt

[1] Hoàng Thị Lan Giao (2007), T ậ p rút g ọn và bài toán phát hiện luật theo tiế  pcận t ậ p thô, Luận án Tiến s ĩ Toán học, Viện Công Nghệ Thông Tin.

[2] Nguyễn Đức Thuần, Nguyễn Xuân Huy (2009), “Rút gọn tậ p thuộc tính củahệ quyết định dựa vào họ phủ tậ p thô, T ạ p chí Khoa học & Công nghệ ,  Đ H 

 Đà N ẵ ng , (4)33 (2009), 64-69.

[3] Nguyễn Đức Thuần, Nguyễn Xuân Huy (2009), “Các xấ p xỉ trên của phủ tậ pthô và ánh xạ đóng”. K  ỷ yế u H ội Nghị Khoa H ọc K  ỷ Niệm 25 N ă m Thành Lậ pViện C ơ học & Tin học Ứ ng d ụng Tp H ồ Chí Minh. Nxb Khoa Học Tự Nhiênvà Công Nghệ, 329-333.

[4] Nguyễn Thanh Tùng, Nông Thị Hoa (2008), M ột phươ ng pháp mớ i xây d ự ng 

cây quyế t định sử d ụng lý thuyế t t ậ p thô, Một số vấn để chọn lọc của Côngnghệ Thông tin và Truyền thông, Huế, 12-13, 229-241.

[5] Nguyễn Xuân Huy (2006), Các phụ thuộc logic trong cơ  sở  d ữ Liệu, NXBThống Kê, Hà Nội.

Tài liệu tiếng Anh

[6] A.A Allam, M.Y. Bakeir and E.A Abo-Tabl (2008), “Some Methods for Generating Topologies by Relations”,  Bull. Malays. Maths.Soc (2) 31(2008),35-45.

[7] A.M. Kozae, AA. Abo Khadra, T.Medhat (2007), “Topological Approach for Approximation Space (TAS)”,   Proceeding of the 5th Internationa

Conference INFOS 2007 on Informatics and Systems 24-26 March 2007 ,

Faculty of Computers & Information Cairo University, Cairo, Egypt, 298:302.[8] Chen Degang, Wang Changzhong, Hu Quinghua (2007), “A New Approach

to Attribute Reduction of Consistent and Inconsistent Covering Rough Sets”, Information Sciences, 177, 3500-3518.

Page 83: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 83/100

 

69

[9] Dai dai, Jianpeng Wang (2007), “A New Extracting Rule Algorithm fromIncomplete Information Systems by Covering Rough Sets”.  Proceeding of 

  International Conference on Intelligent Systems and Knowledg Engineering (ISKE 2007).

[10] E.F Lashin, A.M. Kozae, A.A.Abo Khadra, T.Medhat (2005), “Rough SetTheory for Topological Spaces”, International Journal of ApproximateReasoning, 40(2005) 35-43.

[11] Eric C.C.Tsang, Degang Chen, John W.T.Lee, Daniel S.Yeung (2004), “OnThe Upper Approximations of Covering Generalized Rough sets”,

  Proceeding of the Third International Conference on Machine Learning 

and Cybernetic, Shanghai, 26-29.[12] Gianpiero Cattaneo and Davide Ciucci (2004), “Algebraic Structures for 

Rough Sets”, J.F. Peters et al. (Eds.): Transactions on Rough sets II , LNCS5390, 208-252.

[13] Guilong Liu and Ying Sai (2008), “A Comparison of Two Types of RoughSets Induced by Coverings”, Int.J.Aprrox. Reason, doi:10.1016/jijar.

[14] Guo-Yin Wang, Jun Zhao, Jiu-Jiang An, Yu Wu (2004), “Theoretical Studyon Attribute Reduction of Rough Set Theory: Comparision of algebra and

information views”,   Proceedings of the Third IEEE InternationalConference on Cognitive Informatics (ICCI’04).

[15] Haiyan Yu, Daoping Wang (2007), “A Granular Computing Approach toInducing Rules in Incomplete Information Systems”.   Proceeding of

  International Conference on Intelligent Systems and Knowledg

 Engineering (ISKE 2007).

[16] Journi Järvinen (2007), “Lattice Theory for Rough Sets”, J.F. Peters et al.(Eds.): Transactions on Rough sets VI , LNCS 4374, 400-498.

[17] Keyun Qin, Yan Gao, and Zheng Pei (2007), “On Covering Rough Sets”,J.F. Peters et al. (Eds.): Transactions on Rough sets VIII, LNCS 4481, pp.34-41.

[18] Lin, T.Y. (1988).” Neighborhood Systems and Approximation in RelationalDatabases and Knowledge Bases”.   Proceedings of the 4th International 

Symposium on Methodologies of Intelligent Systems.

Page 84: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 84/100

 

70

[19] Michiro Kondo and Wieslaw A.Dudek (2006), “Topological Structures of Rough sets induced by Equivalence Relations”,   Journal of Advanced 

Computational Intelligence and Intelligent Informatics, Vol. 10 No 5.

[20] Milan Vlach (2008), Algebraic and Topological Aspects of Rough SetTheory, Fourth International Workshop on Computational Intelligence &Applications, IEEE SMC Hiroshima Chapter, Hiroshima University, Japan,December 10&11.

[21] Ngo Chi Lang (2003), A Tolerance Rough Set Approach to Clustering Web

Search Results, Master Thesis in Computer Science, Warsaw UniversityFaculty of Mathematics, Informatics and Mechanics.

[22] Nguyen Duc Thuan (2009), “Covering Rough Sets From a TopologicalPoint of View”, International Journal of Computer Theory and Engineering 

(IJCTE). Vol 1(4) 601-604.

[23] Nguyen Duc Thuan (2010), “A Family of Covering Rough Sets BasedAlgorithm for Reduction of Attributes  ”,   International Journal of

Computer Theory and Engineering (IJCTE). Vol 2(2) 180-184.

[24] Nguyen Duc Thuan, Nguyen Xuan Huy (2009), “A new measure to evaluatethe consistency of a set of decision rules extracted from a decision table”,

  International Journal of Computer Electrical Engineering (IJCEE). Vol1(4) 447- 451.

[25] P.Samanta and Mihir K. Chakraborty (2008), “On Extention of Dependencey and Consistency Degree of Two Knowledges Represented byCovering”. J.F. Peters et al. (Eds.): Transactions on Rough sets IX , LNCS5390, 351-364.

[26] Pawlak. Z (1991), “Rough sets, Theoretical Aspects of Reasoning aboutData”, Kluwer Academic Publishers, London.

[27] Pawlak. Z (2002), “ Theory with Data using Rough Sets”. Proceedings of the 26th Annual International Computer Software and ApplicationsConference (COMPSAC ‘ 02).

[28] Qiang Shen, Richard Jensen (2007), “Rough Sets, Their Extensions andApplications”,   International Journal of Automation and Computing ,04(1),100-106.

[29] QingE Wu, Tuo Wang, YongXuan Huang, and JiSheng Li (2008),“Topology Theory on Rough Sets”,   IEEE Transactions on Systems, Man,and Cybernetics-Part B: Cybernetics, Vol. 38, No.1. Feb.

Page 85: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 85/100

 

71

[30] Ruizhi Wang, Duoqian Miao, Guirong Hu (2006),   Descernibility Matrix  Based Algorithm for Reduction of Attributes, IAT Workshops 2006, 477-480.

[31] Serkan Narl, Ahmet Z. Ozcelik (2008), “On Generalizing Rough Set Theoryvia using a Filter”,   Int. J. Computational and Mathematical Science, 2;3©www.waset.org Summer 2008.

[32] Skowron A., Zhong N. (2000.), Rough Sets in KDD, Tutorial Notes.

[33] Taihe Fa and Daowu Pei (2007), “Topological Description of Rough setModels”, Fourth  International Conference on Fuzzy System and Knowledge

 Discovery (FSKD 2007).

[34] Tamer Medhat Mohammad Ibrahim (2007), Supra Topological Approach  for Decision Making via Granular Computing , Thesis for the degree of Doctor of Philosophy, Tanta University.

[35] The UCI machine learning repository,<http://mlearn.ics.uci.edu/MLRepository.html>.

[36] W. Zhu (2006), “Properties of the Second Type of Covering-Based RoughSets”, Proceedings of the 2006 IEEE/ACM International Conference on WI-

 IAT 2006 Workshops.

[37] W. Zhu, Fei-Yue Wang (2003), Reduction and Axiomization of CoveringGeneralized Rough sets, Information Sciences, vol. 152, 217-230.

[38] . Zhu, Fei Wang (2006), “Relationships Among Three Type of CoveringRough Sets”, IEEE GrC, Atlanda, USA, 43-48.

[39] W. Zhu, Fei-Yue Wang (2007), “Topological Properties in Covering-BasedRough sets”, FSKD ’07 Haikou, China, 24-27.

[40] W.Zhu, Fei-Yue Wang (2007), “On Three Type of Covering-Based Roughsets”, IEEE Transactions on Knowledge and Data Mining , Vol.19, No.8.

[41] Wei Wei, Jiye Liang, Yuhua Qian (2008), “Change Mechanism of aDecision Table’s Decision Performance Caused by Attribute Reductions”,Granular Computing, 2008, IEEE Internation Conference, 638 – 643.

[42] Wei-Jiang Liu (2004), “Topological Space Properties of Rough sets”,Proceedings of the Third International Conference on Machine Learningand Cybernetics, Shanghai, 26-29, August 2004.

[43] Xian-Jun Meng, Quing-Cai Chen, Xiao-Long Wang (2009), “A Tolerance

Rough Set Based Sematic Clustering Method for Web Search Results”,

Page 86: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 86/100

 

72

 Information Technology Journal, Vol. 4, 453-464.

[44] Y.Y. Yao, S.K.M. Wong (1995), “Generalization of Rough Sets Using

Relationships Between Attribute Values”,   Proceedings of the 2nd Annual  Joint Conference on Information Sciences, 30-33.

[45] Y.Y. Yao, Yan Zhao, Jue Wang (2006), “On Reduct ConstructionAlgorithms, Rough sets and Knowledge Technology”, First InternationalConference, RSKT2006, Proceedings, LNAI 4062, 207-304.

[46] Yuhua Qian, Chuangyin Dang, Jiye Liang, Haiyun Zhang, Jianmin Ma(2008), “On The Valuation of The Decision Performance of an IncompleteDecision Table”, Data & Knowledge Engineering , Vol. 65, 373-400.

[47] Yuhua Qian, Jiye Liang, Chuangyin Dang (2008), “ConverseApproximation and Rule Extraction from Decision Tables in Rough SetTheory”, Computers and Mathematics with Applications, Vol 55, 1754-1765.

[48] Yuhua Qian, Jiye Liang, Deyeu Li, Haiyun Zhang, Chuangyin Dang (2008),“Measures of Evaluating The Decision Performace of a Decision Table inRough Set Theory”, Information Sciences, Vol.178,181 – 202.

Page 87: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 87/100

 

73

Phụ lục 1: Xây dự ng phần mềm hỗ trợ rút trích luậtquyết định dự a vào lý thuyết tập thô

Hằng năm để nâng cao chất lượ ng giảng dạy tại Đại học Nha Trang, Phòng

Kiểm định chất lượ ng đào tạo của tr ườ ng sẽ phát phiếu khảo sát chất lượ ng của mỗi

môn học đến sinh viên. Biểu mẫu, cũng như nội dung khảo sát đượ c nhà tr ườ ng

thông qua, dựa vào các tiêu chí giáo dục đại học, do nhóm chuyên gia giáo dục đề 

xuất. Mỗi một phiếu khảo sát thu về, đượ c Trung tâm Nghiên cứu & Phát triển

Công nghệ phần mềm ĐH Nha Trang (TTNCPTPM) xử lý: nhận dạng và chuyểnqua dữ liệu số (lưu tr ữ dướ i dạng *.mdb). Sau đó, căn cứ vào các tiêu chí đánh giá

(của nhóm chuyên gia đề xuất), phần mềm của TTNCPTPM k ết xuất k ết quả đánh

giá chất lượ ng giảng dạy của giáo viên. Trong các niên học vừa qua, những k ết quả 

thu đượ c từ phần mềm của TTNCPTPM đã giúp cho nhà tr ườ ng bướ c đầu phân loại

chất lượ ng giảng dạy của giáo viên.

Trên cơ  sở nghiên cứu về lý thuyết tậ  p thô, chúng tôi muốn ứng dụng xây

dựng một phần mềm rút trích tậ p luật quyết định từ dữ liệu khảo sát. K ết quả thu

đượ c sẽ là một kênh tham khảo vì đượ c rút trích dựa trên mô hình toán học độc lậ p

vớ i mô hình do nhóm chuyên gia giáo dục đề xuất.

Cơ  sở  lý thuyết của phần mềm ngoài những thuật toán đã đượ c công bố,

chúng tôi sử dụng các thuật toán mớ i do chúng tôi đề xuất và công bố. Điểm đáng

lưu ý là một số thuật toán ở  đây dựa vào lý thuyết tậ p thô mở r ộng dựa vào phủ tậ p

thô.

I.  Cơ sở lý thuyết liên quan

a.   Hiệu chỉ nh d ữ liệu:

Khi nhận dạng dữ liệu có thể có những mục trong phiếu khảo sát, phần mềm

nhận dạng không thể nhận biết đượ c do lỗi sinh viên đã đánh dấu không chính xác.

Tr ướ c đây, những phiếu có những mục “không rõ” này sẽ đượ c đánh dấu để loại bỏ 

khi thống kê. Để xử lý tr ườ ng hợ  p này, chúng tôi xem dữ liệu sau định dạng như là

Page 88: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 88/100

 

74

một hệ thống thông tin không đầy đủ, và điền giá tr ị thích hợ  p theo thuật toán của

nhóm tác giả Dai Dai, Jiangpeng Wang.

b.   Rút g ọn t ậ p thuộc tính:

 Như đã biết, từ một bảng quyết định có nhiều đối tượ ng, tậ p luật quyết định

rút trích đượ c là r ất lớ n. Để thu gọn tậ p luật quyết định mà không làm mất đi tính

đặc tr ưng của bảng quyết định, một trong những phươ ng án là thu gọn tậ  p thuộc

tính. Tuy nhiên, việc rút gọn tậ p thuộc tính cũng dùng để đánh giá sự độc lậ p của

các tiêu chí khảo sát. Nếu số thuộc tính rút gọn càng lớ n, chứng tỏ các tiêu chí của

 bảng khảo sát có sự dư thừa bất hợ   p lý. Thuật toán đượ c sử dụng trong phần mềmnày trình bày ở chươ ng 3.

c.   Rút trích t ậ p luật :

Sinh luật quyết định là một k ết quả quan tr ọng của phần mềm. Thuật toán sử 

dụng để sinh luật dựa tiế p cận tính toán hạt của các tác giả Haiyan Yu và Daoping

Wang. Thuật toán đã đượ c công bố và so sánh vớ i các thuật toán rút trích dữ liệu

khác. Tính ưu việt của thuật toán là việc k ết xuất dữ liệu đượ c phân lớ  p, tổ hợ  p đơ n

giản). Trong phần mềm, chúng tôi còn rút trích luật k ết hợ  p vớ i thuật toán apriori

cải biên: apriori_DT do chúng tôi đề xuất. Ngoài ra, phần mềm còn có chức năng

rút gọn tậ p luật k ết hợ  p dựa vào thuật toán của Jiye Li.

d.   Độ đ o độ chắ c chắ n, độ nhấ t quán, độ hỗ tr ợ của t ậ p luật quyế t định:

 Nhằm đánh giá tậ p luật quyết định rút trích đượ c, ngườ i ta dựa vào độ đo độ 

chắc chắn, độ nhất quán, độ hỗ tr ợ . Phần mềm đã sử dụng hệ độ đo do trình bày ở  

chươ ng 4.

e.  Tìm độ k của các phụ thuộc hàm xấ  p xỉ  

Tậ p luật quyết định, thể hiện mối quan hệ các tiêu chí đánh giá vớ i thuộc tính

quyết định (thuộc tính phân loại). Tậ p luật này là khá lớ n. Nhưng đáng lưu ý là tậ p

luật này không thể hiện mối quan hệ giữa các tiêu chí đánh giá. Việc nhận biệt mối

quan hệ giữa những tiêu chí đánh giá này khá quan tr ọng, hỗ tr ợ cho việc xây dựng,

 bổ sung, hay loại bỏ các tiêu chí thích hợ  p. Như đã biết, việc rút trích tất cả các phụ 

Page 89: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 89/100

 

75

thuộc này là bài toán NP-đầy đủ. Vì vậy, đôi khi ngườ i ta chỉ cần xác định độ k của

một phụ thuộc hàm xấ p xỉ ứng vớ i hai tậ p thuộc tính cho tr ướ c. Ở đây, phần mềm

chúng tôi có xây dựng chức năng cho phép chọn các thuộc tính cho tr ướ c này và

tính độ k của phụ thuộc hàm xấ p xỉ của hai thuộc tính đó.

Có thể tóm tắt những chức năng chính và thuật toán liên quan theo sơ   đồ sau:

É 

ð 

Hình PL1 S ơ  đồ chứ c nă ng và thuật toán xử lý d ữ liệu d ạ y & học t ại Đ H Nha Trang  

Rút gọn tập thuộc tínhThuật toán của

 Ng  Đứ c Thuần, Ng X. Huy

Rút trích luật q.địnhThuật toán của

 Haiyan Yu và Daoping Wang

Đánh giá tập luậtThuật toán của

 Ng  Đứ c Thuần, Ng X. Huy

 Kiể m tra tính

độc l ậ p các tiêuchí khảo sát 

 Độ tin cậ y của

t ậ p luật 

 Hiệu chỉ nh tiêuchí khảo sát 

(I)

(II)

Rút trích luật k ết hợ pThuật toán Apriori

cải biên

Cung cấ p tri thức về chất lượ ng dạy và học

Phiếu khảo sátđượ c thu hồi sau khisinh viên đánh giá

TTNC & PTCNPMnhận dạng và chuyển thành dữ 

liệu số (*.mdb)

Đánh giá dự vào phươ ng pháp docác chuyên gia giáo dục đề xuất(Phần mềm TTNC&PTPM)

 

Hiệu chỉnh dữ liệuThuật toán của

 Dai Dai, Jiangpeng Wang 

(I)

Xác định độ k của cácphụ thuộc xấp xỉ 

Page 90: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 90/100

 

76

II.  Một số k ết quả đạt đượ c

Phần mềm RSEdu ver 1.0 chúng tôi đã thử nghiệm trên số liệu khảo sát của

nhà tr ườ ng thu đượ c trong các niên học: - Phần mềm đã cho các k ết quả thực

nghiệm như sau:

 Nội dung K ết quả 

Số lượ ng bản ghi xử lý 13.434

Số lượ ng bản ghi đượ c hiệu chỉnh 1.734

Số lượ ng thuộc tính đượ c rút gọn 0

Số lượ ng luật quyết định rút trích 717.271

Đánh giá tậ p luật Màn hình minh họa

Một số màn hình k ết quả : Màn hình giao diện, Một số luật rút trích, Đồ thị 

thể hiện các độ đo

Hình PL2-Giao diện của chươ ng trình

Page 91: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 91/100

 

77

Hình PL3- Biểu đồ minh họa độ đo ta(.) và các độ đo cổ điển

Hình PL4- Biểu đồ minh họa độ đo tb(.) và các độ đo cổ điển

Page 92: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 92/100

 

78

Hình PL5- Chức năng tính phụ thuộc độ k 

Hình PL6- Chức năng rút trích tậ p luật 

Page 93: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 93/100

 

79

Hình PL7- Một k ết quả rút trích tậ p luật trên csdl

Thông tin dạy và học của Đ.H Nha Trang (vớ i 13.434 bản ghi)

 M ột số k ế t quả ứ ng d ụng độ đ o độ chắ c chắ n, độ nhấ t quán, độ hỗ tr ợ :chươ ng 3)

Id Tiêu chí123456789

101112131415

16

GV truyền đạt rõ ràng, dễ hiểuGV thườ ng nêu vấn đề để SV suy ngh ĩ , trao đổiGV quan tâm tổ chức các hoạt động phát triển tư duy sáng tạo của SVGV có kiến thức sâu r ộng và cậ p nhậtGV sử dụng hiệu quả các phươ ng tiện dạy học (bảng viết, đèn chiếu,…)GV thực hiện đúng giờ lên lớ  p và k ế hoạch giảng dạyGV có tác phong và cách ứng xử chuẩn mựcGV cho điểm công bằng, phản ánh đúng năng lực của SVGV nhiệt tình và có trách nhiệm trong giảng dạy

GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảoCảm thấy hứng thú trong giờ học Nắm đượ c mục đích, yêu cầu của học phần Nhận đượ c nhiều kiến thức bổ ích từ học phầnĐượ c GV giải thích đầy đủ và rõ ràng các thắc mắcĐượ c phát triển những k ỹ năng tổng quát (k ỹ năng học tậ p, giao tiế p, trình bày, làmviệc nhóm,...)Xế p loại

Bảng PL1: Danh sách các thuộc tính trong bảng quyết định của bài toán

Xủ lý Thông Tin Dạy & Học tại ĐHNT 

Page 94: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 94/100

 

80

Cơ sở dữ liệu của bài toán của bài toán có danh sách các tiêu chí tươ ng ứng

vớ i các thuộc tính từ 1 đến 15, và thuộc tính quyết định (16) Bảng PL1.

Hệ độ đo đượ c đề xuất trong chươ ng 3, đượ c ứng dụng đánh giá hiệu năng

quyết định của một bộ tiêu chí (tuỳ chọn bất k ỳ) lên thuộc tính quyết định (tuỳ 

chọn) xế p loại của giáo viên. Để minh hoạ, trong phần này trình bày một k ết quả đo

hiệu năng quyết định giữa hai tậ p luật, một bao gồm tậ p thuộc tính thứ nhấ t gồm

các tiêu chí:

·  GV truyền đạt rõ ràng, dễ hiểu

·  GV có tác phong và cách ứng xử chuẩn mực

·  GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo

và tậ p luật thứ hai gồm t ậ p thuộc tính thứ hai có các tiêu chí:

·  GV truyền đạt rõ ràng, dễ hiểu

·  GV thườ ng nêu vấn đề để SV suy ngh ĩ , trao đổi

·  GV quan tâm tổ chức các hoạt động phát triển tư duy sáng tạo của SV

và tiêu chí quyết định là hiệu quả tiế p thu tri thức của sinh viên, cụ thể là

thuộc tính:

·   Nhận đượ c nhiều kiến thức bổ ích từ học phần

Các k ết quả đánh giá tươ ng ứng cho hai tậ  p thuộc tính đượ c trình bày lần

lượ t trong hình PL8, PL9:

Độ đo Tậ p thuộc tính điều kiện thứ nhất Tậ p thuộc tính điều kiện thứ hai

τα 0,414 0,418

τβ 0,218 0,225

γ 0,048 0,024

Page 95: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 95/100

 

81

Hình PL8 : - K ết quả khảo sát hiệu năng quyết định vớ i tậ p thuộc tính thứ nhất

Hình PL9 : - K ết quả khảo sát hiệu năng quyết định vớ i tậ p thuộc tính thứ hai

Page 96: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 96/100

 

82

 K ế t quả rút trích luật k ế t hợ  p:

Việc ứng dụng trên csdl bài toán KSCLGV ĐHNT nhằm mục tiêu khai thác

các luật k ết hợ  p mạnh và có độ tin cậy cao trong toàn bộ dữ liệu. Trong khai thác

thực nghiệm, các ngưỡ ng hỗ tr ợ tối thiểu = 30% và ngưỡ ng tin cậy tối thiểu = 81%

đượ c lựa chọn. Vớ i các ngưỡ ng tối thiểu xác định tr ướ c, thuật toán khai thác luật

k ết hợ  p Apriori DT đượ c thực thi bằng chươ ng trình RSedu v1.0. K ết quả thu đượ c

25 luật.

Thực nghiệm này không áp d ụng khuôn mẫ u luật  trong quá trình khai thác

nhằm đem lại một cái nhìn toàn diện về các tri thức trên toàn bộ cơ sở dữ liệu phânloại giảng viên.

Id. Luật k ết hợ   p Support(%) C

1If GV truyền đạt rõ ràng, dễ hiểu = Đồng ý then GV có tác phong và cáchứng xử chuẩn mực = Đồng ý

33,19481 81,66019

2If GV sử dụng hiệu quả các phươ ng tiện dạy học (bảng viết, đèn chiếu,…) =

Đồng ý then GV thực hiện đúng giờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý33,34441 81,86084

3If GV cho điểm công bằng, phản ánh đúng năng lực của SV = Đồng ý thenGV có tác phong và cách ứng xử chuẩn mực = Đồng ý 41,72207 83,45802

4If GV nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phong và cách ứng xử chuẩn mực = Đồng ý

54,18052 84,12698

5If Đượ c GV giải thích đầy đủ và rõ ràng các thắc mắc = Đồng ý then GV cótác phong và cách ứng xử chuẩn mực = Đồng ý

35,65492 83,09123

6If Xế p loại = Giỏi then GV có tác phong và cách ứng xử chuẩn mực = Đồngý 30,8012 89,19374

7 If Xế p loại = Giỏi then GV nhiệt tình và có trách nhiệm trong giảng dạy =Đồng ý

30,97573 89,69916

8If GV có kiến thức sâu r ộng và cậ p nhật = Đồng ý and GV thực hiện đúnggiờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý then GV có tác phong và cách

ứng xử chuẩn mực = Đồng ý

30,39395 82,71884

9If GV có kiến thức sâu r ộng và cậ p nhật = Đồng ý and GV nhiệt tình và cótrách nhiệm trong giảng dạy = Đồng ý then GV có tác phong và cách ứng xử chuẩn mực = Đồng ý

30,14461 85,60302

10If GV thực hiện đúng giờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý and GVcho điểm công bằng, phản ánh đúng năng lực của SV = Đồng ý then GV cótác phong và cách ứng xử chuẩn mực = Đồng ý

34,04225 86,0685

11If GV có tác phong và cách ứng xử chuẩn mực = Đồng ý and GV cho điểmcông bằng, phản ánh đúng năng lực của SV = Đồng ý then GV thực hiệnđúng giờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý

34,04225 81,59363

12

If GV thực hiện đúng giờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý and GV

nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phongvà cách ứng xử chuẩn mực = Đồng ý 45.07148 86,67093

Page 97: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 97/100

 

83

13If GV có tác phong và cách ứng xử chuẩn mực = Đồng ý and GV nhiệt tìnhvà có trách nhiệm trong giảng dạy = Đồng ý then GV thực hiện đúng giờ lênlớ  p và k ế hoạch giảng dạy = Đồng ý

45,07148 83,18761

14If GV cho điểm công bằng, phản ánh đúng năng lực của SV = Đồng ý andGV nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV thực hiệnđúng giờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý

31,27493 81,23921

15If GV cho điểm công bằng, phản ánh đúng năng lực của SV = Đồng ý andGV nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phong và cách ứng xử chuẩn mực = Đồng ý

33,55219 87,15458

16If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV thực hiện đúng giờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý then GV cótác phong và cách ứng xử chuẩn mực = Đồng ý

38,12334 82,75302

17If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV có tác phong và cách ứng xử chuẩn mực = Đồng ý then GV thực hiệnđúng giờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý

38,12334 82,24852

18If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV thực hiệnđúng giờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý

35,85439 81,15124

19If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV nhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phong và cách ứng xử chuẩn mực = Đồng ý

37,37533 84,59368

20If Cảm thấy hứng thú trong giờ học = Tươ ng đối đồng ý and GV có tác phong và cách ứng xử chuẩn mực = Đồng ý then GV thực hiện đúng giờ lênlớ  p và k ế hoạch giảng dạy = Đồng ý

30,66822 81,61911

21If Đượ c GV giải thích đầy đủ và rõ ràng các thắc mắc = Đồng ý and GV cótác phong và cách ứng xử chuẩn mực = Đồng ý then GV nhiệt tình và có

trách nhiệm trong giảng dạy = Đồng ý

30,04488 84,26573

22If Đượ c GV giải thích đầy đủ và rõ ràng các thắc mắc = Đồng ý and GVnhiệt tình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phongvà cách ứng xử chuẩn mực = Đồng ý

30,04488 86,69065

23

If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV thực hiện đúng giờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý and GV cótác phong và cách ứng xử chuẩn mực = Đồng ý then GV nhiệt tình và cótrách nhiệm trong giảng dạy = Đồng ý

31,19182 81,81818

24

If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV thực hiện đúng giờ lên lớ  p và k ế hoạch giảng dạy = Đồng ý and GV nhiệttình và có trách nhiệm trong giảng dạy = Đồng ý then GV có tác phong vàcách ứng xử chuẩn mực = Đồng ý

31,19182 86,99583

25

If GV giớ i thiệu đầy đủ giáo trình, bài giảng, tài liệu tham khảo = Đồng ý andGV có tác phong và cách ứng xử chuẩn mực = Đồng ý and GV nhiệt tình vàcó trách nhiệm trong giảng dạy = Đồng ý then GV thực hiện đúng giờ lên lớ  pvà k ế hoạch giảng dạy = Đồng ý

31,19182 83,45564

Bảng PL2: Tậ p luật k ết hợ  p khai thác trên cơ sở dữ liệu bài toán

Xử lý thông tin tại ĐHNT 

Tuy nhiên, những k ết quả này không sử dụng tr ực tiế p các k ết quả của luận

án do chúng tôi phát hiện hoặc xây dựng, nên chúng tôi không trình bày chi tiết.

Page 98: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 98/100

 

84

III.  K ết Luận

Đây là phần mềm ứng dụng, ngoài chức năng hỗ tr ợ việc đánh giá khảo sát

chất lượ ng giảng viên tại Đại học Nha Trang. Phần mềm cũng là k ết quả minh họa

cho những k ết quả nghiên cứu mở  r ộng tậ p thô của nhóm chúng tôi. K ết quả thực

nghiệm cho thấy r ằng, các tiêu chí của bảng khảo sát chất lượ ng giảng viên độc lậ p;

ngoài ra tậ p luật quyết định bướ c đầu cho thấy những tiêu chí quan tr ọng ảnh hưở ng

đến việc phân loại giảng viên. Do phần mềm mớ i hoàn thiện, nên thờ i gian tớ i

chúng tôi sẽ nhờ các chuyên gia giáo dục học đánh giá và phản biện. Chúng tôi xin

mạnh dạn đánh giá các ưu nhượ c điểm của phần mềm như sau:Ư u đ iể m

-  Đáp ứng nhu cầu thực nghiệm chính xác các k ết quả nghiên cứu lý thuyết

trên tậ p thô

-  Giao diện chươ ng trình thân thiện

-  Sử dụng k ỹ thuật lậ  p trình Hướ ng đối tượ ng, các giải thuật đều đượ c viết

dướ i dạng các Lớ   p và có thể biên dịch thành những thư viên liên k ết động (dll)nhằm mục đích cậ p nhật, nâng cấ p mở r ộng và sử dụng lại.

-  Cấu hình liên k ết vớ i hệ quản tr ị csdl SQL 2005 thông qua tậ p tin XML; giúp

việc chỉnh sửa thông tin k ết nối tr ực quan và dễ dàng.

 Nhượ c đ iể m

Bộ luật sinh ra cần tinh chỉnh để tối ưu về mặt số lượ ng.

Dữ liệu thủ nghiệm còn bé H ướ ng cải tiế n

Cải thiện các giải thuật tìm kiếm trên hệ thông tin lớ n nhằm tối ưu hóa tốc độ 

Thêm chức năng cấu hình csdl cho phép thao tác trên csdl mẫu bất k ỳ 

Tiế p tục mở r ộng để chươ ng trình tr ở thành một phần mềm thực nghiệm các

lý thuyết mớ i về tậ p thô. 

Page 99: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 99/100

 

85

Phụ lục 2: Phiếu thu thập thông tin dạy và học

(Do Phòng kiể m định chấ t l ượ ng giáo d ục Đ.H Nha Trang soạn thảo)

Page 100: Luan an Ly Thuyet Tap Tho

5/11/2018 Luan an Ly Thuyet Tap Tho - slidepdf.com

http://slidepdf.com/reader/full/luan-an-ly-thuyet-tap-tho 100/100

 

 

BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜ NG ĐẠI HỌC NHA TRANG

PHIẾU THU THẬP THÔNG TIN DẠY & HỌC 

(Dùng để lấy ý kiến sinh viên về giảng dạy học phần)

Tên học phần (HP): Học kỳ: Năm học:

Lớ p (của anh/chị): Khoa:

Họ và tên Giảng viên:

(Chú ý: SV không cần ghi tên của mình trong phiếu này, tô kín ô tròn đượ c lựa chọn) 

I. THÔNG TIN VỀ BẢN THÂN

1. Giớ i tính: ○  Nam  ○  N ữ  

2. Tự đánh giá về mức độ tiếp thu của anh/chị đối vớ i HP này: ○ T ố t   ○ Trung bình  ○ Y ế u 

3. Xếp loại học lực của anh/chị trong học kỳ vừa qua (nếu có): ○  Giỏi ○ Khá ○ Trung bình khá  ○ Trung bình ○ Y ế u 

4. Tỷ lệ thờ i gian tham dự lớ p học của anh/chị đối vớ i HP này: ○  X ấ  p xỉ 100%  ○ T ố i thiể u 80%  ○  Dướ i 80% 

5. Đối vớ i HP này, anh/chị thuộc diện:  ○  H ọc lần 1 ○  H ọc lại 

II. THÔNG TIN VỀ DẠY VÀ HỌC 

Đ: Đồng ý TĐĐ: Tươ ng đối đồng ý KĐ: Không đồng ý N: Không có ý kiến

STT L ĩ nh vự c 1: Hoạt động giảng dạy Đ TĐĐ KĐ N

1 GV có phươ ng pháp truyền đạt tốt ○  ○  ○  ○ 2 GV thườ ng nêu vấn đề để SV suy ngh ĩ , trao đổi ○  ○  ○  ○ 3 GV quan tâm tổ chức các hoạt động nhóm sinh viên ○  ○  ○  ○ 4 GV quan tâm phát triển khả năng diễn đạt, tranh luận của SV ○  ○  ○  ○ 5 GV dạy kết hợ p vớ i giáo dục nhân cách, đạo đức ○  ○  ○  ○ 6 GV sử dụng hiệu quả các phươ ng tiện dạy học (bảng, đèn chiếu, mô hình,…)  ○  ○  ○  ○ 7 GV thực hiện tốt thờ i gian lên lớ p và kế hoạch giảng dạy ○  ○  ○  ○ 8 GV tổ chức kiểm tra theo đúng Đề cươ ng chi tiết môn học  ○  ○  ○  ○ 9 GV đưa ra lượ ng bài tập, thực hành hợ p lý ○  ○  ○  ○ 10 GV có hoặc giớ i thiệu giáo trình, bài giảng, tài liệu tham khảo tốt ○  ○  ○  ○ 

L ĩ nh vự c 2: Cảm nhận của bản thân Đ TĐĐ KĐ N

11 Cảm thấy hứng thú trong giờ học ○  ○  ○  ○ 12 Nắm đượ c mục đích, yêu cầu của học phần

○ 

○ 

○ 

○ 

13 Nhận đượ c nhiều kiến thức bổ ích từ học phần ○  ○  ○  ○ 14 Có đủ thông tin về kế hoạch giảng dạy và các tiêu chí đánh giá của học phần ○  ○  ○  ○ 15 Đượ c phát triển những kỹ năng tổng quát (kỹ năng học tập, giao tiếp, trình

bày, làm việc nhóm,...)○  ○  ○  ○ 

L ĩ nh vự c 3: Cơ sở vật chất phục vụ dạy và học Đ TĐĐ KĐ N

16 SV dễ dàng tiếp cận tài liệu học tập và tham khảo đượ c GV giớ i thiệu ○  ○  ○  ○ 17 Thư viện nhà trườ ng có đủ tài liệu tham khảo đối vớ i học phần ○  ○  ○  ○ 18 Phòng học có đủ các thiết bị hỗ trợ cần thiết cho giảng dạy ○  ○  ○  ○ 19 Phòng học đảm bảo yêu cầu về chỗ ngồi ○  ○  ○  ○ 20 Phòng học đảm bảo yêu cầu về ánh sáng, độ thông thoáng ○  ○  ○  ○ 

III. Ý KIẾN KHÁC1. Cảm nhận chung của anh/chị về chất lượ ng giảng dạy học phần này tại lớ p của anh/chị:

○  Rấ t t ố t   ○ T ố t   ○ Trung bình  ○ Không t ố t  

2. Theo anh/chị, để nâng cao hơ n nữa chất lượ ng của học phần này thì GV và Nhà trườ ng cần làm những gì?

2a. Góp ý cho GV:

2b. Góp ý cho Nhà trườ ng:

 M  u NXGD2/07