hƯỚng dẪn mÔ tẢ thÔng tin tỪ vỰng trong tỪ ĐiỂn...

25
HƯỚNG DN MÔ TTHÔNG TIN TVNG TRONG TĐIN DÙNG CHO MÁY TÍNH SP 7.2 – Đề tài KC.01.01.05/06-10 Vũ Xuân Lương 1 , Nguyn ThMinh Huyn 2 , HTú Bo 3 Mc lc A. THÔNG TIN HÌNH THÁI – MORPHOLOGICAL.................................................. 5 I. THÔNG TIN CU TO T.................................................................................. 5 1. Tiêu chí xác định................................................................................................. 5 2. Thc hành gán nhãn thông tin cu to t............................................................ 5 2.1. Tđơn : simple word ................................................................................... 5 2.2. Tghép (compound word); ......................................................................... 6 2.3. Tláy (reduplicative word). ........................................................................ 6 B. THÔNG TIN CÚ PHÁP – SYNTACTIC .................................................................. 8 I. THÔNG TIN TLOI .......................................................................................... 8 1. Tiêu chí xác định tloi ..................................................................................... 8 2. Thc hành gán nhãn thông tin cú pháp ............................................................... 8 2.1. Danh t(Nouns - N) .................................................................................... 8 2.1.1. Danh triêng : Proper Noun................................................................. 8 2.1.2. Danh tđơn th: Concrete Noun ......................................................... 8 2.1.3. Danh ttng hp : Collective Noun ..................................................... 9 2.1.4. Danh ttru tượng : Abstract Noun ..................................................... 9 2.1.5. Danh tloi th: Classify Noun ........................................................ 10 2.1.6. Danh tđơn v: Unit Noun ................................................................ 10 2.2. Động t(Verbs – V) .................................................................................. 11 2.2.1. Ni động t(intransitive verb) ........................................................... 11 2.2.2. Ngoi động t(transitive verb), .......................................................... 11 2.2.3. Động ttrng thái (state verb) ............................................................ 11 1 Trung tâm Tđin hc (Vietlex). 2 Đại hc Khoa hc Tnhiên – Đại hc Quc gia Hà Ni. 3 JAIST.

Upload: others

Post on 15-Oct-2019

2 views

Category:

Documents


0 download

TRANSCRIPT

HƯỚNG DẪN MÔ TẢ THÔNG TIN TỪ VỰNG TRONG TỪ ĐIỂN DÙNG CHO MÁY TÍNH

SP 7.2 – Đề tài KC.01.01.05/06-10 Vũ Xuân Lương1, Nguyễn Thị Minh Huyền2, Hồ Tú Bảo3

Mục lục

A. THÔNG TIN HÌNH THÁI – MORPHOLOGICAL.................................................. 5

I. THÔNG TIN CẤU TẠO TỪ .................................................................................. 5

1. Tiêu chí xác định................................................................................................. 5

2. Thực hành gán nhãn thông tin cấu tạo từ............................................................ 5

2.1. Từ đơn : simple word................................................................................... 5

2.2. Từ ghép (compound word); ......................................................................... 6

2.3. Từ láy (reduplicative word). ........................................................................ 6

B. THÔNG TIN CÚ PHÁP – SYNTACTIC.................................................................. 8

I. THÔNG TIN TỪ LOẠI .......................................................................................... 8

1. Tiêu chí xác định từ loại ..................................................................................... 8

2. Thực hành gán nhãn thông tin cú pháp............................................................... 8

2.1. Danh từ (Nouns - N) .................................................................................... 8

2.1.1. Danh từ riêng : Proper Noun................................................................. 8

2.1.2. Danh từ đơn thể : Concrete Noun ......................................................... 8

2.1.3. Danh từ tổng hợp : Collective Noun..................................................... 9

2.1.4. Danh từ trừu tượng : Abstract Noun..................................................... 9

2.1.5. Danh từ loại thể : Classify Noun ........................................................ 10

2.1.6. Danh từ đơn vị : Unit Noun ................................................................ 10

2.2. Động từ (Verbs – V) .................................................................................. 11

2.2.1. Nội động từ (intransitive verb) ........................................................... 11

2.2.2. Ngoại động từ (transitive verb),.......................................................... 11

2.2.3. Động từ trạng thái (state verb)............................................................ 11

1 Trung tâm Từ điển học (Vietlex). 2 Đại học Khoa học Tự nhiên – Đại học Quốc gia Hà Nội. 3 JAIST.

2.2.4. Trợ động từ (auxiliary verb) ............................................................... 12

2.3. Tính từ (Adjective – A).............................................................................. 12

2.3.1. Tính từ chỉ tính chất............................................................................ 12

2.3.2. Tính từ quan hệ ................................................................................... 13

2.3.3. Tính từ tượng thanh : Onomatopoetic Adjective............................ 13

2.3.4. Tính từ tượng hình : Pictographic Adjective ...................................... 13

2.4. Đại từ (Pronoun – P) .................................................................................. 14

2.4.1. Đại từ xưng hô .................................................................................... 14

2.4.2. Đại từ chỉ định .................................................................................... 14

2.4.3. Đại từ nghi vấn.................................................................................... 14

2.5. Số từ (Numeral – M).................................................................................. 14

2.5.1. Số đếm ................................................................................................ 14

2.5.1. Số thứ tự.............................................................................................. 14

2.6. Lượng từ (Numeral – M) ........................................................................... 14

2.7. Phụ từ (Adverb – R)................................................................................... 14

2.8. Giới từ (Preposition – O) ........................................................................... 15

2.9. Liên từ (Conjunction – C).......................................................................... 15

2.10. Trợ từ (Introductory word – I) ................................................................. 15

2.11. Cảm từ (Emotivity word – E) .................................................................. 15

C. THÔNG TIN NGỮ NGHĨA - SEMANTIC............................................................. 16

I. LOGICAL CONSTRAINT: .......................................................................... 16

1. Tiêu chí xác định............................................................................................... 16

2. Thực hành gán nhãn thông tin ngữ nghĩa ......................................................... 16

2.1. Con người : People ................................................................................ 16

2.1.1. Người : Person ................................................................................ 16

2.1.2. Tổ chức : Organization ................................................................... 16

2.1.3. Nhân vật siêu nhiên : Supernatural Being ...................................... 16

2.2. Động vật : Animal.................................................................................. 17

2.2.1. Thú : Animal ................................................................................... 17

2.2.2. Chim : Bird ..................................................................................... 17

2.2.3. Cá : Fish .......................................................................................... 17

2.2.4. Lưỡng cư : Amphibian.................................................................... 17

2.2.5. Bò sát : Reptile................................................................................ 17

2.2.6. Sâu : Worm ..................................................................................... 18

2.1.2.7. Côn trùng : Insect......................................................................... 18

2.1.2.8. Động vật thân mềm : Shellfish .................................................... 18

2.1.2.9. Động vật giáp xác : ...................................................................... 18

2.1.2.10. động vật hư cấu : Fictional Animal ........................................... 19

2.3. Vi sinh vật : Microorganism .................................................................. 19

2.4. Thực vật : Plant...................................................................................... 19

2.4.1. cây thân gỗ : Tree............................................................................ 19

2.4.2. cây bụi : Bush ................................................................................. 19

2.4.3. cây thân leo : Vine .......................................................................... 19

2.4.4. cây thân cỏ : Herb ........................................................................... 19

2.5. Thức ăn : Food ....................................................................................... 19

2.6. Vật dụng : Artifact ................................................................................. 19

2.7. Vật hư cấu : Fictional Object ................................................................ 19

2.8. Bộ phận : Part ........................................................................................ 19

2.9. Chất liệu : Substance.............................................................................. 20

2.10. Tự nhiên : Natural Object .................................................................... 20

2.11. Vị trí : Location.................................................................................... 20

2.12. Lĩnh vực tri thức : Field Of Knowledge .............................................. 20

2.13. Trạng thái : State ............................................................................. 20

2.14. Hoạt động : Action.............................................................................. 20

2.15. Quan hệ : Relation .............................................................................. 20

2.16. Tình thái :............................................................................................ 20

2.17. Thuộc tính: Attribute .......................................................................... 20

2.18. Giá trị : Value ...................................................................................... 20

2.19. Đơn vị : Unit ........................................................................................ 20

II. SEMANTIC CONSTAINT:......................................................................... 20

1. Tiêu chí xác định............................................................................................... 20

2. Thực hành gán nhãn thông tin Semantic constraint.......................................... 21

2.1. Subject : chủ thể..................................................................................... 21

2.2. Object : khách thể .................................. Error! Bookmark not defined.

2.2.1. Direct object (Dob) : bổ ngữ trực tiếp ............................................ 21

2.2.2. Indirect object (iob) : bổ ngữ gián tiếp ........................................... 22

2.2.3. Object (Obj) : bổ ngữ tự do............................................................. 23

2.3. Location (Loc) : vị trí, địa điểm............................................................. 24

A. THÔNG TIN HÌNH THÁI – MORPHOLOGICAL

I. THÔNG TIN CẤU TẠO TỪ 1. Tiêu chí xác định Trong phạm vi của đề tài, cấu tạo của từ được xét về những mặt sau đây:

a) Căn cứ vào mặt ý nghĩa và khả năng hoạt động để phân biệt từ đơn với từ phức.

b) Từ đơn là từ chỉ chứa một tiếng, tiếng ấy phải có nghĩa và có khả năng hoạt động độc lập. Chúng nằm trong vốn từ cơ bản của tiếng Việt, và phần lớn trong số đó là từ gốc (hiểu theo nghĩa là những từ có khả năng được dùng để cấu tạo hàng loạt từ phức).

c) Từ phức là từ gồm hai tiếng trở lên kết hợp chặt chẽ với nhau, và có ý nghĩa cho sẵn mà không thể nào xác định được một cách rõ ràng bằng việc suy ra từ ý nghĩa của mỗi tiếng.

d) Muốn nhận ra một từ phức thì phải tìm ra trong nó ít nhất một tiếng có nghĩa.

e) Trong loại từ phức, căn cứ vào phương thức cấu tạo để phân biệt từ ghép với từ láy hoặc dạng láy.

2. Thực hành gán nhãn thông tin cấu tạo từ

2.1. Từ đơn : simple word Đặc điểm:

- Gồm những từ có một tiếng vừa có nghĩa, vừa hoạt động độc lập.

- Những từ có nhiều tiếng (bao gồm cả từ vay mượn đã được Việt hoá, hoặc có hình thức phiên âm gần giống với tiếng Việt), nhưng nếu mỗi tiếng trong đó tự nó không có ý nghĩa (phải cả khối gồm nhiều tiếng gộp lại mới có ý nghĩa) thì cũng được xếp vào loại từ đơn. Ví dụ: bồ nông, bồ hóng, bù nhìn, mạt chược, ca la thầu, ba lô, béc giê, cà phê, căng tin, xi măng, xích lô, blốc, crếp, v.v.

- Những từ có nhiều tiếng có hình thức cấu tạo giống như từ láy nhưng nếu chia các tiếng đó ra mà mỗi tiếng không có một ý nghĩa nào hết cũng được xếp vào loại từ đơn. Ví dụ: ba ba, chuồn chuồn, cào cào, châu chấu, đu đủ, su su, thuồng luồng, v.v.

Danh sách:

trâu, bò, lợn, gà, sách, đèn, bàn, ghế, ông, bà, cha, mẹ, núi, sông, cây, hoa, máy, xe, con, cục, cái, ăn, học, ngủ, đi, đứng, khóc, cười, đẹp, xấu, tốt, đã, sẽ, đang, bồ nông, bồ

hóng, bù nhìn, mạt chược, ba ba, chuồn chuồn, ca la thầu, ba lô, béc giê, cà phê, căng tin, xi măng, xích lô, blốc, crếp, v.v...

2.2. Từ ghép (compound word); Đặc điểm:

- Từ ghép được cấu tạo theo phương thức phối hợp ngữ nghĩa giữa các tiếng được dùng làm yếu tố cấu tạo.

- Từ ghép gồm chủ yếu những từ có hai tiếng, cũng có thể là từ nhiều tiếng, mỗi tiếng đều có nghĩa rõ rệt và có thể hoạt động như một từ đơn.

- Căn cứ vào phương thức phối hợp ngữ nghĩa lại có thể phân biệt thành từ ghép song song (từ ghép đẳng lập) và từ ghép chính phụ.

- Từ ghép song song có sự phối hợp ngữ nghĩa giữa hai tiếng theo quan hệ bình đẳng, song song, không có tiếng chính, tiếng phụ (ví dụ: nhà cửa, ruộng vườn, quần áo, núi sông), và thường mang ý nghĩa khái quát. Trật tự trước sau giữa hai tiếng có thể thay đổi (ví dụ: nhà cửa - cửa nhà, chờ mong – mong chờ, chèo chống – chống chèo).

- Từ ghép chính phụ có sự phối hợp ngữ nghĩa giữa hai tiếng theo quan hệ không bình đẳng. Đó là sự phối hợp giữa một tiếng chính có ý nghĩa khái quát và một tiếng phụ có ý nghĩa hạn định (ví dụ: xe đạp, tàu hoả, nhà ga, nhà thương, nhà rông, rượu chanh, bánh mì, cơm chay).

- Những từ hai tiếng có cấu tạo theo phương thức lặp lại hoàn toàn (giống từ láy), nhưng có nghĩa ngữ pháp chỉ “số nhiều đều đặn” thì được xếp vào loại từ ghép. Ví dụ: ai ai, chiều chiều, đâu đâu, ngày ngày, người người, sáng sáng, tối tối, v.v.

Ghi chú: Trong phạm vi đề tài này, chúng tôi không phân biệt hai loại từ ghép song song và từ ghép chính phụ.

Danh sách:

nhà cửa, cửa nhà, ruộng vườn, quần áo, núi sông, chờ mong, mong chờ, chèo chống, chống chèo, xe đạp, tàu hoả, nhà ga, nhà thương, nhà rông, rượu chanh, bánh mì, cơm chay, ai ai, chiều chiều, đâu đâu, ngày ngày, người người, sáng sáng, tối tối…

2.3. Từ láy (reduplicative word). Đặc điểm:

- Từ láy được cấu tạo theo phương thức láy, đó là phương thức lặp lại có tính chất hoà phối ngữ âm toàn bộ tiếng gốc hay lặp lại một bộ phận nào đó của tiếng gốc bằng một tiếng khác gọi là tiếng láy (âm tiết láy).

- Từ láy gồm chủ yếu là những từ có hai tiếng (có một số ít là từ ba hoặc bốn tiếng), trong đó có thể chỉ có một tiếng có nghĩa, hoặc có thể có nhiều tiếng có nghĩa. Ví dụ: long lanh (long có nghĩa), long tong (tong có nghĩa), xanh xanh (cả hai tiếng đều có nghĩa), (căn phòng trông) tối tối (cả hai tiếng đều có nghĩa), v.v.

- Căn cứ vào phương thức phối hợp ngữ âm có thể phân biệt 2 kiểu từ láy: láy bộ phận (chúm chím, bập bềnh, lênh khênh, ...) và láy toàn bộ (lăm lăm, đùng đùng, oang oang, ...). Để có được tính chất hoà phối ngữ âm, việc láy không đơn thuần là sự lặp lại tiếng gốc ban đầu, mà thường kèm theo một sự biến đổi nhất định về mặt âm thanh (đo đỏ, lành lạnh, nho nhỏ, vành vạnh, ...).

- Căn cứ vào số lần lặp lại của hình thức ngữ âm có thể phân biệt 3 kiểu từ láy: láy đôi (gọn gàng, vững vàng, chắc chắn, ...), láy ba (dửng dừng dưng, sạch sành sanh, tẻo tèo toe, ...), và láy tư (đủng đa đủng đỉnh, long la long lanh, nhí nha nhí nhảnh).

- Chú ý phân biệt giữa từ láy và dạng láy, chẳng hạn đủng đỉnh, long lanh, nhí nhảnh... (từ láy) và đủng đa đủng đỉnh, loang la long lanh, nhí nha nhí nhảnh... (dạng láy).

- Chú ý phân biệt giữa từ ghép và dạng láy; chẳng hạn đỏ hoét (từ ghép) và đỏ hoen hoét (dạng láy), đỏ hỏn (từ ghép) và đỏ hon hỏn (dạng láy), xanh lè (từ ghép) và xanh lè lè (dạng láy), xanh lét (từ ghép) và xanh len lét (dạng láy), v.v.

- Chú ý phân biệt giữa từ láy và dạng lặp trong từ ghép. Chẳng hạn, tối tối với nghĩa “tối nào cũng vậy” là dạng lặp (từ ghép); còn tối tối (hay tôi tối) với nghĩa “lúc gần tối, chưa tối hẳn” (Có tiếng chim gì mổ nhau kêu quang quác trong chiếc lồng kẽm chỗ tối tối) là từ láy.

- Chú ý phân biệt giữa từ láy và từ đơn. Chẳng hạn các tổ hợp ba ba, cào cào, châu chấu, chuồn chuồn, (quả) đu đủ, (quả) su su, thuồng luồng về hình thức ngữ âm có cấu tạo giống như từ láy, nhưng khi xét riêng mỗi yếu tố trong từng tổ hợp thì chúng đều không mang một ý nghĩa nào hết, vì lẽ đó chúng được xếp vào danh sách các từ đơn.

Ghi chú: Trong phạm vi đề tài này, chúng tôi không phân biệt các kiểu từ láy, và đồng thời xếp chung cả dạng láy vào loại từ láy,

Danh sách:

ào ào, bập bềnh, bập bà bập bềnh, bập bùng, chí chát, chí cha chí chát, chông chênh, đỏ hon hỏn, lênh khênh, long bong, long tong, ma mảnh, mơn mởn, …

B. THÔNG TIN CÚ PHÁP – SYNTACTIC

I. THÔNG TIN TỪ LOẠI 1. Tiêu chí xác định từ loại

1.1. Tiêu chí về ý nghĩa khái quát: ý nghĩa khái quát được hiểu là ý nghĩa được nhận biết thông qua ý nghĩa hay cách sử dụng của một loạt từ nhất định (ý nghĩa ngữ pháp), chứ không phải thông qua ý nghĩa hay cách sử dụng của từng từ cụ thể (ý nghĩa từ vựng). Chẳng hạn: ý nghĩa về sự vật được xếp thành loại danh từ; ý nghĩa về hành động và trạng thái được xếp thành loại động từ; ý nghĩa về tính chất được xếp thành loại tính từ, v.v.

1.2. Tiêu chí về khả năng kết hợp:

- Từ có khả năng làm đầu tố trong trong cụm từ chính phụ;

- Từ có tham gia vào cụm từ chính phụ nhưng không làm đầu tố;

- Từ không tham gia vào cụm từ chính phụ, nhưng có thể có quan hệ với cụm từ chính phụ trong trường hợp cụ thể.

1.3. Tiêu chí về chức năng cú pháp:

- Chức năng của từ là đóng vai trò gì trong thành phần câu. Dùng chức năng của từ để góp phần làm cho việc phân định từ loại được rõ ràng.

- Có thể nhận ra được chức năng của từ trong hoạt động ngôn ngữ, chẳng hạn chức năng chủ ngữ đối với danh từ, vị ngữ đối với động từ, v.v.

2. Thực hành gán nhãn thông tin cú pháp

2.1. Danh từ (Nouns - N)

2.1.1. Danh từ riêng : Proper Noun

Đặc điểm:

- Không kết hợp được với số từ, đại từ chỉ định, trừ danh từ chỉ tên người trong những trường hợp đặc biệt. Vd: trong lớp này có hai Tuấn; thêm một Thứ nữa là vừa bảy.

Danh sách:

Nguyễn Du, Việt Nam, Hải Phòng, Trường Đại học Bách khoa, Mộc tinh, ...

2.1.2. Danh từ đơn thể : Concrete Noun

Đặc điểm:

- Chỉ những vật thể mà ta có thể dùng cảm quan thông thường để phân biệt được một cách cụ thể.

- Chỉ những vật thể tưởng tượng gắn với đời sống tâm linh của con người.

- Đứng sau danh từ chỉ loại hoặc sau số từ + danh từ chỉ loại.

- Đứng trước đại từ chỉ định (này, kia, ấy, nọ).

Danh sách:

bàn, ghế, sách, vở, dao, thuyền, xe đạp, xe lửa, tàu thuỷ, cầu, đường, nhà ga, cửa sổ, gà, ngựa, giáo viên, học sinh, bác sĩ, thần, thánh, tiên, bụt, ma, quỷ, sông, hồ, núi, âm phủ, thiên đàng, niết bàn,...

2.1.3. Danh từ tổng hợp : Collective Noun

Đặc điểm:

- Chỉ những vật khác nhau về loại nhưng thường đi kèm với nhau thành một tập hợp hoàn chỉnh.

- Không đứng sau số từ + danh từ chỉ loại, trừ một vài trường hợp đặc biệt.

- Không đứng sau số từ.

- Không đứng sau danh từ chỉ loại.

- Không đứng trước đại từ chỉ định (này, kia, ấy, nọ).

Danh sách:

nhà cửa, gà qué, thầy trò, đồ đạc, cây cối, chim muông, quần áo, trong ngoài, trên dưới, quan quân, binh lính, binh mã, người ngựa, nhân dân, quân đội, uỷ ban, ban chấp hành, sư đoàn, tỉnh thành, thành phố, nông thôn, thủ đô, ...

2.1.4. Danh từ trừu tượng : Abstract Noun

Đặc điểm:

- Chỉ những khái niệm được khái quát hoá trong tư duy.

- Không đứng sau số từ, danh từ chỉ loại, trừ những trường hợp đặc biệt; chẳng hạn: một nền dân chủ, nỗi tâm tư, cái tình yêu, cái tật, cái thói.

Danh sách:

chính sách, chủ trương, tư tưởng, tâm tư, tình cảm, chính trị, lí luận, kinh tế, kế hoạch, nghề nghiệp, nghiệp vụ, phán đoán, định luật, định lí, bệnh tật, tật, thói, vùng, miền, trong, trên, ngoài, dưới, ...

2.1.5. Danh từ loại thể : Classify Noun

Đặc điểm:

- Chỉ từng cá thể, từng đơn vị sự vật, hiện tượng xác định.

- Chỉ tập hợp những vật cùng loại.

- Không đảm nhiệm vai trò định danh.

- Đứng trước và làm phụ tố cho những danh từ đơn thể đảm nhiệm vai trò chính tố.

- Thường đứng sau số từ.

- Trong chu cảnh cụ thể, có thể thay thế cho danh từ đơn thể để đảm nhiệm vai trò chính tố, chẳng hạn: trong chuồng nuôi hai con ngựa, (một) con thì béo, (một) con thì gầy.

Danh sách:

con, cây, cục, cái, chiếc, tấm, phiến, tờ, tập, tệp, mẩu, mảnh, miếng, cuốn, quyển, pho, ngọn, quả, lá, cọng, ngôi, toà, túp, căn, thửa, tiếng, tia, cột, bó, chồng, mớ, giàn, xiên, xâu, bánh, luồng, hạt, dòng, cụ, ông, người, tên, thằng, đứa, cậu, chú, cô, cuộc, sự, nỗi, niềm, toán, bầy, đàn, lũ, tốp, bộ, đợt, trận, cơn, ván, bàn, ...

2.1.6. Danh từ đơn vị : Unit Noun

Đặc điểm:

- Danh từ đơn vị khoa học, chỉ đơn vị đo lường do các nhà khoa học đặt ra và quy ước chung, như gam, mét, lít... Các danh từ loại này đứng trước và làm phụ tố cho những danh từ đơn thể chỉ chất liệu đảm nhiệm vai trò chính tố.

- Danh từ đơn vị dân gian, vốn có nghĩa phái sinh từ những danh từ chỉ đồ đựng hay các hành động tạo lượng do nhân dân quy ước, như đấu, thùng, bồ, nắm, ngụm ... Các danh từ loại này thường đứng sau số từ.

- Danh từ đơn vị tiền tệ (đồng, hào, yên, bảng, ...); luôn luôn đứng sau số từ.

- Danh từ đơn vị thời gian, chỉ một khoảng thời gian xác định hoặc không xác định; thường đứng sau số từ (giờ, phút, canh, khắc, ...); luôn luôn đứng sau số từ.; thường dùng làm chính tố trong ngữ danh từ.

- Danh từ đơn vị tổ chức (làng, xã, phường, huyện, bang, lớp, ...); luôn luôn đứng sau số từ; thường dùng làm chính tố trong ngữ danh từ; thường đứng trước danh từ riêng chỉ địa danh.

Danh sách:

cm, kg, tấn, tạ, ca, thùng, đấu, bơ, bò, nắm, ngụm, nhúm, … giờ, phút, giây, canh, khắc, ngày, tháng, năm, quý, lúc, ... làng, bản, thôn, xóm, xã, phường, huyện, quận, tỉnh, nhóm, tổ, đội, lớp, bang, ...

2.2. Động từ (Verbs – V)

2.2.1. Nội động từ : intransitive verb

Đặc điểm:

- Chỉ những động từ hoạt động không bắc cầu sang những sự vật ở ngoài nó.

- Khi những động từ này làm chính tố (vị ngữ chính) trong câu thì không đòi hỏi phải có bổ ngữ đối tượng trực tiếp nhưng nghĩa của câu vẫn được hiểu đầy đủ.

Danh sách:

ngủ, ngồi, khóc, cười, thở, tắm, chạy, bay, hót, hát, sủa, kêu, làm lụng, nghỉ ngơi, suy nghĩ, ...

2.2.2. Ngoại động từ : transitive verb

Đặc điểm:

- Chỉ những động từ hoạt động có bắc cầu sang những sự vật ở ngoài nó.

- Khi những động từ này làm chính tố (vị ngữ chính) trong câu đòi hỏi phải có bổ ngữ đối tượng trực tiếp, bổ ngữ đối tượng gián tiếp, hoặc bổ ngữ tự do thì nghĩa của câu mới được hiểu đầy đủ.

Danh sách:

đọc (đọc sách, đọc thư), viết, đá, đặt, chặt, đẽo, bẻ, hái, nghe, nhớ, tin, nghi ngờ, biết, mua, bán, cho, tặng, xây dựng, cải tiến, ...

2.2.3. Động từ trạng thái : state verb

Đặc điểm:

- Chỉ những động từ biểu thị tình trạng, cách thức tồn tại của sự vật.

- Khi những động từ này hoạt động làm chính tố (vị ngữ chính) thì sau nó phải có phụ tố chỉ nội dung (còn tiền, mất của, ở bẩn, được ăn, mèo già hoá cáo, nên người, thành vợ chồng ... ).

Danh sách:

có, còn, hết, được, mất, hoá, thành, nên, trở thành, trở nên, thua ...

2.2.4. Trợ động từ : auxiliary verb

Đặc điểm:

- Chỉ những động từ chuyên dùng phụ thêm cho một động từ khác để làm thành vị ngữ trong câu.

- Những động từ này có thể đứng trước hoặc sau động từ chính.

- Một số biểu thị điều kiện và thái độ của chủ thể đối với hành động.

- Một số biểu thị hướng của hành động.

Danh sách:

bị, được, chịu, phải, muốn, toan, quyết, quyết phải, định, dám, nên, cần, đâm, sinh, xuống (lặn xuống, xẹp xuống), lên (lớn lên ~ lửa bùng lên ~ thét lên ~ tức phát điên lên ~ đỏ bừng mặt lên), ra (ra kết quả ~ nhận ra lỗi ~ đã hiểu ra), ...

2.3. Tính từ (Adjective – A)

2.3.1. Tính từ chỉ tính chất

Đặc điểm:

- Những từ mang ý nghĩa về các loại phẩm chất, như: tốt, đẹp, xấu, hay, dở, sạch, bẩn, đục, trong, đúng, sai, quan trọng, tầm thường, ...

- Những từ mang ý nghĩa về lượng thuộc nhiều mặt như mật độ, độ dài, trọng lượng, hình dạng, màu sắc, mùi vị, âm thanh: nhiều, ít, đông, thưa, dài, ngắn, to, nhỏ, cao, thấp, nông, sâu, cong, thẳng, vênh, xanh, đỏ, thơm, thối, vang, dội, ồn, lặng, ....

- Thường đi sau phụ từ chỉ thời gian (đã, đang, sẽ ...), chỉ thang độ (rất, hơi, khí, quá...), chỉ tần xuất (thường, hay, năng...), chỉ tính khẳng định và phủ định (có, không, chưa, chẳng...).

- Thường đi trước phụ từ rồi (xong rồi, đẹp rồi, đỏ rồi, hỏng rồi...), phụ từ chỉ hướng phát triển ra, lên, đi, lại (đẹp ra, nhanh lên, xấu đi, nhỏ đi, nhỏ lại, chậm lại, trắng lại).

Danh sách:

tốt, đẹp, xấu, hay, dở, sạch, bẩn, đục, trong, đúng, sai, trái, phải, quan trọng, tầm thường, nhiều, ít, đông, thưa, dài, ngắn, to, nhỏ, cao, thấp, nông, sâu, cong, thẳng, vênh, xanh, đỏ, thơm, thối, vang, dội, ồn, lặng, gập ghềnh, chông chênh, lênh khênh, sừng sỏ, hùng hổ, ...

2.3.2. Tính từ quan hệ

Đặc điểm:

- Tính từ quan hệ nảy sinh do có sự ảnh hưởng, phụ thuộc hoặc tác động qua lại lẫn nhau giữa các sự vật, hiện tượng. Ví dụ: chung - riêng, nội – ngoại, công – tư, trái – phải (bên trái – bên phải), ...

- Tính từ quan hệ có thể được chuyển loại từ các danh từ. Chỉ danh từ nào có thể thêm rất vào trước nó thì mới coi là tính từ quan hệ. Ví dụ: tác phong (rất) công nhân, cung cách (rất) quý phái, thái độ (rất) cửa quyền, cái nhìn (rất) Việt nam, giọng lưỡi (rất) Chí Phèo.

Danh sách:

chung, riêng, công, tư, nội, ngoại, công hữu, tư hữu, riêng tư ...

2.3.3. Tính từ tượng thanh : Onomatopoetic Adjective

Đặc điểm:

- Những từ có nguồn gốc ở những hành động tạo ra âm thanh, có tác dụng mô phỏng các âm thanh vốn có trong tự nhiên để biểu thị sự vật về mặt âm thanh.

- Có rất ít khả năng kết hợp với các phụ từ chỉ mức độ rất, hơi, khí.

Danh sách:

leng keng, kẽo kẹt, loảng xoảng, cót két, cọt kẹt, choang, choang choang, oàng, ùng oàng, ì ầm, ầm ì, róc rách, ...

2.3.4. Tính từ tượng hình : Pictographic Adjective

Đặc điểm:

- Những từ có quy chiếu là những hình ảnh vật lí cụ thể của sự vật được tri giác, có tác dụng gợi tả hình ảnh, dáng điệu của sự vật.

- Rất dễ dàng kết hợp với các phụ từ chỉ mức độ rất, hơi, khí.

Danh sách:

lom khom, còm nhom, khẳng khiu, lênh khênh, lung linh, khum khum, trùng trục, lũn cũn, bè bè, ...

2.4. Đại từ (Pronoun – P)

2.4.1. Đại từ xưng hô

Đặc điểm:

Danh sách: tôi, tao, tui, mình, ta, chúng tôi, chúng

2.4.2. Đại từ chỉ định

Đặc điểm:

Danh sách: đây, đấy, đó, kia, ấy, nọ, này, nay, bây giờ, thế, vậy

2.4.3. Đại từ nghi vấn

Đặc điểm:

Danh sách: ai, gì, chi, đâu, bao giờ, bao nhiêu, mấy, sao, thế nào

2.5. Số từ (Numeral – M)

2.5.1. Số đếm

Đặc điểm:

Danh sách: một, hai, ba, bốn,

2.5.1. Số thứ tự

Đặc điểm:

Danh sách: nhất, nhì, ba, tư,

2.6. Lượng từ (Quantity – Q) Đặc điểm:

Danh sách: những, các, mấy, mỗi, mọi, từng, ...

2.7. Phụ từ (Adverb – R) Đặc điểm:

Danh sách:

đã, đang, sẽ, vừa, mới, sắp, từng, liền, bèn, rồi, ngay ..., rất, khá, khí, hơi, quá, lắm, thật, hết sức, cực kì, bỗng, thình lình ..., cũng, vẫn, đề, còn, cứ, mãi, luôn, luôn luôn, liên tục, liên tiếp, không ngừng, năng ..., không, chẳng, chưa, chửa ..., có, nhất quyết, nhất định, ắt là …, hãy, đừng, chớ, nên, phải, còn ..., được (làm được), ra (nghĩ ra), ...

2.8. Giới từ (Preposition – O) Đặc điểm:

Danh sách: của, để, ở, về, tại, trên, dưới, trong, ngoài, vào...

2.9. Liên từ (Conjunction – C) Đặc điểm:

Danh sách: và, với, cũng, hay, hoặc, nhưng, vì, song, thì, càng, cho nên, không những, mà còn, bằng, ...

2.10. Trợ từ (Introductory word – I) Đặc điểm:

Danh sách: à, ư, nhỉ, nhé, chỉ, thì, mà, đích thị, ngay cả, đến cả, ...

2.11. Cảm từ (Emotivity word – E) Đặc điểm:

Danh sách: ái chà, chao ôi, ôi, ôi chao, ái, ối, trời ơi, bớ, ê, ...

C. THÔNG TIN NGỮ NGHĨA - SEMANTIC

I. LOGICAL CONSTRAINT: 1. Tiêu chí xác định

2. Thực hành gán nhãn thông tin ngữ nghĩa

2.1. Con người : People

2.1.1. Người : Person

Đặc điểm:

- Chỉ từng người riêng lẻ, phân biệt với tập thể.

Danh sách:

ông, bà, nam, nữ, nô tì, phi công, thuyền trưởng, y tá, phát thanh viên, biên tập viên, trưởng phòng, sư trưởng, ông, bà, cha, mẹ, học sinh, bác sĩ, công nhân, bộ đội, ...

Chú ý:

- Các đơn vị từ vựng có ý nghĩa chỉ người nói chung (ý nghĩa khái quát, tổng quát) thì xếp vào nhóm Khái niệm. Ví dụ: con cái, cháu chắt, cha anh, chú bác, cộng đồng.

- Dấu hiệu nhận diện: thường không đi với số từ (một, hai), lượng từ (những, các).

2.1.2. Tổ chức : Organization

Đặc điểm:

- Chỉ tập hợp người hoạt động vì những quyền lợi chung, nhằm một mục đích chung, phân biệt với cá nhân.

Danh sách:

ban chấp hành, chi uỷ, chi đoàn, câu lạc bộ, lớp, tổ, ca, ...

2.1.3. Nhân vật siêu nhiên : Supernatural Being

Đặc điểm:

- Chỉ lực lượng có tính chất, khả năng vượt ra khỏi phạm vi tự nhiên, không thể giải thích bằng các quy luật tự nhiên.

Danh sách:

Phật, A Di Đà, Ngọc Hoàng, chú Cuội, Hằng Nga, Diêm Vương Tinh, thần, tiên, …

2.2. Động vật : Animal

2.2.1. Thú : Animal

Đặc điểm:

- Chỉ động vật có xương sống bậc cao, có lông mao và tuyến vú, nuôi con bằng sữa.

Danh sách:

chó, mèo, sư tử, cá voi

2.2.2. Chim : Bird

Đặc điểm:

- Chỉ động vật có xương sống, đẻ trứng, đầu có mỏ, thân phủ lông vũ, có cánh để bay.

Danh sách:

gà, bồ câu, hải âu, đà điểu

2.2.3. Cá : Fish

Đặc điểm:

- Chỉ động vật có xương sống, sống ở nước, thở bằng mang, bơi bằng vây.

Danh sách:

trắm, mè, thu, nhụ, đé,

2.2.4. Lưỡng cư : Amphibian

Đặc điểm:

- Động vật có xương sống, sinh ra ở nước nhưng sống ở trên cạn.

Danh sách:

ếch, ếch bò, nhái, nhái bén, nhái xanh, cóc, cóc tía, chẫu chàng, chẫu chuộc, ễnh ương, cá cóc, sa giông, kì giông, ...

2.2.5. Bò sát : Reptile

Đặc điểm:

- Chỉ động vật có xương sống, thở bằng phổi, chuyển dịch bằng cách bò sát đất.

Danh sách:

rắn, rết, thằn lằn, thạch sùng

2.2.6. Sâu : Worm

Đặc điểm:

- Chỉ dạng ấu trùng của côn trùng (thường ăn hại cây cối), hoặc là loài giun sán nói chung.

Danh sách:

sâu róm, sâu que, rầy nâu, sâu đục thân, ...

2.1.2.7. Côn trùng : Insect

Đặc điểm:

- Chỉ động vật chân đốt, cơ thể chia thành ba phần, có một đôi râu, ba đôi chân, phần lớn có cánh.

Danh sách:

kiến, ong, ve, bọ xít, bọ rùa, bọ vừng, bọ hung, ruồi, muỗi, ...

2.1.2.8. Động vật thân mềm : Shellfish

Đặc điểm:

- Động vật không xương sống, cơ thể là khối thịt mềm, ẩn trong một lớp vỏ hoặc không có vỏ, phần lớn sống ở biển và ở nước ngọt, một số sống trên cạn.

Danh sách:

trai, điệp, nghêu, sò, ngao, ốc, hến, trùng trục, vẹm, ốc sên, ôcs bưu vàng, hàu, hà, bào ngư, tu hài, hải sâm, mực, ...

2.1.2.9. Động vật giáp xác :

Đặc điểm:

- Động vật không xương sống, có vỏ cứng ở ngoài cơ thể, thở bằng mang, đầu có mắt kép, hai đôi râu .

Danh sách:

tôm, tôm sú, tôm he, tôm hùm, tép, cua, ghẹ, ghẹ xanh, rạm, cua đồng, cáy, còng, dã tràng, sam, ...

2.1.2.10. động vật hư cấu : Fictional Animal

Đặc điểm:

- Chỉ động vật tưởng tượng, không có trong thực tế.

Danh sách:

rồng, thuồng luồng, ma cà rồng, ma gà, quỷ Dạ Xoa, ...

2.3. Vi sinh vật : Microorganism

Danh sách: virus, vi khuẩn, vi trùng, amib, trùng roi, trùng sốt rét, ...

2.4. Thực vật : Plant

2.4.1. cây thân gỗ : Tree

Danh sách: lim, gụ, sến, đa, phi lao, tre, luồng, ...

2.4.2. cây bụi : Bush

Danh sách: cúc tần, duối, sim, mua, găng, ...

2.4.3. cây thân leo : Vine

Danh sách: mướp, gấc, bầu, bí , mùng tơi, tơ hồng, tầm xuân, hoa giấy...

2.4.4. cây thân cỏ : Herb

Danh sách: lúa, khoai lang, khoai môn, ráy, dọc mùng, rau dền, rau sam, rau muống, cỏ tranh, lau, cói, nhô, kê, lạc, vừng, mía, loa kèn, cẩm chướng, sen, súng, đồng tiền, cúc, hướng dương, ...

v.v.

2.5. Thức ăn : Food

2.6. Vật dụng : Artifact

2.7. Vật hư cấu : Fictional Object

2.8. Bộ phận : Part

2.9. Chất liệu : Substance

2.10. Tự nhiên : Natural Object

2.11. Vị trí : Location

2.12. Lĩnh vực tri thức : Field Of Knowledge

2.13. Trạng thái : State

2.14. Hoạt động : Active

2.15. Quan hệ : Relation

2.16. Tình thái : Model

2.17. Thuộc tính: Attribute

2.18. Giá trị : Value

2.19. Đơn vị : Unit

II. SEMANTIC CONSTAINT: 1. Tiêu chí xác định - Động từ làm vị ngữ thường quyết định bộ khung vai nghĩa trong cấu cấu trúc câu. Căn cứ vào đặc điểm này để xác định các thành phần chịu sự ràng buộc của động từ.

- Không dựa vào dấu hiệu hình thức mà dựa vào loại nội dung ý nghĩa do bổ ngữ (complement) biểu thị để phân biệt hai loại bổ ngữ trực tiếp (direct object) và bổ ngữ gián tiếp (indirect object). Chẳng hạn:

a) Nó tặng mẹ một bó hoa.

b) Nó tặng một bó hoa cho mẹ.

thì một bó hoa là bổ ngữ trực tiếp, còn mẹ là bổ ngữ gián tiếp

- Chỉ xác định bổ ngữ trực tiếp và bổ ngữ gián tiếp cho những động từ ngoại động điển hình làm vị ngữ, trong trường hợp các thành phần đi với động từ này chỉ đối tượng chịu tác dụng trực tiếp của hành động và đối tượng “vì nó” mà diễn ra hành động.

- Trường hợp các động từ ngoại động kém điển hình làm vị ngữ thì thành phần bổ nghĩa đi sau nó được xác định là bổ ngữ nói chung hoặc bổ ngữ tự do (object). Chẳng hạn:

d) Tôi thấy mệt mỏi.

e) Tôi thấy anh đã mệt mỏi.

v.v.

2. Thực hành gán nhãn thông tin Semantic constraint

2.1. Subject : chủ thể

Đặc điểm:

- Chủ thể là đối tượng gây ra hành động.

- Động từ chỉ hành động phải là động từ làm vị ngữ trong câu.

Ví dụ:

– Chim bay. – Chó sủa.

Sub: N (Animal)

– Thầy giáo giảng bài. – Học sinh nghe nhạc.

Sub: N (Person)

Dob: N

2.2. Direct object (Dob) : bổ ngữ trực tiếp

Đặc điểm:

- Bổ ngữ trực tiếp là thành phần chỉ đối tượng chịu tác dụng trực tiếp của hành động được nêu ra ở động từ làm vị ngữ.

- Chỉ xác định trong trường hợp động từ ngoại động làm vị ngữ.

Ví dụ:

2.2.1. Bổ ngữ chỉ vật được tạo tác:

– Họ đang xây nhà. – Nó xây bức tường.

Sub: N (Person)

Dob: N (Building)

– Nàng Bân may áo cho chồng. – Tôi vừa may xong chiếc túi ba gang.

Sub: N (Person)

Dob: N (Artifact)

2.2.2. Bổ ngữ chỉ vật bị làm tiêu biến:

– Bộ đội phá cầu. – Công nhân đang phá đá.

Sub: N (Person)

Dob: N (Non-LivingThing)

2.2.3. Bổ ngữ chỉ vật bị thay đổi tính chất hoặc đặc điểm vật lí:

– Cô ta nhuộm đầu. – Họ đang nhuộm vải.

Sub: N (Person)

Dob: N

– Công an bắt cướp. – Trọng tài bắt lỗi việt vị.

Sub: N (Person)

Dob: N

– Ai dám trả lời! – Nó dám lấy vợ.

Sub: N (Person)

Obj: V, VP

2.3. Indirect object (iob) : bổ ngữ gián tiếp

Đặc điểm:

- Bổ ngữ chỉ đối tượng không chịu tác dụng trực tiếp của hành động, nhưng “vì nó” mà diễn ra hành động được nêu ở động từ.

- Bổ ngữ gián tiếp được xác định khi và chỉ khi có xuất hiện của bổ ngữ trực tiếp.

- Khi bổ ngữ gián tiếp đứng sau bổ ngữ trực tiếp thì phải có giới từ, như cho, vì, để…

- Bổ ngữ gián tiếp đứng trước bổ ngữ trực tiếp (ngay sau động từ) thì không dùng giới đi.

Ví dụ:

2.3.1. Các động từ trao nhận làm vị ngữ yêu cầu 2 bổ ngữ bắt buộc, chỉ vật được trao nhận và người tiếp nhận, bổ ngữ có thể là một danh từ hay danh ngữ:

– Tôi tặng bó hoa/con ngựa đua cho mẹ. – Tôi tặng hoa cho ban chấp hành chi đoàn.

Sub: N (Person) < ! người cụ thể>

Dob: N < ! mọi thứ có ý nghĩa>

Iob: N (People) < ! con người nói chung>

– Tôi tặng mẹ bó hoa/con ngựa đua. – Tôi tặng ban chấp hành chi đoàn lẵng hoa.

Sub: N (Person) < ! người cụ thể>

Iob: N (People) < ! con người nói chung>

Dob: N < ! mọi thứ có ý nghĩa>

2.3.2. Các động từ mệnh lệnh – sai khiến làm vị ngữ yêu cầu 2 bổ ngữ bắt buộc, chỉ người bị sai khiến và hành động sai khiến, bổ ngữ có thể là một động từ hay động ngữ:

- Bà bắt cháu ăn.

Sub: N (Person) < ! bà>

Dob: N (Person) < ! cháu >

Iob: V < ! ăn>

– Ông bắt trâu cày thông tầm.

Sub: N (Person)

Dob: N (Animal) < ! cháu >

Iob: VP < ! cày thông tầm>

Mẫu chung cho bắt (ở nghĩa này…):

Sub: N (Person) < ! người>

Dob: N (LivingThing) < ! vật sống, động vật>

Iob: V, VP < ! hành động cụ thể>

2.4. Object (Obj) : bổ ngữ tự do

Đặc điểm:

- Ngoài hai bổ ngữ trực tiếp và bổ ngữ gián tiếp thể hiện ở những động từ ngoại động điển hình, thì ở các động từ ngoại động kém điển hình còn có một loại bổ ngữ là từ hoặc cụm từ có chức năng làm cho nghĩa của động từ (làm vị ngữ) được đầy đủ hơn.

- Loại bổ ngữ này thường đi với những động từ biểu thị tình trạng, cách thức tồn tại của sự vật.

Ví dụ:

– Tôi thấy đói. – Tôi thấy mệt trong người.

Sub: N (Person)

Obj: V, VP

– Tôi còn mẹ già. – Chị ấy đã có con. – Ngân hàng hết tiền. – Loài thú có lông.

Sub: N (LivingThing)

Obj: N

– Da bắt nắng. – Vải bắt bụi.

Sub: N

Obj: N

2.5. Location (Loc) : vị trí, địa điểm

Đặc điểm:

- Với những động từ chỉ những hoạt động có bao hàm phương hướng thì bao giờ cũng đòi hỏi một thành phần bổ ngữ đi sau để xác định rõ vị trí, hướng, đích mà hành động nhắm đến.

- Với những động từ chỉ hoạt động không có bao hàm phương hướng, khi cần xác định vị trí, đích mà hành động hướng đến hoặc tác động đến thì thường phải có những động từ có hoạt động bao hàm hướng đi kèm, như: lao (vào), đi (ra), bay (lên), lặn (xuống), vươn (tới), quành (sang), tạt (qua), …

Ví dụ:

– Khách vào nhà nghỉ. – Đoàn xe vào Nam lúc 3 giờ sáng.

Sub: N (Person)

Loc: N

– Nó đập tay xuống bàn. – Con trâu đập đầu vào tường.

Sub: N (LivingThing)

Dob: N

Loc: N

– Tôi lao xe qua cầu. – Con thú lao đầu vào vách đá.

Sub: N (LivingThing)

Dob: N

Loc: N

Tài liệu tham khảo

[1] Hoàng Phê, Nguyễn Ngọc Trâm (1997), Một số vấn đề về từ điển học, Nhà xuất bản Khoa học Xã hội.

[2] Hoàng Phê (2003), Logic-Ngôn ngữ học, Nhà xuất bản Đà Nẵng – Trung tâm Từ điển học.

[3] Uỷ ban Khoa học Xã hội Việt Nam (1983), Ngữ pháp tiếng Việt, Nhà xuất bản Khoa học Xã hội.

[4] Nguyễn Văn Hiệp (2006), Ngữ nghĩa học dẫn luận (dịch từ JOHN LYONS, Linguistic Semantics, Cambridge University Press, 1995), Nhà xuất bản Giáo dục.

[5] Nguyễn Minh Thuyết, Nguyễn Văn Hiệp (2004), Thành phần câu tiếng Việt, Nhà xuất bản Giáo dục.

[6] Diệp Quang Ban (2005), Ngữ pháp tiếng Việt, Nhà xuất bản Giáo dục.

[7] Nguyễn Kim Thản (1997), Nghiên cứu ngữ pháp tiếng Việt, Nhà xuất bản Giáo dục.

[8] Đinh Văn Đức (1986), Ngữ pháp tiếng Việt, Nhà xuất bản Đại học và Trung học chuyên nghiệp.

[9] Cao Xuân Hạo (1998), Tiếng Việt: mấy vấn đề ngữ âm - ngữ pháp - ngữ nghĩa, Nhà xuất bản Giáo Dục.

[10] Vũ Xuân Lương (2002), Thiết lập giao diện biên soạn từ điển ngôn ngữ trên máy tính, Tạp chí Ngôn ngữ, Số 7.