viỆn khoa hỌc kỸ thuẬt bƯu ĐiỆn · web view4.1 sở cứ xây dựng tiêu chuẩn. 33....
TRANSCRIPT
BỘ THÔNG TIN VÀ TRUYỀN THÔNGĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN
THUYẾT MINH TIÊU CHUẨN
TIÊU CHUẨN KỸ THUẬT TẠO LẬP CHỈ MỤC(DÙNG CHO METADATA VÀ TÀI LIỆU TOÀN VĂN)
HÀ NỘI - THÁNG 1/2017
Mục lục
1 Giới thiệu.............................................................................................................................4
1.1 Tên gọi của tiêu chuẩn Việt Nam....................................................................................4
1.2 Mục đích của việc xây dựng tiêu chuẩn........................................................................4
1.3 Các nội dung nghiên cứu...............................................................................................4
2 Tinh hinh trong va ngoai nước vê tiêu chuẩn lập chỉ mục va tai liệu toan văn...........5
3 Cơ sơ xây dựng các yêu cầu kỹ thuật............................................................................10
3.1 Phân tích tinh hinh đối tượng tiêu chuẩn..................................................................10
3.2 TCVN 4743:1989............................................................................................................11
3.3 TCVN 7539:2005............................................................................................................11
3.4 Tai liệu toan văn theo tiêu chuẩn ISO..........................................................................14
3.5 Tiêu chuẩn ISO 15836:2003..........................................................................................17
3.6 Tiêu chuẩn ISO 999:1996...............................................................................................21
3.7 TCVN 10669:2014 (ISO 5963:1985)..............................................................................29
3.8 NISO TR02-1997, Guidelines for Indexes and Related Information Retrieval Devices..................................................................................................................................31
4 Xây dựng tiêu chuẩn.........................................................................................................33
4.1 Sở cứ xây dựng tiêu chuẩn...........................................................................................33
4.2 Hinh thức xây dựng tiêu chuẩn.....................................................................................35
4.3 Cấu trúc tiêu chuẩn........................................................................................................35
4.4 Nội dung tiêu chuẩn.......................................................................................................36
Tai liêu tham khao...................................................................................................................40
THUYẾT MINH TIÊU CHUẨNTIÊU CHUẨN KỸ THUẬT TẠO LẬP CHỈ MỤC
(DÙNG CHO METADATA VÀ TÀI LIỆU TOÀN VĂN)
1 Giới thiệu
1.1 Tên gọi của tiêu chuẩn Việt Nam
Tiêu chuẩn kỹ thuật tạo lập chỉ mục (dùng cho metadata va tai liêu toan văn)
1.2 Mục đích của việc xây dựng tiêu chuẩn
Tiêu chuẩn nay cung cấp hướng dẫn về nội dung, tổ chức va trình bay chỉ mục sử
dụng cho viêc tìm kiếm tai liêu va các phần của tai liêu. Tiêu chuẩn đề xuất các quy tắc
lập chỉ mục, các phương pháp được sử dụng (phân tích bằng trí tuê, thuật toán máy
tính hoặc ca hai), phương tiên lập chỉ mục va các phương pháp trình bay chỉ mục cho
tìm kiếm. Nó nhấn mạnh ba quy trình cần thiết cho tất ca các chỉ mục: thiết kế toan
diên, quan lý vốn từ vựng va cung cấp các cú pháp. Nó bao gồm các định nghĩa về chỉ
mục va các thanh phần, thuộc tính va các khía cạnh; từ vựng thống nhất; mô ta ban
chất va sự đa dạng của các chỉ mục; các khuyến nghị liên quan đến viêc thiết kế, tổ
chức va trình bay các chỉ mục.
Tiêu chuẩn nay liên quan đến viêc chuẩn bị tất ca các loại chỉ mục cho tìm kiếm thông
tin, bất kể chúng được tạo lập trên cơ sở phân tích bằng trí tuê, bằng các phương pháp
tự động hoặc được máy tính hỗ trợ, cho dù chúng được tìm kiếm bằng mắt thường
hoặc bằng thuật toán điên tử va được biên soạn bởi một người lập chỉ mục hoặc một
nhóm người lập chỉ mục.
1.3 Các nội dung nghiên cứu
Bộ Thông tin va Truyền thông đã giao Viên Công nghê thông tin - Đại học Quốc gia Ha
Nội xây dựng "Tiêu chuẩn kỹ thuật tạo lập chỉ mục (dùng cho metadata va tai liêu toan
văn) – Phần 2: Lập chỉ mục cho tai liêu toan văn ", đây la bộ dự thao trong khuôn khổ
dự án "Xây dựng 04 chuẩn từ vựng về dữ liêu nội dung số va trao đổi thông tin; 58
chuẩn tạo lập, lưu trữ, trao đổi va quan lý dữ liêu va nội dung số". Nhóm thực hiên
nghiên cứu đã có những kết qua nghiên cứu tập hợp tóm tắt ở phần dưới đây.
2 Tinh hinh trong va ngoai nước vê tiêu chuẩn lập chỉ mục va tai liệu toan văn.
Thuật ngữ tạo lập chỉ mục trong ngôn ngữ của nganh Thông tin Tư liêu được gọi la
định chỉ mục. Định chỉ mục la một quy trình xử lý nội dung tai liêu được áp dụng rộng
rãi trong các thư viên va cơ quan thông tin nhằm tạo ra các bang chỉ mục cho phép
người dùng có thể truy cập thông tin va có thể tìm kiếm va thu thập thông tin có
nghĩa theo chủ đề va từ khóa.
Trong cuốn NIST's Dictionary of Algorithms and Data Structures (Từ điển thuật toán
va cấu trúc dữ liêu của Viên Tiêu chuẩn va Kỹ thuật Quốc gia Mỹ) có định nghĩa về
các loại chỉ mục trong đó có định nghĩa về chỉ mục ngược (inverted indexing) la cấu
trúc dữ liêu chỉ mục lưu giữ các ánh xạ từ nội dung (từ hoặc số) đến vị trí của nó
trong một têp tin cơ sở dữ liêu hoặc trong một tai liêu hoặc trong một tập tai liêu. Có
2 loại chỉ mục ngược: chỉ mục ngược mức tai liêu va chỉ mục ngược mức từ.
Trong hoạt động tiêu chuẩn hóa san xuất, các lĩnh vực của đời sống xã hội, viêc
chuẩn hóa các quy trình luôn la một vấn đề luôn được quan tâm, các quy trình hoạt
động thư viên, trao đổi thông tin la một phần trong các quy trình đó.
Hiên nay, Tổ chức Tiêu chuẩn hóa Quốc tế đã ban hanh các Tiêu chuẩn quốc tế ISO
liên quan đến lập chỉ mục va tai liêu toan văn sau:
- ISO 5963:1985 Documentation - Method for examining documents, determining
their subject and selecting indexing terms
- ISO 999:1996 Information and documentation - Guidelines for the content,
organization and presentation of indexes
- ISO 23950:1998 Information and documentation -- Information retrieval (Z39.50) --
Application service definition and protocol specification.
- ISO/IEC 26300:2006 Information technology -- Open Document Format for Office
Applications (OpenDocument) v1.0
- ISO/IEC 29500-1:2012 Information technology -- Document description and
processing languages -- Office Open XML File Formats -- Part 1: Fundamentals and
Markup Language Reference
- ISO/IEC 29500-2:2012 Information technology -- Document description and
processing languages -- Office Open XML File Formats -- Part 2: Open Packaging
Conventions
- ISO/IEC 29500-3:2012 Information technology -- Document description and
processing languages -- Office Open XML File Formats -- Part 3: Markup
Compatibility and Extensibility
- ISO/IEC 29500-4:2012 Information technology -- Document description and
processing languages -- Office Open XML File Formats -- Part 4: Transitional
Migration Features
- ISO/IEC TS 30135-1:2014 Information technology -- Digital publishing -- EPUB3 --
Part 1: EPUB3 Overview
- ISO/IEC TS 30135-2:2014 Information technology -- Digital publishing -- EPUB3 --
Part 2: Publications
- ISO/IEC TS 30135-3:2014 Information technology -- Digital publishing -- EPUB3 --
Part 3: Content Documents
- ISO/IEC TS 30135-4:2014 Information technology -- Digital publishing -- EPUB3 --
Part 4: Open Container Format
- ISO/IEC TS 30135-5:2014 Information technology -- Digital publishing -- EPUB3 --
Part 5: Media Overlay
- ISO/IEC TS 30135-6:2014 Information technology -- Digital publishing -- EPUB3 --
Part 6: EPUB Canonical Fragment Identifier
- ISO/IEC TS 30135-7:2014 Information technology -- Digital publishing -- EPUB3 --
Part 7: EPUB3 Fixed-Layout Documents
- ISO 14739-1:2014 Document management -- 3D use of Product Representation
Compact (PRC) format -- Part 1: PRC 10001
- ISO 14289-1:2012 Document management applications -- Electronic document file
format enhancement for accessibility -- Part 1: Use of ISO 32000-1 (PDF/UA-1)
- ISO 19005-1:2005 Document management -- Electronic document file format for
long-term preservation -- Part 1: Use of PDF 1.4 (PDF/A-1)
- ISO 19005-2:2011 Document management -- Electronic document file format for
long-term preservation -- Part 2: Use of ISO 32000-1 (PDF/A-2)
- ISO 19005-3:2012 Document management -- Electronic document file format for
long-term preservation -- Part 3: Use of ISO 32000-1 with support for embedded files
(PDF/A-3)
- ISO 24517-1:2008 Document management -- Engineering document format using
PDF -- Part 1: Use of PDF 1.6 (PDF/E-1)
- ISO 32000-1:2008 Document management -- Portable document format -- Part 1:
PDF 1.7
Tiêu chuẩn do các nước ban hanh:
- Tính đến năm 2001, có 8 nước đã chấp nhận ISO 5963: 1985 lam tiêu chuẩn quốc
gia. Một số nước chấp nhận ISO 5963: 1985 lam tiêu chuẩn quốc gia không có bổ
sung hiêu chỉnh: Anh, Tây Ban Nha, Thụy Điển, Đức, Bungari, Cộng hòa Séc, Nam
Phi... Một số nước chấp nhận ISO 5963: 1985 lam tiêu chuẩn quốc gia có bổ sung,
hiêu chỉnh: Ý, Nga…
- Tổ chức tiêu chuẩn hóa Công hòa Liên bang Nga đã xây dựng va ban hanh hai tiêu
chuẩn quốc gia liên quan đến định chỉ mục tai liêu, bao gồm: GOST 7.59-2003 "Định
chỉ mục tai liêu. Yêu cầu chung cho tổ chức va lập chỉ mục” va GOST 7.66-92 "Định
chỉ mục tai liêu. Yêu cầu chung để phối hợp định chỉ mục.
- Mỹ: Guidelines for Indexes and Related Information Retrieval Devices (Hướng dẫn
lập chỉ mục va các công cụ tìm kiếm thông tin có liên quan) ban hanh năm 1997.
Các tiêu chuẩn Việt nam vê thông tin va tư liệuỞ nước ta, ngay 14 tháng 7 năm 2004, Tổng cục trưởng Tổng cục Tiêu chuẩn-Đo
lường-Chất lượng ra Quyết định số 414/TĐC-QĐ về viêc thanh lập Ban Kỹ thuật tiêu
chuẩn TCVN/TC 46: Thông tin Tư liêu.
Ban Kỹ thuật tiêu chuẩn TCVN/TC 46 ra đời góp phần đẩy mạnh hoạt động tiêu
chuẩn hóa trong lĩnh vực thông tin-thư viên, lưu trữ va xuất ban theo mô hình va
phương hướng của Tổ chức Tiêu chuẩn hoá quốc tế (ISO). Trong mang thông tin-
thư viên, TCVN/TC 46 phần lớn tập trung vao viêc nghiên cứu va biên soạn tiêu
chuẩn thuộc ba lĩnh vực chủ đề : 1) các tiêu chuẩn dùng cho mô ta thư mục va dữ
liêu thư mục; 2) các tiêu chuẩn dùng cho mô ta chủ đề va dữ liêu chủ đề va 3)
Các tiêu chuẩn trình bay tư liêu.
Thời gian qua, TCVN/TC 46 đã xem xét, sửa đổi va cập nhật các tiêu chuẩn trước
đây do Trung tâm Tiêu chuẩn Chất lượng phối hợp với Viên Thông tin KHKT Trung
ương (nay la Trung tâm Thông tin KH&CN Quốc gia) hoặc Cục xuất ban biên soạn
dựa trên các tiêu chuẩn của Liên Xô cũ hoặc Khối SEV va trình Bộ KH&CN phê
duyêt va ban hanh. Đó la: TCVN 2243 – 77: Chuyển chữ cái Nga sang chữ cái Viêt,
TCVN 4523-88: Ấn phẩm thông tin, phân loại, cấu trúc va trình bay; TCVN 4524-88:
Xử lý thông tin, bai tóm tắt va bai chú giai; TCVN 4743-89: Mô ta thư mục tai liêu,
yêu cầu chung va quy tắc biên soạn; TCVN 5453-1991: Hoạt động thông tin khoa
học va tư liêu. Thuật ngữ va khái niêm cơ ban; TCVN 5697-1992: Hoạt động thông
tin tư liêu. Từ va cụm từ tiếng Viêt viết tắt dùng trong mô ta thư mục; TCVN 5698-
1992 Hoạt động thông tin tư liêu. Từ va cụm từ tiếng nước ngoai viết tắt dùng trong
mô ta thư mục; va một số tiêu chuẩn dựa trên ISO như TCVN 6380: 1998 về Thông
tin va tư liêu – Mã số tiêu chuẩn quốc tế cho sách (ISBN) VN 6381: 1998 về Thông
tin va tư liêu – Mã số tiêu chuẩn quốc tế cho xuất ban phẩm nhiều kỳ (ISSN). TCVN
6909:2001 (Phông chữ Unicode) dùng chung cho nhiều nganh,…
Từ khi thanh lập, TCVN/TC 46 chủ trương biên soạn các TCVN (một vai tiêu chuẩn
trong số đó dựa trên ISO):
- TCVN 7420-1:2004 va TCVN 7420-2 :2004 (tương đương với ISO 15489 –1 va ISO
15489 –2): Thông tin va Tư liêu – Quan lý hồ sơ. Phần 1 : Yêu cầu chung va Thông
tin va Tư liêu – Quan lý hồ sơ. Phần 2 : Hướng dẫn;
- TCVN 7539: 2005 Thông tin va Tư liêu– Khổ mẫu MARC 21 cho dữ liêu thư mục;
- TCVN 7587: 2007 Thông tin va Tư liêu — Tên va mã địa danh Viêt Nam dùng trong
lưu trữ va trao đổi thông tin KHCN;
- TCVN 7588: 2007 Thông tin va Tư liêu – Tên va mã tổ chức dịch vụ thông tin
KH&CN Viêt Nam dùng trong lưu trữ va trao đổi thông tin KH&CN;
- TCVN 5453: 2009 Thông tin va Tư liêu: Từ vựng, v.v…
- TCVN 10669:2014 (ISO 5963:1985) Thông tin va tư liêu – Phương pháp phân tích
tai liêu, xác định chủ đề va lựa chọn các thuật ngữ định chỉ mục.
- TCVN 10846:2015 (ISO 999:1996) Thông tin va tư liêu – Hướng dẫn về nội dung,
tổ chức va trình bay các bang chỉ mục.
Muốn bám sát chương trình tiêu chuẩn hóa của ISO trong lĩnh vực thông tin va tư
liêu (Xem phụ lục), trên con đường hội nhập va hiên đại hóa, TCVN/TC 46 còn rất
nhiều viêc phai lam, mặc dầu kinh phí hiên nay được cấp chỉ đủ để tổ chức biên
soạn va ban hanh 2 hoặc 3 tiêu chuẩn mỗi năm. Vì vậy, chúng ta phai không ngừng
cai tiến hoạt động của TCVN/TC 46 nói chung va cân bằng viêc biên soạn giữa các
tiêu chuẩn về các công đoạn, công cụ xử lý, lưu trữ va phổ biến thông tin truyền
thống với các tiêu chuẩn cần thiết trong thời đại áp dụng công nghê thông tin mới để
theo kịp với đa phát triển của hoạt động tiêu chuẩn hóa trong khu vực va trên thế
giới.
Ngay 20/09/2011, Bộ Thông tin va Truyền thông ban hanh Thông tư số 24/2011/TT-
BTTTT về "Quy định về viêc tạo lập, sử dụng va lưu trữ dữ liêu đặc ta trên trang
thông tin điên tử hoặc cổng thông tin điên tử của cơ quan nha nước".
Theo Thông tư số 24/2011/TT-BTTTT, Dữ liêu đặc ta la những thông tin mô ta các
đặc tính của dữ liêu như nội dung, định dạng, chất lượng, điều kiên va các đặc tính
khác nhằm tạo thuận lợi cho quá trình tìm kiếm, truy cập, quan lý va lưu trữ dữ liêu.
Va nhằm tạo thuận lợi cho quá trình tìm kiếm, truy cập, quan lý va lưu trữ dữ liêu,
thông tin đăng tai trên cổng thông tin điên tử, cổng thông tin điên tử của cơ quan nha
nước phai sử dụng dữ liêu đặc ta theo chuẩn Dublin Core với 15 yếu tố dữ liêu đặc
ta. Trong đó, quy định 6 yếu tố dữ liêu đặc ta bắt buộc gồm: Tiêu đề, người tạo, thời
gian, mô ta, cơ quan ban hanh va yếu tố định danh; Các yếu tố được khuyến nghị
nên sử dụng la: Ngôn ngữ, nguồn, người cộng tác va chủ đề; Còn các yếu tố tùy
chọn bao gồm: Phạm vi, dạng, định dạng, quan hê va các quyền.
Nhận xét: Thông tư số 24/2011/TT-BTTTT, Quy định về viêc tạo lập, sử dụng va lưu
trữ dữ liêu đặc ta trên trang thông tin điên tử hoặc cổng thông tin điên tử của cơ
quan nha nước theo chuẩn Dublin Core. Như vậy khi xem xét phạm vi đối tượng áp
dụng của dự án chung va kết hợp với mục đích xây dựng dự thao nay, các đối tượng
áp dụng khác (ngoai cơ quan nha nước) cũng có thể áp dụng chuẩn Dublin Core vao
trong hoạt động tạo lập, sử dụng va lưu trữ dữ liêu đặc ta của họ.
Viêc nay tạo ra sự thống nhất trong trao đổi va lưu trữ thông tin, dữ liêu va giam bớt
khó khăn kỹ thuật không đáng có. Cụ thể trong dự thao nay, nhóm biên soạn nhất trí
khuyến nghị sử dụng chuẩn Dublin Core trong quá trình tạo lập chỉ mục ngược cho
metadata.
Các tiêu chuẩn TCVN 7980:2008 hoan toan tương đương ISO 15836:2003, TCVN
10669:2014 hoan toan tương đương với ISO 5963:1985. Các tiêu chuẩn TCVN khác
khi xét các yếu tố rang buộc có liên quan như đã phân tích bên trên thì nhóm biên
soạn thống nhất không cần phai xem xét đến.
Như vậy các tai liêu, tiêu chuẩn kỹ thuật ma nhóm biên soạn sử dụng để xây dựng
quyển thuyết minh nay từ đó có thể xem xét sở cứ xây dựng dự thao phục vụ cho
mục đích dự án bao gồm:
- TCVN 4743:1989: Xử lý thông tin - Mô ta thư mục tai liêu;
- TCVN 5453: 2009, Thông tin va Tư liêu – Từ vựng;
- TCVN 7539:2005: Khổ mẫu MARC 21 cho dữ liêu thư mục;
- TCVN 5697:2009: Từ va cụm từ tiếng Viêt viết tắt trong mô ta thư mục;
- TCVN 10669:2014 (ISO 5963:1985) Thông tin va tư liêu – Phương pháp phân
tích tai liêu, xác định chủ đề va lựa chọn các thuật ngữ định chỉ mục;
- TCVN 7980:2008 (ISO 15836:2003) Thông tin va tai liêu – Bộ phần tử dự liêu
đặc ta Dublin Core;
- ISO 999:1996, Information and documentation – Guidelines for the content,
organization and presentation of indexes;
- ISO 15836:2003, Information and documentation -- The Dublin Core metadata
element set;
- NISO TR02-1997, Guidelines for Indexes and Related Information Retrieval
Devices;
- NISO TR03-1999, Guidelines for Alphabetical Arrangement of Letters and
Sorting of Numerals and Other Symbols;
3 Cơ sơ xây dựng các yêu cầu kỹ thuật.
3.1 Phân tích tinh hinh đối tượng tiêu chuẩn
Khi đề cập đến nganh thư viên, quy trình tạo lập chỉ mục đã được hình thanh va phát
triển gần như song hanh cùng nganh thư viên. Từ hồi mở đầu trên tai liêu giấy, quy
trình tạo lập chỉ mục được tiến hanh thủ công, người định chỉ mục tiến hanh tỉ mỉ va
tốn nhiều thời gian để lập được bang chỉ mục cho một tai liêu giấy. Tuy nhiên khi
khoa học công nghê phát triển, số lượng sách, các dạng xuất ban phẩm ở dạng giấy
va không ở dạng giấy được xuất ban, phát hanh ngay một nhiều, quy trình tạo lập chỉ
mục thủ công đã không còn phù hợp nữa. Bang chỉ mục trong hiên tại đã có nhiều
thay đổi, ứng dụng bang chỉ mục góp phần để giới thiêu cho người đọc về tai liêu,
cách đọc, cách khai thác, cách tra cứu như thế nao để thấy được “Ngọc trong sách”.
Với nhiều phong cách khác nhau, các nha văn muốn bạn đọc của mình tiếp cận với
những từ, những câu “đắt nhất” đó một cách tự nhiên hoặc bất ngờ, vao thời điểm
cao trao hay trầm lắng.
Đối với một nha nghiên cứu, trong công trình nghiên cứu khoa học của mình thường
sử dụng nhiều thuật ngữ chuyên môn, thuật ngữ khoa học, cách tiếp cận mới được
thể hiên. Va đó cũng chính la những ý tưởng, tư tưởng, tính mới trong nghiên cứu…
được tác gia mong muốn thể hiên, chia sẻ với giới chuyên môn, với người đọc tham
khao va với người học.
Vậy lam sao để bạn đọc sớm phát hiên ra những ý “đắt nhất” đó? Cách thức nao để
bạn đọc kiểm soát nội dung cuốn sách, hê thống các vấn đề, các nội dung trùng lặp
nhau để thuận tiên cho viêc đối chiếu, so sánh va suy ngẫm về một vấn đề? Viêc lam
nay chỉ có tác gia va các cán bộ la chuyên gia trong công tác biên tập đúng nghĩa
của nha xuất ban mới có thể thực hiên được. Đó chính la tạo “bang chỉ mục” cho tai
liêu sách, đặc biêt la sách tham khao va nghiên cứu chuyên nganh. Viêc tạo “bang
chỉ mục” cho tai liêu sách sẽ giúp người đọc lựa chọn phạm vi nội dung, định hướng
viêc đọc sách va kiểm soát viêc đọc sách của chính mình. "Bang chỉ mục" được
người định chỉ mục day công chỉ ra, đánh dấu những thuật ngữ, từ chuyên môn, các
từ khóa… hay còn được hiểu la những từ, ý, câu “đắt nhất” của công trình nghiên
cứu khoa học.
3.2 TCVN 4743:1989
Quy định những yêu cầu đặt ra với công tác mô ta thư mục một tai liêu. Khái niêm tai
liêu ở đây bao gồm các tai liêu công bố hoặc không công bố với các loại hình khác
nhau: sách, ấn phẩm tiếp tục, các tai liêu định mức kỹ thuật, các tai liêu kỹ thuật, các
báo cáo nghiên cứu khoa học, các tai liêu dịch va luận án.
Tiêu chuẩn đã đưa ra các quy tắc để mô ta tai liêu với thanh phần các yếu tố mô ta,
trình tự sắp xếp các yếu tố, cách điền va phương pháp trình bay các yếu tố mô ta,
sử dụng các dấu phân cách giữa các yếu tố va các vùng mô ta.
3.3 TCVN 7539:2005
Tiêu chuẩn nay quy định về cách trình bay các dữ liêu thư mục cho biên mục đọc
máy. Đây la một tiêu chuẩn mới được ban hanh va la tiêu chuẩn duy nhất trong số
bốn tiêu chuẩn vừa đề cập được xây dựng trên cơ sở một chuẩn biên mục của Hoa
Kỳ.
TCVN 7539:2005: Khổ mẫu MARC 21 cho dữ liêu thư mục, được áp dụng nhiều
nhất. Tuy nhiên, một số thư viên đại học cho biết: hiên thư viên có biên mục theo
MARC 21 nhưng lại không biết có TCVN 7539:2005. Kết qua cụ thể về viêc áp dụng
TCVN trong xử lý tai liêu tại thư viên công cộng.
Tiêu chuẩn TCVN 7539:2005 day 100 trang, khổ A4, gồm 17 điều:
— Các điều 1-3 la các điều khoan chung liên quan tới: Phạm vi áp dụng, Thuật
ngữ va Quy định chung về biểu ghi thư mục;
— Các điều từ 4-17 quy định các trường trong biểu ghi MARC21 được lựa chọn
vao tiêu chuẩn la những trường được sử dụng thường xuyên với mục đích đam bao
sự bao quát ở mức hợp lý trên cơ sở nghiên cứu thực tiễn biên mục ở Viêt Nam.
Mỗi trường được cấu trúc thanh 3 phần:
— Định nghĩa va phạm vi trường;
— Cấu trúc trường;
— Quy ước nhập dữ liêu.
Cuối tiêu chuẩn có 2 phụ lục có thể dùng để tham khao, bao gồm: Danh mục các từ
viết tắt (sử dụng trong tiêu chuẩn) va Danh mục một số mã thường gặp. Với cách
trình bay ngắn gọn, rõ rang, tuân thủ các quy định trình bay TCVN, TCVN 7539:2005
có thể la cẩm nang cho các cán bộ trực tiếp biên mục cũng như cán bộ nghiên cứu
va giang dạy biên mục đọc máy tại Viêt Nam.
Định danh của xuất ban phẩm nhiều kỳ có thể la một loạt chữ số va ngay tháng,
nhưng chỉ có một số yếu tố đáp ứng tiêu chuẩn nhất định mới được coi la định danh
số va thời gian.
Định danh số. Một chữ số hoặc kết hợp các chữ số, ngay tháng, chữ cái hoặc từ để
nhận dạng một xuất ban phẩm nhiều kỳ.
Định danh thời gian. Một ngay tháng hoặc kết hợp của ngay tháng, chữ số, hoặc các
từ để nhận dạng một xuất ban phẩm nhiều kỳ.
Một số xuất ban phẩm nhiều kỳ có nhiều định danh số hoặc ngay tháng. Trong bai
viết nay, thuật ngữ “định danh” đề cập đến dạng định danh số hoặc ngay tháng hoặc
kết hợp ca hai khi được mô ta ở trường 362 hoặc 500.
Định danh phai “nhận dạng” một số cụ thể. Ở đây, khía cạnh nhận dạng la chủ yếu.
Ví dụ, nếu xuất ban phẩm nhiều kỳ được xuất ban hang tháng va chỉ có 1 định danh
ngay tháng, thì phai chứa ít nhất tên tháng, năm để phân biêt mỗi số của từng tháng
với các số khác. Nếu một xuất ban phẩm nhiều kỳ mang ca định danh số va thời
gian, ít nhất một loại định danh phai nhận dạng được số đó, trong trường hợp nay,
cần mô ta ca hai loại định danh.
Nguồn mô ta. Nguồn lấy thông tin để mô ta định danh la toan bộ xuất ban phẩm
nhiều kỳ (AACR2 12.0B1). Điều nay có nghĩa la thông tin được lấy từ bất cứ vị trí
nao của tai liêu ma không cần dùng các dấu ngoặc. Định danh có thể hoặc không
xuất hiên trên nguồn lấy thông tin chính. Trong nhiều xuất ban phẩm nhiều kỳ, một
phần định danh có trên bìa trong khi định danh đầy đủ lại ở trang biên tập hay tiêu đề
chạy. AACR2 liêt kê nguồn lấy thông tin mô ta la trang nhan đề, phần mở đầu, dẫn
nhập va lời ghi cuối sách.
Nguồn ưu tiên. Định danh có thể được lấy từ bất kỳ nguồn nao khi cần thiết, nhưng
thường ưu tiên hơn với định danh được giới thiêu một cách đầy đủ nhất, dễ dang tìm
thấy nhất. Định danh xuất hiên cùng với nhan đề hoặc bất cứ vị trí nao ở nguồn lấy
thông tin chính thường la định danh được ưu tiên.
Nguồn định danh có chứa một định danh số va một định danh thời gian. Khi xuất ban
phẩm nhiều kỳ có ca hai loại định danh số va thời gian, mỗi phần của định danh có
thể được lấy từ các nguồn khác nhau. Tạp chí thường chỉ có ngay tháng trên bìa,
còn số thứ tự các tập thì có ở trang thông tin biên tập. Mỗi phần định danh được lựa
chọn như thực thể riêng rẽ thì được hợp lại với dấu phân cách thích hợp.
Hợp nhất định danh số va thời gian. Định danh số có thể được lấy từ một nguồn va
định danh thời gian từ một nguồn khác. Định danh số có thể nhóm lại từ nhiều nguồn
khác nhau khi thấy rõ rang la nha xuất ban dự định dùng hai phần định danh nay
thay cho định danh số. Khi không rõ thì không hợp nhất định danh số từ nhiều
nguồn. Nếu cũng có trong tay số mới nhất ghi la volume 1, issue 2, thì ý định của
nha xuất ban la rõ rang va ca hai định danh số va thời gian có thể được mô ta như
định danh số.
Định danh thời gian cũng có thể được hợp lại với nhau từ nhiều nguồn va thường
không khó hiểu như với định danh số.
Lấy định danh từ một nguồn không chính thức hoặc không được trình bay nổi bật.
Mô ta một định danh từ một nguồn không chính thức, như tìm thấy trong lời nói đầu,
nếu đó không phai la số thứ tự hoặc thời gian khác được coi la định danh va phai
chắc chắn đó la một xuất ban phẩm nhiều kỳ.
3.4 Tai liệu toan văn theo tiêu chuẩn ISO.
a. Tai liêu PDF.
PDF (viết tắt từ tên tiếng Anh Portable Document Format, Định dạng Tai liêu Di
động) la một định dạng tập tin văn ban khá phổ biển của hãng Adobe Systems.
Tương tự như định dạng Word (.doc), PDF hỗ trợ văn ban thô (text) cùng với phông
chữ, hình anh đồ họa, âm thanh va nhiều hiêu ứng khác. Tuy nhiên, viêc hiển thị văn
ban PDF không phụ thuộc vao môi trường lam viêc của người sử dụng (cấu hình
máy, phần mềm va hê điều hanh). Không như văn ban Word, một văn ban PDF,
trong hầu hết các trường hợp, sẽ được hiển thị giống nhau trên những môi trường
lam viêc khác nhau. Chính vì ưu điểm nay, định dạng PDF đã trở nên phổ biển cho
viêc phát hanh sách, báo hay các tai liêu khác qua mạng Internet.
Viêc phổ biến định dạng PDF trong thời gian đầu tương đối chậm. Những phiên ban
đầu tiên của PDF không hỗ trợ siêu liên kết bên ngoai, lam giam tính hữu dụng của
nó trên web. Kích thước tập tin tăng lên so với văn ban thuần cũng có nghĩa la thời
gian để tai xuống một tai liêu PDF sẽ lâu hơn, đây cũng la một vấn đề với những
modem chậm thời đó.
Kể từ năm 1995, Adobe đã tham gia vao một số các nhóm lam viêc để tạo ra thông
số kỹ thuật cho các ấn phẩm của ISO va hợp tác trong quá trình ISO trên một phần
nhỏ của các tiêu chuẩn chuyên nganh cho các nganh công nghiêp PDF va các mục
đích cụ thể (ví dụ như PDF / X hoặc PDF / A).
Các chuẩn ISO cho các dạng PDF:
- PDF/X (theo chuẩn ISO 15929 va 15930 – Công nghê đồ họa – Trạo đổi dữ liêu
số): dạng “PDF trao đổi” dựa trên PDF 1.3, PDF 1.4 va PDF 1.6.
- PDF/A (theo chuẩn ISO 19005 – Quan lý tai liêu - Định dạng tập tin tai liêu điên tử
để bao quan lâu dai): dạng “PDF lưu trữ” dựa trên PDF 1.4 va PDF 1.7.
- PDF/E (theo chuẩn ISO 24517 – Quan lý tai liêu - Định dạng tai liêu kỹ thuật sử
dụng PDF): dạng “PDF kỹ thuật” dựa trên PDF 1.6.
- Tiêu chuẩn ISO cho "PDF đầy đủ chức năng" được xuất ban dưới hình thức tiêu
chuẩn ISO 32000. Đặc ta chức năng đầy đủ của không chỉ la một tập hợp con của
đặc điểm kỹ thuật Adobe PDF, trong khuyến nghị của ISO 32000-1 các chức năng
PDF đầy đủ bao gồm tất ca mọi thứ được định nghĩa trong PDF 1.7.
ISO 32000-1: 2008 quy định cụ thể một dạng kỹ thuật số cho đại diên cho tai liêu
điên tử cho phép người dùng trao đổi va xem các tai liêu điên tử độc lập với môi
trường ma họ đã tạo ra trong hoặc môi trường ma họ đang xem hoặc in trong nay
danh cho các nha phát triển phần mềm đó. tạo ra các tập tin PDF (phù hợp với các
nha văn), phần mềm đọc file PDF hiên có va giai thích nội dung của họ để hiển thị va
tương tác (phù hợp với độc gia) va các san phẩm PDF có thể đọc va / hoặc viết các
tập tin PDF cho nhiều mục đích khác (phù hợp với san phẩm).
b. Tai liêu EPUB.
EPUB (short for electronic publication) la tiêu chuẩn e-book mở va miễn phí do Diễn
đan xuất ban quốc tế (IDPF) đề xuất có đuôi file la .epub.
EPUB được thiết kế cho nội dung ngược, có nghĩa la một người đọc EPUB thể tối
ưu hóa văn ban cho một thiết bị hiển thị cụ thể. EPUB cũng hỗ trợ nội dung cố định.
Định dạng nay được dự định như la một định dạng duy nhất ma các nha xuất ban va
nha ở chuyển đổi có thể sử dụng trong nha, cũng như để phân phối va bán hang. Nó
thay thế các tiêu chuẩn mở eBook.
Các chuẩn ISO cho EPUB.
- Part 1 ISO/IEC TS 30135-1 2014-11-05 EPUB3 Overview
- Part 2 ISO/IEC TS 30135-2 2014-11-05 Publications
- Part 3 ISO/IEC TS 30135-3 2014-11-05 Content Documents
- Part 4 ISO/IEC TS 30135-4 2014-11-05 Open Container Format
- Part 5 ISO/IEC TS 30135-5 2014-11-05 Media Overlay
- Part 6 ISO/IEC TS 30135-6 2014-11-05 EPUB Canonical Fragment
Identifier
- Part 7 ISO/IEC TS 30135-7 2014-11-05 EPUB3 Fixed-Layout
Documents
c. Tai liêu PRC.
PRC la một định dạng ebook khá phổ biến tại Viêt Nam. Đây la một dạng file nén
được tối ưu hóa để lưu trữ, tai va hiển thị các loại dữ liêu 3D, đặc biêt la dữ liêu đại
diên cho san phẩm san xuất. Định dạng cho phép lưu trữ các file CAD lớn trong một
hình thức nén cao so với ban gốc. Cấu trúc hoan chỉnh của PRC được xác định bởi
hê thống CAD chứa trong một file PRC nhằm đáp ứng nhu cầu tai liêu 3D của san
phẩm san xuất va các nganh công nghiêp liên quan.
Tiêu chuẩn ISO cho PRC:
- ISO 14739-1: 2014 Document management -- 3D use of Product Representation
Compact (PRC) format -- Part 1: PRC 10001
d. Tai liêu mở (.odt).
Tai liêu mở (hay còn gọi la OpenDocument trong tiếng Anh) la một định dạng tập tin
thuộc họ XML dùng để lưu những tai liêu điên tử như bức thư, văn ban, bang tính,
biểu đồ, va ban thuyết trình.
Tiêu chuẩn nay được phát triển bởi Organization for the Advancement of Structured
Information Standards (OASIS). Các thông số kỹ thuật của tiêu chuẩn đã được phát
triển bởi Sun Microsystems cho các định dạng XML ban đầu được tạo ra va thực
hiên bởi OpenOffice.org.
Đinh dạng OpenDocument được sử dụng trong các phần mềm tự do va ca ở phần
mềm độc quyền. Nó bao gồm bộ phần mềm văn phòng (ca dạng phần mềm truyền
thống lẫn phần mềm trên nền web) va các ứng dụng cá nhân như phần mềm xử lý
văn ban, bang tính, ban thuyết trình, va ứng dụng quan lý dữ liêu.
Ngoai viêc la một tiêu chuẩn OASIS, phiên ban 1.0 được công bố như la một tiêu
chuẩn quốc tế ISO/IEC.
Tiêu chuẩn ISO cho .odt:
- ISO/IEC 26300:2006 Open Document Format for Office Applications
e. Tai liêu mở XML (.docx)
Tai liêu mở XML (cũng chính thức được gọi la OOXML hoặc OpenXML) la định dạng
tập tin XML được phát triển bởi Microsoft cho đại diên cho bang tính, biểu đồ, trình
diễn va văn ban.
Bộ chương trình Microsoft Office 2007 mặc định lưu tập tin dùng định dạng nay.
Office Open XML bao gồm nhiều ngôn ngữ đánh dấu đặc biêt thuộc họ XML va gói
lại những tập tin XML trong lưu trữ Open Packaging Convention (hợp với định dạng
ZIP). Ban đặc ta định dạng bao gồm các gian đồ XML (XML schema) dùng để kiểm
chứng cú pháp XML trong một tập tin.
Microsoft phát triển ban đặc ta về Office Open XML để thay thế các định dạng nhị
phân cũ của Office va nó được Ecma International xuất ban la tiêu chuẩn Ecma 376
vao tháng 12 năm 2006 va ISO/IEC chuẩn hóa (ISO/IEC 29500).
Tiêu chuẩn ISO cho .docx:
- ISO/IEC 29500-1:2012 Information technology - Document description and
processing languages - Office Open XML File Formats - Part 1: Fundamentals and
Markup Language Reference.
- ISO/IEC 29500-2:2012 Information technology - Document description and
processing languages - Office Open XML File Formats - Part 2: Open Packaging
Conventions.
- ISO/IEC 29500-3:2012 Information technology - Document description and
processing languages - Office Open XML File Formats - Part 3: Markup Compatibility
and Extensibility.
- ISO/IEC 29500-4:2012 Information technology - Document description and
processing languages -- Office Open XML File Formats - Part 4: Transitional
Migration Features
3.5 Tiêu chuẩn ISO 15836:2003.
Bộ phần tử dự liêu đặc ta Dublin Core la một chuẩn đề cập đến viêc mô ta tai
nguyên thông tin liên lĩnh vực. Ở đây, tai nguyên thông tin được định nghĩa la các
thông tin được định danh. Đây la định nghĩa được sử dụng trong chuẩn Internet RFC
2396, “các thẻ định danh tai nguyên thống nhất (URI): Cú pháp chung” do Tim
Berners-Lee va cộng sự phát triển. Đối với các ứng dụng Dublin Core, tai nguyên
thông tin la một tai liêu điên tử.
Tiêu chuẩn nay chỉ áp dụng cho bộ phần tử được sử dụng chung trong các ứng
dụng hoặc dự án cụ thể. Các chính sách, yêu cầu của cộng đồng va địa phương
khác nhau có thể áp đặt thêm một số giới hạn, quy tắc va cách thông dịch. Tiêu
chuẩn nay không định nghĩa chi tiết tiêu chí ma bộ phần tử được sử dụng trong các
ứng dụng va dự án cụ thể. Tiêu chuẩn nay thay thế cho chuẩn RFC 2413, đây la
phiên ban phát hanh đầu tiên về Dublin Core.
Trong các mô ta phần tử, mỗi phần tử có một nhãn mô ta nhằm truyền đạt sự am
hiểu ngữ nghĩa về phần tử va mỗi phần tử còn có một tên duy nhất, gồm một từ ma
máy có thể hiểu được, dùng để tạo ra đặc ta cú pháp của các phần tử đơn gian hơn
trong lược đồ mã hóa.
Tuy nhiên trong một vai môi trường, như HTML, không phân biêt dạng chữ hoa va
chữ thường thì viêc tuân thủ các quy ước về tên các phần tử la cách tốt nhất nhằm
tránh xung đột khi dự liêu đặc ta được trích dẫn hoặc chuyển đổi sang các môi
trường có sự phân biêt chữ hoa, chữ thường, như XML (Ngôn ngữ đánh dấu mở
rộng).
Mỗi phần tử la tùy chọn va có thể lặp lại. Các phần tử dự liêu đặc ta có thể xuất hiên
ở mọi thứ tự. Viêc sắp xếp theo thứ tự số lần xuất hiên của một phần tử (ví dụ: tác
gia) có ý nghĩa đối với nha cung cấp, nhưng không đam bao các phần tử được duy
trì trong mỗi hê thống.
Để thúc đẩy tính tương tác toan cầu, một số mô ta phần tử nên có một từ điển đối
với các giá trị phần tử tương ứng. Điều nay được gia định rằng các từ vựng được
kiểm soát khác sẽ được phát triển về tính tương tác trong các miền cục bộ nao đó.
Các phần tử gồm có:
1. Tiêu đề: Tên được đặt cho một tai nguyên. Thông thường, Tiêu đề được hiểu la
tên chính thức của một tai nguyên.
2. Tác gia: Một thực thể trách nhiêm chính la tạo ra nội dung cho tai nguyên. Thông
thường, tên của tác gia nên được sử dụng để định danh thực thể nay.
3. Chủ đề: Một chủ điểm nội dung của tai nguyên. Thông thường, Chủ đề được thể
hiên la các từ khóa, cụm từ khóa, hoặc các mã phân loại mô ta chủ điểm của tai
nguyên. Cách tốt nhất được khuyến cáo la lựa chọn một giá trị từ một từ vựng được
kiểm soát hay từ một lược đồ phân loại chính thức.
4. Mô ta: Mô ta nội dung của tai nguyên. Các ví dụ về mô ta bao gồm, nhưng không
chỉ như vậy, một tóm tắt, mục lục, tham chiếu đến nội dung của tai liêu bằng đồ họa,
văn ban.
5. Nha phát hanh: Thực thể có trách nhiêm tạo ra tai nguyên thông tin sẵn sang để
sử dụng. Thông thường, tên của nha phát hanh nên được sử dụng để chỉ ra thực thể
đó.
6. Người đóng góp: Thực thể có trách nhiêm đóng góp vao nội dung của tai nguyên
thông tin đó. Thông thường, tên của người đóng góp nên được sử dụng để chỉ ra
thực thể đó.
7. Ngay tháng: Ngay tháng của sự kiên trong vòng đời của tai nguyên. Thông
thường, Ngay tháng la ngay tạo ra tai nguyên hoặc ngay tai nguyên sẵn sang sử
dụng. Cách tốt nhất được khuyến cáo đối với viêc mã hóa giá trị ngay tháng được
xác định trong một hồ sơ theo TCVN ISO 8601:2004 [W3CDTF] va bao gồm ngay
tháng theo dạng YYYY-MM-DD.
8. Kiểu: Ban chất hoặc dạng nội dung của tai nguyên. Kiểu bao gồm các thuật ngữ
mô ta các danh mục phân loại chung, các chức năng, các dạng hoặc các mức kết
hợp nội dung. Cách tốt nhất được khuyến cáo để chọn một giá trị từ một từ vựng
được kiểm soát (ví dụ, từ vựng kiểu DCMI [DCT]). Để mô ta biểu thị dạng vật lý hoặc
dạng số của tai nguyên, sử dụng phần tử định dạng.
9. Định dạng: Biểu thị dạng vật lý hoặc số của tai nguyên. Thông thường, định dạng
bao gồm kiểu phương tiên hoặc các kích cỡ của tai nguyên. Định dạng được sử
dụng để định danh phần mềm, phần cứng, hoặc thiết bị cần thiết khác dùng cho viêc
điều hanh hoặc hiển thị. Các ví dụ về kích thước bao gồm kích cỡ va khoang thời
gian. Cách tốt nhất được khuyến cáo la lựa chọn giá trị từ một từ vựng được kiểm
soát (ví dụ, danh sách các kiểu phương tiên Internet (Internet Media Types [MIME])
định nghĩa các định dạng môi trường máy tính).
10. Thẻ định danh: Tham chiếu đến tai nguyên thông tin trong ngữ canh cụ thể. Cách
tốt nhất được khuyến cáo la định danh tai nguyên bằng một chuỗi hoặc số phù hợp
với hê thống định danh chính thức. Hê thống định danh chính thức bao gồm nhưng
không hạn chế đối với thẻ định danh tai nguyên thông tin thống nhất (URI) (gồm
người quy định tai nguyên thống nhất (URL), thẻ định danh đối tượng dạng số (DOI),
va mã số sách tiêu chuẩn quốc tế ( (ISBN)).
11. Nguồn: Tham chiếu đến một tai nguyên ở đó tai nguyên hiên tại được tạo. Tai
nguyên hiên tại có thể được lấy từ toan bộ hoặc một phần tai nguyên gốc. Cách tốt
nhất được khuyến cáo la định danh tai nguyên được tham chiếu bởi chuỗi hoặc bởi
số phù hợp với hê thống định danh chính thức.
12. Ngôn ngữ: Ngôn ngữ mô ta nội dung tri thức của tai nguyên. Cách tốt nhất la sử
dụng RFC 3066 kết hợp với ISO 639 [ISO639], định nghĩa các thẻ ngôn ngữ chính
gồm hai va ba chữ cái cùng với các thẻ nhỏ tùy chọn.
13. Quan hê: Tham chiếu đến tai nguyên có liên quan. Cách tốt nhất được khuyến
cáo la định danh tai nguyên được tham chiếu bằng chuỗi hoặc số phù hợp với hê
thống định danh chính thức.
14. Phạm vi: Phạm vi về nội dung của tai nguyên. Thông thường, phạm vi bao gồm
vị trí về không gian (tên địa điểm hoặc tọa độ địa lý), khoang thời gian (nhãn, ngay
tháng, hoặc dãy ngay tháng), hoặc pháp nhân (như thực thể quan trị được đặt tên).
Cách tốt nhất được khuyến cáo la lựa chọn một giá trị từ một từ vựng được kiểm
soát.
15. Quyền: Thông tin về các quyền đối với tai nguyên. Thông thường, quyền bao
gồm tuyên bố quan lý các quyền đối với tai nguyên, hoặc tham chiếu một dịch vụ cấp
thông tin. Thông tin về các quyền thường bao gồm Quyền sở hữu trí tuê (IPR), ban
quyền, va các quyền sở hữu khác. Nếu có mặt phần tử quyền, thì không có gia định
nao được tạo ra về các quyền trong tai nguyên đó.
3.6 Tiêu chuẩn ISO 999:1996.
Tiêu chuẩn nay cung cấp hướng dẫn về nội dung, tổ chức va trình bay các chỉ mục,
áp dụng cho viêc lập chỉ mục cho các dữ liêu toán văn va tai liêu điên tử.
Tiêu chuẩn nay liên quan đến các nguyên tắc lập chỉ mục cơ ban va thực hanh chứ
không phai la các thủ tục chi tiết về lập chỉ mục tùy theo loại tai liêu được lập chỉ mục
va người dùng được chỉ mục nhắc đến.
Tiêu chuẩn nay bao gồm các lựa chọn, hình thức va sự sắp xếp của các Tiêu đề va
Tiêu đề phụ được sử dụng trong mục nhập chỉ mục khi các đối tượng lập chỉ mục
được xác định.
Mặc dù tiêu chuẩn nay không đưa ra bất cứ hướng dẫn cho viêc tạo ra chỉ mục tự
động trên máy tính, nó có liên quan đến viêc tạo ta tất ca các loại chỉ mục, bất kể
chúng được thực hiên thủ công hoặc bằng các phương pháp có máy tính hỗ trợ, va
được biên soạn bởi một người lập chỉ mục hoặc một nhóm người lập chỉ mục.
Tiêu chuẩn nay không bao gồm viêc trích xuất bằng máy các từ khóa để tạo ra chỉ
mục, cũng không bao gồm các hê thống lập chỉ mục đặc biêt như PRECIS, hê thống
lập chỉ mục chuỗi, lập chỉ mục trích dẫn hoặc lập chỉ mục kết hợp, mặc dù các
khuyến nghị có thể tương ứng với một trong các hê thống đó.
Chức năng của một chỉ mục la cung cấp cho người dùng một phương tiên hiêu qua
để theo dõi thông tin. Do đó, một chỉ mục nên:
- Xác định va xác định vị trí thông tin quan trọng trong các tai liêu được lập chỉ
mục;
- Phân biêt giữa thông tin về một chủ đề va đề cập thoáng qua về một chủ đề;
- Phân tích các khái niêm được đề cập trong tai liêu ma một số tiều đề thể hiên;
- Đam bao các từ được sử dụng trong chỉ mục la phù hợp với người dùng chỉ
mục để họ có thể nhanh chóng thiết lập sự có mặt hay vắng mặt của thông tin về
một chủ đề cụ thể trong một công viêc không quen thuộc; nhanh chóng phục hồi
thông tin được nhớ trong một phần hoặc toan bộ công viêc; nhanh chóng xác
định các tai liêu trong bộ sưu tập.
- Chỉ ra mối quan hê giữa các khái niêm;
- Nhóm các thông tin nằm rai rác trong các tai liêu hoặc bộ sưu tập;
- Tổng hợp các tiêu đề va tiêu đề phụ vao trong các mục; sự tổng hợp nay có
thể đặt vao một têp chuẩn;
- Hướng dẫn cho người dùng tìm kiếm thông tin theo các từ không được chọn
lam tiêu đề đến các từ chỉ mục được chọn la tiêu đề chỉ mục hoặc tham chiếu chéo;
- Sắp xếp các dẫn mục theo thứ tự có hê thống va dễ sử dụng.
Chỉ mục có thể được tạo lập cùng hoặc riêng biêt với tai liêu. Chỉ mục có thể bao
gồm thẻ cho các loại khác nhau bao gồm tên (người, nhóm, địa danh), từ kỹ thuật,
các vấn đề, chức danh công viêc, dòng đầu tiên của bai thơ, trích dẫn, chữ viết tắt,
từ viết tắt, số, ngay tháng, v.v… Chỉ mục tổng quát kết hợp các mục nhập cho một
phần hoặc tất ca các loại nêu trên trong một chuỗi. Khi tai liêu va bộ sưu tập thích
hợp cho viêc lập chỉ mục, chúng có thể tách dòng cho các loại đầu vao khác nhau.
Phổ biến nhất trong các loại nay la:
- Chỉ mục theo chủ đề: cung cấp truy cập vao nội dung của tai liêu theo
chủ đề. Các tiêu đề được sắp xếp theo thứ tự bang chữ cái va thứ tự có hê thống.
- Chỉ mục theo tác gia: cung cấp truy cập vao thông tin về các tai liêu được trích
dẫn bởi tên của tác gia trong các tai liêu được lập chỉ mục hoặc một danh sách
các tai liêu phân biêt bởi tên của tác gia trong bộ sưu tập được lập chỉ mục. Chỉ mục
theo tác gia có thể bao gồm tác gia la cá nhân hoặc tập thể.
- Chỉ mục theo tên: cung cấp truy cập theo tên nằm trong tai liêu, có thể la tên
của cá nhân, tổ chức hoặc đối tượng. Các tên như vậy có thể kết hợp vao một chỉ
mục.
- Chỉ mục địa lý: cung cấp truy cập đến thông tin hoặc tai liêu thông qua
địa danh. Những địa điểm nay có thể rất rộng, chẳng hạn như châu lục hoặc quốc
gia, hoặc rất cụ thể, chẳng hạn như các thanh phố va thị trấn hoặc các tòa nha cụ
thể trong khu dân cư.
- Chỉ mục theo tiêu đề: cung cấp truy cập theo tiêu đề hoặc trích dẫn của tai liêu
được thể hiên trong một chuỗi các tiêu đề.
- Chỉ mục theo số hiêu va mã hiêu: cung cấp truy cập theo định danh của
tai liêu ví dụ số hiêu bằng sáng chế, ISBN, ngay tạo, ngay công bố hoặc ca hai.
Một chỉ mục hiêu qua đáp ứng được nhu cầu của người tìm kiếm thông tin trong các
tai liêu được lập chỉ mục. Người lập chỉ mục nên công bằng va khách quan trong
viêc lựa chọn chủ đề va thuật ngữ. Kiến thức của người lập chỉ mục có được thông
qua nghiên cứu va kinh nghiêm, xác định chất lượng của chỉ mục. Các yếu tố quan
trọng khác bao gồm kiến thức của người lập chỉ mục về ngôn ngữ va chủ đề của tai
liêu, chất lượng của các công cụ lập chỉ mục
Chỉ mục nên có đầy đủ chi tiết để đáp ứng nhu cầu dự kiến của người sử dụng, đưa
ra số lượng chi tiết va số lượng tai liêu được lập chỉ mục bao trùm các chủ đề. Các
yếu tố anh hưởng đến độ dai của chỉ mục bao gồm:
- Ban chất va mục đích của các tai liêu được lập chỉ mục; ví dụ, có thể la tai liêu
kỹ thuật hoặc khoa học đòi hỏi xử lý chi tiết hơn các tai liêu phổ thông;
- Mục đích lập chỉ mục; ví dụ, một cá nhân cụ thể có thể hứng thú với chỉ một
khía cạnh của tai liêu phức tạp. Trường hợp có sự hứng thú đặc biêt đến lập chỉ
mục, điều nay nên được nêu rõ trong một lưu ý mang tính giới thiêu đến tiêu đề hoặc
các thẻ khác.
Các chi tiết, kiểu cách va bố cục của một chỉ mục phai nhất quán. Chỉ mục cần được
xây dựng phù hợp với một mô hình hợp lý, cân bằng, nhất quán va dễ dang nhận
biết. Tính nhất quán la số lượng chi tiết được đưa ra, sử dụng các thuật ngữ, phân
khu, tham chiếu chéo, kiểu cách va thiết kế chung. Tính nhất quán có thể có được
nếu
- Thiết lập va thực hiên theo các chính sách lập chỉ mục va các têp chuẩn;
- Các tai nguyên chỉ mục đáng tin cậy được sử dụng, chẳng hạn như, từ điển,
từ vựng kiểm soát, sự tư vấn của các chuyên gia;
- Quyết định lập chỉ mục được ghi lại một cách có hê thống;
- Lam viêc trên cùng chỉ mục được tạo thanh từ hai hay nhiều chỉ mục được
phối hợp một cách cẩn thận.
Chất lượng va tính nhất quán của một chỉ mục sẽ được tăng cường nếu người lập
chỉ mục có thể thao luận về tai liêu với tác gia để biết các yêu cầu của nha xuất ban
va hoan toan hiểu các yêu cầu của người sử dụng tiềm năng về chỉ mục. Thông tin
nay sẽ giúp người lập chỉ mục đưa ra quyết định đúng trong viêc lựa chọn thêm vao
hoặc loại trừ các mục nhập chỉ mục va sự cần thiết cho các chỉ mục đặc biêt.
Người lập chỉ mục nên truy cập
- Tai liêu toan văn, ví dụ, dữ liêu toan văn bao gồm thuyết minh va những tai
liêu bên ngoai văn ban như hình minh họa, ban đồ va biểu đồ.
- Các tai liêu ở dạng cuối cùng, ví dụ, bằng chứng của các trang được đánh
dấu kết hợp với các thay đổi về văn ban va viêc đánh số trang.
Thông thường chỉ mục bao gồm tất ca các thứ trong các loại ấn ban phẩm. Sự loại
trừ đưa đến sự chú ý của người sử dụng trong một lưu ý giới thiêu. Đối với tai liêu in,
lập chỉ mục bao gồm giới thiêu, ghi chú, bổ sung, minh họa va phụ lục. Trang tiêu đề,
lời đề tặng, mục lục, tóm tắt hoặc trích ở đầu bai báo hoặc chương, quang cáo, va
các chủ đề tương tự thường không được lập chỉ mục, nhưng phai được kiểm tra để
đưa vao trong chỉ mục.
Các trường hợp sau đây có thể anh hưởng đến quyết định cung cấp nhiều hơn một
chỉ mục:
- Quan tâm đặc biêt trong các phần cụ thể của tai liêu, chẳng hạn như quang
cáo hoặc đánh giá;
- Quan tâm đặc biêt trong các chủ đề cụ thể của các tai liêu được lập chỉ mục,
ví dụ, tác gia hoặc trích dẫn pháp lý;
- Khó khăn trong viêc đồng hóa các nhóm phi ngôn ngữ, ví dụ, số bằng sáng
chế hoặc công thức hóa học, trong một danh sách chủ yếu bằng lời nói.
Trình diễn tiêu đề va tiêu đề phụ:
- Viêc lựa chọn các khái niêm được đưa vao chỉ mục phụ thuộc vao yêu cầu dự
kiến sử dụng va ban chất của các tai liêu được lập chỉ mục. Mục đích của tai liêu anh
hưởng đến sự biểu hiên của tiêu đề.
- Các tiêu đề nên được lựa chọn thuật ngữ được sử dụng trong tai liêu, đặc biêt
la trong trường hợp lập chỉ mục một tai liêu duy nhất; hoặc trong trường hợp lập chỉ
mục cho bộ sưu tập của têp chuẩn.
- Các tiêu đề nên đại diên cho các khái niêm tìm thấy trong các tai liêu. Trình
bay các tiêu đề trong chỉ mục nên phù hợp với viêc sử dụng ngôn ngữ va thuật ngữ
của các tai liêu. Nói chung, các tiêu đề nên bao gồm tên, nếu cần thiết có thể thay
bằng tính từ hoặc danh từ hay động từ được sử dụng như la thuộc ngữ.
- Viêc thể hiên các dẫn mục thay cho viêc bố trí theo cấp bậc các tiêu đề va
tiêu đề phụ nhờ viêc lặp lại các từ lặp cho từ ghép hoặc sử dụng có hê thống dấu
chấm câu để xác định vai trò của các từ ngữ. Viêc sử dụng nay có thể thích hợp
trong chỉ số tờ báo, các thư mục va tóm tắt.
- Chỉ mục có thể tham khao các quy tắc biên mục được sử dụng trong các thư
viên của nước sở tại để được hướng dẫn chi tiết về viêc xây dựng các tiêu đề cho
tên người, địa điểm va các cơ quan doanh nghiêp.
- Tiêu đề tai liêu bình thường được in nghiêng hoặc gạch chân. Nếu cần thiết
để xác định tên của tác gia, nơi xuất ban, ngay tháng hoặc các từ hạn định khác có
thể được thêm vao trong dấu ngoặc đơn.
Định vị (locator):
- Mục đích của định vị la để dẫn người dùng đến thẳng một phần của tai liêu bộ
sưu tập có chứa thông tin ma chỉ mục đề cập đến. Các loại định vị được sử dụng
trong các chỉ mục va sử dụng in ấn đặc biêt nên được ghi rõ trong một lưu ý giới
thiêu. Ban chất của định vị phụ thuộc vao lai liêu được lập chỉ mục.
- Tai liêu in: Nếu các trang của một tai liêu in được chia theo một cách nao đó,
ví dụ, theo các cột, người lập chỉ mục có thể lam chỉ định tham chiếu đến đến trang
va cột. Nếu văn ban được đánh số đoạn văn, người lập chỉ mục có thể sử dụng
những con số chỉ đoạn như định vị.
- Tai liêu không in va tai liêu đa phương tiên: Các phương tiên truyền thông
không in, cho các mục đích của lập chỉ mục, có thể được chia thanh ba loại.
Những tai liêu trong đó bao gồm các yếu tố hình thanh một hoặc nhiều chuỗi có thể
được liên tục đánh số va được người sử dụng nắm bắt. Ví dụ như một bộ sưu tập
của các slide, một cuộn phim, đĩa âm thanh, một máy cơ sở dữ liêu có thể đọc được.
Định vị sẽ được cho số lượng các slide, số khung, số bên va bên va nhận dạng hồ
sơ.
Những tai liêu bao gồm một hoặc nhiều chuỗi theo trình tự các yếu tố không
thể phân biêt được số hiêu, ví dụ được thực hiên tuần tự các tai liêu như phim anh,
âm thanh va băng video. Trong những trường hợp người lập chỉ mục cần phai đưa
ra những vị trí có liên quan, chẳng hạn như thời gian hoạt động từ một điểm cụ thể.
Những tai liêu không bao gồm các trình tự như ban đồ, biểu đồ, sơ đồ, biểu
đồ, v.v Trong một số trường hợp có những quy ước cụ thể, ví dụ, ban đồ tham chiếu
tọa độ. Trong trường hợp khác, người lập chỉ mục nên thiết kế định vị.
Nếu một tai liêu la một chủ đề liên tục đánh số liên tiếp theo thứ tự, cần tham chiếu
các mục số đầu tiên va cuối cùng, ví dụ 3-11. Thông thường, những con số không
nên bị xóa, bởi vì nó trình rõ rang bay các số đầu tiên va cuối cùng đầy đủ, ví dụ như
78- 79, 123- 125. Đặc biêt, khi không gian cần thiết hoặc trong trường hợp định vị rất
dai, ví dụ, 100026- 100027, con số nay có thể được loại bỏ để chỉ các chữ số trong
viêc thay đổi định vị thứ hai được đưa ra, ví dụ 100026- 7. Dù hình thức trình bay
được sử dụng, phai được áp dụng nhất quán trong chỉ mục.
Nếu một chủ đề được xử lý nhiều lần nhưng không liên tục trên một chuỗi số liên
tiếp, nên tham chiếu cho từng hạng mục trong trình tự, ví dụ như, 3, 4, 5 (không 3-
5).
Tham chiếu chéo:
- Một chỉ mục bao gồm các tiêu đề thích hợp va từ đồng nghĩa thay thế va tham
chiếu chéo giữa các tiêu đề có liên quan, trừ trường hợp nhiều mục được sử dụng.
- Tham chiếu chéo “xem” được tạo từ từ đồng nghĩa không ưu tiên với dạng ưu
tiên của tiêu đề. Trường hợp hướng của các tham chiếu chéo la nhiều tiêu đề, chúng
phai được liêt kê theo thứ tự bang chữ cái, cách nhau bằng dấu chấm phẩy.
- Tham chiếu chéo “xem thêm” được thực hiên giữa các tiêu đề va tiêu đề phụ
trong chỉ mục. Thông thường tham chiếu chéo nay theo sau các định vị liên quan
đến tiêu đề va tiêu đề phụ ma chúng có liên quan. Trường hợp hướng của các tham
chiếu chéo la cho nhiều tiêu đề, chúng phai được liêt kê theo thứ tự bang chữ cái,
cách nhau bằng dấu chấm phẩy.
Để phần loại bằng tay hoặc bằng máy, các biểu tượng va ký tự phai được đăng ký.
Những giá trị đăng ký được bắt nguồn từ một hê thống được thiết lập như ISO 646,
nhưng hê thống nay được thiết kế để thể hiên ký tự chứ không phai để phân loại,
thường la ghi lại tất ca chữ hoa trước tất ca các chữ thường va các ký hiêu không
phai chữ cái xen kẽ.
Vì vậy, cho mục đích phân loại, với các chữ thường va chữ hoa của một chữ được
cho giá trị giống hêt nhau để một chuỗi chữ cái duy nhất thu được. Biểu tượng dấu
chấm câu dùng để phân biêt các loại giá trị chỉ mục tiêu đề để phân loại các tiêu đề
theo thứ tự yêu cầu.
Đăng ký tiêu đề chỉ mục
- Hê thống để ghi tiêu đề nên rõ rang (có nghĩa la, vị trí của tiêu đề chỉ mục hồ
sơ phai rõ rang) va có thể dự đoán.
- Viêc sắp xếp theo chữ va số la thực tế nhất, do đó la phương pháp trình bay
chỉ mục phổ biến nhất. Các quy định khác có thể thích hợp hơn cho một chỉ mục cụ
thể.
- Trong một chỉ mục, các tiêu đề phụ có thể thỉnh thoang vẫn phai chuẩn bị
thuận tiên hơn bằng một phương pháp khác theo chữ cái.
- Nếu sắp xếp không phai la ngay lập tức rõ rang cho người sử dụng, có thể
được giai thích trong một lưu ý giới thiêu đến các chỉ mục.
Đăng ký tiêu đề phụ.
- Tiêu đề phụ nằm trong chỉ mục theo cùng một cách với tiêu đề. Tuy nhiên, sự
sắp xếp của các tiêu đề phụ có thể được sửa đổi một cách hữu ích bởi một số sắp
xếp theo số, thời gian hay mang tính hê thống, đặc biêt la nếu sắp xếp như vậy la rõ
rang hay ngụ ý trong văn ban, hoặc giới thiêu để phân biêt số lượng lớn các từ đồng
âm.
- Trong trường hợp các tiêu đề phụ bắt đầu bằng giới từ hoặc liên từ, nó có thể
đưa ra quyết định để loại trừ giới từ hoặc liên từ cho mục đích đăng nhập. Một quyết
định như vậy nên được áp dụng cho chỉ mục va ghi lại trong một lưu ý giới thiêu.
Đăng ký dẫn mục có chứa tham chiếu chéo: tham chiếu chéo "xem" hoặc "xem
thêm" sau tiêu đề nhưng không phai một phần của nó va không anh hưởng đến vị trí
của tiêu đề trong chuỗi chữ cái.
Người lập chỉ mục nên tìm các biên tập viên (hoặc cơ quan/cá nhân ma họ đã ký
hợp đồng biên soạn chỉ mục) nếu họ thực hiên bất kỳ quy ước cụ thể trong viêc trình
bay ban thao. Trong trường hợp chỉ mục của một tai liêu đơn gian, người lập chỉ
mục thường cung cấp chỉ mục dưới dạng in hoặc đọc máy kèm theo ban thao giấy
giống với dạng đọc máy. Đối với chỉ mục cho các bộ sưu tập tai liêu, định dạng để
trình bay sẽ phụ thuộc vao công nghê sử dụng để san xuất va phổ biến chỉ mục cuối
cùng, chỉ mục có thể thay đổi từ thẻ để ấn phẩm điên tử.
Trong trường hợp ban thao đọc máy được cung cấp để định dạng lại, hoặc để gắn
vao một chỉ mục trực tuyến hoặc chỉ mục in, người lập chỉ mục phai tìm va cẩn thận
lam theo hê thống định dạng mã yêu cầu của khách hang.
Khi chỉ mục được thiết lập từ ban đánh máy theo các quy ước để có được ban sao
đánh máy rõ rang, những người lam viêc liên quan đến chỉ mục xuất ban được
khuyến khích. Ví dụ, vì lợi ích của sự rõ rang, các ban sao có thể được trình bay
theo phong cách rõ rang với chỉ định thích hợp cho công viêc cuối cùng, khi các chỉ
mục được xác định. Viêc chỉ định nhân viên đánh máy để chuẩn bị các ban sao phai
tuân theo quy ước phát hanh chỉ mục được chấp nhận tại mỗi quốc gia.
Nếu một chỉ mục không phai la loại đơn gian hoặc loại quy ước tự giai thích, người
lập chỉ mục nên kéo dai chỉ mục với một lưu ý giới thiêu. Bất kỳ chữ viết tắt, ký hiêu,
quy ước in, v.v… đòi hỏi phai có lời giai thích nằm trong các lưu ý, cũng như đề cập
đến bất kỳ tiêu chuẩn quốc tế hoặc các tiêu chuẩn khác được sử dụng cho hê thống
chuyển tự va chuyển sang chứ Latin. Trong trường hợp các chỉ mục được công bố
một cách riêng biêt, một lưu ý nên có đủ thông tin thư mục (tác gia, tiêu đề, nha xuất
ban, nơi va ngay công bố va cáp tập được lập chỉ mục) để xác định đầy đủ các tai
liêu được lập chỉ mục.
Chỉ mục thêm vao tai liêu được thường được đặt ở cuối của tai liêu, đôi khi có thể
đặt trước các văn ban, ví dụ, tai liêu tham khao của nhiều cuốn sách va tạp chí. Số
trang ma đánh số chỉ mục cần được thể hiên trong bang mục lục. Trong nhiều quyển
tai liêu, chỉ mục có thể xuất hiên ở phần cuối quyển hoặc la một quyển riêng biêt. Số
trang thêm vao văn ban la chữ số Ả Rập, ngoại trừ với chỉ mục đặt trước văn ban.
Trong trường hợp nay, khác với văn ban chính của tai liêu, số trang nên la chữ số La
Mã.
Các trang ma tại đó các chỉ mục được in nên duy trì đầu đề liên tục. Đối với nhiều chỉ
mục đầu đề cần phai liên trên mỗi trang với một tên thích hợp cho mỗi chỉ mục. Đối
với chỉ mục trình bay riêng biêt, dòng chữ "chỉ mục (tiêu đề tai liêu)" nên được sử
dụng.
Trong viêc lựa chọn ban in, mối quan tâm đầu tiên nên la kha năng đọc rõ rang va
nhanh chóng. Kích thước font chữ va độ rộng cột nên được tỷ lê thuận với nhau. Một
dòng la đủ để chứa một chiều dai chỉ mục trung bình bao gồm hai hoặc nhiều định vị.
Khi một mục dai hơn một dòng, nên tránh phân chia bộ định vị.
Một chỉ mục thường được bố trí ở hai cột trên mỗi trang. Nếu bạn cần phai tiết kiêm
không gian, có thể được sắp xếp theo ba cột. Một số loại chỉ mục, đặc biêt la khi đầu
vao la dai, ví dụ, chỉ mục của các dòng đầu tiên hoặc một bang các giấy tờ pháp lý,
có thể tốt hơn nếu bố trí chỉ mục toan bộ chiều rộng của trang. Nếu bạn được có
nhiều hơn một chỉ mục cho tai liêu va mỗi chỉ mục trai dai nhiều cột, khuyến cáo mỗi
chỉ mục bắt đầu ở đầu mỗi trang hoặc cột. Các tiêu đề cho mỗi chỉ mục, rút ngắn nếu
cần thiết, phai được lặp lại ở đầu mỗi trang như la đầu đề trang. Trong một chỉ mục
dai, khuyến cáo rằng mỗi nhóm các tiêu đề chỉ mục bắt đầu với cùng chữ cái được
bắt đầu tại một cột mới hoặc một trang mới.
3.7 TCVN 10669:2014 (ISO 5963:1985)
Thông tin va tư liêu – Phương pháp phân tích tai liêu, xác định chủ đề va lựa chọn
các thuật ngữ định chỉ mục
Ban kỹ thuật tiêu chuẩn, Tiểu ban kỹ thuật tiêu chuẩn liên quan Thông tin va Tư liêu
– Nhận dạng va mô ta của Tổ chức Tiêu chuẩn hóa Quốc tế sau khi tiến hanh soát
xétvao năm 2001, 2008 va đã bỏ phiếu tán thanh vẫn tiếp tục sử dụng ISO 5963:
1985. Tính đến năm 2001, có 8 nước đã chấp nhận ISO 5963: 1985 lam tiêu chuẩn
quốc gia. Một số nước chấp nhận ISO 5963: 1985 lam tiêu chuẩn quốc gia không có
bổ sung hiêu chỉnh: Anh, Tây Ban Nha, Thụy Điển, Đức, Bungari, Cộng hòa Séc,
Nam Phi... Một số nước chấp nhận ISO 5963: 1985 lam tiêu chuẩn quốc gia có bổ
sung, hiêu chỉnh: Ý, Nga…
Tổ chức tiêu chuẩn hóa Công hòa Liên bang Nga đã xây dựng va ban hanh hai tiêu
chuẩn quốc gia liên quan đến định chỉ mục tai liêu, bao gồm: GOST 7.59-2003 "Định
chỉ mục tai liêu. Yêu cầu chung cho tổ chức va lập chỉ mục” va GOST 7.66-92 "Định
chỉ mục tai liêu. Yêu cầu chung để phối hợp định chỉ mục. Tiêu chuẩn GOST 7.66-
92 đã được xây dựng trên cơ sở chấp nhận ISO 5963-85 Tư liêu - Phương pháp
phân tích tai liêu, xác định chủ đề va lựa chọn các thuật ngữ định chỉ mục.
Tiêu chuẩn nay mô ta các cách thức được khuyến cáo áp dụng khi phân tích tai liêu,
xác định chủ đề của các tai liêu va lựa chọn các thuật ngữ định chỉ mục thích hợp.
Tiêu chuẩn chỉ tập trung vao các giai đoạn ban đầu của viêc định chỉ mục va không
đề cập tới cách thực hiên của bất kỳ một hê thống định chỉ mục cụ thể nao, dù la tiền
kết hợp hay hậu kết hợp.
Tiêu chuẩn nay có tất ca 8 Điều bao gồm:
1 Phạm vi áp dụng
2 Tai liêu viên dẫn
3 Thuật ngữ định nghĩa
4 Hoạt động va mục đích của viêc định chỉ mục
5 Phân tích tai liêu
6 Nhận dạng khái niêm
7 Lựa chọn các thuật ngữ chỉ mục
8 Kiểm soát chất lượng
Như các tiêu chuẩn quốc gia khác, 3 điều đầu của tiêu chuẩn TCVN 10669:2014
(ISO 5963:1985) đưa ra các phạm vi áp dụng tiêu chuẩn, những tai liêu cần có khi
áp dụng tiêu chuẩn va những thuật ngữ, định nghĩa được sử dụng trong tiêu chuẩn.
Tiếp theo sau đó la các điều khoan chính quy định về những viêc cần thiết phai thực
hiên khi tiến hanh định chỉ mục.
TCVN 10669:2014 (ISO 5963:1985) ban đầu được dự kiến như một hướng dẫn
danh cho những người định chỉ mục trong các giai đoạn phân tích tai liêu va nhận
dạng các khái niêm. Nó cũng có thể có ích cho viêc phân tích yêu cầu của người
dùng tin va dịch các yêu cầu đó, với mục đích truy hồi thông tin, ra thanh các thuật
ngữ được kiểm soát của một ngôn ngữ định chỉ mục, va nó có thể có nhiêm vụ
hướng dẫn người lam bai tóm tắt. Tuy nhiên, cần phai nhớ rằng các công viêc nay la
không giống nhau mặc dù chúng đều có vẻ tương tự.
TCVN 10669:2014 (ISO 5963:1985) mô ta các cách thức được khuyên dùng khi
phân tích tai liêu, xác định chủ đề của các tai liêu đó va lựa chọn các thuật ngữ định
chỉ mục thích hợp trong các thư viên va cơ quan thông tin va các cơ quan khác ở
Viêt Nam.
TCVN 10669:2014 (ISO 5963:1985) chỉ tập trung vao các giai đoạn ban đầu của viêc
định chỉ mục, va không ban tới cách thực hiên của bất kỳ một hê thống định chỉ mục
cụ thể nao, dù la tiền kết hợp hay hậu kết hợp. Nó cũng mô ta các kỹ thuật chung để
phân tích tai liêu nên áp dụng ở mọi tình huống định chỉ mục. Tuy nhiên, các phương
pháp nay nhắm đến đối tượng đặc biêt la các hê thống định chỉ mục trong đó các
chủ đề của tai liêu được thể hiên ở dạng tóm tắt, va các khái niêm được diễn đạt
bằng các thuật ngữ của một ngôn ngữ định chỉ mục được kiểm soát. Trong ngữ
canh nay, một ngôn ngữ được kiểm soát thường la một tập con của các thuật ngữ
được lựa chọn từ ngôn ngữ tự nhiên, va được điều chỉnh bởi, ví dụ như một từ điển
từ chuẩn. Tuy nhiên, các phương pháp nay cũng áp dụng với những hê thống trong
đó các khái niêm được trình bay với mục đích truy hồi thông tin theo các dấu hiêu
được lựa chọn từ các danh mục của một hê thống phân loại.
Các kỹ thuật được mô ta trong TCVN 10669:2014 (ISO 5963:1985) nay có thể được
sử dụng bởi bất kỳ cơ quan nao trong đó những người định chỉ mục phân tích các
chủ đề của tai liêu va thể hiên các chủ đề nay bằng các thuật ngữ chỉ mục. Các kỹ
thuật nay không áp dụng với những cơ quan sử dụng các kỹ thuật định chỉ mục tự
động, trong đó các thuật ngữ ở dạng văn ban được tổ chức thanh các tập hợp hoặc
các lớp theo các tiêu chí có thể do máy tính thiết lập, ví dụ, số lần xuất hiên va/hoặc
sự liền kề trong văn ban, mặc dù mục đích của các hê thống nay la như nhau.
3.8 NISO TR02-1997, Guidelines for Indexes and Related Information Retrieval Devices.
Tại Mỹ, tiêu chuẩn “Hướng dẫn lập chỉ mục va các công cụ tìm kiếm thông tin có liên
quan” ban hanh năm 1997. Tai liêu do Tổ chức tiêu chuẩn thông tin quốc gia (NISO)
lập va được Viên tiêu chuẩn quốc gia Mỹ (ANSI) công nhận để triển khai các tiêu
chuẩn kỹ thuật cho thư viên, dịch vụ thông tin va xuất ban.
Tiêu chuẩn nay được lập như một tiêu chuẩn của NISO về lập chỉ mục để sửa đổi
tiêu chuẩn ANSI Z39.4-1984 Tiêu chuẩn cơ ban về lập chỉ mục. Mục đích của viêc
sửa đổi la để mở rộng phạm vi của tiêu chuẩn, giai quyết tất ca các loại của các chỉ
mục (điên tử va in ấn, hiển thị va không hiển thị, do người lam va tự động), trong khi
tiêu chuẩn 1984 về chỉ mục tập trung vao các chỉ mục in được tạo ra bởi người lập
chỉ mục.
Tiêu chuẩn được thông qua có chỉnh sửa theo các khuyến nghị của các đại diên
Hiêp hội Thư viên Mỹ, Hội Thông tin khoa học Mỹ, Hội Các nha lập chỉ mục Mỹ, va
các Hiêp hội Thư viên Do Thái.
Tiêu chuẩn kỹ thuật nay danh cho tất ca những người có liên quan đến lập chỉ mục
được sử dụng để tìm kiếm thông tin – người chỉ mục chuyên nghiêp lam viêc với tất
ca các loại tai liêu, người lập cơ sở dữ liêu, các nha xuất ban chỉ mục va các tai liêu
có chứa chỉ mục, các nha thiết kế chỉ mục điên tử va các thuật toán lập chỉ mục, các
thủ thư va người lập biên mục va các người sử dụng chỉ mục khác.
Vì các chỉ mục có phạm vi từ các danh sách đơn gian đến các công cụ rất phức tạp
cho viêc định vị thông tin va vì các loại chỉ mục va phương pháp lập chỉ mục rất đa
dạng, tiêu chuẩn nay phan ánh sự phức tạp va biến thể qua tham chiếu với các
nguyên tắc lập chỉ mục. Nó nhấn mạnh đến ba quy trình cần thiết cho tất ca các chỉ
tiêu: thiết kế toan diên, quan lý vốn từ vựng va cung cấp các cú pháp.
Để giúp người dùng quan tâm đến các loại chỉ mục, tiêu chuẩn đề ra các hướng dẫn
cho các loại chỉ mục sau:
- Chỉ mục in cho các tai liêu đơn gian (bao gồm các chỉ mục cuối sách).
- Các chỉ mục cho cơ sở dữ liêu.
- Các chỉ mục tự động.
- Các chỉ mục cho tìm kiếm điên tử (chỉ mục không hiển thị).
Tiêu chuẩn nay gồm 9 phần:
1. Phạm vi: bao gồm các nguyên tắc để trình bay các chỉ mục in va chỉ mục điên tử
biên soạn bởi con người va bằng thuật toán máy tính cho viêc tìm kiếm tất ca các
loại tai liêu. Nó bao gồm các chỉ mục hiển thị, thiết kế để tìm kiếm bằng các phương
tiên tìm kiếm trực quan va các chỉ mục không hiển thị, thiết kế để tìm kiếm bằng các
phương tiên điên tử.
2. Thuật ngữ va định nghĩa: các thuật ngữ va thuật ngữ bổ sung được định nghĩa
theo bang từ vựng áp dụng cho tiêu chuẩn.
3. Chức năng của chỉ mục: định nghĩa thêm khái niêm chỉ mục được mô ta ở phần
trên trong môi trường tìm kiếm thông tin.
4. Phân loại chỉ mục: phân loại chỉ mục theo các chức năng va định nghĩa được mô
ta ở phần trên.
5. Thiết kế chỉ mục: tóm tắt các thiết kế chỉ mục dựa trên 18 khía cạnh va thuộc tính
quan trọng của chỉ mục. Đối với hầu hết các phần, các hướng dẫn nay không thiên
về các sự lựa chọn cụ thể hoặc tùy chọn ma quyết định lựa chọn:
(a) chủ yếu dựa vao nhu cầu, thói quen, sở thích của người sử dụng;
(b) do nha xuất ban va người lập chỉ mục đồng ý về các lựa chọn thuộc tính trước
khi lập ra chỉ mục;
(c) cho các thuộc tính hoặc lựa chọn đặc biêt được lam rõ cho người sử dụng.
6. Từ vựng: khuyến cáo nguồn va hình thức của từ được sử dụng trong các chỉ mục.
Hướng dẫn nay nhấn mạnh tầm quan trọng của viêc liên kết các từ thay thế va các
dạng từ cho các khái niêm tương tự hoặc giống nhau. Nó đồng thời đề xuất các từ
liên kết cho các khái niêm có liên quan. Trong các chỉ mục hiển thị, viêc hiển thị
thông tin từ vựng nên được tích hợp vao viêc hiển thị các chỉ mục. Trong các chỉ số
không hiển thị, giao diên tìm kiếm sẽ cung cấp cho viêc hiển thị từ vựng va quan hê
từ vựng lúc thủ tục tìm kiếm được tạo ra.
7. Tiêu đề, dẫn mục va thủ tục tìm kiếm: mô ta các phương pháp va hình thức kết
hợp các từ để tạo ra tiêu đề va dẫn mục trong các chỉ mục hiển thị va thủ tục tìm
kiếm trong các chỉ mục không hiển thị.
8. Trình bay chỉ mục: liêt kê các lựa chọn va khuyến nghị cho viêc trình bay các chỉ
mục hoặc các bộ phận của chỉ mục, bao gồm các bang dẫn mục từ chỉ mục hiển thị
hoặc thông tin lấy từ chỉ mục không hiển thị.
9. Sắp xếp chỉ mục: bao gồm các quy tắc sắp xếp các chỉ mục theo thứ tự chữ cái.
4 Xây dựng tiêu chuẩn.4.1 Sở cứ xây dựng tiêu chuẩn
Trước khi xét đến các tai liêu đã phân tích ở Điều 3, như đã đề cập bên trên mục tiêu
la xây dựng được tiêu chuẩn kỹ thuật về quy trình chung được sử dụng để tạo lập
chỉ mục ngược danh cho dữ liêu đặc ta (metadata).
Quy trình tạo lập chỉ mục ngược danh cho dữ liêu đặc ta hoan toan có thể áp dụng
quy trình tạo lập chỉ mục ngược chung, điểm khác biêt có thể thấy đó chính la viêc
sử dụng từ điển chuẩn. Vì vậy, dự thao được xây dựng dựa trên bộ khung ma TCVN
10669:2014 (ISO 5963:1985) đã đưa ra, đồng thời kết hợp với phần kỹ thuật ISO
999:1996. Tuy nhiên với các đặc điểm của TCVN 10669:2014(ISO 5963:1985) va
ISO 999:1996 như đã đề cập ở Điều 3.5 va Điều 3.6 của thuyết minh, nhóm biên
soạn đề nghị bổ sung các kỹ thuật được xây dựng ở tai liêu NISO TR02:1997 (như
Điều 3.7 của thuyết minh) để phù hợp với các mục tiêu: chỉ mục cho cơ sở dữ liêu,
chỉ mục cho tìm kiếm tự động, ..v...v....
Viêc sử dụng từ điển chuẩn như đã phân tích tình hình ở Điều 2 va Điều 3 thuyết
minh, nhóm soạn thao khuyến nghị sử dụng từ điển chuẩn được xây dựng từ
MARC21 va Dublin Core.
Như vậy, các tai liêu sở cứ được nhóm biên soạn sử dụng như sau:
— Về bộ khung sườn của quy trình tạp lập chỉ mục ngược cho dữ liêu đặc ta:
tham khao TCVN 10669:2014 (ISO 5963:1985) Thông tin va tư liêu – Phương pháp
phân tích tai liêu, xác định chủ đề va lựa chọn các thuật ngữ định chỉ mục;
— Về các bước tổ chức nội dung va trình bay bang chỉ mục: tham khao ISO
999:1996, Thông tin va tư liêu – Hướng dẫn về nội dung, tổ chức va trình bay các
bang chỉ mục;
— Về các bước phân tích tai liêu va trình bay bang chỉ mục bằng công cụ phần
mềm va phục vụ tìm kiếm điên tử: tham khao NISO TR02-1997, Guidelines for
Indexes and Related Information Retrieval Devices (Hướng dẫn về chỉ mục va các
thiết bị truy tìm thông tin có liên quan);
— Về các dữ liêu đặc ta được sử dụng lam đầu vao xây dựng từ điển từ chuẩn:
tham khao TCVN 7539:2005: Khổ mẫu MARC 21 cho dữ liêu thư mục; TCVN
7980:2008 (ISO 15836:2003) Thông tin va tai liêu – Bộ phần tử siêu dữ liêu Dublin
Core;
— Về thuật ngữ được sử dụng trong quy trình tạo lập chỉ mục cho dữ liêu đặc ta
tham khao: TCVN 10669:2014 (ISO/IEC 5963:1985); TCVN 5453: 2009 Thông tin
va Tư liêu: Từ vựng; va NIST's Dictionary of Algorithms and Data Structures (Từ điển
thuật toán va cấu trúc dữ liêu của Viên Tiêu chuẩn va Kỹ thuật Quốc gia Mỹ).
4.2 Hinh thức xây dựng tiêu chuẩn.
Tiêu chuẩn được xây dựng theo phương pháp chấp thuận áp dụng các quy định kỹ
thuật của tiêu chuẩn quốc tế. Nội dung của tiêu chuẩn quốc tế được chuyển thanh
nội dung của Tiêu chuẩn kỹ thuật quốc gia, có thay đổi bố cục va hình thức trình bay
cho phù hợp với hướng dẫn xây dựng quy chuẩn kỹ thuật theo thông tư 03/2011/TT-
BTTTT “Quy định hoạt động xây dựng quy chuẩn kỹ thuật quốc gia va tiêu chuẩn
quốc gia thuộc Bộ Thông tin va Truyền thông”
4.3 Cấu trúc tiêu chuẩn
Dự thao tiêu chuẩn bao gồm các phần sau:
Lời nói đầu
1 Phạm vi áp dụng
2 Tai liêu viên dẫn
3 Thuật ngữ va định nghĩa
4 Chức năng của chỉ mục
5 Phân loại chỉ mục
5.1 Chỉ mục theo chủ đề
5.2 Chỉ mục theo tác gia
5.3 Chỉ mục theo tên
5.4 Chỉ mục địa lý
5.5 Chỉ mục theo nhan đề
5.6 Chỉ mục theo số hiêu va mã hiêu
6 Kiểm soát chất lượng
6.1 Chất lượng của chỉ mục
6.2 Độ dai va chi tiết của chỉ mục
6.3 Tính nhất quán trong lập chỉ mục
7 Nội dung va tổ chức chỉ mục
7.1 Cấu trúc va nội dung tổng thể
7.2 Lựa chọn các tiêu đề
7.3 Tên riêng.
7.4 Dấu định vị.
7.5 Tham chiếu chéo.
8 Sắp xếp các tiêu đề chỉ mục
8.1 Trình tự sắp xếp ký tự
8.2 Sắp xếp theo từ va theo chữ cái
8.3 Sắp xếp vừa có chữ va số
8.4 Sắp xếp các tiêu đề chỉ mục
8.5 Các tiêu đề chỉ mục bắt đầu với từ ngữ giống nhau
8.6 Sắp xếp các tiêu đề phụ
9 Trình bay chỉ mục dữ liêu đặc ta
9.1 Trình bay chỉ mục trình duyêt
9.2 Trình bay hồ sơ tìm kiếm
9.3 Từ điển dữ liêu đặc ta
10 Trình bay chỉ mục tai liêu toan văn
10.1 Chuẩn bị ban thao chỉ mục cho xử lý cuối cùng
10.2 Ghi chú dẫn nhập
10.3 Trình bay chỉ mục
10.4 Hỗ trợ tìm kiếm
Tai liêu tham khao
4.4 Nội dung tiêu chuẩn
Nội dung của tiêu chuẩn TCVN II.1.12:2015 “Tiêu chuẩn kỹ thuật tạo lập chỉ mục
(dùng cho metadata va tai liêu toan văn) - Phần 1: Lập chỉ mục cho metadata” được
biên soạn dựa trên tham khao các tiêu chuẩn 10669:2014 (ISO/IEC 5963:1985) va
TCVN 10846:2015 (ISO 999:1996) va NISO/TR 02:1997 với các sửa đổi bổ sung
đưa ra trong bang dưới đây.
Bang 3 – Tham chiêu nội dung dự thao Tiêu chuẩn với tai liệu tham khao.
Dự thao TCVN Tai liệu tham khao
TCVN 10846:2015
Tai liệutham khao
TCVN 10669:2014
Tai liệutham khaoNISO/TR 02:1997
Sửa đổi bổ sung
Tên tiêu chuẩn Tự xây dựng
1. Phạm vi áp dụng Tự xây dựng
2. Tai liêu viên dẫn Tự xây dựng
3. Thuật ngữ va định
nghĩa
3. Thuật ngữ va định
nghĩa
4. Chức năng của chỉ
mục
4 . Chức năng
của một bang chỉ mục
5. Phân loại chỉ mục 5. Dạng bang chỉ
mục
5.1 Chỉ mục theo
chủ đề
5.1 Bang chỉ mục
chủ đề
5.2 Chỉ mục theo
tác gia
5.2 Bang chỉ mục
tác gia
5.3 Chỉ mục theo
tên
5.3 Bang chỉ mục
tên
5.4 Chỉ mục địa lý 5.4 Bang chỉ mục địa
lý
5.5 Chỉ mục theo nhan đề
5.5 Bang chỉ mục nhan đề
5.6 Chỉ mục theo số hiêu va mã hiêu
5.6 Bang chỉ mục số va mã
6. Kiểm soát chất lượng
6. Kiểm soát chất lượng
6.1 Chất lượng của chỉ mục
6.1 Chất lượng của các bang chỉ mục
6.2 Độ dai va chi tiết của chỉ mục
6.2 Độ dai va mức độ chi tiết của các bang chỉ mục
6.3 Tính nhất quán trong lập chỉ mục
6.3 Tính nhất quán trong định chỉ mục
7. Nội dung va tổ chức chỉ mục
7. Nội dung va cách tổ chức chung
7.1 Cấu trúc va nội dung tổng quát
7.1 Cấu trúc va nội dung tổng quát
7.2 Lựa chọn các 7.2 Khái niêm: trình 6. Nhận dạng
tiêu đề bay trong các tiêu đề va phụ đề
(mục 7.2.1,7.2.2)
khái niêm (mục 6.3,6.4)7. Lựa chọn các thuật ngữ định chỉ mục
7.3 Tên riêng 7.3 Tên riêng va các nhan đề tai liêu: lựa chọn va hình thức tiêu đề
7.4 Dấu định vị 7.4 Dấu định vị
8. Cách sắp xếp các
mục từ trong chỉ mục
8. Cách sắp xếp các
mục từ trong chỉ mục
8.1 Trật tự cơ ban
của viêc sắp xếp các ký
tự
8.1 Trật tự cơ ban
của viêc sắp xếp các
ký tự
8.2 Sắp xếp theo
trật tự chữ cái theo
từng từ so với từng ký
tự
8.2 Sắp xếp theo
trật tự chữ cái theo
từng từ so với từng ký
tự
8.3 Sắp xếp chữ va số
8.3 Sắp xếp chữ va số
8.4 Sắp xếp các tiêu đề chỉ mục
8.4 Sắp xếp các tiêu đề chỉ mục
8.5 Tiêu đề chỉ mục bắt đầu bằng cùng một thuật ngữ
8.5 Tiêu đề chỉ mục bắt đầu bằng cùng một thuật ngữ
8.6 Sắp xếp các phụ đề
8.6 Sắp xếp các phụ đề
8.7 Sắp xếp các mục từ chứa tham chiếu chéo
8.7 Sắp xếp các mục từ chứa tham chiếu chéo
9. Trình bay chỉ mục dữ liêu đặc ta
8.3 Index display in electronic media
9.1 Trình bay chỉ mục trình duyêt
8.3.1Browsable index displays
9.2 Trình bay hồ sơ tìm kiếm
8.3.2 Displays of retrieved
records
9.3 Từ điên dữ liêu đặc ta
Tự xây dựng
10 Trình bay chỉ mục tai liêu toan văn
9 Trình bay chỉ mục
10.1 Trình bay ban chỉ mục để xử lý cuối cùng
9.1 Trình bay ban chỉ mục để xử lý cuối cùng
10.2 Ghi chú dẫn nhập
9.2 Ghi chú dẫn nhập
10.3 Trình bay chỉ mục
9.3 Trình bay chỉ mục
10.4 Hỗ trợ tìm kiếm 9.4 Hỗ trợ tìm kiếm (mục 9.4.1)
Tai liệu tham khao
[1] ISO 5963:1985, Documentation — Methods for examining documents determining
their subjects, and selecting indexing terms.
[2] TCVN 10846:2015 (ISO 999:1996) Thông tin va tư liêu – Hướng dẫn về nội dung,
tổ chức va trình bay các bang chỉ mục.
[3] NISO TR02-1997 -- Guidelines for Indexes and Related Information Retrieval
Devices.
[4] ISO 23950:1998, Information and documentation -- Information retrieval (Z39.50)
-- Application service definition and protocol specification
[5] TCVN 5453:2009 - Thông tin va Tư liêu-Từ vựng
[6] TCVN 7980: 2008 - Thông tin va tư liêu – Bộ thuộc tính dự liêu đặc ta Dublin Core
-----------------------------------------------------------------------------