mà ĐỀ tÀi: 2.2.1-cs15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16....
Post on 29-Aug-2019
7 Views
Preview:
TRANSCRIPT
1
NGHIÊN CỨU ĐỀ XUẤT CÁC GIẢI PHÁP TIN HỌC HÓA
TỪ ĐIỂN THỐNG KÊ VIỆT NAM PHỤC VỤ CHO KHAI THÁC,
CẬP NHẬT TRỰC TUYẾN
Cấp đề tài:
Thời gian nghiên cứu:
Đơn vị thực hiện:
Chủ nhiệm:
Cơ sở
2015
Viện Khoa học Thống kê
ThS. Vũ Thị Vân Anh
LỜI NÓI ĐẦU
Từ điển Thống kê Việt Nam (gọi tắt là Từ điển Thống kê) được Tổng cục
Thống kê biên soạn và xuất bản tháng 1 năm 2016 nhằm xây dựng được các từ,
thuật ngữ thống kê chuẩn để tất cả các bên (sản xuất, sử dụng, cung cấp số liệu
thống kê) đều thống nhất hiểu và sử dụng chúng. Từ điển Thống kê với khối lượng
lớn số từ, thuật ngữ (khoảng hơn 2300 từ, thuật ngữ). So với các từ điển chuyên
ngành đây là cuốn từ điển chứa đựng nội dung kiến thức rộng, sâu đối với chuyên
ngành thống kê và cả các ngành liên quan khác. Cuốn Từ điển Thống kê cần được
phổ biến rộng rãi, thuận tiện trong việc tra cứu đối với cán bộ trong và ngoài ngành
Thống kê và các đối tượng dùng tin khác. Ngày nay, Công nghệ thông tin và truyền
thông (CNTT-TT) phát triển không ngừng và đạt những thành tựu đáng kể trong hầu
hết các lĩnh vực, hoạt động trong đó có việc khai thác, tra cứu các nguồn tài liệu
sách. Thực tế cho thấy việc tra cứu các nguồn tài liệu nhờ công nghệ thông tin
(CNTT) trở nên phong phú và dễ dàng. Tài liệu không chỉ biểu hiện bằng giấy mà
còn lưu trữ dạng sách điện tử hay các công cụ tra cứu trực tuyến, nó vừa đáp ứng
nhu cầu người dùng và tiết kiệm đối với người sử dụng. Vì vậy, Viện Khoa học
Thống kê (KHTK) đã đề xuất nghiên cứu đề tài: Nghiên cứu đề xuất các giải pháp
tin học hóa Từ điển Thống kê Việt Nam phục vụ cho khai thác, cập nhật trực
tuyến nhằm mục đích đó.
Trong giai đoạn đầu nghiên cứu, Ban chủ nhiệm đề tài (BCN) tìm hiểu các
công trình nghiên cứu có liên quan để làm tài liệu tham khảo cho đề tài. Tuy nhiên
đây là một loại đề tài mang tính đặc thù sử dụng cho ngành Thống kê nên không tìm
được nhiều nghiên cứu phục vụ cho mục đích chính của đề tài. Các nghiên cứu có
thể sử dụng tham khảo tìm thấy, bao gồm:
MÃ ĐỀ TÀI: 2.2.1-CS15
2
(1) Đề tài “Nghiên cứu và đề xuất giải pháp công nghệ tin học hóa công tác xử
lý số liệu thống kê tháng, quý, năm do các Cục Thống kê thực hiện” do TS. Thiều
Văn Tiến, Tổng cục Thống kê làm chủ nhiệm đề tài.
(2) Nghiên cứu khoa học “Giải pháp xây dựng các bộ sưu tập tài liệu số” của
PGS.TS. Hoàng Đức Liên và Nguyễn Hữu Ty, Trung tâm Thông tin - Thư viện Đại
học Nông nghiệp I, đưa ra những giải pháp về tài liệu số.
(3) Bài viết “Củng cố kho thông tin tư liệu khoa học thống kê kết hợp tin học
hóa” của CN. Hoàng Minh Thiện, nguyên Quyền Giám đốc Trung tâm Thông tin
khoa học Thống kê đưa ra một số giải pháp để kết hợp tin học hóa với nguồn thông
tin khoa học thống kê.
(4) Luận án tiến sĩ “Tin học hóa quá trình quản lý hồ sơ tư vấn cho các công ty
tư vấn Bộ Xây dựng” của tác giả Nguyễn Thị Bạch Tuyết.
Như vậy, các nghiên cứu nêu trên đâu đó nhắc đến khái niệm “tin học hóa”
nhưng cho những nội dung khác với nội dung nghiên cứu đề tài, trên cơ sở những tài
liệu đó, BCN đề tài xác định rõ một số điểm chính như sau:
1. Mục đích của đề tài
Kết quả của đề tài là cơ sở nghiên cứu khoa học để xây dựng Phần mềm tra
cứu Từ điển Thống kê trực tuyến.
2. Mục tiêu tổng quát và mục tiêu chi tiết của đề tài
Mục tiêu tổng quát
Đề xuất các giải pháp tin học hóa cuốn Từ điển Thống kê. Đó là những giải
pháp sẽ phục vụ trực tiếp cho xây dựng Phần mềm tra cứu cuốn Từ điển Thống kê.
Mục tiêu chi tiết
Nghiên cứu rà soát cuốn Từ điển Thống kê, đánh giá hiện trạng công nghệ
thông tin, tìm hiểu các phần mềm tra cứu từ điển để đưa ra các nhóm giải pháp về
công nghệ, giải pháp nghiệp vụ và tổ chức thực hiện tin học hóa Từ điển Thống kê.
3. Phạm vi nghiên cứu
- Cuốn Từ điển Thống kê;
- Website tra cứu từ điển, các giải pháp tin học hóa sách, tài liệu.
4. Nội dung nghiên cứu
(1) Nghiên cứu kinh nghiệm trong và ngoài nước về tin học hóa Từ điển, sách
khoa học, sách tra cứu, tư liệu; (2) Rà soát và đề xuất nội dung hoàn thiện cuốn Từ
điển Thống kê Việt Nam; (3) Đánh giá nền tảng Công nghệ thông tin của Tổng cục
Thống kê và Viện Khoa học Thống kê phục vụ tin học hóa Từ điển Thống kê; (4)
3
Đề xuất nội dung, công nghệ, quy trình quản lý, cập nhật của Phần mềm tra cứu Từ
điển Thống kê trực tuyến.
5. Phƣơng pháp nghiên cứu
- Nghiên cứu tài liệu về tin học hóa từ điển, sách, tài liệu;
- Nghiên cứu phi thực nghiệm một số Website về tra cứu từ điển;
- Nghiên cứu thực nghiệm cuốn Từ điển Thống kê.
6. Những đóng góp mới của đề tài
(1) Đưa ra những ví dụ thực hiện về các phần mềm tra cứu từ điển trực tuyến
trong và ngoài nước; (2) Rà soát một số điểm của Từ điển Thống kê, đề xuất hướng
xây dựng cơ sở dữ liệu về cuốn Từ điển Thống kê phục vụ xây dựng phần mềm tra
cứu sau này; (3) Đánh giá nền tảng CNTT của Viện KHTK, đồng thời đưa ra các yêu
cầu về CNTT để đảm bảo việc xây dựng phần mềm; (4) Mô phỏng Phần mềm tra cứu
trực tuyến cuốn Từ điển Thống kê.
7. Bố cục của báo cáo tổng hợp đề tài
Báo cáo tổng hợp đề tài ngoài phần mở đầu, kết luận, khuyến nghị, tài liệu
tham khảo, đề tài gồm có 3 chương, đó là:
Chương 1. Các vấn đề chung về tin học hóa, tin học hóa Từ điển Thống kê;
Chương 2. Đề xuất các giải pháp công nghệ phục vụ tin học hóa Từ điển Thống
kê; Chương 3. Đề xuất giải pháp nghiệp vụ và tổ chức thực hiện tin học hóa Từ điển
Thống kê;
BCN đề tài xin trân trọng cảm ơn các Hội đồng xét duyệt đề cương, Hội đồng
nghiệm thu đề tài để có góp ý, gợi ý, định hướng hoàn thiện đề tài; trân trọng cảm
ơn các thành viên nghiên cứu chính đã đóng góp nội dung không thể thiếu của đề tài,
trân trọng cảm ơn Viện Khoa học Thống kê đặc biệt là Lãnh đạo Viện KHTK,
Phòng Quản lý khoa học và chất lượng Thống kê đã tạo điều kiện giúp BCN đề tài
hoàn thành đề tài này.
CHƢƠNG 1
CÁC VẤN ĐỀ CHUNG VỀ TIN HỌC HÓA,
TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ
Chương này tập trung trình bày những nội dung tóm tắt có tính chất cơ sở
thực tiễn về việc tin học hóa Từ điển Thống kê. Xu hướng trong và ngoài nước về
công nghệ thông tin trên các lĩnh vực đặc biệt thông tin thống kê. Một nội dung
quan trọng nữa là trình bày kinh nghiệm trong và ngoài nước về các phần mềm tra
cứu Từ điển.
4
1.1. KHÁI NIỆM VỀ TIN HỌC HÓA, GIẢI PHÁP TIN HỌC HÓA
1.1.1. Khái niệm tin học hóa
Tóm lược một số định nghĩa tin học hóa như sau:
(1) Tin học hóa là quá trình ứng dụng công nghệ thông tin (CNTT) trong các
hoạt động của nền kinh tế - xã hội1.
(2) Tin học hóa thông tin thư viện là xây dựng cơ sở dữ liệu (CSDL) thư mục,
xây dựng cơ sở dữ liệu toàn văn, số hóa tư liệu ảnh, xây dựng mang LAN, thu thập
thông tin bằng internet2,...
(3) Tin học hóa công tác xử lý số liệu thống kê nói chung và số liệu tổng điều
tra, điều tra thống kê là hoạt động xử lý dựa trên các phần mềm, và phần mềm tự
phát triển. Tóm lại việc tin học hóa hoá công tác xử lý số liệu điều tra là việc sử
dụng các phần mềm ứng dụng3.
(4) Tìm hiểu khái niệm tin học hóa bằng tiếng anh “Computerization”, được
định nghĩa chung nhất là việc kiểm soát các quy trình bằng máy tính4.
Đối với quan niệm của BCN đề tài, tin học hóa Từ điển Thống kê là xây dựng
Phần mềm tra cứu Từ điển Thống kê. Phần mềm tra cứu là trang web tra cứu trực
tuyến Từ điển Thống kê.
1.1.2. Giải pháp tin học hóa
Tùy khái niệm tin học hóa mà đưa ra những giải pháp tin học hóa. Giải pháp
tin học hóa là việc đáp ứng các yêu cầu về tin học hóa.
Trong Đề tài “Nghiên cứu và đề xuất giải pháp công nghệ tin học hóa công
tác xử lý số liệu thống kê tháng, quý, năm do các Cục Thống kê thực hiện”, tác giả
đưa ra các giải pháp: Xây dựng hệ CSDL dữ liệu điều tra thống kê; xây dựng
CSDL Metadata lưu giữ thông tin về dữ liệu điều tra thống kê; nghiên cứu thử
nghiệm và áp dụng một số công nghệ mới trong thu thập và xử lý số liệu điều tra;
đưa ra những yêu cầu và chức năng cần phải có đối với hệ chương trình xử lý điều
tra thống kê;
Trong kết quả nghiên cứu khoa học “Giải pháp xây dựng các bộ sưu tập tài
liệu số” của PGS.TS. Hoàng Đức Liên và Nguyễn Hữu Ty, Trung tâm Thông tin -
Thư viện Đại học Nông nghiệp I, đưa ra những giải pháp bề tài liệu số gồm: Lựa
1 Luận án tiến sĩ “Tin học hóa quá trình quản lý hồ sơ tư vấn cho các công ty tư vấn Bộ Xây dựng”
của tác giả Nguyễn Thị Bạch Tuyết. 2 Bài viết “Tin học hóa hoạt động thông tin – thư viện tại Viện dân tộc học” của tác giả Nguyễn Thị
Hồng Nhị. 3 Tổng hợp từ Đề tài “Nghiên cứu và đề xuất giải pháp công nghệ tin học hóa công tác xử lý số liệu
thống kê tháng, quý, năm do các Cục Thống kê thực hiện” do TS.Thiều Văn Tiến, Tổng cục Thống
kê làm chủ nhiệm đề tài. 4 Định nghĩa từ từ điển “Mnemonic Dictionary”.
5
chọn tài liệu đầu vào; lựa chọn công nghệ thực hiện; số hóa nguồn tài liệu; tạo siêu
dữ liệu liên kết; vận hành, bảo quản và cung cấp dữ liệu; xuất, nhập dữ liệu từ bên
ngoài để trao đổi.
Đối với đề tài, BCN sẽ đưa ra các giải pháp để xây dựng trang web tra cứu
Từ điển Thống kê bao gồm các nhóm giải pháp về CNTT, giải pháp về nghiệp vụ
và tổ chức thực hiện tin học hóa Từ điển Thống kê, cụ thể các chương II, chương
III của đề tài).
1.2. XU HƯỚNG ỨNG DỤNG CNTT TRONG LĨNH VỰC TRA CỨU
THÔNG TIN TRỰC TUYẾN Ở TRONG VÀ NGOÀI NƯỚC
1.2.1. Xu hƣớng ứng dụng CNTT trên thế giới của các lĩnh vực trong
những năm gần đây
Máy tính sẽ dần thay thế các sách giáo khoa bằng chính các máy tính nhỏ gọn,
cầm tay, đặt phẳng trên ngay mặt bàn, có nối mạng khắp nơi, tương tác tự nhiên
(chứ không chỉ qua chuột và bàn phím như thập niên vừa qua). Người dùng có thể
tham gia các loại hình hoạt động sử dụng phương tiện điện tử, gọi chung là e-* (như
e-books, e-learning, e-education, e-library,…) ở mọi lúc, mọi nơi. Bên cạnh đó,
những ứng dụng khác như dịch vụ tra cứu thông tin trực tuyến cũng sẽ được chú
trọng trong hiện tại và tương lai.
1.2.2. Xu hƣớng ứng dụng CNTT trên thế giới trong tra cứu Từ điển
Thống kê trực tuyến
- Ứng dụng công nghệ mới vào công tác thống kê phục vụ công việc chia sẻ dữ
liệu thống kê trực tuyến qua mạng toàn cầu, chia sẻ các báo cáo thống kê qua các
phương tiện CNTT hiện đại, giúp người dùng có thể tra cứu ở mọi nơi, mọi lúc
thông qua các thiết bị thông minh có kết nối mạng internet.
- Ứng dụng các dịch vụ xử lý số liệu trực tuyến vào công tác thống kê thế giới
ngày càng thay đổi từ mức ban đầu chỉ là gửi thư điện tử kết quả số liệu thống kê
dạng kích cỡ vài Byte đến nay có thể gửi thư lên đến hàng trăm Mb hoặc tài liệu thư
có thể lên đến Giga byte.
- Ứng dụng công nghệ tiên tiến, máy tính chuyên dụng phục vụ công tác làm
thống kê và quản lý và khai thác tra cứu thông tin thống kê.
- Ứng dụng những cải tiến về thiết bị CNTT để làm giảm thời gian xử lý số
liệu thống kê và nâng cao độ chính xác của kết quả thống kê.
- Kết quả của một số chương trình ứng dụng CNTT xây dựng phần mềm sử
dụng tra cứu từ điển trực tuyến tiêu biểu được một số quốc qia và tổ chức trên thế
giới thiết kế và sử dụng tra cứu thông tin thống kê như:
+ Chương trình tra cứu các thuật ngữ thống kê “Glossary of statistical iterms”;
6
+ Tra cứu trực tuyến Cuốn Từ điển “Oxford Dictionary of Statistics”;
+ Tra cứu trực tuyến của Stat Trek;
+ Trang tra cứu Web: http://www.statsoft.com/textbook/statistics-glossary/.
1.2.3. Xu hƣớng ứng dụng CNTT trong lĩnh vực tra cứu thông tin trực
tuyến tại Việt Nam
1.2.3.1. Xu hướng phát triển chung về CNTT trong tất cả các ngành, lĩnh
vực theo định hướng của Chính phủ Việt Nam
Chính phủ nước ta đã ban hành “Chiến lược phát triển CNTT- TT thông Việt
Nam đến năm 2010 và định hướng đến năm 2020” tại Quyết định số 246/2005/QĐ-
TTg ngày 6/10/2005 của Thủ tướng chính phủ. CNTT-TT sẽ bùng nổ tiếp và ngày
càng tiến tới phục vụ hữu ích hơn, đa dạng hơn những nhu cầu của con người và là
động lực thúc đẩy tiến bộ xã hội và nâng cao chất lượng cuộc sống. CNTT-TT có ý
nghĩa đặc biệt trong giáo dục. Sự tác động này sẽ còn tiếp tục làm sâu sắc thêm ý
nghĩa của CNTT-TT trong trong tương lai.
1.2.3.2. Xu hướng ứng dụng CNTT trong các hoạt động khai thác tra cứu
thông tin trực tuyến tại Tổng cục Thống kê
Hướng đến một hệ thống tổ chức Thống kê hoàn chỉnh là cả quá trình lâu dài
đòi hỏi sự kế thừa, kết hợp đồng bộ giữa kế hoạch và thực hiện kế hoạch. Việc tăng
cường ứng dụng CNTT gắn liền với quá trình cải tiến về sản phẩm.
Ứng dụng CNTT trong hệ thống cơ quan chuyên trách về CNTT của Tổng cục
Thống kê và các cơ quan khác trong hệ thống tạo nên hệ thống hỗ trợ nhau cùng
phát triển ứng dụng CNTT.
Phát triển và vận dụng sao cho phù hợp với công việc và điều kiện của ngành
Thống kê đó là: Luôn thay đổi các trang thiết bị tiên tiến ứng dụng vào quản lý xây
dựng CSDL Thống kê nhằm mục đích mở rộng cơ sở hạ tầng CNTT về lưu trữ dữ
liệu thống kê, quản lý dữ liệu một cách dễ dàng hơn; cải tiến các phần mềm quản lý
để phù hợp với các yếu cầu đặt ra với công viêc xây dựng chương trình trong thời
điểm hiện tại và trong tương lai; tạo ra các sản phẩm ứng dụng khác từ các sản phẩm
CNTT hiện có để đáp ứng nhu cầu của các Ngành nghề khác trong xã hội; nâng cao
chất lượng sản phẩm CNTT bằng phương pháp đưa thêm nhiều dịch vụ mới hỗ trợ
người dùng vào các chương trình phần mềm nhằm tạo ra các sản phẩm đa chức năng
CNTT.
1.3. KINH NGHIỆM XÂY DỰNG PHẦN MỀM TRA CỨU THÔNG TIN Ở
TRONG VÀ NGOÀI NƯỚC
Nằm trong phạm vi của đề tài này, BCN nghiên cứu, tìm hiểu và xin giới thiệu
một số ít Phầm mềm tra cứu trực tuyến phổ biến, liên quan đến lĩnh vực Thống kê làm
kinh nghiệm để xây dựng Phần mềm tra cứu cuốn Từ điển Thống kê.
7
1.3.1. Hệ thống Hệ thống Bảng thuật ngữ OECD
Hệ thống Bảng thuật ngữ OECD tên tiếng anh là “The OECD Glossary of
Statistical Terms” là website được đăng tải tại trang web:
https://stats.oecd.org/glossary/index.htm, tạm dịch là Bảng thuật ngữ thống kê của
OECD (Bảng thuật ngữ). Đây được xem như nguồn thông tin vô cùng phong phú về
6934 tiêu đề (từ/thuật ngữ/cụm từ…) có liên quan đến thống kê. Người đọc có thể
tra cứu, sao chép một cách dễ dàng, hữu ích. Ban chủ nhiệm đề tài xem trang web
như tài liệu tham khảo để tìm ra giải pháp cho tin học hóa cuốn Từ điển Thống kê.
Một số điểm nổi bật như sau:
1.3.1.1. Giao diện của Hệ thống Bảng thuật ngữ OECD
1.3.1.2. Giới thiệu chung về Hệ thống Bảng thuật ngữ
(1) Giới thiệu Bảng thuật ngữ
(2) Cách sử dụng Bảng thuật ngữ OECD
(3) Cấu trúc của Bảng thuật ngữ OECD
(4) Các link về nguồn tham khảo trên internet
(5) Hoạt động sắp tới của Bảng thuật ngữ OECD
(6) Link liên quan đến các Bảng thuật ngữ khác có trên internet
1.3.1.3. Tra cứu thuật ngữ trong Hệ thống Bảng thuật ngữ OECD
(1) Tra cứu bằng cách đánh tiêu đề bất kỳ
(2) Tra cứu nâng cao
1.3.2. Hệ thống tra cứu từ điển trực tuyến cuốn Từ điển Thống kê của
Oxford
Từ điển Thống kê Oxford, tên tiếng anh“Oxford Dictionary of Statistics” là một
từ điển chuyên ngành Thống kê đã được tái bản 3 lần, lần tái bản gần đây nhất năm
2014, hiện tại cuốn từ điển này đã được tra cứu trực tuyến tại trang web:
http://www.oxfordreference.com/view/10.1093/acref/9780199679188.001.0001/acre
f-9780199679188.
1.3.3. Tra cứu Thuật ngữ Thống kê thuộc Sổ tay điện tử của STATISTICA
Các mục trong Bảng thuật ngữ Thống kê được lấy từ Sổ tay điện tử của
STATISTICA, có tại trang Web http://www.statsoft.com/Textbook/Statistics-
Glossary. StatSoft đã cung cấp miễn phí Sách Thống kê điện tử từ năm 1995. Sách
thống kê điện tử bắt đầu với từ việc tổng quan về các khái niệm cơ bản có liên quan
về các lĩnh vực thống kê cụ thể. Một bảng chú giải các thuật ngữ thống kê và danh
sách các tài liệu tham khảo để nghiên cứu sâu hơn được đưa vào từ điển.
8
1.3.4. Phần mềm Tra cứu thuật ngữ thống kê
Năm 2007, Tổng cục Thống kê phát hành cuốn Từ điển Thống kê Việt - Pháp -
Anh (gọi tắt là Từ điển Thống kê ba thứ tiếng) nhằm phục vụ cho yêu cầu phát triển
công tác thống kê trong điều kiện cơ chế thị trường và mở rộng hợp tác quốc tế.
Cuốn Từ điển thống kê ba thứ tiếng có 3.601 thuật ngữ, được chia ra theo 7 nhóm
nghiệp vụ. Trên cơ sở cuốn Từ điển Thống kê ba thứ tiếng, Tổng cục Thống kê thiết
kế tra cứu thuật ngữ thống kê có thể truy cập dễ dàng để tìm kiếm tại địa chỉ:
http://portal.thongke.gov.vn/TudienTK/default.asp?language=VN.
1.3.5. Tra cứu Từ điển Y học
Từ điển trực tuyến y học cung cấp các thuật ngữ thông dụng về y học cho các
cán bộ nghiên cứu, giảng viên, sinh viên và các đối tượng quan tâm nhằm phục vụ
cho các hoạt động, học tập nghiên cứu. Từ điển trực tuyến được xây dựng từ các
nguồn thông tin: Từ điển Y học Anh Việt của nhà xuất bản Y học; Từ điển Y học
Anh Việt của nhà xuất bản Thanh Hoá; Từ điển Anh Việt của Viện khoa học xã hội
Việt Nam; Từ điển Oxford.
Trên cơ sở năm phần mềm đã nghiên cứu, tìm hiểu được, BCN đã định hướng
những vấn đề lớn cần đưa ra các giải pháp cụ thể làm cách nào để khi xây dựng tin
học hóa cuốn Từ điển Thống kê được hiệu quả nhất.
CHƢƠNG 2
ĐỀ XUẤT CÁC GIẢI PHÁP CÔNG NGHỆ
PHỤC VỤ TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ
Chương này sẽ đưa ra đánh giá thực trạng cơ sở hạ tầng phục vụ cho việc tin
học hóa Từ điển Thống kê. Từ đó đưa ra giải pháp công nghệ.
2.1. HIỆN TRẠNG ỨNG DỤNG CÔNG NGHỆ THÔNG TIN NGÀNH
THỐNG KÊ5
Đề tài đánh giá nền tảng CNTT của Tổng cục thống kê và của Viện KHTK vì
Viện KHTK là đơn vị chủ trì biên soạn Từ điển Thống kê, được phân công nghiên
cứu tin học hóa cuốn Từ điển Thống kê, có thể đề xuất Viện KHTK được tiếp quản
công việc nếu như Từ điển Thống kê được tin học hóa.
2.1.1. Hiện trạng công nghệ thông tin chung của toàn Ngành
Hiện trạng CNTT đã được Vụ Phương pháp chế độ Thống kê và Công nghệ
thông tin báo cáo hàng năm. Vì vậy, BCN đề tài không trực tiếp đánh giá hiện trạng
5 Báo cáo Hiện trạng ứng dụng Công nghệ thông tin ngành Thống kê và định hướng phát triển đến
năm 2025;
9
CNTT. BCN đề tài trích lại báo cáo về hiện trạng CNTT năm 2015 để làm tư liệu.
Đánh giá bao gồm những điểm sau: (1) Thiết bị mạng; (2) Máy chủ; (3) Máy trạm;
(4) Thiết bị lưu trữ; (5) Hệ thống điện và giám sát; (6) Kết nối; (7) Phần mềm hệ
thống; (8) Các dịch vụ; (9) Hiện trạng Chương trình ứng dụng và Cơ sở dữ liệu; (10)
Tồn tại, hạn chế về hạ tầng công nghệ thông tin. Hạn chế cụ thể sau:
(i) Tình trạng các thiết bị
• Các thiết bị được trang bị đồng bộ nhưng tính sẵn sàng chưa cao vì không có
thiết bị dự phòng. Tại các vị trí quan trọng liên quan đến hoạt động của toàn bộ hệ
thống đều là các điểm đơn (singlepoint) nên khi xảy ra sự cố rất khó khắc phục.
• Hệ thống lưu trữ bằng tủ đĩa đến nay đã cũ, tốc độ và dung lượng thấp, không
đáp ứng được yêu cầu lưu trữ dữ liệu của Ngành.
• Hệ thống lưu điện: Đã được trang bị từ lâu nên hệ thống ắc quy có khả năng
lưu điện rất thấp, không đảm bảo an toàn khi mất điện lưới.
(ii) Đảm bảo an toàn an ninh mạng
• Các thiết bị tường lửa (firewall) đều đã hết bản quyền dẫn đến việc phòng
chống tấn công đảm bảo an toàn, an ninh mạng rất khó khăn.
• Hệ thống không có thiết bị hay phần mềm chuyên biệt để phòng chống thư rác.
• Số lượng người sử dụng email trong Ngành ngày càng tăng song dung lượng
lưu trữ để đáp ứng cho dịch vụ lại rất ít (chỉ chạy trên ổ cứng của máy chủ) dẫn đến
việc truy cập vào mail box rất chậm đồng thời gây mất an toàn.
• Do số lượng người dùng nhiều, một số sử dụng không đúng mục đích phục
vụ công việc, tốc độ đường truyền hạn chế, đồng thời người sử dụng USB chứa
nhiều virut hoặc tự động cắm thêm bộ phát sóng không dây (wireless) nên xảy ra
tình trạng chiếm nhiều băng thông gây tắc nghẽn đường truyền hoặc có nguy cơ cao
trong việc bị tấn công từ bên ngoài.
(iii) Các vấn đề khác
Mặc dù vẫn còn hạn chế nêu trên, nhưng việc đưa thêm một phần mềm tra cứu
vào không làm quá tải hệ thống, ảnh hưởng nhiều vấn đề khác.
2.1.2. Đánh giá nền tảng công nghệ thông tin của Viện Khoa học Thống kê
Trong thời gian và phạm vi giới hạn đề tài này nên nhóm tác giả chỉ thực hiện
trong phạm vi khảo sát cơ sở hạ tầng CNTT đáp ứng việc xây dựng phần mêm tra cứu
Từ điển Thống kê trực tuyến của Viện Khoa học Thống kê. Đánh giá các điểm sau:
(1) Phần cứng gồm: Máy chủ; máy trạm; thiết bị lưu trữ; thiết bị mạng;
firewall; hệ thống cung cấp điện (UPS); hệ thống theo dõi, giám sát.
10
(2) Phần mềm, gồm: Hệ điều hành máy chủ; hệ quản trị cơ sở dữ liệu; công cụ
phát triển ứng dụng; các phần mềm khác; cài đặt hệ điều hành máy chủ.
2.1.3. Yêu cầu về cơ sở hạ tầng công nghệ thông tin đáp ứng việc tin học
hóa Từ điển Thống kê
2.1.3.1. Yêu cầu về công nghệ thiết bị
Với số lượng người dùng toàn ngành Thống kê khá lớn và những người ngoài
ngành dùng đến các dữ liệu thống kê cũng ngày một tăng, điều này được kiểm chứng
thông qua trang website của Tổng cục Thống kê, của Viện Khoa học Thống kê. Để
giải quyết vấn đề đó thì một hệ thống quản lý và phân quyền người sử dụng phải
được xây dựng và quản lý một cách thống nhất. Từ mặt thiết bị đến công nghệ phải
đồng bộ với yêu cầu về phần thiết bị đi kèm. Có như vậy thì mới đảm bảo được việc
triển khai các ứng dụng, các chương trình quản lý đạt yêu cầu như kế hoạch đề ra.
2.1.3.2. Yêu cầu về công nghệ quản trị hệ thống thông tin
An toàn, bảo mật thông tin, cơ sở dữ liệu
- Trước tiên nói về một số tiêu chí của công việc bảo mật CSDL;
- Để bảo mật thông tin truyền trên mạng, người ta sử dụng các phương pháp
mã hoá (encryption). Dữ liệu được biến đổi từ dạng nhận thức được sang dạng
không nhận thức được theo một thuật toán nào đó (tạo mật mã) và sẽ được biến đổi
ngược lại (giải mã) ở trạm nhận. Đây là một lớp bảo vệ thông tin rất quan trọng và
được sử dụng rộng rãi trong môi trường mạng;
- Cập nhật dữ liệu.
2.2. ĐỀ XUẤT CÁC GIẢI PHÁP CÔNG NGHỆ
2.2.1. Lựa chọn kiến trúc CNTT phục vụ chƣơng trình chạy Phần mềm
tra cứu Từ điển Thống kê trực tuyến
2.2.2. Hoàn thiện cơ sở hạ tầng CNTT
- Hiện tại, máy chủ hiện có hoạt động không ổn định, dung lượng hạn chế,
không đủ để đáp ứng công việc, do đó cần phải nâng cấp máy chủ hiện nay này
nhằm tăng khả năng lưu trữ dữ liệu cho hệ thống: Cần xây dựng thêm hệ thống dự
phòng; Cần xây dựng ngay hệ thống tường lửa để có thể tránh được các nguy cơ mất
an toàn dữ liệu; Phải trang bị thiết bị lưu trữ càng sớm càng tốt; Tăng thêm các
đường truyền phụ để đảm bảo tính ổn định của hệ thống; Hệ thống cung cấp nguồn
điện cần phải thay thế hoặc trang bị thêm thiết bị lưu điện. Hệ thống thiết bị giám sát
hoạt động và theo dõi môi trường cần phải được trang bị giúp có thể theo dõi trạng
thái của hệ thống để đảm bảo hệ thống được hoạt động theo dự kiến.
- Hiện tại với những phân tích trên về cơ sở hạ tầng CNTT trên, nếu Phần mềm
11
cài đặt trên web của Viện KHTK, thì cần nghiên cứu lại phương án tối ưu giữa thuê
và đầu tư mới.
- Xây dựng quy chế Môi trường hoạt động.
2.2.3. Lựa chọn công nghệ, phần mềm để xây dựng Phần mềm Từ điển
Thống kê trực tuyến
Từ điển Thống kê trực tuyến nên sử dụng hướng phát triển ứng dụng trên nền
Web. Căn cứ số lượng thuật ngữ của Từ điển, đề xuất sử dụng công nghệ như sau:
(1) Máy chủ triển khai
(2) Cơ sở dữ liệu
Các chương trình thuộc loại này hỗ trợ khả năng lưu trữ, sửa chữa, xóa và tìm
kiếm thông tin trong một cơ sở dữ liệu (CSDL). Tuy nhiên, đa số hệ quản trị CSDL
trên thị trường đều có một đặc điểm chung là sử dụng ngôn ngữ truy vấn theo cấu
trúc mà tiếng Anh gọi là Structured Query Language (SQL). Phần lớn các hệ quản
trị CSDL kể trên hoạt động tốt trên nhiều hệ điều hành khác nhau như: Linux, Unix
và MacOS ngoại trừ SQL Server của Microsoft chỉ chạy trên hệ điều hành
Windows.
- MySQL là cơ sở dữ liệu mã nguồn mở phổ biến nhất do sự ổn định và cơ chế
xử lý nhanh, được nhiều người sử dụng và đáng tin cậy, cũng sử dụng MySQL để
tiết kiệm thời gian và chi phí đối với các website có dung lượng lớn. Ngoài ưu điểm
là mã nguồn mở phổ biến nhất, MySQL còn là cơ sở dữ liệu được chọn cho các ứng
dụng xây dựng trên nền Linux, Apache,… chạy trên nhiều flatform có thể linh hoạt
trong việc sử dụng.
- SQL Server, hiện nay Tổng cục Thống kê đang sử dụng hệ quản trị SQL
Server và định hướng giai đoạn 2016-2020 vẫn tiếp tục sử dụng hệ quản trị này. Nếu
web tra cứu Từ điển Thống kê đặt tại web
http://www.gso.gov.vn/Default.aspx?tabid=217 thì lựa chọn SQL Server là ưu tiên
hàng đầu.
2.2.4. Ngôn ngữ lập trình để triển khai và Framework
- Ngôn ngữ lập trình
Khi lập kế hoạch cho một giải pháp phần mềm, có nhiều ngôn ngữ lập trình
khác nhau để lựa chọn. Sự lựa chọn của bạn có thể phụ thuộc vào nhiều nhân tố.
Nếu sự lựa chọn của bạn phải phụ thuộc vào những gì sẵn có thì có thể bạn sẽ phải
miễn cưỡng chấp nhận và tiếp cận một cách không dễ dàng. Hoặc sẽ tốn nhiều thời
gian để phát triển lại các thành phần mà lẽ ra có thể tái sử dụng được, điều này khiến
cho các tài liệu trở thành khó khăn rất lớn. Với quy mô web nhỏ thì lựa chọn ngôn
ngữ PHP là phù hợp nhất.
12
- Framework Laravel để phát triển
Để có lập trình Web thì cần thiết có Framework, lựa chọn Framework Laravel
là PHP framework hot nhất hiện nay, phù hợp với web nhỏ và đơn giản như
Web đề xuất.
CHƢƠNG 3
ĐỀ XUẤT GIẢI PHÁP NGHIỆP VỤ VÀ
TỔ CHỨC THỰC HIỆN TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ
Đây là chương quan trọng nhất của Đề tài, ngoài những giải pháp tin học thì
giải pháp nghiệp vụ và tổ chức thực hiện như thế nào để có thể thực hiện được việc
tin học hóa là nhiệm vụ trọng tâm và không thể thiếu.
3.1. ĐỀ XUẤT GIẢI PHÁP NGHIỆP VỤ TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ
3.1.1. Rà soát nội dung cuốn Từ điển Thống kê
Từ điển Thống kê bao gồm 2300 từ, thuật ngữ thống kê được kết cấu thành 3
phần chính, bao gồm: Phần I. Lý thuyết thống kê, toán, tin học ứng dụng trong thống
kê; Phần II. Thống kê kinh tế; và Phần III. Thống kê Xã hội và môi trường. Trong
mỗi phần lại được sắp xếp theo lĩnh vực liên quan. Phần I bao gồm 3 lĩnh vực. Phần
II bao gồm 6 lĩnh vực. Phần III bao gồm 9 lĩnh vực. Bên cạnh các nội dung chính,
Từ điển Thống kê còn đưa ra bảng tra cứu thuật ngữ Anh - Việt, tên tiếng anh của
2300 từ, thuật ngữ đã được biên soạn cẩn thận dựa trên tài liệu sẵn có. Để phục vụ
cho mục tiêu đặt ra của đề tài, BCN đề tài đưa ra những nội dung rà soát bao gồm
những vấn đề cụ thể sau:
3.1.1.1. Số lượng từ, thuật ngữ theo vần Anphabeta
Tổng số từ, thuật ngữ của cuốn Từ điển Thống kê là 2300, trong đó số lượng từ
phân loại theo chữ cái chi tiết theo bảng sau:
Bảng 3.1: Số lượng từ, thuật ngữ của Từ điển Thống kê theo vần Anphabeta
(Chi tiết tại báo cáo tổng hợp)
3.1.1.2. Số lượng từ, thuật ngữ thống kê theo cấu trúc từ
Trong cuốn Từ điển Thống kê này, hầu hết các từ được giải thích theo cấu
trúc bao gồm những nội dung như: khái niệm, ý nghĩa, ví dụ, công thức tính (nếu
có). Để định lượng được chính xác, BCN đề tài phân thành 3 loại như sau:
Loại 1: Từ thuật ngữ chỉ đưa ra khái niệm
Loại 2: Từ, thuật ngữ có khái niệm, ví dụ nhưng không có công thức tính
Loại 3: Từ, thuật ngữ có khái niệm, công thức tính kèm theo và có thể có
cả ví dụ
13
Bảng 3.2: Số lượng từ, thuật ngữ của Từ điển Thống kê sắp xếp theo cấu trúc từ
Lĩnh vực Loại 1 Loại 2 Loại 3 Tổng
1.2. Lý thuyết thống kê 176 90 64 330
1.2. Toán ứng dụng trong thống kê 45 13 32 90
1.3. Tin ứng dụng trong thống kê 80 - - 80
2.1. Thống kê TKQG và kinh tế tổng hợp 140 3 27 170
2.2. Thống kê tài chính, tín dụng, ngân hàng,
chứng khoán và bảo hiểm 194 - 26 230
2.3. Thống kê NLNTS 107 - 33 140
2.4. Thống kê Công nghiệp 51 - 19 70
2.5. Thống kê VĐT, XD và BĐS 81 - 9 90
2.6. Thống kê TMDVGC 212 - 38 250
3.1. Thống kê DS, LĐ &VL 143 1 66 210
3.2. Thống kê GD&ĐT 82 - 28 110
3.3. Thống kê KH&CN 63 - 7 70
3.4. Thống kê VHTT&TDTT 85 - 15 100
3.5. Thống kê YT&CSSKCĐ 50 - 50 100
3.6. Thống kê TP&TTANXH 76 - 14 90
3.7. Thống kê BĐG&TBPN 8 - 22 30
3.8. Thống kê MSDC 21 - 29 50
3.9. Thống kê ĐKTN&MT 58 - 32 90
Tổng 1612 107 511 2300
3.1.1.3. Từ, thuật ngữ gần giống tên các chỉ tiêu thống kê
Có một số từ, thuật ngữ đã được quy định trong Hệ thống chỉ tiêu thống kê
quốc gia cũng như Luật Thống kê năm 2015, tuy nhiên trong Từ điển Thống kê đặt
tên gọi còn có sự khác biệt. BCN lọc ra những từ/thuật ngữ đó để phục vụ việc cập
nhật sau này. Một số thuật ngữ liệt kê theo bảng dưới đây:
Bảng 3.3: So sánh tên từ/thuật ngữ theo Luật Thống kê năm 2015
(Chi tiết tại báo cáo tổng hợp)
3.1.1.4. Từ, thuật ngữ theo nguồn tài liệu
14
Cuốn Từ điển Thống kê này được biên soạn trên cơ sở kế thừa cuốn Từ điển
Thống kê xuất bản năm 1977; kết quả nghiên cứu Đề tài cấp Bộ “Nghiên cứu biên
soạn Từ điển Thống kê” do TS. Đỗ Thức làm chủ nhiệm đề tài và tham khảo một số
cuốn từ điển, như: Oxford Dictionary Statistics (University Press, 2002); Statistics
Glossary (OECD, 2010) và một số cuốn từ điển chuyên ngành khác. Phần thống kê
kinh tế, xã hội gồm nhiều lĩnh vực có nghiên cứu, tham khảo Luật chuyên ngành.
Ngoài ra, các chỉ tiêu thống kê ở các ngành, lĩnh vực cũng được biên soạn dựa trên
cơ sở Hệ thống chỉ tiêu thống kê quốc gia đã được Thủ tướng Chính phủ ban hành
theo Quyết định số 43/2010/QĐ-TTg ngày 02/6/2010. Mặc dù quyết định này đã
được thay thế bằng Luật Thống kê năm 2015, tuy nhiên Từ điển Thống kê được căn
cứ vào tên chỉ tiêu thống kê của Quyết định số 43, nên BCN đề tài vẫn rà soát lại
theo quyết định này, nhằm hoàn thiện hơn.
Hiện nay, cuốn Từ điển Thống kê này có 260 chỉ tiêu có trong Hệ thống chỉ
tiêu thống kê quốc gia (cũ) có nhiều chỉ tiêu được tách nhỏ ra, và có những chỉ tiêu
không hoàn toàn trùng khớp cụ thể như trong báo cáo tổng hợp.
Rà soát cuốn Từ điển Thống kê theo nguồn tham khảo sẽ là một thông tin làm
cơ sở dữ liệu cho Phần mềm tra cứu Từ điển.
3.1.1.5. Đề xuất hoàn thiện Từ điển phục vụ tin học hóa
Nhằm hoàn thiện cuốn Từ điển Thống kê Việt Nam, BCN đề xuất một số nội
dung sau:
- Thứ nhất, rà soát các lỗi chính, cập nhật nội dung Từ điển
- Thứ hai, rà soát tên tiếng anh các từ, thuật ngữ
- Thứ ba, xem xét bổ sung thêm từ thuật ngữ thống kê
Có nhiều tài liệu mới ban hành so thời gian phát hành cuốn Từ điển Thống kê,
kèm theo đó là những khái niệm, nội dung mới, xem xét bổ sung thêm một số thuật
ngữ được quy định trong Luật Thống kê năm 2015 vì đây hầu hết là những từ, thuật
ngữ mới. Ngoài ra, khi đã được quy định trong Luật, đơn vị chịu trách nhiệm hàng
năm sẽ phải thu thập thông tin về chỉ tiêu đó, vì thế nên lựa chọn và giải thích thêm
vào cuốn Từ điển Thống kê này, cụ thể xem báo cáo tổng hợp.
3.1.2. Rà soát phục vụ xây dựng cơ sở dữ liệu cho Phần mềm tra cứu Từ
điển Thống kê
BCN đề tài đề xuất một số nội dung xây dựng cơ sở dữ liệu:
3.1.2.1. Cơ sở dữ liệu về nội dung thể hiện của 1 từ, thuật ngữ
Cần xây dựng một cơ sở dữ liệu về nội dung của Phần mềm tra cứu, nghĩa là
khi tìm kiếm 1 từ, thuật ngữ nào đó thì hiển thị của mỗi từ, thuật ngữ gồm những
thông tin gì ngoài nội dung của từ, thuật ngữ có sẵn trong cuốn Từ điển Thống kê.
15
Tham khảo các Phần mềm tra cứu Từ điển Thống kê, BCN đề xuất cần có nội dung
rà soát sau:
Tên từ,
thuật
ngữ
Tên
tiếng
anh
Nội dung
của từ, thuật
ngữ trong
Từ điển
Thống kê
Lĩnh vực
liên quan
Bối cảnh
của định
nghĩa
Nguồn
tham
khảo
Các liên
kết với
những định
nghĩa có
liên quan
(1) (2) (3) (4) (5) (6) (7)
Từ,
thuật
ngữ 1
...
Từ,
thuật
ngữ
2300
Giải thích các cột đề xuất
(1) Tên từ, thuật ngữ, toàn bộ danh sách 2300 từ, thuật ngữ của Từ điển Thống
kê được liệt kê lại và đưa làm một trường dữ liệu.
(2) Tên tiếng anh từ, thuật ngữ, danh sách 2300 tên từ, thuật ngữ của Từ điển
thống kê được chuyển sang tiếng Anh.
(3) Nội dung của từ, thuật ngữ trong Từ điển Thống kê, dữ liệu này là phần
giải thích nội dung của từ, thuật ngữ trong Từ điển Thống kê, tuy nhiên để đáp ứng
Phần mềm cũng cần có thời gian chuyển sang dạng cơ sở dữ liệu, một loại nào phù
hợp để chuyển đổi.
(4) Lĩnh vực liên quan, cần có danh mục các lĩnh vực đã được đưa ra để biết từ,
thuật ngữ đó thuộc lĩnh vực nào.
(5) Bối cảnh của định nghĩa, nếu có thể hãy trình bày thông tin ra đời của từ,
thuật ngữ.
(6) Nguồn tham khảo, phần rà soát này rất mất thời gian và công sức, tuy nhiên
có được nội dung này khiến từ điển thêm có giá trị, độ tin cậy cao.
(7) Các linh liên kết với những định nghĩa có liên quan, mục này giúp Từ điển
Thống kê có tính so sánh với link ở nguồn tài liệu khác tốt, nên bổ sung để làm
phong phú từ điển.
3.1.2.2. Cơ sở dữ liệu phục vụ tính năng khác
Ngoài cơ sở dữ liệu về nội dung thể hiện của 1 từ, thuật ngữ, còn xây dựng cơ
sở dữ liệu cần thiết các tính năng của phần mềm: (1) Cơ sở dữ liệu về danh mục
16
lĩnh vực trong từ điển, phục vụ phần hiển thị trên giao diện tra cứu; (2) Cơ sở dữ liệu
về danh mục từ, thuật ngữ theo Bảng chữ cái; (3) Cơ sở dữ liệu về giới thiệu, hướng dẫn
tra cứu, dữ liệu danh mục người dùng; (4) Cơ sở dữ liệu phục vụ tìm kiếm nâng cao; (5)
Cơ sở dữ liệu về quản trị hệ thống.
3.1.3. Đề xuất nội dung Phần mềm tra cứu và cập nhật Từ điển Thống kê
3.1.3.1. Tính năng Phần mềm
a. Tính năng tìm kiếm
Đây là tính năng quan trọng nhất của Phần mềm tra cứu, BCN đề xuất một số
cách tra cứu từ điển như sau:
- Tìm kiếm theo từ, cụm từ, khi gõ một từ, cụm từ bất kỳ trên bảng kết quả sẽ
hiện ra từ, thuật ngữ trong Danh mục 2300 từ, thuật ngữ của Từ điển Thống kê chứa
từ, cụm từ vừa tìm kiếm.
- Tìm kiếm nâng cao, tương tự như phần tìm kiếm theo từ, cụm từ, nhưng hỗ
trợ tìm kiếm từ chính xác ngay khi kèm với nó là những điều kiện ràng buộc đi theo.
b. Hiển thị từ, thuật ngữ theo Bảng chữ cái
Để thuận lợi cho việc tìm kiếm, và có thể nhìn thấy ngay các từ/thuật ngữ của
Từ điển Thống kê. Phần mềm tra cứu xây dựng tính năng hiện thị tên từ, thuật ngữ
này hiển thị sẵn có phân theo Bảng chữ cái
c. Hiển thị từ, thuật ngữ theo lĩnh vực thống kê
Tương tự phần hiển thị theo Bảng chữ cái, Phần mềm xây dựng tính năng hiển
thị theo Lĩnh vực thống kê. Tính năng này giúp cho việc dễ dàng tìm kiếm từ, thuật
ngữ đã được phân theo Lĩnh vực thống kê có trong Từ điển Thống kê.
d. Truy cập
Tính năng này giới hạn người truy cập, buộc phải có tài khoản mới có thể truy
cập vào Phần mềm tra cứu.
e. Đánh dấu, lưu lại, xem lại
Tính năng này giúp lưu lại, xem lại kết quả đã được tìm kiếm. Người dùng có
thể xem lại lịch sử tìm kiếm và tra cứu trong phần Lịch sử tìm kiếm.
f. Hỏi đáp
Tính năng này giúp giải đáp các thắc mắc của người truy cập về các vấn đề
xung quanh cuốn Từ điển Thống kê.
g. Quản trị dữ liệu
17
Đây là tính năng đặc biệt quan trọng khi Phần mềm hướng tới việc cập nhật Từ
điển Thống kê. Việc quản trị dữ liệu sẽ có nội dung khả năng xóa, thêm, sửa nội
dung của cuốn Từ điển Thống kê
h. Liên hệ
Tính năng này giúp người dùng có thể liên hệ người quản trị, đóng góp ý kiến,
nhận định, đánh giá, góp ý về Từ điển Thống kê. Tính năng này
i. Một số tính năng khác
Các tính năng xem xét là: (1) Tính năng cho phép người dùng từ tạo danh
mục và danh sách từ của riêng mình; (2) Tự động tải các dữ liệu về máy để người
dùng có thể tra cứu và sử dụng ngay cả khi không có kết nối mạng; (3) Tính năng
lưu dữ liệu liên quan Từ điển Thống kê (phần này quan trọng, lưu giữ tài liệu liên
quan từ lúc bắt đầu xây dựng Từ điển Thống kê đến lúc phát hành) .
3.1.3.2. Đề xuất Giao diện Phần mềm
Mô hình giao diện dự kiến như sau:
3.2. GIẢI PHÁP TỔ CHỨC THỰC HIỆN TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ
Khâu cuối cùng sau khi có những ý tưởng xây dựng Web tra cứu Từ điển
Thống kê là tổ chức thực hiện đưa Web triển khai vào thực tế. Có rất nhiều vấn
đề đặt ra và cần giải quyết. BCN đề xuất các giải pháp sau:
3.2.1. Thành lập nhóm Từ điển Thống kê
Đây không phải lần đầu tiên đề xuất nhóm này, Viện KHTK được thành
lập từ việc ghép lại của 3 đơn vị trong đó có Tổ Từ điển Thống kê. Từ điển
Thống kê là sản phẩm đầu ngành, chứa khối lượng tri thức lớn về khoa học
Thống kê. Từ điển Thống kê phải được thường xuyên cập nhật theo sự phát
18
triển của ngành, đổi mới về phương pháp luận và hội nhập với các tổ chức thống
kê khu vực, thống kê toàn cầu. Vì vậy thành lập nhóm này là rất cần thiết.
3.2.2. Tƣ liệu hóa tài liệu trong quá trình xây dựng Từ điển Thống kê
Nhiều năm sau khi cuốn Từ điển Thống kê 1977 được phát hành nhưng
chưa được tái bản một phần nào nguyên nhân là do những tư liệu về quá trình
xây dựng từ điển không được lưu giữ lại. Trong 4 năm từ 2011 đến 2015 triển
khai biên soạn cuốn Từ điển Thống kê có nhiều phiên bản cuốn từ điển đã được
biên soạn, nhiều ý kiến góp ý của chuyên gia về cuốn từ điển, nhiều lần hội
nghị, hội thảo về tổ chức thực hiện biên soạn Từ điển Thống kê. Tất cả đều cần
được tư liệu hóa và lưu giữ lại làm tài liệu cho lần tái bản lần sau.
3.2.3. Xây dựng quy chế ngƣời truy cập
Tăng cường hỗ trợ người dùng tin tiếp cận được với phần mềm tra cứu.
Xây dựng quy chế người truy cập để đáp ứng tối đa nhu cầu của người dùng,
nhất là việc tiếp nhận và giải đáp các phản hồi của người dùng tin .
3.2.4. Đảm bảo đủ nguồn lực cho hoạt động phần mềm tra cứu
Để thuận lợi nhất cho việc quản lý và vận hành Phần mềm, cần lựa chọn một
đơn vị thuộc TCTK để quản lý. Đơn vị quản lý có vai trò như admin, can thiệp vào
các tính năng có của phần mềm. Đặc biệt, là đơn vị chủ trì cập nhật Từ điển
Thống kê khi có chỉ đạo. Đối tượng sử dụng của Phần mềm, trước tiên hướng đến
các cán bộ ngành thống kê, việc truy cập phần mềm bằng tài khoản email nội bộ của
ngành. Ngoài ra, để mở rộng đối tượng sử dụng và quảng bá ngành thống kê, nên
hướng đến những người sử dụng ngoài ngành. Tuy nhiên, để đảm bảo tính bảo lập cần
thiết lập hệ thống truy cập. Duy trì, vận hành Từ điển Thống kê bao gồm 2 yếu tố: (1)
Bảo trì, nâng cấp phần mềm theo định kỳ; (2) Duy trì, nâng cấp nội dung hay cơ sở dữ
liệu và các tính năng của Phần mềm.
3.2.5. Nguồn kinh phí
Nguồn kinh phí xây dựng và thực hiện triển khai xây dựng phần mềm tra
cứu do ngân sách nhà nước bảo đảm, được bố trí theo phân cấp quản lý ngân
sách nhà nước hiện hành.
3.2.6. Hợp tác với các đơn vị về vận hành, quản lý các phần mềm thống kê
Tổng cục Thống kê có vận hành các phần mềm tra cứu như Phần mềm
danh mục hành chính; danh mục nghề nghiệp; phần mềm tra cứu từ điển 3 thứ
tiếng. Cần có mối liên hệ hợp tác để học hỏi kinh nghiệm, phương thức triển
khai để phù hợp với quy định chung của ngành.
19
KẾT LUẬN VÀ KHUYẾN NGHỊ
1. Kết luận
Ngày nay, CNTT và truyền thông phát triển không ngừng và đạt những thành
tựu đáng kể trong hầu hết các lĩnh vực, hoạt động trong đó có việc khai thác, tra cứu
các nguồn tài liệu sách. Thực tế cho thấy việc tra cứu các nguồn tài liệu nhờ CNTT trở
nên phong phú và dễ dàng. Tài liệu không chỉ biểu hiện bằng giấy mà còn lưu trữ
dạng sách điện tử hay các công cụ tra cứu trực tuyến, nó vừa đáp ứng nhu cầu người
dùng và tiết kiệm đối với người sử dụng. Quyết định số 1428/QĐ-TCTK, ngày
25/12/2014 của Tổng cục trưởng Tổng cục Thống kê về “Tuyên truyền kiến thức
thống kê cho cộng đồng và các đối tượng sử dụng thông tin thống kê”, trong đó nhấn
mạnh vai trò của tin học hóa.
Trong khuôn khổ của đề tài, trên cơ sở nghiên cứu về vấn đề tin học hóa, giải
pháp tin học hóa từ điển, đề tài đã đáp ứng được Thuyết minh nghiên cứu đã được
Hội đồng phê duyệt, đi đúng định hướng và đạt được những kết quả nhất định. Cuốn
Từ điển Thống kê cơ bản bao quát hết các hoạt động thống kê, lĩnh vực thống kê,
được đánh giá biên soạn công phu. Tuy nhiên, để tin học hóa Từ điển Thống kê thì
cần xây dựng cơ sở dữ liệu cho Từ điển Thống kê như đã nêu trong chương II của đề
tài. Một nội dung khá quan trọng, không thể thiếu khi nhắc đến CNTT là nền tảng cơ
sở hạ tầng. Nếu chúng ta có đủ CSDL nhưng hạ tầng CNTT không đáp ứng được
yêu cầu đặt ra thì chỉ tin học hóa từ điển sẽ gặp nhiều khó khăn. Đề tài đã mạnh dạn
đưa ra thực trạng về nền tảng CNTT của Viện KHTK, của TCTK nhằm có cơ sở
triển khai tin học hóa Từ điển Thống kê. Việc học hỏi các phần mềm tra cứu từ điển
trên internet là rất cần thiết, ngày nay có rất nhiều các web tra cứu tư liệu, sách báo,
thông tin đặc biệt là những cuốn từ điển. Đặc thù của từ điển là cấu trúc rõ ràng,
thường là tên từ, thuật ngữ và giải thích từ thuật ngữ đó nên công việc thiết kế tra
cứu trực tuyến sẽ dễ dàng hơn tra cứu những tài liệu khác. Để có những tư liệu, đề
tài nghiên cứu những web tra cứu từ điển, bảng thuật ngữ thống kê, tìm ra những
mặt được, hạn chế của web tra cứu, cơ sở cho mục tiêu nghiên cứu của đề tài. Một
nội dung nữa đề tài đưa ra đó là đề xuất nội dung, công nghệ của phần mềm tra cứu
trực tuyến. Đề tài mạnh dạn đề xuất mô hình Web tra cứu trực tuyến với các tính
năng cần thiết và ban đầu mô phỏng giao diện Web tra cứu.
Tuy nhiên, trong quá trình nghiên cứu BCN đề tài xin được thay đổi Đề cương
báo cáo tổng hợp phù hợp với logic vấn đề. Kết quả chính của đề tài là đưa ra các
vấn đề cần phải chuẩn bị trước khi xây dựng Phần mềm tra cứu. Đề tài vẫn còn tồn
đọng nhiều hạn chế, chưa được như mong muốn của BCN đề tài, cụ thể đó là phần
rà soát cuốn Từ điển Thống kê nhằm xây dựng cơ sở dữ liệu cho phần mềm tra cứu
sau này. Đề tài mới chỉ chỉ ra các trường dữ liệu cần rà soát mà không đủ nguồn lực
để đưa ra kết quả rà soát các trường dữ liệu đó. Trường dữ liệu nội dung của từng
20
từ, thuật ngữ có thể chuyển sang dạng file excel để tiện việc chuyển đổi sang phần
mềm, tuy nhiên việc sao chép, biểu diễn công thức trong Excel lại gặp khó khăn,
mất nhiều thời gian và công sức. Trường dữ liệu quan trọng nữa nêu ra ở trên là
nguồn gốc của nội dung các từ thuật ngữ, rà soát vấn đề này cần người có tầm hiểu
biết rộng về các hoạt động thống kê của ngành… và các vấn đề về trường dữ liệu
khác nữa. Đề tài chưa đủ điều kiện đề thực hiện nội dung này mặc dù đã có ý tưởng
thực hiện.
2. Khuyến nghị
(1) Xây dựng Phần mềm tra cứu Từ điển Thống kê dưới dạng Web tra cứu đặt
tại web của Viện Khoa học Thống kê;
(2) Xây dựng Cơ sở dữ liệu về cuốn Từ điển Thống kê Việt Nam với các
trường dữ liệu đã đề cập trong phần chương II. Viện KHTK là đơn vị chủ trì việc
xây dựng CSDL này, khuyến nghị là đơn vị có bản word cuối cùng của cuốn Từ
điển Thống kê để tạo điều kiện thuật lợi nhất hoàn thành CSDL.
(3) Nâng cấp hạ tầng Công nghệ thông tin của Viện Khoa học Thống kê đáp
ứng xây dựng Web tra cứu;
(4) Thành lập nhóm Từ điển Thống kê, cập nhật thường xuyên cuốn Từ điển
Thống kê.
DANH MỤC TÀI LIỆU THAM KHẢO
1. PGS.TS. Hoàng Đức Liên và Nguyễn Hữu Ty (2011), “Giải pháp xây dựng
các bộ sưu tập tài liệu số”;
2. CN. Hoàng Minh Thiện (2014), “Củng cố kho thông tin tư liệu khoa học
thống kê kết hợp tin học hóa”;
3. TS.Thiều Văn Tiến (2005), “Nghiên cứu và đề xuất giải pháp công nghệ tin
học hóa công tác xử lý số liệu thống kê tháng, quý, năm do các Cục Thống kê
thực hiện”;
4. TS. Nguyễn Thị Bạch Tuyết (2011) “Tin học hóa quá trình quản lý hồ sơ tư
vấn cho các công ty tư vấn Bộ Xây dựng”;
5. Tổng cục Thống kê (2016), “Từ điển Thống kê”;
6. http://stats.oecd.org/glossary/
7. http://www.oxfordreference.com/view/
8. http://stattrek.com/statistics/dictionary.aspx
9. http://www.hmu.edu.vn/news/dict.aspx.
top related