mà ĐỀ tÀi: 2.2.1-cs15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16....

20
1 NGHIÊN CỨU ĐỀ XUẤT CÁC GIẢI PHÁP TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ VIỆT NAM PHỤC VỤ CHO KHAI THÁC, CẬP NHẬT TRỰC TUYẾN Cấp đề tài: Thi gian nghiên cu: Đơn vị thc hin: Chnhim: Cơ sở 2015 Vin Khoa hc Thng kê ThS. Vũ Thị Vân Anh LỜI NÓI ĐẦU Từ điển Thống kê Việt Nam (gọi tắt là Từ điển Thống kê) được Tổng cục Thống kê biên soạn và xuất bản tháng 1 năm 2016 nhằm xây dựng được các từ, thuật ngữ thống kê chuẩn để tất cả các bên (sản xuất, sử dụng, cung cấp số liệu thống kê) đều thống nhất hiểu và sử dụng chúng. Từ điển Thống kê với khối lượng lớn số từ, thuật ngữ (khoảng hơn 2300 từ, thuật ngữ). So với các từ điển chuyên ngành đây là cuốn từ điển chứa đựng nội dung kiến thức rộng, sâu đối với chuyên ngành thống kê và cả các ngành liên quan khác. Cuốn Từ điển Thống kê cần được phổ biến rộng rãi, thuận tiện trong việc tra cứu đối với cán bộ trong và ngoài ngành Thống kê và các đối tượng dùng tin khác. Ngày nay, Công nghệ thông tin và truyền thông (CNTT-TT) phát triển không ngừng và đạt những thành tựu đáng kể trong hầu hết các lĩnh vực, hoạt động trong đó có việc khai thác, tra cứu các nguồn tài liệu sách. Thực tế cho thấy việc tra cứu các nguồn tài liệu nhờ công nghệ thông tin (CNTT) trở nên phong phú dễ dàng. Tài liệu không chỉ biểu hiện bằng giấy mà còn lưu trữ dạng sách điện tử hay các công cụ tra cứu trực tuyến, nó vừa đáp ứng nhu cầu người dùng và tiết kiệm đối với người sử dụng. Vì vậy, Viện Khoa học Thống kê (KHTK) đã đề xuất nghiên cứu đề tài: Nghiên cứu đề xuất các giải pháp tin học hóa Từ điển Thống kê Việt Nam phục vụ cho khai thác, cập nhật trực tuyến nhằm mục đích đó. Trong giai đoạn đầu nghiên cứu, Ban chủ nhiệm đề tài (BCN) tìm hiểu các công trình nghiên cứu có liên quan để làm tài liệu tham khảo cho đề tài. Tuy nhiên đây là một loại đề tài mang tính đặc thù sử dụng cho ngành Thống kê nên không tìm được nhiều nghiên cứu phục vụ cho mục đích chính của đề tài. Các nghiên cứu có thể sử dụng tham khảo tìm thấy, bao gồm: MÃ ĐỀ TÀI: 2.2.1-CS15

Upload: others

Post on 29-Aug-2019

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

1

NGHIÊN CỨU ĐỀ XUẤT CÁC GIẢI PHÁP TIN HỌC HÓA

TỪ ĐIỂN THỐNG KÊ VIỆT NAM PHỤC VỤ CHO KHAI THÁC,

CẬP NHẬT TRỰC TUYẾN

Cấp đề tài:

Thời gian nghiên cứu:

Đơn vị thực hiện:

Chủ nhiệm:

Cơ sở

2015

Viện Khoa học Thống kê

ThS. Vũ Thị Vân Anh

LỜI NÓI ĐẦU

Từ điển Thống kê Việt Nam (gọi tắt là Từ điển Thống kê) được Tổng cục

Thống kê biên soạn và xuất bản tháng 1 năm 2016 nhằm xây dựng được các từ,

thuật ngữ thống kê chuẩn để tất cả các bên (sản xuất, sử dụng, cung cấp số liệu

thống kê) đều thống nhất hiểu và sử dụng chúng. Từ điển Thống kê với khối lượng

lớn số từ, thuật ngữ (khoảng hơn 2300 từ, thuật ngữ). So với các từ điển chuyên

ngành đây là cuốn từ điển chứa đựng nội dung kiến thức rộng, sâu đối với chuyên

ngành thống kê và cả các ngành liên quan khác. Cuốn Từ điển Thống kê cần được

phổ biến rộng rãi, thuận tiện trong việc tra cứu đối với cán bộ trong và ngoài ngành

Thống kê và các đối tượng dùng tin khác. Ngày nay, Công nghệ thông tin và truyền

thông (CNTT-TT) phát triển không ngừng và đạt những thành tựu đáng kể trong hầu

hết các lĩnh vực, hoạt động trong đó có việc khai thác, tra cứu các nguồn tài liệu

sách. Thực tế cho thấy việc tra cứu các nguồn tài liệu nhờ công nghệ thông tin

(CNTT) trở nên phong phú và dễ dàng. Tài liệu không chỉ biểu hiện bằng giấy mà

còn lưu trữ dạng sách điện tử hay các công cụ tra cứu trực tuyến, nó vừa đáp ứng

nhu cầu người dùng và tiết kiệm đối với người sử dụng. Vì vậy, Viện Khoa học

Thống kê (KHTK) đã đề xuất nghiên cứu đề tài: Nghiên cứu đề xuất các giải pháp

tin học hóa Từ điển Thống kê Việt Nam phục vụ cho khai thác, cập nhật trực

tuyến nhằm mục đích đó.

Trong giai đoạn đầu nghiên cứu, Ban chủ nhiệm đề tài (BCN) tìm hiểu các

công trình nghiên cứu có liên quan để làm tài liệu tham khảo cho đề tài. Tuy nhiên

đây là một loại đề tài mang tính đặc thù sử dụng cho ngành Thống kê nên không tìm

được nhiều nghiên cứu phục vụ cho mục đích chính của đề tài. Các nghiên cứu có

thể sử dụng tham khảo tìm thấy, bao gồm:

MÃ ĐỀ TÀI: 2.2.1-CS15

Page 2: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

2

(1) Đề tài “Nghiên cứu và đề xuất giải pháp công nghệ tin học hóa công tác xử

lý số liệu thống kê tháng, quý, năm do các Cục Thống kê thực hiện” do TS. Thiều

Văn Tiến, Tổng cục Thống kê làm chủ nhiệm đề tài.

(2) Nghiên cứu khoa học “Giải pháp xây dựng các bộ sưu tập tài liệu số” của

PGS.TS. Hoàng Đức Liên và Nguyễn Hữu Ty, Trung tâm Thông tin - Thư viện Đại

học Nông nghiệp I, đưa ra những giải pháp về tài liệu số.

(3) Bài viết “Củng cố kho thông tin tư liệu khoa học thống kê kết hợp tin học

hóa” của CN. Hoàng Minh Thiện, nguyên Quyền Giám đốc Trung tâm Thông tin

khoa học Thống kê đưa ra một số giải pháp để kết hợp tin học hóa với nguồn thông

tin khoa học thống kê.

(4) Luận án tiến sĩ “Tin học hóa quá trình quản lý hồ sơ tư vấn cho các công ty

tư vấn Bộ Xây dựng” của tác giả Nguyễn Thị Bạch Tuyết.

Như vậy, các nghiên cứu nêu trên đâu đó nhắc đến khái niệm “tin học hóa”

nhưng cho những nội dung khác với nội dung nghiên cứu đề tài, trên cơ sở những tài

liệu đó, BCN đề tài xác định rõ một số điểm chính như sau:

1. Mục đích của đề tài

Kết quả của đề tài là cơ sở nghiên cứu khoa học để xây dựng Phần mềm tra

cứu Từ điển Thống kê trực tuyến.

2. Mục tiêu tổng quát và mục tiêu chi tiết của đề tài

Mục tiêu tổng quát

Đề xuất các giải pháp tin học hóa cuốn Từ điển Thống kê. Đó là những giải

pháp sẽ phục vụ trực tiếp cho xây dựng Phần mềm tra cứu cuốn Từ điển Thống kê.

Mục tiêu chi tiết

Nghiên cứu rà soát cuốn Từ điển Thống kê, đánh giá hiện trạng công nghệ

thông tin, tìm hiểu các phần mềm tra cứu từ điển để đưa ra các nhóm giải pháp về

công nghệ, giải pháp nghiệp vụ và tổ chức thực hiện tin học hóa Từ điển Thống kê.

3. Phạm vi nghiên cứu

- Cuốn Từ điển Thống kê;

- Website tra cứu từ điển, các giải pháp tin học hóa sách, tài liệu.

4. Nội dung nghiên cứu

(1) Nghiên cứu kinh nghiệm trong và ngoài nước về tin học hóa Từ điển, sách

khoa học, sách tra cứu, tư liệu; (2) Rà soát và đề xuất nội dung hoàn thiện cuốn Từ

điển Thống kê Việt Nam; (3) Đánh giá nền tảng Công nghệ thông tin của Tổng cục

Thống kê và Viện Khoa học Thống kê phục vụ tin học hóa Từ điển Thống kê; (4)

Page 3: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

3

Đề xuất nội dung, công nghệ, quy trình quản lý, cập nhật của Phần mềm tra cứu Từ

điển Thống kê trực tuyến.

5. Phƣơng pháp nghiên cứu

- Nghiên cứu tài liệu về tin học hóa từ điển, sách, tài liệu;

- Nghiên cứu phi thực nghiệm một số Website về tra cứu từ điển;

- Nghiên cứu thực nghiệm cuốn Từ điển Thống kê.

6. Những đóng góp mới của đề tài

(1) Đưa ra những ví dụ thực hiện về các phần mềm tra cứu từ điển trực tuyến

trong và ngoài nước; (2) Rà soát một số điểm của Từ điển Thống kê, đề xuất hướng

xây dựng cơ sở dữ liệu về cuốn Từ điển Thống kê phục vụ xây dựng phần mềm tra

cứu sau này; (3) Đánh giá nền tảng CNTT của Viện KHTK, đồng thời đưa ra các yêu

cầu về CNTT để đảm bảo việc xây dựng phần mềm; (4) Mô phỏng Phần mềm tra cứu

trực tuyến cuốn Từ điển Thống kê.

7. Bố cục của báo cáo tổng hợp đề tài

Báo cáo tổng hợp đề tài ngoài phần mở đầu, kết luận, khuyến nghị, tài liệu

tham khảo, đề tài gồm có 3 chương, đó là:

Chương 1. Các vấn đề chung về tin học hóa, tin học hóa Từ điển Thống kê;

Chương 2. Đề xuất các giải pháp công nghệ phục vụ tin học hóa Từ điển Thống

kê; Chương 3. Đề xuất giải pháp nghiệp vụ và tổ chức thực hiện tin học hóa Từ điển

Thống kê;

BCN đề tài xin trân trọng cảm ơn các Hội đồng xét duyệt đề cương, Hội đồng

nghiệm thu đề tài để có góp ý, gợi ý, định hướng hoàn thiện đề tài; trân trọng cảm

ơn các thành viên nghiên cứu chính đã đóng góp nội dung không thể thiếu của đề tài,

trân trọng cảm ơn Viện Khoa học Thống kê đặc biệt là Lãnh đạo Viện KHTK,

Phòng Quản lý khoa học và chất lượng Thống kê đã tạo điều kiện giúp BCN đề tài

hoàn thành đề tài này.

CHƢƠNG 1

CÁC VẤN ĐỀ CHUNG VỀ TIN HỌC HÓA,

TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ

Chương này tập trung trình bày những nội dung tóm tắt có tính chất cơ sở

thực tiễn về việc tin học hóa Từ điển Thống kê. Xu hướng trong và ngoài nước về

công nghệ thông tin trên các lĩnh vực đặc biệt thông tin thống kê. Một nội dung

quan trọng nữa là trình bày kinh nghiệm trong và ngoài nước về các phần mềm tra

cứu Từ điển.

Page 4: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

4

1.1. KHÁI NIỆM VỀ TIN HỌC HÓA, GIẢI PHÁP TIN HỌC HÓA

1.1.1. Khái niệm tin học hóa

Tóm lược một số định nghĩa tin học hóa như sau:

(1) Tin học hóa là quá trình ứng dụng công nghệ thông tin (CNTT) trong các

hoạt động của nền kinh tế - xã hội1.

(2) Tin học hóa thông tin thư viện là xây dựng cơ sở dữ liệu (CSDL) thư mục,

xây dựng cơ sở dữ liệu toàn văn, số hóa tư liệu ảnh, xây dựng mang LAN, thu thập

thông tin bằng internet2,...

(3) Tin học hóa công tác xử lý số liệu thống kê nói chung và số liệu tổng điều

tra, điều tra thống kê là hoạt động xử lý dựa trên các phần mềm, và phần mềm tự

phát triển. Tóm lại việc tin học hóa hoá công tác xử lý số liệu điều tra là việc sử

dụng các phần mềm ứng dụng3.

(4) Tìm hiểu khái niệm tin học hóa bằng tiếng anh “Computerization”, được

định nghĩa chung nhất là việc kiểm soát các quy trình bằng máy tính4.

Đối với quan niệm của BCN đề tài, tin học hóa Từ điển Thống kê là xây dựng

Phần mềm tra cứu Từ điển Thống kê. Phần mềm tra cứu là trang web tra cứu trực

tuyến Từ điển Thống kê.

1.1.2. Giải pháp tin học hóa

Tùy khái niệm tin học hóa mà đưa ra những giải pháp tin học hóa. Giải pháp

tin học hóa là việc đáp ứng các yêu cầu về tin học hóa.

Trong Đề tài “Nghiên cứu và đề xuất giải pháp công nghệ tin học hóa công

tác xử lý số liệu thống kê tháng, quý, năm do các Cục Thống kê thực hiện”, tác giả

đưa ra các giải pháp: Xây dựng hệ CSDL dữ liệu điều tra thống kê; xây dựng

CSDL Metadata lưu giữ thông tin về dữ liệu điều tra thống kê; nghiên cứu thử

nghiệm và áp dụng một số công nghệ mới trong thu thập và xử lý số liệu điều tra;

đưa ra những yêu cầu và chức năng cần phải có đối với hệ chương trình xử lý điều

tra thống kê;

Trong kết quả nghiên cứu khoa học “Giải pháp xây dựng các bộ sưu tập tài

liệu số” của PGS.TS. Hoàng Đức Liên và Nguyễn Hữu Ty, Trung tâm Thông tin -

Thư viện Đại học Nông nghiệp I, đưa ra những giải pháp bề tài liệu số gồm: Lựa

1 Luận án tiến sĩ “Tin học hóa quá trình quản lý hồ sơ tư vấn cho các công ty tư vấn Bộ Xây dựng”

của tác giả Nguyễn Thị Bạch Tuyết. 2 Bài viết “Tin học hóa hoạt động thông tin – thư viện tại Viện dân tộc học” của tác giả Nguyễn Thị

Hồng Nhị. 3 Tổng hợp từ Đề tài “Nghiên cứu và đề xuất giải pháp công nghệ tin học hóa công tác xử lý số liệu

thống kê tháng, quý, năm do các Cục Thống kê thực hiện” do TS.Thiều Văn Tiến, Tổng cục Thống

kê làm chủ nhiệm đề tài. 4 Định nghĩa từ từ điển “Mnemonic Dictionary”.

Page 5: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

5

chọn tài liệu đầu vào; lựa chọn công nghệ thực hiện; số hóa nguồn tài liệu; tạo siêu

dữ liệu liên kết; vận hành, bảo quản và cung cấp dữ liệu; xuất, nhập dữ liệu từ bên

ngoài để trao đổi.

Đối với đề tài, BCN sẽ đưa ra các giải pháp để xây dựng trang web tra cứu

Từ điển Thống kê bao gồm các nhóm giải pháp về CNTT, giải pháp về nghiệp vụ

và tổ chức thực hiện tin học hóa Từ điển Thống kê, cụ thể các chương II, chương

III của đề tài).

1.2. XU HƯỚNG ỨNG DỤNG CNTT TRONG LĨNH VỰC TRA CỨU

THÔNG TIN TRỰC TUYẾN Ở TRONG VÀ NGOÀI NƯỚC

1.2.1. Xu hƣớng ứng dụng CNTT trên thế giới của các lĩnh vực trong

những năm gần đây

Máy tính sẽ dần thay thế các sách giáo khoa bằng chính các máy tính nhỏ gọn,

cầm tay, đặt phẳng trên ngay mặt bàn, có nối mạng khắp nơi, tương tác tự nhiên

(chứ không chỉ qua chuột và bàn phím như thập niên vừa qua). Người dùng có thể

tham gia các loại hình hoạt động sử dụng phương tiện điện tử, gọi chung là e-* (như

e-books, e-learning, e-education, e-library,…) ở mọi lúc, mọi nơi. Bên cạnh đó,

những ứng dụng khác như dịch vụ tra cứu thông tin trực tuyến cũng sẽ được chú

trọng trong hiện tại và tương lai.

1.2.2. Xu hƣớng ứng dụng CNTT trên thế giới trong tra cứu Từ điển

Thống kê trực tuyến

- Ứng dụng công nghệ mới vào công tác thống kê phục vụ công việc chia sẻ dữ

liệu thống kê trực tuyến qua mạng toàn cầu, chia sẻ các báo cáo thống kê qua các

phương tiện CNTT hiện đại, giúp người dùng có thể tra cứu ở mọi nơi, mọi lúc

thông qua các thiết bị thông minh có kết nối mạng internet.

- Ứng dụng các dịch vụ xử lý số liệu trực tuyến vào công tác thống kê thế giới

ngày càng thay đổi từ mức ban đầu chỉ là gửi thư điện tử kết quả số liệu thống kê

dạng kích cỡ vài Byte đến nay có thể gửi thư lên đến hàng trăm Mb hoặc tài liệu thư

có thể lên đến Giga byte.

- Ứng dụng công nghệ tiên tiến, máy tính chuyên dụng phục vụ công tác làm

thống kê và quản lý và khai thác tra cứu thông tin thống kê.

- Ứng dụng những cải tiến về thiết bị CNTT để làm giảm thời gian xử lý số

liệu thống kê và nâng cao độ chính xác của kết quả thống kê.

- Kết quả của một số chương trình ứng dụng CNTT xây dựng phần mềm sử

dụng tra cứu từ điển trực tuyến tiêu biểu được một số quốc qia và tổ chức trên thế

giới thiết kế và sử dụng tra cứu thông tin thống kê như:

+ Chương trình tra cứu các thuật ngữ thống kê “Glossary of statistical iterms”;

Page 6: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

6

+ Tra cứu trực tuyến Cuốn Từ điển “Oxford Dictionary of Statistics”;

+ Tra cứu trực tuyến của Stat Trek;

+ Trang tra cứu Web: http://www.statsoft.com/textbook/statistics-glossary/.

1.2.3. Xu hƣớng ứng dụng CNTT trong lĩnh vực tra cứu thông tin trực

tuyến tại Việt Nam

1.2.3.1. Xu hướng phát triển chung về CNTT trong tất cả các ngành, lĩnh

vực theo định hướng của Chính phủ Việt Nam

Chính phủ nước ta đã ban hành “Chiến lược phát triển CNTT- TT thông Việt

Nam đến năm 2010 và định hướng đến năm 2020” tại Quyết định số 246/2005/QĐ-

TTg ngày 6/10/2005 của Thủ tướng chính phủ. CNTT-TT sẽ bùng nổ tiếp và ngày

càng tiến tới phục vụ hữu ích hơn, đa dạng hơn những nhu cầu của con người và là

động lực thúc đẩy tiến bộ xã hội và nâng cao chất lượng cuộc sống. CNTT-TT có ý

nghĩa đặc biệt trong giáo dục. Sự tác động này sẽ còn tiếp tục làm sâu sắc thêm ý

nghĩa của CNTT-TT trong trong tương lai.

1.2.3.2. Xu hướng ứng dụng CNTT trong các hoạt động khai thác tra cứu

thông tin trực tuyến tại Tổng cục Thống kê

Hướng đến một hệ thống tổ chức Thống kê hoàn chỉnh là cả quá trình lâu dài

đòi hỏi sự kế thừa, kết hợp đồng bộ giữa kế hoạch và thực hiện kế hoạch. Việc tăng

cường ứng dụng CNTT gắn liền với quá trình cải tiến về sản phẩm.

Ứng dụng CNTT trong hệ thống cơ quan chuyên trách về CNTT của Tổng cục

Thống kê và các cơ quan khác trong hệ thống tạo nên hệ thống hỗ trợ nhau cùng

phát triển ứng dụng CNTT.

Phát triển và vận dụng sao cho phù hợp với công việc và điều kiện của ngành

Thống kê đó là: Luôn thay đổi các trang thiết bị tiên tiến ứng dụng vào quản lý xây

dựng CSDL Thống kê nhằm mục đích mở rộng cơ sở hạ tầng CNTT về lưu trữ dữ

liệu thống kê, quản lý dữ liệu một cách dễ dàng hơn; cải tiến các phần mềm quản lý

để phù hợp với các yếu cầu đặt ra với công viêc xây dựng chương trình trong thời

điểm hiện tại và trong tương lai; tạo ra các sản phẩm ứng dụng khác từ các sản phẩm

CNTT hiện có để đáp ứng nhu cầu của các Ngành nghề khác trong xã hội; nâng cao

chất lượng sản phẩm CNTT bằng phương pháp đưa thêm nhiều dịch vụ mới hỗ trợ

người dùng vào các chương trình phần mềm nhằm tạo ra các sản phẩm đa chức năng

CNTT.

1.3. KINH NGHIỆM XÂY DỰNG PHẦN MỀM TRA CỨU THÔNG TIN Ở

TRONG VÀ NGOÀI NƯỚC

Nằm trong phạm vi của đề tài này, BCN nghiên cứu, tìm hiểu và xin giới thiệu

một số ít Phầm mềm tra cứu trực tuyến phổ biến, liên quan đến lĩnh vực Thống kê làm

kinh nghiệm để xây dựng Phần mềm tra cứu cuốn Từ điển Thống kê.

Page 7: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

7

1.3.1. Hệ thống Hệ thống Bảng thuật ngữ OECD

Hệ thống Bảng thuật ngữ OECD tên tiếng anh là “The OECD Glossary of

Statistical Terms” là website được đăng tải tại trang web:

https://stats.oecd.org/glossary/index.htm, tạm dịch là Bảng thuật ngữ thống kê của

OECD (Bảng thuật ngữ). Đây được xem như nguồn thông tin vô cùng phong phú về

6934 tiêu đề (từ/thuật ngữ/cụm từ…) có liên quan đến thống kê. Người đọc có thể

tra cứu, sao chép một cách dễ dàng, hữu ích. Ban chủ nhiệm đề tài xem trang web

như tài liệu tham khảo để tìm ra giải pháp cho tin học hóa cuốn Từ điển Thống kê.

Một số điểm nổi bật như sau:

1.3.1.1. Giao diện của Hệ thống Bảng thuật ngữ OECD

1.3.1.2. Giới thiệu chung về Hệ thống Bảng thuật ngữ

(1) Giới thiệu Bảng thuật ngữ

(2) Cách sử dụng Bảng thuật ngữ OECD

(3) Cấu trúc của Bảng thuật ngữ OECD

(4) Các link về nguồn tham khảo trên internet

(5) Hoạt động sắp tới của Bảng thuật ngữ OECD

(6) Link liên quan đến các Bảng thuật ngữ khác có trên internet

1.3.1.3. Tra cứu thuật ngữ trong Hệ thống Bảng thuật ngữ OECD

(1) Tra cứu bằng cách đánh tiêu đề bất kỳ

(2) Tra cứu nâng cao

1.3.2. Hệ thống tra cứu từ điển trực tuyến cuốn Từ điển Thống kê của

Oxford

Từ điển Thống kê Oxford, tên tiếng anh“Oxford Dictionary of Statistics” là một

từ điển chuyên ngành Thống kê đã được tái bản 3 lần, lần tái bản gần đây nhất năm

2014, hiện tại cuốn từ điển này đã được tra cứu trực tuyến tại trang web:

http://www.oxfordreference.com/view/10.1093/acref/9780199679188.001.0001/acre

f-9780199679188.

1.3.3. Tra cứu Thuật ngữ Thống kê thuộc Sổ tay điện tử của STATISTICA

Các mục trong Bảng thuật ngữ Thống kê được lấy từ Sổ tay điện tử của

STATISTICA, có tại trang Web http://www.statsoft.com/Textbook/Statistics-

Glossary. StatSoft đã cung cấp miễn phí Sách Thống kê điện tử từ năm 1995. Sách

thống kê điện tử bắt đầu với từ việc tổng quan về các khái niệm cơ bản có liên quan

về các lĩnh vực thống kê cụ thể. Một bảng chú giải các thuật ngữ thống kê và danh

sách các tài liệu tham khảo để nghiên cứu sâu hơn được đưa vào từ điển.

Page 8: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

8

1.3.4. Phần mềm Tra cứu thuật ngữ thống kê

Năm 2007, Tổng cục Thống kê phát hành cuốn Từ điển Thống kê Việt - Pháp -

Anh (gọi tắt là Từ điển Thống kê ba thứ tiếng) nhằm phục vụ cho yêu cầu phát triển

công tác thống kê trong điều kiện cơ chế thị trường và mở rộng hợp tác quốc tế.

Cuốn Từ điển thống kê ba thứ tiếng có 3.601 thuật ngữ, được chia ra theo 7 nhóm

nghiệp vụ. Trên cơ sở cuốn Từ điển Thống kê ba thứ tiếng, Tổng cục Thống kê thiết

kế tra cứu thuật ngữ thống kê có thể truy cập dễ dàng để tìm kiếm tại địa chỉ:

http://portal.thongke.gov.vn/TudienTK/default.asp?language=VN.

1.3.5. Tra cứu Từ điển Y học

Từ điển trực tuyến y học cung cấp các thuật ngữ thông dụng về y học cho các

cán bộ nghiên cứu, giảng viên, sinh viên và các đối tượng quan tâm nhằm phục vụ

cho các hoạt động, học tập nghiên cứu. Từ điển trực tuyến được xây dựng từ các

nguồn thông tin: Từ điển Y học Anh Việt của nhà xuất bản Y học; Từ điển Y học

Anh Việt của nhà xuất bản Thanh Hoá; Từ điển Anh Việt của Viện khoa học xã hội

Việt Nam; Từ điển Oxford.

Trên cơ sở năm phần mềm đã nghiên cứu, tìm hiểu được, BCN đã định hướng

những vấn đề lớn cần đưa ra các giải pháp cụ thể làm cách nào để khi xây dựng tin

học hóa cuốn Từ điển Thống kê được hiệu quả nhất.

CHƢƠNG 2

ĐỀ XUẤT CÁC GIẢI PHÁP CÔNG NGHỆ

PHỤC VỤ TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ

Chương này sẽ đưa ra đánh giá thực trạng cơ sở hạ tầng phục vụ cho việc tin

học hóa Từ điển Thống kê. Từ đó đưa ra giải pháp công nghệ.

2.1. HIỆN TRẠNG ỨNG DỤNG CÔNG NGHỆ THÔNG TIN NGÀNH

THỐNG KÊ5

Đề tài đánh giá nền tảng CNTT của Tổng cục thống kê và của Viện KHTK vì

Viện KHTK là đơn vị chủ trì biên soạn Từ điển Thống kê, được phân công nghiên

cứu tin học hóa cuốn Từ điển Thống kê, có thể đề xuất Viện KHTK được tiếp quản

công việc nếu như Từ điển Thống kê được tin học hóa.

2.1.1. Hiện trạng công nghệ thông tin chung của toàn Ngành

Hiện trạng CNTT đã được Vụ Phương pháp chế độ Thống kê và Công nghệ

thông tin báo cáo hàng năm. Vì vậy, BCN đề tài không trực tiếp đánh giá hiện trạng

5 Báo cáo Hiện trạng ứng dụng Công nghệ thông tin ngành Thống kê và định hướng phát triển đến

năm 2025;

Page 9: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

9

CNTT. BCN đề tài trích lại báo cáo về hiện trạng CNTT năm 2015 để làm tư liệu.

Đánh giá bao gồm những điểm sau: (1) Thiết bị mạng; (2) Máy chủ; (3) Máy trạm;

(4) Thiết bị lưu trữ; (5) Hệ thống điện và giám sát; (6) Kết nối; (7) Phần mềm hệ

thống; (8) Các dịch vụ; (9) Hiện trạng Chương trình ứng dụng và Cơ sở dữ liệu; (10)

Tồn tại, hạn chế về hạ tầng công nghệ thông tin. Hạn chế cụ thể sau:

(i) Tình trạng các thiết bị

• Các thiết bị được trang bị đồng bộ nhưng tính sẵn sàng chưa cao vì không có

thiết bị dự phòng. Tại các vị trí quan trọng liên quan đến hoạt động của toàn bộ hệ

thống đều là các điểm đơn (singlepoint) nên khi xảy ra sự cố rất khó khắc phục.

• Hệ thống lưu trữ bằng tủ đĩa đến nay đã cũ, tốc độ và dung lượng thấp, không

đáp ứng được yêu cầu lưu trữ dữ liệu của Ngành.

• Hệ thống lưu điện: Đã được trang bị từ lâu nên hệ thống ắc quy có khả năng

lưu điện rất thấp, không đảm bảo an toàn khi mất điện lưới.

(ii) Đảm bảo an toàn an ninh mạng

• Các thiết bị tường lửa (firewall) đều đã hết bản quyền dẫn đến việc phòng

chống tấn công đảm bảo an toàn, an ninh mạng rất khó khăn.

• Hệ thống không có thiết bị hay phần mềm chuyên biệt để phòng chống thư rác.

• Số lượng người sử dụng email trong Ngành ngày càng tăng song dung lượng

lưu trữ để đáp ứng cho dịch vụ lại rất ít (chỉ chạy trên ổ cứng của máy chủ) dẫn đến

việc truy cập vào mail box rất chậm đồng thời gây mất an toàn.

• Do số lượng người dùng nhiều, một số sử dụng không đúng mục đích phục

vụ công việc, tốc độ đường truyền hạn chế, đồng thời người sử dụng USB chứa

nhiều virut hoặc tự động cắm thêm bộ phát sóng không dây (wireless) nên xảy ra

tình trạng chiếm nhiều băng thông gây tắc nghẽn đường truyền hoặc có nguy cơ cao

trong việc bị tấn công từ bên ngoài.

(iii) Các vấn đề khác

Mặc dù vẫn còn hạn chế nêu trên, nhưng việc đưa thêm một phần mềm tra cứu

vào không làm quá tải hệ thống, ảnh hưởng nhiều vấn đề khác.

2.1.2. Đánh giá nền tảng công nghệ thông tin của Viện Khoa học Thống kê

Trong thời gian và phạm vi giới hạn đề tài này nên nhóm tác giả chỉ thực hiện

trong phạm vi khảo sát cơ sở hạ tầng CNTT đáp ứng việc xây dựng phần mêm tra cứu

Từ điển Thống kê trực tuyến của Viện Khoa học Thống kê. Đánh giá các điểm sau:

(1) Phần cứng gồm: Máy chủ; máy trạm; thiết bị lưu trữ; thiết bị mạng;

firewall; hệ thống cung cấp điện (UPS); hệ thống theo dõi, giám sát.

Page 10: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

10

(2) Phần mềm, gồm: Hệ điều hành máy chủ; hệ quản trị cơ sở dữ liệu; công cụ

phát triển ứng dụng; các phần mềm khác; cài đặt hệ điều hành máy chủ.

2.1.3. Yêu cầu về cơ sở hạ tầng công nghệ thông tin đáp ứng việc tin học

hóa Từ điển Thống kê

2.1.3.1. Yêu cầu về công nghệ thiết bị

Với số lượng người dùng toàn ngành Thống kê khá lớn và những người ngoài

ngành dùng đến các dữ liệu thống kê cũng ngày một tăng, điều này được kiểm chứng

thông qua trang website của Tổng cục Thống kê, của Viện Khoa học Thống kê. Để

giải quyết vấn đề đó thì một hệ thống quản lý và phân quyền người sử dụng phải

được xây dựng và quản lý một cách thống nhất. Từ mặt thiết bị đến công nghệ phải

đồng bộ với yêu cầu về phần thiết bị đi kèm. Có như vậy thì mới đảm bảo được việc

triển khai các ứng dụng, các chương trình quản lý đạt yêu cầu như kế hoạch đề ra.

2.1.3.2. Yêu cầu về công nghệ quản trị hệ thống thông tin

An toàn, bảo mật thông tin, cơ sở dữ liệu

- Trước tiên nói về một số tiêu chí của công việc bảo mật CSDL;

- Để bảo mật thông tin truyền trên mạng, người ta sử dụng các phương pháp

mã hoá (encryption). Dữ liệu được biến đổi từ dạng nhận thức được sang dạng

không nhận thức được theo một thuật toán nào đó (tạo mật mã) và sẽ được biến đổi

ngược lại (giải mã) ở trạm nhận. Đây là một lớp bảo vệ thông tin rất quan trọng và

được sử dụng rộng rãi trong môi trường mạng;

- Cập nhật dữ liệu.

2.2. ĐỀ XUẤT CÁC GIẢI PHÁP CÔNG NGHỆ

2.2.1. Lựa chọn kiến trúc CNTT phục vụ chƣơng trình chạy Phần mềm

tra cứu Từ điển Thống kê trực tuyến

2.2.2. Hoàn thiện cơ sở hạ tầng CNTT

- Hiện tại, máy chủ hiện có hoạt động không ổn định, dung lượng hạn chế,

không đủ để đáp ứng công việc, do đó cần phải nâng cấp máy chủ hiện nay này

nhằm tăng khả năng lưu trữ dữ liệu cho hệ thống: Cần xây dựng thêm hệ thống dự

phòng; Cần xây dựng ngay hệ thống tường lửa để có thể tránh được các nguy cơ mất

an toàn dữ liệu; Phải trang bị thiết bị lưu trữ càng sớm càng tốt; Tăng thêm các

đường truyền phụ để đảm bảo tính ổn định của hệ thống; Hệ thống cung cấp nguồn

điện cần phải thay thế hoặc trang bị thêm thiết bị lưu điện. Hệ thống thiết bị giám sát

hoạt động và theo dõi môi trường cần phải được trang bị giúp có thể theo dõi trạng

thái của hệ thống để đảm bảo hệ thống được hoạt động theo dự kiến.

- Hiện tại với những phân tích trên về cơ sở hạ tầng CNTT trên, nếu Phần mềm

Page 11: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

11

cài đặt trên web của Viện KHTK, thì cần nghiên cứu lại phương án tối ưu giữa thuê

và đầu tư mới.

- Xây dựng quy chế Môi trường hoạt động.

2.2.3. Lựa chọn công nghệ, phần mềm để xây dựng Phần mềm Từ điển

Thống kê trực tuyến

Từ điển Thống kê trực tuyến nên sử dụng hướng phát triển ứng dụng trên nền

Web. Căn cứ số lượng thuật ngữ của Từ điển, đề xuất sử dụng công nghệ như sau:

(1) Máy chủ triển khai

(2) Cơ sở dữ liệu

Các chương trình thuộc loại này hỗ trợ khả năng lưu trữ, sửa chữa, xóa và tìm

kiếm thông tin trong một cơ sở dữ liệu (CSDL). Tuy nhiên, đa số hệ quản trị CSDL

trên thị trường đều có một đặc điểm chung là sử dụng ngôn ngữ truy vấn theo cấu

trúc mà tiếng Anh gọi là Structured Query Language (SQL). Phần lớn các hệ quản

trị CSDL kể trên hoạt động tốt trên nhiều hệ điều hành khác nhau như: Linux, Unix

và MacOS ngoại trừ SQL Server của Microsoft chỉ chạy trên hệ điều hành

Windows.

- MySQL là cơ sở dữ liệu mã nguồn mở phổ biến nhất do sự ổn định và cơ chế

xử lý nhanh, được nhiều người sử dụng và đáng tin cậy, cũng sử dụng MySQL để

tiết kiệm thời gian và chi phí đối với các website có dung lượng lớn. Ngoài ưu điểm

là mã nguồn mở phổ biến nhất, MySQL còn là cơ sở dữ liệu được chọn cho các ứng

dụng xây dựng trên nền Linux, Apache,… chạy trên nhiều flatform có thể linh hoạt

trong việc sử dụng.

- SQL Server, hiện nay Tổng cục Thống kê đang sử dụng hệ quản trị SQL

Server và định hướng giai đoạn 2016-2020 vẫn tiếp tục sử dụng hệ quản trị này. Nếu

web tra cứu Từ điển Thống kê đặt tại web

http://www.gso.gov.vn/Default.aspx?tabid=217 thì lựa chọn SQL Server là ưu tiên

hàng đầu.

2.2.4. Ngôn ngữ lập trình để triển khai và Framework

- Ngôn ngữ lập trình

Khi lập kế hoạch cho một giải pháp phần mềm, có nhiều ngôn ngữ lập trình

khác nhau để lựa chọn. Sự lựa chọn của bạn có thể phụ thuộc vào nhiều nhân tố.

Nếu sự lựa chọn của bạn phải phụ thuộc vào những gì sẵn có thì có thể bạn sẽ phải

miễn cưỡng chấp nhận và tiếp cận một cách không dễ dàng. Hoặc sẽ tốn nhiều thời

gian để phát triển lại các thành phần mà lẽ ra có thể tái sử dụng được, điều này khiến

cho các tài liệu trở thành khó khăn rất lớn. Với quy mô web nhỏ thì lựa chọn ngôn

ngữ PHP là phù hợp nhất.

Page 12: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

12

- Framework Laravel để phát triển

Để có lập trình Web thì cần thiết có Framework, lựa chọn Framework Laravel

là PHP framework hot nhất hiện nay, phù hợp với web nhỏ và đơn giản như

Web đề xuất.

CHƢƠNG 3

ĐỀ XUẤT GIẢI PHÁP NGHIỆP VỤ VÀ

TỔ CHỨC THỰC HIỆN TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ

Đây là chương quan trọng nhất của Đề tài, ngoài những giải pháp tin học thì

giải pháp nghiệp vụ và tổ chức thực hiện như thế nào để có thể thực hiện được việc

tin học hóa là nhiệm vụ trọng tâm và không thể thiếu.

3.1. ĐỀ XUẤT GIẢI PHÁP NGHIỆP VỤ TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ

3.1.1. Rà soát nội dung cuốn Từ điển Thống kê

Từ điển Thống kê bao gồm 2300 từ, thuật ngữ thống kê được kết cấu thành 3

phần chính, bao gồm: Phần I. Lý thuyết thống kê, toán, tin học ứng dụng trong thống

kê; Phần II. Thống kê kinh tế; và Phần III. Thống kê Xã hội và môi trường. Trong

mỗi phần lại được sắp xếp theo lĩnh vực liên quan. Phần I bao gồm 3 lĩnh vực. Phần

II bao gồm 6 lĩnh vực. Phần III bao gồm 9 lĩnh vực. Bên cạnh các nội dung chính,

Từ điển Thống kê còn đưa ra bảng tra cứu thuật ngữ Anh - Việt, tên tiếng anh của

2300 từ, thuật ngữ đã được biên soạn cẩn thận dựa trên tài liệu sẵn có. Để phục vụ

cho mục tiêu đặt ra của đề tài, BCN đề tài đưa ra những nội dung rà soát bao gồm

những vấn đề cụ thể sau:

3.1.1.1. Số lượng từ, thuật ngữ theo vần Anphabeta

Tổng số từ, thuật ngữ của cuốn Từ điển Thống kê là 2300, trong đó số lượng từ

phân loại theo chữ cái chi tiết theo bảng sau:

Bảng 3.1: Số lượng từ, thuật ngữ của Từ điển Thống kê theo vần Anphabeta

(Chi tiết tại báo cáo tổng hợp)

3.1.1.2. Số lượng từ, thuật ngữ thống kê theo cấu trúc từ

Trong cuốn Từ điển Thống kê này, hầu hết các từ được giải thích theo cấu

trúc bao gồm những nội dung như: khái niệm, ý nghĩa, ví dụ, công thức tính (nếu

có). Để định lượng được chính xác, BCN đề tài phân thành 3 loại như sau:

Loại 1: Từ thuật ngữ chỉ đưa ra khái niệm

Loại 2: Từ, thuật ngữ có khái niệm, ví dụ nhưng không có công thức tính

Loại 3: Từ, thuật ngữ có khái niệm, công thức tính kèm theo và có thể có

cả ví dụ

Page 13: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

13

Bảng 3.2: Số lượng từ, thuật ngữ của Từ điển Thống kê sắp xếp theo cấu trúc từ

Lĩnh vực Loại 1 Loại 2 Loại 3 Tổng

1.2. Lý thuyết thống kê 176 90 64 330

1.2. Toán ứng dụng trong thống kê 45 13 32 90

1.3. Tin ứng dụng trong thống kê 80 - - 80

2.1. Thống kê TKQG và kinh tế tổng hợp 140 3 27 170

2.2. Thống kê tài chính, tín dụng, ngân hàng,

chứng khoán và bảo hiểm 194 - 26 230

2.3. Thống kê NLNTS 107 - 33 140

2.4. Thống kê Công nghiệp 51 - 19 70

2.5. Thống kê VĐT, XD và BĐS 81 - 9 90

2.6. Thống kê TMDVGC 212 - 38 250

3.1. Thống kê DS, LĐ &VL 143 1 66 210

3.2. Thống kê GD&ĐT 82 - 28 110

3.3. Thống kê KH&CN 63 - 7 70

3.4. Thống kê VHTT&TDTT 85 - 15 100

3.5. Thống kê YT&CSSKCĐ 50 - 50 100

3.6. Thống kê TP&TTANXH 76 - 14 90

3.7. Thống kê BĐG&TBPN 8 - 22 30

3.8. Thống kê MSDC 21 - 29 50

3.9. Thống kê ĐKTN&MT 58 - 32 90

Tổng 1612 107 511 2300

3.1.1.3. Từ, thuật ngữ gần giống tên các chỉ tiêu thống kê

Có một số từ, thuật ngữ đã được quy định trong Hệ thống chỉ tiêu thống kê

quốc gia cũng như Luật Thống kê năm 2015, tuy nhiên trong Từ điển Thống kê đặt

tên gọi còn có sự khác biệt. BCN lọc ra những từ/thuật ngữ đó để phục vụ việc cập

nhật sau này. Một số thuật ngữ liệt kê theo bảng dưới đây:

Bảng 3.3: So sánh tên từ/thuật ngữ theo Luật Thống kê năm 2015

(Chi tiết tại báo cáo tổng hợp)

3.1.1.4. Từ, thuật ngữ theo nguồn tài liệu

Page 14: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

14

Cuốn Từ điển Thống kê này được biên soạn trên cơ sở kế thừa cuốn Từ điển

Thống kê xuất bản năm 1977; kết quả nghiên cứu Đề tài cấp Bộ “Nghiên cứu biên

soạn Từ điển Thống kê” do TS. Đỗ Thức làm chủ nhiệm đề tài và tham khảo một số

cuốn từ điển, như: Oxford Dictionary Statistics (University Press, 2002); Statistics

Glossary (OECD, 2010) và một số cuốn từ điển chuyên ngành khác. Phần thống kê

kinh tế, xã hội gồm nhiều lĩnh vực có nghiên cứu, tham khảo Luật chuyên ngành.

Ngoài ra, các chỉ tiêu thống kê ở các ngành, lĩnh vực cũng được biên soạn dựa trên

cơ sở Hệ thống chỉ tiêu thống kê quốc gia đã được Thủ tướng Chính phủ ban hành

theo Quyết định số 43/2010/QĐ-TTg ngày 02/6/2010. Mặc dù quyết định này đã

được thay thế bằng Luật Thống kê năm 2015, tuy nhiên Từ điển Thống kê được căn

cứ vào tên chỉ tiêu thống kê của Quyết định số 43, nên BCN đề tài vẫn rà soát lại

theo quyết định này, nhằm hoàn thiện hơn.

Hiện nay, cuốn Từ điển Thống kê này có 260 chỉ tiêu có trong Hệ thống chỉ

tiêu thống kê quốc gia (cũ) có nhiều chỉ tiêu được tách nhỏ ra, và có những chỉ tiêu

không hoàn toàn trùng khớp cụ thể như trong báo cáo tổng hợp.

Rà soát cuốn Từ điển Thống kê theo nguồn tham khảo sẽ là một thông tin làm

cơ sở dữ liệu cho Phần mềm tra cứu Từ điển.

3.1.1.5. Đề xuất hoàn thiện Từ điển phục vụ tin học hóa

Nhằm hoàn thiện cuốn Từ điển Thống kê Việt Nam, BCN đề xuất một số nội

dung sau:

- Thứ nhất, rà soát các lỗi chính, cập nhật nội dung Từ điển

- Thứ hai, rà soát tên tiếng anh các từ, thuật ngữ

- Thứ ba, xem xét bổ sung thêm từ thuật ngữ thống kê

Có nhiều tài liệu mới ban hành so thời gian phát hành cuốn Từ điển Thống kê,

kèm theo đó là những khái niệm, nội dung mới, xem xét bổ sung thêm một số thuật

ngữ được quy định trong Luật Thống kê năm 2015 vì đây hầu hết là những từ, thuật

ngữ mới. Ngoài ra, khi đã được quy định trong Luật, đơn vị chịu trách nhiệm hàng

năm sẽ phải thu thập thông tin về chỉ tiêu đó, vì thế nên lựa chọn và giải thích thêm

vào cuốn Từ điển Thống kê này, cụ thể xem báo cáo tổng hợp.

3.1.2. Rà soát phục vụ xây dựng cơ sở dữ liệu cho Phần mềm tra cứu Từ

điển Thống kê

BCN đề tài đề xuất một số nội dung xây dựng cơ sở dữ liệu:

3.1.2.1. Cơ sở dữ liệu về nội dung thể hiện của 1 từ, thuật ngữ

Cần xây dựng một cơ sở dữ liệu về nội dung của Phần mềm tra cứu, nghĩa là

khi tìm kiếm 1 từ, thuật ngữ nào đó thì hiển thị của mỗi từ, thuật ngữ gồm những

thông tin gì ngoài nội dung của từ, thuật ngữ có sẵn trong cuốn Từ điển Thống kê.

Page 15: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

15

Tham khảo các Phần mềm tra cứu Từ điển Thống kê, BCN đề xuất cần có nội dung

rà soát sau:

Tên từ,

thuật

ngữ

Tên

tiếng

anh

Nội dung

của từ, thuật

ngữ trong

Từ điển

Thống kê

Lĩnh vực

liên quan

Bối cảnh

của định

nghĩa

Nguồn

tham

khảo

Các liên

kết với

những định

nghĩa có

liên quan

(1) (2) (3) (4) (5) (6) (7)

Từ,

thuật

ngữ 1

...

Từ,

thuật

ngữ

2300

Giải thích các cột đề xuất

(1) Tên từ, thuật ngữ, toàn bộ danh sách 2300 từ, thuật ngữ của Từ điển Thống

kê được liệt kê lại và đưa làm một trường dữ liệu.

(2) Tên tiếng anh từ, thuật ngữ, danh sách 2300 tên từ, thuật ngữ của Từ điển

thống kê được chuyển sang tiếng Anh.

(3) Nội dung của từ, thuật ngữ trong Từ điển Thống kê, dữ liệu này là phần

giải thích nội dung của từ, thuật ngữ trong Từ điển Thống kê, tuy nhiên để đáp ứng

Phần mềm cũng cần có thời gian chuyển sang dạng cơ sở dữ liệu, một loại nào phù

hợp để chuyển đổi.

(4) Lĩnh vực liên quan, cần có danh mục các lĩnh vực đã được đưa ra để biết từ,

thuật ngữ đó thuộc lĩnh vực nào.

(5) Bối cảnh của định nghĩa, nếu có thể hãy trình bày thông tin ra đời của từ,

thuật ngữ.

(6) Nguồn tham khảo, phần rà soát này rất mất thời gian và công sức, tuy nhiên

có được nội dung này khiến từ điển thêm có giá trị, độ tin cậy cao.

(7) Các linh liên kết với những định nghĩa có liên quan, mục này giúp Từ điển

Thống kê có tính so sánh với link ở nguồn tài liệu khác tốt, nên bổ sung để làm

phong phú từ điển.

3.1.2.2. Cơ sở dữ liệu phục vụ tính năng khác

Ngoài cơ sở dữ liệu về nội dung thể hiện của 1 từ, thuật ngữ, còn xây dựng cơ

sở dữ liệu cần thiết các tính năng của phần mềm: (1) Cơ sở dữ liệu về danh mục

Page 16: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

16

lĩnh vực trong từ điển, phục vụ phần hiển thị trên giao diện tra cứu; (2) Cơ sở dữ liệu

về danh mục từ, thuật ngữ theo Bảng chữ cái; (3) Cơ sở dữ liệu về giới thiệu, hướng dẫn

tra cứu, dữ liệu danh mục người dùng; (4) Cơ sở dữ liệu phục vụ tìm kiếm nâng cao; (5)

Cơ sở dữ liệu về quản trị hệ thống.

3.1.3. Đề xuất nội dung Phần mềm tra cứu và cập nhật Từ điển Thống kê

3.1.3.1. Tính năng Phần mềm

a. Tính năng tìm kiếm

Đây là tính năng quan trọng nhất của Phần mềm tra cứu, BCN đề xuất một số

cách tra cứu từ điển như sau:

- Tìm kiếm theo từ, cụm từ, khi gõ một từ, cụm từ bất kỳ trên bảng kết quả sẽ

hiện ra từ, thuật ngữ trong Danh mục 2300 từ, thuật ngữ của Từ điển Thống kê chứa

từ, cụm từ vừa tìm kiếm.

- Tìm kiếm nâng cao, tương tự như phần tìm kiếm theo từ, cụm từ, nhưng hỗ

trợ tìm kiếm từ chính xác ngay khi kèm với nó là những điều kiện ràng buộc đi theo.

b. Hiển thị từ, thuật ngữ theo Bảng chữ cái

Để thuận lợi cho việc tìm kiếm, và có thể nhìn thấy ngay các từ/thuật ngữ của

Từ điển Thống kê. Phần mềm tra cứu xây dựng tính năng hiện thị tên từ, thuật ngữ

này hiển thị sẵn có phân theo Bảng chữ cái

c. Hiển thị từ, thuật ngữ theo lĩnh vực thống kê

Tương tự phần hiển thị theo Bảng chữ cái, Phần mềm xây dựng tính năng hiển

thị theo Lĩnh vực thống kê. Tính năng này giúp cho việc dễ dàng tìm kiếm từ, thuật

ngữ đã được phân theo Lĩnh vực thống kê có trong Từ điển Thống kê.

d. Truy cập

Tính năng này giới hạn người truy cập, buộc phải có tài khoản mới có thể truy

cập vào Phần mềm tra cứu.

e. Đánh dấu, lưu lại, xem lại

Tính năng này giúp lưu lại, xem lại kết quả đã được tìm kiếm. Người dùng có

thể xem lại lịch sử tìm kiếm và tra cứu trong phần Lịch sử tìm kiếm.

f. Hỏi đáp

Tính năng này giúp giải đáp các thắc mắc của người truy cập về các vấn đề

xung quanh cuốn Từ điển Thống kê.

g. Quản trị dữ liệu

Page 17: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

17

Đây là tính năng đặc biệt quan trọng khi Phần mềm hướng tới việc cập nhật Từ

điển Thống kê. Việc quản trị dữ liệu sẽ có nội dung khả năng xóa, thêm, sửa nội

dung của cuốn Từ điển Thống kê

h. Liên hệ

Tính năng này giúp người dùng có thể liên hệ người quản trị, đóng góp ý kiến,

nhận định, đánh giá, góp ý về Từ điển Thống kê. Tính năng này

i. Một số tính năng khác

Các tính năng xem xét là: (1) Tính năng cho phép người dùng từ tạo danh

mục và danh sách từ của riêng mình; (2) Tự động tải các dữ liệu về máy để người

dùng có thể tra cứu và sử dụng ngay cả khi không có kết nối mạng; (3) Tính năng

lưu dữ liệu liên quan Từ điển Thống kê (phần này quan trọng, lưu giữ tài liệu liên

quan từ lúc bắt đầu xây dựng Từ điển Thống kê đến lúc phát hành) .

3.1.3.2. Đề xuất Giao diện Phần mềm

Mô hình giao diện dự kiến như sau:

3.2. GIẢI PHÁP TỔ CHỨC THỰC HIỆN TIN HỌC HÓA TỪ ĐIỂN THỐNG KÊ

Khâu cuối cùng sau khi có những ý tưởng xây dựng Web tra cứu Từ điển

Thống kê là tổ chức thực hiện đưa Web triển khai vào thực tế. Có rất nhiều vấn

đề đặt ra và cần giải quyết. BCN đề xuất các giải pháp sau:

3.2.1. Thành lập nhóm Từ điển Thống kê

Đây không phải lần đầu tiên đề xuất nhóm này, Viện KHTK được thành

lập từ việc ghép lại của 3 đơn vị trong đó có Tổ Từ điển Thống kê. Từ điển

Thống kê là sản phẩm đầu ngành, chứa khối lượng tri thức lớn về khoa học

Thống kê. Từ điển Thống kê phải được thường xuyên cập nhật theo sự phát

Page 18: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

18

triển của ngành, đổi mới về phương pháp luận và hội nhập với các tổ chức thống

kê khu vực, thống kê toàn cầu. Vì vậy thành lập nhóm này là rất cần thiết.

3.2.2. Tƣ liệu hóa tài liệu trong quá trình xây dựng Từ điển Thống kê

Nhiều năm sau khi cuốn Từ điển Thống kê 1977 được phát hành nhưng

chưa được tái bản một phần nào nguyên nhân là do những tư liệu về quá trình

xây dựng từ điển không được lưu giữ lại. Trong 4 năm từ 2011 đến 2015 triển

khai biên soạn cuốn Từ điển Thống kê có nhiều phiên bản cuốn từ điển đã được

biên soạn, nhiều ý kiến góp ý của chuyên gia về cuốn từ điển, nhiều lần hội

nghị, hội thảo về tổ chức thực hiện biên soạn Từ điển Thống kê. Tất cả đều cần

được tư liệu hóa và lưu giữ lại làm tài liệu cho lần tái bản lần sau.

3.2.3. Xây dựng quy chế ngƣời truy cập

Tăng cường hỗ trợ người dùng tin tiếp cận được với phần mềm tra cứu.

Xây dựng quy chế người truy cập để đáp ứng tối đa nhu cầu của người dùng,

nhất là việc tiếp nhận và giải đáp các phản hồi của người dùng tin .

3.2.4. Đảm bảo đủ nguồn lực cho hoạt động phần mềm tra cứu

Để thuận lợi nhất cho việc quản lý và vận hành Phần mềm, cần lựa chọn một

đơn vị thuộc TCTK để quản lý. Đơn vị quản lý có vai trò như admin, can thiệp vào

các tính năng có của phần mềm. Đặc biệt, là đơn vị chủ trì cập nhật Từ điển

Thống kê khi có chỉ đạo. Đối tượng sử dụng của Phần mềm, trước tiên hướng đến

các cán bộ ngành thống kê, việc truy cập phần mềm bằng tài khoản email nội bộ của

ngành. Ngoài ra, để mở rộng đối tượng sử dụng và quảng bá ngành thống kê, nên

hướng đến những người sử dụng ngoài ngành. Tuy nhiên, để đảm bảo tính bảo lập cần

thiết lập hệ thống truy cập. Duy trì, vận hành Từ điển Thống kê bao gồm 2 yếu tố: (1)

Bảo trì, nâng cấp phần mềm theo định kỳ; (2) Duy trì, nâng cấp nội dung hay cơ sở dữ

liệu và các tính năng của Phần mềm.

3.2.5. Nguồn kinh phí

Nguồn kinh phí xây dựng và thực hiện triển khai xây dựng phần mềm tra

cứu do ngân sách nhà nước bảo đảm, được bố trí theo phân cấp quản lý ngân

sách nhà nước hiện hành.

3.2.6. Hợp tác với các đơn vị về vận hành, quản lý các phần mềm thống kê

Tổng cục Thống kê có vận hành các phần mềm tra cứu như Phần mềm

danh mục hành chính; danh mục nghề nghiệp; phần mềm tra cứu từ điển 3 thứ

tiếng. Cần có mối liên hệ hợp tác để học hỏi kinh nghiệm, phương thức triển

khai để phù hợp với quy định chung của ngành.

Page 19: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

19

KẾT LUẬN VÀ KHUYẾN NGHỊ

1. Kết luận

Ngày nay, CNTT và truyền thông phát triển không ngừng và đạt những thành

tựu đáng kể trong hầu hết các lĩnh vực, hoạt động trong đó có việc khai thác, tra cứu

các nguồn tài liệu sách. Thực tế cho thấy việc tra cứu các nguồn tài liệu nhờ CNTT trở

nên phong phú và dễ dàng. Tài liệu không chỉ biểu hiện bằng giấy mà còn lưu trữ

dạng sách điện tử hay các công cụ tra cứu trực tuyến, nó vừa đáp ứng nhu cầu người

dùng và tiết kiệm đối với người sử dụng. Quyết định số 1428/QĐ-TCTK, ngày

25/12/2014 của Tổng cục trưởng Tổng cục Thống kê về “Tuyên truyền kiến thức

thống kê cho cộng đồng và các đối tượng sử dụng thông tin thống kê”, trong đó nhấn

mạnh vai trò của tin học hóa.

Trong khuôn khổ của đề tài, trên cơ sở nghiên cứu về vấn đề tin học hóa, giải

pháp tin học hóa từ điển, đề tài đã đáp ứng được Thuyết minh nghiên cứu đã được

Hội đồng phê duyệt, đi đúng định hướng và đạt được những kết quả nhất định. Cuốn

Từ điển Thống kê cơ bản bao quát hết các hoạt động thống kê, lĩnh vực thống kê,

được đánh giá biên soạn công phu. Tuy nhiên, để tin học hóa Từ điển Thống kê thì

cần xây dựng cơ sở dữ liệu cho Từ điển Thống kê như đã nêu trong chương II của đề

tài. Một nội dung khá quan trọng, không thể thiếu khi nhắc đến CNTT là nền tảng cơ

sở hạ tầng. Nếu chúng ta có đủ CSDL nhưng hạ tầng CNTT không đáp ứng được

yêu cầu đặt ra thì chỉ tin học hóa từ điển sẽ gặp nhiều khó khăn. Đề tài đã mạnh dạn

đưa ra thực trạng về nền tảng CNTT của Viện KHTK, của TCTK nhằm có cơ sở

triển khai tin học hóa Từ điển Thống kê. Việc học hỏi các phần mềm tra cứu từ điển

trên internet là rất cần thiết, ngày nay có rất nhiều các web tra cứu tư liệu, sách báo,

thông tin đặc biệt là những cuốn từ điển. Đặc thù của từ điển là cấu trúc rõ ràng,

thường là tên từ, thuật ngữ và giải thích từ thuật ngữ đó nên công việc thiết kế tra

cứu trực tuyến sẽ dễ dàng hơn tra cứu những tài liệu khác. Để có những tư liệu, đề

tài nghiên cứu những web tra cứu từ điển, bảng thuật ngữ thống kê, tìm ra những

mặt được, hạn chế của web tra cứu, cơ sở cho mục tiêu nghiên cứu của đề tài. Một

nội dung nữa đề tài đưa ra đó là đề xuất nội dung, công nghệ của phần mềm tra cứu

trực tuyến. Đề tài mạnh dạn đề xuất mô hình Web tra cứu trực tuyến với các tính

năng cần thiết và ban đầu mô phỏng giao diện Web tra cứu.

Tuy nhiên, trong quá trình nghiên cứu BCN đề tài xin được thay đổi Đề cương

báo cáo tổng hợp phù hợp với logic vấn đề. Kết quả chính của đề tài là đưa ra các

vấn đề cần phải chuẩn bị trước khi xây dựng Phần mềm tra cứu. Đề tài vẫn còn tồn

đọng nhiều hạn chế, chưa được như mong muốn của BCN đề tài, cụ thể đó là phần

rà soát cuốn Từ điển Thống kê nhằm xây dựng cơ sở dữ liệu cho phần mềm tra cứu

sau này. Đề tài mới chỉ chỉ ra các trường dữ liệu cần rà soát mà không đủ nguồn lực

để đưa ra kết quả rà soát các trường dữ liệu đó. Trường dữ liệu nội dung của từng

Page 20: MÃ ĐỀ TÀI: 2.2.1-CS15 - vienthongke.vnvienthongke.vn/attachments/article/2990/16. 2.2.1-CS15.pdfkhoa học Thống kê đưa ra một số giải pháp để kết hợp tin học

20

từ, thuật ngữ có thể chuyển sang dạng file excel để tiện việc chuyển đổi sang phần

mềm, tuy nhiên việc sao chép, biểu diễn công thức trong Excel lại gặp khó khăn,

mất nhiều thời gian và công sức. Trường dữ liệu quan trọng nữa nêu ra ở trên là

nguồn gốc của nội dung các từ thuật ngữ, rà soát vấn đề này cần người có tầm hiểu

biết rộng về các hoạt động thống kê của ngành… và các vấn đề về trường dữ liệu

khác nữa. Đề tài chưa đủ điều kiện đề thực hiện nội dung này mặc dù đã có ý tưởng

thực hiện.

2. Khuyến nghị

(1) Xây dựng Phần mềm tra cứu Từ điển Thống kê dưới dạng Web tra cứu đặt

tại web của Viện Khoa học Thống kê;

(2) Xây dựng Cơ sở dữ liệu về cuốn Từ điển Thống kê Việt Nam với các

trường dữ liệu đã đề cập trong phần chương II. Viện KHTK là đơn vị chủ trì việc

xây dựng CSDL này, khuyến nghị là đơn vị có bản word cuối cùng của cuốn Từ

điển Thống kê để tạo điều kiện thuật lợi nhất hoàn thành CSDL.

(3) Nâng cấp hạ tầng Công nghệ thông tin của Viện Khoa học Thống kê đáp

ứng xây dựng Web tra cứu;

(4) Thành lập nhóm Từ điển Thống kê, cập nhật thường xuyên cuốn Từ điển

Thống kê.

DANH MỤC TÀI LIỆU THAM KHẢO

1. PGS.TS. Hoàng Đức Liên và Nguyễn Hữu Ty (2011), “Giải pháp xây dựng

các bộ sưu tập tài liệu số”;

2. CN. Hoàng Minh Thiện (2014), “Củng cố kho thông tin tư liệu khoa học

thống kê kết hợp tin học hóa”;

3. TS.Thiều Văn Tiến (2005), “Nghiên cứu và đề xuất giải pháp công nghệ tin

học hóa công tác xử lý số liệu thống kê tháng, quý, năm do các Cục Thống kê

thực hiện”;

4. TS. Nguyễn Thị Bạch Tuyết (2011) “Tin học hóa quá trình quản lý hồ sơ tư

vấn cho các công ty tư vấn Bộ Xây dựng”;

5. Tổng cục Thống kê (2016), “Từ điển Thống kê”;

6. http://stats.oecd.org/glossary/

7. http://www.oxfordreference.com/view/

8. http://stattrek.com/statistics/dictionary.aspx

9. http://www.hmu.edu.vn/news/dict.aspx.