thỐng kÊ chÍnh thỨc vỚi bigdata: kinh nghiỆm quỐc tẾ

22
Người trình bày: Nguyễn Văn Đoàn Viện trưởng Viện Khoa học Thống kê THỐNG KÊ CHÍNH THỨC VỚI BIGDATA: KINH NGHIỆM QUỐC TẾ VÀ ĐỊNH HƯỚNG CỦA TỔNG CỤC THỐNG KÊ Hà Nội, 10/2015 1

Upload: doannhi

Post on 04-Feb-2017

236 views

Category:

Documents


3 download

TRANSCRIPT

Người trình bày: Nguyễn Văn Đoàn

Viện trưởng Viện Khoa học Thống kê

THỐNG KÊ CHÍNH THỨC VỚI BIGDATA:

KINH NGHIỆM QUỐC TẾ VÀ

ĐỊNH HƯỚNG CỦA TỔNG CỤC THỐNG KÊ

Hà Nội, 10/2015

1

Nội dung

2

1. Một vài số liệu thống kê được SX từ nguồn Bigdata

2. Dự án “Vai trò của Bigdata trong hiện đại hóa SXTK”

3. Ủy ban Thống kê LHQ với Big data

4. Cơ quan thống kê quốc gia của một số nước với Big data

5. Ứng dụng Bigdata trong thống kê giá (CPI)

6. Định hướng của Tổng cục Thống kê về Big data

1. Một vài số liệu thống kê được sản xuất từ nguồn Bigdata

3

Số liệu thống kê về tin nhắn của Hà Lan (xem đồ thị)

• Nguồn số liệu: Phương tiện truyền thông

• Phân tích, kết luận

- 50% số tin nhắn vô nghĩa

- Chi khoản tiền lớn, không mang lợi ích.

• Kiến nghị với Chính phủ:

- Cần có điều chỉnh hoạt động tin nhắn

• Tác động

- Tránh lãng phí

- Mang lại lợi ích kinh tế

- Nâng vị thế của cơ quan thống kê quốc gia

(1) Nguồn : Xem mục số 27 trong tài liệu http://www1.unece.org/stat/platform/pages/viewpage.action?pageId=77170614

1. Một vài số liệu (2)

4

10 lĩnh vực thống kê chính thức được

sản xuất từ Big data

• Thống kê kinh tế và tài chính: 48.1%

• Thống kê xã hội và nhân khẩu học: 44.2%

• Thống kê giá: 38.5%

• Thống kê lao động: 21.2%

• Thống kê: 19.2%

• Thống kê du lịch: 17.3%

• Thống kê môi trường: 13.5%

• Thống kê vận tải: 13.5%

Nguồn: 2Results of the UNSD/UNECE Survey of Big data

State Street PriceStats

5

PriceStats is a provider of high-frequency global

inflation indices that offer insights into key

macroeconomic variables. The indices are generated using

software that scans the underlying code on public websites

to capture the full array of products sold by online

retailers, including food, beverages, electronics, apparel,

furniture, household products…The technology monitors

price fluctuations on roughly five million items sold by

hundreds of online retailers in more than 70 countries. The

PriceStats methodology is grounded in the extensive body

of research of MIT professors Alberto Cavallo and Roberto

Rigobon and their Billion Prices Project at MIT. Cavallo

and Rigobon have leveraged this research and their

expertise in monetary economics to develop the PriceStats

indices

Through the partnership announced on May 5, 2011, between PriceStats and State Street Global

Markets, this unique body of infl ation research is incorporated into advisory research analyses and

investment strategy publications across major asset classes and distributed through State Street Global

Markets’ proprietary client research portal, IR3. The partnership, which is housed within State Street

Global Markets’ academic affiliate, State Street Associates, will benefit from 13 years of experience in

bringing leading academic research in finance and economics to sophisticated institutional investors

around the world.

So sánh CPI-Bigdata với CPI truyền thống

6

Agentina Mỹ

PriceStats for 22 Countries:

Argentina, Australia, Brazil, Canada, Chile, China, Colombia, France, Germany, Greece, Ireland,

Italy, Japan, Korea, Netherlands, Russia, South Africa, Spain, Turkey, United Kingdom, Uruguay

and the United States.

7

Steve Landefeld (2014), “Uses of Big Data for Official Statistics”

2. Dự án “Vai trò của Big data trong hiện đại hóa sản xuất thống kê ”

8

Năm 2010, UNECE thành lập Nhóm Công tác về hiện đại hóa SXTK

• Giám sát, điều phối công việc quốc tế liên quan đến hiện đại hóa SXTK

Năm 2014, triển khai Dự án “Vai trò của Bigdata trong hiện đại hóa

SXTK”:

• Mục tiêu của dự án

- Hướng dẫn NSOs về chiến lược, phương pháp luận mà Big data đặt ra

- Chứng minh tính khả thi, hiệu quả sử dụng Bigdata so với TK truyền thống

- Chia sẻ kiến thức, kinh nghiệm, công cụ và PP SXTK từ Bigdata.

• Nội dung dự án:

- Bảo mật thông tin riêng tư

- Đối tác

- Chất lượng số liệu

- Công nghệ

(3) UNECE (2013) what does “big data” mean for official statistic? Report of the Hight-level Group for the

Modemisation of Statistical Production and Services (HLG). http://www1.unece.org/stat/platform/display/hlgbas

2. Dự án (2)

9(3) UNECE (2013) what does “big data” mean for official statistic? Report of the Hight-level Group for the

Modemisation of Statistical Production and Services (HLG). http://www1.unece.org/stat/platform/display/hlgbas

Tên nhóm Số thành viên (TV) Nhiệm vụ

Bảo mật

thông tin

riêng tư

11 TV đến từ 9 cơ

quan NSOs quốc gia,

quốc tế, Viện, Trường

Xem xét các công cụ sẵn có để quản lý rủi ro

trong bảo mật thông tin riêng tư, tập trung vào

các đặc điểm và tác động của Big data đối với

thông tin riêng tư;

Đối tác

12 TV đến từ 8 cơ

quan NSOs quốc gia

và quốc tế

Xây dựng mối quan hệ đối tác với các cơ quan,

tổ chức có nguồn Bigdata, với cộng đồng khoa

học, nhà cung cấp công nghệ…

Chất lượng

số liệu

13 TV đến từ 9 cơ

quan NSOs quốc gia

và quốc tế

Thiết kế khung chất lượng cho Big data

Công nghệ

38 TV đến từ 18 cơ

quan NSOs quốc gia

và quốc tế

Thiết kế, cài đặt và sử dụng môi trường máy

tính truy cập web, các công cụ và phương pháp

sản xuất số liệu thống kê chính thức từ nguồn

Big data.

2. Dự án (3)

10

• Kết quả Dự án

- Tổ chức Hội nghị quốc tế về “Big data trong Thống kê chính

thức” tổ chức tại Bắc Kinh, năm 2014

- Hoàn thiện kết quả của dự án được thực hiện năm 2015

- Tổ chức Hội thảo quốc tế về “Bigdata in secure societies” tại

Brussels (Bỉ) vào 30/9/20154

- Tổ chức Hội nghị toàn cầu lần thứ hai về Big data đối với thống

kê chính thức tại Abu Dhabi, United Arab Emirates, 20-

22/10/2015 5.

(4) http://www.big-data-europe.eu/event/sc7-brussels-2015/(5) Chủ đề cuộc hội thảo này là “Moving from examples to guidelines” (tạm dịch là “Chuyển từ các ví dụ đến hướng dẫn thực hành”),

nhằm thúc đẩy sự phát triển của Big data thêm một bước nữa.

3. Ủy ban thống kê Liên hợp quốc với Big data

11

Big Data Seminar at the 44th UNSC: 2/2013, New York

Big Data Seminar at the 45th UNSC: 3/2014, New York

• Thành lập GWG: Nhóm Công tác toàn cầu về Big data

• 28 Thành viên: 18 quốc gia; 10 tổ chức quốc tế.

• Mục tiêu: Giải quyết các vấn đề:

-Phương pháp luận

- Chất lượng

- Bảo mật

- Công nghệ

- Truy cập dữ liệu

- Phân tích chi phí-lợi ích về Big data.

• 18 quốc gia: Australia, Bangladesh, Cameroon, China,

Colombia, Denmark, Egypt, Indonesia, Italy, Mexico,

Morocco, Netherlands, Oman, Pakistan, Philippines, United

Arab Emirates, United Republic of Tanzania, United States of

America.

• 10 tổ chức quóc tế, khu vực tư nhân: Economic and Social

Commission for Asia and the Pacific/Statistical Institute for

Asia and the Pacific, Economic Commission for Europe,

Eurostat, International Telecommunication Union,

Organization for Economic Cooperation and Development,

Statistical Centre for the Cooperation Council for the Arab

Countries of the Gulf, Statistics Division of the Department of

Economic and Social Affairs of the, United Nations, United

Nations Global Pulse, Universal Postal Union, World Bank

3. Ủy ban Thống kê Liên hợp quốc (2)

12

• GWG khẳng định:

Sử dụng Big data cho thống kê chính thức là nghĩa vụ đối với cộng đồng thống kê quốc

tế dựa trên các nguyên tắc cơ bản để đáp ứng sự kỳ vọng của xã hội đối với các sản phẩm

thống kê và cải thiện cách thức làm việc đạt hiệu quả hơn.

• GWG đã hình thành 8 tổ công tác theo các chủ đề:

(1) Vận động và truyền thông

(2) Liên kết Big data và các Mục tiêu Phát triển bền vững

(3) Tiếp cận và quan hệ đối tác

(4) Đào tạo, xây dựng kỹ năng và năng lực thống kê

(5) Dữ liệu từ điện thoại di động

(6) Ảnh vệ tinh

(7) Dữ liệu từ các phương tiện truyền thông xã hội

(8) Các vấn đề liên quan đến nhiều chủ đề của Bigdata

3. Ủy ban Thống kê Liên hợp quốc (3)

13

• GWG công bố kết quả ban đầu

- NSOs các nước tận dụng Big data và phương thức thu thập

- Cách nào để các nhà thống kê đưa Chính phủ điện tử - Thống kê điện tử vàotrung tâm của chuyển đổi chính quyền thông qua khoa học dữ liệu

- Suy luận Big data và mô hình cho thống kê chính thức, với những ứng dụngcủa phân tích hình ảnh vệ tinh.

- Cơ hội và thách thức sử dụng Big data trong thống kê chính thức (nhưquyền riêng tư, bảo mật và Big data v.v...,

- Trình bày kết quả nói trên tại các Hội nghị quốc tế:

+ Big data trong Thống kê chính thức (Bắc Kinh, 2014)

+ Hội nghị IOAS ở Đà Nẵng

+ Đại hội Thống kê thế giới lần thứ 60.

Report_GWG2014_E.pdf) ; ..\..\BigData and modirnization of stat system.pdf

3. Ủy ban Thống kê Liên hiệp quốc (4)

14

• Hoạt động tiếp: Tập trung vào các chủ đề:

(1) Vận động và truyền thông về Big data ;

(2) Liên kết Big data với các Mục tiêu Phát triển bền vững;

(3) Đào tạo, xây dựng các kỹ năng và năng lực;

(4) Giải quyết các thách thức đối với Big data…

(5) Tổ chức hội thảo về Big data với thống kê chính thức

HN toàn cầu lần thứ hai về Bigdata: Tại Abu Dhabi, United Arab Emirates, 10/20157

HN “Toán thống kê: Cơ hội và thách thức với Big data”: Tại Singapore, 12/2015

4. Thống kê quốc gia và khu vực với Big data

15

Communication

Mobile phone data

Social Media

WWW

Web Searches

Businesses'

Websites

eCommerceWebsites

Job Adver-tisements

Real Estate Websites

Internet Traffic

Sensors

Traffic Loops

Smart Meters

Vessel Identification

Satellite Images

Webcams

Process generated

Flight Reservation Systems

Supermarket Cashier Data

Loyalty Programs

Financial Transactions

eGovernment

Mobile Payments

Crowd Sourcing

VGI websites (Open Streetmap)

Community Pictures Collections

Eurostat and the ESS: Big Data Pilots 2016-2019

4. Cơ quan thống kê quốc gia với Big data

16

NSOs Dự án

1. Úc • Sử dụng hình ảnh vệ tinh trong thống kê nông nghiệp

2. Brazil • Sử dụng dữ liệu kiểm soát tần suất nước để lập tài khoản nước

3. Bhutan • Sử dụng công nghệ truyền thông di động để tính CPI

4. Colombia • Sử dụng hình ảnh vệ tinh trong thống kê nông nghiệp và vận tải

5. Estonia • Sử dụng dữ liệu định vị di động trong thống kê thương mại quốc tế

6. Camerom • XD năng lực sử dụng Big data như nguồn số liệu thống kê chính thức

• XD năng lực cho việc sử dụng Big data cho mục đích thống kê

7. Anh

• Khai thác cơ sở dữ liệu thương mại để ước tính số liệu điều tra dân số

• Kiểu dữ liệu Smartmeter cho cấu trúc hộ GĐ/quy mô và nghề nghiệp

• Tiềm năng dữ liệu Smartmeter để phát hiện ngôi nhà vắng chủ

•Aggregated Mobile Phone data to identify commuting patterns 9

4. Cơ quan thống kê quốc gia với Big data

17

NSOs Dự án

8. Mexico

• Tweet analysis

• Thống kê chính thức sử dụng dữ liệu định vị của điện thoại di động

với một ứng dụng cụ thể để xây dựng lưới dân số

9. Trung Quốc

• Big Data Enterprise Statistical Indicator Ten-day Report

• Online Price Changes of Means of Production in Circulation Area in

Shandong Zhuochuang

10. Canada• Non-Residential Buildings Inventory: Feasibility Study

• House market indicators (based on website information)

11. Romania • Using scanner data

12. Nam phi • Assessing use of scanner data for compiling the Consumer Price Index

13. Italy

• Persons and Places: Mobility Estimates based on Mobile Phone Data;

• Use of scanner data for consumer price index;

• Internet as a Data Source for ICT Usage by Enterprises and

Public Institutions

18

4. Cơ quan thống kê quốc gia với Big data (6)

19

11b.Ung dung Bigdata trong CPI.pptx

5. Ứng dụng Bigdata trong thống kê giá

20

Big data là vấn đề rất mới, tiềm năng, thách thức không

nhỏ

Sử dụng Big data để bổ sung hoặc thay thế nguồn dữ liệu

truyền thống

• Minh bạch nguồn dữ liệu đầu vào

• Đảm bảo chất lượng, hiệu quả các hoạt động thống kê

• Hội nhập, đóng góp vào các hoạt động của thống kê thế giới.

Tổng cục Thống kê cần có cách tiếp cận phù hợp

• Vừa học, nghiên cứu, vừa làm

• Làm tốt ngay từ khởi đầu

• Duy trì, cải tiến, nâng lên tầm cao mới

6. Định hướng của Tổng cục Thống kê

6. Định hướng của Tổng cục Thống kê (2)

21

Một số đề xuất

(1) Tổng cục thể hiện quyết tâm, cam kết chính trị

(2) Giao một đơn vị chủ trì

• Thành lập Tổ Công tác Big data:

• Tổ trưởng: LĐ cấp Vụ/tương đương (ít nhất, thuộc diện qui hoạch Vụ trưởng )

• Tổ được chia thành các bộ phận: Phương pháp luận; công nghệ; đối tác…).

• Nhiệm vụ chính của Tổ công tác Big data:

- Xác định tầm nhìn đến năm 2030 về sử dụng Big data cho TCTK

- Xây dựng kế hoạch và triển khai sử dụng Big data.

- Trước mắt, cần nghiên cứu, học hỏi kinh nghiệm của thế giới (tài liệu, hội thảo, tham gia

dự án quốc tế, tham gia khóa đào tạo Big data của khu vực, quốc tế).

- Tiếp theo, chọn một số lĩnh vực đột phá: CPI, ICT, Du lịch... để thử nghiệm và so sánh

với thống kê truyền thống)

(3) Truyền thông về Big data với thống kê chính thức

(4) Xây dựng các đối tác chiến lược về nguồn dữ liệu Big data

(5) Đầu tư nguồn lực.

Thank

You

22