emar - bigdata - tranngocphung - nov2015

11
WHITE PAPER | BIG DATA 1 Digital Marketing Báo cáo đề tài Thực hiện bởi TRẦN NGỌC PHỤNG Sinh viên Marketing K38, UEH Tháng 11.2015

Upload: ngoc-phung-tran

Post on 25-Jan-2017

242 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

1

Digital Marketing

Báo cáo đề tài

Thực hiện bởi TRẦN NGỌC PHỤNG

Sinh viên Marketing K38, UEH

Tháng 11.2015

Page 2: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

2

NỘI DUNG I. Tổng quan ................................................................................................................................ 3

1. Khái niệm ............................................................................................................................. 3

2. Đặc trưng ............................................................................................................................. 3

3. Phân loại ............................................................................................................................... 4

II. Big data và digital marketing ................................................................................................... 6

1. Xu hướng .............................................................................................................................. 6

2. Ứng dụng .............................................................................................................................. 7

3. Nguồn dữ liệu ...................................................................................................................... 8

4. Kết luận ................................................................................................................................ 8

III. Case study: ........................................................................................................................... 9

Facebook: Sử dụng dữ liệu từ người dùng ................................................................................. 9

Page 3: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

3

I. Tổng quan

1. Khái niệm

Theo thống kê từ IBM, lượng dữ liệu tăng thêm mỗi ngày là 2.5x1018 bytes, 90% số đó được tạo ra trong vòng hai năm gần nhất[1]. Hiện tượng bùng nổ công nghệ và thông tin đã làm xuất hiện một thuật ngữ mới: Big Data – Dữ liệu Lớn, đồng thời cũng xuất hiện nhiều quan điểm khác nhau về khái niệm của nó.

Big Data trên Google Trends

Định nghĩa toàn cầu

Big Data là tập hợp một lượng lớn dữ liệu đa đạng nhằm để mở rộng hiểu biết về môi trường, y học, khoa học, thương mại và thực nghiệm con người.

“Big Data - A revolution that will change the way we live, work, think.”

Định nghĩa trong thương mại

Big Data là từ hiện dùng để chỉ lượng lớn dữ liệu có thể sử dụng, thu thập từ các nguồn công nghệ, digital và analog. Big Data dùng để nâng cao hiểu biết về thị trường, từ đó cải thiện thực nghiệm khách hàng và kết quả kinh doanh.

Định nghĩa trong marketing

Big Data là từ hiện dùng để chỉ việc thu thập, xử lý và đưa ra insight từ những thông tin đa dạng về khách hàng, công việc kinh doanh và môi trường.

Big Data được dùng để nâng cao hiểu biết về sở thích, thói quen và sự cân nhắc của khách hàng khi ra quyết định mua hàng với những loại sản phẩm, thương hiệu và kênh phân phối khác nhau.

Việc sử dụng dữ liệu hiệu quả trong marketing dẫn đến sự cải thiện thực nghiệm khách hàng, cải thiện sự trao đổi giá trị giữa khách hàng và doanh nghiệp, từ đó cải thiện kết quả kinh doanh.

2. Đặc trưng

Những nhà khoa học dữ liệu từ IBM, đơn vị tiên phong trong lĩnh vực này, đã liệt kê bốn đặc trưng của dữ liệu lớn như sau:

Page 4: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

4

Volume - Dung lượng: Nhờ sự phát triển của Internet và công nghệ, dữ liệu dần bước vào kỷ nguyên bùng nổ. Lượng dữ liệu có được từ Internet, mạng xã hội, thiết bị di động, máy cảm biến,… càng ngày càng nhiều. Theo Digital Universe và IBM, năm 2012 toàn thế giới có 2.8 ZB (28.000.000.000.000 GB) dữ liệu. Tuy nhiên, điều này cũng dẫn đến hiện tượng “chìm ngập trong dữ liệu”, nghĩa là lượng dữ liệu có xu hướng tăng, nhưng tỷ lệ dữ liệu mà doanh nghiệp có thể xử lý ngày càng giảm.

Lượng dữ liệu hiện có của các doanh nghiệp có xu hướng tăng, trong khi tỷ lệ dữ liệu có thể phân tích ngày càng giảm. (Understanding Big Data, IBM, 2012)

Velocity - Tốc độ: Dữ liệu không chỉ nhiều hơn, mà còn xuất hiện với tốc độ nhanh hơn theo từng ngày. Đơn cử, mỗi giờ Walmart thu về 2.5 petabytes (25.000.000 GB) từ các giao dịch khách hàng; mỗi phút, 205 triệu email được gởi đi.[2]

Variety - Tính đa dạng: Cùng với sự bùng nổ của thiết bị thông minh và thiết bị cảm biến, doanh nghiệp có thêm nhiều nguồn dữ liệu thô, dữ liệu bán cấu trúc lẫn không cấu trúc thông qua website, các chỉ số tìm kiếm, các diễn đàn social media, email, dữ liệu cảm biến,… Với hệ thống phân tích dữ liệu truyền thống, doanh nghiệp sẽ gặp khó khăn khi dữ liệu đa dạng hóa như vậy. Dù một số doanh nghiệp đã chuyển đổi hệ thống, phần lớn chỉ mới ở mức độ bắt đầu hiểu được tiềm năng của Big Data.

Veracity - Tính xác thực: Dữ liệu kém chính xác đưa ra những kết quả phân tích sai lệch. Vì lượng dữ liệu lớn, tốc độ truyền tải nhanh và đa dạng, khó tránh khỏi nguồn dữ liệu từ hoạt động spam và hack. Điều này ảnh hưởng như thế nào? Khi dữ liệu lớn trở thành mấu chốt để đưa ra một quyết định kinh doanh quan trọng, gạn lọc dữ liệu là một công việc cần thiết. Thống kê tại Mỹ cho thấy, trung bình mỗi năm dữ liệu kém chính xác làm nền kinh tế Mỹ thiệt hại 3.1 ngàn tỷ USD.

3. Phân loại

Dưới đây là một số dạng chủ yếu của dữ liệu được xem là Big Data.

Nội dung và hành vi mạng (web behavior and content)

Phạm vi của hành vi mạng (web behavior) rất rộng lớn. Hiện có hơn 5 tỷ trang web trên Internet và mỗi trang có dữ liệu thống kê từ lượng người truy cập, tốc độ truy cập đến hành vi người dùng. Big Data chứa đựng nội dung trên những trang web, song song với sự thay đổi đang xảy ra khi người dùng truy cập. Phân khúc này cũng bao gồm dữ liệu từ các công cụ tìm kiếm.

Page 5: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

5

Nội dung từ người dùng (user-generated content)

Bao gồm dữ liệu tạo thành từ người sử dụng các phương tiện truyền thông xã hội trên toàn cầu: cập nhật trạng thái, tweet, hình ảnh, video, bài blog, diễn đàn, wiki. Email và tương tác giữa các thiết bị di động cũng là nguồn tạo dữ liệu lớn thuộc phân khúc này.

Dữ liệu RFID

RFID là viết tắt của Radio Frequency Identifier – Nhận dạng tần số sóng vô tuyến, là kỹ thuật nhận dạng sóng vô tuyến từ đối tượng được gắn dấu (tag) từ xa, ứng dụng nhằm giảm thiểu sai sót về địa điểm, dây chuyền cung ứng và quản lý thất thoát sản phẩm trong doanh nghiệp. Có khoảng 30 triệu RFIDs vào cuối năm 2011.

Cách thức hoạt động của RFID

Dữ liệu địa lý (geo data)

Phần lớn dữ liệu này tạo ra bởi thiết bị di động. GPS giúp xác định vị trí chính xác ngay cả khi người dùng thực hiện cuộc gọi hay sử dụng công cụ tìm kiếm.

Dữ liệu môi trường

Ví dụ điển hình của loại dữ liệu này là sự biến chuyển của thời tiết, thủy triều và các hoạt động địa chấn được ghi lại sau một khoảng thời gian nhất định.

Dữ liệu vận hành doanh nghiệp

Dữ liệu tạo ra từ hoạt động kinh doanh, trao đổi và giao tiếp với những người liên quan mật thiết với doanh nghiệp, đặc biệt là khách hàng, bao gồm dữ liệu lưu trữ và dữ liệu hiện hành.

Nghiên cứu

Đây là dạng dữ liệu có phạm vi rất rộng, bao gồm thống kê chính phủ trên nhiều phương diện: sức khỏe, giáo dục, kinh tế, nông nghiệp,… và nghiên cứu từ doanh nghiệp, từ các tổ chức giáo dục, đặc biệt là các trường đại học. Nghiên cứu tạo ra lượng lớn dữ liệu đa dạng cả về lượng lẫn chất.

Page 6: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

6

Lưu trữ Big Data tại các trung tâm dữ liệu

II. Big data và digital marketing

1. Xu hướng

Trong lĩnh vực marketing, đặc biệt là digital marketing, Big Data là một từ ngày càng quen thuộc và sẽ còn quen thuộc hơn nữa trong tương lai. Trên thế giới, những ngành nghề liên quan đến dữ liệu trở nên thu hút nhân lực hơn bao giờ hết. Harvard Business Review đã nhận định khoa học dữ liệu là công việc hấp dẫn nhất trong thế kỷ 21.

Xu hướng việc làm Data Scientist, Harvard Business Review, 2013

Một báo cáo của Gartner cho thấy những doanh nghiệp nhạy với dữ liệu có hơn 25% lợi thế cạnh tranh mỗi năm. Tuy nhiên, Gartner cũng cảnh báo, “Vào năm 2015, hơn 85% những công ty trong danh sách Fortune 500 sẽ không thể khai phá hiệu quả nguồn lực của Big Data trong việc nâng cao lợi thế cạnh tranh.”[3] Có rất nhiều lý do dẫn đến kết quả này, điển hình là việc đầu tư cơ sở hạ tầng để thu thập, xử lý dữ liệu và tuyển dụng người có khả năng phân tích dữ liệu.

Tại Mỹ, ngày càng có nhiều yêu cầu phân tích dữ liệu nhằm tìm ra insight khách hàng, dẫn đến sự thiếu hụt nhân lực trầm trọng: 190,000 nhà phân tích và 1.5 triệu nhà quản lý có đủ kỹ năng cần thiết để đưa ra quyết định dựa trên dữ liệu có được[3].

Page 7: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

7

Thị trường Big Data, Sourcedigit.com, 2012

Sự phát triển của những thiết bị thông minh, sự tương tác giữa các thiết bị cùng với sự phổ biến với công chúng là một nền tảng để khẳng định Big Data sẽ còn bùng nổ hơn trong tương lai.

The Internet of Things – Infographic, The Connectivist, dựa trên dữ liệu từ Cisco

2. Ứng dụng

Big Data có rất nhiều ứng dụng trong nhiều lĩnh vực khác nhau, từ lĩnh vực y tế, sức khỏe, giáo dục, kinh tế đến chính trị. Masoom Gupte đã liệt kê 9 ứng dụng mà người làm marketing và bán lẻ có thể tận dụng từ kết quả phân tích Big Data:[3]

1. Theo dõi mô hình mua hàng và lưa chọn ưu tiên của khách hàng 2. Xác định hành vi khách hàng và lựa chọn ưu tiên của khách ở cấp độ vi mô 3. Phát triển đầy đủ diện mạo khách hàng (customer personas)

Page 8: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

8

4. Xúc tiến bộ phận đề xuất sản phẩm và gói sản phẩm trên quảng cáo mục tiêu online (online targeted ads) và trong cửa hàng.

5. Ngăn chặn việc thiếu/thừa hàng hóa. 6. Cung cấp thông tin kịp thời cho nhân viên để giải quyết than phiền, khiếu nại từ khách. 7. Phát triển và nuôi dưỡng mối quan hệ với đối tác, nhà cung cấp và khách hàng. 8. Thiết lập xử lý rủi ro trong việc quản lý gián đoạn nguồn cung hoặc biến động thị trường. 9. Giám sát, điều chỉnh tin tức và sự kiện ảnh hưởng đến nhà cung ứng, đối thủ cạnh tranh,

thị trường địa phương và thương trường thế giới.

Ngoài ra còn có một số ứng dụng trong thương mại thường được nhắc đến: phân khúc thị trường và khách hàng, tiếp thị trên nền tảng định vị, phân tích tiếp thị chéo kênh, tiếp thị đa kênh, quản lý các chiến dịch tiếp thị và khách hàng thân thiết, so sánh giá và phân tích, quản lý chuỗi cung ứng.

3. Nguồn dữ liệu

Đây là câu hỏi được đặt ra khi nói đến Big Data: có thể tìm dữ liệu lớn ở đâu? Điều đó còn tùy thuộc vào mục đích sử dụng dữ liệu của mỗi người. Dữ liệu lớn phục vụ cho mục đích lớn đồng nghĩa với việc chi trả một số tiền lớn. Tuy nhiên, trong thời đại Internet phát triển, rất nhiều bộ dữ liệu công khải và miễn phí cho người dùng. Dưới đây là một số nguồn dữ liệu mở:

Google Public Data: http://www.google.com/publicdata/directory

Stanford network data collection: http://snap.stanford.edu/data/index.html

Amazone AWS: http://aws.amazon.com/public-data-sets/?nc1=h_ls

Nguồn dữ liệu cộng đồng Freebase: http://www.freebase.com/

Dữ liệu từ World Bank: http://datacatalog.worldbank.org/

Dữ liệu từ Liên Hiệp Quốc: http://data.un.org/Explorer.aspx

Trang Facebook Data Science: https://www.facebook.com/data

Một số cộng đồng trên Internet đã liệt kê danh sách rất nhiều bộ dữ liệu mở. Tham khảo thêm tại: https://www.quora.com/Where-can-I-find-large-datasets-open-to-the-public

hoặc http://hadoopilluminated.com/hadoop_illuminated/Public_Bigdata_Sets.html

4. Kết luận

Hiện tại, trên thế giới vẫn có rất nhiều quan điểm về Big Data, cũng như có rất nhiều thông tin về Big Data trên Internet lẫn sách báo. Bài nghiên cứu nhỏ này chỉ nhằm mục đích cung cấp những điều cơ bản về Big Data mà sinh viên Marketing cần biết.

Việc thấu hiểu rằng dữ liệu là một trong những công cụ đắc lực cho doanh nghiệp, là cơ sở để đưa ra những quyết định quan trọng và thiết lập mối quan hệ bền vững với khách hàng sẽ là lợi thế trong quá trình phát triển công việc kinh doanh. Tuy nhiên, Tim O’Reilly đã nói: “Những doanh nghiệp có lượng lớn dữ liệu mà không tận dụng được sẽ bị thay thế bởi những công ty khởi nghiệp có ít dữ liệu hơn nhưng tận dụng được tiềm năng từ nguồn dữ liệu đó.” Điều này nghĩa là, quan trọng không phải dữ liệu có được lớn như thế nào, mà là dữ liệu thích hợp cho vấn đề hiện tại.

Page 9: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

9

III. Case study:

Facebook: Sử dụng dữ liệu từ người dùng

Facebook ra đời năm 2014, sau chỉ hơn 10 năm, Facebook đã trở thành một trong những trang mạng xã hội hàng đầu thế giới, hơn thế nữa, Facebook dần trở thành thị trường lớn và đầy tiềm năng cho hoạt động marketing.

Trang Zephoria đã đưa ra một số thống kê như sau:[4]

Mỗi tháng có 1.49 tỷ tài khoản hoạt động, tăng 13% mỗi năm, nhiều hơn Twitter (284 triệu), Instagram (200 triệu) và WhatsApp (500 triệu) cộng lại.

Có 29.7% người dùng thuộc độ tuổi 25 tới 34.

Trung bình mỗi giây có 5 tài khoản mới được tạo.

50% người dùng từ 18-24 tuổi mở facebook ngay sau khi thức dậy.

42% người làm marketing khẳng định facebook quan trọng đối với công việc kinh doanh của họ.

16 triệu trang fanpage kinh doanh địa phương được tạo ra tính đến tháng 5.2013, tăng 100% so với tháng 6.2012.

Với 1.49 tỷ người dùng hoạt động mỗi tháng, lượng dữ liệu mà Facebook nhận được mỗi ngày là rất lớn. Tuy nhiên, việc sử dụng Big Data của Facebook đã nhận được một số phản hồi tiêu cực từ giới truyền thông và công chúng. Một trong số đó là nghiên cứu tâm lý không được sự cho phép của người dùng[5]. Trong thí nghiệm này, Facebook chỉ ra rằng họ có thể điều khiển tâm trạng của người khác bằng việc hiển thị những bài viết mang tính tích cực hoặc tiêu cực. Đây là vấn đề khiến nhiều người phải suy nghĩ, một khi mạng xã hội phát triển mạnh mẽ đến nỗi có thể điều khiển cả cảm xúc của người dùng.

Trung tâm Dữ liệu của Facebook tại Prineville, Oregon. Hình ảnh: IntelFreePress/Flickr

Ngoài ra, một vấn đề mà một số người dùng facebook vẫn luôn ý thức – tính bảo mật của thông tin cá nhân. Nếu Google chỉ đơn thuần đoán biết hành vi và xây dựng hình mẫu của người dùng dựa trên những cú click chuột, những trang web được lưu trữ qua cookies, Facebook nắm tất cả

Page 10: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

10

dữ liệu về tên họ, tuổi tác, giới tính, quê quán, nơi sinh sống,… và cả sở thích của người dùng. Chẳng có gì khó khăn khi người làm marketing yêu cầu dữ liệu về “nữ dưới 30 tuổi sống tại TP.HCM quan tâm đến mỹ phẩm hoặc làm đẹp”, hay “sinh viên tại TP.HCM quan tâm đến phim điện ảnh.”

Facebook, cũng như rất nhiều doanh nghiệp công nghệ khác, đang tự thiết lập luật lệ cho riêng mình, đỉnh điểm là yêu cầu lấy tên thật trên Facebook, nếu bất cứ người dùng nào phát hiện tài khoản không đúng tên thật có thể nhấn nút report, tài khoản đó sẽ phải đổi tên hoặc cung cấp CMND xác nhận đúng tên họ.

Người dùng có thể khóa (deactivate) hoặc xóa vĩnh viễn tài khoản trên Facebook, tuy nhiên, rất nhiều người có thể chấp nhận hoặc phớt lờ vấn đề về thông tin cá nhân để sử dụng Facebook và tận dụng những lợi ích mà mạng lưới này mang lại.

Page 11: EMAR - BIGDATA - TranNgocPhung - Nov2015

WHITE PAPER | BIG DATA

11