powerpoint 簡報 · information & intelligence as a service iiaas是saas的延伸 i2aas...
TRANSCRIPT
2015/2/6
1
大數據發展現況與未來發展趨勢
台北醫學大學大數據研究中心及管理學院籌備處
大數據特徵與趨勢
2
經濟可負擔的處理大量成長的資料
Volume (大量)
建立大數據來源的可信性Veracity(真實性)
不確定與不準確的資料
1 in 3企業領導者不信任他們用來作為企業決策的資訊真實性關鍵 –數據的可信性
50x 35 ZB
20202010
整合性收集與分析更多元的資料Variety (種類多)
能夠反應不斷且更快速到達的資料
Velocity (快速)
超過300億RFID 感測裝置
全球80%資料為非結構性
資料來源:IBM
大數據的系統要求
•High performance –高併發讀寫的需求高併發、即時動態獲取和更新資料
•Huge Storage –海量資料的高效率存儲和訪問的需求類似SNS網站,海量使用者資訊的高效率即時存儲和查詢
•High Scalability & High Availability –高可擴展性和高可用性的需求需要擁有快速橫向擴展能力、提供7*24小時不間斷服務
雲計算
2015/2/6
2
Data Mining包含六大領域
Database systems,
Data Warehouses,
OLAP
Machine
learning
Visualization
Mathematical
programming
High
performance
computing
Data Mining
Statistical and data
analysis methods
CRISP-DM六個階段
Business
Understanding
Data Preparation
Evaluation
Data
Understanding
Modeling
Deployment
Data
7
完整的演算法SQL Server 2008已提供
決策樹 群集 時間序列
時序群集 關聯規則
貝氏機率分類
類神經網路
SQL Server 2000已提供
羅吉斯回歸
線性回歸 文字資料採擷
Binary Classifier (二元分類)Numeric Predictor (數值預測)
Time Series (時間序列)C&R TREE (分類回歸樹)
Quick Unbiased Efficient Statistical Tree (QUEST決策樹模型)CHAID (分類樹)Decision List (決策樹列表)
Regression (線性回歸分析)PCA/Factor (主成分分析)
Neural Net (類神經網路)C5.0 (決策樹)Feature Selection (特徵選取)
Discriminant Analysis (判別分析)Logistic (羅吉斯回歸)
Generalize Linear Model (廣義線性模型)Cox Regression
常用的Data Mining及統計學習方法-1
2015/2/6
3
常用的Data Mining及統計學習方法-2
Support Vector Machine (SVM支持向量機)Bayes Net (貝氏分類器)
SLRM (自我學習反應模型)GRI關聯Apriori關聯CARMA關聯(連續交易)Sequence Clusterc序列關聯K-Means (K-Means分群)Kohonen (自我組織化)
Two-Step (二階段)Anomaly (異常檢測)Random Forests (隨機森林)
ICA (獨立成分分析)Multivariate adaptive regression spline (MARS多元適應性回歸平滑)
Pmml(預測模型標記語言)Boosting
使用軟體 常用SQL server 2012 2014
SPSS 21 (PAWS) --IBM
SAS
SQL 2012+Excel (2013)-Data Mining
Add-in
Clementine 12.0
Statistica 14.0
WEKA
R Cloud R
R+Excel ADD-IN …….還有更多雲端軟體
-11-
R + Excel資料採擷發展趨勢
-12-2015/2/6
資料分析
• Statistics–描述統計、簡單參數和非參數檢驗、線性模型
• Graphs–各種統計圖表
• Models–經典統計模型
• Distributions–各種分佈的分位數、分佈圖、抽樣、尾概率等
2015/2/6
4
14
資料採擷在各產業的應用
• 金融服務業
客戶貢獻度分析、信用評分、風險評估、客戶區隔、交叉行銷等。
• 保險業顧客貢獻度分析、信用評分、風險評估、客戶區隔、交叉行銷、客戶流失分析和詐欺偵測等。
• 電信業顧客貢獻度分析、信用評分、客戶區隔、交叉行銷、客戶流失分析、銷售預測和詐欺偵測等。
15
資料採擷在各產業的應用
• 製造業
客戶貢獻度分析、品質管制、行銷績效分析、生產分析和存貨分析等。
• 零售業
客戶忠誠度、客戶區隔、購物籃分析、定價分析、交叉行銷和銷售預測等。
• 生物科技、醫療保健、航太空業、環境、法律等
16
商業智慧的核心
• 如何收集資料營運資料,市場調查資料,固定Panel追蹤
• 如何管理資料
ETL,Data warehousing
• 如何從資料中獲取智慧
Data Mining,OLAP,Statistics
• 如何應用智慧
行銷策略,主管決策,互動化CRM機制
2015/2/6
5
• 雲端運算可以實現適應端通過在線上傳資料或購買資料,通過雲資料倉庫,進行資料倉庫建模或資料抽取,線上支付使用資料採擷工具和商業智慧相關處理軟體
18
IaaSInfrastructure as a Service
PaaSPlatform as a Service
SaaSSoftware as a Service
雲端運算產業類型
IIaaS I2aaSInformation & intelligence as a Service
IIaaS是SaaS的延伸 I2aaS• 資料採擷和商業智慧的原理相似,均由資料提供資訊、產生知識,再由知識累積智慧。而雲端運算可以使這個過程在網際網路上得以實現。也就是說雲端運算可以提供基於SaaS的知識與智慧分析的服務(Information&Intelligence as a Service),簡稱
IIaaS ;I2aaS,它是SaaS的延伸。
2015/2/6
6
急遽成長的大數據帶來結構性變革預估至2015年,80%的可用資料有不確定性
企業可用特定方案改善客戶、產品和位址等資料的品質,但這些數據只占整體企業數據的一小部分
2015年時,聯網的設備將比全球總人口多一倍,感測器所產生的資料都有不確定性
社群媒體帳戶數超過全球人口總量,這些數據的內容和表達都充滿不確定性
資料來源: IBM, 2012
善用大數據可大幅提升競爭力與經濟效益
大數據硬體/軟體/服務商機• 全球市場:IDC 估計大數據將會貢獻
40%的複合年成長率 (CAGR)
– 2012年全球市場價值估計為$6.8 B USD; 預期在 2016 達到$50.7 B USD
• 大陸市場:IDC 預測大陸大數據市場在
未來5年內的將以51.4% CAGR 成長
– 從2011到2016年預測大數據市場價值從77.6 成長到617 million USD.
單位:百萬美元
大數據產業應用價值
0
1,000
2,000
3,000
4,000
5,000
6,000
7,000
2010
2011
2012
2013
2014
2015
資料來源:IDC
23
從大數據中獲取新的使用者洞察力
利用Windows Azure上的Hadoop,我們
可以用一種以前從未有過的方式挖掘和理解我們的用戶。 這真的是未來的商務智慧方案。
-Mark VaymanLead Program Manager
Halo Services Team
直接將Halo團隊與用戶聯繫起來,提高了用戶體驗。每天為Halo團隊提供各種分析結果,每
週開發團隊會根據使用者回饋、偏好分析等調整地圖、遊戲方式等。
保持公平競爭水準,提供遊戲中檢測欺詐者的手段。
提高玩家保留率。為客戶保留活動提供客戶流失分析結果,可以更針對性地對客戶發郵件進行挽留。
獲得對玩家行為和用戶偏好的洞察力
為網上Halo比賽提供
資料,從而得到排行榜
提高玩家保留率
欺詐檢測
為Halo開發和服務團隊提供更為敏捷、速度更快的互動式儀錶盤
結果目標 戰術
2015/2/6
7
政府以大數據打擊與預防犯罪,強化國安
25
曼菲斯警局
即時且大數據分析精准預防犯罪
降低30%犯罪率 重案結案率提升54%
聯邦調查局
結合群眾外包快速偵破波士頓爆炸案
監視影像
• 拿起又放下背包• 來回徘回• 明顯不關注賽事…
現場照片
• 表情差異顯著• 特徵吻合• 出現頻繁…
2日內成功確認嫌犯身分,並於4日內逮捕歸案
社群討論 通聯記錄
巡邏報告
即時監控影像
犯罪紀錄
• 即時監控犯罪高風險區域
• 即時反應犯罪移動軌跡
• 表情緊張• 無目標性行走• 刻意低頭…
動態犯罪預警熱圖
監視影像
顧客意見
銷售紀錄
零售業如何透過大數據創造獨特競爭以大數據創造創新商業模式,打造快速時尚王國
26
「Zara 是快速時尚(fast fashion)的先驅,從此改變了時尚世界的遊戲規則。」 -紐約時報
「全球最創新、具破壞性的零售商,非 Zara 莫屬。」-LVMH 集團時尚總監皮耶特(Daniel Piette)
23.6%毛利率
高於LVMH等精品集團
平均2周可推出一新品
約為其他品牌的6倍快
一年12,000款時裝且每天可賣出110萬件產品
實體店面(Off-line) 線上商店(On-line)
每日資料回報
分眾快速鋪貨
新品上市前測
即時資料回報
點擊紀錄
線上討論
試賣紀錄
流行趨勢分析分眾偏好掌握快速設計打版
西班牙時尚服飾品牌分店橫跨74國超越2千家
2013市值最高成衣品牌($20B)
整合虛實商店銷售、討論與行為資訊,掌握時尚趨勢,快速生產鋪貨
電子商務以大數據驅動服務差異性與競爭力
• 全球最大的線上市場集團,包含阿裡巴巴B2B、淘寶網、天貓、一淘網、阿裡雲計算及支付寶等,具備完整電子商務生態體系
單日RMB350億營業額
2013光棍節創下世界紀錄
超過5億會員數
每日訪客數為臺灣人口三倍
每分賣4.8萬件商品
總商品數超過8億件
27
淘寶指數
數據魔方
iSPI指數
資料地圖
• 消費者資料研究平臺,瞭解市場購物趨勢
• 提供商家資料化營運支援
• 綜合反映網絡零售商品/服務的一般價格水準
• 圍繞地圖視角呈現的可視化線上交互產品
以大數據分析為商業核心驅動力,打造以消費者為導向之電商系統
電子商務大量交易資料(交易量、點擊紀錄、分眾偏好…)
天氣 股價 健康
過去60年天氣信息820億次分析即時天氣比對
成功預測
未來40天氣象
上億條社群推特/討論語意與情感分析
準確率達87.6%15%投資報酬率
杠杆社群與公開性數據提升預測准確性
提前2周掌握流感爆發關鍵
和美國疾病控制及預防中心合作,以關鍵字搜
尋次數掌握流感
28
2015/2/6
8
Google Trends,百度指數等輔以大數據的創新事業模式創造高價值$3M 和 $200M收購值的差別在哪裡?
• Groupon以$3M美元收購地圖日記• 百萬網友團購網 -數位時代 2010年12 月
• APP致富!LINE母公司以$17.7M美元並購「走著瞧」• 陌生號碼辨識與簡訊封鎖APP
• gogolook開發的whoscall,目前已累積了超過500萬用戶,每日活躍用戶高達一百萬人 - 2013年12 月
•蘋果以$200M美元收購社交分析服務公司 Topsy• 提供社交分析服務
• 分析Twitter 5億用戶所產生每日5億個推文信息
資料量與分析決定了企業價值!!
機會與挑戰:跨領域整合與人才培育
31
運用視覺化技術,詮釋由數據而得的洞悉,進一步協助決策的形成
硬體(電機領域)
軟體(資訊領域)
決策(商管領域)
分析(數學領域)
資料管理 分析探索 視覺呈現大數據
價值實現
領域專門知識
分析應用技能
數據管理技能
需要跨領域組合商業領域專家、模型與分析(資料科學)專家以及資料工程專家成為大數據分析研究團隊,協同合作從事分析模型及解決方案
2015全球大數據分析專業職位將達440萬人,人才將短缺將達280萬人 (Gartner, 2013)
運用分散式系統運算,收集、處理、整合管理多元性資料
運用統計、機器學習技術,找出資料中的隱藏模式關聯性
物聯網簡介
2015/2/6
9
物聯網發展
比爾蓋茲於〝未來之路〞提及Internet of Things的概念
美國Auto-ID提出〝物聯網〞概念,主要建立在物品編碼、RFID和網際網路的基礎上
IBM提出智慧地球(物聯網為其部分之一),歐巴馬特別將物聯網提升為國家發展戰略之一
歐盟宣佈物聯網行動計畫,開始在醫療、航空、能源、汽車等領域建置物聯網
資料來源:http://mag.nownews.com/article.php?mag=11-59-4159
感測網路,不接入網際網路:物聯網就是感測網路,只是給人們生活環境中的物體安裝感測器,這些感測器可以説明我們認識環境,而這個感測器往不接入網際網路
網際網路的一部份:物聯網並不是一種全新的網路,實際上早就存在了,他是網際網路發展的自然延伸和擴張,是網際網路的一部份
網際網路的補充網路:網際網路是指人與人之間通過PC結成的全球性網路,服務於人與人之間的資訊交換。而物聯網的主體則是各種各樣的物品,通過物品間傳遞資訊而達到最終服務於人的目的。所以物聯網是網際網路的擴展和補充,物聯網與網際網路是相對平等的兩張網。如果把網際網路比作是人類資訊交換的動脈,那麼物聯網就是毛細血管,兩者相互連通,是網際網路的補充。
未來的網際網路:從宏觀概念上講,未來的物聯網將使人置身於無所不在的網路之中,在不知不覺中,人可以隨時隨地與周圍的人或物進行資訊的交換,這時,物聯網也就等同於泛在網路,或者說未來的網際網路。
物聯網的類型
資料來源:http://mag.nownews.com/article.php?mag=11-59-4159
只要是物品間通過感測網路連接而成的網路,不論是否接入網際網路,都可算是物聯網的範疇
物聯網不僅局限於物與物間的資訊傳遞,還將和現有的電信網路實現無縫融合,最終形成人與物無所不在的資訊交換
資料來源:http://mag.nownews.com/article.php?mag=11-59-4159
龐大的商機!
資料來源:今週刊2014.96期
2015/2/6
10
會思考的智慧家庭 連線到雲端管家
資料來源:今週刊2014.96期
物聯網帶來的生活
資料來源:今週刊2014.96期
利用智慧型裝置 即可找出最近的車位
車子、定位、管控、水的回收等、城市裡的大小車,在定位中心都看的到
家電革命
三星衝刺智慧家電「智慧家庭戰爭裡,家電革命是首要,更重要的是,讓消費者生活更便利!」
三星家電部門副總裁Kurt Jovais
資料來源:今週刊2014.96期
台積電董事長 張忠謀
物聯網將是「next big thing(下一件大事)。」物聯網是個很大的構想,還沒有公司可以真正地管理整個生態系統,半導體技術在物聯網中屬基本的需求,對半導體業界來說,將是下一個重要的市場。
資料來源:今週刊2014.96期
2015/2/6
11
半導體廠商搶搭物聯網商機,新推IoT控制處理器配雲端服務
資料來源:http://www.ithome.com.tw/news/88562
面對物聯網(Internet of Things,IoT)大潮流趨勢,不少科技研發大廠,如:英特爾、ARM等,先後皆宣佈投入物聯網處理器、晶片的開發工作,並認為這是極具潛力開發的大市場。而近日,擁有40年老牌的半導體廠飛思卡爾(Freescale)也提供不一樣的物聯網應用方案,透過結合新一代i.MX 6處理器,搭配ARM核心技術與甲骨文的雲端服務,聯手打造更寬廣的物聯網世界。
隨著IPv6網路架構實現和5G WiFi 802.11ac高速無線傳輸環境的成型,根據思科(Cisco)預估,等到2020年網路將會存在超過500億台裝置互聯,甚至如IDC的預估,2020年物聯家庭市場將可達到517.7億美元的市場規模。
物聯網非新產業,而是已經持續發生許多年
資料來源:http://www.ithome.com.tw/news/88562
儘管物聯網在過去已談論多年,對於物聯網的描述和看法也非常多,但直到現在卻仍未有一個明確定義。而面對物聯網,飛思卡爾全球行銷暨業務開發總監Rajeev Kumar則是提出了另一個不一樣的觀點。他說,可將物聯網看成是一顆大樹,由根莖、樹幹和枝葉組成。
1.根莖指的是「技術」,可包含訊號感測(如:加速計、磁力儀)、運算處理(如:MCU、MPU),以及網路連結(如:Zigbee、WiFi、BT、NFC)技術。2.樹幹則是代表「軟體」,就像輸送水及養份的樹幹作為傳輸通道使用。3.枝葉則表示各式各樣的「應用」,透過軟硬體配合,可提供像是智慧家庭、智慧醫療、智慧電力、智慧汽車等物聯服務。
汽車、穿戴式裝置和智慧家庭物聯網發展最有潛力
資料來源:http://www.ithome.com.tw/news/88562
而穿戴式裝置則是以設計為主,在符合最小尺吋晶片、低功耗和高延展性等特性下,提供使用者不同低、高階智慧穿戴功能。另外在智慧家庭的發展上則以家電、空調、娛樂、監控為主,透過一台物聯網閘道將各種產品、設備節點串聯在一起,並經由連結雲端分析後,提供各式各樣的家庭服務,像是燈光、溫度調控、門鈴、門鎖、安全監控及警報器等自動化功能應用。
另外在智慧城市應用上,Rajeev Kumar則分別以智慧電網、智慧供應鏈及智慧橋為例,表示未來高樓、行駛火車、大橋,即便是遭遇到停電、暴風雪等人為或天然災害,透過物聯應用也能夠提供更好解決方案。不過Rajeev Kumar也認為,要發展物聯網必須要達到一定經濟規模和裝置數量才有辦法實現完成,但他也樂觀表示,在接下來2到3年間,將可以看到顯著的物聯網成長。
面對物聯網的大潮流,必須要有共同結盟的夥伴
資料來源:http://www.ithome.com.tw/news/88562
Rajeev Kumar並以飛思卡爾產品為例,新推出的物聯網閘道,除內建的是自家新一代i.MX 6處理器,核心架構採用的則是ARM Cortex A9,並可結合甲骨文的嵌入式Java SE雲端服務,透過各家軟硬體的整合,才得以讓推出物聯網產品實現。
而除了飛思卡爾之外,臺灣IC設計大廠最近也是動作頻頻,如,聯發科,近日也同時宣佈將和宏碁共同合作,新發佈的LinkIt物聯及穿戴平臺,整合Aster系統單晶片的開發平臺,可支援宏碁Acer Open Platform(AOP)雲端服務,透過AOP代理與雲端溝通,可提供更簡化的物聯網產品開發流程,協助開發者創造更多元的物聯網應用及服務。
2015/2/6
12
可將物聯網看成一顆大樹,由根莖、樹幹和枝葉組成
資料來源:http://www.ithome.com.tw/news/88562
1.根莖指的是「技術」2.樹幹則是代表「軟體」3.枝葉則表示各式各樣「應用」
城市物聯應用
資料來源:http://www.ithome.com.tw/news/88562
在物聯網架構下推行的城市物聯應用,像是電力偵測網、可識別行人交通號志、自動感測汽車,醫療中心病人偵測器與平板、家庭電器的娛樂與健康監控系統、企業照明、溫控與安全管控,以及工廠生產自動化監測等。
思卡爾晶片研發的公版裝置
資料來源:http://www.ithome.com.tw/news/88562
可依照使用者需求搭配不同的高階、低階產品智慧功能,並符合最小尺吋晶片、低功耗,以及高延展性等特性。
物聯網閘道
資料來源:http://www.ithome.com.tw/news/88562
內建自家新一代i.MX 6處理器,核心架構採用的則是ARM Cortex A9,並可結合甲骨文的嵌入式Java SE雲端服務。
2015/2/6
13
今年2月,貴州發佈的大數據產業發展應用規劃綱要(2014-2020年)提出,將組織實施重大應用示範專案,推動建設面向政府、公眾和企業的雲計算和大數據服務平臺,建設“七朵雲”。
貴州“電子政務雲”建設,當前最主要任務是以省市縣三級協同辦以系統為基礎,儘快完成基於雲計算的電子政務外網平臺頂層設計,建立統一的貴州省電子政務雲平臺。
省市縣三級政府協同辦公系統建設初步實現了加強省政府辦公廳與各級各部門的互聯互通和非涉密檔網上流轉,大量減少部門往返辦公廳取件現象,提高了公文運轉和會議通知效率,降低了行政成本。
各級各部門要在今年6月底前,按照《貴州省電子政務外網線路與設備接入技術要求》,將所有公務員的非涉密辦公電腦接入電子政務外網,並積極創造條件將所轄鄉鎮、街道辦事處、國有企業接入系統。
貴州電子政務雲建設力爭2014年取得重大突破
資料來源:http://big5.xinhuanet.com/gate/big5/www.gz.xinhuanet.com/2014-03/14/c_119764667.htm
國家政策與教育
資策會推出Big Data網站分析認證班
網路行銷人員多半熟練于設計行銷活動與執行媒體計畫,卻受限於訪客行為資料不完整,因此難以精算出行銷活動的量化效益,或深入探查訪客對各別網頁的具體反應。行銷人員亦無法即時從市場經驗汲取有效回饋,「計畫、執行、量測、分析、改進」的行銷迴圈,往往出現中斷點。網站分析即著眼於整合網站內、外部的訪客行為記錄,將訪客屬性、來源管道、流覽足跡、以及最後的轉換成效連成一氣,以幫助行銷人員找出問題、發掘高效市場、預見長期趨勢,進而提出對策,達成企業目標。
資料來源:http://news.sina.com.tw/article/20140312/11963246.html
誰當選總統 谷歌先知道
1.以穀歌來說,握有多種與候選人相關的關鍵片語合,可以從用戶搜尋個別候選人的次數、所搭配使用的關鍵字為何,分析後就能輕易看出民意流向,業界盛傳,穀歌內部不僅可以在投票當天早上、甚至前一晚,就精准判斷出哪組候選人會當選,連得票率都八九不離十,不過當然該公司從未承認過有這一回事。
2.目前每日用戶發文量已高達5億條推文的推特,亦自2008年起在網路社群分析公司Topsy協助下,每到美國總統大選期間,就針對每組候選人分析用戶推文為正向或負向,而即時判斷民意走向,推特更因此而推出Twindex。
3.隨著蘋果日前以2億美元重金買走當初協助推特建立Twindex的Topsy,蘋果接下來想要用手上的海量資料做些什麼事、或推出什麼樣的創新服務,應該很值得觀察。
資料來源:http://www.chinatimes.com/newspapers/20131206000042-260202
2015/2/6
14
資料來源:農委會
利用農業雲端運用,提升農業整體服務與經營效率
建立健康農業生產追溯雲端服務,強化農產品供應鏈安全管
控,加強農產品生產、加工、檢驗等資訊之透明度,提供民
眾即時且安心的消費資訊。
發展農業休閒旅遊雲端服務,網羅農遊景點、地方美食、農
產伴手、鄉村民宿等旅遊資訊,提供網路、手機等便捷多元
之查詢服務,行銷臺灣休閒農業。
輔導從農者導入雲端經營管理系統,提升對農業從業人員之
服務,傳遞農業經營管理專業知識,強化企業化管理與產業
競爭優勢。
結合空照與遙測資訊建立土石流防災應變及農業災損勘災雲
端系統,提供土石流、雨量等即時消息服務,提升民眾防災
應變、災害搶救之能力,以及作為農業災損判定的參考。
以資通訊雲端技術整合農業價值鏈,建立農業生產追溯、農遊、管理與防災等雲端系統,開創農業新價值
農業雲端服務範例-農業生產追溯雲端服務
設計個別之二維條碼,由每一農場列印於產品包裝上,提供有機農場驗證狀況、品質監測記錄及產品特性等資料。
強化「臺灣CAS優良農產品管理入口網」功能,加強檢核業者產品原料登錄,並開發團購應用程式,開拓CAS優良農產品商機。
推動肉牛生產場自動化系統,建立國產牛肉追溯制度,協助業者以符合產銷履歷規範之風險控管方式加強管理。
兩岸四地消費者信心指數中國大陸地區城市消費力
北京華通人商用資訊有限公司
負責人:紀宏院長劉揚院長謝邦昌教授
05-14年全國城市消費力資料
2013年全國城市消費力為14.9萬億元,根據模型預測,2014年將達16.7萬
億元,同比增長12.3%,比預期7.5%的GDP增速高出4.8個百分點。隨著城鎮化
進程的加速,居民收入分配改革的深化,全國城市消費力呈逐年上升的態勢。
4.0 4.7 5.8 7.0 8.0 9.6 11.4 13.2 14.9 16.7
17.0 18.2
23.5
20.6
13.9
19.0 19.3
15.4 13.3
12.3
0
5
10
15
20
25
0
5
10
15
20
25
2005 2006 2007 2008 2009 2010 2011 2012 2013 2014
億元 %
2015/2/6
15
2013年省級城市消費力TOP10
排名 省份 CCP(億元)
1 廣東 207632 江蘇 153363 山東 128524 浙江 100395 上海 80116 遼寧 76817 北京 7128
8 河南 70699 四川 6502
10 湖北 6401資料來源:國家統計局,華通公司資料庫
排名 城市CCP
(億元)與2012年相比排名變化
排名 城市CCP
(億元)與2012年相比排名變化
1 上海 7969 --- 11 成都 2276 ---
2 北京 7025 --- 12 杭州 2216 ---3 深圳 4860 --- 13 瀋陽 2130 ---4 廣州 4822 --- 14 西安 1728 ---
5 天津 3812 --- 15 長沙 1668 1
6 重慶 2863 --- 16 大連 1631 17 武漢 2719 --- 17 哈爾濱 1533 38 佛山 2568 --- 18 濟南 1502 ---9 南京 2455 --- 19 青島 1495 210 東莞 2286 --- 20 蘇州 1484 1
2013年地級城市消費力TOP20
資料來源:國家統計局,華通公司資料庫
排名 城市PCP(元)
與2012年相比排名變化
排名 城市PCP(元)
與2012年相比排名變化
1 大慶 58471 --- 11 蘇州 42379 1
2 長沙 54765 1 12 福州 41488 1
3 廣州 48286 1 13 杭州 40955 ---
4 東營 47826 2 14 青島 40805 ---
5 鄂爾多斯 46939 --- 15 呼和浩特 40705 ---
6 包頭 46365 2 16 大連 40215 ---
7 深圳 46069 --- 17 濟南 40113 1
8 無錫 44478 --- 18 珠海 39938 1
9 寧波 43132 --- 19 南京 39748 ---
10 克拉瑪依 42574 --- 20 北京 39413 ---
2013年地級城市人均消費力TOP20
資料來源:國家統計局,華通公司資料庫
排名 城市CCP
(億元)與2012年相比排名變化
排名 城市CCP
(億元)與2012年相比排名變化
1 昆山 598 --- 11 太倉 204 ---2 江陰 543 --- 12 石獅 195 ---3 常熟 445 --- 13 即墨 182 3
4 張家港 399 --- 14 溫嶺 182 1
5 晉江 318 1 15 滕州 180 ---
6 慈溪 306 2 16 南安 180 2
7 義烏 285 --- 17 龍口 172 ---8 宜興 284 --- 18 丹陽 170 19 增城 237 --- 19 里安 170 110 余姚 211 --- 20 海城 167 1
2013年縣級市消費力TOP20
資料來源:國家統計局,華通公司資料庫
2015/2/6
16
排名 城市PCP(元)
與2012年相比排名變化
排名 城市PCP(元)
與2012年相比排名變化
1 霍林郭勒 63592 --- 11 榮成 36615 1
2 昆山 49604 --- 12 宜興 34853 ---
3 張家港 48491 --- 13 遷安 33775 ---
4 江陰 47195 --- 14 滿洲里 33254 3
5 常熟 44426 --- 15 格爾木 33236 1
6 太倉 43523 --- 16 二連浩特 32906 1
7 龍口 40405 --- 17 蓬萊 32050 1
8 文登 40155 --- 18 膠州 32017 ---
9 石獅 38442 --- 19 海寧 31480 ---
10 揚中 37231 1 20 丹陽 31337 5
2013年縣級市人均消費力TOP20
資料來源:國家統計局,華通公司資料庫
城鎮化消費潛力評估
消費力高消費力低
城鎮化率高
城鎮化率低
上海、北京、深圳、廣州、天津、佛山、東莞、成都、杭州、瀋陽、大連、青島、長沙、哈爾濱、鄭州
福州、廈門、合肥、昆明、太原、中山、包頭、溫州、大慶、南昌、南寧、徐州、石家莊、烏魯木齊、蘭州、貴陽、珠海、柳州、洛陽、東營、鞍山、撫順、蕪湖、株洲、邯鄲、秦皇島
寧波、長春、常州、淄博、汕頭、煙臺、唐山、呼和浩特、昆山、江陰、南通、惠州、臨沂、吉林、常熟、泉州、張家港、台州、揚州、江門、鎮江、海口、濰坊、宜昌、慈溪、晉江、淮安、義烏、濟寧
武漢、重慶、南京、西安、濟南、蘇州、無錫
2013年,我國城鎮化率達到53.73%,並以每年2%的增速向前推進,同時我國政府高度重視城鎮化,城鎮化可以推動國內需求,減少對出口的依賴,刺激經濟發展;隨著城鎮化發展,個人消費水準將會得到刺激,城市消費潛力也可以得到大幅提升。
城鎮化消費潛力城市名單
分類 城市級別 城市
消費潛力城市
二線武漢、重慶、南京、西安、濟南、蘇州、無錫、寧波、長春、淄博
三線
常州、汕頭、煙臺、唐山、呼和浩特、昆山、江陰、南通、惠州、臨沂、吉林、常熟、泉州、張家港、台州、揚州、江門、鎮江、海口、濰坊、宜昌、慈溪、晉江、淮安、義烏、濟寧
老齡化消費潛力評估
消費力高
消費力低
老齡化程度高
老齡化程度低
上海、北京、天津、重慶、武漢、南京、成都、瀋陽、大連、青島、濟南、哈爾濱、無錫
長春、常州、淄博、徐州、煙臺、唐山、江陰、南通、洛陽、東營、吉林、常熟、鞍山、張家港、台州、揚州、撫順、鎮江、蕪湖、濰坊、株洲、宜昌、慈溪、淮安、邯鄲、秦皇島、濟寧
福州、寧波、廈門、合肥、昆明、太原、中山、包頭、溫州、大慶、南昌、南寧、石家莊、烏魯木齊、汕頭、呼和浩特、蘭州、貴陽、珠海、昆山、惠州、柳州、臨沂、泉州、江門、海口、晉江、義烏
深圳、廣州、佛山、東莞、杭州、西安、長沙、蘇州、鄭州
2013年我國60歲以上各老齡人口達到2.02億,占總人口的14.9%,並以每年4%左右的速度遞增,人口老齡化將給中國的經濟社會發展帶來深刻影響。目前我國老齡產業每年市場潛在消費能力高達3000億元,在政府引導和社會資源有效整合下,“銀髮產業”前景廣闊,消費潛力值得期待。
2015/2/6
17
老齡化消費潛力城市名單
分類 城市級別 城市
消費潛力城市
二線重慶、武漢、南京、成都、瀋陽、大連、青島、濟南、哈爾濱、無錫、長春、淄博
三線
常州、徐州、煙臺、唐山、江陰、南通、洛陽、東營、吉林、常熟、鞍山、張家港、台州、揚州、撫順、鎮江、蕪湖、濰坊、株洲、襄陽、宜昌、慈溪、淮安、邯鄲、秦皇島、濟寧
城市消費力研究意義
在深入研究消費者信心指數的過程中,發現不同城市之間的
消費者消費水準存在顯著差異。尤其中國大陸地區幅員如此遼闊,
存在很大地域差異,消費水準也千差萬別,所以針對大陸不同地
區消費者所處的宏觀經濟環境進行研究顯得十分必要。我們根據
城市的地理位置、行政級別、經濟水準、人口結構、消費能力以
及城市化水準等指標,將中國大陸各縣市進行分層,更好的瞭解
不同城市之間的消費潛力。
城市消費力( City Consumption Power,簡稱“CCP”) ,是一個
綜合性評價指標,標誌城市的整體消費能力 。
消費力理論是消費經濟學的重要內容。我國上世紀70年代末起步研究
消費經濟理論時就提出了消費力,至今已近30年。期間不少人對消費力從
不同的角度進行了研究,有些機構也提出了區域性消費力概念,如深圳消
費力、長沙消費力,但還沒有一個針對中國大陸地區各縣市的整體概念。
城市消費力(CCP)城市消費力構建流程
數據準備
• 行政級別資料、人口資料(總人口、
城鎮人口、農村人口)、經濟資料
(GDP、社會消費品零售總額、投
資等)、人民生活(城鎮居民人均
可支配收入、消費性支出、居民儲
蓄餘額等)
資料處理
• 聚類分析、因數分析、指數平
滑、逐步回歸、神經網路
城市人均消費力指標 城市消費力指標
2015/2/6
18
城市人均消費力(PCP)是由城市人口、GDP、社會消費品零售總
額、城鎮居民人均可支配收入、消費性支出等指標構成,根據每個指標
對PCP的影響程度不同,賦予不同的權重,構建的可以衡量每位消費者潛
在消費能力的綜合性指標。
城市人均消費力(PCP)
城市人均消費力(PCP)
城市人口數(POP)
城市消費力(CCP)
視覺化大數據
視覺化大數據
1.Echarts
請點選連結:http://echarts.baidu.com/doc/example/force2.html#shine
視覺化大數據
2. GAPMINDER
請點選連結:http://www.gapminder.org/world/#$majorMode=chart$is;shi=t;ly=2003;lb=f;il=t;fs=11;al=30;stl=t;st=t;nsl=t;se=t$wst;tts=C$ts;sp=5.
59290322580644;ti=2012$zpv;v=0$inc_x;mmid=XCOORDS;iid=phAwcNAVuyj1jiMAkmq1iMg;by=ind$inc_y;mmid=YCOORDS;iid=phAwcNAVuyj2tPLxKvvnNPA;by=ind$inc_s;uniValue=8.21;iid=phAwcNAVuyj0XOoBL_n5tAQ;by=ind$inc_c;uniValue=255;gid=CATID0;by=grp$map_x;scale=log;dataMin=283;dataMax=110808$map_y;scale=lin;dataMin=18;dataMax=87$map_s;sma=49;smi=2.65$cd;bd=0$inds=;modified=75
2015/2/6
19
視覺化大數據
3. D3
請點選連結:http://d3js.org/
百度預測
請點選連結:http://trends.baidu.com/
文本分析Text Mining
R Facebook 以周傑倫為例
1. 爬取使用者發文 2. 爬取粉絲者發文
包含發文時間、按贊數、留言筆數
2015/2/6
20
R Weibo 以世界盃為例
1.搜尋有關世界盃或巴西的發文
2.以關鍵字做搜尋
3.搜尋可依時間區間做搜索
資料內容涵蓋:使用者ID、文章主題、
微博主文、微博轉發文、微博時間
、搜尋時間、轉發次數、回復次數。
辭雲
圖片來源:http://csteed.github.io/
集群分析圖 主成份分析─陡坡圖
2015/2/6
21
主成份分析─雙標圖
趙藤雄、董事長、縣政府、辦公室
這四個詞彼此在所有詞雲中,是較重要的詞。
辭雲聚類圖
分類主題辭雲聚類圖 兩岸/臺灣專家:兩岸「雲合作」可從智慧城市入手
臺灣雲端運算產業協會副理事長王瑋:
「智慧城市的基礎設施是雲端,差異化就在巨量數據的分析。交通、醫療、教育,環境、水質等等問題都可以用資訊技術的方法幫忙解決。」
資料來源:http://www.cdnews.com.tw/cdnews_site/docDetail.jsp?coluid=113&docid=102571627
2015/2/6
22
國家統計資料統一管理平臺簡介
One-stop Shop for Business
Information Needs in
China
—國家資料
十八大報告提出:深化行政體制改革建設服務型政府加快健全基本公共服務體系,加強和創新社會管理“十二五”時期統計發展和改革規劃綱要指出:全面提高統計能力,增強政府統計公信力全面加強統計工作,為政府決策提供依據
行政權力規範透明運行的要求
各級政府科學決策的要求
經濟形勢發展的要求.
馬建堂局長全國統計工作會議上多次提到要建
設服務型統計,使統計現代化建設不斷進步
大量資料,沒有統一處理平臺
統計結果,內部資料共用不便
分析結果,不盡如人意
信息發佈方式不夠直觀,高效
專案背景
國家政策層面
行政部門
統計部門
軟硬體條件已經具備,基礎設施完善
有成熟的技術支撐
有成熟的資訊化實施經驗
領導高度重視,各部門積極配合
符合大數據時代發展方向
專案的可行性 平臺定位
各部門間實現資訊共用的資料平臺
科學發展綜合考核的資料管理平臺
反映全國經濟發展的數據管理平臺
輔助黨政領導決策的宏觀基礎性管理平臺
2015/2/6
23
核心功能框架
工作庫
基礎庫
統 計 資料 統 一管 理 平臺
發佈庫
資料獲取
中繼資料管理
數據查詢
同步管理
一鍵辦公
預測分析系統
空間分析系統
統計圖表
資料查詢
資料庫介紹
線上服務、高效檢索
及時、圖文並茂的資訊
豐富多樣的資訊獲取管道
資料庫介紹報表快速查詢
創新的資料查詢流覽方式,超強使用者體驗
及時、人性化的資料更新提示
資料庫介紹
人性化操作介面 豐富、美觀
的作圖模組
2015/2/6
24
基於中繼資料的系統設計
共用發佈資料庫
部門共用 公眾發佈庫 工作庫
基礎資料庫
國民經濟 社會發展 居民生活 資源環境 物價 投資 其它
中繼資料庫
資原始目錄 業務中繼資料 技術中繼資料 操作中繼資料 管理中繼資料
共用發佈
採集處理
借鑒國際官方統計最佳實踐和設計理念,採用連線分析處理(OLAP)、可擴展置標語言(XML)、WEB伺服器、
統計資料和中繼資料交換系統(SDMX-ML)等先進資訊技術和標準
統一、協調、高效的管理平臺
資料獲取和中繼資料儲存庫來實現資料和中繼資料收集、驗證、處理和管理過程的自動化和現代化
為統計局工作人員的資料處理工作提供靈活、便捷的服務,統一管理內部資料,從而簡化工作流程,提高使用者的工作效率,不斷推進統計現代化
為社會公眾查詢、分析資料,以及直觀的掌握資料變動特徵,提供快捷、靈活的資料服務操作,實現統計發佈的現代化
快速、準確、安全的資料獲取
統計資料統一管理平臺
資料錄入
業務直報系統表
各部門專有系統
報表編輯功能
Excel、Txt、Dbf文件
系統介面
保存
導入
自動採集
手工錄入
匯出
資料同步
高度靈活的資料查詢
資料查詢 圖表展示
用戶可以通過簡單查詢、高級查詢、快速查詢、模糊搜索等多種查詢方式進行資料查詢
2015/2/6
25
個性化的數據定制
每一位元使用者可以根據自身的需求及使用習慣,對重點關注報表資訊編輯並收藏,定制屬於自己的個性化內容
靈活、清晰的視覺化數據通過動態介面、互動式統計圖,靈活、形象地展示統計指標資料,創新資料查詢和流覽方式,加強與資料使用者的聯動性,以增加統計資料的吸引力和可讀性,提高統計資料的社會影響力。
區域經濟瞭解各省經濟發展、生態建設、民生改善等情況
人口
瞭解不同普查年份分年齡段人口情況
房價瞭解全國70個大中城市房屋銷售價格變動情況
食品價格瞭解50個城市主要食品價格變動情況
強大的分析決策能力
景氣分析
指標預測分析、空間地理分析
可以説明使用者有效的監測經濟波動情況,並對經濟波動起到預警目的,同時通過分析各指標的表現,找出對應的
原因,為採取相應的調控措施提供參考
隨時隨地的資訊獲取
2015/2/6
26
大數據已成為多家媒體解讀兩會的“利器”。多樣精美的資料視覺化表達,讓專業枯燥的資料分析變得通俗易懂。
例:
熱力圖:現在就可以告訴你去故宮玩的人多不多。
遷徙圖:可以告訴你哪條航線最熱門。
今年政府工作報告關於產業結構調整的論述中,大數據首次出現,與新一代移動通信、積體電路、先進製造、新能源、新材料等一起,成為要引領未來產業發展的新興產業。
全國人大代表耿福能認為“採集什麼資料,如何採集,採集的頻度、精度、標準是什麼,如何處理和分析資料都需要科學的理論和方法論的指導,而不是憑個人的喜好主觀地選擇資料。”
傳統深入群眾式的調研正是為了瞭解最真實的情況,獲取海量的資訊,有了大數據的支援,調研將更加精准、便捷。
從兩會“大數據熱”展望“資料中國”
資料來源:http://big5.xinhuanet.com/gate/big5/news.xinhuanet.com/politics/2014-03/11/c_119716523.htm
今年2月,貴州發佈的大數據產業發展應用規劃綱要(2014-2020年)提出,將組織實施重大應用示範專案,推動建設面向政府、公眾和企業的雲計算和大數據服務平臺,建設“七朵雲”。
貴州“電子政務雲”建設,當前最主要任務是以省市縣三級協同辦以系統為基礎,儘快完成基於雲計算的電子政務外網平臺頂層設計,建立統一的貴州省電子政務雲平臺。
省市縣三級政府協同辦公系統建設初步實現了加強省政府辦公廳與各級各部門的互聯互通和非涉密檔網上流轉,大量減少部門往返辦公廳取件現象,提高了公文運轉和會議通知效率,降低了行政成本。
各級各部門要在今年6月底前,按照《貴州省電子政務外網線路與設備接入技術要求》,將所有公務員的非涉密辦公電腦接入電子政務外網,並積極創造條件將所轄鄉鎮、街道辦事處、國有企業接入系統。
貴州電子政務雲建設力爭2014年取得重大突破
資料來源:http://big5.xinhuanet.com/gate/big5/www.gz.xinhuanet.com/2014-03/14/c_119764667.htm
臺灣大數據分析發展願景
103
透過開放平臺營運,提供知識整合與加值應用及測試環境,使產學研研發可快速整合介接,領域應用知識可快速累積,持續大數據相關技術深化!
軟硬整合提升差異化價值,結合創新服務與商業模式,以硬帶軟進軍國際市場,以軟帶硬彰顯競爭力,帶動智慧產業發展!
學研研發整合加速BDA技術整合與應用能量
產業實務整合擴充BDA智慧產業應用多元性
Big Data / Open Data Application Platform
硬體(Commodity Server, Storage)以硬帶軟 以軟帶硬
零售批發業• 占臺灣GDP 19.3%• 服務型態發展靈活多元化,超商、購物中心密度世界第一
製造業• 占臺灣GDP 25.6%• PC製造占全球90%,前五大
PC製造商產值皆超過台幣三仟億
媒體與觀光 –新興機會• 傳統媒體客群急速流失,行動化、雲端多螢服務成為主流
• 臺灣觀光產值僅占GDP4%,相較國際平均9%有大幅成長空間
Individual/
Smart LIving/Smart CIty
臺灣重點發展領域
‹#›
SmartInfrastructure/platform
健康照護• 美國醫療照護每年將可達到3千億應用成效,其中2/3來自每年減少8%不要的醫療支出 (MGI)
• 臺灣健保具龐大的健康醫療資訊,善加運用應可創造顯著成效
• 能源服務• 臺灣依賴進口能源• 節能省碳日益重要• 技術與產業急待發展
教育與人力資源• 國際競爭與人口結構改變使人力素質為臺灣發展之關鍵
• 教學與學習效能的提升、教育資源應用優化為發展機會
大數據管理平臺• 80%大數據分析工作耗費於資料擷取與準備,技術門檻高
雲端儲存與運算• 大數據大且快的特性,促使雲端儲存與運算的重要性共伴相生
Smart
BusinessSmart
Government
政府與社會關注議題智慧產業發展
共通平臺
資訊安全 • 網際網路資安威脅日新月異,種類多、量大、速度快• 政府與企業難以拼湊資安威脅之全貌,急需提升防禦能力
2015/2/6
27
臺灣微軟 輔大統計資訊系中華資料採礦協會
2014 CIO 必須知道的新趨勢 SMAC
Gartner、IDC、MIC
2014年 IT 四大天王社群、行動、大數據、雲端
http://www.ithome.com.tw/node/84744
展望1:IT四大驅力推升軟體需求展望2:作業系統雲端化展望3:行動裝置成主流 BYOD擋不住展望4:3D印表機成客制化商品好幫手展望5:CIO參與商業價值創新展望6:軟體定義IT的時代來臨展望7:營業秘密法與個資法展望8:大螢幕手機進軍商務應用展望9:4G帶動物聯網起飛
展望2:作業系統雲端化展望3:行動裝置成主流 BYOD擋不住
展望5:CIO參與商業價值創新
Source: From the Gartner Report Market Insight
WW CIO 心中的 TOP 3 技術與雲端Office
微軟如何利用BI 和雲Office
協助 CIO 進行商業價值創新?
企業 BI 的面向
用來控制 協助管理鎖在企業內部
2015/2/6
28
當離開了公司…
企業 BI
• 我能不能帶出去• 能不能 Offline• 有沒有安全性• 能不能即時分析與分享
老闆
業務
分析師
當業務急需一份協力廠商原物料商品分析時
分析師
業務
企業 BI 面對臨時與即時的外部資料分析與分享
BYODHigh ExecutionOut of Office
微軟 Power BI for Office 365 雲端商業智慧方案
1 in 4 enterprise customers on Office 365
分享 找到
Q&A
行動
1 Billion Office Users
分析 視覺發現
可擴充 | 可管理 | 可信賴
2015/2/6
30
不需額外建置的 Power BI 網站流覽報表
Q&A Q&A
Q&A
運用雲端BI參與商業價值創新為您的企業再創高峰
High ExecutionOut of Office BYOD
完全自主,不需仰賴 IT 達到Time-to-Market
立即支援任意裝置與流覽不在辦公室、也能辦公室