power bi x r
TRANSCRIPT
Power BI x RChia-Chi Chang @ TW.R
2017/06/13
Quick Survey !有多少人的工作是和資料有關的 ?
Quick Survey !有多少人的工作是
80% 都在 SQL & Excel 上完成的 ?
Quick Survey !有多少人的工作是
80% 都在 R & Python上完成的 ?
Quick Survey !有多少人的工作是
80% 都在 hdfs & Spark 上完成的 ?
Quick Survey !有多少人的工作是
80% 都在臨表涕泣不知所云的 ?
臨表涕泣的兩種可能原因
(1) Data 中根本沒有對應的資訊(2) 使用錯誤方式探索與解讀
Data Thinking配對與確認探索與挖掘呈現與互動
Problem Data
Problem-Driven:
Thinking Data
Through Problem
Data-Driven:Thinking Problem
Through Data
Problem behind
Problem
Information behind Data
BusinessInsights
Case Study:能否使用產官學研的資料或 1111 人力銀行的資料探索出未來人才類型或未來會紅的技能 ?
如果 … 已經 … 擁有一組豐富資訊的 Dataset 時 …
Data Thinking配對與確認探索與挖掘呈現與互動
ExampleTitanic dataset
https://raw.githubusercontent.com/haven-jeon/introduction_to_most_usable_pkgs_in_project/master/bicd
ata/data/titanic.csv
看這張表時 會想問怎樣的問題呢 ?
InteractiveData Storytelling
Sanddance & Power BI
附帶一提其實 Power BI 內建Crawler & ETL tools
畫圖前的準備 … 把資料轉到正確的方向與格式 !
Wide Format Versus Long Format
select survived, gender, count(*) as nfrom titanic group by
survived, gender
<- gatherspread ->
tidyr::nest ->
<- unnest
ETL: dplyr + tidyrCheat Sheet
Play Power BIAesthetic Mapping !
Reactive query !Manage relationship of tables