杨 大 川 dyang@minesage

29
[email protected] [email protected] 杨杨杨杨杨杨杨杨杨 杨杨杨杨杨杨杨杨杨 杨杨杨杨 杨杨杨杨

Upload: illana-davidson

Post on 01-Jan-2016

198 views

Category:

Documents


2 download

DESCRIPTION

数据分析与数据挖掘 实战案例. 杨 大 川 [email protected]. 讲师简介. 杨大川 - 迈思奇科技有限公司 CTO 微软 MVP.2004 (最有价值专家) 曾任美国硅谷 Annuncio 公司首席工程师 招商迪辰产品研发部总经理 现兼任中科院客座教授 Minesage : 迈思奇科技有限公司 微软数据分析 / 挖掘领域合作伙伴 面向企业客户提供完整的数据分析 / 挖掘解决方案 www.minesage.com. Agenda. 从数据到信息 传统报表系统的挑战 数据分析与实战案例 数据挖掘与实战案例 总结:商业智能的巨大潜力. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 杨  大  川 dyang@minesage

杨 大 川杨 大 川[email protected]@minesage.com

数据分析与数据挖掘数据分析与数据挖掘实战案例实战案例

Page 2: 杨  大  川 dyang@minesage

讲师简介讲师简介

杨大川 杨大川 - - 迈思奇科技有限公司迈思奇科技有限公司 CTOCTO微软微软 MVP.2004MVP.2004 (最有价值专家)(最有价值专家)曾任美国硅谷曾任美国硅谷 AnnuncioAnnuncio 公司首席工程师公司首席工程师招商迪辰产品研发部总经理招商迪辰产品研发部总经理现兼任中科院客座教授现兼任中科院客座教授

Minesage :Minesage : 迈思奇科技有限公司迈思奇科技有限公司微软数据分析微软数据分析 // 挖掘领域合作伙伴挖掘领域合作伙伴面向企业客户提供完整的数据分析面向企业客户提供完整的数据分析 // 挖掘解决挖掘解决方案方案www.minesage.comwww.minesage.com

Page 3: 杨  大  川 dyang@minesage

AgendaAgenda

从数据到信息从数据到信息传统报表系统的挑战传统报表系统的挑战数据分析与实战案例数据分析与实战案例数据挖掘与实战案例数据挖掘与实战案例总结:商业智能的巨大潜力总结:商业智能的巨大潜力

Page 4: 杨  大  川 dyang@minesage

现代企业的现代企业的 ITIT 系统系统

企业资源计划系统 企业资源计划系统 (ERP)(ERP)

客户关系管理系统 客户关系管理系统 (CRM)(CRM)

供应链管理系统 供应链管理系统 (SCM)(SCM)

电子商务系统 电子商务系统 (EBiz)(EBiz)

人事管理系统 人事管理系统 (HR)(HR)

财务系统 财务系统 (Fin)(Fin)

… …… …

呼叫中心呼叫中心

市场市场活动活动系统系统

客户关客户关系管理系管理

互联网互联网系统系统

财务系统财务系统

采购系统采购系统 人事系人事系统统

库存系统库存系统

最终结果:大量的最终结果:大量的数据数据

Page 5: 杨  大  川 dyang@minesage

这里有几根火柴?这里有几根火柴?

报表系统的答案:报表系统的答案: 4040 根根

Page 6: 杨  大  川 dyang@minesage

AgendaAgenda

从数据到信息从数据到信息传统报表系统的挑战传统报表系统的挑战数据分析与实战案例数据分析与实战案例数据挖掘与实战案例数据挖掘与实战案例总结:商业智能的巨大潜力总结:商业智能的巨大潜力

Page 7: 杨  大  川 dyang@minesage

挑战挑战

难以挖掘出潜在的规则

难以交互分析了解各种组合

难以追溯历史数据形成孤岛

数据太多信息太少

随着数据量的增大难度越来越大

Page 8: 杨  大  川 dyang@minesage

AgendaAgenda

从数据到信息从数据到信息传统报表系统的挑战传统报表系统的挑战数据分析与实战案例数据分析与实战案例数据挖掘与实战案例数据挖掘与实战案例总结:商业智能的巨大潜力总结:商业智能的巨大潜力

Page 9: 杨  大  川 dyang@minesage

现在呢?现在呢?

Page 10: 杨  大  川 dyang@minesage

数据分析:数据分析: OLAPOLAP 技术技术

数据集市数据集市

数据仓库数据仓库

源系统源系统

客户端客户端

CubeCube

OLAPOLAP

Page 11: 杨  大  川 dyang@minesage

DemoDemo

互联网行业互联网行业电信电信财务和预算财务和预算房地产房地产

Page 12: 杨  大  川 dyang@minesage

互联网行业 – 门户网站互联网行业 – 门户网站传统的网站流量分析工具传统的网站流量分析工具

简单的静态报表简单的静态报表后台处理,大量信息丢失后台处理,大量信息丢失无法针对业务层面深入分析无法针对业务层面深入分析

OLAPOLAP 解决方案解决方案1818 个角度随心所欲的分析个角度随心所欲的分析瞬间获得结果瞬间获得结果非常容易切入业务层面非常容易切入业务层面发现更多的宝藏发现更多的宝藏

Page 13: 杨  大  川 dyang@minesage

电信行业电信行业手机产业的迅猛发展导致:手机产业的迅猛发展导致:

海量的数据海量的数据海量的用户海量的用户激烈竞争与频繁的策略调整激烈竞争与频繁的策略调整

OLAPOLAP 数据分析的价值数据分析的价值发现不断变化的规律发现不断变化的规律辅助正确的决策辅助正确的决策好的决策 好的决策 = $$$= $$$

Page 14: 杨  大  川 dyang@minesage

财务和预算财务和预算财务软件有很多财务软件有很多

用友用友金蝶金蝶

预算的方式有很多预算的方式有很多ExcelExcel专用系统专用系统

OLAPOLAP 可以分析什么?可以分析什么?鸟瞰图的分析方式鸟瞰图的分析方式

Page 15: 杨  大  川 dyang@minesage

房地产房地产买房?卖房?租房?买房?卖房?租房?房价的趋势如何?房价的趋势如何?不同地区的变化不同地区的变化不同类型的变化不同类型的变化供求关系的变化供求关系的变化

OLAPOLAP 的解决方案的解决方案专业化的专业化的 KPIKPI

Page 16: 杨  大  川 dyang@minesage

AgendaAgenda

从数据到信息从数据到信息传统报表系统的挑战传统报表系统的挑战数据分析与实战案例数据分析与实战案例数据挖掘与实战案例数据挖掘与实战案例总结:商业智能的巨大潜力总结:商业智能的巨大潜力

Page 17: 杨  大  川 dyang@minesage

商业智能包含的范围商业智能包含的范围

数据挖掘数据挖掘

数据报表数据报表

数据分析数据分析

Page 18: 杨  大  川 dyang@minesage

深入数据挖掘工具 深入数据挖掘工具 (SQL 2005)(SQL 2005)

关联销售关联销售销售预期销售预期客户分类客户分类客户行为分析客户行为分析风险管理风险管理信用评估信用评估欺诈检测欺诈检测流量点击分析流量点击分析……..

Page 19: 杨  大  川 dyang@minesage

DemoDemo

图书音像销售 – 关联模型图书音像销售 – 关联模型自行车销售 – 决策树自行车销售 – 决策树搜索引擎搜索引擎

Page 20: 杨  大  川 dyang@minesage

历史数据 历史数据 CustIDCustID

980001980002980003980004980005980006

CustIDCustID BookBook

980001 天龙八部980001 鹿鼎记980002 丁丁历险记 -丁丁在刚果980002 丁丁历险记 -月球探险980002 神雕侠侣980003 围城980004 数据挖掘指南980004 数据库实战宝典980004 SQL Server 2005

Page 21: 杨  大  川 dyang@minesage

历史数据(历史数据( NestedNested ))

BookBook

天龙八部鹿鼎记

丁丁历险记 -丁丁在刚果丁丁历险记 -月球探险

神雕侠侣围城

数据挖掘指南数据库实战宝典

SQL Server 2005

CustIDCustID980001

980002

980003

980004

Page 22: 杨  大  川 dyang@minesage

关联模型关联模型 ::AssociationAssociation

同类集合同类集合规则规则图示图示预测预测…………

Page 23: 杨  大  川 dyang@minesage

自行车销售自行车销售某体育用品商店某体育用品商店拥有大量会员拥有大量会员部分会员是购买自行车的用户部分会员是购买自行车的用户

问题:决定客户是否可能购买自行车的因素?问题:决定客户是否可能购买自行车的因素?性别性别年龄年龄交通距离交通距离拥有的汽车数目拥有的汽车数目拥有的子女数目拥有的子女数目收入收入…………

Page 24: 杨  大  川 dyang@minesage

决策树:决策树: Decision TreeDecision Tree

找到潜在客户找到潜在客户

Page 25: 杨  大  川 dyang@minesage

搜索引擎搜索引擎

ITIT 新宠新宠百度神话百度神话GoogleGoogle

YahooYahoo

MSNMSN

如何发现词与词之间的关联?如何发现词与词之间的关联?我们销售关键词给企业我们销售关键词给企业如果知道与某个词关联最强的如果知道与某个词关联最强的 NN个词…个词…潜在的价值是无限的潜在的价值是无限的

Page 26: 杨  大  川 dyang@minesage

AgendaAgenda

从数据到信息从数据到信息传统报表系统的挑战传统报表系统的挑战数据分析与实战案例数据分析与实战案例数据挖掘与实战案例数据挖掘与实战案例总结:商业智能的巨大潜力总结:商业智能的巨大潜力

Page 27: 杨  大  川 dyang@minesage

解决解决

商业智能商业智能

数据挖掘找出数据挖掘找出潜在规则,辅潜在规则,辅助决策助决策

OLAPOLAP、数据分、数据分析提供了更及时析提供了更及时、更丰富的信息、更丰富的信息

报表系统提供了报表系统提供了最基本的信息最基本的信息

Page 28: 杨  大  川 dyang@minesage

问题:问题:

OLAP OLAP 的目的是什么?的目的是什么?Static ReportingStatic ReportingData MiningData MiningData AnalysisData Analysis

以上案例中涉及的主要软件有哪些?以上案例中涉及的主要软件有哪些?典型的数据分析系统包括哪四层?典型的数据分析系统包括哪四层?

Page 29: 杨  大  川 dyang@minesage

联系方式:联系方式: 杨大川 杨大川 [email protected]@minesage.com

电话 电话 010-58895882010-58895882