about bi (2014/03/25)
DESCRIPTION
オープンソースBI勉強会 #4 の発表資料です。 http://atnd.org/events/48687TRANSCRIPT
BI とは?
オープンソース BI 勉強会 #4
2014/03/25
@teruu
自己紹介
川崎照夫TwitterID: teruu所属:データフォーシーズBI 歴:1年 6 か月
BI の目的
BI の目的:会計、販売、顧客、在庫、購買、生産といった業務系のデータを取り出し、色々な形で活用する
BI システム構築実践入門平井明夫 (2005)
具体的には
• 会計データを活用→利益/コストを部門別に分析• プロジェクト管理データ→利益/コストをプロジェクト別に分析• 販売管理データ→売上実績/目標達成度を部門/製品/顧客別に分析• 生産管理データ→生産高/生産性/計画達成度を部門/製品別に分析• 在庫管理データ→在庫量/在庫金額/不良在庫を部門/品目別に分析• 購買管理データ→購入金額/納期/不良率を部門/仕入先別に分析• 顧客管理データ→顧客/ Web サイト会員の分布/行動を年齢などのプロファイル
別に分析• EC サイトのデータ→商品/コンテンツの人気度やキャンペーン効果
BI の定義
• 企業内外の事実に基づくデータを組織的かつ系統的に蓄積・分類・検索・分析・加工して、ビジネス上の各種の意思決定に有用な知識や洞察を生み出すこと
ガートナーグループのアナリストハワード・ドレスナー氏による定義 (1989 年 )
ITmedia エンタープライズ「 5 分で絶対に分かるビジネス・インテリジェンス」(http://www.itmedia.co.jp/im/articles/0803/28/news136.html)
BI の歴史(データ分析の変遷)
@ ITビジネスインテリジェンスとは何か(http://www.atmarkit.co.jp/ait/articles/0612/09/news010.html)
トピック
• 日経 BP– 超 Excel
• 人間 BI 脱出の切り札、超「 Excel 」• http://business.nikkeibp.co.jp/article/opinion/20131227/257658/
• 超 Excel ソフト 8 製品の実力• http://itpro.nikkeibp.co.jp/article/Active/20140312/542945/
• BI は Excel との闘いである
最近の BI の対立軸
• フォーマル BI– 多次元キューブ/ OLAP– 構造化– データ分析基盤
• カジュアル BI– データ可視化– アドホック分析– 統計ソフト、データ分析ソフト的
BI の基本的なシステム構成
BI / DWH | 特集/コラム | TIS Direct Web(http://www.tis.jp/special/keyword/bi_dwh.html)
Pentaho について• オープンソースベースの BI スイート• 以下の製品群で構成
EE CE 主な対象
ダッシュボード ダッシュボードエディタ
CDF(Community Dashboard Framework)
経営陣
Reporting Reporting (定型レポート) ビジネスユーザ
メタデータインタラクティブレポート
Adhoc レポート
OLAP (多次元分析)
Analyzer JPivot/saiku/Pivot4J
アナリスト・ビジネスユーザ
ETL (データ統合)
Data Integration 開発者、 DB 管理者
データマイニング
Weka アナリスト、パワーユーザ
今後のテーマ (1)
• DWH– スタースキーマ– SCD(Slowly Changing Dimensions)– CDC (Change Data Capture)– サロゲートキー– MDM( マスターデータマネジメント )
• OLAP(ROLAP/MOLAP)– キューブ設計– MDX
今後のテーマ (2)
Pentaho の各製品• PDI • OLAP • Reporting • ダッシュボード • データマイニング
今後のテーマ (3)
デザインツール• スキーマワークベンチ• アグリゲーションデザイナ• メタデータエディタ
サードパーティー製品• saiku • Pivot4J
今後のテーマ (4)
その他の BI 製品• Tableau• QlikView
今後のテーマ (5)
カラム指向 DB• HP Vertica • Amazon Redshift
NoSQL DB• MongoDB • Hadoop Hive
インメモリ DB
今後のテーマ (6)
データ可視化• CTools • D3 • Highcharts • GIS 系
データ分析手法R の活用
今後のテーマ (7)
• オープンデータの活用• Pentaho オープンソース・コミュニティ
の活用
今後のテーマ (8)
• 開発手法• プロトタイピング• ドキュメント
今後のテーマ (9)
• 開発ツール• SQL エディタ• XML エディタ• ユーティリティ• バージョン管理• バグトラッキング
• テスト手法• 自動化手法
今後のテーマ (10)
運用• Apache • Tomcat • クラウド活用 (AWS)• スケジューリング、バッチ実行
今後のテーマ (11)
ポータルサイト、 CMS との統合• Liferay• Alfresco
今後のテーマ (12)
学習メディアの活用• ドットインストール • Slideshare • YouTube
今後のテーマ (13)
• プロフィットセンター/コストセンターの考え方