emc greenplum - データ ストレージ、コンバージド … greenplum driving the future of...

4
EMC Greenplum Driving the future of Data Warehousing and Analytics 業界最高レベルのパフォーマンスと柔軟な拡張性で 情報資産の有効活用を実現。

Upload: lamhanh

Post on 24-Mar-2018

232 views

Category:

Documents


7 download

TRANSCRIPT

EMC GreenplumDriving the future ofData Warehousing and Analytics業界最高レベルのパフォーマンスと柔軟な拡張性で情報資産の有効活用を実現。

業界最高レベルのコスト・パフォーマンスを実現 ● 超並列処理で業界最高レベルのクエリー性能 ● パラレル・ローディングによる世界最速のデータロード  ● 数百ギガから数十ペタバイト規模までのリニアなスケーラビリティ

柔軟かつリニアな拡張性で、運用コストおよび将来的な IT投資リスクを軽減 ● ユーザーが汎用的なハードウェアを自由に選択可能 ● データ量の増加に伴うシステム拡張を低コストで実現 ● 数千万円からのスモール・スタートが可能 ● フォルト・トレラント機能の実装によりミッション・クリティカルなシステムをサポート ● 動的リソース配分機能によるデータベース管理コストの削減

データウェアハウスの未来をリードするGreenplum®

主な特徴

SQL MapReduce

Master

Segment Segment Segment Segment Segment

Master

MasterServersNetworkInterconnect

FlatFiles

Applications&DBs

ETL & DIProducts

SegmentServers

Master Servers

(TB)

Greenplu

m

A社

B社

C社

12

10

8

6

4

20

Greenplum Database®は超並列(MPP: Massive Parallel Processing)アーキテクチャを採用しています。マスター・サーバはアプリケーションからの SQLあるいMap/Reduceを解析しユーザー・データの分散配置、必要な CPUおよびメモリーのコストを計算し最適な並列実行プランを作成します。作成した並列実行プランに基づいて全てのセグメント・サーバに対してクエリーの実行、データの格納の実行を指示します。各セグメント・サーバに実装されているパラレル・データフロー・エンジンは其々のセグメント・サーバに格納されているデータに対してクエリーやデータの実行をマスター・サーバに依存することなくパラレルに実行します。

Scatter/Gather StreamingTM 技術により、Greenplum Databaseのデータロード性能は世界最高速を誇ります。1ラックに構成した場合の 1時間当りのロード量は 10TBに達し、他社の追随を許しません。また性能のみならずロード方法の多様性も Scatter/Gather Streaming技術の特長です。通常バルクロード時に必要とされるロード・サーバを設置しないロード方式やアプリケーションから直接データをロードすると言ったことが可能です。

MPPアーキテクチャ

世界最高速のデータロード性能 Scatter/Gather

1 高性能

コモディティ・ハードウェアで実現する大規模DB

数百ギガから数十ペタ規模の大データウェアハウスを実現–規模はもはやバリアではありません。

ソフトウェア・オンリーのアプローチにより、低価格かつ高い柔軟性を実現

分析処理の大規模並列

パラレルエンジンにより、SQLやMapReduce 処理を100~1000以上のCPUコアの同時使用を実現

広範囲のSQL対応(SQL-92, SQL-99, SQL-2003 OLAP)

柔軟な拡張性と自在なDWHプロビジョニング

ストレージ容量や性能の拡張はサーバのオンライン追加で実現

ビジネス・アナリスト一人一人のための専用データウェアハウスを実現

コスト・パフォーマンス高性能 柔軟性と拡張性

最新ハードウェアによるシステム全体の新規導入

導入時のコストを圧縮するソフトウェア・オンリー・アプローチ

GreenplumDB

サーバ

ストレージ

スイッチ

利点・ 最新ハードウェアによる高性能 DWH環境の迅速なデプロイ・ システム構築時と拡張時の 高い自由度

既存ハードウェアと組み合わせることによる限定的ハード導入

GreenplumDB

サーバ

既存ストレージ

既存スイッチ

利点・ ハードウェア費用の圧縮・ 既存環境と親和性の高い システム構築(ストレージ統合等)

セグメント・サーバ 2台+ストレージ・アレイ2台

柔軟な拡張性を実現するハードとソフトの疎結合

・ システム負荷にあわせてシステム 拡張部位を選択可能・ ソフトウェアとハードウェアの 疎結合が 実現する柔軟性・ 既存システムのリタイアが不要

容量

性能

CPU ディスク

CPU ディスク

セグメント・サーバ 2台

セグメント・サーバ 4台

CPU ディスク

CPU ディスク

CPU ディスク

CPU ディスク

CPU ディスク

CPU ディスク

ストレージ・アレイ増設による容量重視の拡張方式

サーバ増設による性能重視の拡張方式

システムの End-of-Life まで続くコスト削減効果・ 専用DWHシステムの場合 _ リタイアするシステムは、DWHシステムとしてのみ活用可能   ex.開発機、検証機

・ GreenplumDBの場合 _ リタイアするシステムは、コモディティ製品の組み合わせのため、  多様な用途に転用可能   ex.開発機、検証機、ファイル・サーバ、ウェブ・サーバ etc

インタコネクト

リタイア

リタイア

CPU ディスク

CPU ディスク

CPU ディスク

CPU ディスク

CPU ディスク

CPU ディスク

検証用DWH

CPU ディスク

スイッチ

ウェブ・サーバ

CPU ディスク

ファイル・サーバ

業界標準のコモディティ・ハードウェアによって自由にシステムを構成する事が可能であり、本番環境、検証環境、アプリケーション開発などそれぞれのシステム要件に合わせて経済的なシステムを構成実現できます。例えば本番環境には最新の高性能のハードウェアを、開発環境には既存のハードウェアを転用し経済的で安価なシステム構成を構築することが可能であり、TCOの削減を実現します。

Greenplumによる TCO削減の効果はシステム導入時に限りません。専用ハードウェアで構成される従来の DWHではシステム・リタイア後の用途が限定されてしまいましたが、Greenplum

システムはコモディティ・ハードウェアを活用しているためリタイア後に、例えば、サーバをファイル・サーバやウェブ・サーバに、インタコネクトをネットワークス・スイッチにと幅広く活用することが可能です。これにより他システムの構築に掛かるコストの削減にも貢献することが可能です。

ソフトウェア・ソリューションならではのオープンなエコシステムGreenplum は特定のハードウェアに依存せず、業界標準の IA サーバ、EthernetスイッチとオープンソースOSの Linux 環境で稼働するオープンなソフトウェア・ソリューションです。 コモディティ・ハードウェアの活用で高いパフォーマンスを実現するとともに業界最高レベルの価格性能比を誇ります。

既存ハードによるコスト削減

システムの有効活用によりTCOの削減

3 コスト・パフォーマンス

柔軟な拡張性システム性能要件によって柔軟にシステムを拡張することが可能です。データ容量のみの増強が必要な場合はセグメント・サーバは追加せずにストレージ・アレイのみを追加、データ容量の増加はなく詳細な分析のためにサーバ能力のみの増強が必要であればセグメント・サーバのみを追加することが可能です。データ容量、サーバ能力ともに増強が必要な場合にはディスク内蔵のセグメント・サーバを増強するというシステム要件に応じた柔軟で経済的な拡張性を実現しています。

BI、ETL製品への幅広い対応で基幹システム、分析システム連携を実現

基幹システム

分析&レポートETLExtractTransform Load

Oracle

Certified ETL ToolsDataStageInfomaticaSAS ETLAb InitioPluralSoftTalend

Certified BI ToolsMicroStrategyCognosSASJaspersoft Business ObjectPentahoHyperionACTUATE

High SpeedLoader

IBM/DB2

MySQL

Postgres

SQLServer

JDBC<  >

ODBC<  >

SQL/92<  >

Greenplumは主要な ETL 製品に幅広く対応しており基幹系のデータベースからの取り込みをお客様の環境に適した ETL 製品を選択することが可能です。アプリケーション・インターフェースは主要な業界標準の JDBC、ODBC、SQL/92に対応するとともに、様々な BI Tool製品が利用可能です。お客様の業務要件にもっともふさわしい組み合わせを選択でき、既に導入済みの ETL、BI製品ライセンスやスキルを活用できます。

利用によるベネフィット

2 柔軟性と拡張性

●お問い合わせはEMCジャパン株式会社東京都渋谷区代々木2-1-1新宿マインズタワー〒151-0053http://japan.emc.com

お問い合わせはhttp://japan.emc.com/contact/

2011年1月版

© Copyright 2011 EMC Corporation. 不許複製

SG1027-1 01/11

EMC2、EMC、Greenplum、Greenplum Database、Scatter/Gather Streaming、およびwhere information livesは、EMC Corporationの登録商標、または商標です。これらの商標は、日本または諸外国で 商標登録等により、適用法令で守られている場合があります。他のすべての名称ならびに製品についての商標は、それぞれの所有者の商標または登録商標です。

通信メディアおよびエンターテインメント

金融サービス

T-Mobileお客様の行動を理解することによる顧客の囲い込み、顧客ロイヤルティ・プログラムの作成

インターネット

Fox

Deutsche Bank・ 不正行為の検出と防止・ 信用度採点による信用 リスクの低減

小売

製薬

Walmartサプライ・チェーン分析によるコストの最適化と削減

Amylin新薬の発見と開発のための分析

広告対象の絞り込みのためのクリック・ストリーム分析と市場調査

Greenplumは世界各国で 150社以上の IT 活用先進企業で利用されています。金融機関(銀行、保険、カード)、通信業界、流通業、ネット系企業、製造業など幅広い企業でビジネスの発展に貢献しています。利用目的も One to One Marketing、コンプライアンス管理、マーケット・セグメント分析、CRM情報基盤、経営 KPI管理、バッチ時間の短縮と様々です。

事例

● ソフトウェアのみ購入● ハードウェアはお客様が自由に選択● システム構築と管理はお客様が実施

● ハードウェア、ソフトウェア導入済み統合アプライアンス● 短期間での導入が可能● 保守ワークロードの削減● ペタバイトクラスまでのリニア・スケーラビリティ

ソフトウェア・ソリューション

アプライアンス・ソリューション

2つの導入方式

OS

<本番環境> SUSE Linux Enterprise Server 10.2 (64ビット) Red Hat Enterprise Linux 5.x (64ビット) CentOS Linux 5.X (64 bit) Sun Solaris 10 Update 7 以上 (64ビット)<開発・評価環境> Mac OS X 10.5 Red Hat Enterprise Linux 5.2 以上 (32ビット) CentOS Linux 5.2 以上 (32ビット)

ファイル・システム SUSE Linux, Red Hat Enterprise Linuxではデータ領域に XFS, Solaris ではデータ領域に ZFS を使用

プロセッサ <本番環境> x86 64 ビット<開発・評価環境> x86 32 ビット

メモリ容量 サーバあたり 16GB 以上

ディスク 標準ディスク・インターフェイス規格(SATA / SAS)ストレージ・エリア・ネットワーク(SAN)

ネットワーク ギガビット Ethernetスイッチまたは 10ギガビット Ethernetスイッチ