クラウド運用のベストプラクティスを考える -...

14
Copyright © MIRACLE LINUX CORPORATION. All rights reserved. 関係者外秘 クラウド運用の ベストプラクティスを考える 2016/12/01 ミラクル・リナックス株式会社 テクニカル・アライアンス部 熊谷 理那

Upload: virtualtech-japan-inc

Post on 12-Jan-2017

419 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘

クラウド運用のベストプラクティスを考える

2016/12/01ミラクル・リナックス株式会社

テクニカル・アライアンス部

熊谷 理那

Page 2: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘2

“クラウド”の利用拡大

Page 3: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘3

“オンプレ”運用から”クラウド”運用へのシフト

静的な運用設計初期費用>運用費用

動的な運用設計運用費用>初期費用

使用するツール知識時間経過で安定化

様々なツール知識時間経過で変化

オンプレの障害対応 クラウドの障害対応

オンプレの運用設計 クラウドの運用設計

Page 4: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘4

“クラウド”な運用課題例 1/2

構成管理

リソース・コスト最適化

リソース監視コスト可視化

クラウドではコストやリソースの最適化は最重要の課題

・大規模な監視・リソースの可視化・構成変更の自動化

Page 5: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘5

“クラウド”な運用課題例 2/2

プロフェッショナル オペレーター

コミュニケーション

!!!ドキュメント ナレッジ・ベース

検知

対応

インシデント→対応→ドキュメント作成→ナレッジ蓄積を動的かつ高速に行う必要あり

Page 6: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘6

局所的なソリューション(OSSツール)

Page 7: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘7

OpenStack共同検証ラボ

Page 8: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘8

OpenStack共同検証ラボ

{ OpenStack } + { OSS }“クラウド”の運用を想定してOSSを組合せベストプラクティスを探求する

・構築済みOpenStack環境を提供→成果はGithub等で公開

Page 9: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘9

OpenStack共同検証ラボ : MLの例

Page 10: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘10

OpenStack共同検証ラボ : MLの例

・ 各テナント毎にZabbix Serverを配置し、Agent経由で監視。・ OpenStack用監視テンプレートを適用。

CustomerVM

ZBX agent

CustomerVM

ZBX agentZBX sever

VM

CustomerVM

ZBX agent

CustomerVM

ZBX agentZBX sever

VM

CustomerVM

ZBX agent

CustomerVM

ZBX agentZBX sever

VM

A

B

C

Page 11: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘11

OpenStack共同検証ラボ : MLの例

Zabbix

Nagios

fluentd

Redmine

ssh

イベント管理

変更管理リリース管理

インシデント管理

問題管理Zabbix

稼働監視リソース監視障害判定

自動起票エスカレーションステータス管理

ホスト管理資源/資産管理設定管理一括変更

ログ管理リソース状況参照

イベント通知イン

シデント登録

リモートコ

マンド問題切り分

状況表示イベント管理イベント通知

サービスデスク

Page 12: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘12

OpenStack共同検証ラボ : MLの例

アプリ

ゲストOS

アプリ

ゲストOS

仮想マシン 仮想マシン

HyperVisor

ZabbixNagiosFluentd

Ceilometerlibvirt

ZabbixNagiosFluentd

ゲストOS、アプリのリソース、ログ

仮想マシンリソース

物理マシン、OpenStackのリソース、ログ

複数の監視サーバを統合してイベントを管理複数の監視ソフトで取得した情報を統合管理

複数の管理対象のリソースを縦串、横串で確認監視ソフトの違い、環境の違いを意識せず、一括でグラフ表示、イベント表示

監視サーバ、監視対象を問わずグラフを並べて表示

Page 13: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘13

OpenStack共同検証ラボ : MLの例

統合監視とインシデント管理を統合障害検知後、自動でインシデント起票

対応状況、ステータスなどが追跡可能で、詳細な現象、対応履歴が参照可能

長く利用することで、独自のナレッジベースとして活用できる

インシデント発行

ステータス通知

メール通知

2014/10/21 03:02:22 ! XXさんがステータスを対処済みに変更しました

2014/10/21 02:51:06 ホストAで障害が復旧しました

2014/10/21 02:32:19 ! XXさんがステータスを対処中に変更しました

2014/10/21 02:16:25 担当にXXさんが割り当てられました

2014/10/21 02:16:23 ホストAで障害が発生

Page 14: クラウド運用のベストプラクティスを考える - OpenStack最新情報セミナー(2016年12月)

R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70

Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘14

OpenStack共同検証ラボ : MLの例

OpenStack監視テンプレート

Zabbixのイベントを集約・表示

Hatoholからチケットを自動で発行