クラウド運用のベストプラクティスを考える -...
TRANSCRIPT
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘
クラウド運用のベストプラクティスを考える
2016/12/01ミラクル・リナックス株式会社
テクニカル・アライアンス部
熊谷 理那
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘2
“クラウド”の利用拡大
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘3
“オンプレ”運用から”クラウド”運用へのシフト
静的な運用設計初期費用>運用費用
動的な運用設計運用費用>初期費用
使用するツール知識時間経過で安定化
様々なツール知識時間経過で変化
オンプレの障害対応 クラウドの障害対応
オンプレの運用設計 クラウドの運用設計
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘4
“クラウド”な運用課題例 1/2
構成管理
リソース・コスト最適化
リソース監視コスト可視化
クラウドではコストやリソースの最適化は最重要の課題
・大規模な監視・リソースの可視化・構成変更の自動化
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘5
“クラウド”な運用課題例 2/2
プロフェッショナル オペレーター
コミュニケーション
!!!ドキュメント ナレッジ・ベース
検知
対応
インシデント→対応→ドキュメント作成→ナレッジ蓄積を動的かつ高速に行う必要あり
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘6
局所的なソリューション(OSSツール)
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘7
OpenStack共同検証ラボ
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘8
OpenStack共同検証ラボ
{ OpenStack } + { OSS }“クラウド”の運用を想定してOSSを組合せベストプラクティスを探求する
・構築済みOpenStack環境を提供→成果はGithub等で公開
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘9
OpenStack共同検証ラボ : MLの例
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘10
OpenStack共同検証ラボ : MLの例
・ 各テナント毎にZabbix Serverを配置し、Agent経由で監視。・ OpenStack用監視テンプレートを適用。
CustomerVM
ZBX agent
CustomerVM
ZBX agentZBX sever
VM
CustomerVM
ZBX agent
CustomerVM
ZBX agentZBX sever
VM
CustomerVM
ZBX agent
CustomerVM
ZBX agentZBX sever
VM
A
B
C
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘11
OpenStack共同検証ラボ : MLの例
Zabbix
Nagios
fluentd
Redmine
ssh
イベント管理
変更管理リリース管理
インシデント管理
問題管理Zabbix
稼働監視リソース監視障害判定
自動起票エスカレーションステータス管理
ホスト管理資源/資産管理設定管理一括変更
ログ管理リソース状況参照
イベント通知イン
シデント登録
リモートコ
マンド問題切り分
け
状況表示イベント管理イベント通知
サービスデスク
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘12
OpenStack共同検証ラボ : MLの例
アプリ
ゲストOS
アプリ
ゲストOS
仮想マシン 仮想マシン
HyperVisor
ZabbixNagiosFluentd
Ceilometerlibvirt
ZabbixNagiosFluentd
ゲストOS、アプリのリソース、ログ
仮想マシンリソース
物理マシン、OpenStackのリソース、ログ
複数の監視サーバを統合してイベントを管理複数の監視ソフトで取得した情報を統合管理
複数の管理対象のリソースを縦串、横串で確認監視ソフトの違い、環境の違いを意識せず、一括でグラフ表示、イベント表示
監視サーバ、監視対象を問わずグラフを並べて表示
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘13
OpenStack共同検証ラボ : MLの例
統合監視とインシデント管理を統合障害検知後、自動でインシデント起票
対応状況、ステータスなどが追跡可能で、詳細な現象、対応履歴が参照可能
長く利用することで、独自のナレッジベースとして活用できる
インシデント発行
ステータス通知
メール通知
2014/10/21 03:02:22 ! XXさんがステータスを対処済みに変更しました
2014/10/21 02:51:06 ホストAで障害が復旧しました
2014/10/21 02:32:19 ! XXさんがステータスを対処中に変更しました
2014/10/21 02:16:25 担当にXXさんが割り当てられました
2014/10/21 02:16:23 ホストAで障害が発生
R:75 G:175 B:110 R:220 G:240 B:210 R:135 G:185 B:85 R:240 G:150 B:25R:0 G:155 B:70
Copyright © MIRACLE LINUX CORPORATION. All rights reserved.関係者外秘14
OpenStack共同検証ラボ : MLの例
OpenStack監視テンプレート
Zabbixのイベントを集約・表示
Hatoholからチケットを自動で発行