thursday, 11th december 2014 · master / slave node 1 node 2 ... sap hana secondary vip saphana...
TRANSCRIPT
Thursday, 11th December 2014
SUSE® HA 集群
林培峰SUSE 中国区技术经理[email protected]
4
议程SUSE® Linux Enterprise High Availability
概述
使用场景
技术路线图
产品特性
架构
5
挑战SUSE® Linux Enterprise High Availability
• 可能出现的错误
– 硬件 crash, 水灾 , 火灾 , 停电 , 地震等 ?
• 服务中断和数据丢失
– 你能够承受 5 秒钟的损失 , 但能承受更长时间的业务中断吗 ?
• 业务中断带来多大的损失 ?
墨菲定律:凡事只要有可能出错 , 那就一定会出错
你能承受低可用的系统吗 ?
6
概述SUSE® Linux Enterprise High Availability
• Linux 开源业界最先进的高可用解决方案
• 成熟可靠的开源技术套件 :‒ 经济实惠
‒ 方便集成
‒ 可视化诊断
• 与 SUSE Linux 深度集成 , 可帮助你 :‒ 维护业务的连续运行
‒ 保护数据一致性
‒ 减少关键业务的非计划停止时间
7
好处SUSE® Linux Enterprise High Availability
快速及简易安装、 配置和管理集群
确保关键业务系统和数据的连续运行
可用于物理 , 虚拟或者混合环境中
满足你的 SLA ( 服务水平协议 )
提高服务可用性
8
• 业务 24/7 可用
数据分布式复制
服务器备份和恢复
集群文件系统
双数据中心集群
• 虚拟化集群
网络负载均衡
成熟免费应用管理脚本
Samba 集群
支持多种硬件架构平台unique
unique
unique
unique
unique
unique
unique
unique
主要特性SUSE® Linux Enterprise High Availability
9
技术领导者SUSE® Linux Enterprise High Availability
• 操作历史日志全跟踪
• 最新的开源技术高可用套件
• 双数据中心集群支持
• 可靠的集群文件系统
• 集成分布式数据复制
• 支持多种硬件架构
• 与 OS 深度集成
• 支持虚拟化高可用
10
竞争对比SUSE® Linux Enterprise High Availability
Competitive Point SUSE HA Red Hat HA Symantec VCS
是否开源 Yes Yes No
跨区域支持 Yes No Yes
支持虚拟化
Hybrid physical, virtual clusters, protects guests and guest apps; supports KVM,
Xen, VMware
KVM, apps within guest, clusters physical, virtual
servers
VMware ESX server, protects apps in
guests
OS 集成工具 Yes Yes No
免费工具和资源代理 Yes
No(extra for Load Balancer,
Clustered Samba, and SAP Resource Agent)
No (extra charged)
硬件平台支持x86, x86_64, Itanium, IBM POWER, IBM System z
Only on x86, x86_64 Only on x86, x86_64
主版本升级 Yes No No
滚动更新 Yes No No
集群文件系统 OCFS2, GFS2 No (extra charged for GFS2) No (extra charged)
分布式数据复制 Yes No No (extra charged)
服务器备份和恢复 Yes No No (extra charged)
成本 $$ $$$ $$$$
11
• 控制德国境内的空中交通
• 政府企业
• SUSE 长期客户
• 视频 : DFS YouTube video
成功案例 –德国空管系统SUSE® Linux Enterprise High Availability
”SUSE Linux 是我们关键业务”非常重要的角色
” SUSE 为我们提供快速满意的“技术支持服务
“ 到目前为止 , 还没出现过SUSE Linux ”非正常关机情况
— Pieter Hollants
DFS Linux Service andCompetence Center
12
• 全球领先的汽车制造商
• 长期的客户关系
• 运行 SAP 高可用
成功案例 – 梅赛德斯 -奔驰SUSE® Linux Enterprise High Availability
”SUSE Linux Enterprise 提供可靠性和灵活性的完美组合 .”
”采用 SUSE 解决方案 , SAP应用 100% 运行时间 .”
”SUSE 和 SAP 的紧密合作关系给了我们充足的信心 .”
“SUSE HA 为我们提供强大的工具 .”
— ANTÓNIO DAMASIT Manager
13
• 上交所上市的全国性股份制商业银行
• 选用 SUSE Linux 为唯一的 Linux 操作系统
• 银行关键业务高可用
成功案例–浦东发展银行SUSE® Linux Enterprise High Availability
” 我们之所以选择 SUSE Linux 和 SUSE HA, 是因为它的成熟
性 , ”而且实施和操作成本较低
— IT 系统管理员
14
• 大型政府企业 , 包括下属 32个省市自治区气象部门
• SUSE 长期的客户 , 多个项目采用SUSE Linux 和 SUSE HA
• 多个气象关键业务运行高可用
成功案例 – 中国气象局SUSE® Linux Enterprise High Availability
” 我们对于 SUSE Linux 和SUSE HA 的性能表现和易用性感到非常的满意。结果表明 ,我们的管理更加方便了 , 安全性和反应能力都得到了提高 ,
”整体上变得更灵活
— 陈建军计算机与网络工程部信息中心
主任中国气象局
15
• 全球最大的电信运营商
• SUSE Linux入围中国移动集中采购目录 , 是中国移动长期供应商
• 多个关键应用运行 SUSE Linux 和SUSE HA
成功案例 – 中国移动SUSE® Linux Enterprise High Availability
” 我们将用于银行业务、 CRM和帐务的关键任务应用程序托
付给了 SUSE Linux 和SUSE HA, 对此我们十分放心 .”
— 庄钊文计费中心高级管理员
16
• 中国最大的车用润滑油生产制造商
• 把原有运行在Windows上的 ERP 应用迁移到 SUSE Linux
• 在 SUSE Linux 和 SUSE HA上运行SAP R3 ERP 系统
成功案例 – 统一石化SUSE® Linux Enterprise High Availability
“ 我们不必再将全部时间用来救火 , 实现了将更多精力从事战略性项目的梦想 . 我们对于SUSE Linux 和 SUSE HA所表现出的优异性能 , 出现的稳定性和安全性非常满意 . 如果让我们对操作系统进行打分 , 我们可以愿意打满分 .”
—潘北平 信息中心主任
使用场景
18
主要使用场景SUSE® Linux Enterprise High Availability
• 关键应用需要高可用
• 主 / 主服务
‒ OCFS2/GFS2 集群文件系统 , 数据库 , Samba 文件服务器
• 主 / 备服务
‒ “传统”数据库 , SAP 服务 , 大部分常规服务
• 私有云
‒ VM 高可用 , 控制节点高可用
• 各种拓扑的高可用 :
‒ 本地 , 城域 , 跨地域高可用
19
场景之 - 关键应用 (基于共享存储)SUSE® Linux Enterprise High Availability
resource failover
active / active
node 1 node 2
Database: (Oracle/DB2/Sybase)
共享存储
自开发应用中间件 : WAS/MQ/Weblogic
20
场景之 - 关键应用 ( 非共享存储 )SUSE® Linux Enterprise High Availability
resource failover
Master / slave
node 1 node 2
●自开发应用●中间件 : WAS/MQ/Weblogic●Database: (Oracle/DB2/Sybase)
本地硬盘 本地硬盘
分布式数据块复制
●自开发应用●中间件 : WAS/MQ/ Weblogic
●Database: (Oracle/DB2/ Sybase)
21
场景之 - SAP 应用SUSE® Linux Enterprise High Availability
22
场景之 - SAP HANASUSE® Linux Enterprise High Availability
SAP HANAPrimary
SAP HANASecondary
vIP
SAPHana Master/Slave ResourceMaster Slave
SAPHanaTopology Clone Resource
Clone Clone
suse01 suse02
Cluster Communication
System Replication
23
场景之 - 虚拟化SUSE® Linux Enterprise High Availability
suse1
kvmVM1
KvmVM2
suse2 suse3
Corosync + openAIS
Pacemaker
DLM
OCFS2 集群文件系统
KvmVM3
Network Links
Clients
Storage
24
场景之 - 高可用云 (OpenStack)SUSE® Linux Enterprise High Availability
25
场景之 - 负载均衡SUSE® Linux Enterprise High Availability
从本地到跨地域 Geo 集群
27
• 提供不同数据中心 ( 地区)之间的集群
‒ 即使一个数据中心出问题后,也能提供灾难恢复
‒ 每个数据中心有一个单独的集群
‒ 同时支持手工和自动切换
• 扩展城市集群的能力
‒ 数据中心之间没有距离限制
‒ 不需要同一个存储和网络
• 存储复制方式- active/passive
‒ 利用 Distributed Replicated Block Device (DRBD)
‒ 可集成第三方解决方案
‒ HP Continuous Access
‒ EMC SRDF
双数据中心集群 – 概述SUSE® Linux Enterprise High Availability
28
• 本地集群‒ 没有网络延迟
‒ 并行同步访问共享存储
• 城域集群
‒ 网络延迟 <15ms (~20mls)
‒ 一般在站点之间设置冗余网络
‒ 通常在某些情况下需要存储层的数据复制
• 双数据中心 ( 跨地域 ) 集群
‒ 高网络延迟 , 有限宽带
‒ 存储异步复制
双数据中心集群–从本地到跨地域SUSE® Linux Enterprise High Availability
29
双数据中心集群–配置SUSE® Linux Enterprise High Availability
Site A Site B
(Arbitrator)
boothd
Node 1 Node 2 Node 7 Node 8
Site C
boothd boothd
产品路线图
31
2012 2013 2014 2015 2016
SLE 11
SLE 12
SP3
GA
SP2
SP1
SP4
产品路线图SUSE® Linux Enterprise High Availability
SLE HA 11 SP2• Geo 集群
• 日志跟踪
• 安装工具
• web 工具管理
SLE HA 12• 离线日志浏览
• SCSI 集群
• GEO- 标准软件栈- 多租户- IP 迁移
SLE HA 11 SP3• 更友好的用户
使用界面
• 远程监控
32
• 错误发生时 :‒ 能承受多长时间的业务中断 – 0s, 1s, 1min, 1hour, 1day?
• 虚拟化和云‒ 是否重新 -{启动 ,部署 } VM 就足够了 ?
‒ 在 VM里是否需要安装 HA组件 ?
• 服务监控‒ 在深度监控中 , 'system as one' 或者远程监控
• Local, Metro, Geo...‒ 下一个集群的使用场景 ?
未来主要关注点SUSE® Linux Enterprise High Availability
Forward looking statement, might change without notice.
功能特性
34
新特性和增强SUSE® Linux Enterprise High Availability
• 最新的 HA 版本
• 历史日志浏览
‒ 离线支持
• 新的 fence 代理支持
‒ SCSI 处理
• 服务器备份和恢复
‒ 最新的 rear软件版本
• 负载均衡
‒ 增加 HAproxy
• 集群文件系统
‒ OCFS2 性能提高
‒ 增加 GFS2
35
新特性和增强SUSE® Linux Enterprise High Availability
• Pacemaker‒ 对象标识
‒ CIB 性能明显提高
• Cluster Shell命名行 :‒ 健康评估
‒ 提高错误报告和语法检查
‒ 支持 corosync 配置
• web 管理工具
‒ 增强配置向导
• Geo 集群
‒ 算法增强
‒ 在 CIB存储每个站点的配置信息
‒ 多仲裁站点
‒ 基于 DNS IP fail-over
安装 & 管理
37
• 配置一个集群确实很方便- node1 # sleha-init -i bond0 -t ocfs2 -p /dev/sdb- node[2...N] # sleha-join -c 192.168.2.1
• 可通过 web 配置集群
简易安装配置 – Bootstrap & WizardsSUSE® Linux Enterprise High Availability
38
web 管理工具 - hawk
39
命令行工具SUSE® Linux Enterprise High Availability
管理
41
• 应用远程监控
‒ 不需要 HA组件
‒ 复用 Nagios 插件
• 增强对 VM 处理
‒ 可从 Hypervisor直接监控 VM
‒ 把 VM 作为集群负载 , 实现 VM 高可用
‒ VM无需改变
• 扩展 pacemaker, 包括“ container” 资源的概念
远程监控
42
历史日志浏览
43
集群模拟SUSE® Linux Enterprise High Availability Extension
SUSE HA 架构
© SUSE, All rights reserved.45
3节点集群SUSE® Linux Enterprise High Availability Extension
Kernel
XenVM1
LAMPApache
IPext3
Kernel Kernel
Corosync + openAIS
Pacemaker
DLM
cLVM2+OCFS2
XenVM2
Network Links
Clients
Storage
46
Linux 高可用软件包SUSE® Linux Enterprise High Availability Extension
• 软件包组成 :
‒ resource-agents – 管理和监控服务的可用性
‒ stonith – IO fencing隔离支持 (also Xen and VMware VMs)
‒ corosync and OpenAIS – 集群架构
‒ Pacemaker – 集群资源管理
‒ CRM GUI – 集群管理图形界面工具
‒ hawk – 集群管理 Web 界面工具
‒ CLI – 集群管理命令行工具 .
© SUSE, All rights reserved.47
ext3, XFS OCFS2
cLVM2
Local Disks SANFC(oE), iSCSI
DRBD Multipath IO
DLM
SCTP TCP UDPmulticast
UDPmulticastEthernet Infiniband
Bonding
Linux Kernel
SAP
MySQL
libvirt
Xen
Apache
iSCSI
Filesystems
IP address
DRBD
clvmd
Ocfs2_controld
dlm_controld
YaST2
cDRBD cOpenAISMPIO
LVS
Re
sour
ce A
gent
s
LSB
in
it
ST
ON
ITH
LRM
...
DRAC
iLO
SBD
Fencing
Web GUI
Python GUI
CRM Shell
CIBPolicyEngine
Pacemaker
OpenAIS
各组件具体组成一个节点 :
48
• 业务中断恢复无距离限制–从本地到跨地域
• 可用性可达 99.9999%
• 支持在线不停机更新 , 减少计划停止时间
• 简易的安装 , 配置和管理
• 可视化诊断
• 开源 HA 技术的领导者
• 可与私有产品媲美
挑战墨菲定律
还等什么 ?
总结SUSE® Linux Enterprise High Availability
49
Thank you.
56
Learn more
www.suse.com/products/highavailability