플래시 시스템, 성능의 제약을 속도로 초월하다 › edm › j1410 › 1030_hdp ›...

Post on 28-Jun-2020

1 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

www.ibmitinsight.com01 BIG DATA

플래시 시스템, 성능의 제약을 속도로 초월하다IBM FlashSystem, 스토리지와 애플리케이션의 성능 문제 해결해

www.ibmitinsight.com02 BIG DATA

IBM FlashSystem 기술은 특별히 스토리지와 애플

리케이션 성능 문제를 해결하는 데 초점이 맞춰져 있다.

IT Insight는 IBM FlashSystem 기술의 활용과 관련하여

중점적으로 고려할 사항 및 기업에서 그 가치를 극대화

할 방법에 대해 소개하고자 한다.

플래시의 이점I/O 대기 시간이 솔루션 성능을 저하시키는가? 플

래시 기술은 애플리케이션 가속화의 용도로 가장 많

이 쓰인다. 프로세서 기술의 속도가 기존 스토리지의

속도를 앞질렀고, 그로 인해 I/O 대기 시간이 서버의

성능을 십분 발휘하는 데 커다란 걸림돌이 되곤 한다.

IBM MicroLatency 기능을 갖춘 IBM FlashSystem

기술은 I/O 대기 시간을 디스크와 비교하여 몇 분의 일

수준으로 단축하므로 애플리케이션의 응답 시간이 획

기적으로 향상될 때가 많다.

IBM FlashSystem 기술은 대부분의 애플리케이션에

서 필요한 수준을 능가하는 IOPS(I/O Operations Per

Second) 용량을 제공한다. 이와 같은 성능 확장성 덕분

에 스토리지를 통합하려는 경우, 하나의 이미지에 여러

애플리케이션이 있는 경우 또는 단일 서버나 여러 대의

서버에 걸쳐있는 다수의 가상 머신에서 애플리케이션을

실행하는 경우에 효과적인 기술이다.

데이터 센터에서 스토리지 공간을 줄이고 전력 및 냉

각 비용을 낮추면서 스토리지 성능을 높이길 원한다면,

I/O 밀도, 용량(최대 40TB RAID5), 에너지 및 설치 공

간 절감 효과를 고려할 때 IBM FlashSystem 기술이 2U

폼 팩터에서 뛰어난 효율성을 실현한다. 전력 소비와 냉

각 비용을 줄일 뿐 아니라 스토리지 성능 관련 기능을 강

화하므로 데이터 센터의 무분별한 확장(sprawl) 현상을

해결하는 데도 더없이 효과적인 솔루션이다.

응답 시간과 IOPS의 중요성

플래시 제품 소개에서 보통 IOPS 또는 응답 시간을

강조하는데, 사실 이 두 가지는 밀접하게 연관되어 있

다. 응답 시간은 하나의 I/O를 처리하는 데 걸리는 시간

이며, I/O가 빨리 처리될수록 더 많은 작업이 수행된다.

그리고 IOPS는 시스템의 처리 속도 또는 처리량을 측

정하는 척도이다.

큐잉(Queuing) 원칙에 따르면, 큐에 있는 항목 수(Q)

를 항목당 평균 시간(t)으로 나누면 시스템의 처리 속도

가 나온다(Q/t = 처리량). 예를 들어, 큐의 깊이가 20이

고 응답 시간이 5밀리초라면 4,000IOPS가 된다. 시스

템에서 스토리지에 작업을 전송하는 속도가 고정되어

있다면 가장 중요한 변수는 응답 시간이다. 앞의 예에서

큐는 변화가 없지만 응답 시간이 100마이크로초로 단

축되면 처리 속도는 200,000IOPS로 향상된다.

따라서 시스템에서 I/O 처리에 상당한 시간을 보낸다

고 가정하면, I/O 응답 시간을 낮춰 애플리케이션 성능

에 가장 큰 영향을 줄 수 있다. MicroLatency 기능을 갖

춘 IBM FlashSystem 기술은 업계 최고 수준의 응답 시

간을 실현하도록 설계되었다. 어떤 프로세스에서 데이

터를 기다리는 시간이 단축되면 프로세스 성능이 수동

으로 튜닝했을 때보다 더 빨라질 수 있다. 개발 팀이 성

능 튜닝보다 신규 소프트웨어 배포에 주력할 수 있다면

좋지 않을까?

물론 IOPS 기능 자체도 여전히 중요하다. 대부분의 애

플리케이션에서는 IBM FlashSystem의 처리 확장성이 한

계에 이르지 않겠지만, 수요가 증가하거나 가상화 또는

스토리지 중앙화에 의한 통합을 지원할 경우에 대비하여

넉넉한 IOPS 성능까지 보장된다면 더욱 좋을 것이다.

모든 지표가 동등한 건 아니다

제조사들은 제품 기능의 한계치를 제공하는데, 사용자

가 그 의미를 제대로 알고 있어야 한다. 일반적으로 플래

시 제품에 표시되는 응답 시간 수치는 단일 I/O 작업 또는

큐 깊이가 1인 경우를 기준으로 하는데, 실제 환경 대부

분은 큐 깊이가 5 ~ 20이다. 여기서 큐 깊이 1을 기준으

로 하는 것은 최상 조건의 응답 시간이 단일 I/O 작업에서

측정되기 때문이며, 이 기본적인 능력에 기초하여 큐 깊

이가 1보다 큰 경우의 성능이 결정된다.

그런데 모든 스토리지 제품은 IOPS 성능 향상과 함께

응답 시간도 증가하기 마련이기 때문에 IOPS 성능이 향

상되어도 응답 시간이 길어지지 않도록 설계할 필요가

있다. 그리고 IBM FlashSystem 설계의 장점은 IOPS성

능이 향상되더라도 응답 시간을 상당 구간에서 낮은 수

준으로 유지하면서 일관성 있고 예측 가능한 성능을 제

공하는 데 있다.

플래시가 가장 뛰어난 성능을 제공하는 I/O 작업은

읽기 작업이다. 플래시는 무작위 읽기가 100%일 때 최

고의 처리량(IOPS)을, 순차적 읽기가 100%일 때 최고

의 대역폭(초당 기가바이트)을 제공한다. 게다가 IBM

FlashSystem 기술은 무작위 및 순차적 쓰기 성능도 뛰

어나다. 실제로 쓰기 관리 오버헤드가 발생할 때까지는

읽기보다 짧은 응답 시간으로 무작위 쓰기를 수행할 수

있다(모든 플래시 제품은 가비지 컬렉션을 해결해야 한

다). 현실적으로 어떤 작업 유형이 100%를 차지하는 워

크로드는 드물며, 실제 환경에서는 해당 제품이 복합 워

크로드를 어떻게 처리하고 평균 응답 시간을 낮은 수준

으로 유지하면서 얼마나 버틸 수 있느냐가 중요하다.

소프트웨어 관련 참고 사항

시스템 솔루션은 하드웨어와 소프트웨어의 통합체이

므로, 소프트웨어가 솔루션의 성능과 IBM FlashSystem

기술의 활용 가능 범위를 좌우하는 것도 당연하다. 소

프트웨어 동작이 어떻게 IBM FlashSystem 기술을 보

완할 수 있는가에 대해서는 본 기사 마지막 부분에 있

는 별도의 박스기사 ‘애플리케이션/구현 환경에서 IBM

FlashSystem으로 얻는 이점을 알아보기 위한 5가지 질

문’에서 확인할 수 있다. 다양한 애플리케이션과 미들웨

어에서 IBM FlashSystem으로 큰 효과를 볼 수 있지만,

성능과 확장성을 염두에 두고 신중하게 설계된 소프트

웨어는 IBM FlashSystem 기술의 가치를 최대한 누릴 수

있도록 해준다. 예를 들면, 다음과 같다.

컴퓨터 시스템의 구성 요소에서 일부의 성능이 향상되면 애플리케이션의 성능도 더 좋아질

것으로 기대하게 된다. 그러나 최신 시스템 솔루션은 하드웨어와 소프트웨어의 정교한 통

합체이기 때문에 성능을 제약하는 요인이 아닌 구성 요소를 업그레이드할 경우 성능 향

상에 도움이 되지 않을 것이다. 따라서 어떤 신기술이든 그것을 최대한 활용하기 위해서는 환경의 어

느 부분이 성능을 제약하는지 알아낼 필요가 있다.

• IBM FlashSystem 기술은 IBM DB2를 비롯하여 현

재 출시된 주요 데이터베이스 제품 대부분을 가속화

하는 용도로 널리 사용되고 있다.

• IBM InfoSphere Identity Insights는 더 신속한 범

죄 예측 및 예방을 위해 최적화된 지능적 인식 알고리

즘을 갖춘 고급 엔티티 분석 소프트웨어 솔루션이다.

이 솔루션은 전체 정보 환경을 실시간으로 마이닝하

면서 동일 인물 또는 집단과 관련된 모든 연관 관계와

사건을 밝혀낸다. 의심스러운 상황이나 패턴이 발견

되면 사전 예방적으로 경고를 발효한다. 이 솔루션을

IBM FlashSystem 기술과 함께 사용한 결과, 디스크

를 사용할 때보다 성능이 100배 향상되었고 랙 공간

은 1/24로 줄었다.

• IBM Tealeaf 제품은 항공기의 블랙박스처럼 실제 사

용자의 관점에서 웹 사이트의 상호 작용을 기록한

다. Tealeaf는 미션 크리티컬 웹 사이트를 모니터링하

면서 매일 테라바이트 단위의 데이터를 수집하고 실

시간으로 분석하는 경우가 많다. IBM FlashSystem

이 등장하기 전에 디스크를 사용하던 Tealeaf 고객들

은 심각한 I/O 제약을 겪어야 했다. “손쉽게 처리 속도

를 2배 높였고, 시스템은 어떤 부하 상태에서도 훨씬

더 신속하게 쿼리를 수행할 수 있게 되었습니다.” 라

www.ibmitinsight.com03 BIG DATA

더 이상 I/O 제약은 없다

IBM FlashSystem 기술은 애플리케이션을 가속화하

고 스토리지 통합을 현실화하며 설치 공간을 줄이고 전

력 및 냉각 비용을 감축하면서 비즈니스 환경에 획기적

인 변화를 가져온다. 또한 기존 SAN 환경에서 손쉽게

구현할 수 있다. IBM FlashSystem 기술은 일관성, 예측

가능성, 우수한 확장성, 짧은 응답 시간을 갖춘 업계 최

고의 스토리지 솔루션이 되도록 설계되고 개발되었다.

IT 팀은 IBM FlashSystem 기술을 활용하여 I/O 제약

에서 벗어나 새로운 기능과 기술에 주력할 수 있으며,

경제적인 방식으로 애플리케이션과 데이터 센터 성능

을 획기적으로 향상시킬 수 있다.

고 Tealeaf의 CTO인 Robert Wenig은 말한다. “IBM

FlashSystem 솔루션의 진정한 매력은 코드 변경 없이

강력한 성능을 실현할 수 있다는 것입니다. 정말 탁월

한 장점이죠.”

• IBM General Parallel File System(GPFS)은 짧은 응

답 시간을 필요로 하는 분석, 빠른 속도를 필요로 하

는 백업 복구 및 파일 수집(Ingest) 그리고 데이터 워

크플로우를 최적화하여 비즈니스 프로세스의 성능

을 높이는 작업 등에 활용된다. 클러스터 파일 시스템

인 GPFS가 IBM FlashSystem과 만나면 다음과 같이

세 가지 측면에서 그 장점이 배가된다.

• IBM ProtecTIER 인라인 중복 제거 기술은 중복된

데이터를 줄이거나 없애 어떤 규모의 기업도 더 효

율적으로 데이터를 보호하고 급증하는 신규 데이터

를 관리할 수 있게 한다. IBM FlashSystem 솔루션과

ProtecTIER 기술을 함께 사용함으로써 기업용 플래

시 스토리지 성능을 실현할 뿐 아니라 효율적이고 빠

르며 안정적인 백업/복구 시스템을 구축할 수 있다.

ProtecTIER와 IBM FlashSystem에 관한 최근 연구 조

사에 따르면, ProtecTIER와 디스크를 함께 사용할 경

우와 비교하여 다음과 같은 3가지 장점이 있다.

1 파일 내용의 크기와 범위가 확대됨에 따라 메

타데이터의 크기도 증가하므로 메타데이터

작업이 전반적인 성능을 부분적으로 좌우한다. 메

타데이터 저장/검색에 IBM FlashSystem 기술을

활용하면 클러스터 기반의 어떤 애플리케이션도 가

속화할 수 있다.

2 GPFS는 투명한 방식으로 다른 스토리지 계층

에 파일을 마이그레이션하도록 지원한다. 사용

자는 GPFS의 정책 엔진을 사용하여 I/O 작업량이 많

은 일부 파일을 IBM FlashSystem에서 전담하게 하고

자주 액세스하지 않은 대용량 파일은 계속 디스크 또

는 테이프에서 처리할 수 있다.

3 IBM FlashSystem 기술을 데이터 저장소로 사

용하면 예측 가능하고 일관성 있는 성능과 짧

은 응답 시간을 실현하여 GPFS를 사용하는 가장 까

다로운 애플리케이션의 요구 사항도 충족할 수 있다.

1 백업 및 복원에서 비용대비성능이 최대

50% 향상된다.

2 IBM FlashSystem 솔루션은 디스크에 비

해 랙 사용 공간이 1/18 수준이다.

3 전력 소비가 크게 줄어든다.

플래시는 무작위 읽기가

100%일 때 최고 처리량을,

순차적 읽기가

100%일 때 최고 대역폭을 제공할 수 있다.

IBM FlashSystem과

InfoSphere Identity Insights를

함께 사용한 결과,

디스크를 사용할 때와 비교하여 성능이

100x 향상되고, 랙 공간이

1/24 로 줄었다.

IBM FlashSystem과 ProtecTIER를

함께 사용한 결과,

디스크를 사용할 때와 비교하여

가격 및 성능이

50% 향상되고, 랙 공간이

1/18

로 줄었으며 에너지 사용량도

크게 감축되었다.

 

 

애플리케이션/구현 환경에서 IBM FlashSystem으로 얻는 이점을 알아보기 위한 5가지 핵심 질문

IBM FlashSystem 기술을 도입한 기업은 큰

효과를 거둘 수 있다. 이 기술이 어떤 환경에

적합한지 판단하는 데 다음 5가지 질문이

도움이 될 것이다.

애플리케이션에서 I/O 대기 시간이 긴 편인

가 또는 성능 문제를 해결하려면 (쇼트 스트

로킹(short-stroking) 하드디스크 드라이브와 같

은) 고비용의 완화 조치가 필요한가?

애플리케이션에서 엄격한 응답 시간 요구 사

항을 충족해야 하는가? 응답 시간에 민감

한 애플리케이션이라면 IBM FlashSystem 기술의

MicroLatency 기능이 효과적일 수 있다.

무작위 I/O와 순차적 I/O의 비중이 각각 얼

마나 되는가? 무작위 I/O는 디스크 기반 시

스템에 더 큰 부담으로 작용하지만, IBM FlashSys-

tem에서는 이 문제가 손쉽게 해결된다.

해당 애플리케이션 환경에서 몇 개의 스레

드가 I/O를 수행하는가? 이 값이 높을수록

MicroLatency 기술과 IBM FlashSystem의 뛰어

난 처리 확장성이 진가를 발휘한다.

애플리케이션이 수익과 직결되는가 또는

사용자 시간을 중요시하는 다수의 내부

고객을 애플리케이션에서 지원하는가? 이러한

경우에 IBM FlashSystem 기술의 도입으로 경

쟁력을 크게 강화할 수 있다.

1

2

3

4

5

더 자세한 정보는 여기에서!

플래시를 이용한 똑똑하고 더 빠른 통찰력 이용

http://www-903.ibm.com/edm/J1409/0925_hdp/FlashSystemInsight.pdf

더욱 진화된 고객 경험을 실현하는 고속 분석(High Velocity Analytics Take the Customer Experience to the Next Level: IBM FlashSystem과 IBM Tealeaf)

theedison.com/pdf/samples_IBM_FlashSystem_Tealeaf_WP.pdf

똑똑한 데이터 센터에서 플래시의 성능을

활용하여 정보를 보호하기(Protecting Information in a Smarter Data Center with the Performance of Flash: IBM FlashSystem과 IBM ProtecTIER)

theedison.com/pdf/samples_IBM_FlashSystem_ProtecTIER_WP.pdf

top related