데이터웨어하우스 (dw)
DESCRIPTION
데이터웨어하우스 (DW). 2005. 5. 목 차. 개 념 정 의 필요성 시스템 구성 DW 의 특징 Mart 구성 방법 OLAP 도입효과. 개념. 신속하고 정확한 의사 결정을 위해 기업 내부 및 외부 소스로부터 데이터를 수집하고 관리하기 위해 기업내의 분포되어 있는 다양한 Data 를 모아놓은 저장소로써 경영층 및 관리층의 의사결정지원 (Decision Support) 을 주목적으로 함. 의사결정을 위하여 정보를 필요로 하는 사람들에게 필요한 시간에 원하는 방식으로 접근할 - PowerPoint PPT PresentationTRANSCRIPT
데이터웨어하우스 (DW)
2005. 5
- 2 -
1. 개 념2. 정 의3. 필요성4. 시스템 구성5. DW 의 특징6. Mart 구성 방법7. OLAP
8. 도입효과
목 차
- 3 -
1. 개념 신속하고 정확한 의사 결정을 위해 기업 내부 및 외부 소스로부터 데이터를 수집하고 관리하기 위해 기업내의 분포되어 있는 다양한 Data 를 모아놓은 저장소로써 경영층 및 관리층의 의사결정지원 (Decision Support) 을 주목적으로 함
Repository
처방데이터 상병데이터 . .수익데이터 의사결정을 위하여 정보를
필요로 하는 사람들에게필요한 시간에 원하는 방식으로 접근할
수 있도록 하는 것입니다 .
- 4 -
2. 정의
진료 . 경영 . 관리 등의주제별 재구성 Data
수년간의각 부서에서
발행한 데이터와 외부 정보를 주제별로통합하여
별도의 프로그램 없이
사용자 스스로즉시에여러 각도로분석이 가능한
통합 의료정보시스템
처리 목적 Data(OCS, 검사 , 원무 )
경영분석
진료분석
통계정보
- 5 -
3. 필요성
병원 내부 데이터 병원 내부 시스템 병원 내부 프로세스 사용자 인식의 변화 외부 환경의 변화• 대용량 데이터의 축적• 지속적인 분석 / 반영이 안됨• 데이터로부터 지식 획득 / 활용이 어려움• 보다 세분화된 분석 ,
통계 및 환자진료에 대한 자료 요구
• 의사 결정 시스템의 부재• 통합적 분석 정보의 축적 / 분석 미비• 정형화된 자료 중심의 보고서
• 분석 툴 기능의 활용 미비 ( 타부서 의존 )• 많은 수작업으로 인해 분석정보의 적시성 미흡
• 사용자의 Needs 의
다양화와 고도화
• 고객 요구 수준 향상
• 병원간의 생존 경쟁 심화• 환자 진료 분석을 통한 대외 전략 수립기능 확보 필요 • IT 기술의 발전에 따른 대용량의 데이터처리 와 신속한 분석을 요구
문제제기
- 병원내의 분산된 데이터의 통합 / 정보화- 다양한 진료 / 연구를 위한 지원 정보 요구- 신속 정확한 의사결정 지원 요구
Data Warehouse 의 필요성- 병원 경영현황의 보다 정확한 파악- 차별화된 의료 서비스 기반 제공- 경쟁적 우위 달성
- 6 -
• ETL(Extraction, Transformation, Loading, ETT 와 동의어 ) 이란 OLTP 으로부터 필요한 데이터를 추출 (Extract) 하여 변환 (Transformation) 작업을 거쳐 타겟 시스템 (Target System) 으로 전송 및 로딩 (Loading) 하는 모든 과정• 메타데이타 : 어떤 Data 를 어떻게 저장할 것인가 정의하고 , 데이터를 찿기 위한 인덱스 정보를 가지고 있는 데이터• 데이타마트 : DW 에 저장된 정보를 주제별 (EIS, CIS 등 ) 로 중복 저장하는 장소• OLAP(On-Line Analytical Processing) : User 가 DW 나 Mart 에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용
4. 시스템 구성운영계(OLTP) 데이터 웨어하우스 OLAP 사용자
ETL( 대상 Data 추출 )
Data Warehouse( 대용량 저장장치 )
ROLAP/Report
WEB basedAnalysis
병원장
관리자
의사간호사관리
RDBMS
지원업무
RDBMS
기타
RDBMS
OCSMetadata
DataMart
DataMart
DataMart
DataMart
EIS
CIS
보고서
기 타
- 7 -
5. DW 특징
특징
주제지향성 (Subject Orientation)
통합성 (Integration)
비휘발성 (Non-Volatility)
시계열성 (Time-Varient)
- 8 -
5. DW 특징
; 통합의 관점에서 조직이 갖고 있는 정보를 업무 중심이 아닌 특정 주제 중심으로 구성하는 것
Operational Data Warehouse
A B C D
A B C D
A B C D
A B C D 질병별분석
환자별분석
처방별분석
약품별분석
주제중심
원무업무진료업무지원업무외부자료
Applications
A
B
C
D
● 주제지향성 (Subject Orientation)
- 9 -
3. DW 특징
; 같은 성격을 갖는 데이터의 표현을 단일화하는 것
성별
Operational
Appl A – m, fAppl B – 1, 2Appl C – x, yAppl D – male, female
Appl A – cmAppl B – inchesAppl C – mcfsAppl D - yards
Appl A – description AAppl B – description BAppl C – description C
Appl A – key char(10)Appl B – key dec fixed(9,2)Appl C – key pic ‘999,999’Appl D – key char(12)
m, f
Cm
description
Key char(12)
Data Warehouseencoding
measurement
Description from multiple sources
Conflicting keys
단위
설명
키
● 통합성 (Integration)
- 10 -
5. DW 특징
; 원시데이터로부터의 로딩 (Loading) 과 적재된 자료에 대한 검색 (Query) 이며 자료의 변경 및 삭제와 같은 휘발성 (Volatile) 작업은 없다
레코드 단위로 데이터 조작 대단위의 데이타 로드 및 엑세스
Operational Data Warehouse
Insert
Delete
Change
Select
Select
Load
Access Only
● 비휘발성 (Non-Volatility)
- 11 -
5. 특징
; 일정한 기간동안의 데이터를 저장하여 시점별로 분석 가능 . 즉 , DW 에 저장되는 각각의 레코드에 시간이라는 필드를 갖게 하여 조회시 , 과거 - 현재 - 미래 등 시간 흐름상 추세를 분석
• 검색하는 순간의 데이터의 정확성이 중요• Key Structure may/may not contain an element of time
• 이미 정해진 어느 한 시점의 정확성이 중요• 일정기간 단위별로 ‘ Snap Shot’ 형식으로 저장• Key Structure contain an element of time
Operational Data Warehouse
● 시계열성 (Time-Varient)
- 12 -
장점• 빠른 implementation • 빠른 투자 회수 (ROI)I• 부분적인 제어• data 는 IT 에 의존하지 않고 사용
단점• 여러가지 data models 이 발생• data model 에 통일성 떨어짐• manage/maintain 을 위해서는 여러 interface 가 필요• No single version of the truth• data 의 중복이 발생
장점• Single Version of the Truth• IT 에 의한 정제된 data• data medels 의 통일성• 완벽한 data transformation• 유연한 data mart 구성
단점• data warehouse 가 존재해야 함• 기업의 전략과 일치하여야 함
6. Data Mart 구성 방법독립적 Data Mart 종속적 Data Mart
- 13 -
① 정의 : 최종 사용자 (end-user) 가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정
② 목적 : DW 나 Mart 로 구성된 자료를 최종사용자는 온라인상에서 직접 데이터에 접근
하며 , 대화식으로 정보를 분석하므로 최종사용자가 기업의 전반적인 상황을
이해할 수 있게 하고 의사결정을 지원하는데 그 목적이 있음
7. OLAP 소개가 . OLAP(On-Line Analytical Processing) 의 정의와 목적
나 . OLAP 특성 ① 다차원성 : 사용자들이 실질적인 차원에서 정보를 분석하도록 한다 .
② 직접접근 : 사용자가 전산 부서와 같은 정보 매개자를 거치지 않고 자신이 원하는 정보에
직접 접근한다 .
③ 대화식 분석 : 사용자는 시스템과의 상호작용을 통해 정보를 분석하며 원하는 결과를
얻을때 까지 계속해서 분석을 수행한다 . ④ 의사결정에 활용 : 사용자가 기업의 전반적인 상황을 이해할 수 있게 하고 의사결정을 지원한다 .
- 14 -
일반적으로 OLAP 툴은 MOLAP, ROLAP, DOLAP, HOLAP 로 구분된다 .
• MOLAP(Multidimensional OLAP) : 다차원 데이터베이스에 기반한 OLAP 아키텍처 .
- 원하는 정보를 사전에 다차원데이타베이스 (MDB) 에 저장한 후 필요시 즉시 조회하는 툴
- 정보의 유형별로 MDB 를 사전에 구성해 놓아야 함으로 IT 직원의 업무가 가중
- 사용자는 사용하기 편함
• ROLAP(Relational OLAP) : 관계형 데이터베이스에 기반한 OLAP 아키텍처 .
- MDB 를 서로의 관계 정보를 다양하게 조회할 수 있도록 하는 툴
- 최근 병원업계에서는 ROLAP 을 사용하는 추세
OLAP 과 관련하여 가장 많은 논란이 되는 것은 MOLAP 제품과 ROLAP 제품 사이의 선택이다 .
ROLAP 제품은 일반적으로 MOLAP 제품에 비해 복잡한 비즈니스 로직을 반영하기 힘들고
다차원 연산기능이 부족한 반면 , MOLAP 제품은 ROLAP 제품에 비해 대용량의 데이터를
처리하지 못함 .
7. OLAP 소개다 . OLAP Tool 비교
- 15 -
7. OLAP 소개
MOLAP ROLAP
특성 다차원 모델링 및 질의도구 다차원 질의 도구
데이터 조작 읽기 / 쓰기 읽기 중심데이터 요구량 대용량 초대용량연산 기능 다양한 연산 제한된 연산개발 주체 최종 사용자 주도형 전산부서 주도형
라 . MOLAP 과 ROLAP 의 비교
- 16 -
8. 도입 효과
가 . End-User Comouting 구현으로 업무처리가 단순
나 . 일관성있는 데이터를 기반으로 신속 정확한 의사결정지원 (DSS) 이 가능
다 . 업무의 중복성 및 업무절차의 복잡성이 대폭 감소
라 . 과거 자료에 의한 추론 및 자료추적이 가능 – 공중보건정보에 활용