시각화를활용한 빅데이터분석과 공공데이터개방사례 - …140227).pdf1...

35
시각화를 활용한 빅데이터 분석과 공공데이터개방 사례

Upload: others

Post on 04-Feb-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

시각화를 활용한

빅데이터 분석과

공공데이터개방 사례

1

데이터에서 가치 찾기

정보를 인간에게 가용하게해주는 기술

획기적으로 지난 40년간기술이 발전됨

빅데이터 수집, 저장, 처리 빅데이터 분석, 활용

데이터에서 가치를 찾는인간의 스킬을 간과함

정보는 인간에게 이해될 때가치가 있고, 이를 위해시각화가 필요함

빅데이터에서 가치를 얻기 위해서는 수집, 저장, 처리에서 분석, 활용으로

눈을 돌려야 한다

2

목차

1. 시각화

2. 공공데이터 개방

3. 적용사례

3

시각화

시각화(Visualization)는 데이터에 대한 이해를 증폭시키기 위해 데이터를 시각적으로 표현

시각화는 비쥬얼 인식의 강점이 발휘될 수 있는 도구와 결합될 때 성공적임

시각화는 빅데이터에서 인사이트를 얻는 직관적인 분석 기법

1. 시각화

4

현행 예산 정보의 표현

공공 데이터 개방이 확산되고 있으나 정보 제공 방식은 예전과 같은 나열 방식

1. 시각화

5

예산 정보의 표현 – 시각화 1

Tree Map을 이용하여 예산 정보를 시각화

1. 시각화

6

예산 정보의 표현 – 시각화 2

New York Times에서 역동적인 시각화로 예산 변화를 표현

예산 규모를 크기로, 증감률

을 색상과 위치로 표시

의무적인 것과 자유재량에 따라

사용할 수 있는 종류를 구분

증가, 삭감률에 따라

구분부처별로 구분

1. 시각화

7

관점별 주문 데이터 분석

필요한 분석 관점 별로 여러 번의 분석을 수행

월별 요일별 주문량은?

월별 주문량 일별 주문량

요일별 주문량 메뉴별 주문량

주문 데이터

관점 별 여러 번의 분석

주문데이터

1. 시각화

8

주문 데이터 분석 시각화

Calendar View로 여러 관점의 분석 결과를 한 번에 확인

가을철의 주문 빈도가 낮음

주말과 평일의 주문 차이

일월화수목금토

1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월

기념일(5월5일, 12월25일) 특수

붉은색이 진할수록 주문 빈도가 높음초록색이 진할수록 주문 빈도가 낮음

한 번에 표현

주문 데이터

1. 시각화

9

추세 분석

광역시 별 인구, 가구, 주택수의 증가 추세를 비교하고자 한다면

※ 예시: 통계청의 인구가구 데이터

행정구역별 수록시점 총인구 가구수 주택수

부산광역시 1990 3,854,960 993,375 510,124

부산광역시 1995 3,814,325 1,079,417 659,924

부산광역시 2000 3,662,884 1,120,186 805,212

부산광역시 2005 3,523,582 1,186,378 913,487

부산광역시 2010 3,414,950 1,243,880 990,374

대구광역시 1990 2,322,838 597,150 291,594

대구광역시 1995 2,449,420 703,464 425,930

대구광역시 2000 2,480,578 759,351 530,789

대구광역시 2005 2,464,547 814,585 590,734

대구광역시 2010 2,446,418 868,327 661,936

인천광역시 1990 1,922,608 485,404 309,867

인천광역시 1995 2,308,188 658,818 508,799

인천광역시 2000 2,475,139 747,297 614,081

인천광역시 2005 2,531,280 823,023 687,552

인천광역시 2010 2,662,509 918,850 781,115

광주광역시 1990 1,139,003 287,950 161,071

광주광역시 1995 1,257,636 354,717 244,060

광주광역시 2000 1,352,797 408,527 324,337

광주광역시 2005 1,417,716 460,090 366,315

광주광역시 2010 1,475,745 515,855 426,391

대전광역시 1990 1,049,578 262,193 158,831

대전광역시 1995 1,272,121 357,814 270,487

대전광역시 2000 1,368,207 413,758 320,723

대전광역시 2005 1,442,856 478,865 363,630

대전광역시 2010 1,501,859 532,643 404,341

1. 시각화

10

일반적인 추세 분석

부산시

광역시간 인구수 증가 추세 비교

1. 시각화

11

시각화를 이용한 추세 분석

Motion Chart 이용하여 광역시 간 인구, 가구, 주택 추세를 한번에 비교 분석

가구수 관점(X축) – 대전이 광주를, 인천이 대구를 추월

인구수 관점(Y축) – 부산시만이 인구수가 줄고 있음

주택수 관점(원 면적) –인천의 주택수 증가가 눈에띰, 인구가 줄고 있는 부산의 주택수는 오히려 증가

X축: 가구수, Y축: 인구수, 원크기: 주택수 ● 대전 ● 광주 ● 인천 ● 대구 ● 부산

1. 시각화

12

세종시 연혁 시각화

텍스트, 이미지, 동영상 정보를 융합하여 시 연혁을 Time Line으로 시각화

연혁을 단순히 나열하지 않고시간의 흐름에 따라 다양한 정

보를 융합하여 표시

1. 시각화

13

목차

1. 시각화

2. 공공데이터 개방

3. 적용사례

14

“공공정보를 어떻게, 어떤 수준까지 개방할 것인지, 계획을 조속히 마련할 것”(13.5.14 국무회의)

“작은 정보 하나라도 개방하고 공유하면 실제 국민 삶에 큰 도움 될 것”(13.6.19 정부3.0 비전선포식)

“정부3.0은 개방에서 끝이 아니라 민간 활용으로 사회수준을 업그레이드”(13.6.29 수석비서관회의)

공공데이터 개방은 민간의 창의와 활력을 제고해

일자리와 가치 창출

국민과의 소통과 맞춤형 서비스 제공

정부 3.0 정부가 보유한 공공데이터를 더 많이 개방 및 공유

하고 민간이 활용

미국‧EU‧영국 등 선진국은 오픈데이터 기본계획 및 법제도 마련

UN 전자정부 평가 항목에 공공데이터 개방(Open Gov.data) 추가

박근혜 정부의 공공데이터 개방 의지 천명!

정부 정책 2. 공공데이터 개방

15

공공데이터 개방 vs 정보 공개2. 공공데이터 개방

구분 공공데이터 개방 정보 공개

정의기계 판독이 가능한 형태의 공공데이터에 접근하여 다양한 방식으로 전달하는 것

-시민의 청구에 열람, 사본, 복제의 형태로 정보를 공개-공공기관이 자발적으로, 법령에 의하여 의무적으로 정보

를 배포 또는 공표하는 제도

목적공공데이터 민간 활용을 통한

국민 편의 향상과신규 비즈니스를 창출

국민의 알 권리 충족과행정 투명성을 제고

근거 법령공공 데이터 제공 및

이용 활성화에 관한 법률정보공개법

제공 및공개 단위

데이터베이스 내의 데이터 문서, 도면, 사진

16

공공데이터 개방 지원 기능

공공데이터 개방을 효율적으로 지원하기 위해 필요한 시스템 기능

공공데이터연계

공공데이터개방 프로세스공공데이터개방프로세스

공공데이터제공서비스

공공데이터포탈

공공데이터 DB

수집 가공 적재 서비스

공공데이터DB

Link API

2. 공공데이터 개방

17

공공데이터 개방 프로세스

공공데이터를 손쉽게 개방할 수 있도록 공공데이터개방 프로세스를 구성

안전행정부 공공데이터 관리 지침에따라 공공데이터 보유항목을 관리

공공데이터항목관리

공공데이터 개방 요청과 개방 취소프로세스를 지원

개방프로세스관리

공공데이터 개방 실적, 대국민활용 실적과 같은 통계 정보를

통한 모니터링

개방모니터링

특정관리자 IP 만 접근 허용권한체계를 통한 데이터 접근 통제

보안관리

2. 공공데이터 개방

18

공공데이터 포털

공공데이터를 활용하여 참여, 소통을 효율적으로 수행할 수 있는 기능

해당 기관의 특성에 맞는 메뉴의 구성

통합검색, 추천정보, 주간/월간인기정보, 자료실, 배너존,

최근 등록정보

2. 공공데이터 개방

19

공공데이터 연계

표준화를 적용하여 다양한 공공데이터 원천을 연계

공공데이터 개방관리 도구

공공데이터 DB

공공데이터 연계 프로세스공공데이터 원천

수집 가공 적재 서비스인터페이스

연계 가이드 제공

체계연동가이드

데이터 제공이 용이하도록가이드 제공을 통해 공공데이터

수집의 효율성 강화

연계데이터표준화수립

각 원천 데이터 별로 동일한 항목및 데이터를 제공하기 위하여공공데이터 표준화 지원대기

환경

소방

지리

차량

민원

교통

배출가스

시설물

도로

건물

행정

관광

2. 공공데이터 개방

20

공공데이터 제공서비스

다양한 사용자 계층의 공공데이터 활용성 강화를 위해 공공데이터를

Sheet, Chart, Map, File, OPEN API로 제공

Sheet

Chart

Map

OpenAPI

서비스설정

메타데이터관리

미리보기

2. 공공데이터 개방

21

목차

1. 시각화

2. 공공데이터 개방

3. 적용사례

22

서울시 열린데이터광장3. 적용사례

23

열린데이터광장 구성3. 적용사례

24

공공데이터개방 구조

공공데이터개방 프로세스 공공데이터 포털

공공데이터 연계 공공데이터제공 서비스

공공데이터개방 프로세스

기준정보 관리

분류체계 관리

시스템정보 관리

담당자 관리

메타정보 관리

참여소통

개발자 공간

아이디어 제안

우수 사례수요 조사

외부데이터 연계

데이터 등록

데이터 승인

데이터 공유

로컬 DB

카탈로그

개방프로세스 관리

개방 요청

개방 승인

개방 취소

개방 모니터링

DB 연계

연계DB 관리

연계테이블 관리

개방데이터목록 관리

수요 조사

연계 모니터링

제공데이터

시트

차트

OpenAPI

파일

링크

사이트소개

사이트 안내

이용약관

자료실

고객센터

공지사항

F A Q

Q&A

My Page

시각화

캘린더 뷰

모션 차트

3. 적용사례

25

위세아이텍의 WISE 3.0 제품군

WISE 3.0

공공데이터 개방과 활용을 위한 플랫폼 WISE 3.0은 WISE Open™을 중심으로

시각화와 데이터품질관리 도구가 결합되어 보다 고도화된 서비스를 제공

3. 적용사례

26

WISE VisualTM WISE OLAPTM

데이터의 전체적인 의미를 직관적으로인지시키기 위해 적합한 유형의 그래픽을 이용

데이터의 세부 부분을 여러 관점에서탐색적으로 분석

직관적인표현중심 탐색중심

WISE Visual™과 WISE OLAP™

시각화 도구인 WISE Visual™ 과 WISE OLAP™ 을 통해 공공데이터를 직관적으로

인지하고 여러 관점으로 탐색

3. 적용사례

27

열린데이터광장 시각화

2014. 2. 17 열린데이터광장에서 데이터시각화 시범서비스를 실시

3. 적용사례

28

예산현황 시각화

2014년 부문별 서울시 예산현황 (전체, 증감, 분야별)

3. 적용사례

29

대기오염도 Calendar View

2014년 서울역과 강남구의 이산화질소 대기오염도 비교

3. 적용사례

30

교통수단 이용율 Heat Map

통근 통학시 소득별 연령별 교통수단 이용률

3. 적용사례

31

주민등록인구 변화 Motion Chart

1991년부터 2013년까지 자치구별 주민등록인구 변화

3. 적용사례

32

지하철 호선별 이용객 Tree Map

지하철 호선별 이용객 수와 전년대비 증가율

3. 적용사례

33

맺는 말

1. 시각화

데이터에 대한 이해를 증폭시키기 위해 데이터를 시각적으로 표현

2. 공공데이터 개방

공동데이터 포털, 개방 프로세스, 공공데이터 연계, 공공데이터 제

공 서비스 기능이 필요

3. 적용사례

34

감사합니다.

㈜위세아이텍김 종 현

[email protected]