newsml소개및한국형newsml 제안 - kona.or.kr

64
Copyrightⓒ2004 wiseMedia Corp NewsML소개 한국형 NewsML 제안 2004. 10. 22 김명기 / [email protected]

Upload: others

Post on 04-Nov-2021

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: NewsML소개및한국형NewsML 제안 - kona.or.kr

Copyrightⓒ2004 wiseMedia Corp

NewsML소개 및 한국형 NewsML 제안

2004. 10. 22

김명기 / [email protected]

Page 2: NewsML소개및한국형NewsML 제안 - kona.or.kr

80

목차

• 연구과제 개요

– 연구목적

– 추진배경

– 기대효과

– 추진체계

• NewsML소개

– NewsML기초

– NewsML에서의 집배신

– NewsML의 소재관리

– NewsML 출력

• NewsML-KR

• NewsML Demo

• 국내외 사례

Page 3: NewsML소개및한국형NewsML 제안 - kona.or.kr

Copyrightⓒ2004 wiseMedia Corp

연구과제연구과제 개요개요

Page 4: NewsML소개및한국형NewsML 제안 - kona.or.kr

82

연구목적

1. 뉴스 교류 증가

다른 포맷

다른 통신 방식

다른 MetaData

고비용 저효율

해소방안 수립

2. NewsML 소개 NewsML을 쉽게 이해할 수 있는 공식 문서

3. 해외 사례 조사 NewsML을 채택해 성공적으로 활용하고 있는 해외 사례 조사

4. 한국형 모델 개발 NewsML을 한국에 적용할 수 있는 최적의 방안 도출

5. 업계 공유업계 관계자간 NewsML에 대한 폭넓은 이해 및 정보 공유, 의

견 교환의 장 마련

Page 5: NewsML소개및한국형NewsML 제안 - kona.or.kr

83

추진배경

카인즈 리모델링 추진

뉴스 전송 표준안 모델 개발 및 카인즈 적용으로 카인즈와 언론사간 협력 증진

콘텐트 관리 기술의 변화 뉴스 콘텐트 시장 회복

공공재 및 수익모델 적극 개발뉴스산업에서 NewsML이

핵심 이슈로 급부상유통체계 및 대안모델 개발

프로토타입 개발카인즈가 먼저 NewsML을

검증하고 성공사례 발굴카인즈의 위상 및 역할 개선

Page 6: NewsML소개및한국형NewsML 제안 - kona.or.kr

84

기대효과

• 뉴스 전송 표준화의 필요성이 오래전부터 제기되었음에도 불구하고 특정 뉴스제공사가 담당할 수 없는 특성상 본 연구과제 수

행은 공동의 공론장을 마련하는 기회

• 한국 실정에 맞는 뉴스 포맷의 표준과 분류체계의 표준안을 제시함으로써 기사 유통에 소요되는 기술개발, 운영, 유지보수 등

에 소요되는 비용과 비효율성을 제거

• 연구결과를 공개함으로써 표준안 및 관련 기술의 조기 확산 기대되는 동시에 콘텐트 생산이 본업인 언론사가 기술종속에서 벗

어나 콘텐트 자체로 경쟁할 수 있는 新환경 구축

• 최근 영향력이 급증되고 있는 인터넷(디지털) 미디어 산업의 지원을 언론재단이 고유 사업 영역으로 수용하는 한편, 정체성

재확립이 요구되는 종합뉴스데이터베이스 서비스인 카인즈가 디지털 콘텐트 유통 산업 성장의 인프라에 해당하는 기술 부문에

서 선도적 위치를 담보하는 계기로 삼을 수 있음.

• 카인즈의 사업화 및 이를 통한 언론사와의 협력 관계 증진의 초석이 됨.

Page 7: NewsML소개및한국형NewsML 제안 - kona.or.kr

85

추진체계

- 담당:김명기(대표이사)

- 역할:사업총괄, Part1

- 담당:이화용이사

- 경력:중앙일보,뉴시스CTO

- 담당:김태훈이사

- 경력:국산 검색엔진 개발

- 담당:김승환,김영인

- 역할:NewsML샘플제작

이사장

연구이사

DB팀장

실무팀

사업책임

KINDS운영위

번역부문

NewsML-KR 개발

개발팀

Page 8: NewsML소개및한국형NewsML 제안 - kona.or.kr

86

1. NewsML이란?

2. NewsML 필요성

3. NewsML 도입시 효과 (시장에 미치는 영향)

4. NewsML과 기간시스템과의 연계

5. NewsML-KR 개발

6. NewsML-KR 보급방안

7. NewsML 적용사례

1) 해외사례

2) 국내사례

Part1 NewsML 왜 중요한가?

1. 소개

2. 콘텐트 계층 : ContentItem

3. 구조화 계층 : NewsComponent

4. 콘텐트에 대한 메타데이타 : NewsComponent

5. 관리계층 : NewsItem

6. 관리계층 : 콘텐트 관리전략

7. 교환계층 : NewsML envelope

8. NewsML을 위한 통제용어

9. 구조적 확장

10. 부록

Part3 NewsML 1.2 가이드라인

보고서 주요내용

1 기능사양서 문서의 개요

2 기술상의 규약

3 Acknowledgements

4 NewsML 개요

5 NewsML 기능

6 용어집

7 단축형 NewsML DTD

8 참조

Part2 NewsML 1.2 기능명세서

1. Part4 NewsML-KR

2. NewsML과 NewsML-KR

3. NewsML KR Overview

4. 기사표준포맷 정의

5. 표준분류체계 정의

6. NewsML-KR 응용, 활용방안

Part4 NewsML-KR

Page 9: NewsML소개및한국형NewsML 제안 - kona.or.kr

Copyrightⓒ2004 wiseMedia Corp

NewsML NewsML 소개소개

1. NewsML 기초

2. NewsML에서의 집배신

3. NewsML의 소재관리

4. NewsML 출력

Page 10: NewsML소개및한국형NewsML 제안 - kona.or.kr

88

실제로 가능한

One Source

Multi Use

Page 11: NewsML소개및한국형NewsML 제안 - kona.or.kr

89

NewsML Primary Customers

• News Agencies / Syndicators

• Newspapers

• News Aggregators

• Online Portal

• Editorial System Providers

Page 12: NewsML소개및한국형NewsML 제안 - kona.or.kr

90

Background

“General Content Lifecycle For Content Providers”

[Source] InforWorld

Measure Plan

Author

Edit

PublishDistributeDeliver

Personalize

Consume

Content Provider가 상품 및 콘텐트

개발을 계획하는 단계

Author가 Content Provider를 위해

취재하는 단계

Content Provider를 위해 취재한 것을

편집하거나 조합하는 단계

Content Provider가 상품 또는 상품의

일부로서 콘텐트를 출판하는 단계

상품 또는 일부를 전자적으로 배포하거나

인쇄하는 단계

개인화 서비스 단계

이용자가 소비하는 단계

콘텐트 이용 및 효과를 측정하는 단계

Page 13: NewsML소개및한국형NewsML 제안 - kona.or.kr

91

Background

“Application’s Coverage Of the Content Lifecycle”

Digital Content

And User Profiling

Portal Strategy

For Publishers

Secure Distribution

Of Content

E-Commerce &

Print on Demand

Basic Content

Management Solutions

Custom Content

Management Solutions

(End to End)

Syndication &

Aggregation

(XML)

[Source] IBM

Page 14: NewsML소개및한국형NewsML 제안 - kona.or.kr

92

1. NewsML 기초

- NewsML이란?

• NewsML

– 1998년, 로이터 통신이 개발

– 1999년, 로이터 통신사가 IPTC에 표준화를 제안

– 2000년, IPTC가 NewsML v1.0을 승인, 발표

• NewsML이란?

– News와 XML의 합성어, ‘뉴스엠엘’로 읽고 영어로만 표기함

– XML로 된 문서로 텍스트 사진 오디오 비디오 등 미디어 독립적인 특징

– 뉴스의 라이프사이클 관리

– 방대한 분류체계(메타데이터)

• NewsML을 이용하면,

– 뉴스 처리의 표준화

송수신처리가 표준화되기 때문에 계약으로부터 전달되기까지의 기간이 단축된다.

– 콘텐트의 질 향상과 비교가 용이

구조가 통일되어 있기 때문에 콘텐트의 질 비교가 용이, 용어가 통일되어 있어서 콘텐트의 글로벌화 가능

– 집배신에 모든 정보가 집약

제작 워크플로우의 재구축

– 조판 시스템에 건네주는 데이터의 정리

Page 15: NewsML소개및한국형NewsML 제안 - kona.or.kr

93

1. NewsML 기초

- NewsML Flow

기자 편집

조판

미디어편성

신문

관리

NewsML

NewsML

웹NewsML

휴대

NewsML

집배신 출력

NewsML에 기반하고 있다는 것 외에는 기존의 시스템과 큰 차이가 없다. 그러나….

Page 16: NewsML소개및한국형NewsML 제안 - kona.or.kr

94

1. NewsML 기초

- NewsML 구조

Structure level(구조화계층)

Management level(관리계층)

Exchange level(교환계층)

Content level(내용계층)

NewsML에 기반하고 있다는 것 외에는 기존의 시스템과 큰 차이가 없다. 그러나….

News Content를 다루는 견고함과 확장성에서 볼 때 비교가 안된다.

Page 17: NewsML소개및한국형NewsML 제안 - kona.or.kr

95

1. NewsML 기초

- NewsML의 구조

TopicSet

NewsItem

전송 ID 발신인 행선지출고일시 우선도

Identification

NewsManagement

NewsComponent

스테이터스(통상, 공개금, 예정원고, 삭제)

이력 긴급 플래그

권리 데이터

관리 데이터

기술 데이터

스테이터스 변경 지시와 해금 일시

파생원 관련처

장르

저작권

용도

공통 Vocabulary

이미지

ContentItem

텍스트

NewsEnvelope

NewsML

그래픽

동영상

작성 일자

수정 일자

Page 18: NewsML소개및한국형NewsML 제안 - kona.or.kr

96

1. NewsML 기초

- NewsML Sample Code

Page 19: NewsML소개및한국형NewsML 제안 - kona.or.kr

97

• NewsEnvelope은 우편물의 ‘수신인’역할

• 송수신에 관련된 정보를 기술함

1. NewsML 기초

- 교환계층 = NewsEnvelope

• 전송ID

• 전송처, CP 또는 이를 대행하는 곳

• 송신지

• 전송일자/시간

• (옵션) [예시] TextWire, PhotoWire, …

• (옵션) [예시] AisaTextWire, PrimeForCompany

• 우선도 (Queue에 쌓인 순서를 무시하고 전송할 수 있게 함)

Page 20: NewsML소개및한국형NewsML 제안 - kona.or.kr

98

1. NewsML 기초

- 관리계층=NewsItem

• NewsItem은 발행가능한 뉴스 단위

• 전달사 ID

• 날짜

• NewsItem 식별

• 변경버전(‘판’)

• URN

NewsItem 식별

식별자

Worldwide Unique

URN

urn:newsml:[ProviderId]:[DateId]:[NewsItemId]:[RevisionId]

urn:newsml:iptc.org:20011115:abcdefg:1

발행가능한 뉴스단위

Page 21: NewsML소개및한국형NewsML 제안 - kona.or.kr

99

NewsItem관리정보

• 뉴스나 데이터를 인식하기 위한 타입

• 작성일자

• 수정일자

• [예시] Usable, Withheld, Embargoed, Canceled

• 뉴스 출시 조정용

• 긴급도

• 변경이력

• 파생원(기사)

• 뒤에 추가

• 대체

• 관련처(기사)

• 앞에 추가

• 삭제

Page 22: NewsML소개및한국형NewsML 제안 - kona.or.kr

100

1. NewsML 기초

- 구조화계층 = NewsComponent

• 기사나 사진, 그래픽 등 단일 혹은 복수의 오브젝트 요소

뉴스 소재에 관한 정보

저작권/배송처 정보

• 제공자(언론사)

• 작성자(기자), 주된 책임이 있는

• 파일이름

• 시스템 식별자

• 출처

• 공헌자, 가장 기여를 한

• 소유권을 소유한 사람에 대한 정보

• 소유권 날짜

• 권한이 어떻게 이용되는지에 대한 정보

• 사용권한이 적용되는 지역

• 누가 이용권한이 있는지에 대한 정보

• 사용 제한에 대한 정보

• 사용권한의 시작

• 사용권한의 종료

저작권

사용권한

뉴스를 담는 그릇

Page 23: NewsML소개및한국형NewsML 제안 - kona.or.kr

101

기사설명을 위한 Metadata

• 주제코드

• 언어

• 장르

• 대상독자

• 기사발생일자

• 기사발생장소

• 뉴스의 주제에 관한 설명

Page 24: NewsML소개및한국형NewsML 제안 - kona.or.kr

102

사람이 이해할 수 있는

뉴스 정보 특성

• 제목

• 부제목

• 작성자 정보(이름,이메일,직함 등)

• 주제코드

• 자료의 출처

• 저작권 정보(소유권한)

• 이용 권리에 관한 정보 표시(이용권한)

• 연제기사에 관한 정보

• 필요한때만 정의

• 주제어

• NewsML 명세에는 정의되어 있지 않은 뉴스라인

예를들어, 캡션, [편주] 등유저확장용

Page 25: NewsML소개및한국형NewsML 제안 - kona.or.kr

103

1. NewsML 기초

- 내용계층 = ContentItem

• ContentItem은 텍스트, 사진, 동영상 등 실제 기사 데이터를 포함

데이터 영역

• 미디어 타입 (텍스트,그래픽,사진,오디오,비디오,복합 등)

• 서식 (HTML, XML, JPEG 등)

• 마임타입

• 주석

• 사이즈

• 할당

• 중요도

• 신뢰도

• 표현방법

• 일자/시간

• 엔코딩 정의 (텍스트 또는 바이너리 데이터를 XML문서 내에 또는 외부에 두기 위해 정의)

• 기사 내용 (텍스트 또는 이미지나 동영상같은 바이너리 파일도 가능)

Page 26: NewsML소개및한국형NewsML 제안 - kona.or.kr

104

1. NewsML 기초

- NewsML Layout

NewsItemNewsManagement

NewsML

NewsEnvelope

Page 27: NewsML소개및한국형NewsML 제안 - kona.or.kr

105

1. NewsML 기초

- TopicSet

• NewsML은 뉴스 데이터 구조(포맷)의 표준뿐만 아니라 여기에 사용되는 각종 용어의 통일도 필수

◇ 신뢰도 ◇ 긴급도 ◇ 전달 우선 순위

◇ 중요성 ◇ 메타데이터의 중요성 ◇ 독자와의 관련성

◇ 공개 지시 ◇ 주제 코드 ◇ 포맷

◇ 주석 ◇ 뉴스 라인 타입 ◇ 마임(MIME) 타입

◇ 미디어 타입 ◇ 토픽 타입 ◇ 메타데이터

◇ 뉴스 아이템 타입 ◇ 롤(ROLE) ◇ Property

◇ 전달 방법 ◇ 독자층 ◇ 장르

◇ NewsItem의 라벨 ◇ Product ◇ 언어

◇ 국가명 ◇ 통화(단위) ◇ 단체명

◇ 지(역)명 ◇ (미)산업분류코드 ◇ 나스닥 회사 코드

Int’l Standard = 데이터 구조의 표준 + 용어의 표준

NewsML DTD ‘통제용어’로 등록

유형별로 분류해 TopicSet이라는 XML문서로 제공

TopicSet

Page 28: NewsML소개및한국형NewsML 제안 - kona.or.kr

106

1. NewsML 기초

TopicSet-Topic

통제용어의 유형별 분류 통해 TopicSet으로 등록

각각 TopicSet에는 세부 Topic이 존재

TopicSet-Topic이 있음으로 해서

- 시스템에 의해 자동처리가 가능

- 글로벌 교환이 용이

TopicSet-Topic에 등록된 각종 용어는 통제용어로서

NewsML 문서 내에서는 단일 의미로만 사용

Page 29: NewsML소개및한국형NewsML 제안 - kona.or.kr

107

NewsML

NewsEnvelope

Identification

NewsManagement

NewsComponent

DescriptiveMetadataSubject formalName=04000000

A신문사

1. NewsML 기초

TopicSet과 NewsML의 관계

TopicType

TopicType

TopicType SubjectCode

FormalName

SubjectCode

Subject

TopicType FormalName

04000000

Subject02000000

표준화

NewsML

NewsEnvelope

Identification

NewsManagement

NewsComponent

DescriptiveMetadataSubject formalName=02000000

B 신문사

Page 30: NewsML소개및한국형NewsML 제안 - kona.or.kr

108

1. NewsML 기초

TopicSet-Topic이 실제로 어떻게 이용되는가?

NewsML

NewsEnvelope

Identification

NewsManagement

NewsComponent

DescriptiveMetadataSubject formalName=경제

A사 타입 기사

NewsML

NewsEnvelope

Identification

NewsManagement

NewsComponent

DescriptiveMetadataSubject formalName=경제

C사 타입 기사

NewsML

NewsEnvelope

Identification

NewsManagement

NewsComponent

DescriptiveMetadataSubject formalName=경제

B사 타입 기사

NewsML

NewsEnvelope

Identification

NewsManagement

NewsComponent

DescriptiveMetadataSubject formalName=경제

D사 타입 기사

TopicSet(글로벌+로컬)

공통 Vocabulary 군예:주제명, 지역명, etc

A통신사

C신문사

B 해외통신사

D 인터넷미디어

Vocabulary를 통한

용어의 표준화

구조의 표준화

Page 31: NewsML소개및한국형NewsML 제안 - kona.or.kr

109

2. NewsML에서의 집배신

- 기존의 집배신

• 텍스트 기사와 사진이 별도 시스템에 의해 관리

• 수정하거나 기사와 사진을 연결하는 것은 사람에 의해 작업

: 기사와 사진의 공통 포맷이 존재하지 않았기 때문, 자동 수정기능이 없기 때문

A 통신사 B 신문사 C 포탈

기사

사진

기사

사진

기사

사진

관련

짓기

관련

짓기

관련

짓기

수작업으로

수작업으로

기사시스템으로 전송

화상시스템으로 전송

전화,팩스로 연락

수작업으로

기사시스템으로 전송

화상시스템으로 전송

전화,팩스로 연락

Page 32: NewsML소개및한국형NewsML 제안 - kona.or.kr

110

2. NewsML에서의 집배신

- 멀티미디어

NewsML

MetaData

사진

기사동영상

음성

그래픽

Page 33: NewsML소개및한국형NewsML 제안 - kona.or.kr

111

2. NewsML에서의 집배신

- 메타데이타를 통한 뛰어난 자동처리

• 어디서 보내졌는가?

• 어떤 것이 보내졌는가?

• 곧바로 공개가능한가? 해지정보는?

• 이용상의 권리와 제한은?

• 어떤 내용인가?

• 어떻게 수정이 이루어졌는가?

Page 34: NewsML소개및한국형NewsML 제안 - kona.or.kr

112

2. NewsML에서의 집배신

□ 어디서 보내졌는가? □ 어떤 것이 보내졌는가?

• SentFrom

• ProviderID

• Creator

• NewsService

– 뉴스제공사의 독자적인 전송 정보

– 스포츠, 주식정보, TV프로그램 등

• NewsProduct

– 어떤 NewsML 규격을 이용하고

있는지 표기

• MediaType

– 텍스트, 사진, 그래픽 등의 구별

• Format

– 콘텐트 식별

• MimeType

Page 35: NewsML소개및한국형NewsML 제안 - kona.or.kr

113

2. NewsML에서의 집배신

□ 곧바로 공개가능한가? 해지는? □ 이용상의 권리, 제한은?

• Status

– Usable(공개가능)

– Embargoed(공개대기)

– Canceled(공개취소)

– Withheld(공개미정)

• RightsMetadata

• CopyrightHolder

– 저작권 보관 유지자의 정보

• UsageRights

– 이용상의 제한사항

Page 36: NewsML소개및한국형NewsML 제안 - kona.or.kr

114

2. NewsML에서의 집배신

□ 어떤 내용인가?

• SubjectCode (뉴스 내용의 주제분류)

– Subject 대분류 11000000 정치

– SubjectMatter 중분류 11006000 정부

– SubjectDetail 소분류 11005001 공무원

– SubjectQualifier 스포츠분류

• 지역정보

– Area, Location

• People

• Company

• Organization

Page 37: NewsML소개및한국형NewsML 제안 - kona.or.kr

115

2. NewsML에서의 집배신

□ 어떻게 수정이 바로잡아 졌는가?

• 판의 갱신

– RevisionId의 값을 +1로 변경해 재전송

– RevisionId의 값에 의해 최신판 뉴스를 식별할 수 있음

• 관리정보의 갱신

– 관리정보(NewsManagement)만의 갱신

• Status

• 기사나 사진 등 링크정보의 추가

제3판 기사 갱신

– urn:NewsML:wisemedia.co.kr:20041022:topicset.iptc-seujectcode-kr:3

제4판 기사 갱신

– urn:NewsML:wisemedia.co.kr:20041022:topicset.iptc-seujectcode-kr:4

Page 38: NewsML소개및한국형NewsML 제안 - kona.or.kr

116

판의 갱신 흐름

2. NewsML에서의 집배신

- Link

• 링크하고자 하는 뉴스아이템의 URN, URL를 지정

– Associatedwith(관련처 링크)

– DerivedFrom(파생처 링크)

기사

제1판

기사

제2판

기사

제3판

화상

LinkLink

Link

Page 39: NewsML소개및한국형NewsML 제안 - kona.or.kr

117

2. NewsML에서의 집배신

- 관리정보의 갱신

• NewsManagement만 갱신

– 콘텐트를 포함하지 않는 관리정보만 갱신

• Status의 변경

– Embargoed(공개대기) -> Usable(공개가능)

– Usable(공개가능) -> Canceled(공개취소)

• 기사 전송후 링크정보만 추가해 전송하는 것도 가능

1)텍스트기사 전송(사진정보 없음)

2)뒤에 사진 별도 전송

3)텍스트기사에 사진 링크 정보만 추가

Page 40: NewsML소개및한국형NewsML 제안 - kona.or.kr

118

2. NewsML에서의 집배신

- 관리정보의 갱신(링크정보의 추가)

기사

화상

뉴스발생

1 기사전송

3 기사에 사진링크값 추가하여 전송

2 사진전송

상호 링크 완성

Page 41: NewsML소개및한국형NewsML 제안 - kona.or.kr

119

3. NewsML의 소재관리

- NewsML을 통해 소재관리 일원화가 가능

편집구성

NewsML소재 관리

사진

기사

일러스트

동영상

음성

신문 편집

Web 뉴스

Mobile

Mail 서비스

데이터 방송

디지털 방송

방송국

라디오국

데이타베이스

소재의 Multi Use에 효과적

Page 42: NewsML소개및한국형NewsML 제안 - kona.or.kr

120

3. NewsML의 소재관리

- NewsML에서의 소재관리, 4계층의 관리구조

NewsMLNewsML

NewsItemNewsItem

NewsEnvelopeNewsEnvelope

NewsComponentNewsComponent

ContentItemContentItem

NewsMLNewsML

NewsItemNewsItem

NewsEnvelopeNewsEnvelope

NewsComponentNewsComponent

ContentItemContentItem

(Text)(Text)

NewsComponentNewsComponent

ContentItemContentItem

(Photo)(Photo)

AssociatedWithAssociatedWith

종래에는 단일 소재 단위로 관리 다수의 뉴스와 소재를 복합적으로 관리는 동시에 외

다른 뉴스 정보를 함께 표현

Page 43: NewsML소개및한국형NewsML 제안 - kona.or.kr

121

3. NewsML의 소재관리

- NewsML로 표준화된 관리정보

• 판의 관리 RevisionId

• 상태관리 Status

• 출고전달의 관리 NewsEnvelope

• 소재의 분류 SubjectCode, MediaType

• 소재의 권리정보 RightsMetadata

• 소재간의 관련정보 AssociatedWith

Page 44: NewsML소개및한국형NewsML 제안 - kona.or.kr

122

3. NewsML의 소재관리

- NewsML과 소재관리의 Workflow

집배신 수정·편집 출고

검색

Page 45: NewsML소개및한국형NewsML 제안 - kona.or.kr

123

3. NewsML의 소재관리

- 집배신

• XML의 특성을 살려, 필요한 정보만 필요한 형태로 변환해 이용하는 것이 용이

• DataContent에는 텍스트, 사진, 일러스트, 오디오, 비디오 등으 표현할 수 있어 소재 종류에 의존하지 않

는 소재 관리시스템 구축이 용이

NewsML

A신문사용

NewsML

B신문사용

B신문사

데이터베이스XSLT

NewsML

NewsML

NewsML

기사

사진

그래픽

소재관리 신문편집

웹편집

Page 46: NewsML소개및한국형NewsML 제안 - kona.or.kr

124

3. NewsML의 소재관리

- 수정, 편성

• 소재정보의 갱신, 판의 관리를 NewsML을 이용

• 지금까지 구현할 수 없었던 복수 종류의 소재를 관련지어 그룹화할 수 있는 기능도 NewsML에서는 가능

• 수정, 편성된 소재정보를 NewsML의해 다른 시스템에 손쉬게 넘겨줄 수 있음

관련

1판

2판

소재관리

그룹화 소재관리로 수정,편성된 각종 정보를

저장해 NewsML출력

(그룹정보, 관련정보 포함)

Page 47: NewsML소개및한국형NewsML 제안 - kona.or.kr

125

3. NewsML의 소재관리

- 검색 & 출고

검색• 일반적으로 데이타베이스에 저장된 소재를 검색하

거나 기사 본문을 검색하는 것이 주류

• NewsML에 의하면, 다양한 메타데이터 검색가능

• 특히 SubjectCode등과 같은 토픽셋은 각국 언

어로 현지화되는데 코드를 통해 관리 및 검색할 수

있기 때문에 언어에 의존하지 않고 검색할 수 있음.

예를들어, 영국의 A통신사가 전송한 NewsML

문서에 ‘SubjectCode=11002001,Summit’라는 정보가 포함되어 있을 경우

이를 전송받은 국내 B신문사는 Summit를 번역

하지 않고도 코드를 통해 이것이 ‘정상회담’에 관련

된 기사인 것으로 인식하고 검색할 수 있음.

출고• NewsML 문서내에 출고에 필요한 정보로 전송처,

출고원, 출고시 필요한 주석 등의 각종 정보를 부

가해 출력

• NewsML의 ‘권리정보’에 의한 출고 판단을 자동

처리

누구에게 보내는 것인지?

신문에만 사용하도록 허가

Page 48: NewsML소개및한국형NewsML 제안 - kona.or.kr

126

3. NewsML의 소재관리

- NewsML 소재관리 구축방법

• Windows/Unix 파일시스템의 폴더/파일명 구조에 NewsML 파일 저장

• NewsML 기본 기능을 간단하게 이용가능

• 고속 액세스가 가능해 웹 서비스에 적합

• 시스템 구축시 공정수 늘어남

파일시스템

• NewsML문서를 오브젝트로 DB에 등록

• 잘 활용하면 다른 방식의 장점을 살리는 효과적인 방안이 될 수있으나

대응환경, 적용사례가 거의 없고 성능, 안정성이 입증되지 않았음

• 향후 발전가능성은 염두에 둘 수 있음.

XML대응 ObjectDB

• NewsML파일은 파일시스템에, 관리에 필요한 데이터는 RDB에 보관

• 데이터 액세스와 검색/리스트 작성의 성능을 모두 충족

• 파일시스템과 RDB간 동기화가 관건

• NewsML파일 전체를 RDB에 하나의 항목으로 저장할 수 있는 RDB 있음.

파일시스템+RDB

• NewsML의 요소나 속성 항목을 테이블에 저장

• RDB에 XML레코드를 저장하는 기능 있으나 모두 저장 불필요, 워크플로우나 관리에 필요한 중요 항목만

• 방대한 양의 데이터도 고색 액세스 가능

• 검색이나 항목 단위의 갱신에 효율적

• 확장성이 부족해 NewsML 활용성이 낮아짐

RDB

특징관리방법

Page 49: NewsML소개및한국형NewsML 제안 - kona.or.kr

127

3. NewsML의 소재관리

- NewsML 기반의 시스템 구축시

• 시스템간 인터페이스 표준화에 의해 시스템 개발 기간이 대폭 단축

• 데이터 형식의 표준화로 경쟁이 촉발되어 코스트 감소

• 멀티벤더에 의한 시스템 구축이 용이

Page 50: NewsML소개및한국형NewsML 제안 - kona.or.kr

128

4. NewsML 출력

- One Source Multi Use

소재관리 = One Source

조판/미디어/출력… = Multi Use

소재 관리

시스템

지면 편집

미디어 편집

소재 관리시스템

WEB

휴대단말

신문

Page 51: NewsML소개및한국형NewsML 제안 - kona.or.kr

129

4. NewsML 출력

- Raw Data vs. NewsML

eMail

Pager

PC-PDF Viewer

Personal Printer

Print On Demand

Syndicated Products

Newspaper

Web

E-Ink or E-Paper(eBook)

Speech-Audio

Phone(WAP,iMode,…)

Interactive TV

PDA-Palm-Pilot

기사DBMetaData

RawData &

Private Format

제한된

패키징

기사DB MetaData

Any Product

Open Format

무제한의

패키징

Device or Application

복잡한 전송

자동화된

전송

One Source Multi Use One Source

분류

저작권

이력정보

관련정보

뉴스

자동처리

Page 52: NewsML소개및한국형NewsML 제안 - kona.or.kr

130

결론

• NewsML을 채택하면 관리 및 송수신 등 뉴스 처리의 표준화 가능

• 거래처와의 계약에서 전송시까지의 기간을 대폭 단축

• 콘텐트 구조의 통일로 콘텐트 질 향상, 콘텐트간 품질 비교에 용이

• Open포맷, 용어의 통일로 글로벌화 가능

• 각종 어플리케이션간 인터페이스 표준화로 개발기간 단축, 벤더 경쟁 유도

• 뉴스 제공측과 수신측 모두 단일 포맷으로 인해 처리 비용 대폭 감소

• 다양한 소재관리 통해 뉴스 상품 다양화 및 시장 참여 기회 확대

• 도용 및 저작권 침해에 대해서도 낮은 기본 기술적 대응 및 캠페인 효과

Page 53: NewsML소개및한국형NewsML 제안 - kona.or.kr

Copyrightⓒ2004 wiseMedia Corp

NewsMLNewsML--KRKR

Page 54: NewsML소개및한국형NewsML 제안 - kona.or.kr

132

NewsML-KR

용어

Data 구조

분류체계(TopicSet)

Data 구조

용어

신규정의

한글번역추가

일치

일치

일치

Party, Local, Company, People 등 각 나라마다

또는 뉴스 제공사가 독자적으로 정의해 사용하도록 한

TopicSet에 한하여 신규정의

단, SubjectCode에 한해 국내에 필요한 일부 주제코

드 (예를들어, 북한, 청와대 등)를 확장 등록하였음

NewsML NewsML-KR

Page 55: NewsML소개및한국형NewsML 제안 - kona.or.kr

133

NewsML-KR Source

• http://newsml.or.kr에서 소스 및 관련자료 공개

• DTD : newsml.or.kr/dtd/newsml1.2.dtd

• Catalog : newsml.or.kr/catalog/catalog.ksMasterCatalog.xml

• TopicSet : newsml.or.kr/TopicSets

• TopicSet Naming

– IPTC와 일치 : TopicSet.iptc.(TopicSetName).xml

TopicSet.iptc.Format.xml

– IPTC확장 : TopicSet.iptc.(TopicSetName)-kr.xml

TopicSet.iptc.SubjectCode-kr.xml

– 신규정의 : TopicSet.iptc.ks(TopicSetName).xml

TopicSet.iptc.ksParty.xml

Page 56: NewsML소개및한국형NewsML 제안 - kona.or.kr

134

Demo

• SubjectCode Map

• NewsML Sample

• NewsML.or.kr

Page 57: NewsML소개및한국형NewsML 제안 - kona.or.kr

Copyrightⓒ2004 wiseMedia Corp

해외사례해외사례

Page 58: NewsML소개및한국형NewsML 제안 - kona.or.kr

136

Global Trend

내부적으로 NewsML And NITF 둘다 이용

도입 확정

콘텐트 관리 및 출판 용도로 도입 확정

(일부 커스트마이징해서) 사용중

NITF로 교체 완료

NITF로 교체중

PRISM의 핵심멤버

Page 59: NewsML소개및한국형NewsML 제안 - kona.or.kr

137

일본에서의 NewsML

broadcast station

ContentsManagement

System

ContentsManagement

System

News Agency

MediaSystemMedia

System

Cell phone

Web

ContentsManagement

System

ContentsManagement

System

Newspapers

MediaSystemMedia

System

CTS

DBDB

OUTPUT

OUTPUT

(PHOTO)

Newspapers

broadcast station

Page 60: NewsML소개및한국형NewsML 제안 - kona.or.kr

138

Japanese Newspaper companies and News Agencies

•• National PapersNational PapersThe YomiuriThe AsahiThe Mainichi : CMS, Media SystemThe NikkeiThe Sankei

•• Regional PapersRegional PapersThe Hokkaido The Chunichi (Group)The Nishinihon

•• Local(Prefecture) PapersLocal(Prefecture) PapersThe ChugokuThe ShizuokaThe KobeThe KahokuThe KyotoThe Niigata

:Over 40 Papers

•• OtherOtherSport NewsIndustry Newsetc

• News ProvidersKyodo NewsJiji Press

• Radio TV ListingsTokyo News

ABC-Japan Based Oct-2001

Total Daily Circulations53,708,831 copies

The Hokkaido

The Chunichi(Group)The

Nishinihon

Tokyo

Osaka

Page 61: NewsML소개및한국형NewsML 제안 - kona.or.kr

139

History

• 2000년 (사)일본신문협회 소속 기술위원회 내에 NewsML팀 구성

– 협회에 가입한 22개 회원사 소속 위원

– 외국 통신사, 메이커, 벤더, 프로바이더 등 22개사 기술자

– 기사 및 사진에 대한 표준 제정을 위해 NewsML 검토

• 텍스트/미디어 분과

• 화상분과

• 각 신문사 기사를 기초로 NewsML의 각 요소와 매핑

– 각 신문사별 기사 및 화상에 필요한 요소 항목 조사

– 샘플 작성

– IIM(Information Interchange Model)

– 기존 포맷인 nskNITF와 매핑

• NewsML 기능 사양서 일본어로 번역

– 대부분 NewsML에 대해 생소했고 기술적 이해가 부족했으나 번역 이후 빠르게 이해

– 최초의 발안자인 로이터 통신에 NewsML 연수 실시

• NewsML 가이드라인(해설서) 작성

• 2001년 교토 통신사가 차기 전달 포맷으로 NewsML을 처음 채택

• 2001년 nskNewsML level 1 발표

• 2001년 마이니치신문사가 nskNewsML level 1에 기초한 NewsML 소스 공개

Iptc.NewsML

nskNewsML

Level 1

Page 62: NewsML소개및한국형NewsML 제안 - kona.or.kr

140

NewsML팀(신데이터 포맷 책정팀) members

• 2000년 제1기 출범해 현재 3기 활동중

• Members

– 아시히신문

– 매일신문

– 요미우리신문

– 일본경제신문

– 도쿄신문

– 산케이신문

– 닛칸스포츠신문

– 교토통신

– 시사통신

– 일본방송협회

– 홋카이도신문

– 카호쿠신문

– 야마가타신문

– 후쿠시마신문

– 시즈오카신문

– 시나모 마이니찌 신문

– 주우니지신문

– 후코쿠신문

– 코치신문

– 서일본신문

– 쿠마모토일일신문

– 미나미니혼신문

– AFP

– 로이터 재펀

– Adobe

– NTT 데이터

– 캐논

– 소니

– 도시바

– 니콘

– 일본IBM

– 일본Oracle

– 일본시스템기술

– Nec솔루션즈

– NEC엔지니어링

– 후지사진

– 후지쯔

– 야후

– 그외

Page 63: NewsML소개및한국형NewsML 제안 - kona.or.kr

141

Santo Project in Kinki District, Shared Platform!

Photo!!!

Page 64: NewsML소개및한국형NewsML 제안 - kona.or.kr

142

Nikkei

Distribution by NewsML

Newspaper Systems

Reception by NewsML

NEWSSystem

WebMobile

TV

Shinkansen