온톨로지 구축과
의미 메타데이터 관리
정보통신표준화 & 제3회 메타데이터 표준화 워크숍
메타데이터와 의미 호환(Metadata & Semantic Interoperability)
2006.5.25 (목), 성균관대학교 600주년 기념관
(주)솔트룩스
이경일
2 정보통신표준화 & 제3회 메타데이터 표준화 워크숍
목 차목 차
온톨로지 개요
온톨로지 표현 언어 소개
온톨로지 엔지니어링
온톨로지 기반 리즈닝
Value Innovation Partner 3
근본적인 질문들...
인간의 지식을 어떻게 온전하게 표현하고 공유할 것인가 ?
• 어떻게 추상적 개념, 경험, 지식을 표현/전달/축적/공유할 수 있을까 ?
• 사람이 가진 지식을 어떻게 컴퓨터에 저장하거나 이해시킬 수 있을까 ?
• 사람과 컴퓨터, 컴퓨터와 컴퓨터 간에 명확한 커뮤니케이션이 가능할까 ?
• 컴퓨터가 보다 지능적이고 상황 인지적인 서비스를 수행할 수는 없을까 ?
온톨로지 구축온톨로지 구축 의미 부착, 관리의미 부착, 관리 의미 정보 질의의미 정보 질의 추 론추 론
….….….M
ETA
Value Innovation Partner 4
• Ontology : 아리스토텔레스가 처음 사용 (BC 360)
• “Predicate”을 통한 각 개체의 관계로 존재를 연구
• 단어(word)를 사용해 어떤 도메인을 개념화하고 명시적으로 표현
– concepts
– properties and attributes of concepts
– constraints on properties and attributes
– Individuals (often, but not always)
• 온톨로지의 다른 관점의 표현
– 공통 어휘집 (a common vocabulary)
– 공유된 이해 (a shared understanding)
온톨로지란 ?
Value Innovation Partner 5
온톨로지란 ?
An ontology is a formal, explicit specification of a An ontology is a formal, explicit specification of a
shared conceptualization of a domain of interest.shared conceptualization of a domain of interest.
[Gruber + α]
형식적인 (formal)
기계가 읽을 수 있어야 한다. (XML, BNF...)
형식적인 (formal)
기계가 읽을 수 있어야 한다. (XML, BNF...)
Value Innovation Partner 6
온톨로지란 ?
An ontology is a formal, explicit specification of a An ontology is a formal, explicit specification of a
shared conceptualization of a domain of interest.shared conceptualization of a domain of interest.
[Gruber + α]
명시적인 (explicit)
개념의 종류와 그들의 관계, 개념들의 제약 조건들
이 명백하게 기술 되어있다.
명시적인 (explicit)
개념의 종류와 그들의 관계, 개념들의 제약 조건들
이 명백하게 기술 되어있다.
Value Innovation Partner 7
온톨로지란 ?
An ontology is a formal, explicit specification of a An ontology is a formal, explicit specification of a
shared conceptualization of a domain of interest.shared conceptualization of a domain of interest.
[Gruber + α]
공유된 (Shared)
사람과 사람, 사람과 기계, 기계와 기계가 합의된 표
현 체계에 따라 개념을 공유한다.
공유된 (Shared)
사람과 사람, 사람과 기계, 기계와 기계가 합의된 표
현 체계에 따라 개념을 공유한다.
Value Innovation Partner 8
온톨로지란 ?
An ontology is a formal, explicit specification of a An ontology is a formal, explicit specification of a
shared conceptualization of a domain of interest.shared conceptualization of a domain of interest.
[Gruber + α]
개념화 (Conceptualization)
표현하고자 하는 대상 세계의 개념들을 특정 모델로
추상화하는 과정을 의미한다.
Value Innovation Partner 9
온톨로지란 ?
An ontology is a formal, explicit specification of a An ontology is a formal, explicit specification of a
shared conceptualization of a domain of interest.shared conceptualization of a domain of interest.
[Gruber + α]
관심영역 (Domain)
개념을 표현, 공유하고자 하는 지정된 영역에 제한된
다. (목적성 및 도메인 의존성 존재)
관심영역 (Domain)
개념을 표현, 공유하고자 하는 지정된 영역에 제한된
다. (목적성 및 도메인 의존성 존재)
Value Innovation Partner 10
• To share common understanding of the structure of
descriptive information
– among people
– among software agents
– between people and software
• To enable reuse of domain knowledge
– to avoid “re-inventing the wheel”– to introduce standards to allow interoperability
왜 필요한가 ?
• To make domain assumptions explicit
– easier to change domain assumptions (consider a genetics KB)
– easier to understand and update legacy data
• To separate domain knowledge from the operational knowledge
– re-use domain and operational knowledge separately (e.g., configuration based on constraints)
• To manage the combinatorial explosion
Value Innovation Partner 11
온톨로지의 이해
다음은 무엇을 설명한 것일까요 ? (5고개)
1 이것은 보통 손바닥 길이 정도의 크기입니다.
?
Value Innovation Partner 12
온톨로지의 이해
다음은 무엇을 설명한 것일까요 ? (5고개)
1 이것은 보통 손바닥 길이 정도의 크기입니다.
?2 대부분 손가락 굵기의 긴 막대기 모양입니다.
?
Value Innovation Partner 13
온톨로지의 이해
다음은 무엇을 설명한 것일까요 ? (5고개)
1 이것은 보통 손바닥 길이 정도의 크기입니다.
?2 대부분 손가락 굵기의 긴 막대기 모양입니다.
?3 한쪽 끝이 뾰족합니다. ?
Value Innovation Partner 14
온톨로지의 이해
다음은 무엇을 설명한 것일까요 ? (5고개)
1 이것은 보통 손바닥 길이 정도의 크기입니다.
?2 대부분 손가락 굵기의 긴 막대기 모양입니다.
?3 한쪽 끝이 뾰족합니다. ?4 막대기 속에는 잉크가 들어 있습니다.
?
Value Innovation Partner 15
온톨로지의 이해
다음은 무엇을 설명한 것일까요 ? (5고개)
1 이것은 보통 손바닥 길이 정도의 크기입니다.
?2 대부분 손가락 굵기의 긴 막대기 모양입니다.
?3 한쪽 끝이 뾰족합니다. ?4 막대기 속에는 잉크가 들어 있습니다.
?
5 뾰족한 끝에 작은 쇠공이 달려 있습니다.
Value Innovation Partner 16
온톨로지의 이해
존재/지식/추상적 개념을 공통된 “특징”으로 설명존재/지식/추상적 개념을 공통된 “특징”으로 설명
다음은 무엇을 설명한 것일까요 ? (5고개)
1 이것은 보통 손바닥 길이 정도의 크기입니다.
?2 대부분 손가락 굵기의 긴 막대기 모양입니다.
?3 한쪽 끝이 뾰족합니다. ?4 막대기 속에는 잉크가 들어 있습니다.
?
5 뾰족한 끝에 작은 쇠공이 달려 있습니다.
볼 펜볼 펜
제조사제조사
모델명모델명
길 이길 이
굵 기굵 기
볼 크기볼 크기
잉크 타입잉크 타입
필기구필기구
연필연필 만년필만년필
흑연연필흑연연필 색연필색연필
Value Innovation Partner 17
온톨로지의 이해
임수전
26세
여자
165cm
(배우자/애인)
(소속)
(자녀)
이혜원
4세
여자
95cm
(배우자/애인)
(소속)
(자녀)
이름
나이
성별
키
(배우자/애인)
(소속)
(자녀)
사 람
•그냥 젊은 남자
이경일
28세
남자
183cm
(배우자/애인)
(소속)
(자녀)
Value Innovation Partner 18
온톨로지의 이해
임수전
26세
여자
165cm
(배우자/애인)
(소속)
(자녀)
이혜원
4세
여자
95cm
(배우자/애인)
(소속)
(자녀)
이름
나이
성별
키
(배우자/애인)
(소속)
(자녀)
사 람
㈜소트루스
벤처기업
서울시 강남구
㈜쏘이더스
연예기획사
서울시 강남구
•그냥 젊은 남자
•가정적인 사람
•능력있는 사람
•행복한 사람
이경일
28세
남자
183cm
(배우자/애인)
(소속)
(자녀)
Value Innovation Partner 19
온톨로지의 이해
임수전
26세
여자
165cm
(배우자/애인)
(소속)
(자녀)
이혜원
4세
여자
95cm
(배우자/애인)
(소속)
(자녀)
이름
나이
성별
키
(배우자/애인)
(소속)
(자녀)
사 람
㈜소트루스
벤처기업
서울시 강남구
㈜쏘이더스
연예기획사
서울시 강남구
•그냥 젊은 남자
•가정적인 사람
•능력있는 사람
•행복한 사람
한채연
27세
여자
167cm
(배우자/애인)
(소속)
(자녀)
•바람둥이
•능력있는 사람
•행복한 사람(?)
이경일
28세
남자
183cm
(배우자/애인)
(소속)
(자녀)
Value Innovation Partner 20
온톨로지의 이해
임수전
26세
여자
165cm
(배우자/애인)
(소속)
(자녀)
이혜원
4세
여자
95cm
(배우자/애인)
(소속)
(자녀)
이름
나이
성별
키
(배우자/애인)
(소속)
(자녀)
사 람
㈜소트루스
벤처기업
서울시 강남구
㈜쏘이더스
연예기획사
서울시 강남구
•그냥 젊은 남자
•가정적인 사람
•능력있는 사람
•행복한 사람
한채연
27세
여자
167cm
(배우자/애인)
(소속)
(자녀)
•바람둥이
•능력있는 사람
•행복한 사람(?)
정재훈
25세
남자
180cm
(배우자/애인)
(소속)
(자녀)
이경일
28세
남자
183cm
(배우자/애인)
(소속)
(자녀)
•도대체 알 수 없
는 사람
•양성애자(???)
Value Innovation Partner 21
온톨로지의 이해
임수전
26세
여자
165cm
(배우자/애인)
(소속)
(자녀)
이혜원
4세
여자
95cm
(배우자/애인)
(소속)
(자녀)
이름
나이
성별
키
(배우자/애인)
(소속)
(자녀)
사 람
㈜소트루스
벤처기업
서울시 강남구
㈜쏘이더스
연예기획사
서울시 강남구
•그냥 젊은 남자
•가정적인 사람
•능력있는 사람
•행복한 사람
한채연
27세
여자
167cm
(배우자/애인)
(소속)
(자녀)
•바람둥이
•능력있는 사람
•행복한 사람(?)
정재훈
25세
남자
180cm
(배우자/애인)
(소속)
(자녀)
이경일
28세
남자
183cm
(배우자/애인)
(소속)
(자녀)
•도대체 알 수 없
는 사람
•양성애자(???)
O
O
X – 1:1
X – 여:남
Value Innovation Partner 22
온톨로지의 이해
임수전
26세
여자
165cm
(배우자/애인)
(소속)
(자녀)
이혜원
4세
여자
95cm
(배우자/애인)
(소속)
(자녀)
이름
나이
성별
키
(배우자/애인)
(소속)
(자녀)
사 람
㈜소트루스
벤처기업
서울시 강남구
㈜쏘이더스
연예기획사
서울시 강남구
•그냥 젊은 남자
•가정적인 사람
•능력있는 사람
•행복한 사람
한채연
27세
여자
167cm
(배우자/애인)
(소속)
(자녀)
•바람둥이
•능력있는 사람
•행복한 사람(?)
정재훈
25세
남자
180cm
(배우자/애인)
(소속)
(자녀)
이경일
28세
남자
183cm
(배우자/애인)
(소속)
(자녀)
•도대체 알 수 없
는 사람
•양성애자(???)
O
O
X – 1:1
X – 여:남
존재/지식/추상적 개념을 “관계”와 “제약조건”으로 설명존재/지식/추상적 개념을 “관계”와 “제약조건”으로 설명
Value Innovation Partner 23
온톨로지 구성 요소
• Concepts / Class
– concepts of the domain or tasks, which are usually organized in taxonomies
– Example: Person, Car, University,…
• Relations
– a type of interaction between concepts of the domain
– Example: subclass-of, is-a, …,
• Functions
– a special case of relations in which the n-the element of the relationship is unique for the n-1 preceding elements
– Example : Father_of, Sum_of_Price,…
• Axioms
– model sentences that are always true
– Example: a+0 = a, if x > y, then x+a > y+a,…
• Instances / Individuals
– to represent specific elements
– Example : Student called Peter,…
Relation
Concept
Instance
AxiomFunction
Value Innovation Partner 24
온톨로지의 분류
Content Ont
Tell&Ask Ont
Indexing Ont
Meta Ont
Domain Ont
Task Ont
General Ont
Domain Ont
Task OntGeneral Ont
Nouns Ont
Verbs OntAdjectives Ont
Things, Event
Casuality, Behavior
Other Ont
(Mizoguchi, 1995)
Knowledge Modeling Ont
Informationt OntLexicons
Domain Ont
Application OntRepresentation OntGeneric Ont
Structure Type
Concept Issues
(Van Heijst, 1997)
Top-Level Ont
Domain Ont Task Ont
Application Ont
(Guarino, 1998)
(Lassila and McGuinness, 2001)
Value Innovation Partner 25
지식 표현 및 리즈닝 수준
Value Innovation Partner 26
유사 의미 표현 체계들
Front-End
Back-End
TopicMaps
Extended ER-Models
Thesauri
Predicate Logic
Semantic Networks
Taxonomies
Ontologies
Navigation
Queries
Sharing of Knowledge
Information Retrieval
Query Expansion
Mediation Reasoning
Consistency CheckingEAI
Context Awareness
Value Innovation Partner 27
Object
Person Topic Document
ResearcherStudent Semantics
OntologyDoctoral Student
Taxonomy := Segementation, classification and ordering of elements into a classification system according to their relationships between each other
PhD Student F-Logic
Taxonomy
Value Innovation Partner 28
Object
Person Topic Document
ResearcherStudent Semantics
PhD StudentDoctoral Student
• Terminology for specific domain• Graph with primitives, 2 fixed relationships (similar, synonym) • originate from bibliography
similarsynonym
OntologyF-Logic
Thesaurus
Value Innovation Partner 29
Object
Person Topic Document
ResearcherStudent Semantics
PhD StudentDoctoral Student
knows described_in
writes
AffiliationTel
• Topics (nodes), relationships and occurrences (to documents)• ISO-Standard• typically for navigation- and visualization
OntologyF-Logic
similarsynonym
Topic Map
Value Innovation Partner 30
OntologyF-Logic
similar
OntologyF-Logic
similarPhD StudentDoktoral Student
Object
Person Topic Document
Tel
PhD StudentPhD Student
Semantics
knows described_in
writes
Affiliation described_in is_about
knowsP writes D is_about T P T
DT T D
Rules
subTopicOf
• Representation Language: Predicate Logic• Standards: RDF(S), OWL
ResearcherStudent
instance_of
is_a
is_a
is_aAffiliation
Affiliation
York Sure
AIFB+49 721 608 6592
Ontology
Value Innovation Partner 31
온톨로지 표현 언어의 비교
Value Innovation Partner 32
F-Logic
• F-logic (frame logic)은 개체지향 개념 기반의 온전한 지식 표현
이 가능한 온톨로지 언어
• Horn logic과 개체지향 개념에 기반하여 절차가 아닌, 목표를 정의
하는 방식의 표현법 사용
• F-Logic은 object identity, complex objects, inheritance,
polymorphism, query methods, encapsulation 등을 지원
• 기존의 predicate logic이 일종의 데이터베이스 프로그래밍과 관
련 있다면, F-logic은 개체지향 프로그래밍에 기반
• F-Logic역시 시맨틱 웹 표준상의 RDF 및 OWL-DLP에 기반하고
있으며, 매우 강력하고 효과적인 규칙기반 추론을 지원함
Value Innovation Partner 33
• 추론의 효과성을 고려하여 1980년대 초에 개발된 Description Logic에 대
해 많은 선행 연구가 있었음 (Back, Classic, LOOM, …)
• 지난 10년간 많은 DL 기반 리즈닝 시스템들이 tableaux algorithm에 기반
해 최적화를 수행해 옴
- Examples : RacerPro, FaCT(FaCT++), Pellet, DLP, Cerebra
- FOL 및 modal logic의 decidable한 영역에 대해 계속 확장
• DAML과 OIL이 결합되어, 현재 W3C의 OWL(Web Ontology Language)
에 포함되어 있음
• DL의 구현 수준, 기능성이 다양할 수 있음 (DL이라고 모두 같은 것은 아님)
- ALC (Attribute Logic + Negation) : 가장 작은 규모의 DL
- SHIQO(D), SHIQ(D) , SHIQ , SHIQ-
Description Logic
Value Innovation Partner 34
Semantic Web Architecture (TBL, 2005)
Open-World Assumptions
Value Innovation Partner 35
RDF : A Simple Example
home.htmlcreator
“kim”
<?xml version="1.0"?> <rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.oclc.org/DC/">
<rdf:description rdf:about="http://www.saltlux.com/home"> <dc:creator>kim<dc:creator>
</rdf:Description> </rdf:RDF>
Value Innovation Partner 36
RDF Schema
• RDF Schema
– RDF Vocabulary Description Language.
– For defining an appropriate RDF vocabulary (classes, properties and
constraints) for each specific domain.
– Comprises very limited predefined primitives: subClassOf,
subPropertyOf, domain and range.
– Cannot assert that particular properties are equivalent, transitive,
reverse of one another, etc.
Core Class
rdfs:Resource
rdfs:Literal
rdfs:XMLLiteral
rdfs:Class
rdfs:Property
rdfs:DataType
Core Property
rdfs:type
rdfs:SubClassOf
rdfs:SubPropertyOf
rdfs:domain
rdfs:range
rdfs:Label
rdfs:Comment
Value Innovation Partner 37
Origins of OWL
DAML = DARPA Agent Markup LanguageOIL = Ontology Inference Layer
OWL is now on track tobecome a W3C Recommendation!
DAML
DAML+OIL
OIL
OWL
RDF
All were influenced by RDF
Value Innovation Partner 38
OWL Language
• OWL has three layers:
– OWL Full
– OWL DL (ie, OWL Description Language)
– OWL Lite
• OWL layers were defined to reflect compromises on
expressability vs. implementability
Value Innovation Partner 39
• 특정 분야(Domain) 안에서 사용되는 용어(terms)와 그들의 관계를 정의
– 관심 도메인 내의 개념(concepts)을 정의 : classes 정의
– 계층 구조로 개념들을 정렬 : subclass-superclass hierarchy
– 속성 및 특성(properties)을 그들의 제약조건(constraints)와 함께 정의
– 각 개념과 개념의 속성 값(indiciduals, instances)을 설정
Ontology Engineering 개요
▣ Ontology Engineering ?
• 지식 정보와 그 구조의 공통 의미 이해를 공유하기 위해 필요
– 사람과 사람의 공유를 위해
– 사람과 기계, 기계와 기계의 의미 이해를 공유하기 위해
• 관심 분야의 지식(domain knowledge)의 효과적 재활용을 위해 필요
– 지식 정보가 공유되지 않음으로 발생되는 소모적, 반복적 재투자를 방지
– 복잡하고 이질적인 정보 시스템의 효과적인 상호 운용과 표준화 가능
Value Innovation Partner 40
Methodologies
THING
person processmaterial
[…] […] […]
“TOP-DOWN” “Bottom-up” “Middle-Out”
generalize
specialize
Value Innovation Partner 41
간략 단계 :
적용 범위
결정
기존 자원
재활용 검토
용어를
열거
개념(클래스)정의
속성
정의
제약조건
정의
인스턴트
생성
실제 단계 (반복적 모델링) :
Ontology Engineering 단계
Source : Stanford University
적용 범위
결정
기존 자원
재활용 검토
용어를
열거기존 자원
재활용 검토개념(클래스)
정의
용어를
열거개념(클래스)
정의
속성
정의
개념(클래스)정의
속성
정의
제약조건
정의
인스턴트
생성
개념(클래스)정의
인스턴트
생성
기존 자원
재활용 검토속성
정의
제약조건
정의인스턴트
생성
Value Innovation Partner 42
• 단지 기술적인 요구사항 충족만으로는 온톨로지 기반 솔루션을 개발할 수 없다.
• 시맨틱 솔루션 개발의 세가지 관점
– Human issues
– Software engineering (e.g. architecture, interfaces)
– Knowledge-Meta processes
• 본격적 온톨로지 엔지니어링 전에, 명확한 응용 영역의 이해, 활용 목표를 정의 필요
OntoKnowledge(OTK) 방법론
의미기반
응용 솔루션
Value Innovation Partner 43
기타 방법론들
• Cyc methodology
Manual codification of common sense knowledge extracted by
hand, machine learning tools for new knowledge acquisition
• Uschold and King
Identify the purpose, build, evaluate, document
• Gruniger and Fox
Identify the main scenarios, identify the competency questions,
extract relevant concepts and relations, formalize in FOL
• KACTUS methodology
Ontology built on the basis of an application KB, by abstraction
• 그 외 : CO4 methodology , (KA)2 methodology, Aussenac-
Gille methodology, Maedche methodology, FCA-merge,
PROMPT, ONIONS, Ontoclean, Gomez-Perez evaluation
methodology
Value Innovation Partner 44
다양한 온톨로지 Tools
• 거의 100개에 달하는
온톨로지 구축 tool이 존재 !
• 어떤 것을 써야 하지?
• 온톨로지 표현 문서 편집
보다는 온톨로지 엔지니어링이
가능한 tool 선택이 중요 !
Value Innovation Partner 45
Ontology Engineering Tool - Protégé
Value Innovation Partner 46
Ontology Engineering Tool - OntoStudio
Value Innovation Partner 47
Ontology Engineering Tool - OntoStudio
Value Innovation Partner 48
Ontology와 Rule 기반 추론
Document
Business report Private letter
Employee
• Example domain: access rights for documents
Tony
string
Albert
hasTitleisAllowedToRead
isSupervisorOf
Report 1isAllowedToRead
„Development April 2006“hasTitle
isSupervisorOf
IF
AND
THEN
Business ReportEmployee X isAllowedToRead B
isSupervisorOfEmployee Y Employee X
Business ReportEmployee Y isAllowedToRead B
isAllowedToRead
Value Innovation Partner 49
Reasoning Engines
OntoBroker
(F-Logic)
KAON2
RacerPro
Value Innovation Partner 50
시맨틱 기술 적용 분야
RDF, OWL,F-Logic
시스템 통합및 상호운용
유비쿼터스컴퓨팅
의미기반전자 상거래
시맨틱데스크탑
시맨틱 블로그및 커뮤니티
멀티미디어정보 처리
Semantic Annotation
& Reasoning
지식 정보 검색 지식 관리 시스템
• 온톨로지 및 리즈닝 기반 지능형 검색
• Web2.0으로의 확장과 시각화
• 분산된 정보 시스템의 의미적 통합
• 이질적 시스템 간의 상호 운용성 확보
• 온톨로지 기반 시스템 통합
• 상황인지를 통한 맞춤형 서비스
• 온톨로지 및 리즈닝 기반 차세대 EC 가능
• 지능형 상품 검색, 절충/협상, 추천 기능 지원
• 의미기반 지능형 블로그
• 시맨틱 위키 및 시맨틱 소셜 네트웍
• 온톨로지 기반 지식 정보 표현, 공유
• 리즈닝을 통한 지식 발굴, 검색
• 데스크탑 검색의 온톨로지 기반 확장
• P2P 적용을 통한 지식 콘텐트 공유
• 강력한 시각화 및 관리 도구 필요
• 시맨틱 어노테이션 적용
• 이미지 및 동영상 검색, 공유
Value Innovation Partner 51
Q&A
52 정보통신표준화 & 제3회 메타데이터 표준화 워크숍
감사합니다