webul semantic - cursuri automatica si...
Post on 09-Jan-2020
31 Views
Preview:
TRANSCRIPT
Webul Semantic
Ștefan Trăuşan-Matu
Webul semantic
Următoarea generație a WWW (Tim Berners-Lee)Utilizat nu numai pentru a fi parcurs de utilizatorii umani prin “browsere” ci și de
10/28/2008 2
utilizatorii umani prin “browsere” ci și de programe care:� accesează selectiv (caută și filtrează) paginile
(resursele) web,� efectuează anumite prelucrări ale acestora,� eventual generează alte resurse web.
Webul semantic necesită:
adnotarea şi metadescrierea resurselor web folosind limbaje bazate pe XML;reprezentarea și prelucrarea cunoştinţelor (de exemplu, prin logici
10/28/2008 3
cunoştinţelor (de exemplu, prin logici terminologice sau decripţionale) -ONTOLOGII;prelucrări ale conținutului documentelor web – Prelucrarea Limbajului Natural
Ontologiile
Constituie repertorii de termeni, vocabulare pentru metadescrieriSunt baze de cunoștințe declarative
10/28/2008 4
Sunt baze de cunoștințe declarative
Ontologiile
în filosofie denotă teoria asupra existenței, mai corect spus, asupra ceea ce considerăcă există cel care întocmește teoria;construirea oricărui sistem filosofic pleacă de
10/28/2008 5
construirea oricărui sistem filosofic pleacă de la o ontologie - definirea categoriile fundamentale de entități din realitate și a relaţiilor dintre ele;nu este întotdeauna explicită, orice demers însă necesitând-o.
Ontologiile
"An ontology is a specification of a conceptualization....That is, an ontology is a description (like a formal specification of a
10/28/2008 6
description (like a formal specification of a program) of the concepts and relationships that can exist for an agent or a community of agents" (Gruber)
Ontologiile conţin :
categoriile, conceptele fundamentale,proprietăţile conceptelor,relaţiile şi distincţiile între concepte,
10/28/2008 7
relaţiile şi distincţiile între concepte,axiome.
Ontologii
Lexicalizate (WordNet, EuroWordNet, BalkanNet, FrameNet, MikroKosmos).Pentru reprezentarea cunoştinţelor.
10/28/2008 8
Pentru reprezentarea cunoştinţelor.Implicite în, de exemplu, biblioteci de clase în OOP
Metode pentru dezvoltareaontologiilor
Ad-hoc
Analiza formală a conceptelor
Psiholingvistică (WordNet)
De la un tezaur, bază de date, o taxonomie
10/28/2008 9
De la un tezaur, bază de date, o taxonomie
Alinierera ontologiilor
Extragere de cunoștințe din texte (text mining)
Plecând de la categorii filosofice (e.g. Sowa)
nealcoolică efervescentă alcoolică vin
apă_minerală
Latice construită prin metoda analizei formale a conceptelor(Sowa, 2001)
10/28/2008 10
apă_mineralăfierbinte cu_cofeină bere ceai şampanie
cafea cola
Categorii geografice - Chat-80(Sowa, 2001)
D etalii geografice
Suprafaţă Punct L in ie
10/28/2008 11
B loc D ig Pe păm ânt Pe apă
Teren O raş
Ţară Pod D rum Râu
Lac Aeroport F ron tieră
M unte H eliport Cale ferată
Bara j L in ie îna ltă tensiune
Categorii fundamentale în Cyc(Sowa, 2001)
C eva
O b iec tIn d iv idu a l In tan g ib il C evaR ep rezen ta t
C o lecţ ie
L u cru O b iectIn tan g ib il
10/28/2008 12
E ven im en t L u c ru In tan g ib il R e laţ ie
P roces V a loareA tr ibu t S lo t (desch idere ) V a lA trA bso lu tă V a lA trR ela tivă V a lA trC a lita tivăC eva O cu ren t C evaE x is ten t V a lA trN ef iz ică A tr ibu t V a lA trF iz icP ercep tib ilă
P rocesD in a m ic
C o m pu sT an g ib il& O b iec tIn tan g ib il In te lig enţă O b iec tT an g ib il
L u cru T a n g ib il
Arborele lui Porfir (traducere după Petrus Hispanus)
Suprem e genus: SU BSTANŢĂ(gen suprem )D ifferen tiae: m aterială im aterială(diferenţă)Suprem e genera: CO RP SPIRIT
D ifferen tiae: însufleţit neînsufleţit
Suprem e genera: V IU M IN ERAL
10/28/2008 13
Suprem e genera: V IU M IN ERAL
D ifferen tiae: cu sensibilitate fără sensibilitate
Suprem e genera: AN IM AL PLAN TĂ
D ifferentiae: raţional iraţional
Specii: O M SĂLBATIC
Indivizi: Socrate P laton A ristotel etc.
Arborele lui Brentano pentru categoriile lui Aristotel
F iinţare
Substanţă Accident
Proprietate Relaţie
10/28/2008 14
Proprietate Relaţie
Inerenţă D irecţionare Conţinere
M işcare Intermediere
Calitate Cantitate Acţiune Pasivitate Posesie Poziţie Loc Timp
Categoriile lui Kant
Cantitate Calitate Relaţie ModalitateUnitate Existenţă Substanţă Posibilitate
10/28/2008 15
Unitate Existenţă Substanţă PosibilitatePluralitate Inexistenţă Cauzalitate RealitateTotalitate Limitaţie Comunitate Necesitate
Ontologia lui John Sowa(Sowa, 2001)
T
Autonom ie Relaţie M ijlocire
F izic Abstract
10/28/2008 16
Realitate Formă Însuş ire Afirm aţie Conexiune Intenţie Perm anenţă Apariţie
Obiect Proces Schem a Scenariu Joncţiune Participare Descriere Istoric Structura Am plasare RaţiuneScop
⊥
T
Fizic Autonomie
Realitate
Rol
EntitateÎnsuşită
Componentă
Parte
Participant
Determinant Imanent
10/28/2008 17
Sursă Produs
Ini ţiator Resursă Scop Esenţă
Agent Temă
Receptor Executant Mutat Spus
Privitor Ascultător Vorbitor Şofer Experienţiator
ŞoferAutobuz ŞoferCamion ŞoferTaxi
PROGRAMMING_CONCEPTPROGRAMMING_ABSTRACTION
DATA_ABSTRACTIONMAPPING
ARRAYCONTAINER
TABLEHASHTABLEINDEXTABLE
ARRAYSYMBOLTABLE
COLLECTIONIMPLICITCOLEXPLICITCOL
10/28/2008 18
EXPLICITCOLSET
SYMBOLTABLEBAG
DISPENSERSTACKQUEUEHEAP
CURSORSTR
CONTROL_ABSTRACTIONEXCEPTIONIF_THEN
Webul semantic
REGULI
10/28/2008 19
REGULI
OWL
RDFS
RDF
XML
RDF – Resource Description Framework
Triplete
� Resurse
� Nume proprietăți
10/28/2008 20
� Nume proprietăți
� Valori proprietăți
URI
Literali
RDF<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns="http://purl.org/rss/1.0/">
10/28/2008 21
<rdf:Description rdf:about="http://esp.ro/republica">
<title>Republica</title>
<dc:subject>Filosofie</dc:subject>
<dc:creator>Platon</dc:creator>
<dc:publisher>Ed. St. siEnciclopedica</dc:publisher>
<dc:date>1986</dc:date>
<dc:language>ro</dc:language>
...
</rdf:Description>
</rdf:RDF>
Individuali
<Person rdf:ID="John"/><Person rdf:ID="Mary"/><rdf:Description rdf:about="#John"><hasParent:resource="#Mary"/><age>25</ age>
10/28/2008 22
</rdf:Description><rdf:Description rdf:about="#John"><differentIndividualFrom:resource="#Mary"/>
</rdf:Description><rdf:Description rdf:about="#Clinton"><sameIndividualAs:resource="#BillClinton"/>
</rdf:Description>
RDFS- clase (tipuri) pentru RDF
<rdfs:Class rdf:ID=“Book"/>
<rdfs:Class rdf:ID=“Man"/>
<rdfs:Class rdf:ID=“Philosopher">
10/28/2008 23
<rdfs:subClassOfrdf:resource="#Man"/>
...
</rdfs:Class>
OWL –Ontology Web Language
<owl:Class rdf:ID=“Man">
<rdfs:subClassOfrdf:resource="#Person"/>
10/28/2008 24
<owl:disjointWithrdf:resource="#Woman"/>
</owl:Class>
OWL (cont.)
<owl:Class rdf:ID=“EyesColor">
<rdfs:subClassOfrdf:resource="#ManDescr"/>
<owl:oneOf rdf:parseType="Collection">
10/28/2008 25
<owl:oneOf rdf:parseType="Collection">
<owl:Thing rdf:about="#Blue"/>
<owl:Thing rdf:about="#Green"/>
<owl:Thing rdf:about="#Brown"/>
<owl:Thing rdf:about="#Black"/>
</owl:oneOf>
</owl:Class>
OWL constraint
<owl:ObjectProperty rdf:ID="author">
<rdfs:domain rdf:resource="#Book" />
<rdfs:range rdf:resource="#Person" />
</owl:ObjectProperty>
10/28/2008 26
</owl:ObjectProperty>
OWL constraint
<owl:Restriction>
<owl:onPropertyrdf:resource="#author"/>
<owl:minCardinality
10/28/2008 27
<owl:minCardinality
rdf:datatype="&xsd;nonNegativeInteger">
1
</owl:minCardinality>
</owl:Restriction>
Nivele OWL
Lite
DL
Full
10/28/2008 28
Full
Logici descripționale
KL/ONECLASSICKRYPTON
10/28/2008 29
KRYPTONLOOMFaCTRacer...
Logici descripționale
ConcepteRoluriAxiome
10/28/2008 30
AxiomeIndividuali
Logici descripţionale
SubsumareVerificare consistenţeiClasificare
10/28/2008 31
Clasificare
Tractabilitate vs. expresivitate
Definiții
Extensionale
� E(man)={John, Fred, Bob, Dan}
Intensionale
10/28/2008 32
Intensionale
Definiții intensionale
(and concept1 concept2)
(or concept1 concept2)
(not concept)
(some proprietate1 concept1)
10/28/2008 33
(some proprietate1 concept1)
(all proprietate1 concept1)
(atleast numar1 proprietate1 concept1)
(atmost numar1 proprietate1 concept1)
Descrieri extensionale
E[(all r v)]={d ∈ D | E[r(d)] ⊆ E(v)}
E[(:and c c )]= E(c ) E(c )1 2 1 2∩
10/28/2008 34
Concepte și roluri
(concept algorithm :primitive)
(concept data-struct:primitive)
10/28/2008 35
:primitive)
(disjoint algorithm data-struct)
(concept container (and data-struct))
(role input
(:domain algorithm)
Concepte și roluri (cont.)
(concept container-algorithm
(and algorithm (:the
10/28/2008 36
(and algorithm (:the input container)))
Concepte și roluri (cont.)
(:the r c)
echivalent cu:
(and (all r c)(atleast 1
10/28/2008 37
(and (all r c)(atleast 1r)(atmost 1 r))
(some r c)
echivalent cu:
(and (all r c)(atleast 1 r))
Servicii terminologice
Subsumare� c1 subsumes c2 � E(c1) includes E(c2)
Clasificare
10/28/2008 38
Clasificare
Ontologii lexicale pe web
WordNet (http://wordnet.stanford.edu)
EuroWordNet
BalkanNet
10/28/2008 39
BalkanNet
FrameNet(http://framenet.icsi.berkeley.edu/)
VerbNet
WordNet
> 100,000 concepte
Substantive, verbe, adjective, adverbe
Din experimente psicholingvistice � o
10/28/2008 40
Din experimente psicholingvistice � o reșea semantică a conceptelor comune din limbaj
WordNet (cont.)
1 concept (e.g. share) � 1 synset � o mulțime de sinonime:
share, portion, part, percentage
1 word � mai multe sensuri (synsets)
10/28/2008 41
1 word � mai multe sensuri (synsets)Sense 1 share -- (any of the equal portions into which the capital stock of a
corporation is divided and ownership of which is evidenced by a stock certificate; "he bought 100 shares of IBM at the market price")
Sense 2 share, portion, part, percentage -- (assets belonging to or due to or contributed by an individual person or group; "he wanted his share in cash")
Sense 3 parcel, portion, share -- (the allotment of some amount by dividing something; "death gets more than its share of attention from theologians")
Sense 4 contribution, part, share -- (any one of a number of individual efforts in a common endeavor; "I am proud of my contribution to the team's success"; "they all did their share of the work")
Sense 5 plowshare, ploughshare, share -- (a sharp steel wedge that cuts loose the top layer of soil)
WordNet (cont.)
Număr fix de relații:
Hypernymsshare, portion, part, percentage -- (assets belonging to or due to or
contributed by an individual person or group; "he wanted his share in cash")
10/28/2008 42
cash")
=> assets -- (anything of material value or usefulness that is owned by a person or company)
=> possession -- (anything owned or possessed)
=> relation -- (an abstraction belonging to or characteristic of two entities or parts together)
=> abstraction -- (a general concept formed by extracting common features from specific examples)
=> abstract entity -- (an entity that exists only abstractly)
=> entity -- (that which is perceived or known or inferred to have its own distinct existence (living or nonliving))
WordNet (cont.)
Hyponymsshare, portion, part, percentage
=> tranche -- (a portion of something (especially money))
=> dispensation -- (a share that has been dispensed or distributed)
=> dole -- (a share of money or food or clothing that has been charitably given)
=> way -- (a portion of something divided into shares; "the split the loot three ways")
10/28/2008 43
=> way -- (a portion of something divided into shares; "the split the loot three ways")
=> ration -- (a fixed portion that is allotted (especially in times of scarcity))
=> allowance -- (an amount allowed or granted (as during a given period); "travel allowance"; "my weekly allowance of two eggs"; "a child's allowance should not be too generous")
=> slice, piece -- (a share of something; "a slice of the company's revenue")
=> split -- (a promised or claimed share of loot or money; "he demanded his split before they disbanded")
=> interest, stake -- ((law) a right or legal share of something; a financial involvement with something; "they have interests all over the world"; "a stake in the company's future")
=> profit sharing -- (a system in which employees receive a share of the net profits of the business)
=> cut -- (a share of the profits; "everyone got a cut of the earnings")
=> allotment, allocation -- (a share set aside for a specific purpose)
WordNet (cont.)
Holonymsshare, portion, part, percentage -- (assets belonging to or due to or
contributed by an individual person or group; "he wanted his share in cash")
PART OF: net income, net, net profit, lucre, profit, profits, earnings
10/28/2008 44
PART OF: net income, net, net profit, lucre, profit, profits, earnings -- (the excess of revenues over outlays in a given period of time (including depreciation and other non-cash expenses))
Protégé (http://protege.stanford.edu)
10/28/2008 45
Prelucrări semantice ale limbajului natural
Vecinătate semantică
Distanțe semantice în ontologii sau în rețele semantice
10/28/2008 46
rețele semantice
Spații semantice – Latent Semantic Analysis (vezi lsa.colorado.edu)
BibliografieConstandache, G.G., Ștefan Trăușan-Matu, Ontologia şi hermeneutica calculatoarelor, Ed. Tehnică, 2001Constandache, G.G., Ștefan Trăușan-Matu, M. Albu, C. Niculescu, Filosofie şi ştiinţe cognitive, MatrixRom, 2002
10/28/2008 47
2002Gruber, T., What is an Ontology, http://www.kr.org/top/definitions.htmlȘtefan Trăușan-Matu, Interfațarea evoluată om-calculator, Ed. MatrixRom, 2000http://www.w3.org/2004/OWL/http://wordnet.princeton.edu
top related