profs.info.uaic.robusaco/teach/courses/... · ga /~ co dezvoltarea aplicațiilorweb date...
TRANSCRIPT
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Dezvoltarea aplicațiilor Web
</>date structurate în cadrul documentelor HTML
scheme de microdate HTML5
Dr. Sabin Corneliu Buraga – profs.info.uaic.ro/~busaco/
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
„Imaginația este mai importantă ca erudiția.”
Albert Einstein
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Constatare
clientul care consumă (accesează) reprezentăride resurse Web nu trebuie obligatoriu să fie uman
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Cum am putea descrie conținutul resurselor Webastfel încât să poată fi procesat automat?
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Idee:specificarea unor meta-date direct în cadrul
documentelor HTML pentru a „explica” unui program (software – e.g., robot al unui
motor de căutare) conținutul unei resurse Web
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Soluții actuale aliniate problematicilor Web-ului semantic – Web of Data
microformate (abordare învechită) – microformats.org
scheme de microdate HTML5 – schema.org
RDFa (standard al Consorțiului Web) – rdfa.info
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Microdata HTML 5
specificație HTML Living Standard (25 octombrie 2019)html.spec.whatwg.org/multipage/microdata.html
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Microdata HTML 5
posibilitatea de a specifica perechi de proprietăținume—valoare „scufundate” în documente HTML
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Microdata HTML 5
grupurile de perechi de proprietăți nume—valoare sunt denumite items
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Microdata HTML 5
grupurile de perechi de proprietăți nume—valoare sunt denumite items
creare via atributul itemscope
stabilește și domeniul de vizibilitate
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Microdata HTML 5
grupurile de perechi de proprietăți nume—valoare sunt denumite items
specificarea unei proprietăți prin atributul itemprop
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Microdata HTML 5
grupurile de perechi de proprietăți nume—valoare sunt denumite items
referire cu ajutorul atributului itemref
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Microdata HTML 5
grupurile de perechi de proprietăți nume—valoare sunt denumite items
asocierea unui tip de date se face cu atributul itemtype
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Microdata HTML 5
grupurile de perechi de proprietăți nume—valoare sunt denumite items
pentru identificarea unui item se folosește itemid
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Există o serie de modele de date(exprimate via microdate)ce pot fi indexate și folosite
de actualele motoare de căutare?
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
schema.org
colecție de vocabulare (scheme de date)– e.g., Book, Event, LocalBusiness, Movie, Offer, Person,
Place, Recipe, Review, TVSeries,… – recunoscute șiindexate de roboții principalelor motoare de căutare
istoric și viziune:R. Wallis, “Schema.org: Structured Data – What, Why, & How”, 2018
www.slideshare.net/rjw/schemaorg-structured-data-the-what-why-how-125885618
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
schema.org
colecție de vocabulare (scheme de date)– e.g., Book, Event, LocalBusiness, Movie, Offer, Person,
Place, Recipe, Review, TVSeries,… – recunoscute șiindexate de roboții principalelor motoare de căutare
Bing, Google, Yahoo!, Yandex
amănunte la schema.org/docs/gs.html
modeleconceptuale
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
tipurile primare de date definite de schema.org
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
diverse proprietăți ce relaționează Integer cu alte concepte
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Thing – schema cea mai generală, incluzând conceptualizări(clasificări realizate riguros)
Action
BroadcastService
CreativeWork
Event
Intangible
MedicalEntity
Organization
Person
Place
Product
Class
Property
modelare de cunoștințe(via o ontologie)
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Person – modelează conceptul „persoană”http://schema.org/Person
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
MusicRecording – specifică o înregistrare muzicală (sub-clasă a conceptului CreativeWork)
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
schema.org
relațiile dintre entități sunt precizate via proprietăți
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
<div itemscope="" itemtype="http://schema.org/RealEstateAgent"><span itemprop="name">Tuxy Unlimited</span><div itemprop="address" itemscope=""
itemtype="http://schema.org/PostalAddress"><span itemprop="streetAddress">Banchiza, 1</span><span itemprop="addressLocality">Iasi</span>,<span itemprop="addressRegion">Iasi</span><span itemprop="postalCode">700550</span>
</div>Phone: <span itemprop="telephone">+4032201090</span><a href=
"http://www.openstreetmap.org/way/243817200#map=18/47.17493/27.57378" itemprop="maps">Details on OpenStreetMap</a>
</div>
fapte vizând domeniul imobiliar
…pe baza modelului conceptual schema.org
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
<p itemid="#busaco" itemscope="" itemtype="http://schema.org/Person">This discipline is taught by
<span itemprop="honorificPrefix">Dr.</span> <a href="https://profs.info.uaic.ro/~busaco/"
title="Visit the Website of Sabin-Corneliu Buraga" itemprop="url"><span itemprop="name">
<span itemprop="givenName">Sabin</span>-<span itemprop="additionalName">Corneliu</span> <span itemprop="familyName">Buraga</span>
</span></a>.
</span></p>
specificarea (adnotarea explicită a) faptului: „entitatea având numele Sabin-Corneliu Buraga este o persoană, posedă titlul Dr. și are situl Web propriu
disponibil la adresa https://profs.info.uaic.ro/~busaco/”
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
<section id="web-nodejs"><h2>Web Supplement</h2><ul>
<li itemscope="" itemtype="http://schema.org/CreativeWork"itemid="#nodejs" class="lecture"><p>Tutorial: <a itemprop="url" title="…"
href="presentations/web-nodejs.pdf"><span itemprop="name">Web Application Development
with Node.js</span></a></p><div class="terms" itemprop="keywords"> Web, development, server,
Node.js, JavaScript, programming, npm, tools</div></li>…
</ul></section>
specificarea în HTML5 a lucrărilor creative de tip CreativeWork conform schema.org
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
extragerea/verificarea de date structurate via Structured Data Testing Tool – search.google.com/structured-data/testing-tool
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
extragerea informațiilor din HTML5aici, despre prelegerile asociate unei materii
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
<article itemscope="" itemtype="http://schema.org/Event"><section id="contest">
<h2>Tema</h2><p itemprop="description">Concursul este destinat studenților<span itemprop="location" itemscope="" itemtype="http://schema.org/Place">
<a href="http://www.info.uaic.ro/" itemprop="url" title="Spre situl FII><span itemprop="name">FII</span></a> (UAIC <span itemprop="address">Iași, România</span>)</span>
și constă în optimizarea conținutului și structurii unui sit Web.</p>…<p>Perioadă de desfășurare: <span itemprop="startDate" content="2018-10-15T00:00">15 octombrie 2018</span>—<strong><span itemprop="endDate" content="2019-01-07T17:00">7 ianuarie 2019, ora 17:00</span></strong>.</p>
</section>…</articol>
pe baza schema.org, se pot modela în HTML date vizând un eveniment (Event) și locul de desfășurare (Place)
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
date pentru „consum” uman vs. date structurate interpretate și prelucrate, ulterior, de algoritmi
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
inspectarea datelor structurate cu OpenLink StructuredData Sniffer – extensie de browser: osds.openlinksw.com
specificarea meta-datelor privitoare la instanța de Articol
aici, o instanță ImageObject
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
<div itemscope="" itemtype="http://schema.org/Product"><img itemprop="image" src="tux-de-catifea-cu-paiete.jpg" /><span itemprop="name" lang="ro">Tux de catifea cu paiete</span>
<div itemprop="aggregateRating"itemscope="" itemtype="http://schema.org/AggregateRating"><span itemprop="ratingValue">74</span>din <span itemprop="bestRating">100</span> de punctepe baza a <span itemprop="ratingCount">33</span> de evaluări ale utilizatorilor
</div>
<div itemprop="offers" itemscope=""itemtype="http://schema.org/AggregateOffer">disponibil de la
<span itemprop="lowPrice">30</span> la <span itemprop="highPrice">130</span> de RON pe baza ofertei a <span itemprop="offerCount">10</span> comercianți
Oferta zilei:<div itemprop="offers" itemscope itemtype="http://schema.org/Offer">
<a itemprop="url" href="http://jucarii.biz/tucsi/tux-catifea-paiete">Jucării de sărbători pentru toți, acum și cu paiete!</a>
</div></div>
</div>modelarea cunoștințelor privind
produse și oferte comerciale
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
alte exemplificări: pinterest.com/kidehen/structured-metadata-related/
TripAdvisor
construcții RDFa utilizând Open Graph Protocol (Facebook) – ogp.me
utilizarea conceptelor Country și AggregateRating
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
acțiuni asociate vizualizării unui produs (instanță a clasei Product) – detalii la schema.org/docs/actions.html
vezi și Increase user engagement with actions in emailsdevelopers.google.com/gmail/markup/
eBay
acțiuni ce pot fi efectuate de utilizator(ViewAction e sub-concept al Action)context: dispozitive mobile, e-mail,…
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
extragerea de microdate HTML5, plus convertirea în triple RDF via RDF Translator (serviciu REST)
disponibil la rdf-translator.appspot.com
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>.
@prefix schema: <http://schema.org/>.
<_:gs0>
rdf:type <http://schema.org/WebPage>;
schema:name "Web Application Development";
schema:description "syllabus (aka the WADe film)";
schema:license <https://creativecommons.org/licenses/by-nc-sa/4.0/>;
schema:author "#busaco".
"#wade-lecture5"
rdf:type <http://schema.org/CreativeWork>;
schema:url <https://profs.info.uaic.ro/~busaco/teach/.../web05ModelulRDF.pdf>;
schema:name "Data Modeling in RDF (Resource Description Framework)";
schema:keywords "Web, model, RDF, vocabulary, DCMI, FOAF, DOAP, SIOC, JSON-LD".
"#busaco"
rdf:type <http://schema.org/Person>;
schema:url <https://profs.info.uaic.ro/~busaco/>;
schema:name "Sabin-Corneliu Buraga".
detalii în cursul despre RDF
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
{ "@context": { "schema": "http://schema.org/" },"@graph": [ {
"@id": "_:N21752188d2184128ba182402e605ec5c","@type": "schema:WebPage","schema:author": { "@id": "_:N48eb473b6579441c817f39bd21fd8990" },"schema:description": "syllabus (aka the WADe film)","schema:license": { "@id": "https://creativecommons.org/licenses/by-nc-sa/4.0/" },"schema:name": "Web Application Development"
},{ "@id": "_:N48eb473b6579441c817f39bd21fd8990",
"@type": "schema:Person","schema:name": "Sabin-Corneliu Buraga","schema:url": { "@id": "https://profs.info.uaic.ro/~busaco/" }
},{ "@id": "_:N35ffb1753f2247329028d3358c0ade52","@type": "schema:CreativeWork","schema:keywords": "Web, model, RDF, data, annotation, vocabulary, …, JSON-LD","schema:name": "Data Modeling in RDF (Resource Description Framework)","schema:url": { "@id": "https://profs.info.uaic.ro/~busaco/…/web05ModelulRDF.pdf" }
}]
}
de la microdate HTML5 exprimate via modelul schema.org
la construcții JSON-LD
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Studiu de caz:adnotarea semantică via microdate HTML5 a datelor
în contextul interacțiunii om-calculator
Persona și teste de utilizabilitate(Ștefan Negru & Sabin Buraga, 2012)
blankdots.com/open/schema/
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
model de cunoștințe + proprietăți specifice asociate conceptului Persona
detalii în cadrul disciplineiHuman Computer Interaction
profs.info.uaic.ro/~busaco/teach/courses/hci/
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
<article itemscope itemtype="http://schema.org/Persona"><section id="personal-info">
<h3>Type: <strong itemprop="personaType">Primary</strong></h3><figure><img itemprop="image" src="tux.jpg" alt="persona image" /></figure><h4>Identity: <span itemprop="givenName">Tuxy</span>
<span itemprop="familyName">Pinguinnesscool</span></h4><h4>Background</h4><ul>
<li>Date of Birth: <time itemprop="birthDate" datetime="1980-10-30">30 October 1980</time></li>
<li>Gender: <span itemprop="gender">Male</span></li><li itemprop="location" itemscope itemtype="http://schema.org/Place">
Location: <span itemprop="name">Iasi, Romania</span></li><li>Tech Level:<span itemprop="technicalLevel">Advanced</span></li>
</ul></section><section id="goals">
<h4>Goals</h4><ul>
<li>Practical Goals: <span itemprop="endGoal">…</span></li><li>Personal Goals: <span itemprop="experienceGoal">…</span></li>
</ul></section>
</article>
moștenite de la Person
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
coObservație: construcțiile schema.org
pot fi incluseîn documentele HTML
și ca date JSON-LD
exemplificare:exprimarea acțiunii de
interacțiune dintre persoana Tuxy și organizația UAIC
<script type="application/ld+json">
{
"@context" : "http://schema.org",
"@type" : "InteractAction",
"agent" : {
"@type" : "Person",
"name" : "Tuxy"
},
"participant" : {
"@type" : "Organization",
"name" : "UAIC"
}
}
</script>
concept
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
generarea de construcții JSON-LD ce recurg la schema.orgwww.microdatagenerator.com
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Diverse utilizări practice:
artefacte culturalevezi prezentările lui A. Isaac despre Europeana
www.slideshare.net/antoineisaac/presentations
biblioteci digitale (digital libraries)R. Wallis, prelegeri la Smart Data’15, BIBFRAME’18,…
www.slideshare.net/rjw/presentations
lucrări științificeformatul Scholarly HTML
w3c.github.io/scholarly-html/
medicină + sănătateschema.org/docs/meddocs.html
health-lifesci.schema.org
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Diverse utilizări practice:
finanțeextensia schema.org privitoare la FIBO (Financial Industry Business Ontology)
wiki.edmcouncil.org
schema.org/FinancialProduct
industria autoauto.schema.org
IoT (Internet of Things)iot.webschemas.org/docs/iot-gettingstarted.html
turismC. Bizer, Schema.org Annotations in Websites. Opportunities
& Challenges for the Tourism Industry, TFF’15www.slideshare.net/TourismFastForward/bizer-christian-schema-orgtourism
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
A se studia și inițiativa Web Data Commons
extragere cu Common Crawl – commoncrawl.org –și acces la seturi de date modelate
via microformate, microdate și RDFa
webdatacommons.org/structureddata/
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
preluare și export de microformate, microdate HTML5 și RDFa cu extensia POSHex
proiect al absolventului FII Tiberiu Pasat (2013)
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Scheme de microdate HTML5în sistemele de management de conținut
(CMS – Content Management Systems)
M. Mössmer, Schema.org Plugins for CMS Systems (2014)oc.sti2.at/sites/default/files/schemaorg_cmsplugins.pdf
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
Scheme de microdate HTML5în sistemele de management de conținut
DokuWikiwww.dokuwiki.org/plugin:semantic
Joomlaextensions.joomla.org/extension/google-structured-data-markup
MediaWikiwww.mediawiki.org/wiki/Extension:GoogleRichCards
TYPO3extensions.typo3.org/extension/schema_org/
WordPresswordpress.org/plugins/all-in-one-schemaorg-rich-snippets/
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
statistici vizând includerea de meta-date
direct în codul HTMLtrends.builtwith.com/docinfo
Dr.
Sab
in B
ura
ga
profs.in
fo.uaic.ro/~busa
co
rezumat
</>specificarea (meta-)datelor
în cadrul documentelor HTML