svenska ylen semanttinen annotointi - onki plus freebase
DESCRIPTION
Lyhyt kuvaus meidän artikkelien semanttisten asiasanojen annotoinnista teknisestä näkökulmasta.TRANSCRIPT
Svenska.yle.fi ja semanttinen annotointi
Mikael Hindsberg, konseptisuunnittelija svenska.yle.fi @mickhinds | [email protected]
30.09.2013
Svenska.yle.fi:n Onki-moduuli
Drupal 7+Onki moduuli
https://drupal.org/node/1604784
+ Arpa http://www.seco.tkk.fi/services/arpa/
+KOKO
http://onki.fi/sv/browser/overview/koko
Demo:http://www.youtube.com/watch?v=3PX2_U50UTs
Lue lisää: http://www.slideshare.net/mickhinds/svenskaylefin-linkitetty-semanttinen-data
FREEBASE-moduuli
Drupal 7+Freebase (API)
https://www.freebase.com/
Code sandbox:
https://drupal.org/sandbox/jaysire/2095551
• Toimijoita, paikkoja, tapahtumia, medioita (kirjoja, musiikkia, elokuvia)
• Rajattu pois yleiset asiasanat (poikkeus, mm urheilulajit)
• Loistava valikoima asiasanoja (40M +)
• Laatu vaihteleva joskin hyvä, asiasanojen lisääminen ongelmallista
FREEBASE Drupalissa
Koodi: https://drupal.org/sandbox/jaysire/
2095551
•Asiansanat + URIt tallennetaan taxonomiaan (kuva oik)•Suosituksia + automaattisia aihesivuja tageista•RDFa sivukoodissa•Odotellaan Ylen yhteistä metadatatietokantaa hierakiasta graafiin SPARQL / graafitietokanta + Solr / Json-LD APItiedot monipuolisempaan hyötykäyttöön sekä jakoon
Visio
Kiitos! Kysymyksiä?
Mikael ’Micke’ Hindsberg
twitter.com/mickhinds [email protected]
http://svenska.yle.fi http://utveckling.ylebloggen.fi
www.slideshare.net/mickhinds
By: aglet http://www.flickr.com/people/aglet/ CC BY-SA http://creativecommons.org/licenses/by-nc-sa/2.0/