kl10tch.school : Введение в linked data и semantic web
TRANSCRIPT
Введение в Linked Data и Semantic Web
24.02.2015 #semwebpeter
Козлов Федор и Колчин Максим
Интернет
Интернет ≠ Веб
Тим Бернерс-Ли
CERN, 1994
TED, 2009
Веб
Веб = Интернет + ссылки + документы
Веб стандартыи технологии
URI
HTTP
Мы склонны зацикливаться на документах...
Все хорошее, что открывает для нас Веб, начинается с ссылок
● вики● постоянные ссылки● твиттер● обмен информацией● социальные сети в целом
Если ты можешь на что-то указать, то ты можешь говорить и
обмениваться этим
Есть одна проблема
● люди не особо заинтересованы в документах
● на самом деле они заинтересованы в тех вещах, которые записаны в документах
Нам надо перейти от этого...
...к этому
Но есть другая проблема...
...люди могут читать документы и тем самым извлекать их значения
...но машины не могут
Нам нужно помочь машинам понимать Веб...
...для того чтобы машины помогали нам извлекать значения документов
Semantic Web
Semantic Web - ...
● попытка создавать документы, которые машины способны понимать
● с использованием RDF и OWL
RDF - это ...
● модель данных● не формат данных (аля XML или JSON)● может быть записан в XML● или в HTML (как RDFa)● или N3● или Turtle● или даже JSON (см. JSON-LD)
RDF
● Тройка «субъект-свойство-объект»● Направленный граф● Формальные описания
Пример:<Федор Козлов> <это> <человек>
OWL
● Описание онтологий● Классы, объектные свойства и данные● Отношения между сущностями
Онтологии уже готовы!
● Метаданные (Dublin Core)● Персоналии (Friend of a Friend)● Классификация (SKOS)● Образование (AIISO)● Наука (LSC)● Библиография (BIBO)● Медиа-ресурсы (MA-ONT)
26
Разные люди знают разную информацию об объекте
isst:FedorKozlov rdf:type foaf:Persongoogle:FedorKozlov foaf:familyName “Kozlov”
vk:KozlovFedor123 foaf:age “24”facebook:KozlovF foaf:knows facebook:MaxKolchin
27
owl:sameAs
isst:FedorKozlov owl:sameAs google:FedorKozlovisst:FedorKozlov owl:sameAs vk:KozlovFedor123isst:FedorKozlov owl:sameAs facebook:KozlovF
Linked Data
Четыре принципа Linked Data
● URI для именования вещей● HTTP URI● RDF и SPARQL для описания вещей● Ссылки на URI сторонних источников в
описании вещей
Основные репозитории
Wiki: DBpedia, Freebase, WikidataMusic: BBC Music, Last FM, Music BrainzGeoData: Linked GeoData, Geo NamesScience: DBLP, BNBNews: New York Times,Отрытые гос-данныеМедицинские данныеОбразование, университеты и предметные области
Стек технологий
Новый язык запросов - SPARQL
● Запросы к данным в RDF● Выборка из графа● Федеративные запросы● Естественный язык в запросах (NL-
SPARQL)● Получение данных через открытые
SPARQL-endpoint
Reasoning
1. Воробьи - это птицы2. У всех птиц есть крылья
Вопрос:У воробьев есть крылья?
Reasoning
1. world:Sparrow rdfs:subClassOf world:Bird2. world:Bird world:has world:Wings
Результат reasoning:world:Bird world:has world:Wings
Средства разработки
Кто, Кому и Зачем?
Компании: разработчики
Компании: клиенты
Публикация и интеграция данных
NASA : POPS
*http://www.w3.org/blog/2011/05/semantic-web-its-not-rocket-sc/
● информация начиная с 1921 года● о 140 000 сотрудниках● 4 источника
В последствии была развернута в US Army и связана с NASA.
● 800+ динамических страниц генерируемых из SPARQL запросов
● среднее кол-во запросов/день: 2 миллиона
● среднее кол-во SPARQL запросов/день: 1 миллион
Результаты:● переиспользование информации● улучшение поискового трафика● контексто-зависимая реклама● автоматизация создания контента
Увеличение поискового трафика на ~30%
*http://readwrite.com/2010/06/30/how_best_buy_is_using_the_semantic_web
Семантический поиск
Открытые (государственные) данные
data.gov.spb.ru
data.mos.ru
5 звезд
*http://5stardata.info/
...в Linked Open Data Cloud
18.05%
* Август 2014
...и другие
● культурное наследие (музеи, библиотеки)○ www.researchspace.org
● интернет вещей○ www.internetofthings.fi
● медицина и разработка лекарственных средств○ www.openphacts.org
Полезные ссылки
1. EUCLID (Educational Curriculum for the usage of Linked Data), http://www.euclid-project.eu/2. Semantic University, http://www.cambridgesemantics.com/semantic-university/getting-
started-semantics3. “The next web” by Tim Berners-Lee at TED2009, www.ted.
com/talks/tim_berners_lee_on_the_next_web4. What is Linked Data? http://youtu.be/4x_xzT5eF5Q5. Introduction to Linked Data: Background Technologies and Standards, Motivating Application
Scenario, http://videolectures.net/eswc2013_hogan_mcginnis_linked_data6. A Semantic Web Primer, http://www.ics.forth.gr/isl/swprimer/7. Linked Data: Structured data on the Web, http://manning.com/dwood/,8. Semantic Web - Books, http://www.w3.org/2001/sw/wiki/Books9. Schema.org
bit.ly/semwebpeter