Технологии «семантической паутины»(semantic web)

13
Технологии «семантической паутины» (Semantic Web) Сергей Горшков Центр информационных технологий index.art – проект Бизнес-Семантика

Upload: indexart

Post on 16-Jun-2015

600 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Технологии «семантической паутины»(Semantic Web)

Технологии «семантической паутины»(Semantic Web)

Сергей ГоршковЦентр информационных технологий index.art – проект Бизнес-Семантика

Page 2: Технологии «семантической паутины»(Semantic Web)

Что такое семантические технологии?

«Семантическая паутина» (Semantic Web) –один из путей дальнейшего развития Интернета.

Основатель: Tim Berners-LeeСтандартизация: W3C

Page 3: Технологии «семантической паутины»(Semantic Web)

Что такое семантические технологии?

Современные информационные системыинформация представляется • в реляционной форме (таблицы)• в поточной (гипертекст, видео и т.д.)

Такая форма записи называется триплетом.

Семантические технологииинформацию выражается в виде набора фактов, записываемых в форме

«подлежащее – сказуемое – определение»

Page 4: Технологии «семантической паутины»(Semantic Web)

Что такое семантические технологии?

Онтология - «словарь терминов», в котором определены все возможные виды объектов и связей между ними.

Примеры стандартных онтологий:• «Дублинское ядро» (Dublin Core)• микроформаты (μF)

Page 5: Технологии «семантической паутины»(Semantic Web)

Простой пример

И.И. Иванов родился 01.01.1970

Содержание онтологии:«человек»

«имеет имя»«родился»

Выбор: использовать стандартную онтологию (foaf), или создать свою.

#Иванов имеет имя «И.И. Иванов»

#Иванов родился «1970-01-01»

#Иванов – уникальный идентификатор объекта, URI

Об уникальных идентификаторах(URI) будет рассказано чуть позже

Page 6: Технологии «семантической паутины»(Semantic Web)

Что хорошего в семантических технологиях?

МикроформатыВозможность искать структурированную информацию.

Магазины должны представлять информацию в семантической форме!

Или вот так:

Как больше вероятность найти нужный товар?

Вот так:

Page 7: Технологии «семантической паутины»(Semantic Web)

Что такое семантические технологии?

• В семантической форме можно записать любую информацию.

• Чем сложнее информация, тем более развитой будет онтология.

Page 8: Технологии «семантической паутины»(Semantic Web)

Что такое семантические технологии?

Информацию, записанную в семантической форме, удобно визуально представить в виде математического графа.

Иванов И.И. Петрова С.С.дружит с

добавилафото

Иванов, Петрова, фото – объекты (вершины графа).«Дружит с», «добавила» - связи (ребра графа).

нравитсяфото!

Семенов В.В.добавил комментарий к фото

дружит с

дружит с

Лучшим примером такого графа будет социальная сеть

Page 9: Технологии «семантической паутины»(Semantic Web)

Что такое семантические технологии?

Все связи, существующие в социальной сети,можно представить в виде графа гигантских размеров, содержащего миллиарды узлов.

Цукерберг: между миллиардом пользователей соцсети установлено свыше триллиона связей, а на серверах компании хранится более 240 миллиардов фотографий.

Page 10: Технологии «семантической паутины»(Semantic Web)

Graph Search в Facebook

В январе 2013 года Facebook представил Graph Search – инструмент поиска по информационному графу, которым является социальная сеть.

Цукерберг: «Система не просто выдает набор ссылок, как Google или Yelp, а сразу отвечает на поставленные вопросы, например: "фотографии, которые мне нравятся", "города, в которых побывали члены моей семьи", или "рестораны в Лондоне, где бывали мои друзья».

Отличие семантического поиска от обычного состоит в том, что поисковая машина учитывает смысл информации, а не просто ищет ключевые слова

Page 11: Технологии «семантической паутины»(Semantic Web)

Перейдем к технологиям

Каждый факт – ребро графа – называется «триплетом».

RDFS – средство записи схемы RDF (онтологии).

OWL – еще один язык записи онтологий.

SPARQL - язык запросов к данным, представленнымв виде триплетов.

RDF – язык записи триплетов. RDF можно записывать с помощью разных синтаксисов: Turtle, XML и т.д.

Page 12: Технологии «семантической паутины»(Semantic Web)

Перейдем к технологиям

foaf – одна из универсальных отнологий

Пример SPARQL-запроса

PREFIX foaf: <http://xmlns.com/foaf/0.1/>

SELECT ?name ?email

WHERE {

?person a foaf:Person.

?person foaf:name ?name.

?person foaf:mbox ?email.

}

Приведенный запрос вернет имена и e-mail’ы каждого человека в мире

Page 13: Технологии «семантической паутины»(Semantic Web)

Спасибо за внимание!Вопросы?

Также можно обсудить в ЖЖ:

http://serge-index.livejournal.com

Проект «Бизнес Семантика»:

http://www.business-semantic.ru