Индексирование семантическими моделями
DESCRIPTION
Индексирование семантическими моделями. О чем. Семантическая модель: модель типа "объект-свойство" Зачем: Поиск смысла. Объекты – это…. - тип объекта (например, организация) - конкретный объект (например, «Российская государственная библиотека»). Свойства – это…. МОЙ БАНК. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/1.jpg)
Яковлева М.В. "Крым-2008"
Индексирование семантическими моделями
![Page 2: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/2.jpg)
О чем
• Семантическая модель: модель типа "объект-свойство"
Зачем:
• Поиск смысла
![Page 3: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/3.jpg)
• Объекты – это…
МОЙ БАНК
Меня зовут АнтонУ меня есть дочь Я работаю в банке
- тип объекта (например, организация)- конкретный объект (например, «Российская государственная библиотека»)
• Свойства – это…
![Page 4: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/4.jpg)
Объекты и свойства
• Объекты – все, из чего состоит мир - материальные и идеальные сущности
• Свойства – описание характеристик объектаСвойства принимают значения в виде: текста, даты, числа, ссылки
Москва
Дата основания: 1147 г.
Основатель: Юрий Долгорукий
Находится в стране:
Страна Россия
Глава государства: президент
Численность населения: 148 000 000
Столица:
объекты:
сво
йст
ва
сво
йств
а
ссылка
![Page 5: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/5.jpg)
Объект - свойство
Когда мы говорим объект, то подразумеваем, что описан объект с набором свойств. Без свойств объекта не бывает.
Что такое объект «журнал»?
Журнал
наименование издательство ISSN гл.редактор ….
![Page 6: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/6.jpg)
Какие бывают свойства
• Текстовые Фамилия
• Дата (дд.мм.гг) Дата рождения
• Числовые Масса тела
• Ссылка Имеет ребенка – Является ребенком (от объекта Петух к объекту Цыпленок)
СЫН
ОТЕЦ
![Page 7: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/7.jpg)
Ссылка. Пример:
Тип объекта
Организация
...… ….. продукция свойство
Тип объекта
Изделие ….. …... производитель свойство
![Page 8: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/8.jpg)
Объекты – какие могут быть• Информационный объект: книги, статьи, сайты, изображения,
видео-клипы, фильмы (то, что содержит информацию о других объектах)
• Функциональный объект: вещь, существо (о них может идти речь в информационном объекте)
• Информационный объект («книга о Ленине») является Источником для функционального объекта («Ленин»)
• Типовой объект – общий для конкретного. Например,
организация – типовой (функц.) объектмагазин № 40 – конкретный (функц.) объект
книга – типовой (инф.) объект«Война и мир» - конкретный (инф.) объект
![Page 9: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/9.jpg)
Чем индексируем, чтобы понять «о чем текст?»
• ББК, УДК,…
• Тематические рубрики
• Ключевые слова
• Теги / метки
Как еще можно индексировать
• Выделение из текста смысловых единиц (объектов) и связей между ними
![Page 10: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/10.jpg)
Пример семантической модели.Текст по географии Европы
Европа
Население: 732 млн.чел.Площадь: 10 млн. кв. км….Омывается:Находятся страны:
Атлантический океан
Макс. глубина: 8742 мСр. глубина: 3600 м…..Омывает части света:Входящие в состав моря:
Балтийское море
Кр.северная точка: 65град.40 мин. с.ш.Кр.южная точка:
53град. 45мин. в.д …..Принадлежит океану:Включает острова:Омывает страны:
Остров Готланд
…..Находится в море:Принадлежит стране:
Швеция
Столица: СтокгольмПлощадь: 449964 кв. кмИмеет выход к морю:Включает острова:Находится в части света:
![Page 11: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/11.jpg)
Индексация текста по географии
• ББК – 26.8
• Ключевые слова:- Европа- География
Если повезет, то:- Атлантический океан- Швеция-…
![Page 12: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/12.jpg)
Важная роль источника
объект «Махно»
свойство значение
Место рождения с. Гуляйполе
Источник: Большая советская энциклопедияИсточник: Энциклопедия «Кругосвет»
Политические взгляды анархист
Источник: Большая советская энциклопедия
Политические взгляды анархист-коммунист
Источник: Учебник Отечественная история. IX-XX вв.Источник: Энциклопедия «Кругосвет»
Фамилия Махно
Имя Нестор
Отчество Иванович
Дата рождения 17.10.1889
источники:
Свойства объекта со ссылкой на источник:
Учебник Отечественная история. IX-XX вв.
Большая советскаяэнциклопедия
Энциклопедия«Кругосвет»
![Page 13: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/13.jpg)
Особенности / плюсы метода семантического индексирования
• Индексация всего документа (текста) и/или его части
• Достаточно содержательный индекс• Использование индекса в качестве
справочника фактической информации• Индексирование во времени, начиная с
простого, дополняя подробностями в течение времени
![Page 14: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/14.jpg)
Профессиональные библиотечные мероприятия
![Page 15: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/15.jpg)
![Page 16: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/16.jpg)
Запрос:Найти все библиотечные мероприятия в июне
![Page 17: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/17.jpg)
Найдено 9 событий (конференции, семинары и пр.) В т.ч. междунар. конференция «Крым-2008»
![Page 18: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/18.jpg)
Свойства объекта «Крым-2008»: название, место, кто проводит, даты и пр.
![Page 19: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/19.jpg)
Информационный источник: Сводный план на 2008 год
![Page 20: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/20.jpg)
Описание источника: комментарий, название, автор, где опубликован
![Page 21: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/21.jpg)
Запрос:Найти конференции, которые пройдут в Иркутске в июне
![Page 22: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/22.jpg)
Описание конференции. Связь ‘конференция «Растим патриотов…» – организатор – РГДБ’
![Page 23: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/23.jpg)
Описание объекта РГДБ (название, адрес, телефон…). Связь ‘РГДБ – директор – Жаркова Л.М.’
![Page 24: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/24.jpg)
Объект Жаркова Л.М. Свойства: фамилия, имя, отчество, место работы... Связь-ссылка на фото
![Page 25: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/25.jpg)
![Page 26: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/26.jpg)
Пример запроса: Профессиональные мероприятия в июне, организатором которых является РБА (5 мероприятий)
![Page 27: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/27.jpg)
Семантическая Библиотека «География Урала»
![Page 28: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/28.jpg)
Запрос: Оленьи ручьи.Найденные объекты – парк Оленьи ручьи и связанные с ним хребты, пещеры, реки, скалы.
![Page 29: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/29.jpg)
Свойства объекта Бардымский хребет: входит в состав Уральских гор, высота, направление… Связь-ссылка ‘Бардымский хребет – на территории имеется – скала Дыроватый камень’
![Page 30: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/30.jpg)
Описание объекта «скала Дыроватый камень» (комментарий, свойства). Связь-ссылка ‘Дыроватый камень - располагается на территории – парк Оленьи ручьи’
![Page 31: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/31.jpg)
Парк Оленьи ручьи: комментарий, свойства, присоединенные файлы
![Page 32: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/32.jpg)
Файл – цитаты из учебника. (doc)
![Page 33: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/33.jpg)
Объект «Пещера Смолинская». Файл – изображение (jpg)
![Page 34: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/34.jpg)
Информационный источник:
Информация для описания свойств объектов берется из источника. В данном случае – Учебник «География Свердловской области». / Источников может быть несколько /
![Page 35: Индексирование семантическими моделями](https://reader035.vdocuments.net/reader035/viewer/2022062723/56813f72550346895daa581b/html5/thumbnails/35.jpg)
«Семантическая Cеть может способствовать эволюции всего человеческого знания в целом»
Тим Бернерс-Ли