anlamsal bilgi yönetiminde Üst veri sistemlerinin...
TRANSCRIPT
1
Anlamsal Bilgi Yönetiminde
Üst Veri Sistemlerinin ve
Ontolojilerin Kullanımı
Yaşar Tonta
Hacettepe Üniversitesi
Bilgi ve Belge Yönetimi Bölümü
yunus.hacettepe.edu.tr/~tonta/
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
2
Plan
• Durum saptaması
• Bibliyografik denetim
• FRBR, RDA
• Anlamsal Web
• Bağlı Veriler
• Sorgu Sistemleri
• Sonuç
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
3
Durum saptaması
• Web
• Hızlı bilgi artışı
• Dijital yerliler
• Sosyal ağlar
• Kullanıcılar tarafından üretilen üst veriler
• Kişiselleştirme
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
4
Kütüphane kataloğu: “Fiyatı yüksek
vasat ürün” (Lloyd Sokvitne)
• “Kullanıcılarımız basitlik ve anında ödül bekliyor ve bizi
kütüphaneleri Amazon, Google, ve iTunes standartlarına göre
yargılıyorlar. Bizim mevcut sistemlerimiz bunların yanında
soluk kalıyor” (University of California, 2005, s. 7).
Beyond the OPAC: Future Directions for Web-Based Catalogues Canberra: AustralianCommitteeon Cataloging, 18 September 2006.(http://www.nla.gov.au/lis/stndrds/grps/acoc/papers2006.html)
5
Düzenin Üç Düzeni
1. Nesnelerin kendilerinin
düzenlenmesi
2. Nesnelerin üst verilerinin
düzenlenmesi
3. Bit’lerin düzenlenmesi
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
6
Üst Veri
• Yapay
• Yapıcı
• İşlem
yapılabilir
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: Coyle, K. (2010 January). Library Data in a Modern Context. Library Technology Reports, 46(1): 1-13. http://alatechsource.metapress.com/content/p3022442071g7655/fulltext.pdf
7
BBY220
FRBR Kavramsal Modeli
• Varlık-İlişki Veri Modeline dayanır
Kullanıcı görevleri
• Bul
• Belirle
• Seç
• Sağla
• İlişkilendir
• Diğer olası görevler: – Telif hakları
– Koruma
8
FRBR 1. Grup Varlıklar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
9
Örnek – İnce Memed
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
10
BBY220
Kataloğun işlevleri (Cutter, Rules for a
Dictionary Catalog, 1876)
• Bilinen bir kitabın yazarına, eseradına ve konusuna göre bulunmasını sağlamak
• Bir kütüphanenin, bir yazarın belirli bir konudaki, belirli bir yazın türünde sahip olduğu kitapları göstermek
• Bir kitabın seçiminde yardımcı olmak
– Basımı açısından (bibliyografik olarak)
– Özelliği açısından (yazınsal/konusal)
11
FRBR 2. Grup Varlıklar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
12
FRBR 3. Grup Varlıklar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
13
MARC’ta FRBR Varlıkları ve İlişkileri
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: C. Oliver, Introducing RDA. Chicago: ALA, 2010. http://www.alastore.ala.org/pdf/9780838998908_excerpt.pdf
14
RDA: Resource Description and Access
• Kullanıcı gereksinimlerinin yanıtlanması
• Maliyet etkinliği
• Esneklik
• Süreklilik
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: C. Oliver, Introducing RDA. Chicago: ALA, 2010. http://www.alastore.ala.org/pdf/9780838998908_excerpt.pdf
15
AACR2 - RDA
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: http://www.loc.gov/catdir/cpso/RDAtest/rdaexamples.html
16 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
Anlamsal Web, 2001
“Anlamsal Web ayrı
bir Web değil ama
şimdikinin bir
uzantısıdır. Anlamsal
Web bilgiye iyi
tanımlanmış anlam
verilerek
bilgisayarlarla
insanların daha iyi
işbirliği yaparak
çalışmasını sağlar.”
- Tim Berners-Lee, James Hendler and
Ora Lassila; Scientific American, May 2001
17 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
Anlamsal Web Mimarisi–Tim Berners-Lee
Kaynak: http://www.w3c.org/2000/Talks/1206-xml2k-tbl/
18
DBpedia
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
19
Dbpedia İstatistikleri
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: Christian Bizer, Jens Lehmann, Georgi Kobilarov, Sören Auer, Christian Becker, Richard Cyganiak, Sebastian Hellmann:
DBpedia – A Crystallization Point for the Web of Data. Journal of Web Semantics: Science, Services and Agents on the World Wide Web, Issue 7, Pages 154–165, 2009.
20
Türkçe DBpedia Henüz Yok
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
21
Wikipedia: Akasya Durağı
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
22
DBPedia: Akasya Durağı
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
23
Kongre Kütüphanesi Bağlı Veri Hizmeti
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
24
VIAF
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
25 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
Anlamsal Bilgi Yönetimi
• Mevcut bilgilerin %20’si yapısal, %80’i yapısal olmayan metin halinde
• Mevcut bilgilerin tanımları sınırlı
• Makinece işlenebilir tanımlar gerekli (ör., RDF, OWL, XML)
26 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
Ontoloji Aracılığıyla Bilgi Bütünleştirmesi
Kaynak: Warren ve Davies, 2007, s. 182
27
Metindeki Varlıkların Bilgi Tabanındakilerle
Karşılaştırılması
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: Warren ve Davis, 2007
28
Shirky: Abartılı Ontoloji
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: www.shirky.com/writings/ontology_overrated.html
29
Sadece Bağlantılar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: www.shirky.com/writings/ontology_overrated.html
30 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
Kaynak: Madnick ve Zhu, 2006, s. 462, 466
Veri kalitesi ve yorum sorunları
• Veri
kalitesiyle
ilgili semantik
farklılıklar
• Yorum
sorunları
(metrik
sistem, “yıl” -
son 12 ay,
takvim yılı,
mali yıl…)
31
Bağlı Veri
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
32
Bağlı Veri Kütüphaneler İçin Niçin Önemli?
• Kütüphane kaynakları
Web’de daha kolay
bulunur
• Kütüphane üst
verilerine dayanan daha
yaratıcı uygulamalar
geliştirilebilir
• Etkin kataloglama ve
yenilik fırsatları sunar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: http://lodlam.net/2012/08/09/linked-data-for-libraries-video-from-oclc/
33 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
Sözcüklerin kullanımı
• “ACCIDENT”
• “event”
• “incident”
• “situation”
• “problem”
• “difficulty”
• “unfortunate situation”
• “the subject of your last letter”
• “what happened last week was…”
• “Mr. A: We all know why we are here.”
34
Zadeh’ye Göre Arama Motorları
• Yetersiz
• İki değerli mantıkla işliyor,
• Çıkarsama yapamıyorlar
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: Zadeh, 2005, 2006)
35
Soru Yanıt Sistemlerine Dönüşüm
• Dünya bilgisi
• İlgililik (istatistiksel/anlamsal)
– q: Vera’nın yaşı kaçtır?
– p: Vera, Irene ile yaşıttır
– r: Irene 65 yaşındadır
• Algılama temelli bilgiden çıkarsama yapma
– İki değerli mantık ve olasılık geçerli değil
• Esas sorun doğal dil anlama sorunu
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: Zadeh, 2005, 2006)
36 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul
Sorunlar
• Sorgu oluşturma – Eş anlamlı sözcükler (“çöp teorisi”)
• Anlam yokluğu – “Telekom şirketi Türkiye Nebi Fışkın Müdür”
– “10 Mayıstaki toplantısında İstanbul’da yerleşik Mobilfon yönetim kurulu Nebi Fışkın’ı CEO olarak atadı”
• Bağlam yokluğu – Kullanıcının hangi bağlamda bilgi aradığı
– COntext INterchange (COIN)
• Sonuçların sunulması – Kullanıcılar ilk ekrandan sonrasına bakmıyorlar
Kaynak: Warren ve Davies, 2007, s. 179-181
37
Swanson’ın Yetersizlik Ön Kabulleri
• Yanıt bulunmadıkça soru kesin olarak
oluşturulamaz
• Makine arama isteklerini uygun arama
terimlerine çevirecek şekilde
programlanamaz
• Makineler anlamı tanıyamaz
• Ya ustaca yapılmış ilgililik
değerlendirmelerine ya da çok etkili mekanik
süreçlere sahip olabilirsiniz, ama ikisine
birden sahip olamazsınız
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
Kaynak: Swanson, 1988
38
Sonuç
• FRBR ve RDA geliştirilmeli
• Kütüphane verileri web’in bir paçası olmalı
• Kütüphanelerde geliştirilen ontolojiler
web’e aktarılmalı
• Kütüphaneler bağlı açık veri modeline
geçmeye özendirilmeli
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir
39
Anlamsal Bilgi Yönetiminde
Üst Veri Sistemlerinin ve
Ontolojilerin Kullanımı
Yaşar Tonta
Hacettepe Üniversitesi
Bilgi ve Belge Yönetimi Bölümü
yunus.hacettepe.edu.tr/~tonta/
1. Uluslararası Semantik Ağ ve Üst Veri Sistemleri Konferansı, 7-8 Mart 2013, İYTE, Urla, İzmir