ontology matching
DESCRIPTION
TRANSCRIPT
ارائه الگوریتمی برای وب معنایی مبتنی بر آنتولوژی
ارائه کننده : اسماعيل اکبرياستاد راهنما: دکتر فتحیان
2
ساختارساختارکلیکلی
مقدمه
وب معنایی
الگوریتم آنتولوژیها و نتایج
پیشنهادات آتی
مراجع
مقدمه1.
2
فهرسفهرست ت
مطالبمطالب
مقدمه
وب معنایی
الگوریتم آنتولوژیهای
پیشنهادی
پیشنهادات آتی
مراجع
مقدمه1.
3
مقدمه
وب معنایی
آنتولوژیالگوریتم
های پیشنهادی
پیشنهادات
آتی
مراجعظهور
اصول
فهرست فهرست مطالبمطالب
چارچوب
وب معنایی2.
ظهور وب معنایی1.2
4
ده دا
ادزی
م حج
داده ساخت نیافته
قابل درک
چرانه؟
ییاب
رز، ا
یرس
تف
دسته بندی، انتخاب
ثاع
ب
ظهور وب معنایی1.2
5
چرا کامپیوترها نمی توانند این کار را برای ما انجام دهند؟یکی از دالیلش این است که صفحات وب شامل •
oاطالعاتی راجع به خودشانoاطالعاتی راجع به محتویاتشانo اطالعاتی راجع به موضوعی که حاوی مطلب در مورد آن هستندo... و
نیستند. مثال: جستجوی کتابTCP/IPدر یک کتابخانه
.همان وضعیتی است که در وب نحوی با آن روبرو هستیم D این دقیقا عهFراد توسFات بين افFادل اطالعFتب ابFزاري بFراي اينکFه وب بFه عنFوان نتيجFه
يافته است تا براي ماشين ها. فحهFک صFات درون يFني اطالعFه معFايي، کFواي معنFد آن، محتFوان پيامFبه عن
وب اسFت، بFه گونFه اي کFد شFده اسFت کFه تنهFا بFراي انسFان قابFل اسFتفاده است.
ارتFاییعبFانگر این وب معنFيز بیFا نFه کامپيوترهFت کFدگاه اسFد بديFد تواننFمانن داده هاي روي وب را پيدا کرده، خوانده، درک و استفاده کنند.انسان
هFت کFازي اسFاي تواناسFوژي هFتانداردها و تکنولFعه اسFايي توسFهدف وب معن فهم بيشFتر اطالعFات روي وب طFراحي بFه منظFوربFراي کمFک بFه ماشFين هFا
شده اند.
ظهور وب معنایی1.2
7
مقدمه
وب معنایی
آنتولوژیالگوریتم
های پیشنهادی
پیشنهادات
آتی
مراجعظهور
اصول
فهرست فهرست مطالبمطالب
چارچوب
اصول وب معنایی2.2
اصول وب معنایی2.2
هر چیزی می تواند توسط 1اصل :URIها شناسایی شود به افFراد، مکFان هFا و چيزهFا در دنيFاي فFيزيکي مي تFوان در وب معنFايي •
بوسيله شناسه هاي گوناگون رجوع کرد
8
اصول وب معنایی2.2
منابع و لينک ها مي توانند داراي نوع باشند2اصل :
9
وب کنونی وب معنایی
اصول وب معنایی2.2
تکامل پشتيباني مي شود3اصل :.
10
اطالعات کنونی
اطالعات قدیمی
11
مقدمه
وب معنایی
آنتولوژیالگوریتم
های پیشنهادی
پیشنهادات
آتی
مراجعظهور
اصول
فهرست فهرست مطالبمطالب
چارچوب
چارچوب وب معنایی3.2
چارچوب وب معنایی3.2
:مراحل زیر مسیری را نشان می دهد که وب معنایی در پیش گرفته است مشترک برای جمالت قابل فهم توسط ماشینsyntaxفراهم کردن 1.( مشترکvocabulariesساختن لغات )2.توافق بر روی یک زبان منطقی3.استفاده از زبان برا ی تبادل اثبات ها4.
رای وبFه ای را بFاختار الیFک سFایی یFیز وب معنFونی و نFترع وب کنFرزلی مخFای برنFآقمFعناییF پیشنFهاFد کردF.F این FساختFار مرFاحFلی کهF دFر باالF لیستF شFد رFا FمنعFکس می کند.
تکنولوژی های وب
ابرمتن
تکنولوژی های تکمیل شده وب معنایی
تکنولوژی های تکمیل نشده وب معنایی
13
فهرسفهرست ت
مطالبمطالب
مقدمه
وب معنایی
آنتولوژیالگوریتم
های پیشنهادی
پیشنهادات آتی
مراجع
نگاشت
ادغام
. آنتولوژی3
انطباق
،نوعيFوش مصFه ماننFد کFامپيوتر علFوم مختلFف هFاي حFوزه در هFا آنتولFوژي ...Fزار وFرم افFنF يFندسFمه F،اييFوب معنF ،بيعيFان طFزبF ازشFردFانش، پFايش دFنماFسFتفادFه شFدهF انFد. بنFابراين Fاين اFنتظFار وجFوFد داردF کFهF تعريFف هFاي مختلفي Fاز
آن وجود داشته باشد.
رمتFت فFوژي ممکن اسFک آنتولFه يFه اگرچFد کFان مي کننFپر بيFولد و جاسFاوشهاي مختلفي به خود بگيرد اما در هر حال شامل:
مجموعFه اي از اصFطالحات، توصFيفي از معFني آنهFا، ویFژگی هFا و بيFان اينکFه •چگونه اين اصطالحات با هم ارتباط دارند، است.
يومFکنسرسW3C رايFيفاتي بFامل توصFد شFا بايFوژي هFه آنتولFد کFنهاد مي کنFپيش عناصر زير باشند:
کالس ها )يا چيزها( در حوزه مورد نظر•ارتباطات بين اين چيزها•مشخصات يا ويژگي هايي که اين چيزها بايد داشته باشند.•
14
. آنتولوژی3
یک آنتولوژی نمونه
. آنتولوژی3
در آنتولوژي همه روابط دنياي واقعي مي تواند وجود داشته باشد
یک آنتولوژی نمونه
. آنتولوژی3
Name :String
.آنتولوژی هسته وب معنایی را تشکیل می دهد.آنتولوژی پیاده سازی عملی وب معنایی را به عهده داردواسطه گری آنتولوژی
به دنبال شناسايي شباهت ها•غلبه بر اختالفات بين آنتولوژي ها•آنهFا بين سيسFتم هFا و • بFه اشFتراک گFذاري به منظFور اسFتفاده مجFدد و
برنامه هايي است که از آنها استفاده مي کنند.واسطه گري آنتولوژي به سه زير حوزه
نگاشت آنتولوژي • ادغام آنتولوژي•انطباق آنتولوژيانطباق آنتولوژي •
تقسيم مي شود. ،اFه اين رويکردهFلي در همFايييک بحث اصFاني و شناسFيين همپوشFتع
بين مفاهيم، روابط، ويژگي ها و نمونه ها در آنتولوژي هاي مختلف است.
. آنتولوژی3
18
فهرسفهرست ت
مطالبمطالب
مقدمه
وب معنایی
آنتولوژیالگوریتم
های پیشنهادی
پیشنهادات آتی
مراجع
نگاشت
ادغام
نگاشت آنتولوژی1.3
انطباق
الFه دنبFوژي بFت آنتولFايشنگاشFت نمFوژي هاسFده بين آنتولFه شFاي يافتFتناظره )خروجی شکل زیر(.
نگاشت آنتولوژی1.3
O1
O2
ورودی
کشف نگاشت خروجی
نگاشت
قواعد نگاشت
استفاده از آنتولوژی واسطآنتولوژی واسط ترکیبی از
آنتولوژی های ورودی• قواعد )پل های( نگاشت•
20
فهرسفهرست ت
مطالبمطالب
مقدمه
وب معنایی
آنتولوژیالگوریتم
های پیشنهادی
پیشنهادات آتی
مراجع
نگاشت
ادغام
ادغام آنتولوژی2.3
انطباق
وژيFردن آنتولFام کFا ادغFد بFوژي جديFک آنتولFاد يFعي در ايجFوژي سFام آنتولFادغهاي موجود دارد.
دو رویکردجایگزینی آنتولوژی های ورودی با آنتولوژی جدید برای مثال الگوریتمPROMPT
ادغام آنتولوژی2.3
O1
O2
ورودی
ادغام خروجی
. در روش دوم آنتولوژي هاي اوليه با يک آنتولوژي جديد جايگزين نمي شوند وان ورودي ميFه عنFه را بFاي اوليFوژي هFه آنتولFود کFاد مي شFل ايجFوژي پFک آنتولFه يFبلک
گيرد و ادغام بين آنتولوژي ها را با استفاده قواعد پل نشFان مي دهد. برای نمونه الگوریتمOnto-Merge
ادغام آنتولوژی2.3
O1 O2
آنتولوژی پل
آنتولوژی ورودی
آنتولوژی ورودی
قواعد پل
23
فهرسفهرست ت
مطالبمطالب
مقدمه
وب معنایی
آنتولوژیالگوریتم
های پیشنهادی
پیشنهادات آتی
مراجع
نگاشت
ادغام
انطباق آنتولوژی3.3
انطباق
کشف تناظر بين آنتولوژي ها ايFوژي هFآنتول نتيجFه عمFل انطبFاق، شناسFايي شFباهت بين موجFوديت هFاي
داده شده است. )ای داده ایFژگی هFوی( اي کالسFژگي هFوي ،)ومFا کالس )مفهFوديت هFاين موج
و روابط بين دو کالس )ویژگی های شی ای( هستند.
انطباق آنتولوژی3.3
الگوریتم های سه حوزه آنتولوژی4.3
n-gram فاصله ويرايش پسوند
واسطه گري آنتولوژي
انطباق آنتولوژي
منبع زبان شناختي عمومي
پيشوند
نگاشت آنتولوژيادغام
آنتولوژي
ايجاد آنتولوژي جديدترکيبي ساختاري معنايي نحوي
منبع زبان شناختي خاص
استفاده از قواعد نگاشت
الگوريتم هاي مختلف واسطه گري آنتولوژي
الگوریتم های سه حوزه آنتولوژی4.3
الگوریتم های سه حوزه آنتولوژی4.3
الگوریتم های سه حوزه آنتولوژی4.3
29
ساختارساختارکلیکلی
وب معنایی
آنتولوژی
پیشنهادات آتی
مراجع
29
فهرسفهرست ت
مطالبمطالب
وب معنایی
آنتولوژی
پیشنهادات آتی
مراجعوب
معنایی
الگوریتم های پیشنهادی.4
الگوریتم های
پیشنهادی
MLMA+ساختاری
ترکیبی
+MLMA الگوریتم 1.4
.دارای سه فاز است:فاز اول
O1
O2
ورودی
[LEVENSHTEIN]
[WORDNET]
]ماتریس شباهت نحوی[
]ماتریس شباهت معنایی[
نرمال سازی
[st0]وضعیت اولیه [L]ماتریس شباهت اولیه اعمال آستانه
th =0.45
خروجی اولیه
+MLMA الگوریتم 1.4
فاز دوم
حذف یا اضافه کردن یک نگاشت ایجاد وضعیت های کاندید
vمحاسبه نمره
[st0]وضعیت اولیه
n
i
m
j
n
i
m
j
thjiMapjiLjiMap
kLMapv
1 110
1 110
10
.),(/),().,(
/).(
:فاز سوم االیFد بFداري حFيله نگهFده بوسFاد شFاي ايجFايه هFدادي از همسFردن تعFتر کFفيلx%
را دارند.vاز وضعيت هايي که بیشترین مقدار )تFاختاري اسFباهت سFار شFک معيFه يFدي را )کFطح بعFباهت سFار شFوريتم معيFالگ
آنهFا بين اFز بهFتFرين FوضFعيت FاFت اعFمFال ميF شFود باFقيمانFده هFاي بFهF وضFعFيت بدست آيد.
مشکالتMLMA+
ايجاد وضعيت هاي همسايه بسيار زياد و در عين حال تصادفي•ايجاد وضعيت هاي همسايه زيادي که از وضعيت اوليه بدتر هستند•در نظر نگرفتن وضعيت اوليه به عنوان يک وضعيت کانديد•جفت موجFوديت منطبFق شFده k-1يFا k+1وضFعيت هFاي همسFايه داراي •
kجفت همFواره از وضFعيت اوليFه بFدتر انFد ) k+1هسFتند کFه وضFعيت هFاي بFا (.تعداد نگاشت های یافته شده
+MLMA الگوریتم 1.4
بهبودMLMA+:
فرض کنيد تعدادn+1 عدد داده شده است.
+MLMA الگوریتم 1.4
بهبودMLMA+:
+MLMA الگوریتم 1.4
در 1 به 0تبدیل st0
0 به 1تبدیل v0بزرگتر از •
th و بزرگتر از v0کوچکتر از •
اديرFترين مقFه بزرگFبراي اينک v اديرFمق کوچکFترين بايFد آوريم بدسFت را تبدیل کنیم.0بزرگتر از آستانه را به
:مثال
+MLMA الگوریتم 1.4
:ارزیابی الگوریتم ه وFعيت اوليFايه از روي وضFعيت همسFر وضFت آوردن هFنيم بدسFرض مي کFف
واحد زماني است. p آن نيازمند Vمحاسبه نمره وندFيره شFتي ذخFاي بيFه هFايه در آرايFاي همسFعيت هFه وضFنيم کFرای فرض کFو ب
ذخيره هر نمره به بيت حافظه نياز داشته باشد.
+MLMA الگوریتم 1.4
زمان
حافظ ه
MLMA+
نسخه بهبود یافته
MLMA+
نسخه بهبود یافته
))()(( 22 pmnmn = )( 4nO
)3()3( pmn = )( 2nO
pmn
pmn
p3
+MLMA الگوریتم 1.4
0
5
10
15
20
25
10 20 30 40 50 60 70 80 90 100
x103
Dimension
Tim
e U
nit
s
Neighbor Search Improved Neighbor Search
0
2
4
6
8
10
12
14
10 20 30 40 50 60 70 80 90 100
x106
Dimension
Mem
ory
Usa
ge
(Byt
e)
Neighbor Search Improved Neighbor Search
مقايسه پيچيدگي زماني جستجوي همسايه و نسخه بهبود يافته آن
جستجوي همسايه و نسخه بهبود حافظه مصرفیمقايسه يافته آن
.دارای سه فاز است:فاز اول
O1
O2
[1]ماتریس همسایگی
[2]ماتریس همسایگی
[1]لیست پیوندی
[2]لیست پیوندی
]ماتریس شباهت نهایی[]ماتریس شباهت اولیه[بهبو
د
الگوریتم ساختاری2.4
الگوریتم ساختاری2.4
طFرواب اسFاس بFر همسFایه مFاتریس )'is-a'تشFکیل subclass اFي superclass ،)'equivalent' و 'disjoint '
الگوریتم ساختاری2.4
A
B
CD
B2B1
C1
D1 D2 D3
0001000000
0011000000
0101000000
1110010001
0000010000
0001100001
0000000010
0000000010
0000001101
0001010010
Neighbor
الگوریتم ساختاری2.4
122335
1533
3113
))((_ ANodelistLinked
14254
4143
312
))'((_ ANodelistLinked
)2()1()2,1(2
ceCharSequenlengthceCharSequenlengthceCharSequenceCharSequenscommonCharp
بدست آوردن ماتریس شباهت اولیه
:بهبود ماتریس شباهت اولیه بدست آمدهاگFر دو نFد از آنتولFوژي مبFدأ و مقصFد بFا هم شFبيه بودنFد مFيزان شFباهت همسFايه •
هاي آنها به اندازه يک مقدار داده شده افزايش مي يابد.باشFند • بFه هم آنتولFوژي هFاي مبFدأ و مقصFد داراي همسFايه شFبيه از نFد اگFر دو
ميزان شباهت آنها به اندازه افزايش مي يابد.اگFر دو نFد از آنتولFوژي مبFدأ و مقصFد داراي ويFژگي نFوع داده اي مشFترک باشFند، •
ميزان شباهت آنها براي يک داده شده به اندازه افزايش مي يابد.ارزیابی الگوریتم
الگوریتم ساختاری2.4
alignmentsexisting
alignmnetsfoundcorrectRecall
_#
__#
RecallPrecision
RecallPrecisionMeasureF
2
alignmentsfound
alignmnetsfoundcorrectprecision
_#
__#
الگوریتم ساختاری2.4
الگوریتم ترکیبی3.4
O1
O2
]ماتریس شباهت ساختاری[
]ماتریس شباهت نحوی[
]ماتریس شباهت نهایی[
وزن دهی
]ماتریس شباهت مفاهیم[
]ماتریس شباهت روابط[
]ماتریس شباهت ویژگی ها[
:شباهت نحوی
:مثال
الگوریتم ترکیبی3.4
),(max_),(tan1),(_ tslentscedistsSimilarityLexical
}"","","{")(__
}"","{")(__
"__"
""
ofpartistwordsofbag
OfPartswordsofbag
ofpartist
OfParts
}"{")(__
{})(__
istwordsofbags
swordsofbags
80.01021
)10,7max(
)"","("_1),(_
isdistancenLevenshteitssimilarityLexical
:ترکیب نتایجشباهت کالس:•
شباهت ویژگی های شی و داده:•oافزایش به اندازه بایاس
الگوریتم ترکیبی3.4
MatrixStructuralMatrixNCLexicalSimilarityesNamedClass ____
الگوریتم ترکیبی3.4
ارزیابی الگوریتم
اديرFوريتم داراي مقFد الگFان مي دهFائین نشFدول پFه جFه کFهمانگونprecision و recall ايFوريتم هFتر از الگFي به MapPSO، GeRoMe و SPIDER ت وFاس recall تر ازFي به
همه آنها دارد.
. پیشنهادات آتی5
با الگوریتم های نحوی و معنایی دیگر. ترکیب الگوريتم ساختاري پيشنهادي اقFانطب و فارسFي زبFان بFه آنتولFوژي انطبFاق بFراي هFايي الگFوريتم ارائFه
.آنتولوژي بين زبان فارسي و زبان انگليسي. معرفی و توسعه ابزارهايي براي وب معنايي در زبان فارسي
. مراجع6
1. D. Fensel, "Ontologies: A Silver Bullet for Knowledge Management and Electronic Commerce", Springer, New York, USA, 2001.
2. J. Davies, D. Fensel, and F. V. Harmelen, (Eds), "Towards the Semantic Web: Ontology Driven Knowledge Management", John Wiley & Sons, New York, 2003.
3. G. Stumme, A. Hotho, and B. Berendt, "Semantic Web Mining State of the art and future directions", Web Semantics: Science, Services and Agents on the World Wide Web, 4 (2006), pp. 124–143.
4. K. K. Breitman, M. A. Casanova, and W. Truszkowski, "Semantic Web: Concepts, Technologies and Applications", Springer Verlag, 2007.
5. N. F. Noy, and M. A. Musen, "PROMPT: Algorithm and tool for automated ontology merging and alignment", in Proc. 17th Natl. Conf. On Artificial Intelligence (AAAI2000), Austin, Texas, USA, 2000.
6. T. B. Passin, "Explorer’s Guide to the Semantic Web", Manning Publications Co: USA, 2004.
7. T. Berners-Lee, "Weaving the web: The Original Design and Ultimate Destiny of the World Wide Web by Its Inventor", New York: HarperCollins, 2000.
8. T. Pedersen, and S. Patwardhan, "WordNet::Similarity – Measuring the Relatedness of Concepts", In Proceedings of 19th National Conference on AI, San Jose, CA, 2004.
9. http://www.w3.org/2001/sw/.
10. www.w3.org/2001/sw/Activity.
11. R. S. Cost, et al, "ItTALKS: A Case Study in the Semantic Web and DAML", SWWS'01: The First Semantic Web Working Symposium, 2001.
50
با تشکربا تشکر