ontology matching

50
ی وژ ل و ت ن ر آ ب ی ن ت ب م ی ی ا ب ع م رآی وب ب ی م ت ن وژ گ ل ه آ آژآئ ری کب ل آ ب ع ما س ده : آ ب ت ک ه آژآئ4 ان ب ح7 ت ف ر کب ما: د ت ه اد ژآ ب س آ

Upload: ismail-akbari

Post on 26-Dec-2014

572 views

Category:

Documents


5 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Ontology matching

ارائه الگوریتمی برای وب معنایی مبتنی بر آنتولوژی

ارائه کننده : اسماعيل اکبرياستاد راهنما: دکتر فتحیان

Page 2: Ontology matching

2

ساختارساختارکلیکلی

مقدمه

وب معنایی

الگوریتم آنتولوژیها و نتایج

پیشنهادات آتی

مراجع

مقدمه1.

2

فهرسفهرست ت

مطالبمطالب

مقدمه

وب معنایی

الگوریتم آنتولوژیهای

پیشنهادی

پیشنهادات آتی

مراجع

مقدمه1.

Page 3: Ontology matching

3

مقدمه

وب معنایی

آنتولوژیالگوریتم

های پیشنهادی

پیشنهادات

آتی

مراجعظهور

اصول

فهرست فهرست مطالبمطالب

چارچوب

وب معنایی2.

Page 4: Ontology matching

ظهور وب معنایی1.2

4

ده دا

ادزی

م حج

داده ساخت نیافته

قابل درک

چرانه؟

ییاب

رز، ا

یرس

تف

دسته بندی، انتخاب

ثاع

ب

Page 5: Ontology matching

ظهور وب معنایی1.2

5

چرا کامپیوترها نمی توانند این کار را برای ما انجام دهند؟یکی از دالیلش این است که صفحات وب شامل •

oاطالعاتی راجع به خودشانoاطالعاتی راجع به محتویاتشانo اطالعاتی راجع به موضوعی که حاوی مطلب در مورد آن هستندo... و

نیستند. مثال: جستجوی کتابTCP/IPدر یک کتابخانه

Page 6: Ontology matching

.همان وضعیتی است که در وب نحوی با آن روبرو هستیم D این دقیقا عهFراد توسFات بين افFادل اطالعFتب ابFزاري بFراي اينکFه وب بFه عنFوان نتيجFه

يافته است تا براي ماشين ها. فحهFک صFات درون يFني اطالعFه معFايي، کFواي معنFد آن، محتFوان پيامFبه عن

وب اسFت، بFه گونFه اي کFد شFده اسFت کFه تنهFا بFراي انسFان قابFل اسFتفاده است.

ارتFاییعبFانگر این وب معنFيز بیFا نFه کامپيوترهFت کFدگاه اسFد بديFد تواننFمانن داده هاي روي وب را پيدا کرده، خوانده، درک و استفاده کنند.انسان

هFت کFازي اسFاي تواناسFوژي هFتانداردها و تکنولFعه اسFايي توسFهدف وب معن فهم بيشFتر اطالعFات روي وب طFراحي بFه منظFوربFراي کمFک بFه ماشFين هFا

شده اند.

ظهور وب معنایی1.2

Page 7: Ontology matching

7

مقدمه

وب معنایی

آنتولوژیالگوریتم

های پیشنهادی

پیشنهادات

آتی

مراجعظهور

اصول

فهرست فهرست مطالبمطالب

چارچوب

اصول وب معنایی2.2

Page 8: Ontology matching

اصول وب معنایی2.2

هر چیزی می تواند توسط 1اصل :URIها شناسایی شود به افFراد، مکFان هFا و چيزهFا در دنيFاي فFيزيکي مي تFوان در وب معنFايي •

بوسيله شناسه هاي گوناگون رجوع کرد

8

Page 9: Ontology matching

اصول وب معنایی2.2

منابع و لينک ها مي توانند داراي نوع باشند2اصل :

9

وب کنونی وب معنایی

Page 10: Ontology matching

اصول وب معنایی2.2

تکامل پشتيباني مي شود3اصل :.

10

اطالعات کنونی

اطالعات قدیمی

Page 11: Ontology matching

11

مقدمه

وب معنایی

آنتولوژیالگوریتم

های پیشنهادی

پیشنهادات

آتی

مراجعظهور

اصول

فهرست فهرست مطالبمطالب

چارچوب

چارچوب وب معنایی3.2

Page 12: Ontology matching

چارچوب وب معنایی3.2

:مراحل زیر مسیری را نشان می دهد که وب معنایی در پیش گرفته است مشترک برای جمالت قابل فهم توسط ماشینsyntaxفراهم کردن 1.( مشترکvocabulariesساختن لغات )2.توافق بر روی یک زبان منطقی3.استفاده از زبان برا ی تبادل اثبات ها4.

رای وبFه ای را بFاختار الیFک سFایی یFیز وب معنFونی و نFترع وب کنFرزلی مخFای برنFآقمFعناییF پیشنFهاFد کردF.F این FساختFار مرFاحFلی کهF دFر باالF لیستF شFد رFا FمنعFکس می کند.

تکنولوژی های وب

ابرمتن

تکنولوژی های تکمیل شده وب معنایی

تکنولوژی های تکمیل نشده وب معنایی

Page 13: Ontology matching

13

فهرسفهرست ت

مطالبمطالب

مقدمه

وب معنایی

آنتولوژیالگوریتم

های پیشنهادی

پیشنهادات آتی

مراجع

نگاشت

ادغام

. آنتولوژی3

انطباق

Page 14: Ontology matching

،نوعيFوش مصFه ماننFد کFامپيوتر علFوم مختلFف هFاي حFوزه در هFا آنتولFوژي ...Fزار وFرم افFنF يFندسFمه F،اييFوب معنF ،بيعيFان طFزبF ازشFردFانش، پFايش دFنماFسFتفادFه شFدهF انFد. بنFابراين Fاين اFنتظFار وجFوFد داردF کFهF تعريFف هFاي مختلفي Fاز

آن وجود داشته باشد.

رمتFت فFوژي ممکن اسFک آنتولFه يFه اگرچFد کFان مي کننFپر بيFولد و جاسFاوشهاي مختلفي به خود بگيرد اما در هر حال شامل:

مجموعFه اي از اصFطالحات، توصFيفي از معFني آنهFا، ویFژگی هFا و بيFان اينکFه •چگونه اين اصطالحات با هم ارتباط دارند، است.

يومFکنسرسW3C رايFيفاتي بFامل توصFد شFا بايFوژي هFه آنتولFد کFنهاد مي کنFپيش عناصر زير باشند:

کالس ها )يا چيزها( در حوزه مورد نظر•ارتباطات بين اين چيزها•مشخصات يا ويژگي هايي که اين چيزها بايد داشته باشند.•

14

. آنتولوژی3

Page 15: Ontology matching

یک آنتولوژی نمونه

. آنتولوژی3

در آنتولوژي همه روابط دنياي واقعي مي تواند وجود داشته باشد

Page 16: Ontology matching

یک آنتولوژی نمونه

. آنتولوژی3

Name :String

Page 17: Ontology matching

.آنتولوژی هسته وب معنایی را تشکیل می دهد.آنتولوژی پیاده سازی عملی وب معنایی را به عهده داردواسطه گری آنتولوژی

به دنبال شناسايي شباهت ها•غلبه بر اختالفات بين آنتولوژي ها•آنهFا بين سيسFتم هFا و • بFه اشFتراک گFذاري به منظFور اسFتفاده مجFدد و

برنامه هايي است که از آنها استفاده مي کنند.واسطه گري آنتولوژي به سه زير حوزه

نگاشت آنتولوژي • ادغام آنتولوژي•انطباق آنتولوژيانطباق آنتولوژي •

تقسيم مي شود. ،اFه اين رويکردهFلي در همFايييک بحث اصFاني و شناسFيين همپوشFتع

بين مفاهيم، روابط، ويژگي ها و نمونه ها در آنتولوژي هاي مختلف است.

. آنتولوژی3

Page 18: Ontology matching

18

فهرسفهرست ت

مطالبمطالب

مقدمه

وب معنایی

آنتولوژیالگوریتم

های پیشنهادی

پیشنهادات آتی

مراجع

نگاشت

ادغام

نگاشت آنتولوژی1.3

انطباق

Page 19: Ontology matching

الFه دنبFوژي بFت آنتولFايشنگاشFت نمFوژي هاسFده بين آنتولFه شFاي يافتFتناظره )خروجی شکل زیر(.

نگاشت آنتولوژی1.3

O1

O2

ورودی

کشف نگاشت خروجی

نگاشت

قواعد نگاشت

استفاده از آنتولوژی واسطآنتولوژی واسط ترکیبی از

آنتولوژی های ورودی• قواعد )پل های( نگاشت•

Page 20: Ontology matching

20

فهرسفهرست ت

مطالبمطالب

مقدمه

وب معنایی

آنتولوژیالگوریتم

های پیشنهادی

پیشنهادات آتی

مراجع

نگاشت

ادغام

ادغام آنتولوژی2.3

انطباق

Page 21: Ontology matching

وژيFردن آنتولFام کFا ادغFد بFوژي جديFک آنتولFاد يFعي در ايجFوژي سFام آنتولFادغهاي موجود دارد.

دو رویکردجایگزینی آنتولوژی های ورودی با آنتولوژی جدید برای مثال الگوریتمPROMPT

ادغام آنتولوژی2.3

O1

O2

ورودی

ادغام خروجی

Page 22: Ontology matching

. در روش دوم آنتولوژي هاي اوليه با يک آنتولوژي جديد جايگزين نمي شوند وان ورودي ميFه عنFه را بFاي اوليFوژي هFه آنتولFود کFاد مي شFل ايجFوژي پFک آنتولFه يFبلک

گيرد و ادغام بين آنتولوژي ها را با استفاده قواعد پل نشFان مي دهد. برای نمونه الگوریتمOnto-Merge

ادغام آنتولوژی2.3

O1 O2

آنتولوژی پل

آنتولوژی ورودی

آنتولوژی ورودی

قواعد پل

Page 23: Ontology matching

23

فهرسفهرست ت

مطالبمطالب

مقدمه

وب معنایی

آنتولوژیالگوریتم

های پیشنهادی

پیشنهادات آتی

مراجع

نگاشت

ادغام

انطباق آنتولوژی3.3

انطباق

Page 24: Ontology matching

کشف تناظر بين آنتولوژي ها ايFوژي هFآنتول نتيجFه عمFل انطبFاق، شناسFايي شFباهت بين موجFوديت هFاي

داده شده است. )ای داده ایFژگی هFوی( اي کالسFژگي هFوي ،)ومFا کالس )مفهFوديت هFاين موج

و روابط بين دو کالس )ویژگی های شی ای( هستند.

انطباق آنتولوژی3.3

Page 25: Ontology matching

الگوریتم های سه حوزه آنتولوژی4.3

n-gram فاصله ويرايش پسوند

واسطه گري آنتولوژي

انطباق آنتولوژي

منبع زبان شناختي عمومي

پيشوند

نگاشت آنتولوژيادغام

آنتولوژي

ايجاد آنتولوژي جديدترکيبي ساختاري معنايي نحوي

منبع زبان شناختي خاص

استفاده از قواعد نگاشت

الگوريتم هاي مختلف واسطه گري آنتولوژي

Page 26: Ontology matching

الگوریتم های سه حوزه آنتولوژی4.3

Page 27: Ontology matching

الگوریتم های سه حوزه آنتولوژی4.3

Page 28: Ontology matching

الگوریتم های سه حوزه آنتولوژی4.3

Page 29: Ontology matching

29

ساختارساختارکلیکلی

وب معنایی

آنتولوژی

پیشنهادات آتی

مراجع

29

فهرسفهرست ت

مطالبمطالب

وب معنایی

آنتولوژی

پیشنهادات آتی

مراجعوب

معنایی

الگوریتم های پیشنهادی.4

الگوریتم های

پیشنهادی

MLMA+ساختاری

ترکیبی

Page 30: Ontology matching

+MLMA الگوریتم 1.4

.دارای سه فاز است:فاز اول

O1

O2

ورودی

[LEVENSHTEIN]

[WORDNET]

]ماتریس شباهت نحوی[

]ماتریس شباهت معنایی[

نرمال سازی

[st0]وضعیت اولیه [L]ماتریس شباهت اولیه اعمال آستانه

th =0.45

خروجی اولیه

Page 31: Ontology matching

+MLMA الگوریتم 1.4

فاز دوم

حذف یا اضافه کردن یک نگاشت ایجاد وضعیت های کاندید

vمحاسبه نمره

[st0]وضعیت اولیه

n

i

m

j

n

i

m

j

thjiMapjiLjiMap

kLMapv

1 110

1 110

10

.),(/),().,(

/).(

Page 32: Ontology matching

:فاز سوم االیFد بFداري حFيله نگهFده بوسFاد شFاي ايجFايه هFدادي از همسFردن تعFتر کFفيلx%

را دارند.vاز وضعيت هايي که بیشترین مقدار )تFاختاري اسFباهت سFار شFک معيFه يFدي را )کFطح بعFباهت سFار شFوريتم معيFالگ

آنهFا بين اFز بهFتFرين FوضFعيت FاFت اعFمFال ميF شFود باFقيمانFده هFاي بFهF وضFعFيت بدست آيد.

مشکالتMLMA+

ايجاد وضعيت هاي همسايه بسيار زياد و در عين حال تصادفي•ايجاد وضعيت هاي همسايه زيادي که از وضعيت اوليه بدتر هستند•در نظر نگرفتن وضعيت اوليه به عنوان يک وضعيت کانديد•جفت موجFوديت منطبFق شFده k-1يFا k+1وضFعيت هFاي همسFايه داراي •

kجفت همFواره از وضFعيت اوليFه بFدتر انFد ) k+1هسFتند کFه وضFعيت هFاي بFا (.تعداد نگاشت های یافته شده

+MLMA الگوریتم 1.4

Page 33: Ontology matching

بهبودMLMA+:

فرض کنيد تعدادn+1 عدد داده شده است.

+MLMA الگوریتم 1.4

Page 34: Ontology matching

بهبودMLMA+:

+MLMA الگوریتم 1.4

در 1 به 0تبدیل st0

0 به 1تبدیل v0بزرگتر از •

th و بزرگتر از v0کوچکتر از •

اديرFترين مقFه بزرگFبراي اينک v اديرFمق کوچکFترين بايFد آوريم بدسFت را تبدیل کنیم.0بزرگتر از آستانه را به

Page 35: Ontology matching

:مثال

+MLMA الگوریتم 1.4

Page 36: Ontology matching

:ارزیابی الگوریتم ه وFعيت اوليFايه از روي وضFعيت همسFر وضFت آوردن هFنيم بدسFرض مي کFف

واحد زماني است. p آن نيازمند Vمحاسبه نمره وندFيره شFتي ذخFاي بيFه هFايه در آرايFاي همسFعيت هFه وضFنيم کFرای فرض کFو ب

ذخيره هر نمره به بيت حافظه نياز داشته باشد.

+MLMA الگوریتم 1.4

زمان

حافظ ه

MLMA+

نسخه بهبود یافته

MLMA+

نسخه بهبود یافته

))()(( 22 pmnmn = )( 4nO

)3()3( pmn = )( 2nO

pmn

pmn

p3

Page 37: Ontology matching

+MLMA الگوریتم 1.4

0

5

10

15

20

25

10 20 30 40 50 60 70 80 90 100

x103

Dimension

Tim

e U

nit

s

Neighbor Search Improved Neighbor Search

0

2

4

6

8

10

12

14

10 20 30 40 50 60 70 80 90 100

x106

Dimension

Mem

ory

Usa

ge

(Byt

e)

Neighbor Search Improved Neighbor Search

مقايسه پيچيدگي زماني جستجوي همسايه و نسخه بهبود يافته آن

جستجوي همسايه و نسخه بهبود حافظه مصرفیمقايسه يافته آن

Page 38: Ontology matching

.دارای سه فاز است:فاز اول

O1

O2

[1]ماتریس همسایگی

[2]ماتریس همسایگی

[1]لیست پیوندی

[2]لیست پیوندی

]ماتریس شباهت نهایی[]ماتریس شباهت اولیه[بهبو

د

الگوریتم ساختاری2.4

Page 39: Ontology matching

الگوریتم ساختاری2.4

Page 40: Ontology matching

طFرواب اسFاس بFر همسFایه مFاتریس )'is-a'تشFکیل subclass اFي superclass ،)'equivalent' و 'disjoint '

الگوریتم ساختاری2.4

A

B

CD

B2B1

C1

D1 D2 D3

0001000000

0011000000

0101000000

1110010001

0000010000

0001100001

0000000010

0000000010

0000001101

0001010010

Neighbor

Page 41: Ontology matching

الگوریتم ساختاری2.4

122335

1533

3113

))((_ ANodelistLinked

14254

4143

312

))'((_ ANodelistLinked

)2()1()2,1(2

ceCharSequenlengthceCharSequenlengthceCharSequenceCharSequenscommonCharp

بدست آوردن ماتریس شباهت اولیه

Page 42: Ontology matching

:بهبود ماتریس شباهت اولیه بدست آمدهاگFر دو نFد از آنتولFوژي مبFدأ و مقصFد بFا هم شFبيه بودنFد مFيزان شFباهت همسFايه •

هاي آنها به اندازه يک مقدار داده شده افزايش مي يابد.باشFند • بFه هم آنتولFوژي هFاي مبFدأ و مقصFد داراي همسFايه شFبيه از نFد اگFر دو

ميزان شباهت آنها به اندازه افزايش مي يابد.اگFر دو نFد از آنتولFوژي مبFدأ و مقصFد داراي ويFژگي نFوع داده اي مشFترک باشFند، •

ميزان شباهت آنها براي يک داده شده به اندازه افزايش مي يابد.ارزیابی الگوریتم

الگوریتم ساختاری2.4

alignmentsexisting

alignmnetsfoundcorrectRecall

_#

__#

RecallPrecision

RecallPrecisionMeasureF

2

alignmentsfound

alignmnetsfoundcorrectprecision

_#

__#

Page 43: Ontology matching

الگوریتم ساختاری2.4

Page 44: Ontology matching

الگوریتم ترکیبی3.4

O1

O2

]ماتریس شباهت ساختاری[

]ماتریس شباهت نحوی[

]ماتریس شباهت نهایی[

وزن دهی

]ماتریس شباهت مفاهیم[

]ماتریس شباهت روابط[

]ماتریس شباهت ویژگی ها[

Page 45: Ontology matching

:شباهت نحوی

:مثال

الگوریتم ترکیبی3.4

),(max_),(tan1),(_ tslentscedistsSimilarityLexical

}"","","{")(__

}"","{")(__

"__"

""

ofpartistwordsofbag

OfPartswordsofbag

ofpartist

OfParts

}"{")(__

{})(__

istwordsofbags

swordsofbags

80.01021

)10,7max(

)"","("_1),(_

isdistancenLevenshteitssimilarityLexical

Page 46: Ontology matching

:ترکیب نتایجشباهت کالس:•

شباهت ویژگی های شی و داده:•oافزایش به اندازه بایاس

الگوریتم ترکیبی3.4

MatrixStructuralMatrixNCLexicalSimilarityesNamedClass ____

Page 47: Ontology matching

الگوریتم ترکیبی3.4

ارزیابی الگوریتم

اديرFوريتم داراي مقFد الگFان مي دهFائین نشFدول پFه جFه کFهمانگونprecision و recall ايFوريتم هFتر از الگFي به MapPSO، GeRoMe و SPIDER ت وFاس recall تر ازFي به

همه آنها دارد.

Page 48: Ontology matching

. پیشنهادات آتی5

با الگوریتم های نحوی و معنایی دیگر. ترکیب الگوريتم ساختاري پيشنهادي اقFانطب و فارسFي زبFان بFه آنتولFوژي انطبFاق بFراي هFايي الگFوريتم ارائFه

.آنتولوژي بين زبان فارسي و زبان انگليسي. معرفی و توسعه ابزارهايي براي وب معنايي در زبان فارسي

Page 49: Ontology matching

. مراجع6

1. D. Fensel, "Ontologies: A Silver Bullet for Knowledge Management and Electronic Commerce", Springer, New York, USA, 2001.

2. J. Davies, D. Fensel, and F. V. Harmelen, (Eds), "Towards the Semantic Web: Ontology Driven Knowledge Management", John Wiley & Sons, New York, 2003.

3. G. Stumme, A. Hotho, and B. Berendt, "Semantic Web Mining State of the art and future directions", Web Semantics: Science, Services and Agents on the World Wide Web, 4 (2006), pp. 124–143.

4. K. K. Breitman, M. A. Casanova, and W. Truszkowski, "Semantic Web: Concepts, Technologies and Applications", Springer Verlag, 2007.

5. N. F. Noy, and M. A. Musen, "PROMPT: Algorithm and tool for automated ontology merging and alignment", in Proc. 17th Natl. Conf. On Artificial Intelligence (AAAI2000), Austin, Texas, USA, 2000.

6. T. B. Passin, "Explorer’s Guide to the Semantic Web", Manning Publications Co: USA, 2004.

7. T. Berners-Lee, "Weaving the web: The Original Design and Ultimate Destiny of the World Wide Web by Its Inventor", New York: HarperCollins, 2000.

8. T. Pedersen, and S. Patwardhan, "WordNet::Similarity – Measuring the Relatedness of Concepts", In Proceedings of 19th National Conference on AI, San Jose, CA, 2004.

9. http://www.w3.org/2001/sw/.

10. www.w3.org/2001/sw/Activity.

11. R. S. Cost, et al, "ItTALKS: A Case Study in the Semantic Web and DAML", SWWS'01: The First Semantic Web Working Symposium, 2001.

Page 50: Ontology matching

50

با تشکربا تشکر