predstavitev raziskovalnega dela v laboratoriju za heterogene računalniške sisteme
DESCRIPTION
Predstavitev raziskovalnega dela v Laboratoriju za heterogene računalniške sisteme. Milan Ojsteršek. Cilj. - PowerPoint PPT PresentationTRANSCRIPT
Predstavitev raziskovalnega dela v Laboratoriju za heterogene računalniške sisteme
Milan Ojsteršek
Cilj
• Zgraditi sistem, ki bo znal iz domensko specifičnih strukturiranih in nestrukturiranih vsebin izluščiti znanje, ki bo se bo uporabljalo pri pomenskem iskanju in odgovarjanju na vprašanja v naravnem jeziku.
Glavna področja raziskovanja
• Ogrodje za gradnjo pomenskih slovarjev– uporabniški vmesnik za prikaz in podsodabljanje pomenskih
slovarjev, – uporabnikov pomenski označevalnik,– uporaba algoritma COALS in algoritmov za določanje
kolokacij pri dopolnjevanju pomenskih slovarjev.• Razločevanje večpomenskosti in pomenski
označevalnik.• Priporočilni sistem in sistem za pomensko iskanje ter
sistem za odgovarjanje na vprašanja v naravnem jeziku.• Detekcija plagiatov.• Digitalna knjižnica.
Infrastruktura, ki smo jo vzpostavili
• POS označevalniki: Slovenski, Nemški , Angleški
• Iskalnik konkordanc• Različni algoritmi za določanje kolokacij• Orodje za gradnjo pomenskih slovarjev• Pomensko označevanje• Korpus slovenskih strokovnih besedil • Sistem za vsebinsko priporočanje
Pomensko označevanje
Teme besedila – Pomenski podpis
Uporaba pomenskega podpisa
• Pomoč pri ugotavljanju pomena večpomenskih besedmih zvez.
• Ugotavljanje podobnosti posameznih odsekov besedil v različnih dokumentih.
• Gručenje dokumentov pri priporočanju vsebin.• Rangiranje dokumentov pri iskanju
(nestrukturirani in strukturirani viri).• Avtomatska klasifikacija dokumentov.