metode ruang vektor
TRANSCRIPT
-
8/18/2019 Metode Ruang Vektor
1/2
A. Metode Ruang Vektor1. Pengertian Ruang Vektor
Mandala (2002, hal: 3) menyatakan bahwa model sistem temu kembali
informasi menentukan detail sistem temu kembali informasi yaitu meliputi
representasi dokumen maupun query, fungsi pencarian (retrieval function) dan
notasi kesesuaian (relevance notation) dokumen terhadap query. Metode Ruang
ektor adalah suatu metode untuk merepresentasikan sistem temu kembali
informasi! "uatu sistem temu kembali informasi terdiri atas dua bagian, yaitu
penyimpanan dokumen dan pemrosesan query! #ntuk mengimplementasikan
metode ruang $ektor, diasumsikan sudah tersedia sekumpulan term yang dapat
mendeskripsikan kumpulan dokumen yang tersimpan dalam suatu sistem temu%kembali informasi! &aik 'uery maupun dokumen%dokumen yang disimpan,
dinyatakan dalam bentuk $ector ("alton, *)! Misalkan terdapat se+umlah n kata
yang berbeda sebagai kamus kata (vocabulary) atau indeks kata (terms index)!
ata%kata ini akan membentuk ruang $ektor yang memiliki dimensi sebesar n!
"etiap kata i dalam dokumen atau 'uery diberikan bobot sebesar wi! &aik
dokumen maupun 'uery direpresentasikan sebagai $ektor berdimensi n!
-enginde
a. Pengindeks- an DokumenPengindeks-an dokumen di bagi menjadi 3 tahapan yaitu.- Parsing
mengambil term%term dari dokumen dan 'uery dengan cara memotong
string input berdasarkan tiap kata yang menyusunnya (.usiana et al,
200*)! /lemen teks (string input) dipisahkan dengan teknik parsing
menggunakan fungsi split dimana pemisahan string dilakukan
berdasarkan white space (spasi dan tab) untuk kemudian diletakkan
pada array
- "topward Remo$ingmenghilangkan stopword pada string input yang menyusun dokumen
dan 'uery, contoh:
#ser could find rele$ant information by using search engine!
ilakukan parsing:
-
8/18/2019 Metode Ruang Vektor
2/2
Dalam proses ini digunakan sebuah daftar kata buang
(stoplist) yaitu daftar kata-kata yang tidak digunakan
(dibuang) karena tidak signikan dalam membedakan
dokumen atau query. Stoplist ini terdiri atas !" kata#
umumnya berupa kata tugas# kata hubung# kata bantu# yang
mempunyai fungsi dalam kalimat penyusun dokumen tetapi
tidak memiliki arti. Daftar stop$ord terlampir bersama
dengan listing programProses yang dilakukan dalam tahap penghilangan
stopword ini adalah%
b. Pembobotan&. Similarity measure