metode ruang vektor

Upload: yan-cita-bagoez

Post on 06-Jul-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 Metode Ruang Vektor

    1/2

    A. Metode Ruang Vektor1. Pengertian Ruang Vektor

    Mandala (2002, hal: 3) menyatakan bahwa model sistem temu kembali

    informasi menentukan detail sistem temu kembali informasi yaitu meliputi

    representasi dokumen maupun query, fungsi pencarian (retrieval function) dan

    notasi kesesuaian (relevance notation) dokumen terhadap query. Metode Ruang

    ektor adalah suatu metode untuk merepresentasikan sistem temu kembali

    informasi! "uatu sistem temu kembali informasi terdiri atas dua bagian, yaitu

     penyimpanan dokumen dan pemrosesan query! #ntuk mengimplementasikan

    metode ruang $ektor, diasumsikan sudah tersedia sekumpulan term yang dapat

    mendeskripsikan kumpulan dokumen yang tersimpan dalam suatu sistem temu%kembali informasi! &aik 'uery maupun dokumen%dokumen yang disimpan,

    dinyatakan dalam bentuk $ector ("alton, *)! Misalkan terdapat se+umlah n kata

    yang berbeda sebagai kamus kata (vocabulary) atau indeks kata (terms index)!

    ata%kata ini akan membentuk ruang $ektor yang memiliki dimensi sebesar n!

    "etiap kata i dalam dokumen atau 'uery diberikan bobot sebesar wi! &aik 

    dokumen maupun 'uery direpresentasikan sebagai $ektor berdimensi n!

    -enginde

    a. Pengindeks- an DokumenPengindeks-an dokumen di bagi menjadi 3 tahapan yaitu.- Parsing

    mengambil term%term dari dokumen dan 'uery dengan cara memotong

    string input berdasarkan tiap kata yang menyusunnya (.usiana et al,

    200*)! /lemen teks (string input) dipisahkan dengan teknik parsing

    menggunakan fungsi split dimana pemisahan string dilakukan

     berdasarkan white space (spasi dan tab) untuk kemudian diletakkan

     pada array

    - "topward Remo$ingmenghilangkan stopword pada string input yang menyusun dokumen

    dan 'uery, contoh:

    #ser could find rele$ant information by using search engine!

    ilakukan parsing:

  • 8/18/2019 Metode Ruang Vektor

    2/2

    Dalam proses ini digunakan sebuah daftar kata buang

    (stoplist) yaitu daftar kata-kata yang tidak digunakan

    (dibuang) karena tidak signikan dalam membedakan

    dokumen atau query. Stoplist ini terdiri atas !" kata#

    umumnya berupa kata tugas# kata hubung# kata bantu# yang

    mempunyai fungsi dalam kalimat penyusun dokumen tetapi

    tidak memiliki arti. Daftar stop$ord terlampir bersama

    dengan listing programProses yang dilakukan dalam tahap penghilangan

    stopword ini adalah%

    b. Pembobotan&. Similarity measure