skripsi diajukan untuk memenuhi salah satu syarat...
TRANSCRIPT
SISTEM PEMEROLEHAN INFORMASI UNTUK PENCARIAN BUKU
SEKOLAH ELEKTRONIK MENGGUNAKAN INVERTED INDEX
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Diajukan oleh:
Satrio Bagus Wicaksono (135314083)
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2018
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
i
SISTEM PEMEROLEHAN INFORMASI UNTUK PENCARIAN BUKU
SEKOLAH ELEKTRONIK MENGGUNAKAN INVERTED INDEX
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Diajukan oleh:
Satrio Bagus Wicaksono (135314083)
PROGRAM STUDI TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2018
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
INFORMATION RETRIEVAL SYSTEM TO SEARCH ELECTRONIC SCHOOL
BOOK USING INVERTED INDEX
THESIS
Presented as Partial Fulfillment of the Requirements
to Obtain Sarjana Komputer Degree
in Informatics Engineering Study Program
By:
Satrio Bagus Wicaksono (135314083)
INFORMATICS ENGINEERING STUDY PROGRAM
INFORMATICS ENGINEERING DEPARTMENT
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2018
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
HALAMAN PERSEMBAHAN “Bersukacitalah dalam pengharapan, sabarlah dalam kesesakan, dan bertekunlah
dalam doa “
Roma 12:12
Karya ini kupersembahkan kepada :
Tuhan Yesus Kristus
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
ABSTRAK
BSE atau buku sekolah elektronik merupakan sebuah inovasi pembelajaran melalui dunia elektronik khususnya internet untuk mempermudah siswa untuk belajar tanpa harus membuka buku aslinya.BSE tercetus karena melihat konsumsi internet saat ini sangat banyak maka dibuat sistem pembelajaran yang mengikuti teknologi yang ada. Salah satu website yang menggunakan BSE adalah www.bse.kemdikbud.co.id. Sebelum adanya sistem pemerolehan informasi buku sekolah elektronik, pengunjung website masih kesusahan dalam mencari kata kunci yang tidak berurutan. Sistem pemerolehan informasi yang dibangun menggunakan struktur data inverted index dengan linkedlist menawarkan kelebihan dalam membantu pengguna untuk mencari judul buku yang diinginkan.
Struktur data inverted index yang dibangun dengan linkedlist menggunakan model boolean dapat mencari 2 keyword dengan kemunculan kata yang tidak berurutan di dalam judul buku. Hasil yang didapat yaitu pengguna dapat mencari judul buku yang diinginkan walaupun kata yang ditulis tidak berurutan. Selain itu, ditemukan perbedaan antara sistem pemerolehan informasi dengan sistem pencarian yang terdapat di dalam website www.bse.kemdikbud.co.id adalah sistem pencarian pada website www.bse.kemdikbud.co.id tidak bisa menemukan kata kunci yang tidak berurutan.
Kata kunci: inverted index, linkedlist, sistem pencarian
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
ABSTRACT BSE or electronic school books is a learning innovation through the world
of electronics, especially the internet to facilitate students to learn without having to open the original book .. Seeing the current internet consumption is overwhelming BSE made a learning system that follows the existing technology. One of the websites that use BSE is www.bse.kemdikbud.co.id. Prior to the electronic school book information retrieval system, website visitors are still difficult to find keywords that are not in order. The information retrieval system was built using an inverted index data structure with linkedlist. this system offers advantages in helping users to find the desired title of the book.
Inverted index data structure built with linkedlist using boolean model. this model can search 2 keywords with the appearance of unordered words in the title of the book. The results obtained are, the user can search for the desired title of the title even though the unordered words. In addition, the writer found the difference between this information retrieval with the search system contained in the website www.bse.kemdikbud.co.id can't find keywords that are not sequential.
Kata kunci: inverted index, linkedlist, information retrieval
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
DAFTAR ISI
HALAMAN PERSETUJUAN ............................................ Error! Bookmark not defined.
HALAMAN PENGESAHAN SKRIPSI ............................. Error! Bookmark not defined.
HALAMAN PERSEMBAHAN .......................................................................................... iv
PERNYATAAN KEASLIAN KARYA .............................. Error! Bookmark not defined.
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH UNTUK
KEPENTINGAN AKADEMIS ........................................... Error! Bookmark not defined.
ABSTRAK ........................................................................................................................ viii
ABSTRACT ........................................................................................................................ ix
KATA PENGANTAR ......................................................... Error! Bookmark not defined.
Bab 1 ..................................................................................................................................... 1
1. Latar Belakang .......................................................................................................... 1
2. Rumusan masalah ..................................................................................................... 2
BAB II .................................................................................................................................. 5
2.1. Pemerolehan Informasi ......................................................................................... 5
2.2 Logical View Pada Document ............................................................................... 6
2.3 Inverted index ....................................................................................................... 7
2.4. Struktur Data ........................................................................................................ 9
2.5 Precision dan Recall ............................................................................................. 9
3.1 Gambaran Umum Penelitian .......................................................................... 10
3.2 Sumber Data ................................................................................................... 10
3.3 Spesifikasi Alat ............................................................................................... 10
3.4 Tahap-Tahap Penelitian ........................................................................................ 11
Bab IV Analisa Dan Perancangan Sistem .......................................................................... 14
4.1. Gambaran Umum Sistem Lama .............................................................................. 14
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
4.2 Gambaran Umum Sistem Baru ................................................................................. 14
4.3 Analisis Kebutuhan Pengguna .................................................................................. 16
4.3.1 Use Case Diagram ............................................................................................. 16
4.3.2 Skenario Use Case ............................................................................................. 17
4.3.3 Perancangan Database ................................................................................ 19
4.4 Perancangan Fisikal ......................................................................................... 21
4.5 Rancangan Struktur Data Inverted Index ............................................................ 23
4.6 Algoritma Model Boolean operator AND ................................................................ 24
4.7 Rancangan Desain Antarmuka ................................................................................. 25
BAB V ................................................................................................................................ 28
IMPLEMENTASI DAN ANALISIS HASIL ..................................................................... 28
5.1 Implementasi Antar Muka (Interface) ................................................................ 28
5.2 Implementasi inverted index ............................................................................... 29
5.3 Perbandingan Relevansi Hasil Pencarian Judul Buku .............................................. 31
BAB VI ............................................................................................................................... 43
KESIMPULAN DAN SARAN ...................................................................................... 43
6.1 Kesimpulan ........................................................................................................... 43
6.2 Saran .................................................................................................................... 43
DAFTAR PUSTAKA ......................................................................................................... 45
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1
Bab 1
Pendahuluan 1. Latar Belakang
BSE atau buku sekolah elektronik merupakan sebuah inovasi
pembelajaran melalui dunia elektronik khususnya internet untuk
mempermudah siswa untuk belajar tanpa harus membuka buku aslinya. Yaitu
cukup membuka dan membaca dengan cara online. BSE tercetus karena
melihat konsumsi internet saat ini sangat banyak maka dibuat sistem
pembelajaran yang mengikuti teknologi yang ada.
Pada situs bse.kemdikbud.go.id ini memiliki permasalahan pada
pencarian judul buku. Contohnya jika seorang siswa akan memasukan judul
buku tetapi hanya mengetikan keyword kata pertama dan kata ketiga dari
judul tersebut, maka dalam pencarian judul buku itu tidak ditemukan.
Tetapi jika siswa tersebut mengetikan keyword kata pertama dan kedua dari
judul buku tersebut maka muncul judul buku yang sesuai dengan kata
pertama dan kedua tersebut.
Pemerintah membuat situs buku sekolah elektronik yaitu
bse.kemdikbud.go.id yang bertujuan agar Buku Sekolah Elektronik (BSE)
dapat di unduh secara gratis. Langkah Pertama untuk mengunduh buku
sekolah elektronik adalah dengan kita mengetikan buku yang ingin dicari
pada kolom pencarian maka akan muncul buku yang kita cari. Lalu jika
sudah muncul, unduh buku yang kita cari . Buku Sekolah Elektronik (BSE)
pada situs ini hanya untuk beberapa kalangan saja seperti SD, SMP, dan
SMA.
Penelitian yang berkaitan dengan pemerolehan informasi sudah
pernah dilakukan oleh Abdul Aziz (2015) tentang pemerolehan informasi
pencarian karya ilmiah menggunakan algoritma pembobotan TF-IDF
bertujuan pengukur tingkat similaritas antara dokumen dengan keyword
yang didapat dari ekstraksi teks pada dokumen sehingga mendapatkan data
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
yang terurut dari yang kemiripannya (tingkat similaritas) paling tinggi
sehingga pencarian karya ilmiah menjadi lebih efisien sebagai informasi
yang relevan.
Penelitian yang telah digunakan oleh Abdul Aziz (2015), akan
dilakukan juga pada kasus ini, tetapi sistem tidak menggunakan
pembobotan dan perangkingan melainkan menggunakan model boolean
sebagai alternatif lain dalam kasus ini.
Dengan permasalahan yang ditimbulkan diatas, sistem pemerolehan
informasi dengan model boolean diharapkan akan sesuai karena dapat
memudahkan siswa dalam mencari judul buku sekolah elektronik yang
mereka cari walaupun mereka hanya mengetikan kata pertama dan ketiga
saja.
2. Rumusan masalah
Dalam pemerolehan informasi tentang pencarian buku sekolah elektronik
ini terdapat masalah yang akan timbul seperti :
1. Bagaimana membuat sistem pemerolehan informasi metode model
Boolean untuk pencarian buku sekolah elektronik?
2. Sejauh mana hasil pencarian sistem pemerolehan informasi metode
model Boolean dalam menemukan buku yang lebih relevan
dibandingkan dengan hasil pencarian buku di website
bse.kemdikbud.co.id?
3. Tujuan Penulisan
Adapun tujuan dari penelitian tugas akhir ini adalah agar memudahkan
siswa dalam mencari buku sekolah elektronik yang mereka cari walaupun
mereka hanya mengetikan keyword yang tidak berurutan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
4. . Batasan Masalah
Beberapa hal berikut ini adalah batasan batasan masalah yang ada dalam
penelitian tugas akhir ini :
1. Pencarian buku sekolah elektronik berdasarkan judul buku.
2. Data yang diambil hanya 110 saja dari keseluruhan data dalam website
tersebut.
3. Data yang diambil terdiri dari Tingkat SD, SMP dan SMA.
5. Sistematika Penulisan
Penyusunan tugas akhir ini menggunakan kerangka pembahasan yang
tersusun sebagai berikut :
Bab I Pendahuluan
Memuat latar belakang, rumusan masalah, batasan masalah,Tujuan,
manfaat, sistematika penulisan dan jadwal penelitian.
Bab II Tinjauan Pustaka
Menguraikan teori dasar tentang pemerolehan informasi, struktur
data dan algoritma.
Bab III Metodologi Penelitian
Membahas metode yang digunakan dalam penelitian yang akan
digunakan
Bab IV Analisis dan Perancangan Sistem
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
Membahas penelitian yang dilakukan disertai dengan pembahasan
yang di dapat setelah melakukan penelitian
Bab V Implementasi Sistem dan Evaluasi
Membahas tentang implementasi dari Sistem yang telah dibuat
beserta evaluasi.
Bab VI Kesimpulan dan Saran
Pada bagian ini berisi tentang kesimpulan umum yang didapat dari
pembuatan sistem serta mengenai rancangan pengembangan sistem
lebih lanjut.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
BAB II
TINJAUAN PUSTAKA
2.1. Pemerolehan Informasi
Pemerolehan informasi merupakan proses yang terlibat
dalam representation, storage, pencarian, dan mendapatkan
informasi yang relevan untuk kebutuhan yang diperlukan pengguna
(Ingwersen,1992). Tipe dari informasi tersebut bisa berupa
dokumen, halaman web, katalog online, dan objek multimedia.
Seiring dengan perkembangan teknologi, pemerolehan informasi
sudah melibatkan pemodelan, pencarian web, visualisasi data,
penyaringan dan bahasa dalam memperoleh informasi yang relevan
(Baeza-Yates, 1999).
Tahap-tahap pemerolehan informasi menurut (Baeza-
Yates,1999) disajikan dalam Gambar 2.1 berikut ini:
Gambar 2.1 Proses Pemerolehan Informasi (Baeza-Yates,
1999)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
Terdapat lima (5) langkah dalam proses pemerolehan
informasi yang dijelaskan melalui Gambar 2.1. Tahap pertama
yaitu text operation yakni menghilangkan kata umum (stop words
removal), pencarian kata dasar (stemming), dan sebagainya. Sebagai
contoh kata umum dalam bahasa Indonesia adalah dan, di, ini, itu,
yang, dan lain-lain.
Tahap kedua adalah query operations seperti penggunaan
operator AND, OR, dan NOT pada query. Tahap ketiga yaitu
pengindeksan yang bertujuan untuk mempercepat proses pencarian.
Tahap keempat yaitu pencarian yang dilakukan pada inverted file
yang sudah dibangun. Tahap kelima adalah pembobotan (ranking)
terhadap dokumen yang diperoleh dari proses pencarian.
2.2 Logical View Pada Document
Dokumen-dokumen pada koleksi tertentu sering
digambarkan secara langsung melalui keyword (kata kunci).Kata
kunci tersebut diekstraksi langsung dari teks pada dokumen atau
dibuat secara manual oleh manusia.Kata kunci atau index term ini
menyediakan logical view dari dokumen.
Logical view dokumen merupakan gambaran proses dalam
membangun suatu rangkaian teks dalam dokumen. Untuk lebih jelas
dalam memahami logical view pada dokumen dari bentuk full text
menjadi indexing dapat dilihat pada Gambar 2.2 berikut ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
Gambar 2.2. Logical view dari dokumen: dari full text
menjadi sebuah indeks term (Baeza-Yates, 1999)
2.3 Inverted index
Inverted index atau inverted file merupakan struktur data
pokok yang terdapat dalam sistem pemerolehan informasi
(Büttcher-Clarke-Cormark, 2010). Tujuan adanya inverted index
adalah untuk mempercepat proses pencarian terms pada koleksi
dokumen (Grossman-Frieder, 2004).
Inverted index memiliki dua komponen pokok yaitu
dictionary dan posting lists.Dictionary menyimpan daftar kata,
sedangkan posting list menyimpan identitas dokumen yang
mengandung kata bersangkutan.
Contoh melakukan pengindeksan terhadap dokumen-
dokumen yang mengandung istilah tertentu dengan membuat
inverted index yang terdiri dari dictionary dan postings
digambarkan pada gambar 2.3 berikut:
Gambar 2.3 Inverted index(Manning, 2008)
Pada gambar 2.4 berikut merupakan gambaran secara
keseluruhan dari proses membangun inverted index (Manning,
2008):
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
Gambar 2.4 Membangun inverted index (Manning, 2008)
Di sebelah kiri pada gambar 2.4, terdapat beberapa istilah
yang disimpan dalam kolom term dan diurutkan sesuai abjad. Di
sebelah kolom term terdapat kolom docID yang menunjukkan
dokumen yang mengandung term tersebut.Sebelah kanan pada
gambar 2.4 menjelaskan bahwa istilah yang terdapat pada kolom
term dan docID dipisah ke dalam kolom term beserta doc. freq
(document frequency)dan disimpan dalam dictionary.
Dictionary berfungsi untuk menyimpan istilah-istilah dan
mempunyai pointer untuk menuju ke posting list pada setiap istilah.
Sedangkan posting list berfungsi untuk menyimpan list dari
dokumen yang mengandung istilah tertentu (Manning, 2008).
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
2.4. Struktur Data
Linked list adalah sekumpulan elemen bertipe sama, yang
mempunyai keterurutan tertentu, yang setiap elemennya terdiri dari
dua bagian Linked list juga merupakan suatu cara untuk menyimpan
data dengan struktur sehingga dapat secara otomatis menciptakan
suatu tempat baru untuk menyimpan data yang diperlukan. Struktur
ini lebih dinamis karena banyaknya elemen dengan mudah ditambah
atau dikurangi, berbeda dengan array yang ukurannya tetap.
Gambar 2.7 menggambarkan pengertian dari linked
list(Robert, 2003):
Gambar 2.7 Linked list (Robert, 2003)
Data yang satu terhubung pada link yang lain sehingga membentuk
seperti suatu rantai.
2.5 Precision dan Recall
Dalam pemerolehan informasi, keefektifan metode perlu diukur dan
dianalisis. untuk mengukur keefektifan metode precision dan recall.
Precision dan recall dirumuskan sebagai berikut (Manning,2008):
Precision = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙 𝑑𝑎𝑙𝑎𝑚 𝑝𝑒𝑛𝑐𝑎𝑟𝑖𝑎𝑛
........(2.4)
Recall = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑑𝑎𝑙𝑎𝑚 𝑑𝑎𝑡𝑎𝑏𝑎𝑠𝑒
........(2.5)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
Bab III
Metodologi Penelitian
3.1 Gambaran Umum Penelitian
Gambaran umum penelitian ini adalah siswa dapat
mengakses website bse.kemendikbud.go.id sistem pemerolehan informasi
untuk mencari buku yang mereka cari dengan memasukan judul buku.
Selain itu penelitian ini diharapkan dapat mencari judul buku dengan
mengetikan keyword secara tidak berurutan.
3.2 Sumber Data
Teknik pengumpulan data dilakukan dengan mengunduh data buku
sekolah elektronik yang dibutuhkan di website bse.kemdikbud.go.id untuk
Tingkat SD, SMP dan SMA.
3.3 Spesifikasi Alat
Sistem dibuat dengan minimal spesifikasi software dan
hardware sebagai berikut:
a. Spesifikasi Hardware
1) Prossesor Intel(R) Core(TM) i5-4200U CPU @1.60GHz (4 CPUs),
~2.3GHz
2) RAM 4 GB
3) Harddisk 750 GB.
b. Spesifikasi software:
- Windows 8 64 bit Operating System
- Compiler IDE NetBeans 8.0.2
- MySQL Database
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
3.4 Tahap-Tahap Penelitian 3.4.1 Studi Kasus
Kasus yang akan dipelajari adalah kebiasaan pengunjung
website bse.kemdikbud.go.id dalam melakukan pencarian buku
dengan mengetikkan keyword yang tidak berurutan maka hasil
pencarian tidak ditemukan.
3.4.2 Studi Pustaka
Studi pustaka yang dilakukan adalah mencari dan
memahami informasi-informasi beserta teori yang berkaitan dengan
materi pemerolehan informasi maupun struktur data linkedlist.
3.4.3 Pengembangan Perangkat Lunak
3.5.3.1 Metode Pengembangan Perangkat Lunak
Metode yang digunakan peneliti dalam
mengembangkan perangkat lunak adalah waterfall
.Pressman & Roger (2001) menuturkan bahwa metode
waterfall merupakan metode pengembangan perangkat
lunak yang dilakukan secara berurutan, dan kemajuan
dipantau secara terus menerus mengalir kebawah.Fase-fase
yang dilalui dalam pengembangan perangkat lunak metode
waterfall yaitu perencanaan, pemodelan, implementasi, dan
pengujian.
Gambaran alur proses dari metode waterfall dan disajikan
seperti berikut ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
Gambar 3.5.3 Alur metode waterfall (Pressman & Roger (2001))
Ada lima tahap yang digunakan dalam metode waterfall yaitu:
a. Analisa
Langkah ini merupakan analisa terhadap kebutuhan
sistem.Pengumpulan data dalam tahap ini bisa melalui wawancara, studi
literatur, dan studi kasus. Wawancara yang dilakukan adalah
mewawancarai pengunjung perpustakaan. Wawancara digunakan untuk
mencari informasi sebanyak mungkin dari pengguna sehingga system
pencarian yang dibuat sesuai dengan kebutuhan pengguna.
b. Design
Proses design adalah proses mengubah hasil analisa menjadi
representasi kebutuhan perangkat lunak yang dapat diprediksi bentuk
dan fungsinya sebelum diubah ke dalam bahasa pemrograman. Titik
focus pada proses ini terletak pada struktur data, arsitektur perangkat
lunak, tampilan user interface, dan algoritma.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
c. Implementasi
Implementasi merupakan proses penerjemahan dari desain ke dalam
bahasa pemrograman. Dalam tahap ini, programmer akan membangun
sistem yang dibutuhkan oleh pengguna.
d. Pengujian
Pengujian merupakan tahap yang dilalui setelah pengkodean
selesai.Tujuan dari pengujian adalah menguji kemampuan dan performa
dari sistem yang telah dibangun.Selain itu, pengujian juga bermanfaat
untuk menemukan kesalahan maupun error yang kemungkinan masih
dapat ditemukan dan selanjutnya dilakukan perbaikan.
e. Analisis Hasil
Analisis hasil merupakan tahap yang dilalui setelah melakukan
pengujian. Tujuan hasil analisis hasil adalah menganalisis hasil dari
sistem yang telah dibangun. Selain itu analisis hasil berguna untuk
mengetahui seberapa akurat dari hasil pencarian yang dilakukan oleh
pengguna. Dalam penelitian ini, recall dan precision digunakan untuk
mengevaluasi sistem pemerolehan informasi ini.
f. Pemeliharaan
Merupakan tahapan akhir dari metode waterfall.Sistem yang sudah
selesai dibangun dan melewati beberapa tahap kemudian dijalankan dan
dilakukan pemeliharaan.Pemeliharaan yang dimaksud adalah
meningkatkan performa dan perbaikan fitur-fitur yang mungkin masih
bisa terjadi error.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
Bab IV Analisa Dan Perancangan Sistem
4.1. Gambaran Umum Sistem Lama
Sistem Pemerolehan Informasi Buku Sekolah Elektronik sebuah website www.bse.kemdikbud.go.id dikembangkan untuk membantu siswa dalam mencari buku yang dibutuhkan. Namun, pada sistem yang terdapat pada website tersebut belum menerapkan Pemerolehan Informasi. Jika kita mengetikan kata yang tidak berurutan maka hasilnya tidak muncul.
4.2 Gambaran Umum Sistem Baru Sistem pemerolehan informasi yang baru sudah menerapkan Pemerolehan informasi model Boolean, yaitu cara membuktikannya adalah dengan mengetikan kata kunci yang tidak berurutan maka hasil tersebut muncul di halaman hasil pencarian. Pada proses pemerolehan informasi terdapat proses Stemming dan Stopwords tetapi pada sistem ini tidak digunakan karena alurnya dilakukan secara manual.
Arsitektur perancangan sistem pemerolehan informasi ini dengan
bersumber pada Gambar 4.1 tetapi ada beberapa perbedaan dalam prosesnya yaitu
tidak melakukan perangkingan. Perbedaan itu ditunjukkan dalam Gambar 4.2
berikut ini:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
Gambar 4. 2 Struktur Pemerolehan Informasi (Baeza-Yates,
1999)
Berdasarkan struktur tersebut, sistem melakukan text operation pada
koleksi judul BSE, berupa pembuangan kata.. Langkah selanjutnya sistem
melalukan indexing kata dan buku pada MySQL. Sistem mengambil index
dari MySQL ke random access memory secara periodik di dalam inverted
index .
Proses pencarian ini, melibatkan user untuk memasukkan pencarian
menggunakan query yang selanjutnya masuk pada tahap text processing.
Sistem akan melakukan pencarian pada inverted index kemudian
ditampilkan melalui user interface.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
4.3 Analisis Kebutuhan Pengguna
4.3.1 Use Case Diagram
Sistem ini diperuntukan kepada pengguna (user) sehingga use case
Diagram digambarkan sebagai berikut:
Gambar 4.3 Use Case Diagram
Sistem pemerolehan informasi buku sekolah sekolah elektronik diakses
oleh satu actor yaitu pengguna.Gambar Use Case diagram diatas dijelaskan dengan
tabel berikut ini:
Tabel 4.1 Keterangan Use Case Diagram
Aktor Keterangan
Pengguna 1. Dapat melakukan searching
buku sekolah elektronik.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
4.3.2 Skenario Use Case Tabel 4.2 Narasi Use Case Mencari Judul Buku Sekolah Elektronik
Nama Use Case Mencari Judul Buku
Sekolah Elektronik
Use-Case type
Business Requirements
ID Use Case 1
Prioritas Penting
Aktor Pengguna
Deskripsi Use case ini mendeskripsikan proses untuk pencarian
judul buku sekolah elektronik
Pra Kondisi Halaman Utama
Pemicu Aktor akan melakukan pencarian judul buku sekolah
elektronik
Langkah Utama Aksi Aktor Reaksi Sistem
1. Aktor memasukan kata
kunci di kolom
pencarian
3. Aktor menekan
Tombol Cari
2. Sistem akan
mengecek kata kunci
yang dimasukkan
4. Sistem menampilkan
Hasil Pencarian
Langkah Alternatif Jika kata kunci yang dimasukkan tidak ada, maka
sistem akan memberi tahu aktor bahwa ada kata kunci
yang dicari tidak ditemukan.
Kesimpulan Use Case ini digunakan untuk pencarian judul buku
sekolah elektronik dan akan berhenti jika aktor
menemukan judul buku yang dicari
Pasca Kondisi Aktor menemukan judul buku sekolah elektronik yang
dicari. Aktor tidak berhasil menemukan judul buku
yang dicari karena kata kunci yang dimasukkan tidak
ditemukan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
4.2 Perancangan Sistem 4.2.1 Perancangan Logikal 4.2.1.1 Diagram Aktifitas 4.2.1.1.1 Mencari Judul Buku Sekolah Elektronik
Gambar 4.4 Diagram Aktifitas
4.2.1 2 Perancangan Model Kelas Analis
Berikut ini merupakan perancangan model kelas analisis untuk
sistem pemerolehan informasi judul buku sekolah elektronik:
Gambar 4.1 Perancangan Model Analisis
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
4.2.2 Diagram Sequence
4.2.2.1 Mencari Judul Buku
Berikut ini Gambar 4.2 merupakan diagram sequence alur
pencarian judul buku sekolah elektronik yang dilakukan oleh
pengguna:
Gambar 4. 1 Diagram Sequence
4.3.3 Perancangan Database
4.3.3.1 Perancangan Konseptual Desain konseptual database disajikan dalam bentuk ERD
yang ditunjukkan pada gambar 4.6 berikut ini:
Gambar 4. 2 Entity Relationship Diagram
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
4.3.3.2 Perancangan Logikal
Hubungan relasi antar tabel pada database perpustakaan
ditunjukkan pada Gambar 4.6 berikut ini:
Gambar 4. 6 Perancangan Logikal
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
4.4 Perancangan Fisikal
Basis data yang digunakan yaitu Mysql dengan tools yaitu aplikasi
SQL Yogs. Database ini digunakan untuk menyimpan teks judul-judul
buku sekolah elektronik di website bse.kemdibud.co.id.
Berikut ini merupakan rancangan tabel-tabel untuk membangun
sistem pemerolehan informasi judul buku sekolah elektronik:
1. Tabel buku
Tabel 4. 1 Tabel buku
Nama Field Tipe Data Ukuran Keterangan
ID_Buku int 100 Merupakan id buku
buku sekolah elektronik
Kelas int 300 Nomor dari Tingkatan
Judul_Buku Varchar 200 Judul dari buku
Tingkat varchar 200 Status sekolah siswa
2. Tabel term
Tabel 4. 2 Table Term
Nama Field Tipe
Data
Ukuran Keterangan
Id_term Integer 100 ID untuk term
term varchar 50 Term dari sebuah
judul buku
Stemmed_word varchar 50 Term yang sudah di
stemming
Is_root_word char 1 Untuk mengecek
sebuah kata termasuk
kata dasar atau bukan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
3. Tabel Postinglist
Tabel 4. 3 Tabel Postinglist
Nama Field Tipe data Ukuran Keterangan
ID_Buku integer 10 Merupakan foreign key
dari tabel buku_perpus
Id_term Integer 100 Merupakan foreign key
dari tabel terms
frequency Integer - Merupakan frequency
dari sebuah kata
Ntfik Integer - Merupakan hasil
perhitungan frequency
w integer - Bobot dari sebuah term
4. Tabel penulis
Tabel 4. 4 Tabel penulis
Nama Field Tipe data Ukuran Keterangan
Id_buku integer - Merupakan primary
key pada tabel
stopwords
Nama_penulis varchar 50 Merupakan daftar kata
yang merupakan
stopword
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
4.5 Rancangan Struktur Data Inverted Index
Inverted index merupakan indeks yang terbentuk dari proses
pengindeksan. Pengindeksan (indexing) adalah cara untuk mempermudah
proses pencarian dengan tujuan meningkatkan efisiensi pencarian. Dengan
melakukan pengindeksan pada buku yang akan dicari, maka pencarian
buku berdasarkan query tertentu tidak perlu dilakukan secara satu persatu.
Inverted index dapat memotong tiap kata (term) yang berbeda dari suatu
list buku.
Struktur data inverted index merupakan pasangan term dan posting
list di dalam sebuah buku (t{b1,b2,b3}). Istilah t merujuk pada term
sedangkan b1-b3 merujuk pada buku. Sebagai contoh, misalkan jika t1
terdapat pada buku b1, b2, b5 sedangkan t2 terdapat pada buku b2, b5 maka
inverted index yang dihasilkan adalah sebagai berikut:
t1 b1, b2, b5
t2 b2,,b5
Rancangan struktur data untuk inverted index akan dijelaskan pada
Gambar 4.4 berikut ini:
Gambar 4. 3 Representasi Struktur Data Inverted Index
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
4.6 Algoritma Model Boolean operator AND Sistem pemerolehan informasi model boolean menerapkan
operator AND. Algoritma model boolean mempunyai input berisi obyek
term untuk keyword (kata kunci) pertama dan find1 berisi obyek term
sebagai kata kedua:
1. Langkah pertama jika find1tidak ada (berisi null) kalau ada
lakukan langkah berikut
a. hasil pencarian ada di postinglist dari term find
2. Else lakukan langkah berikut
a. Langkah kedua membuat variabel baru dengan nama
findHasil dengan tipe Linkedlist postinglist yang bertipe
listIterator, alokasikan memori.
b. Langkah ketiga membuat variabel baru dengan nama t1
dengan tipe Linkedlist postinglist yang bertipe listIterator,
alokasikan memori.
c. Langkah kelima membuat variabel baru dengan nama t2
dengan tipe Linkedlist postinglist yang bertipe listIterator.
d. Selama (t1.hasNext), lakukan langkah berikut.
i. Membuat variabel baru dengan nama p1 bertipe
PostingList,diisi dengan t1.next
ii. t2 diisi iterator dari postinglist untuk find1.
iii. Selama (t2.hasNext), lakukan langkah berikut
a. Jika id buku dari buku p1 sama dengan t2.next
yang mempunyai judul dan id buku. Lakukan
langkah berikut.
i. findHasil tambah p1
e. hasilpencarian berada dipostinglist dari linkedlist findHasil.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
Berikut ini merupakan rancangan diagram kelas yang ditunjukan pada Gambar
4.5:
Gambar 4. 5 Class diagram
4.7 Rancangan Desain Antarmuka
Antar muka sistem pemerolehan informasi terdiri dari satu tampilan
yakni halaman pencarian. Pada halaman pencarian, pengguna diminta
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
untuk memasukkan keyword yang akan dicari, kemudian bisa menekan
tombol Search.
Tampilan dari halaman Awal digambarkan pada Gambar 4.6 dalam
ilustrasi berikut ini:
Gambar 4. 6 Halaman awal
Sedangkan hasil pencarian masih merujuk pada halaman utama, namun
hasil dari pencarian akan ditampilkan di bawah tombol Search
sebagaimana ditampilkan pada Gambar 4.7:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
BAB V IMPLEMENTASI DAN ANALISIS HASIL
5.1 Implementasi Antar Muka (Interface)
5.1.1 Implementasi Halaman Awal
Gambar 5.1 merupakan tampilan awal ketika kita menjalankan program
sistem pemerolehan informasi buku sekolah elektronik.
Gambar 5. 1 Tampilan Awal
5.1.2 Implementasi Halaman Hasil Pencarian
Pada Gambar 5.2 dibawah ini merupakan gambar hasil
pencarian pada sistem pemerolehan informasi buku sekolah
elektronik dengan kata kunci “Bahasa Indonesia”.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
29
Gambar 5. 2 Halaman Hasil Pencarian
5.2 Implementasi inverted index
Inverted index digunakan untuk menambahkan data postinglist yang baru
dari indeks posisi null dan menemukan posisi indeks yang tepat
berdasarkan nomor id_buku data postinglist baru dibandingkan dengan id
buku yang sudah ada. Proses ini untuk membuat indexingnya.
Gambar 5.3 berikut ini merupakan listing program untuk inverted
index yang berfungsi untuk menambahkan kata dalam postinglist:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
30
Gambar 5. 3 Inverted index
5.3. Implementasi model Boolean operator AND
Sistem pemerolehan informasi yang dibuat menggunakan operator
Boolean Proses model Boolean operator AND ini dibuat untuk pencarian
kata kunci. Setelah kita melakukan text processing lalu kata kunci tersebut
masuk dalam proses pencarian..Find ini bertipe Term dan bernilai null dan
find1 juga bertipe Term dan bernilai null. masuk dalam Term = g, g itu
berfungsi untuk mengecek kata ada didalam Wordlist. Lalu jika find sama
dengan null maka find = g yang berarti data itu ada didalam wordlist lalu
break. Setelah itu mencari kata kedua yang berada didalam find1. Proses
itu dicek lagi apakah kata tersebut berada didalam wordlist, jika ada maka
proses tersebut langsung break. Setelah itu, find1 sama dengan null yang
berarti find1 ada di getPostlist. Setelah itu, buat variable baru dengan tipe
postinglist yang berguna untuk menyimpan kata-kata yang sudah dicari.
Setelah itu, buat t1 yang bertipe Postinglist sama dengan find yang berada
di postinglist. Lalu t1 lanjut postinglist membuat variable baru yang
bernama p1 sama dengan t1 lalu lanjut jika p1 itu mempunyai judul buku
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
31
dan id buku.Lalu masuk kedalam findHasil. Setelah proses itu masuk
dalam t2 yang sama dengan find1 , setelah itu t2 lanjut ke dalam if dimana
t2 mempunyai judul buku dan id buku, setelah itu masuk dalam p1 sebagai
findHasil. Setelah proses itu findHasil di setPostlist lalu di tampilkan di
dalam tabel halaman hasil.
Gambar 5.4 Model Boolean dengan operator AND
5.3 Perbandingan Relevansi Hasil Pencarian Judul Buku
Perbandingan relevansi yang dimaksud adalah membandingkan
antara sistem pemerolehan informasi yang dibuat dengan website
www.bse.kemdikbud.co.id. Adapun cara membandingkan adalah dengan
memasukkan kata kunci yang sama kemudian dihitung recall and
precision untuk menentukan relevansi judul buku yang dicari. Berikut ini
adalah hasil perbandingan antara sistem pemerolehan informasi dengan
website www.bse.kemdikbud.co.id
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
32
5.5.1 Kata Kunci “Ilmu Pengetahuan Sosial”
5.5.1.1 Pencarian pada Situs website www.bse.kemdikbud.co.id
Responden mencoba untuk mencari judul buku yang berkaitan
dengan kata kunci “Ilmu Pengetahuan Sosial”. Hasilnya, sistem
menemukan 17 judul buku yang relevan dalam bahasa Indonesia.
Pencarian ini terjadi sebelum website tersebut mengalami pemeliharaan.
Maka perhitungan recall (persamaan (2.4)) dan precision (persamaan
(2.5)) adalah sebagai berikut
Recall = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑑𝑎𝑙𝑎𝑚 𝑑𝑎𝑡𝑎𝑏𝑎𝑠𝑒
= 1717
= 1
Precision = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙
𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙 𝑑𝑎𝑙𝑎𝑚 𝑝𝑒𝑛𝑐𝑎𝑟𝑖𝑎𝑛
= 1717
= 0
Tabel 5.5 precision dalam 11 titik recall
recall precision
0% 0
10% 0
20% 0
30% 0
40% 0
50% 0
60% 0
70% 0
80% 0
90% 0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
33
100% 0
Rata-rata 0
Precision bernilai nol seperti pada Gambar 5.4 karena belum menerapkan
pemerolehan informasi. Sistem ini mengalami pemeliharaan dan terakhir diakses
pada 30 Juli 2018.
Gambar 5.4 Grafik precision dalam 11 titik recall
5.5.2 Kata Kunci “Bahasa Indonesia“
5.5.2.1 Pencarian pada Sistem Pemerolehan Informasi Buku
Responden mencoba untuk mencari judul buku yang berkaitan
dengan kata kunci “Bahasa Indonesia”. Hasilnya, sistem menemukan 7
judul buku yang relevan dalam bahasa Indonesia. Maka perhitungan recall
(persamaan (2.4)) dan precision (persamaan (2.5)) adalah sebagai berikut
Recall = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑑𝑎𝑙𝑎𝑚 𝑑𝑎𝑡𝑎𝑏𝑎𝑠𝑒
= 77 = 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
34
Precision = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙
𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙 𝑑𝑎𝑙𝑎𝑚 𝑝𝑒𝑛𝑐𝑎𝑟𝑖𝑎𝑛
= 77 = 1
Setelah menemukan judul buku yang dicari, maka hasil
perhitungan recall dan precisionnya di masukan ke dalam tabel seperti
pada tabel 5.3.
Tabel 5.3 recall and precision
No Relevan Recall Precision
1 R 0,143 1
2 R 0,286 1
3 R 0,429 1
4 R 0,571 1
5 R 0,714 1
6 R 0,857 1
7 R 1,000 1
Maka perhitungan precision dalam 11 titik recall adalah sebagai berikut :
Tabel 5.4 precision dalam 11 titik recall
recall precision
0% 1
10% 1
20% 1
30% 1
40% 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
35
50% 1
60% 1
70% 1
80% 1
90% 1
100% 1
Rata-rata 1
Dan bila digambarkan dalam bentuk grafik adalah seperti berikut:
Gambar 5.5 Grafik precision dalam 11 titik recall
Dari tabel 5.4 dan Gambar 5.5 dapat dilihat dan diperoleh hasil precision 100%
dari nilai recall 0-100%. Untuk kata kunci tersebut sistem menghasilkan dokumen
relevan yang sama menurut responden
Pada gambar diatas menunjukan jika memiliki precision yang sama yaitu 1, pada
kata kunci “Bahasa Indonesia”
Dan sebagai hasil dari running dari kata “Bahasa Indonesia” adalahseperti pada
Gambar 5.6 berikut :
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
36
Gambar 5.6. Hasil Pencarian kata kunci “Bahasa Indonesia ”
5.5.3 Kata Kunci “Ilmu Alam”
5.6.3.1 Pencarian pada Sistem Pemerolehan Informasi Buku
Responden mencoba untuk mencari judul buku yang berkaitan
dengan kata kunci “Ilmu Alam”. Hasilnya, sistem menemukan 6 judul
buku yang relevan dalam bahasa Indonesia. Maka perhitungan recall
(persamaan (2.4)) dan precision (persamaan (2.5)) adalah sebagai berikut
Recall = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑑𝑎𝑙𝑎𝑚 𝑑𝑎𝑡𝑎𝑏𝑎𝑠𝑒
= 55 = 1
Precision = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙
𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙 𝑑𝑎𝑙𝑎𝑚 𝑝𝑒𝑛𝑐𝑎𝑟𝑖𝑎𝑛
= 55 = 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
37
Setelah menemukan judul buku yang dicari, maka hasil perhitungan recall dan
precisionnya di masukan ke dalam tabel seperti pada tabel 5.6.
Tabel 5.6 Recall dan Precision
No Relevan Recall Precision
1 R 0,200 1
2 R 0,400 1
3 R 0,600 1
4 R 0,800 1
5 R 1,000 1
Maka perhitungan precision dalam 11 titik recall adalah seperti pada tabel 5.7 :
Tabel 5.7 Precision dalam 11 titik Recall
recall precision
0% 1
10% 1
20% 1
30% 1
40% 1
50% 1
60% 1
70% 1
80% 1
90% 1
100% 1
Rata-rata 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
38
Dan bila digambarkan pada Gambar 5.8 dalam bentuk grafik adalah seperti
berikut:
Gambar 5.8 Grafik precision dalam 11 titik recall
Dari tabel 5.7 dan Gambar 5.8 dapat dilihat dan diperoleh hasil precision 100%
dari nilai recall 0-100%. Untuk kata kunci tersebut sistem menghasilkan dokumen
relevan yang sama menurut responden.
Dan sebagai hasil dari running pada gambar 5.9 dari kata “Ilmu Alam”adalah
sebagai berikut :
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
39
Gambar 5.9. Hasil Pencarian kata kunci “Ilmu Alam”
5.5.4 Kata Kunci “Ilmu Sosial”
5.5.4.1 Pencarian pada Sistem Pemerolehan Informasi Buku
Responden mencoba untuk mencari judul buku yang berkaitan
dengan kata kunci “Ilmu Sosial”. Hasilnya, sistem menemukan 4 judul
buku yang relevan. Maka perhitungan recall (persamaan (2.4)) dan
precision (persamaan (2.5)) adalah sebagai berikut:
Recall = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑑𝑎𝑙𝑎𝑚 𝑑𝑎𝑡𝑎𝑏𝑎𝑠𝑒
= 44 = 1
Precision = 𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙
𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑦𝑎𝑛𝑔 𝑡𝑒𝑟𝑎𝑚𝑏𝑖𝑙 𝑑𝑎𝑙𝑎𝑚 𝑝𝑒𝑛𝑐𝑎𝑟𝑖𝑎𝑛
= 44 = 1
Setelah menemukan judul buku yang dicari, maka hasil
perhitungan recall dan precisionnya di masukan ke dalam tabel seperti
pada tabel 5.9.
Tabel 5.9 Recall dan Precision
No Relevan Recall Precision
1 R 0,250 1
2 R 0,500 1
3 R 0,750 1
4 R 1,000 1
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
40
Maka perhitungan precision dalam 11 titik recall pada tabel 5.10 adalah sebagai
berikut :
Tabel 5.10 Precision dalam 11 titik Recall
recall precision
0% 1
10% 1
20% 1
30% 1
40% 1
50% 1
60% 1
70% 1
80% 1
90% 1
100% 1
Rata-rata 1
Dan bila digambarkan pada Gambar 5.11 dalam bentuk grafik adalah sebagai
berikut:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
41
Gambar 5.11 Grafik precision dalam 11 titik recall
Dari tabel 5.10 dan Gambar 5.11 dapat dilihat dan diperoleh hasil precision
100% dari nilai recall 0-100%. Untuk kata kunci tersebut sistem menghasilkan
dokumen relevan yang sama menurut responden.
Dan Gambar 5.12 sebagai hasil dari running dari kata “Ilmu Sosial”adalah
sebagai berikut :
Gambar 5.12. Hasil Pencarian kata kunci “Ilmu Sosial”
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
42
1.6 Analisis Hasil
Sistem pemerolehan informasi buku sekolah elektronik telah
berhasil dikembangkan menggunakan linkedlist dan inverted index.
Sistem pemerolehan informasi buku sekolah elektronik ini dapat
menemukan judul buku dengan 2 keyword kemunculan kata yang tidak
berurutan di dalam judul.
Pada sistem pemerolehan informasi buku sekolah elektronik ,
pencarian 2 keyword yang tidak berurutan dapat menemukan semua
judul buku. Hal ini dibuktikan dengan nilai precision bernilai 1 untuk
semua titik recall pada grafik interpolasi dengan menggunakan
keyword ilmu alam, ilmu sosial dan bahasa indonesia. sedangkan pada
sistem yang lama, jika mencari judul buku dengan 2 keyword tidak
berurutan maka hasil pencarian tidak ditemukan.
Saat ini sistem pada website www.bse.kemdikbud.co.id sedang
dalam pemeliharaan(diakses terakhir pada tanggal 30 Juli 2018 jam
12.30),sehingga penulis hanya menggunakan beberapa data hasil
pencarian sewaktu website www.bse.kemdikbud.co.id masih aktif.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
43
BAB VI
KESIMPULAN DAN SARAN
6.1 Kesimpulan
Kesimpulan yang didapat dari perbandingan antara sistem
pencarian judul buku yang dimiliki www.bse.kemdikbud.co.id dengan
sistem pemerolehan informasi yang dibangun menggunakan struktur data
LinkedList dalam inverted index adalah sebagai berikut:
1. Sistem pemerolehan informasi buku sekolah elektronik yang
dibangun menggunakan struktur data linkedlist dalam inverted
index telah berhasil dikembangkan untuk mencari judul buku
sampai dengan 2 keyword.
2. Sistem pemerolehan informasi buku sekolah elektronik ini
dapat mencari 2 keyword dengan kemunculan kata yang tidak
berurutan di dalam judul, sedangkan pada sistem yang lama,
jika mencari judul buku dengan 2 keyword tidak berurutan
maka hasil pencarian tidak ditemukan.
6.2 Saran
Saran yang mendukung pengembangan dari sistem pemerolehan
informasi judul buku website yaitu:
• Hasil evaluasi dan pengujian sistem pemerolehan informasi
dibandingkan sistem pencarian situs
www.bse.kemdikbud.co.id memiliki saran sebagai berikut:
a. Sistem pemerolehan informasi buku sekolah
elektronik bisa menggunakan 2 keyword untuk
pencariannya dengan kata kunci yang tidak berurutan.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
44
b. Sewaktu penulis ingin membandingkan antara sistem
pemerolehan informasi dengan website
www.bse.kemdikbud.co.id , terdapat kesalahan pada
website tersebut, yaitu website
www.bse.kemdikbud.co.id sedang dalam
pemerliharaan sehingga penulis tidak dapat
membandingkannya.Untuk kedepannya, penulis
berharap website www.bse.kemdikbud.co.id dapat
kembali normal.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
45
DAFTAR PUSTAKA
Adriani, M., Asian, J., Nazief, B., Tahaghoghi, S.M.M. & Williams, H.E.
2007.
Stemming Indonesian : A Confix-Stripping Approach. Transaction on
Asian Langeage Information Processing. Vol. 6, No. 4, Articel 13.
Association for Computing Machinery : New York .
Agusta, Ledy. (2009). Perbandingan Algoritma Stemming Porter dengan
Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa
Indonesia. Jurnal Konferensi Nasional Sistem dan Informatika 2009,
Bali.
Baeza-Yates, R., Riberio-Neto, B. (1999). Modern Information Retrieval
the Concepts and Technology Behind Search. England: A division of
the association for Computing Machinary
Büttcher, Stefan., Clarke, L.A Charles., Cormack, V. Gordon. (2010).
Information Retrieval Implementing and Evaluating Search Engines.
USA: Massachusetts Institute of Technology.
Darojad, Reza Mohammad. (2013). Sistem Temu Balik Informasi
Dokumen Makalah Ilmiah Berbahasa Indonesia Menggunakan
Struktur Data Inverted Index Berbasis Hash Table dan Linked List.
Universitas Sanata Dharma: Yogyakarta.
Hariyanto, Bambang. (2009). Sistem Operasi revisi keempat. Informatika:
Bandung.
Hasibuan, Zainal A., & Andri, Yofi. (2001). Penerapan Berbagai Teknik
Sistem Temu-Kembali Informasi Berbasis Hiperteks. Jurnal Ilmu
Komputer dan Teknologi Informasi, Vol. 1, No. 2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
46
Ingwersen, Peter. (2002). Information Retrieval Interaction. Denmark:
Royal School of Library and Information Science.
Manning, Christopher, D., Raghavan, Prakbhakar., Schütze, Hinrich.
(2008). Introduction to Information Retrieval. England: Cambridge
University Press.
P.J, Deitel., Deitel H.M. (2012). Java How to Program, 9th Edition.
Pearson Education Inc:USA.
Puspitaningrum, Fredes Winda Oktaviani. (2011). Sistem Pemerolehan
Informasi Undang-Undang dan Kasus Menggunakan Struktur Data
Inverted Index dengan Pembobotan TF-IDF. Universitas Sanata
Dharma: Yogyakarta.
Wulandari, Justina Septiani. (2013). Sistem Pemerolehan Informasi
Makalah Ilmiah Berbahasa Indonesia Menggunakan Struktur Data
Inverted Index Dengan Metode Pembobotan TF-IDF Berbasis ORDBMS.
Universitas Sanata Dharma: Yogyakarta
Tamtama, Gabriel Indra Widi (2017). Perbandingan Unjuk Kerja Struktur
Data LinkedList dan ArrayList dalam Inverted Index Untuk Mendukung
Sistem Pemerolehan Informasi Judul Buku Koleksi Perpustakaan.
Universitas Sanata Dharma: Yogyakarta
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI