aplikasi perbaikan ejaan pada pada karya tulis ilmiah · pdf filepenulisan karya ilmiah....
TRANSCRIPT
APLIKASI PERBAIKAN EJAAN PADA KARYA TULIS ILMIAHDIPROGRAM STUDI TEKNIK INFORMATIKA DENGAN MENERAPKAN
ALGORITMA LEVENSHTEIN DISTANCE
Roby Nur Hamzah
Artikel Skripsi Universitas Nusantara PGRI Kediri
Di Publish 12 Agustus 2016
EMIL SALIM SARMAN1441177004006
LATAR BELAKANG MASALAH
REVISI BERULANG-ULANG
KARENA TYPOGRAPHICAL ERROR
SOLUSI EXPERT SYSTEM
TUJUAN PENELITIAN
Expert system
Kualitas karya tulis jadi lebih
baik
Meperbaikikesalahan
pengetikan
Mempermudah pengetikan karya tulis
ilmiah
METODE/TEKNIK YANG DITERAPKANMetode yang diterapkan menggunakan algoritma levenshtein distance.
CARA KERJA
Menghitung jarak terdekat dari string sumber (s) dengan Stringtarget (t). Jika selisih String sumber (s) dengan String target (t)memiliki jarak terendah, maka akan dijadikan saran perbaikanberdasarkan urutan jarak String terendah hingga terbesar.
Acuan perhitungan dengan algoritma dalam penelitian ini dibatasidengan jarak toleransi = 2 dan banyaknya saran perbaikan adalah 20kata.
HASIL DAN PEMBAHASAN/DISKUSI
PEMBAHASANUntuk mengetahui proses perhitungan algoritma Levenshtein Distance dalam memperbaikikesalahan ejaan. Maka akan dilakukan sebuah simulasi algoritma dengan contoh sebagai berikut :
Diketahui sebuah String sumber (s) = “teknuk” dan String target (t) = “teknik” untuk menyamakanString maka akan dilakukan perhitungan:
Rumus :
= d(t,t) + d(e,e) + d(k,k) + d(n,n) + d(u,i) + d(k,k)
= 0 + 0 + 0 + 0 + 1 + 0
= 1
Sehingga jarak levenshtein antara String (s) = “teknuk” dan (t) = “teknik” adalah D(s,t) = 1
HASIL DAN PEMBAHASAN/DISKUSI
Tabel penjelasan algoritma
KESIMPULAN
Berdasarkan hasil penelitian dan implementasi sistem, maka dapatdiambil kesimpulan sebagai berikut :
1. Aplikasi ini dikhususkan pada karya tulis ilmiah yang berformat*docx.
2. Acuan saran perbaikan menggunakan data dari KBBI Kemendikbudversi 3 yang disimpan pada database dan dikoneksikan pada aplikasiuntuk menjadi acuan saran perbaikan kesalahan penulisan ejaan.
KAKAS BANTU PENDETEKSI KESALAHAN
TADA BACA PADA KARYA TULIS ILMIAH
Ratih Nur Esti Anggraini, Mohammad Ahmaluddin Zinni, dan Siti Rochimah
Abdullah Lubis1441177004081
Jurusan Teknik InformatikaInstitut Teknologi Sepuluh Nopember
LATAR BELAKANG MASALAH
Dirjen DIKTI tahun 2012 :
“Karya ilmiah dijadikan sebagai syarat kelulusan mahasiswa S1, S2 dan S3.”
Namun demikian, tidak semua karya
ilmiah yang dihasilkan tersebut
memiliki kualitas yang baik.
Penulisan Kata
Tanda Baca
Tidak SesuaiEjaan Yang
Disempurnakan (EYD).
TUJUAN PENELITIAN
Expert system
Kualitas karya tulisjadi lebih baik
Membantu dunia keilmiahan Indonesia dalam upaya
meningkatkan kualitas tulisan karya ilmiah
Koreksi kesalahan penggunaan tanda
baca
METODE/TEKNIK YANG DITERAPKANMetode yang diterapkan menggunakan Algoritma Boyer-Moore.
CARA KERJA
Heuristik looking-glass :Perbandingkan suatu karakter akhir pada kata w dengan suatu karakter padateks s. Jika karakter tersebut sama maka jendela karakter akan berjalan mundurpada kedua string dan memeriksa kembali kedua karakter.
Heuristik character-jump :Melakukan suatu aksi ketika terdapat perbandingan antara dua karakter yangberbeda.
HASIL DAN PEMBAHASAN/DISKUSI
PEMBAHASANUntuk dapat mengetahui tingkat performansi suatu sistem yang mampu mendapatkan kembaliinformasi-informasi tertentu dapat diketahui menggunakan perhitungan presisi dan recall. Presisimerupakan probabilitas informasi yang relevan dari semua informasi yang didapatkan kembali olehsistem. Rumus untuk menghitung presisi dan recall :
rumus presisi (P) berdasarkan tablecontingency
rumus recall (R) berdasarkan tabel contingency
Rumus perhitungan akurasi berdasarkan
tabel contingency
HASIL DAN PEMBAHASAN/DISKUSI Proses pencarian menggunakan algoritma pencarian string Boyer-Moore
KESIMPULAN
Berdasarkan hasil penelitian dan implementasi sistem,maka dapatdiambil kesimpulan sebagai berikut :
1. Sistem dapat membangkitkan telaah kesalahan tanda baca berdasarkankesalahan yang dideteksi dari karya ilmiah serta penggunaan algoritmapencarian kata (dalam kasus ini menggunakan algoritma Boyer-Moore) dapatdigunakan pada kasus-kasus pendeteksian kesalahan tanda baca yangberhubungan dengan penggunaan spasi atau tidak, serta penggunaan hurufkapital atau huruf normal.
2. Aplikasi ini dikhususkan pada karya tulis ilmiah yang berformat *docx.
APLIKASI KOREKSI KESALAHAN BERBASIS PADA TULISAN BERBAHASA INDONESIA UNTUK MENINGKATKAN KUALITAS PENULISAN KARYA ILMIAH
Andri, Sunda Ariana, Margareta Andriani
Fakultas Ilmu Komputer
Universitas Bina Darma Palembang
Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014
ISSN: 1979-911X
Yogyakarta, 15 November 2014
Moh Mahpudin1441177004340
LATAR BELAKANG MASALAH
Indikasi penguasaan Bahasa Indonesia yang rendah dapat dilihat dari rendahnya nilai rata-rata BahasaIndonesia dibandingkan dengan bahasa Inggris pada Ujian Nasional (Ariana, 2010).
Kebiasaan berbicarasehari-hari dengan Bahasa
daerah
Kurang menguasaiBahasa Indonesia yang
baku
TUJUAN PENELITIAN
Membuat sebuahprogram aplikasi
berbasis komputer
Mengkoreksikesalahan
penggunaan EYD
Memperbaikikesalahan
penulisan karyailmiah
Metode/Teknik Yang Diterapkan
Analisis kebutuhansistem
Perancanganaplikasi
Implementasidan penerapan
algoritmaKesimpulan
Penelitian ini menghasilkan sebuah perangkat lunak aplikasi yang dapat digunakan untukmelakukan koreksi kesalahan penggunaan EyD dalam dokumen berbahasa Indonesia.
HASIL DAN PEMBAHASANBentuk user interface aplikasi pada penelitian ini
Aplikasi koreksi ini menyediakan fungsi untuk melakukan pengecekanpenggunaan kata-kata yang sesuai dengan EYD.
Metode yang digunakan untuk penentuan solusi kata yang tidak sesuaidengan EYD dalam penelitian ini menggunakan metode N-Gram.
N-Gram merupakan sebuah metode yang diaplikasikan untukpembangkitan kata atau karakter. Menurut (Gergely, 2005) N Gramadalah substring sepanjangn karakter dari sebuah string. Metode N-Gram digunakan untuk mengambil potongan-potongan karakter hurufsejumlah n dalam sebuah kata yang secara kontinu dibaca dari katasumber hingga akhir dari dokumen. Contoh pada kata “TEXT” dapatdijelaskan ke dalam beberapa N-Gram sebagai berikut:
Uni-gram : T,E,X,T
Bi-gram : TE,EX,XT
Tri-gram : TEX,EXT
Quad-gram : TEXT,EXT
Salah satu keunggulan menggunakan N-Gram dan bukan suatu katautuh secara keseluruhan adalah bahwa N-Gram tidak terlalu sensitifterhadap kesalahan penulisan yang terdapat pada suatu dokumen(Hanafi, 2009).
Alur proses aplikasi koreksi
KESIMPULAN
Dari proses implementasi dan pengujian dapat diambil beberapakesimpulan sebagai berikut:
1. Aplikasi koreksi yang dibuat dapat mendeteksi kesalahan-kesalahanyang terjadi pada dokumen-dokumen Bahasa Indonesia.
2. Aplikasi koreksi dapat melakukan perbaikan secara otomatisterhadap kata dan kalimat yang tidak sesuai dengan EyD.
APLIKASI PREDICTIVE TEXT BERBAHASA INDONESIADENGAN METODE N-GRAM
Silvia Rostianingsih, Sendy Andrian Sugianto, Liliana.
Program Studi Teknik Informatika Fakultas Teknologi Industri
Universitas Kristen Petra.
E-mail: [email protected], [email protected]
ROKHMAT
1441177004052
LATAR BELAKANG MASALAH
PROSES PENGETIKAN LAMA
SERINGNYA TERJADI KESALAHAN KETIK (TYPO)
EXPERT SYSTEM
PENULISAN KATA TIDAK SESUAI EJAAN YANG DISEMPURNAKAN (EYD).
TUJUAN PENELITIAN
MEMPERCEPAT DALAM PENGETIKAN
SUATU KATA
KUALITAS KARYA TULIS JADI LEBIH
BAIK
MEMPERMUDAH PENGETIKAN KARYA
TULIS ILMIAH
Expert system
METODE/TEKNIK YANG DITERAPKAN
CARA KERJA
Metodologi penelitian dilakukan dengan mempelajari tentang metode N-Gram-Based, dilanjutkan dengan membuat perancangan sistem tentang pengolahankata dan metode scoring kata. Pembuatan perangkat lunak yaitu denganmengimplementasikan desain sistem yang telah dibuat ke dalam bahasapemrograman, meliputi language model, frequency scoring, semantic scoring,Ngram scoring. Selanjutnya dilakukan pengujian aplikasi dalam melakukanprediksi dan keystroke saving yang dihasilkan oleh tiap metode scoring.Kesimpulan dilakukan dengan membandingkan hasil prediksi dan keystrokesaving yang dihasilkan dari aplikasi.
DESAIN SISTEM
Dalam melakukan predictive text, userterlebih dahulu memasukkan metode n-gram yang digunakan. Selanjutnya sistemakan melakukan load file kata yang adasesuai metode n-gram yang dipilih. Sistemakan membaca input karakter dari user danmelakukan parsing data. Selanjutnya sistemmelakukan searching dan scoring kata darifile untuk menghasilkan predictive text.Terakhir, sistem memberikan usulan katayang menjadi predictive text kepada user.Rancangan sistem kerja aplikasi secara garisbesar ditunjukkan pada Gambar 1.
HASIL DAN PEMBAHASAN/DISKUSIPengujian dilakukan antara lain mengujibobot dari tiap metode scoring-nya, yakniKeystroke Saving (KS) dan Score PrediksiEfektif (SPE). Pengujian denganmenghitung keystroke saving adalah untukmenghitung seberapa banyak karakteryang dapat dihemat untuk menghasilkansebuah teks tertentu. SPE didapat darijumlah prediksi efektif yang terjadidibandingkan dengan jumlah total prediksiyang terjadi. Hasil perhitungan yangdidapat dari pengujian pada Bigram (Tabel1) dan Trigram (Tabel 2) menunjukkan nilaiyang hampir sama. Sedangkan untukpersentase frekuensi kata keluar (Tabel 3)menunjukkan bahwa metode bigram dantrigram masih memiliki persentasefrekuensi kata keluar yang lebih tinggidibanding metode lainnya.
KESIMPULAN
Dari hasil penelitian dapat disimpulkan:
1. Rata-rata keystroke saving yang dihasilkan pada pengujian ini adalah 15hingga 25 persen bergantung pada data training.
2. Rata-rata prediksi efektif terjadi di atas 30% dari total prediksi yang terjadi.Hal ini dikarenakan oleh pengaruh dari language model yang dapat langsungmemprediksi kata dengan lebih efektif dan akurat.
3. Frekuensi dari language model yang tinggi sangat mempengaruhi scoringsistem, karena semakin tinggi frekuensi language model suatu kata, makaakan semakin tinggi pula bobot / nilai dari kata itu sendiri.
4. Semakin besar nilai n dalam n-gram berbanding terbalik dengan jumlahfrekuensi keluar yang didapat, yaitu semakin kecil atau lebih jarang keluar.Penggunaan model bi-gram dan tri-gram untuk language model masihmemungkinkan, karena hasil dari jumlah frekuensi keluar pada suku n-gram-nya masih cukup besar dan datanya masih valid apabila diproses lebih lanjut.
Koreksi Ejaan Istilah Komputer Berbasis Kombinasi Algoritma Damerau Levenshtein dan Algoritma Soundex
Akhmad Pahdi
STMIK Banjarbaru
Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 8 No 2 - 2016
ISSN : 1979-9330 (Print) - 2088-0154 (Online)
Fajar Rusdi Wibowo1441177004178
LATAR BELAKANG MASALAH
Kesulitan dalam mengingat, menyebutkan, dan atau menuliskan kata dan penamaan istilah didunia komputer.
TUJUAN PENELITIANMengukur tingkat efektivtas algoritma Damerau-Levenstein yang dikombinasikan dengan algoritma Soundex dalam koreksi ejaan dan pencocokan kata.
METODE/TEKNIK YANG DITERAPKANMetode yang diterapkan menggunakan algoritma Damerau-Levenshteindikombinasikan dengan algoritma Soundex..
CARA KERJA
Damerau-Levenshtein mencari jarak terpendak dalam mentransformasi kata menjadi kata yang lain, selanjutnya
Soundex memembagi dan mengkelompokkan huruf sesuai dengan kesamaan bunyi.
PEMBAHASANAlgoritma Damerau-Levenshtein Algoritma Soundex
1.Inisialisasikan n sebagai panjang karakter dari s dan m sebagai panjang karakter dari t. Jika n = 0 atau m = 0, maka kembalikan nilai (return value) berupa jarak edit dengan rumusan:
jarak_edit = max(n, m)
lalu lompat ke langkah 7.
2. Buat sebuah matriks d sebanyak m + 1 baris dan n + 1 kolom. 3. Isi baris pertama dengan 0..n dan isi kolom pertama dengan 0..m. 4. Periksa setiap karakter dari s terhadap t
Jika s[i] = t[j] maka cost = 0.
Jika s[i] ≠ t[j] maka cost = 1.
5. Isikan nilai dari setiap sel d[i, j] baris per baris dengan: d[i, j] = min(x, y, z)
1. Ubah semua huruf menjadi huruf besar atau uppercase, buang semua huruf vokal, tanda baca yang tidak ada hubungan dengan kata, konsonan H,W, dan Y, serta urutan huruf yang sama (misalnya. sss). Huruf pertama selalu dibiarkan seperti semula.
2. Gabung huruf pertama dengan angka pengganti yang sesuai dengan kode numerik yang ditunjukkan pada Tabel 2.1.
3. Ambil empat kode terdepan dan selanjutnya kode tersebut menjadi kode Soundex.
PROSES PENCOCOKAN KATAPencarian kata yang sesuai
Kata kunci : getweyJumlah karakter : 6
1. Inisialisasi n sebagai panjang karakter kata kunci, dan m sebagai panjang karakter kata-kata yang akan diukur jarak kedekatannya (asumsi, kata “activity”), sehingga mendapatkan penghitungan jumlah n=6 dan jumlah m=8
2. Buat matrix d sebanyak m+1 dan n+1 kolom. 3. Pada matriks yang telah dibuat, isi baris pertama dengan 0..n dan isi
kolom pertama dengan 0..m.
4. Periksa setiap karakter dari s terhadap t.5. Isikan nilai dari setiap sel d[i, j] baris per baris. Langkah ini akan selaluberulang sampai semua matriks terisi.
d[1,1] = min((d[1-1,1]+1),(d[1,1-1]+1),(d[1-1,1-1]+cost))= min((d[0,1]+1),(d[1,0]+1),(d[0,0] +1))= min(2,2,1) = 1
d[1,2] = min((d[1-1,2]+1),(d[1,2-1]+1),(d[1-1,2-1]+cost))= min((d[0,2]+1),(d[1,1]+1),(d[0,1]+1)) = min(3,2,2) = 2
6. Setelah langkah iterasi di atas selesai, maka jarak edit akan ditemukan pada sel d[n, m] yaitu sel pada pojok kanan baris terakhir.7. Selesai.
KESIMPULAN
Selama bunyi dan karakter pertama dari kata kunci sama dengan katasumber maka efektivitas algoritma Soundex sedikit lebih baikdibandingkan dengan algoritma Damerau-Levenstein, dengan tingkatkeberhasilan sebesar 74% sedangkan tingkat keberhasilan Damerau-Levenstein sebesar 70%, kombinasi dari algoritma Damerau Levensteindan algoritma Soundex terbukti dapat meningkatkan tingkat akurasikoreksi ejaan untuk Istilah komputer,dengan tingkat akurasi sebesar92% sedangkan 2% Damerau-Levenstein dan Soundex menyarankankata atau istilah komputer yang tidak relevan.
ARSITEKTUR UNTUK APLIKASI DETEKSI KESAMAAN DOKUMEN
BAHASA INDONESIA
Anna Kurniawati, Kemal Ade Sekarwati, I wayan Simri Wicaksana
Fakultas Ilmu komputer dan Teknologi Informasi Universitas Gunadarma
Konferensi Nasional Sistem Informasi 2012,STMIK - STIKOM
Bali , 23-25 Pebruari 2012
Aef Saefulah
1441177004117
Latar Belakang
PlagiatHanya mencari
padakesamaan
judulnya atautema saja
Plagiat
Mencari kesamaankata pada judul
Mencari kesamaanpada gabungan
kata dan kalimat
Mencari kesamaanpada arti dari
keseluruhan kata paragraf dan
dokumen
Tanpa aplikasiDengan aplikasi
Aplikasi Tessy(Test of Text Similarity)
Pembandingandokumen
menggunakanalgoritma Rarp
Kabin
Pembandingandokumen
menggunakanalgoritma Swith
WatermanPlagiat masih bisadilakukan dan ditemukanpada hasil karya tulismahasiswa.
Belum mempertimbanganstruktur kalimat dansinonim untukmembandingkan kalimat.
Peneliti :Didi Achjari
Peneliti :Sinta Agustina
Peneliti :Audi
Novanta
Penelitian pengukuran
kesamaan dokumen
Menggunakan Metode KeywordSimilarity dengan teknik DOT. ObjekPenelitian yang digunakan adalahdokumen berbahasa Inggris. Dokumenyang digunakan sebanyak 20 data.
Menggunakan Metode Dokumenfingerprinting dengan algoritmaWinnowing.
Peneliti :Saul Schleimer 2003,
Noorzima 2005
Peneliti :Parvati Iyer, 2005
Peneliti :Sinta Agustina 2008,
Hari Bagus, 2003.
Menggunakan metode String matchingdengan algoritma Karp Rabin. ObjekPenelitian yang digunakanadalah dokumen berbahasa Indonesia.
Penelitian pengukuran
kemiripan
Metodologi penelitian
• Kemiripan kalimat• Rata-rata kemiripan kalimat• Rata-rata maksimum
kemiripan dokumen
Arsitektur Deteksi Kesamaan Dokumen
Dalam membangun arsitektur untuk aplikasikesamaan dokumen terdiri dari 3 bagian penting, yaitu :
1. Penentuan Struktur Kalimat atau SPOK, 2. Kesamaan Dokumen3. Analisis Sinonim Kata.
Kesimpulan