aplikasi perbaikan ejaan pada pada karya tulis ilmiah · pdf filepenulisan karya ilmiah....

APLIKASI PERBAIKAN EJAAN PADA KARYA TULIS ILMIAHDIPROGRAM STUDI TEKNIK INFORMATIKA DENGAN MENERAPKAN

ALGORITMA LEVENSHTEIN DISTANCE

Roby Nur Hamzah

Artikel Skripsi Universitas Nusantara PGRI Kediri

Di Publish 12 Agustus 2016

EMIL SALIM SARMAN1441177004006

LATAR BELAKANG MASALAH

REVISI BERULANG-ULANG

KARENA TYPOGRAPHICAL ERROR

SOLUSI EXPERT SYSTEM

User

Highlight

User

Highlight

TUJUAN PENELITIAN

Expert system

Kualitas karya tulis jadi lebih

baik

Meperbaikikesalahan

pengetikan

Mempermudah pengetikan karya tulis

ilmiah

METODE/TEKNIK YANG DITERAPKANMetode yang diterapkan menggunakan algoritma levenshtein distance.

CARA KERJA

Menghitung jarak terdekat dari string sumber (s) dengan Stringtarget (t). Jika selisih String sumber (s) dengan String target (t)memiliki jarak terendah, maka akan dijadikan saran perbaikanberdasarkan urutan jarak String terendah hingga terbesar.

Acuan perhitungan dengan algoritma dalam penelitian ini dibatasidengan jarak toleransi = 2 dan banyaknya saran perbaikan adalah 20kata.

HASIL DAN PEMBAHASAN/DISKUSI

PEMBAHASANUntuk mengetahui proses perhitungan algoritma Levenshtein Distance dalam memperbaikikesalahan ejaan. Maka akan dilakukan sebuah simulasi algoritma dengan contoh sebagai berikut :

Diketahui sebuah String sumber (s) = “teknuk” dan String target (t) = “teknik” untuk menyamakanString maka akan dilakukan perhitungan:

Rumus :

= d(t,t) + d(e,e) + d(k,k) + d(n,n) + d(u,i) + d(k,k)

= 0 + 0 + 0 + 0 + 1 + 0

= 1

Sehingga jarak levenshtein antara String (s) = “teknuk” dan (t) = “teknik” adalah D(s,t) = 1


Tabel penjelasan algoritma

KESIMPULAN

Berdasarkan hasil penelitian dan implementasi sistem, maka dapatdiambil kesimpulan sebagai berikut :

1. Aplikasi ini dikhususkan pada karya tulis ilmiah yang berformat*docx.

2. Acuan saran perbaikan menggunakan data dari KBBI Kemendikbudversi 3 yang disimpan pada database dan dikoneksikan pada aplikasiuntuk menjadi acuan saran perbaikan kesalahan penulisan ejaan.

KAKAS BANTU PENDETEKSI KESALAHAN

TADA BACA PADA KARYA TULIS ILMIAH

Ratih Nur Esti Anggraini, Mohammad Ahmaluddin Zinni, dan Siti Rochimah

Abdullah Lubis1441177004081

Jurusan Teknik InformatikaInstitut Teknologi Sepuluh Nopember


Dirjen DIKTI tahun 2012 :

“Karya ilmiah dijadikan sebagai syarat kelulusan mahasiswa S1, S2 dan S3.”

Namun demikian, tidak semua karya

ilmiah yang dihasilkan tersebut

memiliki kualitas yang baik.

Penulisan Kata

Tanda Baca

Tidak SesuaiEjaan Yang

Disempurnakan (EYD).

TUJUAN PENELITIAN

Expert system

Kualitas karya tulisjadi lebih baik

Membantu dunia keilmiahan Indonesia dalam upaya

meningkatkan kualitas tulisan karya ilmiah

Koreksi kesalahan penggunaan tanda

baca

User

Highlight

METODE/TEKNIK YANG DITERAPKANMetode yang diterapkan menggunakan Algoritma Boyer-Moore.

CARA KERJA

Heuristik looking-glass :Perbandingkan suatu karakter akhir pada kata w dengan suatu karakter padateks s. Jika karakter tersebut sama maka jendela karakter akan berjalan mundurpada kedua string dan memeriksa kembali kedua karakter.

Heuristik character-jump :Melakukan suatu aksi ketika terdapat perbandingan antara dua karakter yangberbeda.

User

Highlight


PEMBAHASANUntuk dapat mengetahui tingkat performansi suatu sistem yang mampu mendapatkan kembaliinformasi-informasi tertentu dapat diketahui menggunakan perhitungan presisi dan recall. Presisimerupakan probabilitas informasi yang relevan dari semua informasi yang didapatkan kembali olehsistem. Rumus untuk menghitung presisi dan recall :

rumus presisi (P) berdasarkan tablecontingency

rumus recall (R) berdasarkan tabel contingency

Rumus perhitungan akurasi berdasarkan

tabel contingency

User

Highlight

User

Highlight

User

Highlight

HASIL DAN PEMBAHASAN/DISKUSI Proses pencarian menggunakan algoritma pencarian string Boyer-Moore

User

Highlight

KESIMPULAN

Berdasarkan hasil penelitian dan implementasi sistem,maka dapatdiambil kesimpulan sebagai berikut :

1. Sistem dapat membangkitkan telaah kesalahan tanda baca berdasarkankesalahan yang dideteksi dari karya ilmiah serta penggunaan algoritmapencarian kata (dalam kasus ini menggunakan algoritma Boyer-Moore) dapatdigunakan pada kasus-kasus pendeteksian kesalahan tanda baca yangberhubungan dengan penggunaan spasi atau tidak, serta penggunaan hurufkapital atau huruf normal.

2. Aplikasi ini dikhususkan pada karya tulis ilmiah yang berformat *docx.

APLIKASI KOREKSI KESALAHAN BERBASIS PADA TULISAN BERBAHASA INDONESIA UNTUK MENINGKATKAN KUALITAS PENULISAN KARYA ILMIAH

Andri, Sunda Ariana, Margareta Andriani

Fakultas Ilmu Komputer

Universitas Bina Darma Palembang

Prosiding Seminar Nasional Aplikasi Sains & Teknologi (SNAST) 2014

ISSN: 1979-911X

Yogyakarta, 15 November 2014

Moh Mahpudin1441177004340


Indikasi penguasaan Bahasa Indonesia yang rendah dapat dilihat dari rendahnya nilai rata-rata BahasaIndonesia dibandingkan dengan bahasa Inggris pada Ujian Nasional (Ariana, 2010).

Kebiasaan berbicarasehari-hari dengan Bahasa

daerah

Kurang menguasaiBahasa Indonesia yang

baku

TUJUAN PENELITIAN

Membuat sebuahprogram aplikasi

berbasis komputer

Mengkoreksikesalahan

penggunaan EYD

Memperbaikikesalahan

penulisan karyailmiah

Metode/Teknik Yang Diterapkan

Analisis kebutuhansistem

Perancanganaplikasi

Implementasidan penerapan

algoritmaKesimpulan

Penelitian ini menghasilkan sebuah perangkat lunak aplikasi yang dapat digunakan untukmelakukan koreksi kesalahan penggunaan EyD dalam dokumen berbahasa Indonesia.

HASIL DAN PEMBAHASANBentuk user interface aplikasi pada penelitian ini

Aplikasi koreksi ini menyediakan fungsi untuk melakukan pengecekanpenggunaan kata-kata yang sesuai dengan EYD.

Metode yang digunakan untuk penentuan solusi kata yang tidak sesuaidengan EYD dalam penelitian ini menggunakan metode N-Gram.

N-Gram merupakan sebuah metode yang diaplikasikan untukpembangkitan kata atau karakter. Menurut (Gergely, 2005) N Gramadalah substring sepanjangn karakter dari sebuah string. Metode N-Gram digunakan untuk mengambil potongan-potongan karakter hurufsejumlah n dalam sebuah kata yang secara kontinu dibaca dari katasumber hingga akhir dari dokumen. Contoh pada kata “TEXT” dapatdijelaskan ke dalam beberapa N-Gram sebagai berikut:

Uni-gram : T,E,X,T

Bi-gram : TE,EX,XT

Tri-gram : TEX,EXT

Quad-gram : TEXT,EXT

Salah satu keunggulan menggunakan N-Gram dan bukan suatu katautuh secara keseluruhan adalah bahwa N-Gram tidak terlalu sensitifterhadap kesalahan penulisan yang terdapat pada suatu dokumen(Hanafi, 2009).

Alur proses aplikasi koreksi

KESIMPULAN

Dari proses implementasi dan pengujian dapat diambil beberapakesimpulan sebagai berikut:

1. Aplikasi koreksi yang dibuat dapat mendeteksi kesalahan-kesalahanyang terjadi pada dokumen-dokumen Bahasa Indonesia.

2. Aplikasi koreksi dapat melakukan perbaikan secara otomatisterhadap kata dan kalimat yang tidak sesuai dengan EyD.

APLIKASI PREDICTIVE TEXT BERBAHASA INDONESIADENGAN METODE N-GRAM

Silvia Rostianingsih, Sendy Andrian Sugianto, Liliana.

Program Studi Teknik Informatika Fakultas Teknologi Industri

Universitas Kristen Petra.

E-mail: [email protected], [email protected]

ROKHMAT

1441177004052


PROSES PENGETIKAN LAMA

SERINGNYA TERJADI KESALAHAN KETIK (TYPO)

EXPERT SYSTEM

PENULISAN KATA TIDAK SESUAI EJAAN YANG DISEMPURNAKAN (EYD).

TUJUAN PENELITIAN

MEMPERCEPAT DALAM PENGETIKAN

SUATU KATA

KUALITAS KARYA TULIS JADI LEBIH

BAIK

MEMPERMUDAH PENGETIKAN KARYA

TULIS ILMIAH

Expert system

User

Highlight

METODE/TEKNIK YANG DITERAPKAN

CARA KERJA

Metodologi penelitian dilakukan dengan mempelajari tentang metode N-Gram-Based, dilanjutkan dengan membuat perancangan sistem tentang pengolahankata dan metode scoring kata. Pembuatan perangkat lunak yaitu denganmengimplementasikan desain sistem yang telah dibuat ke dalam bahasapemrograman, meliputi language model, frequency scoring, semantic scoring,Ngram scoring. Selanjutnya dilakukan pengujian aplikasi dalam melakukanprediksi dan keystroke saving yang dihasilkan oleh tiap metode scoring.Kesimpulan dilakukan dengan membandingkan hasil prediksi dan keystrokesaving yang dihasilkan dari aplikasi.

User

Highlight

User

Highlight

DESAIN SISTEM

Dalam melakukan predictive text, userterlebih dahulu memasukkan metode n-gram yang digunakan. Selanjutnya sistemakan melakukan load file kata yang adasesuai metode n-gram yang dipilih. Sistemakan membaca input karakter dari user danmelakukan parsing data. Selanjutnya sistemmelakukan searching dan scoring kata darifile untuk menghasilkan predictive text.Terakhir, sistem memberikan usulan katayang menjadi predictive text kepada user.Rancangan sistem kerja aplikasi secara garisbesar ditunjukkan pada Gambar 1.

User

Highlight

HASIL DAN PEMBAHASAN/DISKUSIPengujian dilakukan antara lain mengujibobot dari tiap metode scoring-nya, yakniKeystroke Saving (KS) dan Score PrediksiEfektif (SPE). Pengujian denganmenghitung keystroke saving adalah untukmenghitung seberapa banyak karakteryang dapat dihemat untuk menghasilkansebuah teks tertentu. SPE didapat darijumlah prediksi efektif yang terjadidibandingkan dengan jumlah total prediksiyang terjadi. Hasil perhitungan yangdidapat dari pengujian pada Bigram (Tabel1) dan Trigram (Tabel 2) menunjukkan nilaiyang hampir sama. Sedangkan untukpersentase frekuensi kata keluar (Tabel 3)menunjukkan bahwa metode bigram dantrigram masih memiliki persentasefrekuensi kata keluar yang lebih tinggidibanding metode lainnya.

User

Highlight

KESIMPULAN

Dari hasil penelitian dapat disimpulkan:

1. Rata-rata keystroke saving yang dihasilkan pada pengujian ini adalah 15hingga 25 persen bergantung pada data training.

2. Rata-rata prediksi efektif terjadi di atas 30% dari total prediksi yang terjadi.Hal ini dikarenakan oleh pengaruh dari language model yang dapat langsungmemprediksi kata dengan lebih efektif dan akurat.

3. Frekuensi dari language model yang tinggi sangat mempengaruhi scoringsistem, karena semakin tinggi frekuensi language model suatu kata, makaakan semakin tinggi pula bobot / nilai dari kata itu sendiri.

4. Semakin besar nilai n dalam n-gram berbanding terbalik dengan jumlahfrekuensi keluar yang didapat, yaitu semakin kecil atau lebih jarang keluar.Penggunaan model bi-gram dan tri-gram untuk language model masihmemungkinkan, karena hasil dari jumlah frekuensi keluar pada suku n-gram-nya masih cukup besar dan datanya masih valid apabila diproses lebih lanjut.

Koreksi Ejaan Istilah Komputer Berbasis Kombinasi Algoritma Damerau Levenshtein dan Algoritma Soundex

Akhmad Pahdi

STMIK Banjarbaru

[email protected]

Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 8 No 2 - 2016

ISSN : 1979-9330 (Print) - 2088-0154 (Online)

Fajar Rusdi Wibowo1441177004178

mailto:[email protected]


Kesulitan dalam mengingat, menyebutkan, dan atau menuliskan kata dan penamaan istilah didunia komputer.

TUJUAN PENELITIANMengukur tingkat efektivtas algoritma Damerau-Levenstein yang dikombinasikan dengan algoritma Soundex dalam koreksi ejaan dan pencocokan kata.

User

Highlight

METODE/TEKNIK YANG DITERAPKANMetode yang diterapkan menggunakan algoritma Damerau-Levenshteindikombinasikan dengan algoritma Soundex..

CARA KERJA

Damerau-Levenshtein mencari jarak terpendak dalam mentransformasi kata menjadi kata yang lain, selanjutnya

Soundex memembagi dan mengkelompokkan huruf sesuai dengan kesamaan bunyi.

User

Highlight

PEMBAHASANAlgoritma Damerau-Levenshtein Algoritma Soundex

1.Inisialisasikan n sebagai panjang karakter dari s dan m sebagai panjang karakter dari t. Jika n = 0 atau m = 0, maka kembalikan nilai (return value) berupa jarak edit dengan rumusan:

jarak_edit = max(n, m)

lalu lompat ke langkah 7.

2. Buat sebuah matriks d sebanyak m + 1 baris dan n + 1 kolom. 3. Isi baris pertama dengan 0..n dan isi kolom pertama dengan 0..m. 4. Periksa setiap karakter dari s terhadap t

Jika s[i] = t[j] maka cost = 0.

Jika s[i] ≠ t[j] maka cost = 1.

5. Isikan nilai dari setiap sel d[i, j] baris per baris dengan: d[i, j] = min(x, y, z)

1. Ubah semua huruf menjadi huruf besar atau uppercase, buang semua huruf vokal, tanda baca yang tidak ada hubungan dengan kata, konsonan H,W, dan Y, serta urutan huruf yang sama (misalnya. sss). Huruf pertama selalu dibiarkan seperti semula.

2. Gabung huruf pertama dengan angka pengganti yang sesuai dengan kode numerik yang ditunjukkan pada Tabel 2.1.

3. Ambil empat kode terdepan dan selanjutnya kode tersebut menjadi kode Soundex.

PROSES PENCOCOKAN KATAPencarian kata yang sesuai

Kata kunci : getweyJumlah karakter : 6

1. Inisialisasi n sebagai panjang karakter kata kunci, dan m sebagai panjang karakter kata-kata yang akan diukur jarak kedekatannya (asumsi, kata “activity”), sehingga mendapatkan penghitungan jumlah n=6 dan jumlah m=8

2. Buat matrix d sebanyak m+1 dan n+1 kolom. 3. Pada matriks yang telah dibuat, isi baris pertama dengan 0..n dan isi

kolom pertama dengan 0..m.

4. Periksa setiap karakter dari s terhadap t.5. Isikan nilai dari setiap sel d[i, j] baris per baris. Langkah ini akan selaluberulang sampai semua matriks terisi.

d[1,1] = min((d[1-1,1]+1),(d[1,1-1]+1),(d[1-1,1-1]+cost))= min((d[0,1]+1),(d[1,0]+1),(d[0,0] +1))= min(2,2,1) = 1

d[1,2] = min((d[1-1,2]+1),(d[1,2-1]+1),(d[1-1,2-1]+cost))= min((d[0,2]+1),(d[1,1]+1),(d[0,1]+1)) = min(3,2,2) = 2

6. Setelah langkah iterasi di atas selesai, maka jarak edit akan ditemukan pada sel d[n, m] yaitu sel pada pojok kanan baris terakhir.7. Selesai.

KESIMPULAN

Selama bunyi dan karakter pertama dari kata kunci sama dengan katasumber maka efektivitas algoritma Soundex sedikit lebih baikdibandingkan dengan algoritma Damerau-Levenstein, dengan tingkatkeberhasilan sebesar 74% sedangkan tingkat keberhasilan Damerau-Levenstein sebesar 70%, kombinasi dari algoritma Damerau Levensteindan algoritma Soundex terbukti dapat meningkatkan tingkat akurasikoreksi ejaan untuk Istilah komputer,dengan tingkat akurasi sebesar92% sedangkan 2% Damerau-Levenstein dan Soundex menyarankankata atau istilah komputer yang tidak relevan.

ARSITEKTUR UNTUK APLIKASI DETEKSI KESAMAAN DOKUMEN

BAHASA INDONESIA

Anna Kurniawati, Kemal Ade Sekarwati, I wayan Simri Wicaksana

Fakultas Ilmu komputer dan Teknologi Informasi Universitas Gunadarma

Konferensi Nasional Sistem Informasi 2012,STMIK - STIKOM

Bali , 23-25 Pebruari 2012

Aef Saefulah

1441177004117

Latar Belakang

PlagiatHanya mencari

padakesamaan

judulnya atautema saja

Plagiat

Mencari kesamaankata pada judul

Mencari kesamaanpada gabungan

kata dan kalimat

Mencari kesamaanpada arti dari

keseluruhan kata paragraf dan

dokumen

Tanpa aplikasiDengan aplikasi

Aplikasi Tessy(Test of Text Similarity)

Pembandingandokumen

menggunakanalgoritma Rarp

Kabin

Pembandingandokumen

menggunakanalgoritma Swith

WatermanPlagiat masih bisadilakukan dan ditemukanpada hasil karya tulismahasiswa.

Belum mempertimbanganstruktur kalimat dansinonim untukmembandingkan kalimat.

Peneliti :Didi Achjari

Peneliti :Sinta Agustina

Peneliti :Audi

Novanta

Penelitian pengukuran

kesamaan dokumen

Menggunakan Metode KeywordSimilarity dengan teknik DOT. ObjekPenelitian yang digunakan adalahdokumen berbahasa Inggris. Dokumenyang digunakan sebanyak 20 data.

Menggunakan Metode Dokumenfingerprinting dengan algoritmaWinnowing.

Peneliti :Saul Schleimer 2003,

Noorzima 2005

Peneliti :Parvati Iyer, 2005

Peneliti :Sinta Agustina 2008,

Hari Bagus, 2003.

Menggunakan metode String matchingdengan algoritma Karp Rabin. ObjekPenelitian yang digunakanadalah dokumen berbahasa Indonesia.

Penelitian pengukuran

kemiripan

Metodologi penelitian

• Kemiripan kalimat• Rata-rata kemiripan kalimat• Rata-rata maksimum

kemiripan dokumen

Arsitektur Deteksi Kesamaan Dokumen

Dalam membangun arsitektur untuk aplikasikesamaan dokumen terdiri dari 3 bagian penting, yaitu :

1. Penentuan Struktur Kalimat atau SPOK, 2. Kesamaan Dokumen3. Analisis Sinonim Kata.

Kesimpulan

aplikasi perbaikan ejaan pada pada karya tulis ilmiah · pdf filepenulisan karya ilmiah....

Documents