analisa perbandingan metode hierarchical clustering dan nonhierarchical clustering
DESCRIPTION
Tugas kelompok mata kuliah data mining. sebaiknya jangan digunakan sebagai bahan referensi dahulu. pakai sebagai bahan ajar aja ya.TRANSCRIPT
Data Mining and Knowledge Management
Analisa Perbandingan Metode Hierarchical Clustering dan Nonhierarchical
Clustering (Studi Kasus Pengelompokkan Kabupaten/Kota di Jawa Tengah
Tahun 2008 Berdasarkan Ukuran Moneter dan Nonmoneter)
Disusun Oleh:
Eko Wahyu Lestari (12.7121)
Galang Retno Winarko (12.7151)
Lukman Azhari (12.7225)
Putu Agus Darmawan (12.7315)
Kelas 3KS2
SEKOLAH TINGGI ILMU STATISTIK
Jalan Otto Iskandardinata 64C, Jakarta Timur, Jakarta
2014/2015
BAB I PENDAHULUAN
1.1 Latar Belakang
Kemiskinan merupakan suatu masalah yang terjadi di berbagai negara, terutama di negara-
negara berkembang, termasuk Indonesia. Menurut Badan Pusat Statistik (BPS 2015), kemiskinan
adalah ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan
makanan yang diukur dari sisi pengeluaran. Kemiskinan sering kali disebut-sebut sebagai inti dari
masalah pembangunan di suatu daerah sehingga keberadaan data tentang kemiskinan tersebut
dirasa penting karena menyangkut arah dan tujuan pembangunan di suatu daerah. Secara
internasional, terdapat kesepakatan untuk menanggulangi kemiskinan yang tertuang dalam program
Millennium Development Goals (MDGs) butir pertama. Jika dilihat dari jumlah penduduk miskin,
Provinsi Jawa Tengah merupakan provinsi kedua yang jumlah penduduk miskinnya paling banyak,
yaitu sekitar 4,7 juta atau sekitar 16,48% dari jumlah penduduk miskin di Indonesia. Namun, jika
dilihat dari persentase penduduk miskin di Indonesia, Provinsi Jawa Tengah menempati posisi ke-10,
yaitu sebesar 14,44% (BPS, September 2013).
Karena pentingnya data tentang kemiskinan tersebut, perlu kiranya untuk mengelompokkan
daerah-daerah (dalam hal ini Kabupaten/Kota di Provinsi Jawa Tengah) berdasarkan ukuran
kemiskinan (Head Count Index, Poverty Gap Index, dan Poverty Severity Index) agar dapat diketahui
dengan cepat daerah mana saja yang perlu diberikan perhatian lebih dalam hal pengentasan dan
penanggulangan kemiskinan. Dalam hal ini, penulis bermaksud untuk mengelompokkan daerah-
daerah tersebut menggunakan algoritma klastering hierarki Average Linkage dan
membandingkannya dengan algoritma klastering nonhierarki K-means.
1.2 Tujuan
Tulisan ini bertujuan untuk
a. Mengelompokkan Kabupaten/Kota di Jawa Tengah berdasarkan ukuran kemiskinan moneter
dan nonmoneter yang dicakup dalam 3 variabel yaitu Head Count Index, Poverty Gap Index,
dan Poverty Severity Index
b. Membandingkan penggunaan algoritma hierarchical clustering (Average linkage) dan
algoritma nonhierarchical clustering (K-means)
c. Memberikan rekomendasi arah kebijakan pemerintah dalam hal pengentasan kemiskinan
1.3 Konsep dan Definisi
Penduduk miskin adalah penduduk yang memiliki rata-rata pengeluaran per kapita per bulan di
bawah Garis Kemiskinan.
Kemiskinan adalah ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan
dan bukan makanan yang diukur dari sisi pengeluaran.
Head Count Index (HCI-P0) adalah persentase penduduk miskin yang berada di bawah
GarisKemiskinan (GK).
Indeks Kedalaman Kemiskinan (Poverty Gap Index-P1) merupakan ukuran rata-rata kesenjangan
pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan. Semakin tinggi nilai indeks,
semakin jauh rata-rata pengeluaran penduduk dari garis kemiskinan
Indeks Keparahan Kemiskinan (Poverty Severity Index-P2) memberikan gambaran mengenai
penyebaran pengeluaran di antara penduduk miskin. Semakin tinggi nilai indeks, semakin tinggi
ketimpangan pengeluaran di antara penduduk miskin.
Ukuran kemiskinan Moneter merupakan ukuran kemiskinan yang diukur berdasarkan variabel
moneter (kuantitatif) yaitu pendapatan dan pengeluaran konsumsi perkapita.
Ukuran kemiskinan Nonmoneter merupakan ukuran kemiskinan yang diukur berdasarkan variabel
nonmoneter (kualitatif) yaitu indikator individu dan indikator rumah tangga.
Clustering adalah proses membuat pengelompokan sehingga semua anggota dari setiap partisi
mempunyai persamaan berdasarkan matrik tertentu. Objek data yang terletak di dalam klaster harus
memiliki kemiripan sedangkan yang tidak berada dalam satu klaster tidak mempunyai kemiripan.
BAB II PEMBAHASAN
2.1 Kajian Teori
Metode Pengelompokan Hirarki
Metode pengelompokan hirarki digunakan apabila belum ada informasi jumlah
kelompok. Biasanya, hasil dari pengelompokan dengan metode ini adalah dendogram.
Metode Pengelompokan Nonhirarki
Metode pengelompokan nonhirarki bertujuan mengelompokkan n objek ke dalam k
kelompok (k<n). Salah satu prosedur pengelompokan dengan metode ini adalah K-
Means. Algoritma K-Means adalah metode clustering berbasis jarak yang membagi data
ke dalam sejumlah klaster. Algoritma ini hanya dapat digunakan pada atribut numerik.
Ada banyak cara yang dapat digunakan untuk membandingkan performa dari algoritma K-
Means dan algorima hierarki dalam penclusteran, tergantung dari ukuran apa yang digunakan.
Salah satu ukuran yang dapat digunakan dalam membandingkan algoritma tersebut adalah
dengan melihat nilai entropi dan nilai F Measure (yang dihitung dari nilai recall dan precision).
Entropi
Entropi memanfaatkan probabilitas dari klaster yang terbentuk yang dihitung dengan
rumus
1
n
j ij ij
i
E P LogP
di mana
Pij = probabilitas suatu anggota di klaster j untuk masuk ke cluster i.
Entropi dapat digunakan sebagai ukuran yang menunjukkan kualitas dari hasil clustering
(dengan catatan entropi yang terbaik terjadi saat setiap klaster memiliki tepat satu titik/data).
Nilai entropi yang lebih kecil menghasilkan klaster yang lebih bagus kualitasnya.
F Measure
F measure memanfaatkan ide presisi dan recall pada information retrieval, di mana setiap
klaster diperlakukan seolah-olah seperti hasil dari query dan masing-masing kelas seolah-
olah adalah set yang diinginkan dokumen untuk query, dengan rumus
( , ) ,
( , )
ij
i
ij
j
nrecall i j
n
nprecision i j
n
di mana
n = jumlah anggota klaster
F Measure dihitung dengan rumus
2 ( , ) ( , )( , )
( , ) ( , )
recall i j precision i jF i j
precision i j recall i j
Nilai recall dan precision pada suatu keadaan dapat memiliki bobot yang berbeda. Ukuran
yang menampilkan timbal balik antara recall dan precision adalah F-measure yang merupakan
bobot rata-rata harmonik dari recall dan precision. Semakin besar nilai F-Measure, semakin baik
kualitas klaster tersebut.
Pada saat jumlah data meningkat, kinerja algoritma hirarki berjalan menurun dan waktu
untuk eksekusi meningkat. Waktu eksekusi algoritma K-Means juga meningkat tetapi jika
dibandingkan dengan algoritma hirarki kinerjanya lebih baik. Sebagai kesimpulan umum ,
algoritma K-Means baik untuk dataset yang besar dan hirarkis baik untuk dataset kecil .
Perbandingan antara algoritma ini dapat diimplementasikan atas dasar normalisasi, dengan
mengambil data yang dinormalisasi dan data yang tidak dinormalisasi akan memberikan hasil
yang berbeda .Tidak ada konsensus yang jelas dari dua algoritma ini yang dapat menghasilkan
pengelompokan yang lebih baik.
2.2 Sumber Data
Sampel yang digunakan sebanyak 35, yaitu kabupaten/kota di Provinsi Jawa Tengah dengan
jumlah variabel ada 6. Variabel tersebut terdiri dari ukuran kemiskinan moneter dan nonmoneter
yang masing-masing mempunyai 3 variabel, yaitu : presentase penduduk yang berada di bawah garis
kemiskinan (P0 untuk moneter dan P0* untuk nonmoneter), indeks kedalaman kemiskinan (P1 untuk
moneter dan P1* untuk nonmoneter), indeks keparahan kemiskinan (P2 untuk moneter dan P2
* untuk
nonmoneter). Berikut ini adalah data yang digunakan.
Tabel 1 Data Ukuran Kemiskinan di Provinsi Jawa Tengah Tiap Kabupaten/Kota berdasarkan Susenas
Juli 2008
Kabupaten/Kota Ukuran Kemiskinan Moneter Ukuran Kemiskinan Nonmoneter
P0 P1 P2 P0* P1
* P2*
(1) (2) (3) (4) (5) (6) (7)
Cilacap 21,3992 4,6727 1,3493 27,0558 13,7432 9,2395
Banyumas 22,9347 3,9484 0,9254 21,5845 9,5646 5,5311
Purbalingga 27,2908 5,3969 1,4885 26,5569 12,0025 7,5713
Banjarnegara 23,3406 5,7536 1,7193 31,9548 15,5654 10,1228
Kebumen 27,8737 7,0504 2,0473 22,0945 10,2846 6,1921
Purworejo 18,2223 4,1724 1,2146 17,2864 8,6210 5,6476
Wonosobo 27,7216 8,0687 2,8595 23,9390 9,2457 5,4481
Magelang 16,4889 5,0090 1,6948 21,8843 10,3929 6,4720
Boyolali 17,0762 3,6425 1,0149 32,4205 16,1113 10,4927
Klaten 21,7152 7,0936 2,5033 9,8069 2,7721 2,0764
Sukoharjo 12,1273 2,6338 0,7348 7,4471 3,0411 1,8631
Wonogiri 20,7108 6,0289 2,0555 24,4091 11,2168 7,1206
Karanganyar 15,6848 3,0155 0,7806 6,1175 1,8793 0,8686
Sragen 20,8341 3,4997 0,8460 26,8496 12,4314 7,9593
Grobogan 19,8351 4,4859 1,2319 58,2478 29,7677 19,6901
Blora 18,7922 5,1251 1,6115 64,7850 31,6278 20,8122
Rembang 27,2082 5,4754 1,4258 36,5165 17,0610 10,8962
Pati 17,9042 6,0099 2,0839 23,0363 11,6377 7,8362
Kudus 12,5799 5,7580 0,7052 6,0799 1,7488 0,7855
Jepara 11,0504 1,9916 0,4605 17,7879 8,2205 5,3200
Demak 21,2423 3,8609 0,8807 22,1639 9,7753 5,9686
Semarang 11,3729 2,3284 0,6537 17,2681 7,1223 4,2718
Temanggung 16,394 4,6622 1,5002 22,8160 7,9433 4,2502
Kendal 17,8684 4,0242 1,2336 26,5598 12,1225 7,5475
Batang 18,0824 5,4126 1,9274 32,8894 18,0746 12,9430
Pekalongan 19,5191 4,2270 1,0227 16,0557 7,4132 4,6654
Pemalang 23,9151 3,5898 0,8470 22,3749 10,8396 7,1295
Tegal 15,7832 2,6979 0,6786 12,9754 4,8037 2,4554
Brebes 25,9848 5,0560 1,3607 22,8626 10,4550 6,6121
Kota Magelang 11,1643 1,6758 0,4390 0,9312 0,2800 0,1290
Kota Surakarta 16,1259 2,7122 0,7511 0,4538 0,0920 0,0208
Kota Salatiga 8,4658 1,2831 0,3368 5,2759 1,7800 0,9657
Kota Semarang 5,9966 0,9900 0,2855 0,9749 0,2282 0,0861
Kota Pekalongan 10,2919 1,0311 0,1813 2,1577 0,6910 0,3111
Kota Tegal 11,2756 1,4195 0,2126 0,7955 0,2308 0,0762
Sumber: Skripsi Ricky Abdillah (2011)
Dari data di atas akan dibentuk 3 klaster yaitu klaster dengan tingkat kemiskinan tinggi,
sedang, dan rendah dengan menggunakan hierarchy clustering (Average Linkage) dan nonhierarchy
clustering (K-means). Dari hasil clustering tersebut, akan dibandingkan metode klater mana yang
lebih efektif untuk kasus di atas. Lebih lanjut, data yang diolah adalah data yang sudah distandarisasi
untuk mengurangi bias satuan. Kali ini penulis menggunakan alat bantu software SPSS 20 untuk
clustering data di atas.
2.3 Hierarchy Clustering Menggunakan Algoritma Average Linkage
Tabel 2 Case Processing Summary Algoritma Average Linkage
Berdasarkan tabel di atas, dapat dilihat bahwa data sejumlah 35 obyek telah diproses tanpa
ada data yang hilang.
Tabel 3 Agglomeration Schedule
Tabel di atas merupakan hasil proses clustering dengan metode Average Linkage. Jarak antar
variabel diukur dengan jarak euclidean kemudian dilakukan pengelompokan. Pengelompokan
dilakukan secara bertingkat.
Pada stage 1, terbentuk 1 klaster yang beranggotakan sampel nomor 34 dan 35 dengan jarak
0,093 (terdapat dalam kolom Coefficients). Karena proses aglomerasi dimulai dari 2 obyek yang
terdekat, maka jarak tersebut adalah yang terdekat dari sekian kombinasi jarak 35 obyek yang ada.
Angka 6 pada kolom terakhir, Next Stage, berarti clustering selanjutnya dilakukan pada stage 6.
Demikian seterusnya dari stage 6 dilanjutkan ke stage 14 hingga ke stage terakhir.
Proses aglomerasi ini bersifat kompleks, khususnya perhitungan koefisien yang melibatkan
sekian banyak obyek dan terus bertambah. Proses aglomerasi pada akhirnya akan menyatukan
semua obyek menjadi satu klaster. Klaster yang terbentuk dapat dilihat pada tabel 4 dan
dendogramnya dapat dilihat di gambar 1.
Tabel 4 Cluster Membership
Gambar 1 Dendogram using Average Linkage (Between Group)
2.4 Nonhierarchy Clustering Menggunakan Algoritma K-Means
Tabel 5 Iteration History
Dari tabel 5 dapat disimpulkan bahwa proses iterasi dilakukan sebanyak 5 kali. Proses ini dilakukan
untuk mendapatkan klaster yang sesuai. Jarak minimum antar pusat klaster yang terjadi dari hasil
iterasi adalah 5,918.
Tabel 6 Final Cluster Centers
Berdasarkan tabel 6, dapat dketahui bahwa data di atas masih terkait dengan proses
standarisasi yang mengacu pada z-score dengan ketentuan sebagai berikut.
Nilai negatif (-) berarti data berada di bawah rata-rata total
Nilai positif (+) berarti data berada di atas rata-rata total.
Sedangkan rumus yang digunakan adalah
………………………………………………………………. (1)
di mana:
X = Rata-rata sampel dalam cluster
μ = Rata-rata populasi
Z = Nilai standardisasi
σ = Standar Deviasi
Misalnya, apabila ingin mengetahui rata-rata P0 (presentase penduduk yang berada di bawah garis
kemiskinan moneter) dalam klaster 1 (X), maka
X = (rata-rata P0 seluruh sampel) + (0,60332 x Standar Deviasi rata-rata P0)
= 18,1221 + (0,60332 x 5,77461)
= 21,606
Jadi rata-rata P0 yang berada pada klaster 1 adalah 21,606.
Untuk klaster yang lain dapat dicari rata-rata nilai masing-masing variabel dengan cara yang sama.
Berdasarkan tabel 6, dengan ketentuan yang telah dijelaskan di atas, dapat didefinisikan
sebagai berikut.
a. Klaster 1
Dalam klaster 1 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 yang tinggi dan nilai
P0*, P1
*, dan P2* sedang, artinya kabupaten/kota dalam klaster 1 berdasarkan ukuran moneter
mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang tinggi, rata-rata
kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1)
yang tinggi, dan ketimpangan pengeluaran di antara penduduk miskin (P2) yang tinggi.
Dalam ukuran nonmoneter, klaster ini mempunyai persentase penduduk berada di
bawah garis kemiskinan (P0*) yang sedang, rata-rata kesenjangan pengeluaran masing-masing
penduduk miskin terhadap garis kemiskinan yang sedang (P1*), dan ketimpangan pengeluaran
di antara penduduk miskin (P2*) yang sedang juga. Dengan demikian, dapat diduga bahwa
klaster-1 ini merupakan pengelompokan dari kabupaten/kota menengah yang mempunyai
pendapatan ataupun pengeluaran perkapita rendah namun mempunyai akses sanitasi, air
bersih, dan ukuran nonmoneter lain yang cukup mudah.
b. Klaster 2
Dalam klaster 2 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 serta P0*, P1
*, dan
P2* yang rendah, artinya kabupaten/kota dalam klaster 2 berdasarkan ukuran moneter
mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang rendah, rata-
rata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1)
yang rendah, dan ketimpangan pengeluaran di antara penduduk miskin (P2) yang rendah.
Berdasarkan ukuran nonmoneter, klaster ini mempunyai presentase penduduk berada
di bawah garis kemiskinan (P0*) yang rendah, rata-rata kesenjangan pengeluaran masing-
masing penduduk miskin terhadap garis kemiskinan (P1*) yang rendah, dan ketimpangan
pengeluaran di antara penduduk miskin (P2*) yang rendah. Berdasarkan hal tersebut, klaster-2
ini diduga merupakan pengelompokan dari kabupaten/kota yang maju, yaitu yang mempunyai
pendapatan ataupun pengeluaran perkapita tinggi dan juga mempunyai akses sanitasi, air
bersih, dan lain-lain yang sangat mudah.
c. Klaster 3
Dalam klaster 3 ini berisi kabupaten/kota dengan nilai P0, P1, dan P2 yang sedang dan
nilai P0*, P1
*, dan P2* yang tinggi. Artinya, kabupaten/kota dalam klaster 3 berdasarkan ukuran
moneter mempunyai presentase penduduk berada di bawah garis kemiskinan (P0) yang
sedang, rata-rata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis
kemiskinan (P1) yang sedang, dan ketimpangan pengeluaran di antara penduduk miskin (P2)
yang sedang.
Jika dilihat berdasarkan ukuran nonmoneter, klaster ini mempunyai presentase
penduduk berada di bawah garis kemiskinan (P0*) yang tinggi, rata-rata kesenjangan
pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan (P1*) yang tinggi,
serta ketimpangan pengeluaran di antara penduduk miskin (P2*) yang tinggi. Klaster-3 ini
diduga merupakan pengelompokan dari kabupaten/kota kecil yang mempunyai pendapatan
ataupun pengeluaran perkapita sedang namun mempunyai akses sanitasi, air bersih, dan
sebagainya yang sulit.
Perlu diingat kembali, penamaan masing-masing klaster sangat bersifat subjektif tergantung
pada peneliti dengan mengacu pada tujuan penelitian. Tabel berikut ini merupakan tabel Anova
yang dapat digunakan untuk melihat perbedaan variabel pada klaster yang terbentuk. Dalam hal ini
dapat dilihat dari nilai F dan nilai probabilitas (sig) masing-masing variabel.
Tabel 7 ANOVA
Kesimpulannya adalah semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan
variabel pada klaster yang terbentuk.
Berdasarkan tabel yang didapatkan, untuk semua variabel menunjukkan adanya perbedaan di
antara kabupaten/kota pada ketiga klaster yang terbentuk. Hal ini dengan ditunjukkan dengan nilai
sig = 0,000.
Tabel 8 Number of Cases in each Cluster
Jumlah anggota masing-masing klaster yang terbentuk
dapat diketahui dari tabel di atas. Dari tabel tersebut, dapat
dilihat bahwa klaster-1 beranggotakan 21 kabupaten/kota,
klaster-2 berisi 12 kabupaten/kota, dan pada klaster-3
terdapat 2 kabupaten/kota. Berikut adalah tabel yang
menunjukkan kabupaten/kota mana saja yang masuk ke dalam
klaster 1, 2, ataupun 3.
Tabel 9 Hasil Clustering Menggunakan Algoritma K-Means
Cluster 1 QCL_2 Cluster 2 QCL_2 Cluster 3 QCL_2
(1) (2) (3) (4) (5) (6)
Cilacap 0,65404 Sukoharjo 0,48447 Grobogan 0,44868
Banyumas 1,21576 Karanganyar 0,95766 Blora 0,44868
Purbalingga 1,01994 Kudus 0,53191
Banjarnegara 1,12144 Jepara 1,3491
Kebumen 1,75996 Semarang 1,15125
Purworejo 1,13201 Tegal 0,99708
Wonosobo 2,86353 Kota Magelang 0,61207
Magelang 0,95916 Kota Surakarta 1,08426
Boyolali 1,73322 Kota Salatiga 0,78721
Klaten 2,6144 Kota Semarang 1,34156
Wonogiri 0,97717 Kota Pekalongan 0,92186
Sragen 1,3864 Kota Tegal 0,81671
Rembang 1,68831
Pati 1,1944
Demak 1,24212
Temanggung 1,19935
Kendal 0,99843
Batang 1,80709
Pekalongan 1,33859
Pemalang 1,38683
Brebes 0,82133
Tabel di atas dapat ditafsirkan sebagai berikut :
Klaster-1: berisikan Kab. Cilacap, Kab. Banyumas, Kab. Purbalingga, Kab. Banjarnegara, Kab.
Kebumen, Kab. Purworejo, Kab. Wonosobo, Kab. Magelang, Kab. Boyolali, Kab. Klaten, Kab.
Wonogiri, Kab. Sragen, Kab. Rembang, Kab. Pati, Kab. Demak, Kab. Temanggung, Kab. Kendal, Kab.
Batang, Kab. Pekalongan, Kab. Pemalang, dan Kab.Brebes dengan masing-masing jarak terhadap
pusat klaster-1 tercantum dalam kolom 2.
Klaster-2: berisikan Kab. Sukoharjo, Kab. Karanganyar, Kab. Kudus, Kab. Jepara, Kab. Semarang, Kab.
Tegal, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang, Kota Pekalongan, dan Kota
Tegal dengan masing-masing jarak terhadap pusat klaster-2 tercantum dalam kolom 4.
Klaster-3: berisikan Kab. Grobogan, Kab. Bloro dengan masing-masing jarak terhadap pusat klaster-3
tercantum dalam kolom 6.
BAB III PENUTUP
Dari hasil di atas, dapat ditarik kesimpulan sebagai berikut.
1. Kabupaten/Kota di Jawa Tengah dikelompokkan ke dalam 3 klaster, yaitu:
Klaster pertama berisi kabupaten/kota menengah yang anggotanya berjumlah 21
Kab/Kota, yaitu: Kab. Cilacap, Kab. Banyumas, Kab. Purbalingga, Kab. Banjarnegara,
Kab. Kebumen, Kab. Purworejo, Kab. Wonosobo, Kab. Magelang, Kab. Boyolali, Kab.
Klaten, Kab. Wonogiri, Kab. Sragen, Kab. Rembang, Kab. Pati, Kab. Demak, Kab.
Temanggung, Kab. Kendal, Kab. Batang, Kab. Pekalongan, Kab. Pemalang, dan
Kab.Brebes
Klaster kedua berisi kabupaten/kota besar (maju) yang anggotanya berjumlah 12
Kab/Kota, yaitu Kab. Sukoharjo, Kab. Karanganyar, Kab. Kudus, Kab. Jepara, Kab.
Semarang, Kab. Tegal, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang,
Kota Pekalongan, dan Kota Tegal
Klaster ketiga berisi kabupaten/kota kecil (terbelakang) yang anggotanya berjumlah
2 Kab/Kota, yaitu Kab. Grobogan dan Kab. Bloro
2. Penggunaan algoritma hierarchical clustering (average linkage) dan nonhierarchical
clustering (k-means) dalam hal ini menghasilkan klaster yang anggotanya sama.
3. Rekomendasi arah kebijakan pemerintah yang dapat diambil adalah sebagai berikut.
Pemerintah Jawa Tengah seharusnya memfokuskan pemberantasan kemiskinan di
Kabupaten Grobogan dan Blora dengan cara meningkatkan pembangunan sarana
dan prasarana umum di daerah tersebut seperti pembangunan sarana air bersih,
dan sanitasi.
Pemerintah Jawa Tengah dapat memfokuskan pemberantasan kemiskinan di Kab.
Cilacap, Kab. Banyumas, Kab. Purbalingga, Kab. Banjarnegara, Kab. Kebumen, Kab.
Purworejo, Kab. Wonosobo, Kab. Magelang, Kab. Boyolali, Kab. Klaten, Kab.
Wonogiri, Kab. Sragen, Kab. Rembang, Kab. Pati, Kab. Demak, Kab. Temanggung,
Kab. Kendal, Kab. Batang, Kab. Pekalongan, Kab. Pemalang, dan Kab.Brebes dengan
cara menciptakan lapangan pekerjaan ataupun pengadaan pelatihan kerja agar
pendapatan rumah tangga di kabupaten/kota tersebut bisa membaik.
Untuk kabupaten/kota yang belum disebutkan di atas (klaster 2), Pemerintah dapat
meneliti lebih lanjut faktor-faktor apa yang menyebabkan kabupaten/kota tersebut
lebih maju dari pada kabupaten/kota lainnya agar hasilnya dapat digunakan untuk
referensi pembangunan di kabupaten/kota lain yang belum maju.
DAFTAR PUSTAKA
Abdillah, Ricky. 2011. Pengelompokan Kabupaten/Kota Berdasarkan Ukuran Kemiskinan
Nonmoneter di Jawa Tengah (Analisa Data Susenas Juli 2008). Jakarta: Sekolah Tinggi Ilmu
Statistik.
Badan Pusat Statistik. 2014. Statistik Indonesia 2014. Jakarta: Badan Pusat Statistik.
http://www.bps.go.id/Subjek/view/id/23, diakses pada 5 Mei 2015 21:00 WIB
http://www.slideshare.net/miraclemin1/4-kemiskinan-ketimpangan-dan-pembangunan, diakses
pada 5 Mei 2015 21:00 WIB
https://www.academia.edu/5263304/Masalah_dan_Strategi_Pengentasan_Kemiskinan_di_Indonesi
a_, diakses pada 5 Mei 2015 21:00 WIB
Kaur, Manpreet dan Usvir Kaur. 2013. Comparison Between K-Mean and Hierarchical Algorithm
Using Query Redirection. Punjab: Sri Guru Granth Sahib World University.
Langgeni, Diah Pudi, ZK. Abdurahman Baizal, dan Yanuar Firdaus A.W. 2010. Clustering Artikel Berita
Berbahasa Indonesia Menggunakan Unsupervised Feature Selection. Bandung: Institut
Teknologi Telkom.
Steinbach, Michael, George Karypis, dan Vipin Kumar. 2000. A Comparison of Document Clustering
Techniques. Minesota: University of Minnesota.
Wicaksana, I Made Kunta dan I Made Widiartha. 2012. Penerapan Metode Ant Colony Optimzation
Pada Metode K-Harmonic Means Untuk Klasterisasi Data. Bali: Universitas Udayana.