febriyana fst

Upload: etsaabankputra

Post on 02-Jun-2018

248 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/10/2019 Febriyana Fst

    1/73

    ANALISIS KLASTER K-MEANSDAN K-MEDIANPADA

    DATA INDIKATOR KEMISKINAN(Studi Kasus Data Indikator Kemiskinan Kabupaten di Indonesia Tahun 2009)

    Febriyana

    PROGRAM STUDI MATEMATIKA

    FAKULTAS SAINS DAN TEKNOLOGI

    UNIVERSITAS ISLAM NEGERI

    SYARIF HIDAYATULLAH

    JAKARTA

    2011 M / 1432 H

  • 8/10/2019 Febriyana Fst

    2/73

    ANALISIS KLASTER K-MEANSDAN K-MEDIANPADA

    DATA INDIKATOR KEMISKINAN(Studi Kasus Data Indikator Kemiskinan Kabupaten di Indonesia Tahun 2009)

    SkripsiSebagai Satu Syarat Untuk Memperoleh

    Gelar Sarjana Sains

    Fakultas Sains dan Teknologi

    Universitas Islam Negeri Syarif Hidayatullah Jakarta

    OlehFebriyana

    107094002893

    PROGRAM STUDI MATEMATIKA

    FAKULTAS SAINS DAN TEKNOLOGI

    UNIVERSITAS ISLAM NEGERI

    SYARIF HIDAYATULLAH

    JAKARTA

    2011 M / 1432 H

  • 8/10/2019 Febriyana Fst

    3/73

    ii

    PENGESAHAN PEMBIMBING

    ANALISIS KLASTER K-MEANSDAN K-MEDIANPADA DATA

    INDIKATOR KEMISKINAN

    (Studi Kasus Data Indikator Kemiskinan Kabupaten di Indonesia Tahun 2009)

    Skripsi

    Sebagai satu syarat untuk memperolehGelar sarjana sains

    Fakultas Sains dan Teknologi

    Universitas Islam Negeri Syarif Hidayatullah Jakarta

    Oleh

    Febriyana

    107094002893

    Menyetujui,

    Dosen Pembimbing I Dosen Pembimbing II

    Sumainna, M.Si Bambang Ruswandi, M. Stat

    NIP. 150 408 699 NIDN. 0305108301

    Mengetahui :Ketua Program Studi Matematika

    Yanne Irene, M. Si

    NIP. 19741231 200501 2018

  • 8/10/2019 Febriyana Fst

    4/73

    iii

    PENGESAHAN UJIAN

    Skripsi berjudul Analisis Klaster K-Means dan K-Median Pada DataIndikator Kemiskinan yang ditulis oleh Febriyana, NIM 107094002893 telah di uji

    dan dinyatakankan lulus dalam sidang Munaqosyah Fakultas Sains dan Teknologi

    Universitas Islam Negeri Syarif Hidayatullah Jakarta pada tanggal 8 Juni 2011 Skripsi

    ini telah diterima sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu

    (S1) Program Matematika.

    Menyetujui,

    Penguji 1, Penguji 2,

    Taufik Edy Sutanto, M. ScTech Dr. Agus Salim, M.Si

    NIP. 19790530 200604 1002 NIP. 19720816 199903 1 003

    Pembimbing 1, Pembimbing 2,

    Sumainna, M.Si Bambang Ruswandi, M. Stat

    NIP. 150408699 NIDN. 0305108301

    Mengetahui :

    Dekan Fakultas Sains dan Teknologi, Ketua Program Studi Matematika,

    DR. Syopiansyah Jaya Putra, M. Sis Yanne Irene, M. Si

    NIP. 19680117 200112 1001 NIP. 19741231 200501 2018

  • 8/10/2019 Febriyana Fst

    5/73

    iv

    PERNYATAAN

    DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-

    BENAR HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN

    SEBAGAI SKRIPSI PADA PERGURUAN TINGGI ATAU LEMBAGA

    MANAPUN.

    Jakarta, Juni 2011

    Febriyana

    107094002893

  • 8/10/2019 Febriyana Fst

    6/73

    K ar ya ini ku per sembahkan unt uk

    Orangtuaku tercinta yang telah banyak mencurahkan

    kasih say ang dan dukungan baik m or il m aupun m at er i

    Fit r iana Fadhillah

    K edua adikku

    M otto

    Sesungguhny a setelah kesuli tan ter dapa t kemuda han . Setelah

    tangisan t er dapat seny um an. D an segala kesulit an a kan

    ber akhir dengan izin A llah.

  • 8/10/2019 Febriyana Fst

    7/73

    v

    ABSTRAK

    Analisis klaster merupakan salah satu metode multivariateyang bertujuanuntuk mengelompokkan objek berdasarkan kemiripan atau ketidakmiripan

    karakteristiknya, sehingga objek yang terletak pada satu klaster memiliki

    kemiripan yang lebih besar dibandingkan dengan objek pengamatan yang terletak

    pada klaster lain. K-means merupakan salah satu metode pengklasteran tidak

    berhirarki yang paling banyak digunakan, namun karena menggunakan rataansebagai pusat klasternya, metode ini lebih sensitif terhadap keberadaan pencilan

    pada data. Metode K-median yang menggunakan median sebagai nilai pusat

    klasternya dinilai dapat mengatasi adanya pencilan. Penelitian ini bertujuan untuk

    membandingkan hasil analisis klaster k-means dengan k-median dari data

    indikator kemiskinan kabupaten di Indonesia tahun 2009.

    Hasil pengklasteran menunjukkan bahwa pada metode k-means klasterpertama terdapat 395 kabupaten dan pada klaster kedua terdapat 76 kabupaten.

    Sedangkan pada metode k-medianpada klaster pertama terdapat 99 kabupaten dan

    pada klaster kedua terdapat 372 kabupaten. Berdasarkan nilai ketepatan klasifikasi

    klaster K-means memiliki tingkat ketepatan klasifikasi yang lebih baik yaitusebesar 98,51 Sedangkan pada k-median tingkat ketepatan klasifikasi sebesar

    97,57%. Sehingga dapat disimpulkan bahwa pada kasus ini metode pengklasteran

    k-meanslebih baik dibandingkan dengan k-median.

    Kata Kunci: Kemiskinan, K-means, K-median

  • 8/10/2019 Febriyana Fst

    8/73

  • 8/10/2019 Febriyana Fst

    9/73

    vii

    KATA PENGANTAR

    Segala puji dan syukur yang sebesar-besarnya penulis panjatkan kehadirat

    Allah SWT, karena dengan rahmat dan karunia-Nya penulis dapat menyelesaikan

    tugas akhir ini tepat pada waktunya. Shalawat serta salam semoga selalu tercurah

    kepada Nabi Muhammad SAW, keluarga, sahabat serta segenap umatnya.

    Penulis sadar bahwa skripsi ini tidak akan selesai bila penulis tidak

    mendapat bantuan dari berbagai pihak, baik bantuan secara langsung maupun

    dukungan moril dan doa. Oleh karena itu penulis ingin mengucapkan terima kasih

    yang sebesar-besarya kepada:

    1.

    Dr. Syopyansyah Jaya Putra, M.Si, Dekan Fakultas Sains dan Teknologi UIN

    Syarif Hidayatullah Jakarta.

    2. Ibu Yanne Irene, M.Si, Ketua Program Studi Matematika dan Ibu Sumainna,

    M.Si, Sekretaris Program Studi Matematika.

    3. Ibu Sumainna, M.Si, sebagai Dosen Pembimbing I, yang telah meluangkan

    waktunya untuk memberikan bimbingan dan pengarahan hingga

    terselesaikannya skripsi ini.

    4. Bapak Bambang Ruswandi, M.Stat, sebagai Dosen Pembimbing II, atas

    bimbingan, saran dan bantuannya dari awal hingga terselesaikannya skripsi

    ini.

    5. Ayahanda tercinta yang telah menghabiskan waktu dan tenaga tanpa

    mengenal batas untuk memberikan yang terbaik bagi penulis agar dapat

    meraih cita-cita serta segenap kasih sayang dan perhatiannya.

  • 8/10/2019 Febriyana Fst

    10/73

    viii

    6.

    Ibunda tercinta yang selalu memberikan semagat dan dukungan kepada

    penulis, atas doa, kasih sayang, dorongan, pengertian dan kesabaran yang tak

    terkira hingga penulis dapat menyelesaikan skripsi ini.

    7. Seluruh dosen jurusan Matematika, Fakultas Sains dan Teknologi UIN Syarif

    Hidayatullah Jakarta yang telah memberikan segenap ilmu.

    8. Fitriana Fadhillah yang telah meluangkan banyak waktunya untuk membantu

    menyelesaikan skripsi ini serta memberikan dukungan moril dan kesabaran.

    9. Dua adikku, seluruh keluarga besarku dan keluarga Dhila yang telah

    memberikan perhatian, dukungan dan doanya.

    10. Seluruh karyawan dan murid Primagama Pondok Cabe yang selalu

    memberikan dorongan motivasi kepada penulis hingga terselesaikan skripsi

    ini.

    11.

    Seluruh teman-teman Matematika 2007 yang penuh kekeluargaan dan selalu

    memberikan motivasi kepada penulis dalam menyelesaikan skripsi ini.

    Penulis menyadari dalam skripsi ini masih terdapat banyak kekurangan.

    Penulis mengharapkan kritik dan saran agar penulis dapat memperbaiki

    kekurangan yang ada. Penulis berharap semoga tugas akhir ini bermanfaat bagi

    penulis khususnya, dan pihak lain umumnya.

    Jakarta, Juni 2011

    Penulis

  • 8/10/2019 Febriyana Fst

    11/73

    ix

    DAFTAR ISI

    HALAMAN JUDUL ..................................................................................... i

    PENGESAHAN PEMBIMBING ................................................................. ii

    PENGESAHAN UJIAN ............................................................................... iii

    PERNYATAAN ............................................................................................ iv

    PERSEMBAHAN DAN MOTTO

    ABSTRAK ..................................................................................................... v

    ABSTRACT ................................................................................................... vi

    KATA PENGANTAR ................................................................................... vii

    DAFTAR ISI ................................................................................................. ix

    DAFTAR TABEL ......................................................................................... xi

    DAFTAR LAMPIRAN ................................................................................. xii

    BAB I PENDAHULUAN ......................................................................... 1

    1.1. Latar Belakang ......................................................................... 1

    1.2. Permasalahan ........................................................................... 3

    1.3. Pembatasan Masalah ................................................................ 3

    1.4. Tujuan Penelitian ..................................................................... 4

    1.5. Manfaat Penelitian ................................................................... 4

    BAB II LANDASAN TEORI .................................................................... 6

    2.1. Kesejahteraan .......................................................................... 6

    2.2. Kemiskinan .............................................................................. 6

    2.3. Analisis Klaster ........................................................................ 9

  • 8/10/2019 Febriyana Fst

    12/73

    x

    2.4. Ukuran Kemiripan .................................................................... 10

    2.5. K-means Klaster ..................................................................... 11

    2.6. K-medianKlaster .................................................................... 12

    2.7. Analisis Diskriminan ............................................................... 13

    BAB III METODOLOGI PENELITIAN ................................................... 16

    3.1. Sumber Data ........................................................................... 16

    3.2. Variabel Penelitian ................................................................. 16

    3.3. Uji Multikolinieritas ............................................................... 18

    3.4. UjiNormal Multivariate ......................................................... 18

    3.5. Metode Kerja ........................................................................... 19

    3.6. Alur Penelitian ......................................................................... 23

    BAB IV HASIL DAN PEMBAHASAN ..................................................... 24

    4.1. Deskripsi Data ........................................................................ 24

    4.2. Pengujian Asumsi Multikolinieritas ....................................... 25

    4.3. Pembentukan Klaster K-means .............................................. 25

    4.4. Pembentukan Klaster K-median ............................................. 29

    4.5. Analisis Diskriminan .............................................................. 33

    BAB V KESIMPULAN DAN SARAN .................................................... 37

    5.1. Kesimpulan ............................................................................. 37

    5.2. Saran ....................................................................................... 38

    DAFTAR PUSTAKA .................................................................................... 39

    LAMPIRAN .................................................................................................. 41

  • 8/10/2019 Febriyana Fst

    13/73

    xi

    DAFTAR TABEL

    Tabel 4.1 : Deskripsi Data ............................................................................ 24

    Tabel 4.2 : Nilai VIF Setiap Variabel ............................................................. 25

    Tabel 4.3 : Jumlah Anggota Setiap Klaster K-means...................................... 25

    Tabel 4.4 : Rata-rata Setiap Variabel Pada Klaster 1 ................................... 26

    Tabel 4.5 : Rata-rata Setiap Variabel Pada Klaster 2 ................................... 27

    Tabel 4.6 : Variansi Setiap Variabel .............................................................. 28

    Tabel 4.7 : Jumlah Anggota Setiap Klaster K-median.................................... 29

    Tabel 4.8 : Rata-rata Setiap Variabel Pada Klaster 1 ................................... 30

    Tabel 4.9 : Rata-rata Setiap Variabel Pada Klaster 2 .................................. 31

    Tabel 4.10 : Variansi Setiap Variabel ............................................................. 32

    Tabel 4.11 : Ketepatan Klasifikasi K-means .................................................. 34

    Tabel 4.12 : Ketepatan Klasifikasi K-median ................................................ 35

  • 8/10/2019 Febriyana Fst

    14/73

    xii

    DAFTAR LAMPIRAN

    Lampiran 1 : Hasil Pengklasteran .................................................................. 41

    Lampiran 2 : Output Nilai Variance Inflation Factor (VIF) ........................... 54

    Lampiran 3 : Perhitungan Nilai Pada K-means ........................................ 54

    Lampiran 4 : Perhitungan Nilai Pada K-median ...................................... 55

    Lampiran 5 : Ketepatan Klasifikasi K-means ................................................ 56

    Lampiran 6 : Ketepatan Klasifikasi K-median .............................................. 57

    Lampiran 7 : Perhitungan rata-rata setiap variabel pada klaster k-means ...... 57

    Lampiran 8 : Perhitungan rata-rata setiap variabel pada klaster k-median...... 57

  • 8/10/2019 Febriyana Fst

    15/73

    1

    BAB I

    PENDAHULUAN

    1.1 Latar belakang

    Kesejahteraan merupakan tumpuan harapan dan menjadi cita-cita

    luhur perjuangan bangsa Indonesia sejak proklamasi kemerdekaan. Selain

    itu kesejahteraan merupakan hal yang menentukan suatu pembangunan di

    suatu daerah. Kesejahteraan masyarakat diharapkan meningkat dari tahun ke

    tahun.

    Salah satu masalah di bidang kesejahteraan adalah kemiskinan.

    Kemiskinan menjadi permasalahan yang dihadapi oleh semua negara di

    dunia, terutama di negara yang sedang berkembang seperti halnya

    Indonesia. Hingga tahun 2010, BPS memperkirakan hampir 13,33% dari

    total penduduk Indonesia masih hidup dalam kondisi miskin.

    Indonesia memiliki potensi yang luar biasa dengan segala sumber

    daya yang ada. Seharusnya hal ini dapat dimanfaatkan dengan baik oleh

    pemerintah dalam meningkatkan kesejahteraan masyarakat Indonesia.

    Namun kenyataannya permasalahan kemiskinan menjadi salah satu

    permasalahan yang cukup penting di Indonesia. Kondisi ini menggambarkan

    bahwa kemiskinan merupakan masalah sosial, baik di tingkat nasional

    maupun regional dan perlu mendapatkan penanganan yang serius dari

    seluruh masyarakat. Oleh karena itu permasalahan kemiskinan harus segera

    diatasi.

  • 8/10/2019 Febriyana Fst

    16/73

    2

    Kemiskinan terjadi bukan hanya karena rendahnya pendapatan tetapi

    juga karena keterbatasan sarana dan prasarana rumah tangga. Suatu rumah

    tangga tidak memiliki fasilitas buang air besar belum tentu dapat dikatakan

    miskin karena tingkat perekonomiannya cukup tinggi. Hal ini terjadi karena

    rumah tangga tersebut menerapkan pola kehidupan tempat tinggalnya.

    Selama ini pemerintah telah berupaya mengatasi permasalahan

    kemiskinan. Salah satunya yaitu dengan memberikan bantuan kepada rumah

    tangga miskin antara lain dengan memberikan bantuan langsung tunai

    (BLT), pemberian kartu jaminan kesehatan dan lain sebagainya. Namun

    permasalahan mendasar yang sangat penting dan dapat mengganggu

    keberhasilan program ini adalah salah sasaran (mis-targeting). Salah satu

    penyebabnya adalah belum adanya informasi mengenai kondisi aktual

    kemiskinan pada setiap kabupaten.

    Untuk mengatasi hal tersebut, pemerintah memerlukan gambaran

    kondisi sosial ekonomi kabupaten/kota di Indonesia berupa kegiatan

    evaluasi dan studi kasus yang dapat mengelompokkan kabupaten-kabupaten

    di Indonesia untuk mengetahui karakteristik kabupaten tersebut dalam

    bidang kemiskinan. Sehingga dapat menentukan kabupaten mana saja yang

    diprioritaskan untuk mendapatkan bantuan dari pemerintah.

    Dalam statistika, salah satu metode yang digunakan untuk

    mengelompokkan variabel atau objek adalah analisis klaster. Analisis

    klaster merupakan suatu metode untuk mengelompokkan variabel atau

    objek ke dalam beberapa kelompok. Setiap unit pengamatan dalam satu

  • 8/10/2019 Febriyana Fst

    17/73

    3

    kelompok akan mempunyai ciri yang relatif sama sedangkan antar

    kelompok unit pengamatan memiliki sifat yang berbeda [1].

    Ada beberapa metode pengelompokkan dalam analisis klaster, antara

    lain k-means klaster dan k-median klaster. Berdasarkan penelitian Yanne

    Flowrensia (2010) pada kasus pengelompokkan karakteristik tanaman bunga

    iris, metode pengelompokkan k-median lebih baik dibandingkan k-means

    dalam pengelompokkan data yang mengandung outlier [5].

    Pengelompokkan ini bermanfaat bagi pemerintah dalam menentukan

    kabupaten mana saja yang diprioritaskan untuk mendapatkan bantuan. Oleh

    karena itu penulis tertarik untuk melakukan penelitian mengenai hal tersebut

    dengan judul Analisis Klaster K-Means dan K-Median pada data

    indikator kemiskinan studi kasus data indikator kemiskinan kabupaten

    di Indonesia Tahun 2009.

    1.2 Permasalahan

    Rumusan masalah penelitian ini dapat dirinci ke dalam beberapa

    pertanyaan penelitian sebagai berikut :

    1. Bagaimana hasil pengklasifikasian K-Meansdan K-Median.

    2. Kabupaten mana saja di Indonesia yang diprioritaskan untuk

    mendapatkan bantuan dari pemerintah untuk periode 2010 hingga 2015.

    1.3 Pembatasan Masalah

    Agar dalam pembahasan tidak terlalu luas dan hasilnya dapat

    mendekati pokok permasalahan, maka dalam penelitian ini hanya

    membahas pengelompokkan pada data kemiskinan kabupaten di Indonesia

  • 8/10/2019 Febriyana Fst

    18/73

    4

    tahun 2009 serta analisis yang dilakukan berdasarkan data-data yang

    diperoleh pada waktu penelitian.

    1.4 Tujuan Penelitian

    Penelitian ini dilakukan dengan tujuan sebagai berikut :

    1. Untuk membandingkan hasil klasifikasi K-Means dengan hasil

    klasifikasi K-Median.

    2. Mengelompokkan kabupaten-kabupaten di Indonesia berdasarkan

    indikator kemiskinan untuk mengetahui kabupaten mana yang perlu

    mendapatkan prioritas bantuan dari pemerintah agar program

    pemerintah tepat sasaran.

    1.5 Manfaat Penelitian

    Hasil penelitian ini diharapkan dapat digunakan untuk :

    1. Manfaat Teoritis

    Dapat digunakan sebagai bahan referensi untuk penelitian lanjutan,

    dengan tema yang sama akan tetapi dengan metode dan teknik analisa

    yang berbeda. Sehingga dapat dilakukan proses verifikasi demi kemajuan

    ilmu pengetahuan.

    2. Manfaat Praktis

    a. Bagi pemerintah

    Sebagai dasar untuk menentukan kabupaten mana saja yang harus

    diprioritaskan untuk mendapat bantuan, sehingga tidak terjadi lagi

    salah sasaran.

  • 8/10/2019 Febriyana Fst

    19/73

    5

    b.

    Bagi penulis

    Hasil penelitian ini dapat dijadikan bahan temuan awal untuk

    melakukan penelitian lebih lanjut mengenai indikator-indikator

    kemiskinan, serta dapat menerapkan ilmu-ilmu yang telah didapat

    selama kuliah.

    c. Bagi pembaca

    Hasil penelitian diharapkan dapat digunakan sebagai bahan bacaan

    dan acuan bagi pembaca yang sedang melakukan penelitian di bidang

    kemiskinan.

  • 8/10/2019 Febriyana Fst

    20/73

    6

    BAB II

    TINJAUAN PUSTAKA

    2.1 Kesejahteraan

    Kesejahteraan mencakup bidang-bidang kehidupan yang sangat luas

    dan semua aspeknya tidak dapat diukur. Sebuah keluarga dapat dikatakan

    sejahtera apabila seluruh kebutuhan jasmani dan rohani dari keluarga

    tersebut dapat terpenuhi sesuai dengan tingkat hidup masing-masing

    keluarga [2].

    Kesejahteraan dalam konsep dunia modern adalah sebuah kondisi

    dimana seorang dapat memenuhi kebutuhan pokok, baik itu kebutuhan akan

    makanan, pakaian, tempat tinggal, air minum yang bersihserta kesempatan

    untuk melanjutkan pendidikan dan memiliki pekerjaan yang memadaiyang

    dapat menunjang kualitas hidupnya sehingga memiliki status sosial yang

    mengantarkan pada status sosial yang sama terhadap sesama warga lainnya

    [2].

    2.2 Kemiskinan

    Masalah sosial bersifat relatif, namun secara pasti banyak sekali

    permasalahan sosial yang terjadi dalam masyarakat Indonesia. Untuk

    memudahkan penanganannya, pemerintah mengklasifikasikan masalah

    sosial dalam lima masalah utama, yaitu kemiskinan, kecacatan,

    keterlantaran, ketunaan sosial, dan kebencanaan. Namun di antara kelima

  • 8/10/2019 Febriyana Fst

    21/73

  • 8/10/2019 Febriyana Fst

    22/73

    8

    Kemiskinan memiliki beberapa ciri sebagai berikut :

    1. Ketidakmampuan memenuhi kebutuhan konsumsi dasar (pangan,

    sandang dan papan).

    2. Ketiadaan akses terhadap kebutuhan hidup dasar lainnya (kesehatan,

    pendidikan, sanitasi, air bersih dan transportasi).

    3. Ketiadaan jaminan masa depan (karena tiadanya investasi untuk

    pendidikan dan keluarga).

    4. Kerentanan terhadap goncangan yang bersifat individual maupun massal.

    5. Rendahnya kualitas sumber daya manusia dan keterbatsaan sumber alam.

    6. Ketidakterlibatan dalam kegiatan sosial masyarakat.

    7. Ketiadaaan akses terhadap lapangan kerja dan mata pencaharian yang

    berkesinambungan.

    8. Ketidakmampuan untuk berusaha karena cacat fisik maupun mental.

    9.

    Ketidakmampuan dan ketidaksinambungan sosial (anak terlantar, wanita

    korban tindak kekerasan rumah tangga, janda miskin, kelompok marjinal

    dan terpencil).

    Terdapat 14 indikator kemiskinan yaitu luas lantai, jenis lantai, jenis

    dinding, fasilitas buang air besar, sumber air minum, sumber penghasilan

    kepala rumah tangga, sumber penerangan rumah tangga, jenis bahan bakar

    untuk memasak setiap hari, frekuensi pembelian pakaian baru dalam

    setahun, frekuensi mengkonsumsi daging atau susu dalam seminggu,

  • 8/10/2019 Febriyana Fst

    23/73

    9

    frekuensi makan dalam sehari, biaya kesehatan, pendidikan tertinggi kepala

    rumah tangga, dan tabungan [12].

    2.3 Analisis Klaster

    Analisis klaster merupakan teknik multivariate (banyak variabel)

    yang berfungsi mengelompokkan beberapa variabel atau objek [9]. Dalam

    analisis klaster, ingin mengetahui pengaruh dari setiap variabel bebas, baik

    secara individu maupun bersama terhadap variabel tidak bebas.

    Tujuan utama analisis klaster adalah mengklasifikasi objek seperti

    orang, produk atau barang, perusahaan, ke dalam kelompok-kelompok yang

    homogeny dan didasarkan pada suatu set variabel yang dipertimbangkan

    untuk diteliti. Pembentukan klaster didasarkan pada kuat tidaknya hubungan

    antar variabel. Suatu objek dimasukkan ke dalam suatu klaster atau

    kelompok sehingga lebih berhubungan (berkorelasi) dengan objek lainnya

    di dalam klasternya dibandingkan dengan objek di klaster lain.

    Terdapat dua metode dalam analisis klaster, yaitu metode hirarki dan

    metode non-hirarki. Pada metode non-hirarki umumnya digunakan jika

    banyaknya satuan pengamatan besar dan banyaknya klaster telah ditentukan

    sebelumnya. Sedangkan pada metode hirarki banyaknya satuan pengamatan

    tidak begitu besar dan banyaknya klaster tidak ditentukan sebelumnya.

  • 8/10/2019 Febriyana Fst

    24/73

    10

    2.4 Ukuran Kemiripan

    Ukuran kemiripan yang biasa digunakan dalam analisis klaster

    adalah jarak Euclidean dan jarak Mahalanobis [4]. Jarak Euclidean

    digunakan jika variabel amatan saling bebas atau tidak berkorelasi satu

    sama lain (tidak terjadi multikolinieritas). Namun jika terjadi

    multikolinieritas, dapat diatasi dengan mentransformasi data menggunakan

    Principle Component Analysis (PCA) karena bila data yang digunakan

    dalam analisis klaster adalah data skor komponen dari hasil PCA, maka

    tidak akan ditemukan lagi adanya Multikolinieritas [7]. Jarak Euclidean

    dirumuskan sebagai berikut :

    d(i,j)= ( ) i= 1...471 ; j = 1 ... 7 (2.1)

    dimana d(i,j) = jarak antara objek i dan objek j

    xik = nilai objek i pada variabel ke k

    xjk = nilai objek j pada variabel ke k

    p = banyak variabel yang diamati

    Jika terjadi multikolinieritas selain dengan mentransformasi data

    dengan PCA dapat juga menggunakan ukuran jarak Mahalanobis. Jarak

    Mahalanobis dirumuskan sebagai berikut :

    d(i,j)= ( ) =1,2,3,..471; =1,2,3,..,7 (2.2)

    dengan xi dan xj sebagai vektor dari nilai objek i dan j, sedangkan S

    merupakan matriks kovarian.

  • 8/10/2019 Febriyana Fst

    25/73

    11

    2.5 K-Means Klaster

    K-Meansmerupakan metode pengelompokkan yang paling terkenal

    dan banyak digunakan di berbagai bidang karena sederhana dan mudah

    diimplementasikan. K-means merupakan metode pengklasteran secara

    partitioningyang memisahkan data ke dalam kelompok yang berbeda.

    K-means merupakan salah satu metode pengelompokkan data

    nonhirarki yang berusaha membagi data yang ada ke dalam bentuk dua atau

    lebih kelompok [13]. Metode ini dikembangkan oleh Mac Queen pada tahun

    1967.

    Tujuan dari pengelompokkan data ini adalah untuk

    meminimalisasikan fungsi objektif dalam proses pengelompokkan, yang

    pada umumnya berusaha meminimalisasikan ragam di dalam suatu

    kelompok dan memaksimalkan ragam antar kelompok.

    Dasar algoritma K-meansadalah sebagai berikut :

    1. Diberikan nilai k sebagai jumlah klaster yang ingin dibentuk.

    2. Bangkitkan k centroid(titik pusat klaster) awal secara random.

    3. Hitung jarak setiap data ke masing-masing pusat klaster yaitu

    menggunakanEuclidean Distance.

    4. Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan

    pusatnya.

    5. Tentukan posisi pusat klaster baru (Ckj) dengan cara menghitung nilai

    rata-rata dari data-data yang ada pada pusat klaster yang sama.

    =

    =1,2,,7 (2.3)

  • 8/10/2019 Febriyana Fst

    26/73

    12

    = pusat klaster ke-k pada variabel ke-j

    = banyak data pada klaster ke-k

    2.6 K-Median Klaster

    K-median merupakan salah satu metode dalam pengelompokkan.

    Namun jika pada K-means pengelompokkan berdasarkan nilai rataannya,

    pada K-medianpengelompokkan didasarkan pada nilai mediannya [8].

    Misalkan terdapat N buah data, jarak antara objek ke-i, dan objekke-j, dinotasikan dengan . Dalam pemilihan suatu objek yangrepresentatif dalam suatu klaster (median awal), didefinisikan sebagaivariabel biner 0 dan 1, dimana y = 1 jika objek ke-i dipiih sebagai median

    awal. Penempatan setiap objek ke-j ke salah satu median awal dituliskan

    sebagai, denganbernilai 0 dan 1. Jika objek j ditempatkan ke klasterdimana objek i sebagai median maka =1.

    Berdasarkan definisi di atas, maka :

    min (2.4)dengan ` =1 , (2.5)

    , (2.6) = , =jumlah klaster (2.7) {0,1} ,, (2.8) {0,1} , (2.9)

  • 8/10/2019 Febriyana Fst

    27/73

    13

    Persamaan (2.4) menyatakan bahwa klaster yang terbentuk dengan

    menempatkan setiap objek ke median yang terdekat. Persamaan (2.5)

    menyatakan bahwa setiap objek ditempatkan pada sebuah median.

    Persamaan (2.6) menyatakan bahwa penempatan objek didasarkan pada

    median. Persamaan (2.7) menyatakan bahwa hanya terdapat sebuah objek

    yang akan dipilih median.

    Dasar algoritma K-medianadalah sebagai berikut :

    1. Diberikan nilai k sebagai jumlah klaster yang ingin dibentuk.

    2. Bangkitkan k centroid(titik pusat klaster) awal secara random.

    3. Hitung jarak setiap data ke masing-masing pusat klaster yaitu

    menggunakanEuclidean Distance.

    4. Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan

    pusatnya.

    5. Tentukan posisi pusat klaster baru (Ck) dengan cara menghitung nilai

    mediandata-data yang ada pada pusat klaster yang sama.

    2.7 Analisis Diskriminan

    Analisis Diskriminan merupakan suatu analisis dengan tujuan

    membentuk sejumlah fungsi melalui kombinasi linear variabel-variabel asal,

    yang dapat digunakan sebagai cara terbaik untuk memisahkan kelompok-

    kelompok individu. Fungsi yang terbentuk melalui analisis ini selanjutnya

    dinamakan fungsi diskriminan [11].

    Analisis diskriminan dapat digunakan jika variabel terikat terdiri dari

    dua kelompok. Apabila klasifikasi terdiri dari tiga kelompok atau lebih

  • 8/10/2019 Febriyana Fst

    28/73

    14

    maka teknik yang digunakan adalah analisis diskriminan multipel (multiple

    discriminant analysis).

    Analisis diskriminan menghubungkan satu variabel terikat (non

    metrik, nominal atau ordinal) dengan satu atau beberapa variabel bebas

    sebagai prediktor yang merupakan metrik (interval atau rasio).

    Tujuan analisis diskriminan adalah sebagai berikut :

    1. Membuat suatu fungsi diskriminan atau kombinasi linier dari prediktor

    atau variabel bebas yang bisa mendiskriminasi atau membedakan

    kategori variabel terikat atau kelompok. Artinya mampu membedakan

    suatu objek masuk kelompok atau kategori yang mana.

    2. Menguji apakah ada perbedaan signifikan antar kelompok dikaitkan

    dengan variabel bebas atau prediktor.

    3. Menentukan prediktor atau variabel bebas mana yang memberikan

    sumbangan terbesar terhadap terjadinya perbedaan antar kelompok.

    4. Mengklasifikasi objek ke dalam suatu kelompok didasarkan pada nilai

    variabel bebas.

    5. Mengevaluasi keakuratan klasifikasi.

    Adapun dalam penelitian ini tujuan yang ingin dicapai yaitu untuk

    mengevaluasi keakuratan dalam mengklasifikasi.

  • 8/10/2019 Febriyana Fst

    29/73

    15

    Untuk menghitung seberapa besar ketepatan klasifikasi terdapat

    beberapa metode, salah satunya adalah Appearent Error Rate (APER).

    APER adalah persentase kesalahan yang dikelompokkan salah. APER

    dihitung berdasarkan persamaan sebagai berikut :

    (2.10)

    1

    1

    l

    jM

    j

    l

    j

    j

    n

    APER

    n

  • 8/10/2019 Febriyana Fst

    30/73

    16

    BAB III

    METODOLOGI PENELITIAN

    3.1 Sumber Data

    Data yang digunakan dalam penelitian ini adalah data sekunder hasil

    Survei Sosial Ekonomi Nasional (SUSENAS) tahun 2009 yang

    dilaksanakan oleh Badan Pusat Statistik (BPS). Data yang digunakan berupa

    data indikator kemiskinan untuk seluruh kabupaten/kota di seluruh

    Indonesia, yang terdiri dari 471 kabupaten atau kota. Data tersebut

    disesuaikan dengan ketersediaan data yang ada.

    3.2 Variabel Penelitian

    Variabel-variabel yang digunakan pada penelitian ini dibagi dalam

    beberapa bidang sebagai berikut :

    a.

    Variabel Bidang Pekerjaan

    Pengelompokkan pekerjaan dibedakan dalam dua kelompok yaitu

    bekerja di bidang formal dan informal. Pekerja sektor formal adalah

    seseorang yang bekerja dengan dibantu karyawan/pegawai tetap atau

    bekerja sebagai karyawan/pegawai. Sedangkan pekerja di sektor

    informal adalah seseorang yang berusaha sendiri, berusaha dengan

    buruh tidak tetap atau buruh tidak dibayar.

    b. Variabel Fasilitas Perumahan

    Sebuah rumah dikategorikan rumah sehat apabila luas lantai

    perkapita yang ditempati minimal sebesar 8 m2[2].

  • 8/10/2019 Febriyana Fst

    31/73

    17

    Rumah tangga pengguna air bersih adalah persentase rumah

    tangga yang menggunakan air minum yang berasal dari air mineral, air

    leding atau PAM, pompa air, sumur atau mata air terlindung dengan

    jarak ke penampungan lebih dari 10 meter.

    c. Variabel Program Pemerintah

    Beras untuk masyarakat miskin (Raskin) adalah salah satu

    program pemerintah untuk membantu rakyat miskin dalam memenuhi

    kebutuhan makanan sehari-hari. Raskin diselenggarakan oleh Badan

    Urusan Logistik (Bulog) dengan cara menjual beras dengan harga

    murah bersubsidi.

    Variabel yang digunakan dalam penelitian ini disesuaikan dengan

    ketersediaan data. Berikut adalah variabel-variabel yang digunakan:

    X1 : jumlah penduduk miskin yang bekerja di bidang formal.

    X2 : jumlah penduduk miskin bekerja di bidang informal.

    X3 : jumlah rumah tangga dengan luas lantai kurang dari 8 m2.

    X4 : jumlah rumah tangga dengan luas lantai lebih dari 8 m2.

    X5 : jumlah rumah tangga menggunakan air bersih.

    X6 : jumlah rumah tangga menggunakan jamban sendiri.

    X7: jumlah rumah tangga penerima raskin.

  • 8/10/2019 Febriyana Fst

    32/73

    18

    3.3 Uji Multikolinieritas

    Uji multikolinieritas dilakukan untuk mengetahui ada tidaknya

    korelasi antar variabel. Uji multikolinieritas dilakukan dengan

    menggunakan nilai Variance inflation factor (VIF). Jika nilai VIF lebih

    besar dari 5, maka variabel tersebut mempunyai permasalahan

    multikolinieritas dengan variabel bebas lainnya [10].

    3.4 UjiNormal Multivariate

    Pengujian asumsi normal multivariate dilakukan pada masing-

    masing data tiap klaster untuk mengetahui apakah data pada tiap klaster

    tersebut menyebar mengikuti sebaran normal multivariate, dengan langkah-

    langkah sebagai berikut :

    a. Menghitung jarak Mahalanobis (di2) pada kelompok ke-i dengan

    persamaan :

    di2= (xi- )

    TS-1(xi- ) i = 1, 2, ..., n (3.1)

    di2=jarak Mahalanobis

    xi= vektor kolom berisi nilai-nilai pengamatan

    = vektor kolom berisi rataan kelompok ke-i

    S= matriks kovarians

    b. Mengurutkan di2

    dari yang terkecil ke terbesar sehingga d12

    < d22< ....