analisis pengelompokkan kecamatan di kodya...

SKRIPSI

ANALISIS PENGELOMPOKKAN KECAMATAN DI KODYA SURABAYA BERDASARKAN

VARIABEL-VARIABEL KEPENDUDUKAN, KESEHATAN DAN PENDIDIKAN

Oleh : Rengganis L. N. R 1302 100 046

PENDAHULUAN Latar Belakang

Penduduk merupakan subyek sekaligus obyek yang akan memberikan dampak terhadap keberhasilan pembangunan itu sendiri. Jumlah penduduk yang besar dapat menjadi modal pembangunan jika merupakan sumber daya manusia yang berkualitas. Namun penduduk yang besar akan menjadi beban pembangunan apabila kualitas sumber daya manusianya rendah. Untuk menciptakan sumber daya manusia yang berkualitas tidak hanya membutuhkan peran aktif dari pemerintah namun juga harus didukung kesadaran masyarakat akan pentingnya sektor pendidikan, sosial, kesehatan dan sektor terkait lainnya misalnya ekonomi, lingkungan dan lain sebagainya.

Kurangnya sumber daya alam, rendahnya kualitas dan kuantitas sumber daya manusia, dukungan sarana dan prasarana fisik yang kurang memadai, tidak tercukupinya modal usaha, tidak memadainya teknologi yang tersedia serta hal-hal yang berhubungan dengan upaya peningkatan tingkat kesejahteraan masyarakat adalah penyebab terjadinya kemiskinan didalam masyarakat. Oleh karena itu, untuk mengatasi terjadinya kemiskinan perlu kerjasama antara pemerintah dan masyarakat dalam membangun sumber daya manusia yang lebih berkualitas.

Penelitian ini ditujukan untuk mengetahui pengelompokkan Kecamatan di Kota Surabaya dengan menggunakan metode analisis komponen utama dan analisis kelompok. Kemudian untuk mengetahui faktor–faktor yang mempengaruhi kondisi Kecamatan di Kota Surabaya khususnya di sektor kependudukan, sektor kesehatan dan sektor pendidikan digunakan metode klasifikasi pohon.

Permasalahan Permasalahan yang muncul berdasarkan latar belakang di

atas adalah sebagai berikut : 1. Bagaimana pengelompokkan Kecamatan di kota Surabaya

yang dapat digunakan sebagai dasar perencanaan dan penentuan kebijakan dalam sektor kependudukan, kesehatan, dan pendidikan.

2. Faktor apa saja yang mempengaruhi kondisi Kecamatan di kota Surabaya dalam sektor kependudukan, kesehatan dan pendidikan.

Batasan Masalah Batasan masalah dalam penelitian ini adalah sebagai berikut :

1. Data yang digunakan merupakan data sekunder tahun 2004 yang diperoleh dari Badan Pusat Statistik (BPS) yang hanya meneliti di sektor kependudukan, kesehatan dan pendidikan.

2. Wilayah penelitian diambil dari seluruh Kecamatan di kota Surabaya kecuali Kecamatan Benowo karena data tidak lengkap.

Tujuan Penelitian Tujuan yang bisa diambil dari penelitian ini adalah :

1. Mengetahui pengelompokkan Kecamatan di kota Surabaya dalam sektor kependudukan, kesehatan dan pendidikan.

2. Mengetahui faktor yang mempengaruhi kondisi Kecamatan di kota Surabaya dalam sektor kependudukan, kesehatan dan pendidikan.

Manfaat Penelitian

Manfaat yang bisa diambil dari penelitian ini adalah sebagai berikut : 1. Memberikan masukan tentang kecamatan di kota Surabaya

yang masih kurang dalam pemerataan pembangunan khususnya pada sektor kependudukan, kesehatan dan pendidikan.

2. Dapat menentukan sektor-sektor yang masih kurang dalam menunjang keberhasilan di sektor kependudukan, kesehatan dan pendidikan.

TINJAUAN PUSTAKA

Analisis Komponen Utama

Analisa komponen utama bertujuan untuk mereduksi dimensi variabel asal sedemikian hingga dalam melakukan interpretasi menjadi lebih mudah tanpa harus kehilangan banyak informasi data (Johnson, 1998).

Secara aljabar komponen utama merupakan kombinasi linear dari p variabel random .

Jika adalah matrik varian kovarian Σ

dengan vektor random dan mempunyai akar

( )pxxx ,...,, 21

σσσ

σσσσσσ

),...,,( 21 pxxxx =′

ciri vektor ciri (eigenvalue-eigenvector) yaitu (λ1, e1), (λ2, e2), …, (λp, ep ) dimana λ1 ≥ λ2 ≥ …≥ λp ≥ 0, kombinasi linear komponen utamanya adalah :

Dengan var (Yi ) = , i = 1, 2,…, p dan

cov (Yi , Yk ) = , i ≠ k. Antara komponen utama

tidak saling berkorelasi dan memiliki variabel yang sama

dengan akar ciri dari Σ.

pp xexexexeY 122111111 +++=′=

pp xexexexeY 222211222 +++=′=

ppppppp xexexexeY +++=′=

∑′ ii ee

∑′ ki ee

Keragaman total variabel asal akan sama dengan total keragaman komponen utama yaitu :

persentase varian yang dapat diterangkan oleh komponen utama ke-i adalah :

( ) ( )∑∑==

=+++==+++p

iipp Yx

12211 varvar λλλσσσ

Sebelum melakukan analisis komponen utama terlebih dahulu dilakukan pengujian apakah matrik korelasi yang digunakan merupakan matrik identitas atau bukan. Pengujian ini dilakukan dengan uji Bartlet dengan hipotesanya adalah : H0 : Matrik korelasi adalah matrik identitas (Tidak ada korelasi antar variabel ) H1 : Matrik korelasi bukan matrik identitas (Ada korelasi antar variabel ) Statistik ujinya Dimana : n = jumlah pengamatan p = banyak variabel q = banyak kelompok = nilai Wilk’s Lamda Kriteria tolak hipotesis nol adalah jika p-value kurang dari nilai α yang ditetapkan maka dapat dipastikan bahwa ada korelasi antar variabel.

−−−=qpnBartlet

Analisis Kelompok

Analisis kelompok merupakan metode analisis multivariate yang bertujuan untuk memisahkan sekumpulan individu atau pengamatan kedalam beberapa kelompok berdasarkan ukuran kedekatan (Dillon, 1984).

Ukuran kedekatan yang digunakan sebagai interpretasi kedekatan kedua obyek atau data adalah jarak euclidius (Euclidean distance). Jarak euclidius antara x dan y adalah :

Dalam penelitian ini digunakan metode pengelompokkan non hirarki dimana banyaknya kelompok telah ditentukan terlebih dahulu yaitu dua kelompok (K=2) dengan K adalah pusat dari kelompok.

2 )( jkik

kij XXD −Σ==

Metode non hirarki dengan K-mean ini bertujuan mengelompokkan obyek sedemikian hingga jarak tiap obyek ke pusat kelompok dalam satu kelompok adalah minimum (Dillon, 1984).

Langkah-langkah dalam pengelompokan non hirarki K-Means adalah sebagai berikut: 1. Menyusun matrik dari hasil pengukuran n individu dari p

variabel. Ukuran matrik adalah n x p, nilai ini diberikan individu ke-i terhadap variabel ke-j dinotasikan dengan A(i,j), dimana i = 1, 2, ..., n dan j = 1, 2, ..., p.

2. Menentukan besarnya K yaitu banyaknya kelompok yang ingin dibentuk.

3. Melakukan proses penyekatan untuk mengalokasikan tiap individu kedalam satu kelompok.

Langkah-langkah penyekatan antara lain : Menentukan kelompok awal dengan memasukkkan individu ke-i dalam kelompok ke-l

Menghitung rata-rata variabel ke-j pada semua individu dalam kelompok ke-l yang disebut B(l,j) dan menyusun matrik berukuran (l x j). Menghitung jarak antar individu ke-i dan kelompok ke-l

( )[ ]min

min−−

isumKl

( ) ( ) ( )[ ]21

−= ∑

jjlBjiAliD

Menghitung kesalahan dalam penyekatan dan memeriksa apakah perpindaan individu ke-i dari kelompok sekarang kedalam kelompok yang baru akan menghasilkan pengurangan kesalahan dalam penyekatan.

4. Menghitung nilai B(l,j) yag baru dan menyusun matrik

berukuran (l x j) yang baru. Selanjutnya kembali ke point c dan d. Langkah tersebut dilakukan terus menerus hingga tidak ada lagi perpindahan obyek yang menghasilkan pengurangan kesalahan dalam proses penyekatan.

Klasifikasi Pohon Adalah metode yang digunakan untuk menggambarkan

hubungan antara variabel respon yang bersifat kategorik dengan satu set variabel prediktor yang bersifat numerik dan kategorik. Metode ini dikenal juga sebagai pemilahan rekursif secara biner (Lewis, 2000). Artinya sekelompok data yang terkumpul dalam satu ruang disebut simpul (node) yang dapat dipilah menjadi 2 simpul anak dan setiap simpul anak dapat dipilah lagi menjadi 2 simpul anak begitu seterusnya sampai akhirnya berhenti jika sudah memenuhi kriteria tertentu.

Proses Pembentukan Pohon

Untuk proses pembentukan pohon, digunakan learning sample dimana proses pembentukannya ada 3 yaitu:

1. Pemilah-pemilah Metode pemilahan yang sering digunakan adalah indeks

GINI karena lebih mudah dan sesuai untuk diterapkan dalam berbagai kasus dan mempunyai perhitungan yang sederhana dan cepat.

2. Penentuan simpul terminal

Suatu simpul t akan disebut sebagai simpul terminal bila : Tidak terdapat penurunan kehetorogenan yang berarti, sehingga simpul t tidak akan terpilah lagi. Hanya terdapat satu pengamatan pada tiap simpul anak atau adanya batasan minimum n. Adanya batasan jumlah level atau tingkat kedalaman pohon maksimal, kemudian pohon berhenti.

3. Penandaan label kelas.

Penghentian Pembentukan Pohon Klasifikasi Menurut Lewis (2000), proses pembentukan pohon akan

berhenti apabila : 1. Terdapat satu pengamatan dalam tiap simpul anak atau

adanya batasan minimun n. 2. Semua pengamatan pada tiap simpul anak mempunyai

variabel prediktor dengan distribusi yang sama atau identik sehingga tidak mungkin terjadi pemilahan.

3. Adanya batasan jumlah level atau tingkat kedalaman dalam pohon maksimal.

Pemangkasan Pohon Klasifikasi

Untuk mendapatkan pohon yang layak maka perlu dilakukan pemangkasan (pruning) yaitu suatu penilaian ukuran pohon tanpa mengorbankan ketepatan atau kebaikannya melalui pengurangan simpul pohon sehingga dicapai ukuran pohon yang layak. Untuk mendapatkan ukuran pohon yang layak dilakukan pemangkasan pohon dengan cost complexity minimum (Breiman, 1984).

Untuk , maka ukuran cost complexity adalah:

Cost complexity pruning menentukan suatu pohon bagian yang meminimumkan pada seluruh pohon bagian (Breimen , 1984).

Pohon Klasifikasi Optimal

Ukuran pohon yang sangat besar dapat memberikan nilai penduga yang sangat kecil. Sehingga pohon ukuran ini sering dipilih untuk menduga respon tetapi ukuran pohon yang besar ini akan menyebabkan nilai complexity yang tinggi karena data yang digambarkan cenderung kompleks.

0≥α

( ) ( ) TTRTR αα +=

( )αT( )TRα

Jika digunakan resubstitution estimate R(T) sebagai kriteria penentuan pohon terbaik, maka akan cenderung dipilih pohon terbesar. Ada 2 honest estimate bagi R(T) yaitu:

a. Test sample estimate L dibagi menjadi 2 secara acak yaitu data learning dan

data testing. Amatan pada data learning digunakan untuk membentuk deretan pohon {Tk} melalui proses pemangkasan. Sedangkan amatan data testing untuk menduga .

b. Cross validation V-fold estimate

Amatan dalam L dibagi secara acak menjadi V bagian yang saling lepas dengan ukuran kurang lebih sama besar di tiap kelasnya. Learning sample ke-v dengan v=1,2,…,V digunakan untuk membentuk pohon . Misal

adalah hasil pengklasifikasian maka penduga sampel uji untuk R(T) adalah :

)( kts TR

( )VkT

( ) ( )xd V

Dengan menggunakan amatan induk L untuk membentuk deretan pohon {Tk} maka penduga validasi silang lipat V untuk adalah :

Pohon klasifikasi optimum dipilih Tk* dengan

∑∈

≠=Vnn Ljx

kts jxdX

)()( ))((1)(

( )VkT

cv TRV

)( )(1)(

cv TR ( )kcv

kTRmin

Kependudukan Di Indonesia sumber data kependudukan yang sering

digunakan dewasa ini adalah : Sensus Penduduk, Registrasi Penduduk dan survey-survey kependudukan lainnya.

Sensus penduduk adalah suatu kegiatan pengumpulan atau pencacahan data kependudukan terhadap seluruh penduduk yang berdomisili di wilayah Republik Indonesia. Keterangan yang dikumpulkan diantaranya mengenai umur, kelahiran, status kelahiran, dan lain sebagainya. Sedangkan data keadaan sosial antara lain mengenai agama, pendidikan dan sebagainya serta keterangan lainnya yang berhubungan dengan penduduk.

Variabel-variabel kependudukan yang digunakan antara lain : 1. Persentase kelahiran penduduk Persentase kelahiran penduduk adalah perbandingan

antara banyaknya kelahiran yang terjadi dengan banyaknya penduduk di suatu Kecamatan.

2. Persentase kematian penduduk Persentase kematian penduduk adalah perbandingan

antara banyaknya kematian dengan banyaknya penduduk di suatu Kecamatan.

3. Persentase penduduk pendatang Persentase penduduk pendatang adalah perbandingan

antara banyaknya penduduk yang datang terhadap jumlah penduduk di suatu Kecamatan.

4. Persentase perpindahan penduduk Persentase perpindahan penduduk adalah perbandingan

antara banyaknya penduduk yang pindah terhadap jumlah penduduk di suatu Kecamatan.

5. Persentase akseptor baru Persentase akseptor baru adalah perbandingan antara

jumlah akseptor baru terhadap jumlah penduduk . 6. Persentase peserta KB aktif Persentase peserta KB aktif adalah perbandingan antara

jumlah peserta KB aktif terhadap jumlah penduduk di suatu Kecamatan.

7. Persentase klinik KB Persentase klinik KB adalah perbandingan antara

banyaknya klinik KB terhadap banyaknya peserta KB aktif di suatu Kecamatan.

Kesehatan

Tujuan pembangunan bidang kesehatan di Surabaya ialah agar tercapai kemampuan hidup sehat bagi setiap penduduk, demi mewujudkan derajat kesehatan yang optimal. Sedangkan variabel kesehatan yang digunakan adalah persentase tenaga medis yaitu perbandingan antara jumlah tenaga medis terhadap banyaknya penduduk di suatu Kecamatan.

Pendidikan

Peningkatan kualitas sumber daya manusia bertitik tolak pada upaya pembangunan pendidikan. Pada hakekatnya pendidikan merupakan usaha sadar manusia untuk mengembangkan kepribadian dan meningkatkan kemampuan yang berlangsung seumur hidup.

analisis pengelompokkan kecamatan di kodya...

Documents

pengelompokkan unsur

pengelompokkan sifat mekanik material

pengelompokkan seni

pengelompokkan kabupaten/kota berdasarkan jenis …

penilaian otentik (mgmp smp kodya 2011).pptx

pengelompokkan data ruas jalan tahun 2020 menurut

pemetaan dan pengelompokkan produk … · manfaat...

penerapan metode fast feedback model pengelompokkan...

pengelompokkan kultur budaya fakultas

pengelompokkan faktor-faktor penyebab kecelakaan … ·...

e. metodologi - kodya

seminar kodya padang

penelitian snh rs. kodya semarang

pengelompokkan unsur pada spu - anorganik 1

pengelompokkan dampak bencana tanah longsor di …

pengelompokkan bahan

penerapan metode pengelompokkan ide berbantuan …

pengelompokkan masalah kurang argumen

penerapan fuzzy c-means untuk pengelompokkan penyakit

analisis pengelompokkan negara-negara importir produk