analisis pengelompokkan kecamatan di kodya...
Post on 07-Mar-2019
224 Views
Preview:
TRANSCRIPT
SKRIPSI
ANALISIS PENGELOMPOKKAN KECAMATAN DI KODYA SURABAYA BERDASARKAN
VARIABEL-VARIABEL KEPENDUDUKAN, KESEHATAN DAN PENDIDIKAN
Oleh : Rengganis L. N. R 1302 100 046
PENDAHULUAN Latar Belakang
Penduduk merupakan subyek sekaligus obyek yang akan memberikan dampak terhadap keberhasilan pembangunan itu sendiri. Jumlah penduduk yang besar dapat menjadi modal pembangunan jika merupakan sumber daya manusia yang berkualitas. Namun penduduk yang besar akan menjadi beban pembangunan apabila kualitas sumber daya manusianya rendah. Untuk menciptakan sumber daya manusia yang berkualitas tidak hanya membutuhkan peran aktif dari pemerintah namun juga harus didukung kesadaran masyarakat akan pentingnya sektor pendidikan, sosial, kesehatan dan sektor terkait lainnya misalnya ekonomi, lingkungan dan lain sebagainya.
Kurangnya sumber daya alam, rendahnya kualitas dan kuantitas sumber daya manusia, dukungan sarana dan prasarana fisik yang kurang memadai, tidak tercukupinya modal usaha, tidak memadainya teknologi yang tersedia serta hal-hal yang berhubungan dengan upaya peningkatan tingkat kesejahteraan masyarakat adalah penyebab terjadinya kemiskinan didalam masyarakat. Oleh karena itu, untuk mengatasi terjadinya kemiskinan perlu kerjasama antara pemerintah dan masyarakat dalam membangun sumber daya manusia yang lebih berkualitas.
Penelitian ini ditujukan untuk mengetahui pengelompokkan Kecamatan di Kota Surabaya dengan menggunakan metode analisis komponen utama dan analisis kelompok. Kemudian untuk mengetahui faktor–faktor yang mempengaruhi kondisi Kecamatan di Kota Surabaya khususnya di sektor kependudukan, sektor kesehatan dan sektor pendidikan digunakan metode klasifikasi pohon.
Permasalahan Permasalahan yang muncul berdasarkan latar belakang di
atas adalah sebagai berikut : 1. Bagaimana pengelompokkan Kecamatan di kota Surabaya
yang dapat digunakan sebagai dasar perencanaan dan penentuan kebijakan dalam sektor kependudukan, kesehatan, dan pendidikan.
2. Faktor apa saja yang mempengaruhi kondisi Kecamatan di kota Surabaya dalam sektor kependudukan, kesehatan dan pendidikan.
Batasan Masalah Batasan masalah dalam penelitian ini adalah sebagai berikut :
1. Data yang digunakan merupakan data sekunder tahun 2004 yang diperoleh dari Badan Pusat Statistik (BPS) yang hanya meneliti di sektor kependudukan, kesehatan dan pendidikan.
2. Wilayah penelitian diambil dari seluruh Kecamatan di kota Surabaya kecuali Kecamatan Benowo karena data tidak lengkap.
Tujuan Penelitian Tujuan yang bisa diambil dari penelitian ini adalah :
1. Mengetahui pengelompokkan Kecamatan di kota Surabaya dalam sektor kependudukan, kesehatan dan pendidikan.
2. Mengetahui faktor yang mempengaruhi kondisi Kecamatan di kota Surabaya dalam sektor kependudukan, kesehatan dan pendidikan.
Manfaat Penelitian
Manfaat yang bisa diambil dari penelitian ini adalah sebagai berikut : 1. Memberikan masukan tentang kecamatan di kota Surabaya
yang masih kurang dalam pemerataan pembangunan khususnya pada sektor kependudukan, kesehatan dan pendidikan.
2. Dapat menentukan sektor-sektor yang masih kurang dalam menunjang keberhasilan di sektor kependudukan, kesehatan dan pendidikan.
TINJAUAN PUSTAKA
Analisis Komponen Utama
Analisa komponen utama bertujuan untuk mereduksi dimensi variabel asal sedemikian hingga dalam melakukan interpretasi menjadi lebih mudah tanpa harus kehilangan banyak informasi data (Johnson, 1998).
Secara aljabar komponen utama merupakan kombinasi linear dari p variabel random .
Jika adalah matrik varian kovarian Σ
dengan vektor random dan mempunyai akar
( )pxxx ,...,, 21
∑
=
pppp
p
p
σσσ
σσσσσσ
21
22221
11211
),...,,( 21 pxxxx =′
ciri vektor ciri (eigenvalue-eigenvector) yaitu (λ1, e1), (λ2, e2), …, (λp, ep ) dimana λ1 ≥ λ2 ≥ …≥ λp ≥ 0, kombinasi linear komponen utamanya adalah :
Dengan var (Yi ) = , i = 1, 2,…, p dan
cov (Yi , Yk ) = , i ≠ k. Antara komponen utama
tidak saling berkorelasi dan memiliki variabel yang sama
dengan akar ciri dari Σ.
pp xexexexeY 122111111 +++=′=
pp xexexexeY 222211222 +++=′=
ppppppp xexexexeY +++=′=
2211
∑′ ii ee
∑′ ki ee
Keragaman total variabel asal akan sama dengan total keragaman komponen utama yaitu :
persentase varian yang dapat diterangkan oleh komponen utama ke-i adalah :
( ) ( )∑∑==
=+++==+++p
iip
p
iipp Yx
121
12211 varvar λλλσσσ
%100
1
×
∑=
p
ii
i
λ
λ
Sebelum melakukan analisis komponen utama terlebih dahulu dilakukan pengujian apakah matrik korelasi yang digunakan merupakan matrik identitas atau bukan. Pengujian ini dilakukan dengan uji Bartlet dengan hipotesanya adalah : H0 : Matrik korelasi adalah matrik identitas (Tidak ada korelasi antar variabel ) H1 : Matrik korelasi bukan matrik identitas (Ada korelasi antar variabel ) Statistik ujinya Dimana : n = jumlah pengamatan p = banyak variabel q = banyak kelompok = nilai Wilk’s Lamda Kriteria tolak hipotesis nol adalah jika p-value kurang dari nilai α yang ditetapkan maka dapat dipastikan bahwa ada korelasi antar variabel.
*ln2
1 Λ
+
−−−=qpnBartlet
*Λ
Analisis Kelompok
Analisis kelompok merupakan metode analisis multivariate yang bertujuan untuk memisahkan sekumpulan individu atau pengamatan kedalam beberapa kelompok berdasarkan ukuran kedekatan (Dillon, 1984).
Ukuran kedekatan yang digunakan sebagai interpretasi kedekatan kedua obyek atau data adalah jarak euclidius (Euclidean distance). Jarak euclidius antara x dan y adalah :
Dalam penelitian ini digunakan metode pengelompokkan non hirarki dimana banyaknya kelompok telah ditentukan terlebih dahulu yaitu dua kelompok (K=2) dengan K adalah pusat dari kelompok.
2
1
2 )( jkik
p
kij XXD −Σ==
Metode non hirarki dengan K-mean ini bertujuan mengelompokkan obyek sedemikian hingga jarak tiap obyek ke pusat kelompok dalam satu kelompok adalah minimum (Dillon, 1984).
Langkah-langkah dalam pengelompokan non hirarki K-Means adalah sebagai berikut: 1. Menyusun matrik dari hasil pengukuran n individu dari p
variabel. Ukuran matrik adalah n x p, nilai ini diberikan individu ke-i terhadap variabel ke-j dinotasikan dengan A(i,j), dimana i = 1, 2, ..., n dan j = 1, 2, ..., p.
2. Menentukan besarnya K yaitu banyaknya kelompok yang ingin dibentuk.
3. Melakukan proses penyekatan untuk mengalokasikan tiap individu kedalam satu kelompok.
Langkah-langkah penyekatan antara lain : Menentukan kelompok awal dengan memasukkkan individu ke-i dalam kelompok ke-l
Menghitung rata-rata variabel ke-j pada semua individu dalam kelompok ke-l yang disebut B(l,j) dan menyusun matrik berukuran (l x j). Menghitung jarak antar individu ke-i dan kelompok ke-l
( )[ ]min
min−−
=maks
isumKl
( ) ( ) ( )[ ]21
1
2,,,
−= ∑
=
p
jjlBjiAliD
Menghitung kesalahan dalam penyekatan dan memeriksa apakah perpindaan individu ke-i dari kelompok sekarang kedalam kelompok yang baru akan menghasilkan pengurangan kesalahan dalam penyekatan.
4. Menghitung nilai B(l,j) yag baru dan menyusun matrik
berukuran (l x j) yang baru. Selanjutnya kembali ke point c dan d. Langkah tersebut dilakukan terus menerus hingga tidak ada lagi perpindahan obyek yang menghasilkan pengurangan kesalahan dalam proses penyekatan.
Klasifikasi Pohon Adalah metode yang digunakan untuk menggambarkan
hubungan antara variabel respon yang bersifat kategorik dengan satu set variabel prediktor yang bersifat numerik dan kategorik. Metode ini dikenal juga sebagai pemilahan rekursif secara biner (Lewis, 2000). Artinya sekelompok data yang terkumpul dalam satu ruang disebut simpul (node) yang dapat dipilah menjadi 2 simpul anak dan setiap simpul anak dapat dipilah lagi menjadi 2 simpul anak begitu seterusnya sampai akhirnya berhenti jika sudah memenuhi kriteria tertentu.
Proses Pembentukan Pohon
Untuk proses pembentukan pohon, digunakan learning sample dimana proses pembentukannya ada 3 yaitu:
1. Pemilah-pemilah Metode pemilahan yang sering digunakan adalah indeks
GINI karena lebih mudah dan sesuai untuk diterapkan dalam berbagai kasus dan mempunyai perhitungan yang sederhana dan cepat.
2. Penentuan simpul terminal
Suatu simpul t akan disebut sebagai simpul terminal bila : Tidak terdapat penurunan kehetorogenan yang berarti, sehingga simpul t tidak akan terpilah lagi. Hanya terdapat satu pengamatan pada tiap simpul anak atau adanya batasan minimum n. Adanya batasan jumlah level atau tingkat kedalaman pohon maksimal, kemudian pohon berhenti.
3. Penandaan label kelas.
Penghentian Pembentukan Pohon Klasifikasi Menurut Lewis (2000), proses pembentukan pohon akan
berhenti apabila : 1. Terdapat satu pengamatan dalam tiap simpul anak atau
adanya batasan minimun n. 2. Semua pengamatan pada tiap simpul anak mempunyai
variabel prediktor dengan distribusi yang sama atau identik sehingga tidak mungkin terjadi pemilahan.
3. Adanya batasan jumlah level atau tingkat kedalaman dalam pohon maksimal.
Pemangkasan Pohon Klasifikasi
Untuk mendapatkan pohon yang layak maka perlu dilakukan pemangkasan (pruning) yaitu suatu penilaian ukuran pohon tanpa mengorbankan ketepatan atau kebaikannya melalui pengurangan simpul pohon sehingga dicapai ukuran pohon yang layak. Untuk mendapatkan ukuran pohon yang layak dilakukan pemangkasan pohon dengan cost complexity minimum (Breiman, 1984).
Untuk , maka ukuran cost complexity adalah:
Cost complexity pruning menentukan suatu pohon bagian yang meminimumkan pada seluruh pohon bagian (Breimen , 1984).
Pohon Klasifikasi Optimal
Ukuran pohon yang sangat besar dapat memberikan nilai penduga yang sangat kecil. Sehingga pohon ukuran ini sering dipilih untuk menduga respon tetapi ukuran pohon yang besar ini akan menyebabkan nilai complexity yang tinggi karena data yang digambarkan cenderung kompleks.
0≥α
( ) ( ) TTRTR αα +=
( )αT( )TRα
Jika digunakan resubstitution estimate R(T) sebagai kriteria penentuan pohon terbaik, maka akan cenderung dipilih pohon terbesar. Ada 2 honest estimate bagi R(T) yaitu:
a. Test sample estimate L dibagi menjadi 2 secara acak yaitu data learning dan
data testing. Amatan pada data learning digunakan untuk membentuk deretan pohon {Tk} melalui proses pemangkasan. Sedangkan amatan data testing untuk menduga .
b. Cross validation V-fold estimate
Amatan dalam L dibagi secara acak menjadi V bagian yang saling lepas dengan ukuran kurang lebih sama besar di tiap kelasnya. Learning sample ke-v dengan v=1,2,…,V digunakan untuk membentuk pohon . Misal
adalah hasil pengklasifikasian maka penduga sampel uji untuk R(T) adalah :
)( kts TR
( )VkT
( ) ( )xd V
Dengan menggunakan amatan induk L untuk membentuk deretan pohon {Tk} maka penduga validasi silang lipat V untuk adalah :
Pohon klasifikasi optimum dipilih Tk* dengan
=
∑∈
≠=Vnn Ljx
nnvV
kts jxdX
NTR
),(
)()( ))((1)(
( )VkT
∑=
=V
v
Vk
tsk
cv TRV
TR1
)( )(1)(
( )*k
cv TR ( )kcv
kTRmin
Kependudukan Di Indonesia sumber data kependudukan yang sering
digunakan dewasa ini adalah : Sensus Penduduk, Registrasi Penduduk dan survey-survey kependudukan lainnya.
Sensus penduduk adalah suatu kegiatan pengumpulan atau pencacahan data kependudukan terhadap seluruh penduduk yang berdomisili di wilayah Republik Indonesia. Keterangan yang dikumpulkan diantaranya mengenai umur, kelahiran, status kelahiran, dan lain sebagainya. Sedangkan data keadaan sosial antara lain mengenai agama, pendidikan dan sebagainya serta keterangan lainnya yang berhubungan dengan penduduk.
Variabel-variabel kependudukan yang digunakan antara lain : 1. Persentase kelahiran penduduk Persentase kelahiran penduduk adalah perbandingan
antara banyaknya kelahiran yang terjadi dengan banyaknya penduduk di suatu Kecamatan.
2. Persentase kematian penduduk Persentase kematian penduduk adalah perbandingan
antara banyaknya kematian dengan banyaknya penduduk di suatu Kecamatan.
3. Persentase penduduk pendatang Persentase penduduk pendatang adalah perbandingan
antara banyaknya penduduk yang datang terhadap jumlah penduduk di suatu Kecamatan.
4. Persentase perpindahan penduduk Persentase perpindahan penduduk adalah perbandingan
antara banyaknya penduduk yang pindah terhadap jumlah penduduk di suatu Kecamatan.
5. Persentase akseptor baru Persentase akseptor baru adalah perbandingan antara
jumlah akseptor baru terhadap jumlah penduduk . 6. Persentase peserta KB aktif Persentase peserta KB aktif adalah perbandingan antara
jumlah peserta KB aktif terhadap jumlah penduduk di suatu Kecamatan.
7. Persentase klinik KB Persentase klinik KB adalah perbandingan antara
banyaknya klinik KB terhadap banyaknya peserta KB aktif di suatu Kecamatan.
Kesehatan
Tujuan pembangunan bidang kesehatan di Surabaya ialah agar tercapai kemampuan hidup sehat bagi setiap penduduk, demi mewujudkan derajat kesehatan yang optimal. Sedangkan variabel kesehatan yang digunakan adalah persentase tenaga medis yaitu perbandingan antara jumlah tenaga medis terhadap banyaknya penduduk di suatu Kecamatan.
Pendidikan
Peningkatan kualitas sumber daya manusia bertitik tolak pada upaya pembangunan pendidikan. Pada hakekatnya pendidikan merupakan usaha sadar manusia untuk mengembangkan kepribadian dan meningkatkan kemampuan yang berlangsung seumur hidup.
top related