201-621-1-pb.pdf

4
457 BEBERAPA METODE PAUTAN PADA ANALISIS KELOMPOK MENGGUNAKAN JARAK EUCLIDEAN DAN SQUARE EUCLIDEAN Rizky Linda Maylana Jurusan Matematika, F.MIPA, Universitas Brawijaya Email : [email protected] Abstrak. Analisis kelompok digunakan untuk mengelompokkan objek pengamatan menjadi beberapa kelompok sehingga diperoleh kelompok dimana objek-objek dalam satu kelompok memiliki banyak persamaan, sedangkan dengan anggota kelompok lainnya memiliki banyak perbedaan. Dalam analisis kelompok, ukuran kemiripan (ukuran jarak) diperlukan pada tahap awal dalam penggabungan 2 kelompok. Ukuran jarak yang digunakan yaitu jarak Euclidean dan Square Euclidean. Setelah antar peubah diukur dengan matriks jarak, langkah selanjutnya adalah melalukan proses pengelompokan. Proses pengelompokan menggunakan metode hairarki dengan pautan single linkage, average linkage, complete linkage, dan ward’s. Penelitian ini bertujuan mengetahui 4 metode pautan tersebut, manakah yang lebih baik dari hasil pengelompokan dengan menggunakan ukuran jarak kedekatan Euclidean dan Square Euclidean. Proses pengelompokan menggunakan 10 data sekunder dengan berbagai macam jumlah pengamatan dan peubah. Pemilihan metode pengelompokan terbaik menggunakan nilai Cluster Tightness Measure (CTM) terkecil dimana nilai CTM didasarkan pada simpangan baku dari beberapa kelompok dengan beberapa peubah. Berdasarkan nilai CTM, menunjukkan pengelompokan metode single linkage merupakan metode yang lebih baik daripada metode lainnya dengan menggunakan jarak Euclidean dan Square Euclidean. Kata Kunci: Average linkage, Single linkage, Complete linkage, Ward method 1. PENDAHULUAN Secara umum analisis kelompok dibagi menjadi dua metode yaitu metode hirarki dan metode nonhirarki. Metode hirarki jumlah kelompok yang akan dibentuk belum ditentukan. Prosedur kelompok hirarki terdiri atas dua bagian, yaitu metode (penggabungan) agglomerative dan metode (pemisah) divisive. Metode penggabungan yang sering digunakan adalah single linkage, average linkage, dan complete linkage. Selain itu ada juga metode centroid dan ward’s. Single linkage menggabungkan kelompok menggunakan jarak terdekat, complete linkage menggabungkan kelompok menurut jarak paling jauh, average linkage menggabungkan kelompok menurut jarak rata-rata antara setiap pasangan objek yang mungkin dari semua objek pada satu kelompok dengan seluruh objek pada kelompok lain, sedangkan metode Ward’s mengelompokkan objek dengan memaksimalkan kehomogenan dalam kelompok. Pada penelitian ini dikaji lebih khusus mengenai pengelompokan dengan 4 metode pautan, yaitu Single linkage, Complete linkage, Average linkage dan Ward’s dengan 2 ukuran jarak kedekatan, yaitu jarak Euclidean dan jarak Square Euclidean dengan asumsi bahwa antar peubah tidak saling berkorelasi. 2. TINJAUAN TEORI 2.1 Analisis Kelompok Analisis kelompok merupakan metode analisis untuk mengelompokkan objek-objek pengamatan menjadi beberapa kelompok, sehingga akan diperoleh kelompok dimana objek-objek dalam satu kelompok memiliki banyak persamaan sedangkan dengan anggota kelompok lain memiliki banyak perbedaan (Johnson dan Winchern, 2007). Pada dasarnya ada dua prosedur pengelompokan, yaitu pengelompokan dengan prosedur hirarki dan non hirarki. Pada penelitian ini metode yang digunakan adalah prosedur hirarki dimana jumlah kelompok yang akan dibentuk belum ditentukan. Asumsi yang harus dipenuhi dalam analisis kelompok adalah tidak terdapat korelasi antar peubah. Sehingga untuk mengetahui apakah terdapat korelasi antar peubah dilakukan pengujian yaitu analisis korelasi. Analisis kelompok tidak dapat dilakukan jika terdapat korelasi antar peubah, oleh karena itu dilakukan analisis komponen utama. Analisis komponen utama bertujuan menghilangkan korelasi antar peubah dengan membentuk peubah-peubah baru yang tidak saling berkorelasi. Setelah dilakukan analisis komponen utama, maka analisis kelompok dapat dilakukan. Dalam analisis kelompok, ukuran kemiripan (ukuran jarak) diperlukan pada tahap awal dalam penggabungan 2 kelompok.

Upload: agung-setiobudi

Post on 16-Dec-2015

216 views

Category:

Documents


0 download

TRANSCRIPT

  • 457

    BEBERAPA METODE PAUTAN PADA ANALISIS KELOMPOK

    MENGGUNAKAN JARAK EUCLIDEAN DAN SQUARE EUCLIDEAN

    Rizky Linda Maylana

    Jurusan Matematika, F.MIPA, Universitas Brawijaya

    Email : [email protected]

    Abstrak. Analisis kelompok digunakan untuk mengelompokkan objek pengamatan menjadi beberapa kelompok sehingga

    diperoleh kelompok dimana objek-objek dalam satu kelompok memiliki banyak persamaan, sedangkan dengan anggota

    kelompok lainnya memiliki banyak perbedaan. Dalam analisis kelompok, ukuran kemiripan (ukuran jarak) diperlukan pada

    tahap awal dalam penggabungan 2 kelompok. Ukuran jarak yang digunakan yaitu jarak Euclidean dan Square Euclidean.

    Setelah antar peubah diukur dengan matriks jarak, langkah selanjutnya adalah melalukan proses pengelompokan. Proses

    pengelompokan menggunakan metode hairarki dengan pautan single linkage, average linkage, complete linkage, dan wards. Penelitian ini bertujuan mengetahui 4 metode pautan tersebut, manakah yang lebih baik dari hasil pengelompokan dengan

    menggunakan ukuran jarak kedekatan Euclidean dan Square Euclidean. Proses pengelompokan menggunakan 10 data

    sekunder dengan berbagai macam jumlah pengamatan dan peubah. Pemilihan metode pengelompokan terbaik menggunakan nilai Cluster Tightness Measure (CTM) terkecil dimana nilai CTM didasarkan pada simpangan baku dari beberapa kelompok

    dengan beberapa peubah. Berdasarkan nilai CTM, menunjukkan pengelompokan metode single linkage merupakan metode

    yang lebih baik daripada metode lainnya dengan menggunakan jarak Euclidean dan Square Euclidean.

    Kata Kunci: Average linkage, Single linkage, Complete linkage, Ward method

    1. PENDAHULUAN

    Secara umum analisis kelompok dibagi menjadi dua metode yaitu metode hirarki dan metode

    nonhirarki. Metode hirarki jumlah kelompok yang akan dibentuk belum ditentukan. Prosedur

    kelompok hirarki terdiri atas dua bagian, yaitu metode (penggabungan) agglomerative dan metode

    (pemisah) divisive. Metode penggabungan yang sering digunakan adalah single linkage, average

    linkage, dan complete linkage. Selain itu ada juga metode centroid dan wards. Single linkage menggabungkan kelompok menggunakan jarak terdekat, complete linkage menggabungkan kelompok

    menurut jarak paling jauh, average linkage menggabungkan kelompok menurut jarak rata-rata antara

    setiap pasangan objek yang mungkin dari semua objek pada satu kelompok dengan seluruh objek pada

    kelompok lain, sedangkan metode Wards mengelompokkan objek dengan memaksimalkan kehomogenan dalam kelompok. Pada penelitian ini dikaji lebih khusus mengenai pengelompokan

    dengan 4 metode pautan, yaitu Single linkage, Complete linkage, Average linkage dan Wards dengan 2 ukuran jarak kedekatan, yaitu jarak Euclidean dan jarak Square Euclidean dengan asumsi bahwa

    antar peubah tidak saling berkorelasi.

    2. TINJAUAN TEORI

    2.1 Analisis Kelompok

    Analisis kelompok merupakan metode analisis untuk mengelompokkan objek-objek

    pengamatan menjadi beberapa kelompok, sehingga akan diperoleh kelompok dimana objek-objek

    dalam satu kelompok memiliki banyak persamaan sedangkan dengan anggota kelompok lain memiliki

    banyak perbedaan (Johnson dan Winchern, 2007). Pada dasarnya ada dua prosedur pengelompokan,

    yaitu pengelompokan dengan prosedur hirarki dan non hirarki. Pada penelitian ini metode yang

    digunakan adalah prosedur hirarki dimana jumlah kelompok yang akan dibentuk belum ditentukan.

    Asumsi yang harus dipenuhi dalam analisis kelompok adalah tidak terdapat korelasi antar

    peubah. Sehingga untuk mengetahui apakah terdapat korelasi antar peubah dilakukan pengujian yaitu

    analisis korelasi.

    Analisis kelompok tidak dapat dilakukan jika terdapat korelasi antar peubah, oleh karena itu

    dilakukan analisis komponen utama. Analisis komponen utama bertujuan menghilangkan korelasi

    antar peubah dengan membentuk peubah-peubah baru yang tidak saling berkorelasi.

    Setelah dilakukan analisis komponen utama, maka analisis kelompok dapat dilakukan. Dalam

    analisis kelompok, ukuran kemiripan (ukuran jarak) diperlukan pada tahap awal dalam penggabungan

    2 kelompok.

  • 458

    2.2 Jarak Kedekatan

    Observasi mempunyai sifat yang lebih dekat dengan observasi tertentu daripada dengan

    observasi yang lain, digunakan ukuran (distance). Pada penelitian ini lebih difokuskan pada 2 jarak

    kedekatan yaitu, jarak Euclidean dan jarak Square Euclidean.

    Pada jarak Euclidean mempunyai asumsi bahwa antar peubah tidak saling berkorelasi, memiliki

    satuan pengukuran yang sama dan pengukuran pembakuan mempunyai rata-rata nol dan standar

    deviasi satu. Jarak Euclidean merupakan jarak antar objek, misalkan dua objek ke- dan ke- yang berada pada dimensi di mana formulanya sebagai berikut (Johnson dan Winchen, 2007) :

    2

    1

    ( )p

    im jmijm

    X Xd (1)

    di mana, dij = jarak antar objek ke-i dengan objek ke- j; i, j =1,2,,n; i j; m = 1,2,.,p; Xim = nilai pengamatan objek ke-i peubah ke-m; Xjm = nilai pengamatan objek ke-j peubah ke-m; p = banyaknya

    peubah.

    Pada jarak Square Euclidean merupakan ukuran kesamaan jumlah kuadrat perbedaan tanpa akar

    kuadrat. Formulanya sebagai berikut (Hair et al, 1998):

    22

    1

    ( )p

    jmij imm

    X Xd (2)

    2.3 Metode Pengelompokan Hirarki

    Analisis Kelompok hirarki adalah analisis hasil pengelompokan yang hasil pengelompokannya

    disajikan secara berjenjang dari n, (n-1) sampai terdapat satu kelompok. Terdapat beberapa teknik

    metode agglomerative diantaranya, metode single linkage, complete linkage, average linkage, dan

    wards. Metode Single linkage adalah kelompok yang dibentuk dari kesatuan individu dengan

    menggabungkan tetangga terdekat.

    ( ) (3) di mana, adalah jarak antara tetangga terdekat dari kelompok U dan W juga kelompok V dan W, begitu sebaliknya.

    Metode Complete linkage merupakan metode dengan menggunakan prinsip jarak terjauh antar

    objek.

    ( ) (4) di mana, adalah jarak terjauh antar anggota kelompok U dan W juga kelompok V dan W, begitu sebaliknya.

    Metode Average linkage menggunakan prinsip ukuran jarak rata-rata antara setiap pasangan

    objek yang mungkin dari semua objek pada satu kelompok dengan seluruh objek pada kelompok lain.

    ( )

    ( ) (5)

    di mana, adalah jarak antara objek i pada kelompok (UV) dan objek j pada kelompok W; n(UV) =

    jumlah objek dalam kelompok W; = jumlah dari objek-objek pada kelompok (UV) dan W. Metode wards adalah metode cluster hirarki dari penggabungan 2 group untuk meminimalkan

    ESS. Rumus metode wards adalah

    EES(Error of Sum Square)='

    )

    1

    ( ( )n

    i ii

    X X X X (6)

    di mana, Xi = vektor objek ke-i berukuran (px1);

    X = vektor rata-rata semua objek berukuran (px1);

    n = banyaknya objek (Johnson dan Winchern, 2007).

    2.4 Pemilihan Metode Terbaik

    Pemilihan metode terbaik dalam pengelompokkan dapat dilihat dari keragaman yang terbentuk.

    Semakin kecil nilai keragamannya, maka hasil pengelompokkan semakin baik. Jika CTM bernilai nol,

    artinya semua data berada pada pusat kelompok.

  • 459

    1 1

    1 1 pk tm

    t m m

    CTMk p

    SS

    (7)

    dimana: = simpangan baku pada kelompok ke-t untuk peubah ke-m; = simpangan baku peubah ke-m; t =1,.,k; m= 1,.,p; = banyaknya peubah; k = banyaknya kelompok.

    3. METODE PENELITIAN

    Data yang digunakan pada penelitian ini adalah 10 data sekunder dengan berbagai macam

    jumlah pengamatan dan peubah. Langkah-langkah analisis pada penelitian ini adalah

    1. Melakukan pembakuan untuk menyeimbangkan satuan

    2. Melakukan analisis korelasi untuk mengetahui ada tidaknya korelasi antar peubah

    3. Mengukur kesamaan objek menggunakan metode jarak kedekatan yaitu Euclidean dan Square

    Euclidean menggunakan persamaan 1 dan 2

    4. Menjelaskan setiap anggota kelompok yang terbentuk pada masing-masing kombinasi metode

    pengelompokan single linkage menggunakan persamaan 3, complete linkage menggunakan persamaan

    4, average linkage menggunakan persamaan 5 dan wards menggunakan persamaan 6. 5. Melakukan pemilihan metode terbaik menggunakan nilai CTM menggunakan persamaan 7.

    4. HASIL DAN PEMBAHASAN

    Penelitian ini, menggunakan 4 metode penggabungan dan 2 ukuran jarak kedekatan yaitu Single

    linakge, Complete linkage, Average linkage dan Wards Methods jarak yang digunakan Euclidean dan Square Euclidean. Semua data mengandung korelasi sehingga dilakukan analisis komponen utama

    untuk mendapatkan skor komponen sebagai masukan pada analisis kelompok.

    Penentuan hasil metode terbaik menggunakan nilai Cluster Tightness Measure (CTM). Semakin

    kecil nilai keragamannya, maka hasil pengelompokkan semakin baik, jika CTM bernilai nol, artinya

    semua data berada pada pusat kelompok. Hasil perbandingan metode Single linkge, Complete linkage,

    Average linkage dan Wards Method menggunakan jarak Euclidean disajikan di Tabel 1, sedangkan untuk jarak Square Euclidean disajikan di Tabel 2.

    Tabel.1 Nilai CTM Metode Average Linkage, Single Linkage, Complete Linkage dan Wards Method Menggunakan Jarak Euclidean

    No Sample

    Size

    CTM

    Metode Terbaik Average

    Linkage

    Single

    Linkage

    Complete

    Linkage Wards

    1 27 0,433 0,433 0,433 0,898 Average, Single dan

    Complete

    2 31 0,279 0,279 0,506 0,837 Single

    3 35 0,574 0,311 0,711 0,711 Single

    4 24 0,756 0,274 0,756 0,754 Single

    5 19 0,090 0,090 0,115 0,686 Average dan

    Single

    6 21 0,731 0,472 0,637 0,476 Single

    7 14 0,326 0,326 0,326 0,326 Average, Single,

    Complete dan Wards

    8 33 0,277 0,305 0,314 0,881 Average

    9 8 0,416 0,373 0,695 0,842 Single

    10 15 0,249 0,413 0,879 0,841 Average

    Berdasarkan Tabel 1 metode yang lebih baik adalah metode single linkage , karena dari 10 data

    yang diteliti metode single linkage yang paling banyak memiliki nilai CTM lebih kecil dibandingkan

    metode lainnya. Jadi, pada jarak Euclidean metode single linkage merupakan metode yang lebih baik.

  • 460

    Tabel.2 Nilai CTM Metode Average Linkage, Single Linkage, Complete Linkage dan Wards Method Menggunakan Jarak Square Euclidean

    No Sample

    Size

    CTM

    Metode Terbaik Average

    Linkage

    Single

    Linkage

    Complete

    Linkage Wards

    1 27 0,433 0,433 0,433 0,831 Average, Single dan

    Complete

    2 31 0,278 0,278 0,408 0,739 Average dan

    Single

    3 35 0,574 0,311 0,712 0,712 Single

    4 24 0,756 0,274 0,765 0,752 Single

    5 19 0,171 0,090 0,976 0,918 Single

    6 21 0,731 0,472 0,637 0,818 Single

    7 14 0,325 0,325 0,325 0,325

    Average, Single,

    Complete dan

    Wards

    8 33 0,416 0,305 0,314 0,886 Single

    9 8 0,416 0,373 0,842 0,842 Single

    10 15 0,413 0,413 0,826 0,841 Single dan

    Average

    Berdasarkan Tabel 2 metode yang lebih baik adalah metode single linkage. Jadi pada jarak

    Square Euclidean metode single linkage juga merupakan metode yang lebih baik. Dengan

    menggunakan jarak Euclidean dan Suqare Euclidean metode single linkage menjadi metode yang

    lebih baik dibandingkan dengan metode lainnya.

    5. KESIMPULAN

    Berdasarkan nilai CTM menunjukkan bahwa metode pautan single linkage dengan jarak

    Euclidean dan Square Euclidean merupakan metode pautan terbaik dibandingkan metode-metode

    pautan yang lain. Saran untuk penelitian selanjutnya bisa menggunakan metode pemilihan terbaik

    yang lain selain CTM, untuk membuktikan metode single linkage yang terbaik.

    DAFTAR PUSTAKA

    Hair, J.F., Black, W.C., Babin, B.J. dan Anderson, R.E., (1998), Multivariate Data Analysis, Fifth

    Edition, Pearson Prentice Hall, New Jersey.

    Johnson, R.A., dan Winchern, D.W., (2007), Applied Multivariate Statistical Analysis, Pearson

    Education International, USA.

    Walpole, R. E., (1995), Pengantar Statistika, Edisi ke-3, Gramedia, Jakarta.