102214987 anreg best subset

Upload: ilham-yannuar

Post on 30-Oct-2015

90 views

Category:

Documents


1 download

TRANSCRIPT

  • PENYELESAIAN KASUS MULTIKOLINEARITAS

    PADA DATA PENJUALAN PERALATAN ELEKTRONIK DENGAN

    METODE BEST SUBSET REGRESSION

    MAKALAH

    Disusun untuk memenuhi tugas mata kuliah Analisis Regresi

    yang dibina oleh Ir. Hendro Permadi, M.Si

    Oleh

    Anita Hermaningtyas 408312408019

    Rina Uktafiya 408312409119

    Umi Qoiriah 408312409125

    Dwi Rahmawati Utami 40831240913

    UNIVERSITAS NEGERI MALANG

    FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

    PROGRAM STUDI MATEMATIKA

    Desember 2010

  • BAB 1

    PENDAHULUAN

    A. Latar Belakang

    Regresi dalam statistika adalah salah satu metode untuk menentukan

    hubungan suatu variabel terhadap variabel yang lain. Variabel yang pertama

    disebut dengan variabel bebas atau variabel karena seringkali digambarkan

    dalam grafik sebagai absis. Variabel yang kedua adalah variabel terikat atau

    variabel , dalam grafik digambarkan sebagai ordinat. Kedua variabel ini

    biasanya merupakan variabel acak (random).

    Apabila kita menggunakan model regresi

    , dalam hal ini kita mempunyai asumsi bahwa , , , , sebagai

    variable-variabel bebas tidak berkorelasi satu sama lain. Seandainya variable-

    variabel bebas tersebut berkorelasi satu sama lain, maka dikatakan terjadi

    kolinearitas berganda (multicollinearity). Ada kemungkinan terjadi 2 variabel atau

    lebih mempunyai hubungan yang sangat kuat sehingga pengaruh masing-masing

    variable tersebut terhadap sukar untuk dibedakan (Supranto, 2001).

    Multikolinearitas adalah kondisi terdapatnya hubungan linier atau korelasi

    yang tinggi antara masing-masing variabel independen dalam model regresi.

    Multikolinearitas biasanya terjadi ketika sebagian besar variabel yang digunakan

    saling terkait dalam suatu model regresi. Oleh karena itu masalah

    multikolinearitas tidak terjadi pada regresi linier sederhana yang hanya

    melibatkan satu variabel independen.

    Best subset adalah suatu metode pemilihan variable X yang memuat

    hubungan terbaik dengan variable Y. Menaksir persamaan regresi semua

    kemungkinan menggunakan semua kemungkinan kombinasi dari variabel

    independen. Pilih terbaik sesuai dengan mencari disesuaikan tertinggi di R2 dan

    standart error terendah.

  • B. Rumusan Masalah

    1. Bagaimana mengidentifikasi multikolinearitas?

    2. Bagaimana cara mengatasi multikolinearitas?

    3. Bagaimana aplikasi dari metode best subset?

    C. Tujuan

    1. Untuk mengetahui mengidentifikasi multikolinearitas.

    2. Untuk mengetahui cara mengatasi multikolinearitas.

    3. Untuk mengetahui aplikasi dari metode best subset.

  • BAB II

    PEMBAHASAN

    Dalam suatu penelitian ilmiah biasanya yang diteliti adalah hubungan

    antara peubah, dimana perubah itu sebut saja hubungan antara peubah, dimana

    peubah itu sebut saja peubah bebas dan peubah tak bebas . Hubungan tersebut

    dapat pula berupa hubungan fungsional antar peubah yang satu dengan peubah

    yang lain. Tetapi masing-masing peubah merupakan bilangan random, sehingga

    bilamana peubah dipengaruhi atau ditentukan besarnya oleh peubah maka

    dapat dikatakan bahwa permasalahan tersebut dapat diselesaikan dengan

    menggunakan teknik analisis regresi (Nugroho, 1990b).

    Dalam penelitian ini analisis yang dipergunakan adalah Analisis Regresi

    Berganda. Menurut Nugroho (1990b) ada beberapa alas an dipergunakan Regresi

    Berganda :

    a. Membuat persamaan di dalam yang memberikan prediksi yang terbaik

    terhadap . Dengan adanya banyak peubah , mungkin juga termasuk di

    dalamnya pemilihan subset yang terbaik untuk memprediksi .

    b. Dengan mengetahuinya peubah-peubah yang berpengaruh terhadap ,

    mungkin perlu membuat rangking yang didasarkan pada besarnya

    pengaruh terhadap .

    Analisis Regresi Linier Berganda merupakan bentuk umum sedangkan

    Regresi Linier Sederhana merupakan bentuk khusus dari Regresi Linier Berganda

    yaitu apabila satu peubah bebas yang dilibatkannya (Yitnosumartono, 1988)

    Dalam regresi linier berganda terdapat satu peubah tak bebas yang akan

    dilihat hubungannya dengan dua atau lebih peubah bebasnya, umpakan bahwa

    pengamatan-pengamatan dapat dinyatakan dengan fungsi-fungsi linier dari

    beberapa , , , ..., yang diketahui dan faktor sisa. Model populasinya

    adalah sebagai berikut:

    ................................... 5.8

  • I = 1, 2, 3, ...,

    Dimana = Nilai pengamatan yang ke-

    , ..., = peubah bebas yang menentukan nilai pengamatan ke-

    , ..., = koefisien-koefisien regresi sebagian (parsial) untuk

    peubah , ..., , secara berturut-turut.

    = titik potong sumbu

    = faktor sisaan yang ke-

    = banyaknya pengamatan

    Berdasarkan dari matriks korelasi kita dapat mengetahui gambaran

    kolinearitas ganda antara peubah bebas secara kasar dengan jalan menggunakan

    metode membanding koefisien korelasi dalam matriks korelasi dengan nilai kritis

    pada taraf nyata . Dari koefisien yang terpilih lalu dihitung korelasi parsialnya

    setelah itu langsung dilakukan pengujian hipotesis dimana :

    Adapun statistik uji yang digunakan adalah :

    dimana :

    = banyaknya pengamatan

    = banyaknya peubah bebas

    Bila mana benar maka mengikuti distribusi dengan derajat bebas

    pada taraf nyata , jika ( ) maka ditolak yang berarti

    kolinearitas ganda disebabkan karena dan terjadi secara bersama-sama

    dalam regresi.

    Multikolinieritas (kolinearitas ganda) ditemukan oleh Ragner Frisch yang

    berarti adanya hubungan linier yang sempurna atau pasti diantara beberapa atau

    semua variabel yang menjelaskan ( , , ..., ) dari model regresi.

    Beberapa cara mengetahui apakah suatu model regresi itu mempunyai

    kolinearitas ganda atau tidak adalah sebagai berikut:

  • a. Suatu model yang variable-variabel penjelasnya bersifat kolinearitas

    memperlhatkan tanda-tanda sebagai berikut:

    1. Koefisien determinasi ganda tinggi

    2. Koefisien korelasi sederhananya tinggi

    3. VIF (Variance Inflation Factor )

    Jika nilai VIF lebih besar atau sama dengan 10, menandakan adanya

    multikolinieritas pada variabel bebas.

    4. Tak satupun (sedikit sekali diantaranya) variable-variabel bebas

    memiliki uji- yang signifikan, walaupun keadaan 1, 2 dan 3 terpenuhi.

    b. Jika hanya ada dua variable bebas yang ternyata korelasi antara kedua

    variable itu tinggi, maka dapat merupakan indikasi bahwa dalam model

    tersebut terjadi kolinearitas. Akan tetapi apabila model itu mempunyai

    lebih dari dua variable bebas, walaupun korelasi antara dua variable

    rendah, tidak dapat menjadi jaminan bahwa model tersebut tida bersifat

    multikollinearitas.

    c. Apabila model yang akan diuji adalah: ( ) dengan

    koefisien determinasi gandanya adalah tinggi yakni:

    mendekati 1,

    akan tetapi ,

    , mempunyai nilai yang sangat rendah

    dibandingkan nilai kofisien determinasi ganda antara dengan , , dan

    berarti ada kolinearitas ganda.

    d. Mengadakan uji antara variable-variabel bebasnya. Jika hitung

    dibandingkan dengan tabel dan ternyata signifikan maka dapat dianggap

    bahwa ada multikolinearitas (Awat, 1995).

    Akibat Adanya Kolinearitas Ganda

    Jika hubungan antar variable bebasnya sempurna, maka koefisien

    regresi parsial tak akan dapat diestimasi.

    Kalau hubungan tersebut tidak sempurna, maka koefisien regresi

    parsial masih bisa diestimasi, tetapi kesalahan baku dari penduga

    koefisien regresi parsial sangat besar. Hal ini menyebabkan

    pendugaan/peramalan nilai kurang teliti.

  • Cara Mengatasi Masalah Kolinearitas Ganda

    Memeriksa secara teoritis untuk mengetahui apakah antara variable

    bebas memang ada hubungannya.

    Mengadakan penggabungan antara data cross-section dan time series,

    yang akan disebut sebagai polling data.

    Mengeluarkan salah satu variable bebasnya dari model tersebut.

    Mentransformasi variable yang ada dalam model.

    Menambah data baru, yakni menambah jumlah observasi atau .

    Dengan semakin besarnya , maka ada kemungkinan bahwa standard

    error akan semakin kecil pula.

    Best Subset Regression

    Regresi terbaik(best subsets regression) digunakan untuk meregresikan

    satu peubah respon pada semua kemungkinan kombinasi subset peubah-peubah

    prediktor dan kemudian memilih subset terbaik untuk setiap ukuran (size)

    informasi model terbaik ini dipilih berdasarkan nilai R-square terbesar. Pada

    setiap regresi subset terbaik ditampilkan statistik, yaitu : R-sq, adj R-sq, S dan C-

    p. Jika model di fit tanpa konstanta, R-sq dan adj R-sq tidak ditampilkan.

  • APLIKASI

    P.T. Cemerlang dalam beberapa bulan gencar mempromosikan sejumlah peralatan

    elektronik dengan membuka outlet-outlet di berbagai daerah. Berikut adalah data

    mengenai kenaikan penjualan, biaya promosi, jumlah outlet, laju penduduk,

    jumlah pesaing dan income masyarakat pada bulan Mei 2010.

    Kenaikan

    Penjualan

    (%)

    Income

    Masyarakat

    (%)

    Banyaknya

    Sales

    Biaya

    Promosi

    Outlet Pesaing Laju

    Penduduk

    (%)

    10

    12

    30

    25

    8

    38

    21

    14

    9

    17

    24

    48

    55

    35

    60

    5,46

    2,43

    2,56

    3,55

    4,35

    3,65

    3,44

    2,55

    4,79

    2,53

    2,75

    2,53

    3,51

    2,81

    3,01

    205

    206

    254

    246

    201

    291

    234

    209

    204

    216

    245

    286

    312

    265

    322

    26

    28

    35

    31

    21

    49

    30

    30

    24

    31

    32

    47

    54

    40

    42

    159

    164

    198

    184

    150

    208

    184

    154

    149

    175

    192

    201

    248

    166

    287

    15,00

    16,00

    19,00

    17,00

    11,00

    24,00

    16,00

    10,00

    1,35

    2,13

    2,64

    1,63

    2,53

    2,54

    1,53

    2,00

    1,50

    1,75

    1,64

    2,65

    1,45

    1,67

    2,74

    14,00

    14,00

    11,00

    19,00

    21,00

    18,00

    18,00

  • Keterangan :

    = Kenaikan penjualan

    = Income masyarakat

    = Banyaknya sales

    = Biaya Promosi

    = Outlet

    = Pesaing

    = Laju penduduk

    Dari hasil minitab yang didapat untuk mencari best subset dicari C-P

    dengan nilai terkecil, S terkecil, dan R-Sq (Adj) terbesar.

  • Sedangkan,

    Dari data di atas dapat dilihat bahwa pada regresi dan korelasinya ada

    perubahan tanda sehingga menunjukkan bahwa data tersebut multikolinearitas.

    Lalu kita mulai menggunakan metode best subset yaitu dicari C-P dengan

    nilai terkecil, S terkecil, dan R-Sq (Adj) terbesar.

  • Dari keterangan di atas dapat dilihat R-sq yang besar dengan C-p dan S

    terkecil adalah persamaan dengan variable , , , , , .

    Menganalisis dengan melihat nilai C-p bukan terkecil, Sterkecil, dan R-Sq

    (Adj)

  • Dapat dilihat bahwa pada persamaan regresi tersebut masih terdapat

    perubahan tanda sehingga masih terdapat kasus multikolinieritas sehingga

    persamaan regresi tersebut juga masih mengandung kasus multikolinieritas.

    Oleh karena itu, kita cari persamaan regresi yang lebih baik dengan C-p

    terkecil selanjutnya dan beda R-sq yang tidak jauh dari R-sq yang terbesar sehigga

    diperoleh persamaan regresi terbaik.

    Selanjutnya dipilih variable , , dan karena memiliki C-p dan s terkecil

    dan R-Sq (Adj ) terbesar.

    Berdasarkan hasil regresi di atas dapat dilihat bahwa masih terjadi perubahan

    tanda pada persaman regresinya..Sehingga masih terjadi kasus

    multikolineariatas.Oleh karena itu perlu dipilih kemungkinan variable yang lain

    dengan 2 variabel yang merupakan variable terbaik.

    Berikut ini analisis regresi dari dengan variabel bebas dan dengan C-

    p terkecil namun bukan terkecil dan R-Sq(Adj) bukan terbesar.

    Lalu diregresikan :

  • Dari analisis di atas, nampak bahwa pada persamaan regresi sudah tidak terjadi

    perubahan tanda lagi. Serta VIF dari kedua variabel tersebut keduanya kurang dari

    5. Sehingga dapat disimpulkan bahwa variabel yang paling berpengaruh terhadap

    yaitu dan sehingga model regresi yang terbaik yaitu

    dengan R-sq = dan R-sq(adj) = yang

    selisihnya tidak jauh dari R-sq yang terbesar.

  • BAB III

    KESIMPULAN

    Berdasarkan pembahasan data di atas dapat disimpulkan bahwa:

    1. Dari data penelitian kenaikan penjualan peralatan elektronik pada PT

    Cemerlang, ternyata terjadi kasus multikolinieritas. Maka untuk mengatasinya

    digunakan metode best subset regression.

    2. Dari hasil analis menggunakan metode best subset regression diperoleh 2

    variable yang paling mempengaruhi kenaikan penjualan peralatan elektronik,

    yaitu banyaknya sales dan benyaknya pesaing.

    3. Dengan menggunakan metode best subset regression diperoleh model regresi

    terbaik yaitu dengan nilai C-P = 1,6 merupakan nilai paling kecil, nilai

    bukan terkecil, nilai R-Sq (Adj) = , dengan persamaan

    regresi

    4. Dari kesimpulan 1, 2, 3 dapat disimpulkan bahwa semakin banyak sales dan

    sedikit pesainga, semakin tinggi kenaikan penjualan peralatan elektronik.

    DAFTAR PUSTAKA

    Permadi, Hendro. 1999. Teknik Analisis Regresi. UM Press: Jakarta.

    http://myunanto.staff.gunadarma.ac.id/Downloads/files/19417/BAB+15+REGRE

    SI+TIP+TRIK+BERBAGAI+METODE+REGRESI+BERGANDA.pdf