statistika industri

Post on 04-Jul-2015

4.391 Views

Category:

Education

14 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Statistika Industri

M. Aulia Rendy 116111146

Fadhillah Nurainy 116111147

Arif Nurfajar 116111149

Liffi Noferianti 116111150

Mahdy Arief 116110052

Daftar Isi

BAB I Teori Sampling

BAB II Distribusi Sampling

BAB III Teori Estimasi

BAB IV Uji Hipotesis

BAB V Uji Chi Kuadrat

BAB VI Analisis Korelasi dan Regresi Linier

Sederhana

BAB VII Analisis of Variance (ANOVA)

BAB IBAB I. TEORI SAMPLING

PENGERTIAN DASAR

Sampling

Proses pengambilan atau memilih n buah elemen/objek/unsur dari

populasi yang berukuran N.

Sample (n) :

Merupakan bagian dari populasi. Elemen anggota

sampel, merupakan anggota populasi dimana sampel diambil. Jika

N banyaknya elemen populasi, dan n banyaknya elemen

sampel, maka n < N.

Populasi (N)

Kumpulan lengkap dari elemen-elemen yang sejenis akan tetapi

dapat dibedakan berdasarkan karekteristiknya.

TEKNIK-TEKNIK PENGAMBILAN

SAMPEL

Tipe Sampling menurut Proses Memilih

Sampling dengan Pengembalian

Satuan sampling yang terpilih, “dikembalikan” lagi ke dalam populasi

(sebelum dilakukan kembali proses pemilihan berikutnya). Sebuah

satuan sampling bisa terpilih lebih dari satu kali. Untuk populasi

berukuran N=4 dan sampel berukuran n=2, maka sampel yang

mungkin terambil adalah Nn = 42 = 16 buah sampel.

Sampling tanpa Pengembalian

Satuan sampling yang telah terpilih, “tidak dikembalikan” lagi ke

dalam populasi. Tidak ada kemungkinan suatu satuan sampling

terpilih lebih dari sekali. Untuk populasi berukuran N=4 (misalnya

A, B, C, D) dan sampel berukuran n=3, maka sampel yang mungkin

terambil ada 4 buah sampel yaitu ABC, ABD, ACD, dan BCD.

Secara umum untuk menghitung banyaknya macam sampel yang

mungkin jika pengambilan sampel tanpa pengembalian adalah: nCr

= n!/(r!(n-r)!)

Tipe Sampling menurut Peluang

Pemilihannya

Random sampling

Random sampling adalah cara pengambilan sampel yang memberikan kesempatan yang sama untuk diambil kepada setiap elemen populasi. Artinya jika elemen populasinya ada 100 dan yang akan dijadikan sampel adalah 25, maka setiap elemen tersebut mempunyai kemungkinan 25/100 untuk bisa dipilih menjadi sampel. Random Sampling ada dua macam yaitu:

1. Simple Random Sampling atau Sampel Acak Sederhana

Cara atau teknik ini dapat dilakukan jika analisis penelitiannya cenderung deskriptif dan bersifat umum.

2. Stratified Random Sampling atau Sampel Acak Distratifikasikan

Penarikan sampel acak terstruktur dilakukan denganmembagi anggota populasi dalam beberapa sub kelompokyang disebut strata, lalu suatu sampel dipilih dari masing-masing stratum.

3. Cluster Sampling atau Sampel Gugus

Teknik ini biasa juga diterjemahkan dengan cara

pengambilan sampel berdasarkan gugus. Dalam sampel

gugus, setiap gugus boleh mengandung unsur yang

karakteristiknya berbeda-beda atau heterogen.

4. Systematic Sampling atau Sampel Sistematis

Cara ini menuntut kepada peneliti untuk memilih unsur

populasi secara sistematis, yaitu unsur populasi yang bisa

dijadikan sampel adalah yang “keberapa”.

5. Area Sampling atau Sampel Wilayah

Teknik ini dipakai ketika peneliti dihadapkan pada situasi

bahwa populasi penelitiannya tersebar di berbagai wilayah.

TEKNIK PENYAJIAN DATA

SAMPELPenyajian Data

Penyajian data dilakukan untuk mempermudah dalam pengambilan

keputusan. Data-data yang kita ambil dari populasi atau biasa

disebut sebagai data sampel, dapat diperoleh dengan berbagai

cara, antara lain:

Wawancara

Pengamatan

Surat menyurat

Kuisioner

Data mentah yang diperoleh dapat disajikan sebagai statistika

tataan (pengurutan data) dalam bentuk tabel distribusi

frekuensi,histogram, box plot, diagram dahan daun, dan lain-lain.

Tabel Distribusi frekuensi

Tabel distribusi frekuensi adalah metode pengelompokan data ke

dalam beberapa kategori yang menunjukan banyaknya data dalam

setiap kategori. Setiap data tidak dapat dimasukan ke dalam dua

atau lebih kategori agar data menjadi informatif dan mudah

dipahami. Data yang sudah dirangkum dalam distribusi frekuensi

dinamakan data berkelompok.

Contoh tabel distribusi frekuensi

Kelas interval Frekuensi

3 – 5 2

6 – 8 5

9 – 11 7

12 – 14 1

15 - 17 1

Langkah-langkah distribusi

frekuensi:

Mengurutkan data dari data terkecil hingga data terbesar atau

sebaliknya.

Menentukan banyaknya kelas dengan menggunakan kaidah

Sturges, yaitu

N : banyaknya pengamatan

Banyaknya kelas sebaiknya antara 5 sampai dengan 15

Menentukan interval kelas (KI), dengan rumus :

KI sebaiknya kelipatan 5.

k = 1 + 3,3 log N

Melakukan penturusan atau tabulasi dengan memasukan nilai ke

dalam interval kelas.

Untuk komposisi kelas,perhatikan bahwa kelas tidak tumpang tindih

(lihat batas atas dan batas bawah tiap kelasnya kelas).

Bila tabel distribusi frekuensi akan digunakan untuk membuat

histogram atau poligon, maka komposisinya diubah ke bentuk batas

kelas, yaitu batas bawah dikurangi ( ½ x satuan pengukuran terkecil

dari data) dan batas atas ditambah (½ x satuan pengukuran terkecil

dari data).

BATAS KELAS

Batas kelas adalah nilai terendah dan tertinggi dalam satu kelas

tabel distribusi frekuensi. Batas kelas dalam suatu interval kelas

terdiri dari dua macam :

Batas kelas bawah – lower class limit, yaitu nilai terendah dalam

suatu interval kelas

Batas kelas atas – upper class limit, yaitu nilai tertinggi dalam

suatu interval kelas

Contoh Batas Kelas :

Kelas Jumlah Frekuensi (F)

1 215 2122 14

2 2123 4030 4

3 4031 5938 1

4 5939 7846 1

5 7847 9754 1

Interval

Batas kelas bawah Batas kelas atas

NILAI TENGAH

Nilai tengah adalah tanda atau perinci dari suatu interval kelas dan

merupakan suatu angka yang dapat dianggap mewakili suatu

interval kelas. Nilai tengah kelas berada di tengah-tengah pada

setiap interval kelas.

Contoh nilai tengah:

Kelas Nilai tengah

1 215 2122 1168.5

2 2123 4030 3076.5

3 4031 5938 4984.5

4 5939 7846 6892.5

5 7847 9754 8800.5

Interval

Nilai tengah Kelas ke 1= [ 215 + 2122] / 2= 1168.5

NILAI TEPI KELAS

Nilai tepi kelas (Class Boundaries) adalah nilai batas antara kelas

yang memisahkan nilai antara kelas satu dengan kelas lainnya.

Nilai tepi kelas ini dapat dihutung dengan penjumlahan nilai atas

kelas dengan nilai bawah kelas diantaranya dan di bagi dua.

Contoh nilai tepi kelas:

Kelas IntervalJumlah

Frekuensi (F)Nilai Tepi Kelas

1 215 2122 14 214.5

2 2123 4030 3 2122.5

3 4031 5938 1 4030.5

4 5939 7846 1 5938.5

5 7847 9754 1 7846.5

9754.5

Nilai tepi kelas ke 2 = [ 2122 +2123 ] / 2= 2122,5

Distribusi Frekuensi Relatif

Distribusi frekuensi relatif adalah frekuensi setiap kelas

dibandingkan dengan frekuensi total. Tujuan pembuatan distribusi

ini adalah untuk memudahkan membaca data secara tepat dan

tidak kehilangan makna dari kandungan data.

Contoh Distribusi Frekuensi Relatif

Kelas IntervalJumlah Frekuensi

(F)

Frekuensi relatif

(%)

1 215 2122 14 70

2 2123 4030 3 15

3 4031 5938 1 5

4 5939 7846 1 5

5 7847 9754 1 5

Frekuensi relatif (%)= [ 14 / 20 ] x 100 %= 70 %

Penyajian dalam Bentuk Grafik

1. Grafik Histogram

Penyajian dalam bentuk histogram tidak lain merupakan

pengembangan dari bentuk tabel frekuensi. Bentuk histogram

memberikan gambaran frekuensi untuk setiap nilai atau selang nilai

tertentu dari data. Gambaran ini akan lebih memudahkan pengguna

dalam mengungkap informasi yang terkandung dalam data.

Histogram merupakan diagram yang berbentuk balok. Histogram

menghubungkan antara tepi kelas interval dengan pada sumbu

horizontal (X) dan frekuensi setiap kelas pada sumbu vertikal (Y).

Kelas IntervalJumlah Frekuensi

(F)

1 215 2122 14

2 2123 4030 3

3 4031 5938 1

4 5939 7846 1

5 7847 9754 1

0

5

10

15

Tepi Kelas

2. Grafik Polygon

Grafik polygon menggunakan garis yang mengubungkan titik–titik

yang merupakan koordinat antara nilai tengah kelas dengan jumlah

frekuensi pada kelas tersebut.

Contoh Grafik Polygon

Kelas Nilai Tengah Jumlah Frekuensi (F)

1 1168.5 14

2 3076.5 3

3 4984.5 1

4 6892.5 1

5 8800.5 1

Jumlah Frekuensi (F)

0

2

4

6

8

10

12

14

16

1 2 3 4 5

Jumlah

Frekuensi (F)

3. Kurva Ogif

Kurva ogif merupakan diagram garis yang menunjukan kombinasi

antara interval kelas dengan frekuensi kumulatif.

Contoh kurva Ogif

Kelas

Interval Nilai Tepi Kelas

Frekuensi kumulatif

Bawah Atas Kurang dari Lebih dari

1 215 2122 214.5 0 20

2 2123 4030 2122.5 14 6

3 4031 5938 4030.5 17 3

4 5939 7846 5938.5 18 2

5 7847 9754 7846.5 19 1

9754.5 20 0

0

5

10

15

20

25

1 2 3 4 5 6

Interval kelas

Fre

ku

an

si K

um

ula

tif

Kurang dari

Lebih dari

4. Box plot

Dalam membuat boxplot, pendekatan yang digunakan adalah

dengan membagi kumpulan data yang telah diurutkan menjadi

empat bagian sama banyak. Keempat bagian tersebut mempunyai

lima pembatas, yaitu : data terkecil (Xmin), K1, K2 atau

median, K3, dan data terbesar (Xmax) seperti terlihat di bawah ini :

25% 25% 25% 25%

Xmin K1 K2 K3 Xmax

Dengan menggunakan boxplots kita dapat pula mendeteksi ada

atau tidaknya data pencilan (data ekstrim). Data pencilan dideteksi

dengan menggunakan nilai-nilai Pagar Dalam (PD) dan Pagar Luar

(PL). Nilai-nilai pagar tersebut dihitung menggunakan rumus :

Nilai data yang terletak antara PD dan PL dikategorikan sebagai

data pencilan dekat (∗), dan nilai data yang terletak di luar PL

dikategorikan sebagai data pencilan jauh (ο).

Contoh boxplot

5. Diagram dahan daun

Diagram dahan daun adalah suatu cara mencatat data secara

tersusun. Diagram ini sangat berguna pada saat kita ingin

menyajikan data dalam bentuk gambar tentang bentuk sebarannya

tanpa kehilangan informasi nilai numerik dari data. Penggunaan

diagram dahan-daun memungkinkan kita untuk mengelompokkan

data sekaligus memberi kita informasi visual; panjang tiap baris

memperlihatkan frekuensi tiap baris

Diagram dahan-daun sangat mudah dibuat. Angka-angka data kita

bagi menjadi dua bagian, bagian pertama menjadi dahan, dan

bagian kedua menjadi daun. Angka yang menjadi daun biasanya

adalah satu atau dua angka terakhir..

Contoh diagram batang daunStem-and-leaf of C1 N =

30

Leaf Unit = 1.0

3 0 333

5 0 45

7 0 66

11 0 8899

(6) 1 000011

13 1 2223

9 1 55

7 1 6

6 1 88

4 2 01

2 2

2 2 44

Distribusi Sampling merupakan distribusiteoritis (distribusi kemungkinan) dari semuahasil sampel yang mungkin, dengan ukuransampel yang tetap N, pada statistik(karakteristik sampel) yang digeneralisasikanke populasi.

Distribusi Sampling memungkinkan untukmemperkirakan probabilitas hasil sampeltertentu untuk statististik tersebut

Merupakan jembatan, karena melalui distribusisampling dapat diketahui karakteristikpopulasi

Sampel dari Populasi Terbatas

Sampel dari Populasi Tidak Terbatas

Teorema Limit Pusat

Bila populasi terbatas yang berukuran N dan berdistribusi normal dengan rata-rata µ dan simpangan baku rata-rata sampel yang didasarkan pada sampel random berukuran n dan dipilih dari populasi di atas, akan memiliki distribusi normal dengan rata-rata dan simpangan baku seperti berikut:

Untuk pengambilan sampel tanpa pengembalian atau n/N > 5%:

Untuk pengambilan sampel dengan pengembalian atau n/N ≤ 5%

X

1

N

nN

nX

X

nX

X

Bila populasi memiliki ukuran yang tidak berhingga dan didistribusikan secara normal dengan rata-rata µ dan simpangan baku .., maka rata-rata sampel .. Yang didasarkan pada sampel random ukuran n, dan yang dipilih dengan pengembalian atau tanpa pengembalian dari populasi tersebut akan memiliki distribusi normal dengan rata-rata dan simpangan baku:

nX

X

Dalam suatu pengujian kelelahan (fatigue test), materialtitanium diberi pembebanan berulag sampai deteksitimbulnya retak (crack initiation). Siklus pembebananrata-rata sampai mulai retak adalah 25000 kali dengandeviasi standar 5000. jika diuji 25 spesimen materialtitanium yang dipilih secara acak, berapakah :

Mean dari sampel tersebut?

Deviasi standar dari sampel tersebut?

Mean dari sampel

Deviasi standar dari sampel

100025

5000

25000

nx

x

Normalitas dari distribusi sampling rata-rata Jika populasi cukup besar dan berdistribusi secara

normal, maka distribusi sampling rata-ratanya akan normal

Jika distribusi populasi tidak normal, maka distribusi sampling rata-ratanya akan mendekati normal, apabila jumlah sampel cukup besar, biasanya 30 atau lebih (n≥ 30)

Distribusi normal dari rata-rata sampel memiliki rata-rata yang sama dengan rata-rata harapan E( ) dan simpangan baku. Nilai-nilai tersebut dapat dihitung dari rata-rata populasi dan simpangan baku populasi

X

Untuk populasi terbatas atau n/N>5%, berlaku:

Untuk populasi tidak terbatas atau n/N≤5%, berlaku:

1

N

nN

n

XZatau

XZ

X

n

XZatau

XZ

X

0

2

4

6

8

10

12

-6 -4 -2 0 2 4 6

Distribusi X jika n > 30

Distribusi X jika n < 30Distribusi Populasi(tidak terdistribusi normal)

Lima ratus cetakan logam memiliki berat rata-rata 6,03 N dan deviasi standar 0,4 N.Berapakah probabilitas bahwa suatu sampelacak terdiri dari 100 cetakan yang dipilih akanmempunyai berat total antara 597 sampai 600N?

Mean dan deviasi standar :

Probabilitas mean tersebut dapat dicari dengan menggunakantabel distribusi normal standar di mana :

Maka:

1558,00475,02033,0

)67,1()83,0(

)83,067,1(

036,0

03,600,6

036,0

03,697,5)00,697,5(

036,01500

100500

100

4,0

1

03,6

x

x

x

x

x

x

x

ZP

ZPXP

xz

N

nN

n

Adalah distribusi dari perbedaan dari besaran rata-rata yang muncul dari sampel-sampel dua populasi

Rata-Rata

Simpangan Baku

Pendekatan Normal

2121

XX

2

2

2

1

2

1

21 nnXX

21

2121

XX

XXZ

Distribusi Proporsi Sampling adalah distribusiproporsi-proporsi (rasio / perbandingan) dari seluruh sampel acakberukuran n yang mungkin yang dipilih dari sebuah populasi.

Jika dalam sebuah populasi probabilitasterjadinya suatu peristiwa (probabilitassukses) adalah π sementara probabilitas gagalnya

adalah θ = 1 – π maka mean dan deviasi standar

distribusi proporsi sampling adalah :

Jika sampling dilakukan tanpa pergantian atau

populasi terhingga yang berukuran N :

1

N

nN

nP

P

Jika sampling dilakukan dengan pergantianatau populasinya tak terhingga, maka :

nnP

P

)1(

n

N

P

PMean dari distribusi proporsi sampling

Deviasi standar dari distribusi proporsisampling

Ukuran populasi

Ukuran sampel

Probabilitas sukses

Probabilitas gagal

Proporsi adalah variabel diskrit yangpopulasinya mengikuti distribusi binomial.

Jika nilai n besar (n>30), distribusi proporsisampling mendekati suatu distribusi normal.

Untuk menentukan probabilitas denganmenggunakan tabel distribusi normal makadiperlukan faktor koreksiterhadap nilaiproporsi tersebut. n2

1

Divisi pengendalian mutu pabrik perkakasmesin mencatat bahwa 1,5% dari bearingmengalami cacat. Jika dalam pengiriman satukotak produk terdiri dari 100 bearing, tentukanprobabilitas banyaknya bearing yang cacatsebanyak 2% atau lebih!

Mean dan deviasi standar :

Faktor koreksi variabel diskrit = 1/2n = 1/200 = 0,005

Proporsi (2%) setelah dikoreksi, p= 0,02-0,005 = 0,015

Maka,

%505,01)0(1

0122,0

015,0015,01

)01,0(1)01,0(

0122,0100

)015,01(015,0)1(

015,0

p

p

P

P

ZP

ZP

pPpP

nn

Distribusi perbedaan dari sampling S1 – S2

memiliki mean dan deviasi standar sebagaiberikut :

Dengan syarat bahwa sampel yang dipilihtidak saling terikat (saling bebas)

22

2121

2121

SSSS

SSSS

Distribusi penjumlahan dari sampling S1 + S2

memiliki mean dan deviasi standar sebagaiberikut :

Dengan syarat bahwa sampel yang dipilihtidak saling terikat (saling bebas)

22

2121

2121

SSSS

SSSS

Lampu bohlam merk Phillups (1) memilikidaya tahan pakai rata-rata 2400 jam dandeviasi standar 200 jam. Sementara lampubohlam merk Dup (2) memiliki daya tahanpakai rata-rata 2200 jam dengan deviasistandar 100 jam. Jika dari masing-masing merkdipilih 125 sampel yang diuji, berapakanprobabilitas bahwa bohlam merk Phillups (1)memiliki daya tahan pakai sekurang-kurangnya 160 jam lebih lama dibandingkanbohlam merk Dup (2)?

Mean dan deviasi standar dari distribusi perbedaan sampling :

Skor z untuk perbedaan mean 160 jam adalah :

Jadi, probabilitas yang akan ditentukan adalah :

%72,979772,00228,01

)2(1)2()160)((

220

200160)()(

20125

)100(

125

)200(

20022002400

2121

21

21

21

21

2121

2121

21

21

22

2

2

1

2

22

SSSS

SS

SS

SS

SS

SSSS

SSSS

ZPZPSSP

SSZ

nn

1.Selang kepercayaan mean sampel

Dari gambar di atas

Sampel acak berukuran n dari suatu populasi dengan variansi σ 2 yang diketahui dan mean yang dihitung akan menghasilkan selang kepercayaan sebesar (1 -α)100%.

2.Selang kepercayaan untuk µ; diketahui

Bila rataan sampel acak berukuran n dari suatu populasi dengan variansi 2 yang diketahui maka selang keperctayaan (1-α)100% untuk µ ialah :

zα/2 adalah nilai sebaran normal yang menghasilkan luas α/2 di sebelah kanannya.

Contoh : mean dan simpangan baku dari IPK sebanyak 36 orang mahasiswa adalah 2.6 dan 0.3. tentukan selang kepercayaan 95% dan 99% untuk nilai mean -nya.

Jawab : titik estimasi adalah = 2.6. karena sampel beukuran besar, simpangan baku σ dapat didekati dengan s = 0.3. nilai z yang memberikan luas daerah dibawah kurva sebesar 0.025 di sebelah kanan, atau 0.975 di sebelah kiri, adalah z 0.025 = 1.96 (dari tabel). Oleh karena itu selang kepercayaan 95% adalah

2.6 – (1.96) (0.3)/) < µ < 2.6 + (1.96) (0.3/) atau

2.50 < µ < 2.70

Dengan cara yang sama, selang kepercayaan 99% memerlukan z 0.005 = 2.575 dan selang kepercayaan ini adalah :

2.6 – (2.575) (0.3/) < µ < 2.6 + (2.575) (0.3/) atau

2.47 < µ < 2.73

3. Sampel sedikit

Bagaimana jika syarat n ≥ 30 untuk menghitung variansi populasi tidak dapat dipenuhi? Gunakan distribusi T sebagai ganti distribusi Gauss. Disini :

Mengacu pada gambar di atas, nilai peluang pada daerah diarsir

P(-tα/2<T< tα/2) = 1 – α

Di mana tα/2 adalah nilai t untuk derajat bebas n-1. Luas sebelah kanan nilai ini adalah α/2, dan berdasarkan simetri, luas sebelah kiri dari -tα/2 juga α/2. Substitusi untuk T menghasilkan

P(-tα/2<( )< tα/2) = 1 – α

Maka diperoleh P( ) = 1 – α

Dengan demikian, untuk n sampel, mean dan simpangan baku s, interval kepercayaan (1 –α)100% diberikan oleh :

4. Selang kepercayaan untuk µ; σ tidak diketahui.

Suatu selang kepercayaan (1 – α)100% untuk µ adalah:

Contoh : ada 7 kontainer serupa yang berisi asam sulfat dengan volume : 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, dan 9.6 liter. Tentukan selang kepercayaan 95% untuk mean dari kontainer-kontainer tersebut juka distribusinya mendekati normal.

Jawab : dari data yang diberikan,diketahui mean sampel = 10.0 dan simpangan baku sampel s=0.283. berdasarkan tabel T, kita dapatkan t 0.025 = 2.447 untuk derajat bebas v=6. Karena itu, selang kepercayaan 95% dari adalah

10.0 – (2.447) (0.283 / )< < 10.0 + (2.447) (0.283 / ), atau

9.74< <10.26

Penaksir titik untuk proporsi p dalam suatu percobaan binomial diberikan oleh statistic denganX menyatakan banyaknya yang berhasil dalam n usaha. Jadi, proporsi sampel akan digunakansebagai taksiran titik untuk parameter p.

Variansi

Dengan demikian dapat dituliskan

Dengan

dan menyatakan nilai kurva normal baku yang di sebelah kanannya terdapat daerah seluas .

Selang kepercayaan sampel-besar untuk p

dengan menyatakan nilai z sehingga luas di sebelah kanannya α/ 2.

Contoh 1

Pada suatu sampel acak n = 500 keluarga yang memiliki pesawat televise di kotaHamilton, Kanada, ditemukan bahwa x = 340 memiliki tv berwarna. Carilah selang kepercayaan 95%untuk proporsi sesungguhnya dari keluarga yang memiliki tv berwarna di kota tersebut.

Jawab

Taksiran titik untuk p ialah . Dari table diperoleh . Jadi, selang kepercayaan 95% untuk p adalah

Yang, bila disederhanakan akan menjadi

Yang, bila disederhanakan akan menjadi

0,64 < p < 0,72

Bila p berada tepat di tengah selang kepercayaan (1-) 100% maka menaksir p tanpa galat.Tapi, biasanya, tidak akan tepat sama dengan p dan taksiran titik meleset (mempunyai galat).Besarnya galat akan smaa dengan selisih positif antara dan p, dan dengan selang kepercayaan (1-) 100% selisih ini akan lebih kecil dari .

Teorema 1

Bila dipakai sebagai taksiran p, galatnya akan lebih kecil daripada

dengan kepercayaan (1-α) 100%.

Pada contoh 1 diatas, proporsi sampel berbeda dengan proporsi p yang sesungguhnya tidak lebihdari 0,04 dengan kepercayaan 95%. Sekarang ingin ditentukan berapa besarkah sampel yangdiperlukan agar terjamin bahwa galat dalam menaksir p tidak melebihi suatu besaran g. Menurutteorema 1, ini berarti n harus dipilih agar

Teorema 2

Bila dipakai sebagai taksiran p, maka dengan kepercayaan (1 -α) 100% galat

akan lebih kecil dari besaran tertentu g bila ukuran sampel sebesar

Contoh 2

Berapa besarkah diperlukan sampel pada contoh 1 agar taksiran p meleset kurang dari 0,02 dengan kepercayaan 95%?

Jawab :

Pandanglah ke-500 keluarga sebagai sampel pendahuluan yang memberikan taksiran . Maka menurut teorema 3

Jadi, bila taksiran p didasarkan atas sampel acak ukuran 2090 maka proporsi sampel tidak akan berbeda lebih dari 0,02 dengan proporsi sesungguhnya, dengan kepercayaan 95 %.

Teorema 3

Bila dipakai sebagai taksiran p, maka dengan kepercayaan paling sedikit (1 -α) 100% galat akan lebih kecil dari besaran tertentu g bila ukuran sampel

Contoh 3

Berapa besarkah sampel yang diperlukan pada contoh 1 agar kita yakin paling sedikit dengan kepercayaan 95% bahwa taksiran p melesat kurang dari 0,02?

Jawab

Berbeda dengan contoh2, disini kita anggap tidak ada sampel pendahuluan diambil untuk menaksir p. Karena itu, dengan kepercayaan paling sedikit 95% proporsi sampel yang kita peroleh tidak akan berbeda dari proporsi sesungguhnya melebihi 0,02 bila kita memilih ukuran sampel

MENAKSIR SELISIH RATA-RATA.

Dalam hal ini kita berhubungan dengan dua buah populasi yang selisih rata-ratanya ( μ 1 – μ2 ) akan kita taksir.

a. Interval taksiran untuk selisih rata-rata jika σ1 dan σ2 diketahui:

b. Interval taksiran untuk selisih rata-rata jika simpangan baku σ1 dan σ2 tidak diketahui tetapi σ1 = σ2 :

c. jika simpangan baku σ1 dan σ2 tidak diketahui dan σ1 ≠ σ2 :

Contoh:

Masa pakai barang A yang dihasilkan oleh dua pengusaha akan diteliti. Dari barang yang dihasilkan oleh pengusaha 1 diteliti 150 buah dan dicatat masa pakainya. Rata -ratanya 1400 jam dean simpangan baku 80 jam.Barang yang dihasilkan pengusaha II diteliti sebanyak 100 buah. Ternyata rata-ratanya = 1300 jam dan S = 70 jam. Carilah interval taksiran selisih rata -ratanya. dengan kepercayaan 95%.

Jawab:

Asumsi σ1 = σ2

sehingga sp= 74,5 dari daftar t dengan kepercayaan 95% dan V= 248 didapat t0,05(248)= 1,96

2.1.Estimasi Selisih Dua Proporsi

Selang kepercayaan untuk p 1- p2 dapat ditetapkan dengan menggunakan distribusi sampel . Darimateri menaksir proporsi diketahui dan masing-masing berdistribusi hampir normal, denganrataan p 1 dan p2 , dan variansi p 1q 1 / n 1 dan p2q2 / n2 . Dengan mengambil kedua sampel secarabebas dari kedua populasi maka peubah akan bebas satu sama lain, dank arena distribusi normalbersifat merambat, maka dapat disimpulkan bahwa

berdistribusi hampir normal dengan rataan

Dan variansi

Bila nilai kurva normal sehingga luas di sebelah kanannya

Contoh 4

Suatu perusahaan dalam cara pembuatan suku cadang sedang direncanakan. Sampel diambildari cara lama maupun yang baru untuk melihat apakah cara baru tersebut memberikanperbaikan. Bila 75 dari 1500 suku cadang yang berasal dari cara lama ternyata cacat dan 80 dari2000 yang berasal dari cara baru ternyata cacat, carilah selang kepercayaan 90% untuk selisihsesungguhnya proporsi yang cacat dalam kedua cara.

Karena selang ini mengandung nilai 0, tak ada alasan mempercayai bahwa cara baru tersebut memberikan penurunan yang berarti dalam proporsi suku cadang yang cacat disbanding dengan cara lama.

Bila sampel berukuran n diambil dari populasi normal dengan variansi dan variansi sampel S2

dihitung maka kita peroleh suatu nilai dari statistic S2. Variansi sampel hasil perhitungan iniakan digunakan sebagai taksiran titik untuk . Karena itu statistik S2 disebut penaksir .

Jadi dapat ditulis

Bila S2 variansi sampel acak ukuran n dari populasi normal maka selang kepercayaan (1-α) 100%untuk variansi diberikan oleh

Contoh 5

Data berikut menyatakan berat, dalam gram, 10 bungkus bibit sejenis tanaman yang dipasarkanoleh suatu perusahaan : 46,4, 46,1 , 45,8 , 47,0 , 46,1 , 45,9 , 45,8 , 46,9 , 45,2 dan 46, 0 . Carilahselang kepercayaan 95 % untuk variansi semua bungkusan bibit yang dipasarkan perusahaantersebut, anggap populasinya normal.

Jawab

Mula-mula hitunglah

atau

0,135 < < 0,953

Estimasi Nisbah Dua Variansi

Contoh :

Suatu selang kepercayaan untuk perbedaan rataan kadar ortofosfor, diukur dalam mg perliter, pada dua stasion di sungai James telah dihitung di contoh 7.8 dengan menganggap keduavariansi populasi normal tidak sama. Beri dukungan atas anggapan ini dengan membuat selangkepercayaan 98% untuk dan untuk , bila dan variansi populasi kadar ortofosfor masing-masingdi stasion 1 dan 2.

Jawab

Dari contoh 7.8 diperoleh n 1 = 15, n2 = 12, s 1 = 3,07 dan s2 = 0,80 . Untuk selang kepercayaan98%, α = 0,02. Dengan menggunakan interpolasi dari tabel, kita peroleh

Yang, bila disederhanakan, menjadi

BAB IV

UJI HIPOTESIS

HIPOTESIS

• Hipotesis statistik, disingkat hipotesis, adalah suatu asersi (assertion) atau dugaan (conjecture) mengenai satu atau lebih populasi.

• Terdapat dua macam hipotesisHipotesis nol (hipotesis yang menyatakan tidak adanya perbedaan atau tidak adanya korelasi, ditandai dengan lambang “=“, lambang H0)

Hipotesis alternatif (negasi dari hipotesis nol, lambang H1)

JENIS HIPOTESIS

UJI DUA EKOR

nilai kritis (dicari dari tabel statistika

nilai kritis (dicari dari tabel statistika

daerah kritis

daerah kritis

daerah penolakan

H0

daerah penolakan H0

UJI SATU EKOR KANAN

nilai kritis (dicari dari tabel statistika

daerah kritis

daerah penolakan

H0

UJI SATU EKOR KIRI

nilai kritis (dicari dari tabel statistika

daerah kritis

daerah penolakan

H0

Prosedur uji hipotesis

1. Rumuskan H0 dan H1. 2. Tentukan taraf signifikansi, yaitu , yang

akan dipakai untuk uji hipotesis. 3. Pilihlah statistik uji yang cocok untuk menguji

hipotesis yang telah dirumuskan. 4. Hitunglah nilai statistik uji berdasarkan data

observasi (amatan) yang diperoleh darisampel. Penghitungan nilai statistik uji ini dapat dilakukansecara manual, namun dapat pula dengan menggunakan paketprogram statistik yang dewasa ini telah beredar secara luas.

Prosedur uji hipotesis

5. Tentukan nilai kritik dan daerah kritik berdasarkan tingkat signifikansi yang telah ditetapkan.

6. Tentukan keputusan uji mengenai H0.Manual: Jika nilai statistik uji amatan berada di daerah kritik, maka H0 ditolak.Komputer: Jika p , maka H0 ditolak.

7. Tulislah kesimpulan berdasarkan keputusan ujiSebaiknya, kesimpulan dirumuskan dengan bahasa sehari-hari (bukan dalam terminologi statistik) dan koheren dengan permasalahan yang dirumus-kan di awal penelitian.

RUMUS STATISTIK UJI

RUMUS STATISTIK UJI

RUMUS STATISTIK UJI

Contoh 1

Menurut pengalaman selama beberapa tahun terakhir ini, pada ujian matematika standar yang diberikan kepada siswa-siswa SMU di Surakarta diperoleh rataan 74.5 dengan deviasi baku 8.0. Tahun ini dilaksanakan metode baru untuk dapat meningkatkan kemampuan siswa dalam bidang studi matematika tersebut. Setelah metode baru tersebut dilaksanakan, secara random dari populasinya, diambil 200 siswa untuk dites dengan ujian matematika standar dan tenyata dari 200 siswa tersebut diperoleh rataan 75.9. Jika diambil = 5%, apakah dapat disimpulkan bahwa metode baru tersebut dapat meningkatkan kemampuan siswa dalam matematika?

µ0 σ

n

X

Jawab:

α = 0.05

α = 0.05

•1.645

DK

α = 0.05

•1.645

DK

α = 0.05

•1.645

•2.475

Contoh 2

• Untuk melihat apakah rataan nilai matapelajaran Matematika siswa kelas tiga SMU “Entah-Mana” lebih dari 65, secara random dari populasinya, diambil 12 siswa. Ternyata nilai-nilai keduabelas siswa tersebut adalah sebagai berikut.51 71 76 81 67 98 58 69 87 74 79 81

• Jika diambil = 1% dan dengan mengasumsikan bahwa distribusi nilai-nilai di populasi normal, bagaimana kesimpulan penelitian tersebut?

Jawab:

Jawab:

Jawab:

α = 0.01

•2.718

•2.572

Contoh 3

• Seseorang ingin menunjukkan bahwa siswa wanita dan siswa pria tidak sama kemampuannya dalam matematika. Untuk itu, ia mengambil 12 wanita dan 16 pria sebagai sampel. Nilai-nilai mereka adalah:

Wanita : 51 71 76 81 67 98 58 69 87 74 79 81

Pria : 68 72 77 79 68 80 54 63 89 74 66 86 77 73

74 87

• Jika diasumsikan bahwa sampel-sampel tadi diambil dari populasi-populasi normal yang variansi-variansinya sama tetapi tidak diketahui, dan dengan =5%, bagaimana kesimpulan penelitian tersebut?

Jawab:

Jawab:

Jawab:

Jawab:

Kegunaan Chi‐Square: Uji Chi Square berguna untuk menguji hubungan atau

pengaruh dua buah variabel nominal dan mengukur

kuatnya hubungan antara variabel yang satu dengan

variabel nominal lainnya (C = Coefisien of contingency).

Karakteristik Chi‐Square: Nilai Chi‐Square selalu positip.

Terdapat beberapa keluarga distribusi Chi‐Square, yaitudistribusi Chi‐Square dengan DK=1, 2, 3, dst.

Bentuk Distribusi Chi‐Square adalah menjulur positip.

Pengujian hipotesis kompatibilitas merupakansuatu pengujian hipotesis untuk menentukanapakah suatu himpunan frekuensi yang diharapkan (frekuensi teoritis) sama denganfrekuensi yang telah diperoleh (frekuensipengamatan) dari suatu distribusi.

Jadi, dalam pengujian hipotesis kompatibilitasmerupakan pengujian kecocokan antara hasilpengamatan (frekuensi pengamatan) tertentudengan frekuensi yang telah diperolehberdasarkan nilai harapannya (frekuensiteoritis).

Menentukan Formulasi Hipotesis

H0 : frekuensi pengamatan sesuai dengan frekuensi yang diharapkan.

H1 : frekuensi pengamatan tidak sesuai dengan frekuensi yang diharapkan.

Menentukan Taraf Nyata (α) dan tabel χ2

Taraf nyata (α) dan χ2 tabel dapat ditentukan dengan derajat kebebasan (db)=

k-N.

keterangan:

k : merupakan banyaknya kejadian atau kelas,

N : merupakan banyaknya kuantitas dari hasil pengamatan yang

digunakan untuk menghitung frekuensi harapan.

Menentukan Kriteria Pengujian

H0 diterima jika X2hitung ≤ X2

α(k - N).H1 ditolak jika X2

hitung > X2α (k - N).

Menentukan Nilai Uji Statistik

Keterangan:f0 : merupakan frekuensi pengamatan,fe : merupakan frekuensi harapan.

Membuat KesimpulanDalam membuat kesimpulan kita akan menentukanapakah H0 dapat diterima atau ditolak.

Peneliti ingin mengetahui apakah terdapathubungan antara jenis kelamin denganhobi?

Data:Laki‐laki yang suka olah raga 27

Perempuan yang suka olah raga 13Laki‐laki yang suka otomotif 35

Perempuan yang suka otomotif 15Laki‐laki yang suka Shopping 33

Perempuan yang suka Shopping 27Laki‐laki yang suka komputer 25

Perempuan yang suka komputer 25

1. Tulis Hipotesis Ha dan Ho

Ho : χ = 0, Tidak terdapat hubungan

yang signifikan antara jenis kelamin

dengan hobi.

Ha : χ ≠ 0, Terdapat hubungan yang

signifikan antara jenis kelamin dengan

hobi.

2. Buat Tabel Kontingens

3. Cari nilai Frekuensi yang diharapkan

(fe)

Fe untuk setiap sel =

Misal:

fe sel pertama = = 24

4. Isikan Nilai fe ke Dalam Tabel

Kontingensi

5. Hitung nilai Chi‐Square

6. Tentukan kriteria pengujian

7. Tentukan nilai χ2 Tabel

› Taraf signifikansi (α) = 0,05.

› Df = (Baris‐1)(Kolom‐1)

= (2‐1)(4‐1)

= 3

χ2 Tabel = 7,815

8.

KESIMPULAN:

Tidak terdapat hubungan yang signifikan

antara jenis kelamin dengan hobi.

Uji kebebasan antara 2 variabel memiliki

prinsip pengerjaan yang sama dengan

pengujian beberapa proporsi.

(Berbeda hanya pada penetapan

Hipotesis awal dan hipotesis alternatif)

A. Uji Kebebasan :

› H0 : variabel-variabel saling bebas

› H1 : variabel-variabel tidak saling bebas

B Uji Beberapa Proporsi :

› H0 : setiap proporsi bernilai sama

› H1 : ada proporsi yang bernilai tidak sama

Bentuk umum Tabel Kontingensi → berukuran r baris x k kolom

derajat bebas = (r-1)(k-1)

r : banyak baris

k : banyak kolom

o: frekuensi observasi baris ke-i, kolom ke-j ij,

e : frekuensi ekspektasi baris ke-i, kolom ke-j )

Kita akan menguji kebebasan antara faktor gender (jenis kelamin) dengan jam kerja di suatu pabrik. Tabel kontingensi dapat dibuatsebagai berikut :

*) Nilai dalam kotak kecil adalah frekuensi ekspektasiPerhatikan cara mendapatkan frekuensi ekspektasi!

Apakah ada kaitan antara gender dengan jam kerja? Lakukan pengujian kebebasan variabel dengan taraf uji 5 % Ukuran Tabel Kontingensi di atas = 3 x 2 ( 3 baris dan 2 kolom)

db = (3-1)(2-1) = 2 x 1 = 2

1. H0 : Gender dan Jam kerja saling bebas

H1 : Gender dan Jam kerja tidak salingbebas

2. Statistik Uji = χ²

3. Nilai α = 5 % = 0.05

4. Nilai Tabel χ² db = 2; α = 0.05 → χ² tabel = 5.99147

5. Wilayah Kritis : Penolakan H0 → χ² hitung > χ²tabel

χ² hitung > 5.99147

Kesimpulan

χ² hitung < χ² tabel (0.4755 < 5.99147)

χ² hitung ada di daerah penerimaan H0

H0 diterima, gender dan jam kerja saling bebas

Catatan : Kesimpulan hanya menyangkutkebebasan antar variabel dan bukan hubungansebab-akibat (hubungan kausal)

1. Pendahuluan Analisa regresi digunakan untuk mempelajari dan mengukur

hubungan statistik yang terjadi antara dua atau lebih varibel. Dalam regresi sederhana dikaji dua variabel, sedangkan dalam regresi majemuk dikaji lebih dari dua variabel.

Dalam analisa regresi suatu persamaan regresi hendak ditentukan dan digunakan untuk menggambarkan pola atau fungsi hubungan yang terdapat antar variabel.

Variabel yang akan diestimasi nilainya disebut variabel terikat (dependent variable atau response variable) dan biasanya diplot pada sumbu tegak (sumbu-y). Sedangkan variabel bebas (independent variable atau explanatory variable) adalah variabel yang diasumsikan memberikan pengaruh terhadap variasi variabel terikat dan biasanya diplot pada sumbu datar (sumbu-x).

Regresi Linear

1. Pendahuluan Analisa korelasi bertujuan untuk mengukur

"seberapa kuat" atau "derajat kedekatan" suatu relasi yang terjadi antar variabel.

Analisa regresi ingin mengetahui pola relasi dalam bentuk persamaan regresi,

Analisa korelasi ingin mengetahui kekuatan hubungan tersebut dalam koefisien korelasinya. Dengan demikian biasanya analisa regresi dan korelasi sering dilakukan bersama-sama.

Regresi Linear

1. Pendahuluan Dalam menentukan apakah terdapat suatu hubungan yang

logis antar variabel, terutama bila penilaian dilakukan terhadap angka-angka statistik saja, perlu diperhatikan beberapa hal yang berkaitan dengan masuk akal atau tidaknya hubungan tersebut jika ditinjau dari sifat dasar hubungan tersebut.

Terdapat beberapa kemungkinan bentuk relasi meliputi hubungan sebab akibat (cause-and-effect relationship), hubungan akibat penyebab yang sama (common-cause factor relationship) hubungan semu (spurious relationship).

Regresi Linear

1. Pendahuluan Langkah pertama dalam menganalisa relasi antar

variabel adalah dengan membuat diagram pencar (scatter diagram) yang menggambarkan titik-titik plot dari data yang diperoleh. Diagram pencar ini berguna untuk membantu dalam melihat apakah ada relasi yang

berguna antar variabel,

membantu dalam menentukan jenis persamaan yang akan digunakan untuk menentukan hubungan tersebut.

Regresi Linear

1. Pendahuluan

Regresi Linear

Linier positif Linier negatif

1. Pendahuluan

Regresi Linear

Curvelinier positif Curvelinier negatif

1. Pendahuluan

Regresi Linear

Curvelinier Tak tentu

2. Analisis Regresi LinearFungsi regresi linear dapat dinyatakan dalam hubungan matematis oleh: BXAY .

Sebagai misal Y = 2 + 1,4X, secara teoritis bila X = 10, maka Y = 16. Pada kenyataannya

tidak demikian, sebab yang mempengaruhi Y bukan hanya X tetapi ada faktor lain yang tidak

dimasukkan dalam persamaan, faktor tersebut secara keseluruhan disebut sebagai

“kesalahan” (disturbance’s error). Adanya kesalahan ini menjadikan perkiraan menjadi tidak

akurat, selalu ada resiko yang disebabkan oleh adanya kesalahan. Kesalahan ini tidak dapat

dihilangkan sama sekali, maka resiko ini harus diperkecil sekecil mungkin dengan

memperkecil kesalahan. Dengan memperhitungkan kesalahan, regresi linear dinyatakan

sebagai BXAY .

Regresi Linear

2. Analisis Regresi LinearAsumsi yang digunakan dalam regresi linear adalah sebagai berikut:

a. 0iE

b. 22 iE

c. 0),cov( jijiE

d. iX konstan

Untuk memperkirakan A dan B dipergunakan metode kuadrat kesalahan terkecil, dimana

Model sebenarnya : BXAY

Model perkiraan : ebXaY

a, b, dan e adalah penduga untuk A, B, dan

iii ebXaY atau )( iii bXaYe dan 22 )( ii

i

bXaYei

.

Regresi Linear

2. Analisis Regresi Linearpenurunan parsial terhadap a dan b yang sederhana diperoleh

2

2

2

i

i

i

i

i

ii

i

i

i

i

i

i

XXn

YXXXY

XbYa dan

i i

ii

i

i

i

i

i

ii

XXn

YXYXn

b2

2

Regresi Linear

2. Analisis Regresi Linear

Gambar 2 Garis regresi linier pada diagram pencar

y (+)

y (+)

y (+)

y

(+)

y

(-)

y

(-)

y

(-)

y

(-)

y

(0)

y

(0)

a

y a bx

x

y

Regresi Linear

2. Analisis Regresi LinearNilai variabel A dan B untuk populasi diberikan oleh

XBYA dan

x

xy

X

YX

XEXE

YEXEXYEB

var

,cov22

Bila

nYXYX

ns

i i

ii

i

iixy /1

adalah penduga untuk xy dan

nXX

ns

i

i

i

ix /1

2

22 adalah penduga untuk

2

x , maka

i

i

i

ii

x

xy

x

yx

s

sb

22

Regresi Linear

2. Analisis Regresi Lineardimana

nYXYXyx

i i

ii

i

ii

i

ii / dan

nXXx

i

i

i

i

i

i /

2

22

i

i

e

bx

b2

2

2var

dan

i

i

eax

X

na

2

2

22 1var

2

2

2

,,cov e

i

i

bax

Xba

Regresi Linear

2. Analisis Regresi LinearContoh 1

Dari suatu praktikum fisika dasar diperoleh data yang menghubungkan variabel bebas x dan variabel terikat y seperti ditunjukkan dalam tabel berikut.

Uji ke- x y

1 6 30

2 9 49

3 3 18

4 8 42

5 7 39

6 5 25

7 8 41

8 10 52

56 296

Regresi Linear

2. Analisis Regresi LinearJika berdasarkan kajian teoritis dan sifat dari fenomena yang menghubungkan x dan y dapat diasumsikan mempunyai bentuk hubungan linier, maka persamaan garis regresinya dapat ditentukan sebagai berikut.

Tabel perhitungan:

Uji ke- x y xy x2 y2

1 6 30 180 36 900

2 9 49 441 81 2401

3 3 18 54 9 324

4 8 42 336 64 1764

5 7 39 273 49 1521

6 5 25 125 25 625

7 8 41 328 64 1681

8 10 52 520 100 2704

56 296 2257 428 12920

56 296

7 37 8 8

x yx y

n n

Regresi Linear

2. Analisis Regresi LinearKolom y2 ditambahkan pada tabel meskipun belum digunakan untuk perhitungan persamaan garis regresi. Nilai tersebut akan digunakan kemudian. Jadi dengan menggunakan hasil pada tabel, nilai dari konstanta a dan b dapat ditentukan:

2 22

8(2257) (56)(296) 14805,1389

2888(428) (56)

n xy x yb

n x x

37 (5,1389)(7) 1,0277a y bx

Jadi persamaan garis regresi linier yang menggambarkan hubungan antara variabel x dan y dari data sampel pada percobaan/praktikum di atas adalah:

ˆ 1,0277 5,1389y a bx x

Dengan menggunakan persamaan garis regresi yang diperoleh, maka dapat diperkirakan hasil yang akan diperoleh (nilai y) untuk suatu nilai x tertentu. Misalnya untuk x = 4 maka dapat diperkirakan bahwa y akan bernilai: ˆ 1,0277 5,1389y a bx x =1,0277 + 5,1389(4) = 21,583

Regresi Linear

2. Analisis Regresi Linear

y = 5.1389x + 1.0278

0

10

20

30

40

50

60

0 2 4 6 8 10 12

x

y

Gambar. Garis regresi untuk contoh soal 1

Regresi Linear

2. Analisis Regresi LinearKarena variansi dari A dan B tidak diketahui maka digunakan variansi

dari a dan b yang dapat dinyatakan sebagai

222

22

2

2

n

yxby

n

xby

n

eS i i

iii

i i

ii

ie

i

i

e

bx

SS

2

2

2 dan

i

i

eax

X

nSS

2

2

22 1

Regresi Linear

2. Analisis Regresi Linear

Regresi Linear

x x

y y

(a)x (b)x

Derajat variasi sebaran data

2. Analisis Regresi Linear

Dengan menggunakan data dan tabel perhitungan pada contoh 1, maka standard error estimasi dari garis regresi yang diperoleh adalah:

2

,2

(11,920) 1,0277(296) 5,1389(2,257) 1,698

8 2

y x

y a y b xys

n

Regresi Linear

3. Uji Koefisien dan KorelasiUntuk melihat pengaruh X terhadap Y, maka dilakukan pengujian pada koefisien regresi

B. Bila X tidak mempengaruhi Y maka B = 0, bila ada pengaruh negatif B < 0, ada pengaruh

positif B > 0, dan bila ada pengaruh X terhadap Y maka B 0. Perumusan untuk pengujian

koefisien regresi B, adalah:

a. Ho : B = 0

b. H1 : B > 0 (ada pengaruh X terhadap Y positif)

H1 : B < 0 (ada pengaruh X terhadap Y negatif)

H1 : B 0 (ada pengaruh X terhadap Y)

c. Dengan diketahui, dari tabel distribusi-t maka dapat dihitung t untuk pengujian satu

arah dan 2

t untuk pengujian dua arah.

d. Tentukan statistik uji (tb) yang diberikan oleh

b

o

bs

Bbt

;

n

xx

ss

xy

b2

2

,

)(

e. Simpulkan, tolak Ho atau terima Ho.

Regresi Linear

3. Uji Koefisien dan Korelasi

Pendugaan Parameter Regresi

Dari nilai atau derajat kepercayaan (1 - ) yang telah ditentukan, interval

pendugaan parameter A dan B dapat ditentukan, yang diberikan masing-masing oleh:

bb stbBstb22

dan

aa staAsta22

Regresi Linear

3. Uji Koefisien dan KorelasiDengan menggunakan data dan tabel perhitungan pada contoh 1 dan hasil perhitungan standard error estimasi dari garis regresi yang diperoleh pada contoh 12, maka uji kemiringan (slope) garis regresi dapat dilakukan sebagai berikut:

1. Hipotesis: Ho : B = 0

H1 : B 0

2. α = 0.05

3. Digunakan distribusi t0,025 dengan df = n - 2 = 8 - 2 = 6

4. Batas-batas daerah penolakan uji dua ujung (two-tailed) Dari tabel distribusi t batas kritis adalah = tcr = 2,447

5. Aturan keputusan: Tolak H0 dan terima H1 jika perbedaan yang terstandard antara kemiringan sample (b) dan kemiringan populasi yang dihipotesiskan (BHo) kurang dari -2,447 atau lebih dari 2,447. Jika sebaliknya terima H0

Regresi Linear

3. Uji Koefisien dan Korelasi6. Rasio Uji

,

2 2

2

1,698 1,6980,283

656428

8

y x

b

ss

xx

n

5,1389 0

18,1590,283

oH

t test

b

b BRU t

s

7. Pengambilan keputusan

Karena RUt = 18,159 bernilai jauh lebih besar daripada nilai batas tcr = 2,447, maka H0: B = 0 ditolak. Hal ini bahwa hipotesis alternatif yang menyatakan bahwa terdapat kemiringan pada garis regresi untuk populasi serta suatu hubungan regresi yang berarti benar-benar ada antara variabel X dan Y. Kesimpulan diatas dapat juga diperkuat dengan menentukan perkiraan interval nilai B dengan tingkat kepercayaan 95 persen sebagai: b - t(sb) < B < b - t(sb) 5,1389 - 2,447(0,283) < B < 5,1389 + 2,447(0,283) 4,4464 < B < 5,8314

Dengan menganggap nilai variable terikat, y yang sesungguhnya terdistribusi normal di sekitar garis regresi maka suatu estimasi interval dapat diperoleh sebagai:

y xy z s

Dalam relasi ( z adalah skor z yang akan menentukan tingkat kepercayaan dari penerimaan estimasi interval yang dilakukan. Gambar 7 mengilustrasikan estimasi interval untuk z = 2.

Gambar 7 Interpretasi dan aplikasi estimasi interval untuk sampel besar

x

y y

,3 y xs

,3 y xs

1x

1y

1 ,ˆ 2 y xy s

Untuk Sampel Kecil (n < 30)

a. Prediksi Kisaran Nilai Rata-rata y Jika Diketahui x Estimasi interval untuk sampel kecil dengan situasi ini dapat diperoleh dengan rumus berikut:

2

/ 2 , 2

2

g

y x

x xy t s

n xx

n

dimana: y = estimasi titik yang dihitung dengan persamaan regresi untuk nilai x tertentu

tα/2 = nilai t untuk α/2 ( =tingkat kepercayaan) dengan derajat kebebasan n-2 xg = nilai x yang ditentukan n = jumlah observasi pasangan pada sampel

Regresi Linear

b. Prediksi Kisaran Nilai Spesifik y Jika Diketahui x

Estimasi interval untuk sampel kecil dengan situasi ini dapat diperoleh dengan rumus berikut:

2

/ 2 , 2

2

1ˆ 1

g

y x

x xy t s

n xx

n

Regresi Linear

Dengan menggunakan data dan tabel perhitungan pada contoh 1 dan persamaan garis regresi yang dihasilkan serta nilai sy,x pada contoh 2 , dapat diprediksi dengan tingkat kepercayaan 95 persen dan derajat kebebasan = n - 2 = 8 -2 = 6, untuk x = 4,

2

/ 2 , 2

2

2

2

4 7121,583 2,447 1,698

8 428 56 8

g

y x

x xy t s

n xx

n

Jadi dengan derajat kepercayaan 95 persen diperoleh: 19,038 < y < 24,128

Regresi Linear

4. Analisis KorelasiSebelum dilakukan analisa regresi, langkah yang biasa ditempuh adalah melakukan

analisa korelasi yang ditujukan untuk mengetahui erat tidaknya hubungan antar variabel.

Pada analisa regresi, untuk observasi Y diasumsikan bahwa X adalah tetap konstan dari

sampel ke sampel. Interpretasi koefisien korelasi untuk mengukur kuatnya hubungan antar

variabel tergantung pada asumsi yang digunakan untuk X dan Y. Bila X dan Y bervariasi

maka koefisien korelasi akan mengukur “covariability (kesamaan variasi)” antara X dan Y. Di

dalam analisa regresi, koefisien korelasi digunakan untuk mengukur “cocok/tepat (fitness)”

garis regresi sebagai pendekatan data observasi. Besarnya koefisien korelasi dinyatakan

sebagai

yx

xy

yx

YX

),cov(

Dalam prakteknya, tidak diketahui tetapi nilainya dapat diestimasi berdasar data sampel.

Bila r adalah penduga , dengan r dinyatakan sebagai

i i

ii

i i

ii

i

i

i

i

i

ii

i

i

i

i

i

ii

YYnXXn

YXYXn

yx

yx

r2

2

2

2

Regresi Linear

4. Analisis KorelasiPengujian hipotesis tentang dilakukan dengan langkah-langkah sebagai berikut

a. Ho : = 0 (tidak ada hubungan antara X dan Y)

H1 : > 0 (ada hubungan positif)

H1 : < 0 (ada hubungan negatif)

H1 : 0 (ada hubungan)

Apabila = 0, maka variansi r diberikan oleh

2

1)var(

22

n

rr r

Dimana r2 disebut sebagai koefisien determinasi untuk mengukur besarnya kontribusi X

terhadap variasi Y

b. Dengan diketahui, dari tabel distribusi-t maka dapat dihitung )2( nt untuk pengujian

satu arah dan )2(

2n

t untuk pengujian dua arah.

c. Tentukan statistik uji (tb) yang diberikan oleh

21

2

r

nrtr

dengan derajat kebebasan n

d. Simpulkan, tolak Ho atau terima Ho.

Regresi Linear

4. Analisis Korelasi Dengan menggunakan data dan tabel perhitungan pada contoh 1 dan persamaan

garis regresi yang dihasilkan dapat diperoleh koefisien determinasi dan koefisien korelasi sebagai berikut. Dari persamaan regresi a = 1,0277 dan b = 5,1389. Jumlah pasangan pengamatan n = 8. Maka:

2

2

2 2

2

2

1,0277 296 5,1389 2257 8 37 0,982

11920 8 37

a y b xy n yr

y n y

0,982 0,991r

Regresi Linear

4. Analisis Korelasi

Hubungan antara koefisien regresi b dengan koefisien korelasi r dinyatakan oleh

x

y

s

srb dimana

i

iy YYn

s21

dan i

ix XXn

s21

.

Regresi Linear

4. Analisis Korelasi

Dalam statistika seringkali menduga nilai rata-rata Y pada nilai X tertentu. Telah

ditunjukkan bahwa bXaY ˆ adalah penduga E(Y|X). Misalkan oY adalah nilai Y pada X =

Xo, maka

oooooo XYEBXAXbEaEbXaEYE |ˆ

Interval penduga E(Yo|Xo) dengan tingkat keyakinan 1 diberikan oleh

2

2

2/2

2

2/

1|

1

i

oeooo

i

oeo

X

XX

nstbXaXYE

X

XX

nstbXa

Interval penduga untuk individu Yo pada X = Xo diberikan oleh

2

2

2/2

2

2/

11

i

oeoo

i

oeo

X

XX

nstbXaY

X

XX

nstbXa

Regresi Linear

5. Regresi Linear Non Linear

Tidak selamanya hubungan antara X dan Y dapat bersifat linear, akan tetapi bisa juga

non linear. Metode kesalahan kuadrat terkecil dapat pula digunakan untuk menentukan

parameter sebagai koefisien pada hubungan yang non linear. Bentuk-bentuk hubungan non

linear dapat didekati/ditransformasi sebagai hubungan linear, Tabel 11.1. adalah beberapa

bentuk transformasi dari non linear menjadi linear oooo XBAY .

Tabel 11.1. Hubungan Koefisien Non Linear Dengan Hasil Transformasi Linear

Persamaan Hasil Transformasi oooo XBAY

Persamaan Asal

oY oA oB oX

BAXY Ylog Alog Xlog

X

BAY

Y A B

X

1

BXAeY Yln Aln B X

XABY Ylog Alog Blog X

Regresi Linear

BAB VII

ANOVA(Analisis Of Varians)

ANOVA

Anova berfungsi untuk menguji lebih dari 2 rata-rata. Tabel yang digunakan pada Anova adalah tabel distribusi-F

Anova terbagi menjadi 2 :

- Anova One Way

- Anova Two Way

Kegunaan ANOVA

• Mengendalikan 1 atau lebih variabel independen▫ Disebut dgn faktor (atau variabel treatment)▫ Tiap faktor mengandung 2 atau lebih level

(kategori / klasifikasi)

• Mengamati efek pada variabel dependen▫ Merespon level pada variabel independen

• Perencanaan Eksperimen: perencanaan denganmenggunakan uji hipotesis

ANOVA

• Asumsi :

1. Data berdistribusi normal

2. Skala pengukuran minimum interval

3. Variasi homogen

4. Pengambilan sampel acak dan independent

Anova One Way

(Complete Random Design / CRD)

Pengertian :

Dipengaruhi satu faktor yang terdiri dari beberapa level.

Misalnya, mengukur kesuburan tanaman dengan faktor pupuk. Jadi tiap pot memiliki tingkat kesuburan tanah yang sama namun pupuknya berbeda, dari pernyataan tersebut dapat dilihat bahwa kesuburan tanaman hanya dipengaruhi oleh satu faktor saja, yaitu pupuk

Anova One Way

• Model Matematik

Dimana:

µ = Mean

= efek perlakuan ke-j

~ IIDN(0,σ)

= Hasil Observasi

Prosedur analisis variansi adalah

• Menentukan H0 dan H1.H0 : 1 = 2 = 3 = ……= k

H1 : paling sedikit dua diantara rata-rata tersebuttidak sama

• Menentukan taraf nyata .

• Uji statistik (tabel Anova):

1k1

2

1

k

JKAS

2

2

1

S

S

)1( nk)1(

2

nk

JKGS

Sumber

Variasi

Jumlah

Kuadrat

Derajat Bebas Rata-rata

Kuadrat

F hitungan

Perlakuan JKA

Galat JKG

Total JKT 1nk

nk

T

n

T

JKA

k

i

i 2

..1

2

.

k

i

n

j

ijnk

TyJKT

1 1

2

..2 JKAJKTJKG

Analisis Variansi Dua Arah

• Untuk menentukan apakah ada variasi dalampengamatan yang diakibatkan oleh perbedaan dalamperlakuan, uji hipotesisnya adalah :▫ H0 : 1. = 2. = … = k. atau bisa dituliskan H0 : 1 = 2 = … =k

▫ H1 : paling sedikit dua diantaranya tidak sama

• Untuk menentukan apakah ada variasi dalampengamatan yang diakibatkan oleh perbedaan dalamblok, uji hipotesisnya adalah :▫ H0 : .1 = .2 = … = .b atau bisa dituliskan H0 : 1 = 2 = … = b

▫ H1 : paling sedikit dua diantaranya tidak sama

• Tabel Anova:

1k1

2

1

k

JKAS

2

2

11

S

SF

1b1

2

2

b

JKBS

2

2

22

S

SF

)1)(1( bk)1)(1(

2

bk

JKGS

1bk

Sumber VariasiJumlah

KuadratDerajat Bebas Rata-rata Kuadrat F hitung

Perlakuan JKA

Blok JKB

Galat JKG

Total JKT

bk

TyJKT

k

i

b

j

ij

2

1 1

2 ..

bk

T

b

T

JKA

k

i

i 2

..1

2

.

bk

T

k

T

JKB

b

j

j 2

..1

2

.

JKBJKAJKTJKG

Daerah kritis :

H0 ditolak pada taraf keberartian jika

F1 >

H0 ditolak pada taraf keberartian jika

F2 >

)]1)(1(,1[; bkkf

)]1)(1(,1[; bkbf

Uji Kesamaan Beberapa Variansi

• Analisis variansi satu arah hanyadapat dilakukan apabila variansi darik-populasi adalah sama (homogen).

• Bila syarat tersebut tidakdipenuhi, maka uji analisis variansitidak dapat dilakukan

Terimakasih

Semoga bermanfaat

top related