count data) dalam glm - kusmansadik.files.wordpress.com · negatif binomial log ... nilai deviance...
TRANSCRIPT
![Page 1: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/1.jpg)
Pemodelan Data Cacahan
(Count Data) dalam GLM
Dr. Kusman Sadik, M.Si
Sekolah Pascasarjana Departemen Statistika IPB
Semester Genap 2017/2018
![Page 2: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/2.jpg)
2
Pada model linear klasik, seperti regresi linear,
memerlukan asumsi bahwa peubah respon y
menyebar Normal.
Pada kenyataanya banyak ditemukan bahwa peubah
respon y tidak menyebar Normal. Misalnya menyebar
Binomial, Poisson, Gamma, Eksponensial, dsb.
Maka dikembangkan Model Linear Terampat (GLM)
untuk mengatasi masalah ini.
Pendahuluan
![Page 3: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/3.jpg)
3
Tiga Komponen dalam GLM
1. Komponen Acak (Random Component)
Komponen acaknya adalah peubah respon y.
Dalam GLM, peubah respon diasumsikan
mempunyai sebaran yang termasuk ke dalam
keluarga eksponensial (exponential family),
yaitu :
![Page 4: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/4.jpg)
4
lanjutan …
2. Komponen Sistematik (Systematic Component)
Komponen sistematik adalah kombinasi linear
dari kovariat x1, x2, …, xp. Sehingga dapat
dituliskan sebagai berikut:
i = (ixi)
i disebut juga sebagai penduga linear (linear
predictor), i adalah konstanta.
![Page 5: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/5.jpg)
5
lanjutan …
3. Fungsi Hubung (Link Function)
Yaitu fungsi yang menghubungkan antara
komponen acak dengan komponen sistematik.
Misalkan E(yi) = i, selanjutnya dapat dibuat
hubungan sebagai berikut :
g(i) = i = (ixi)
g(.) disebut sebagai fungsi hubung. Fungsi ini
harus bersifat terdiferensialkan monoton
(monotonic differentiable)
![Page 6: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/6.jpg)
6
Sebaran Keluarga
Eksponensial
Normal
Binomial
Multinomial
Poisson
Gamma
Eksponensial
Negatif Binomial
Dsb.
![Page 7: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/7.jpg)
7
Fungsi Hubung Natural/Kanonik
Sebaran y Fungsi Hubung
Normal Identitas
Binomial Logit
Gamma Invers
Poisson Log
Multinomial Logit Kumulatif
Negatif Binomial Log
Inverse Gaussian Invers Kuadrat
![Page 8: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/8.jpg)
8
Pendugaan Parameter
Metode Fisher Scoring
L(,y) adalah fungsi kemungkinan (likelihood), I disebut
matrik informasi Fisher. Maka penduga secara iteratif
adalah sebagai berikut :
srr
r
yLE
yLU
),( ;
),( 2
I
)1()1()1()()1( ˆˆ kkkkkUβIβI
)1()1()1()( )(ˆˆ kkkkUIββ
-
![Page 9: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/9.jpg)
9
Pengukuran Kelayakan Model
Kelayakan model (goodness of fit) pada GLM dapatdiukur berdasarkan Deviance (D).
Deviance adalah dua kali perbedaan antara log likelihood nilai aktual dengan log likelihood nilaidugaan.
Nilai deviance dapat digunakan sebagai statistik ujimengenai kelayakan model.
Deviance merupakan peubah acak yang sebarannyamendekati sebaran 2.
![Page 10: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/10.jpg)
10
Sebaran asimptotik bagi deviance (D) adalah
2(n-p)
dimana n adalah banyaknya data, sedangkanp adalah banyaknya parameter dalammodel.
![Page 11: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/11.jpg)
11
Uji hipotesis untuk vektor r
Ho : r = 0 H1: r 0
p = [ r : p-r ]
![Page 12: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/12.jpg)
12
Peubah Respon Poisson
Respon yang diukur (y) berupa banyaknya
kejadian selama selang waktu tertentu atau
dalam luas area tententu.
Misalnya, banyaknya pengunjung mal per hari,
banyaknya bakteri dalam kultur biakan, dsb.
Peubah respon y yang demikian disebut
menyebar Poisson
![Page 13: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/13.jpg)
13
Karakteristik Sebaran Keluarga Eksponensial
![Page 14: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/14.jpg)
14
![Page 15: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/15.jpg)
15
GLM untuk Sebaran Poisson
![Page 16: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/16.jpg)
16
![Page 17: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/17.jpg)
17
![Page 18: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/18.jpg)
18
Model Log-Linear
![Page 19: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/19.jpg)
19
Masalah Overdispersi
![Page 20: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/20.jpg)
20
Studi KasusMcCullagh dan Nelder (hlm. 204)
![Page 21: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/21.jpg)
21
Data
![Page 22: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/22.jpg)
22
Pemodelan
![Page 23: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/23.jpg)
23
![Page 24: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/24.jpg)
24
Implementasi dalam Program R : Syntax
## 6.3.2. A study of wave damage to cargo ships
## McCullagh dan Nelder (hlm.204)
shipku <- read.csv(file='1-data.ship.accident.mccullagh.csv',
header=TRUE)
tipe <- factor(shipku[,2]) # Kategorik
tahun <- factor(shipku[,4]) # Kategorik
periode <- factor(shipku[,6]) # Kategorik
service <- shipku[,7] # Kontinu
incidents <- shipku[,8] # Kontinu
## Menentukan kategori pembanding
tipe <- relevel(tipe, ref="A")
tahun <- relevel(tahun, ref="1960-64")
periode <- relevel(periode, ref="1960-74")
data.frame(tipe,tahun,periode,service,incidents)
![Page 25: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/25.jpg)
25
## We model the rate of damage incidents per month of service, so
## log(service) is an offset.
## We expect overdispersion, so we fit by quasi-likelihood using
## the quasipoisson family.
## The number of damage incidents must be zero for any observation
## with zero aggregated months of service (whether they corrspond
## to "necessarily empty" or "accidentally empty cells." These
## "observations" are not useful in fitting the model, and so are
## omitted using the subset argument.
model <- glm(incidents ~ tipe + tahun + periode,
offset = log(service), family = quasipoisson("link"=log),
subset = (service != 0))
summary(model)
![Page 26: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/26.jpg)
26
Keluaran Program R: (1)
> data.frame(tipe,tahun,periode,service,incidents)
tipe tahun periode service incidents
1 A 1960-64 1960-74 127 0
2 A 1960-64 1975-79 63 0
3 A 1965-69 1960-74 1095 3
4 A 1965-69 1975-79 1095 4
5 A 1970-74 1960-74 1512 6
6 A 1970-74 1975-79 3353 18
7 A 1975-79 1960-74 0 0
8 A 1975-79 1975-79 2244 11
.
.
.
37 E 1970-74 1960-74 1157 5
38 E 1970-74 1975-79 2161 12
39 E 1975-79 1960-74 0 0
40 E 1975-79 1975-79 542 1
![Page 27: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/27.jpg)
27
Keluaran Program R: (2)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.6768 -0.8293 -0.4370 0.5058 2.7912
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -6.40590 0.28276 -22.655 < 2e-16 ***
tipeB -0.54334 0.23094 -2.353 0.02681 *
tipeC -0.68740 0.42789 -1.607 0.12072
tipeD -0.07596 0.37787 -0.201 0.84230
tipeE 0.32558 0.30674 1.061 0.29864
tahun1965-69 0.69714 0.19459 3.583 0.00143 **
tahun1970-74 0.81843 0.22077 3.707 0.00105 **
tahun1975-79 0.45343 0.30321 1.495 0.14733
periode1975-79 0.38447 0.15380 2.500 0.01935 *
----------------
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for quasipoisson family taken to be 1.691028)
Null deviance: 146.328 on 33 degrees of freedom
Residual deviance: 38.695 on 25 degrees of freedom
![Page 28: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/28.jpg)
28
Contoh Topik Riset
dalam Jurnal
![Page 29: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/29.jpg)
29
Contoh 1:
![Page 30: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/30.jpg)
30
Contoh 2:
![Page 31: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/31.jpg)
31
Contoh 3:
![Page 32: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/32.jpg)
32
Contoh 4:
![Page 33: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/33.jpg)
33
Contoh 5:
![Page 34: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/34.jpg)
34
Contoh 6:
![Page 35: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/35.jpg)
35
Contoh 7:
![Page 36: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/36.jpg)
36
McCullagh, P. and Nelder, J.A. (1989) Generalized
Linear Models, 2nd. C&H.
Dobson and Barnett. (2008). An Introduction to
Generalized Linear Models, New York: C&H, 3rd ed.
Agresti, A. (2015). Foundations of Linear and
Generalized Linear Models. New Jersey: Wiley.
Pustaka Utama
![Page 37: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/37.jpg)
37
Jiang, J. (2007). Linear and Generalized Linear Mixed
Models and Their Applications, Springer.
McCulloch, C.E. and Searle, S.R. (2001) Generalized,
Linear, and Mixed Models, Wiley
Pawitan, Y. (2001) In All Likelihood. Oxford.
Lee, Y., Nelder, J.A. and Pawitan, Y. (2006).
Generalized Linear Models with Random Effects. C&H.
Pustaka Tambahan
![Page 38: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/38.jpg)
38
Materi ini bisa di-download di:
kusmansadik.wordpress.com
![Page 39: Count Data) dalam GLM - kusmansadik.files.wordpress.com · Negatif Binomial Log ... Nilai deviance dapat digunakan sebagai statistik uji ... Studi Kasus McCullagh dan Nelder (hlm](https://reader031.vdocuments.net/reader031/viewer/2022013018/5cecdecd88c99396038b514a/html5/thumbnails/39.jpg)
39