multimedia dan computer vision
TRANSCRIPT
H. SUMIJANSTAF PENGAJAR
Universitas Putra Indonesia “YPTK”
MULTIMEDIA DAN COMPUTER VISION
Multimedia: merupakan integrasi dari media
kontinu (misalnya audio, video) dan media
diskrit (teks, audio, grafik, gambar, video)
menjadi informasi digital yang dapat
disampaikan kepada pengguna secara tepat.
Teknologi Multimedia : teknologi berbasis
komputer yang dapat mengintegrasikan
informasi teks, suara, gambar, animasi dan
video digital serta mengkomunikasikannya
kepada pengguna.
Tantangan Teknis :
Butuh pengelolaan ragam data dan
volume data besar
Waktu proses data dan komunikasi antara
komponen-komponen teknologi bersifat real-
time.
Butuh sinkronisasi kerja antar komponen
teknologi
Volume Data : Speech 8000 samples/s 8Kbytes/s
CD Audio44,100 samples/s, 2 bytes/sample
176Kbytes/s
Satellite 180X180 km^2 600MB/image
Imagery 30m^2 resolution (60MB compressed)
NTSC Video30fps, 640X480 pixels, 3bytes/pixel
30Mbytes/s (2-8 Mbits/s compressed)
Dokumen multimedia :
Teks
Citra Audio
Video
Animasi (komputer grafik)
Suatu dokumen yang berisikan dua atau lebih
elemen-elemen multimedia (media) dari sumber
yang berbeda ( teks, citra, video, audio, …)
Dokumen multimedia disimpan dalam satu atau
beberapa file secara tersinkronisasi terhadap
dasar waktu yang sama.
Dokumen multimedia :
Contoh :
Suatu reportase pada siaran televisi akan susah difahami jika
komentar seorang jurnalis memiliki delay waktu terhadap
video dan/atau juga terhadap ilustrasi grafik yang ditayangkan.
Sinkronisasi dokumen multimedia :
• Sinkronisasi intra-objets
• Sinkronisasi inter-objets
Layanan Residential Video-on-demand
Video phone/Conference
Multimedia home shopping (MM catalogs,
product demos and presentation)
Layanan Business Services
Corporate training
Desktop MM conferencing, MM e-mail
9
Vidéo conférence
1. Volume data multimedia sangat besar
2. Bandwidth jaringan terbatas dan mahal
3. Delay waktu transmisi besar
1. Realtime Object Recognition in video games Ari Morgan (1)
2. Multiple Camera Tracking with Wide Baseline Homography
Zhaowen Wang, Ning Xu, David Ho (3)
3. Multiview 3D object reconstruction Vinay Muttineni, Mahesh
Akella, Allan Law (3)
4. Wild Cat Identification Mohammad Amanzadeh, Amit Das,
Heman Gala (3)
5. Background subtraction: compare three methods Kevin
Shih, Philbert Lin, and Pooya Khorrami (3) Compare
three methods for background subtraction.
6. Taxi Detection and Tracking AJ von Alt, Phil Lee (2)
Develop a method for detecting and tracking specific
cars through a video sequence with applications to New
York style Taxi cabs in an urban environment
CONTOH APLIKASI COMPUTER VISION
7. Classroom webcam control Sahil Handa, Sujay Bhobe,
Suchithra Gopal (3)
8. K-mer Based DNA Sequence Alignment using Inverse
Document File Approach Izzat El Hajj (1) One of the
bottleneck problems in DNA sequence assembly and
alignment is being able to find contigs in a database
that overlap with a sequence of base pairs. The idea
this project wishes to borrow from computer vision is
the inverse document file approach used to query
image databases.
9. Analyze material composition Johannes Traa (1) I would
like to explore a computer vision application of
techniques from compositional data analysis (CODA).
CONTOH APLIKASI COMPUTER VISION
10. Bimanual Symmetric Gesture Recognition using Computer
Vision Aadeel Akhtar, Manoj Kumar, Tom Paine (3)
11. Similar category classification Abdel Vargas Silva (1)
12. Real-time Segmentation of Human Data from Kinect
Pengye Xia, Nan Chen, and Tony Lau (3)
13. Street Sign Recognition John Parkeer, Brian Wright (2)
14. Control law and parameter recovery from video footage
Sophie Puydupin and Pritam Sukumar (2)
15. Aircraft localization and classification Jason Oates (1)
16. Detect Star Patterns for Space Navigation Eric Babcock (1)
17. Create 3D Mesh using Kinect Jorge Carmona (1)
18. Automatic Face Tagging Thapanapong Rukkanchanunt,
Manne Henriksson, Seylom Ayivi-Guedehoussou (3)
CONTOH APLIKASI COMPUTER VISION
19. Object Removal by Retrieving Background Regions
Mariyam Khalid, Daphne Tsatsoulis, Zhicheng Yan (3)
20. 20. Segment out person using Kinect RJ Marsan, Felix
Wang, John Wieting (3)
21. Playing Card Recognition Cem Onyuksel, Adam
Zimmerman (2)
22. Depth Upsampling using Sparse Dictionaries Keunhong
Park (1)
23. Monitoring and Diagnostics of Gas Turbines Duy (Dewey)
Tran (1)
24. Restoring Motion-Blurred Image Chao Xia (1)
25. Power Watershed Segmentation Pratik Mallya (1)
26. Carcassonne Gameboard Scorer Zigang Xiao, Ting Yu (2)
27. Image Analysis of Maize Ear Ou Yang Fu (1)
CONTOH APLIKASI COMPUTER VISION
Pendidikan
Pembelajaran jarak jauh
Repository video pembelajaran
Akses ke MM digital libraries
Kedokteran
Diagnosis, pengobatan dan pengarsipan
Basis data multimedia
Bidang medis (kedokteran) :
Simulasi kedokteran :
Bidang medis (Diagnosis) :
Algoritma segmentasi warna citra
Simulasi penerbangan :
APA KEUNTUNGAN BERBUAT BAIKAllah tidak membebani seseorang melainkan sesuai dengan kesanggupannya. Ia
mendapat pahala (dari kebajikan) yang diusahakannya dan ia mendapat siksa
(dari kejahatan) yang dikerjakannya. (Mereka berdoa): "Ya Tuhan kami, janganlah
Engkau hukum kami jika kami lupa atau kami tersalah. Ya Tuhan kami, janganlah
Engkau bebankan kepada kami beban yang berat sebagaimana Engkau bebankan
kepada orang-orang sebelum kami. Ya Tuhan kami, janganlah Engkau pikulkan
kepada kami apa yang tak sanggup kami memikulnya. Beri ma'aflah kami;
ampunilah kami; dan rahmatilah kami. Engkaulah Penolong kami, maka tolonglah
kami terhadap kaum yang kafir."( QS: 2. Al Baqarah:286)
Barangsiapa yang mengerjakan kebaikan seberat dzarrahpun, niscaya dia akan
melihat (balasan)nya. Asbabun nuzul. Dan barangsiapa yang mengerjakan
kejahatan sebesar dzarrahpun, niscaya dia akan melihat (balasan)nya pula.
Asbabun nuzul (QS: 99. Al Zalzalah:7-8)
Dan sampaikanlah berita gembira kepada mereka yang beriman dan berbuat
baik, bahwa bagi mereka disediakan surga-surga yang mengalir sungai-sungai
di dalamnya. Setiap mereka diberi rezki buah-buahan dalam surga-surga itu,
mereka mengatakan : "Inilah yang pernah diberikan kepada kami dahulu."
Mereka diberi buah-buahan yang serupa dan untuk mereka di dalamnya ada
isteri-isteri yang suci dan mereka kekal di dalamnya. (QS :2. Al Baqarah:25)
• Kompresi data teks (Huffman coding,
RLE coding, LZW coding, arithmetic coding
• Representasi dan kompresi data suara
dan audio
• Representasi dan kompresi citra
• Representasi dan kompresi video
• Metode representasi data/informasi kedalam
ukuran yang lebih kecil sehingga dapat
mempercepat waktu transmisinya dan memperkecil
penggunaan memori penyimpanan
• Kompresi dapat dilakukan tanpa kehilangan
atau perubahan data (Lossless compression)
• Kompresi dapat dilakukan dengan kehilangan atau
perubahan data (lossy compression)
• Pengkodean (coding) data atau informasi
yang memiliki redundancy (kerangkapan)
kedalam jumlah bit yang lebih kecil.
• Digunakan untuk kompresi teks atau
citra/video tanpa kehilangan/perubahan data
(citra/video medis)
• Beberap contoh coding : Huffman, arithmetic,
statistik, RLE (run-length encoding), Lempel-
Ziv, Lempel-Ziv-Welch,
A 12"" 9S 7P 5R 5T 5E 4I 4N 4U 4M 3K 2O 2Y 2C 1J 1L 1V 1
• Huffman Coding (David Albert Huffman 1952)
- Berbasis pada perhitungan statistik
- Mengunakan bantuan pohon biner
- Data yang frekuensi munculnya paling
banyak dikode dengan jumlah bit terkecil
- Data yang frekuensi munculnya paling
sedikit dikode dengan jumlah bit terbesar
• Huffman Coding
Contoh : "this is an example of a huffman tree"
- statistik munculnya karakter : “ “= 7, a=4,
e=4, f=3, t=2, h=2, i=2, s=2, n=2, m=2, x=1,
p=1, l=1, u=1, 0=1, r=1.
- Probabilitas munculnya karakter : “ “= 0.1944…,
a=e=0.1111…, f=0.0833…, t=h=i=s=n=m=0.0556,
x=p=l=u=o=r=0.0278.
• Huffman Coding Pohon biner :
““= 7a=4 e=4 f=3 t=2 h=2 i=2 s=2 n=2 m=2 x=1 p=1 l=1 u=1 0=1 r=1
2
2
2 4
4
4
4
5
8
8
8
12
16
20 36“ “= 000a = 010 e = 011 f = 0010 t = 0011 h = 1000 i = 1001 s = 1010 n = 1011 m = 1100 x = 11010 p = 11011 l = 11100 u = 11101 o = 11110 r = 11111288 bit 195 bit
0 0 0
0 1
1
0 1
1
0 0 0 1
1
0 1
1
0 0 1
0 1
1
0 0 1
1
0 1
1
• Huffman Coding
1. digunakan untuk pengkodean teks, citradan video
2. Ada 3 jenis algorithme Huffman coding,Masing masing berhubungan denganmetode pembuatan pohon biner :
• Huffman Coding
statik : code setiap karakter ditentukan
langsung oleh algoritma (contoh : teks
berbahasa Prancis, dimana frekuensi
kemunculan huruf e sangat banyak sehingga
code bitnya kecil.
semi-adaptatif : teks harus dibaca terlebih dulu
untuk menghitung frekuensi munculnya setiap
karakter, kemudian membentuk pohon
binernya.
• Huffman Coding
adaptatif : Metode ini memberikan rasio kompresi
yang tinggi karena pohon biner Dibentuk secara
dinamik mengikuti tahapan compresi. Namun dari
sisi kecepatan eksekusi membutuhkan waktu yang
lebih lama karena satiap saat pohon binernya akan
beruabah mengikuti perubahan frekuensi munculnya
setiap karakter.
• Kelemahan Huffman Coding
- Bila frekuensi munculnya setiap karakter dalam
suatu dokumen adalah sama semua.
- File kompresinya bisa sama atau lebih besar dari
file aslinya
- Solusi yang mungkin adalah kompresi per blok
karekter dari dokumen tersebut
Entropi H :
Entropi H :
• Run-length encoding
- RLE coding telah diaplikasikan khususnya pada scanner
hitam putih (biner)
- Prinsip dasarnya adalah menghitung jumlah/panjang data
yang sama dalam serangkain data yang akan dikompres
- Contoh pada dokumen hitam H (tulisan) dan putih P (latar
belakang dokumen), berikut misalnya data pada satu baris
dokumen yang direpresntasikan dalam pixel :
PPPPPPPPPPPPHPPPPPPPPPPPPPPHHHPPPPPPPPPPPPPPPPPPPPPPPHPPPPPPPPPPP
- Bentuk kompresinya adalah : 12P1H14P3H23P1H11P
• Aplikasi Run-length encoding
- Kompresi citra format bmp pada Windows dan OS/2 untuk
citra 1, 4 dan 8 bit/pixel
- Citra format PCX 8 dan 24 bit/pixel
- Fax dan scanner hitam putih
Format file citra:
• File citra umumnya memiliki :
- header yang menyatakan informasi citra seperti ukuran
citra, format file, dll.
- data citra itu sendiri
• Struktur file berbeda antara satu format dengan format
citra lainnya
• Bisa jadi struktur file untuk format citra yang sama
berbeda dari satu versi ke versi yang lain (contoh : file
TIFF)
• Format JPEG mengikuti norm ISO
• Bersifat pengunaan bebas
• Jumlah warna citra 224 = 16777216 warna
• Type kompresi lossy menggunakan DCT
• Kualitas kompresi tergantung pada rasio
kompresi
• Tidak memiliki sifat warna transparan
• Bukan format animasi
• JPEG 2000 masih dibawah proteksi hak paten
• Type kompresi lossy dan lossless menggunakan
Wavelet Transform
• Jumlah warna citra 224 = 16777216 warna
• Kualitas kompresi dapat diatur secara lokal atau
global
• Dapat ditampilkan dengan ukuran yang berbeda
• Bukan format animasi
• Tidak memiliki sifat warna transparan
• Bersifat pengunaan bebas
• Type kompresi lossless baik untuk citra
berwarna maupun citra gray-level
• Memiliki sifat warna transparan
• Bukan format animasi
• Versi format animasinya adalah MNG
• Bersifat dilindungi oleh hak paten
• Jumlah warna citra 256 (sistem pallet)
• Dapat memiliki sifat warna transparan
• Dapat merupakan format animasi
• Penggunaa umum adalah untuk logo dan
citra yang memiliki jumlah warna sedikit
Pembagian citra
dalam blok
8x8 pixel
Transformasi
warnaDCT Kuantisasi
Coding RLE
&
Huffman
Tabel
Kuantisasi
Tabel
coding
Rekonstruksi
Blok citra
Transformasi
Warna
invers
IDCTKuantisasi
Inverse
Decoding RLE
&
Huffman
Citra terkompresi
JPEGCitra asli
Kompresi JPEG
Rekonstruksi JPEG
Bagan standar kompresi citra JPEG
Matrice d’origine.
Matrice d’origine. Matrice transformée DCT
DCT
Matrice de quantification
Matrice quantifiée.
÷
1260 rata2 dari
seluruh matrik asli
-1, 1, -3, 2 deviasi
1
0
2
2
).12(cos).,()(.),(
N
x
NXN
ixyxPixeliCyiDCT
1
0
1
0 2
).12(cos.
2
).12(cos).,()().(.
2),(
N
x
N
y N
jy
N
ixyxPixeliCjC
NjiDCT
1
0
2
2
).12(cos.),()(.),(
N
y
XNN
jyyiDCTjCjiDCT
Transformasi DCT
1
0
1
0 2
).12(cos.
2
).12(cos).,()().(.
2),(
N
i
N
j N
jy
N
ixjiDCTiCjC
NyxPixel
1
0
2
2
).12(cos).,()(.),(
N
j
NXN
jyjiDCTjCyiIDCT
1
0
2
2
).12(cos.),()(.),(
N
i
XNN
ixyiIDCTiCyxPixel
Transformasi DCT invers.
Implementasi 1D :
Implementasi 1D :
Matriks hasil IDCT
IDCT
x
Matriks kuantisasi
Matriks terkuantisasi. Matriks terkuantisasi invers.
00000000
00000000
00000000
00000000
00000000
0000001314
0000001224
000001001264
F
Quantization Table for:
Photoshop CS2 (Save As 11)Quantization Table: Luminance
1 1 1 2 3 3 4 5
1 1 1 2 3 4 4 6
1 1 2 3 4 4 5 7
2 2 3 4 4 5 7 8
3 3 4 4 5 7 8 8
3 4 4 5 7 8 8 8
4 4 5 7 8 8 8 8
5 6 7 8 8 8 8 8
Quantization Table: Chrominance
1 2 4 7 8 8 8 8
2 2 4 7 8 8 8 8
4 4 7 8 8 8 8 8
7 7 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
8 8 8 8 8 8 8 8
Quantization Table for:
IrfanView (95%)Quantization Table: Luminance
2 1 1 2 2 4 5 6
1 1 1 2 3 6 6 6
1 1 2 2 4 6 7 6
1 2 2 3 5 9 8 6
2 2 4 6 7 11 10 8
2 4 6 6 8 10 11 9
5 6 8 9 10 12 12 10
7 9 10 10 11 10 10 10
Quantization Table: Chrominance
2 2 2 5 10 10 10 10
2 2 3 7 10 10 10 10
2 3 6 10 10 10 10 10
5 7 10 10 10 10 10 10
10 10 10 10 10 10 10 10
10 10 10 10 10 10 10 10
10 10 10 10 10 10 10 10
10 10 10 10 10 10 10 10
Zigzag coding : urutan pengkode
menurut norm JPEG.
20 -10 11 1 -9 2 -2 -4 -8 -1 0 1 2 3 -1 0 0 0 0 -1 EOB
• DC adalah nilai rata-rata matriks dan merepresentasikan
informasi global matriks (frekuensi rendah)
• AC merepresentasikan informasi detail matriks (frek. tinggi)
• Penkodean dilakukan dalam bentuk zigzag :
Table 1 - Huffman - Luminance (Y) - DC
Length Bits Code
3 bits
000001010011100101110
04050302060100 (End of Block)
4 bits 1110 07
5 bits 1111 0 08
6 bits 1111 10 09
7 bits 1111 110 0A
Table 2 - Huffman - Luminance (Y) - AC
Length Bits Code
2 bits 0001
0102
3 bits 100 03
4 bits 101010111100
110400 (End of Block)
5 bits 1101 01101 11110 0
052112
6 bits 1110 101110 11
3141
... ... ...
12 bits...1111 1111 0011...
...F0 (ZRL)...
... ... ...
16 bits ...1111 1111 1111 1110
...FA
20 -10 11 1 -9 2 -2 -4 -8 -1 0 1 2 3 -1 0 0 0 0 -1 EOB
Code bit-stream :
Code 01, 21, 41, dst 2 mendahului 2 angka 0
Contoh : 32 adalah 000-2 bit
20 -10 11 1 -9 2 -2 -4 -8 -1 0 1 2 3 -1 0 0 0 0 -1 EOB
AC Code Size Additional Bits DC/AC Value
01 1 0 1 -1 1
02 2 00,01 10,11 -3,-2 2,3
03 3 000,001,010,011 100,101,110,111 -7,-6,-5,-4 4,5,6,7
04 4 0000,...,0111 1000,...,1111 -15,...,-8 8,...,15
05 5 0 0000,... ...,1 1111 -31,...,-16 16,...,31
06 6 00 0000,... ...,11 1111 -63,...,-32 32,...,63
07 7 000 0000,... ...,111 1111 -127,...,-64 64,...,127
08 8 0000 0000,... ...,1111 1111 -255,...,-128 128,...,255
09 9 0 0000 0000,... ...,1 1111 1111 -511,...,-256 256,...,511
0A 10 00 0000 0000,... ...,11 1111 1111 -1023,...,-512 512,...,1023
0B 11 000 0000 0000,... ...,111 1111 1111 -2047,...,-1024 1024,...,2047
1011 0101 1011 1011 00 1 . . . . . 1010 1 . . . . . . 111011 0 1100
(04)- 10 (04)- 11 ( 11)- ( 41)
• Informasi dalam signal 1-D et 2-D tersebar dalam
frekuensi yang berbeda (dari frekuensi rendah ke
frekuensi tinggi)
• Analisis informasi dalam signal tersebut membutuhkan
teknik analisis multi-frekuensi multi-resolusi
multi-scale
• Wavelet transform (WT) sangat sesuai dengan
kebutuhan analisis multi-frekuensi.
Bagaimana DWT berfungsi ?
Dua pendekatan analisis :
- pendekatan melalui dilatasi filter resolusi signal tetap.
- pendekatan melalui dilatasi signal resolusi signal
berubah
Contoh : misalkan suatu signal memiliki informasi yang
tersebar hingga pada frekuensi 1000 Hz.
Prinsipe : memisahkan signal dalam dua komponen yaitu
informasi general (frekuensi rendah) dan informasi
detil (frekuensi tinggi)
Pendekatan melalui dilatasi filtre ?
- Pada tahap awal, kita bagi informasi signal dalam dua bagian dengan
melewatkannya dalam high-pass filter (500-1000 Hz) dan low-pass
filter (0-500 Hz).
- Menghasilkan satu signal yang berhubungan dengan informasi pada
interval 0-500 Hz (frekuensi rendah) dan satu signal lainnya dengan
informasi pada interval 500-1000 Hz (frekuensi tinggi).
- Selanjutnya, kita lakukan proses berulang pada salah satu atau kedua
komponen tadi.
- Andaikan kita lakukan untuk bagian low-pass dengan menggunakan
high-pass filter (250-500 Hz) dan low-pass filter (0-250 Hz). Maka kita
akan punya 3 komponen informasi, masing-masing berhubungan
dengan informasi dari satu signal yang sama pada frekuens 0-250 Hz,
250-500 Hz et 500-1000 Hz.
- dst.
Pendekatan dilatasi signal ?
• Tahap pertama, kita lewatkan signal kedalam low-pass filter dan high-
pass filter (kita gunakan filter dengan resolusi yang sama,).
• Tahap kedua, resolusi signal hasil low-pass dan high-pass kita bagi dua.
• Selanjutnya, kita lakukan proses yang sama hingga pada resolusi yang
diinginkan.
Keuntungan untuk kompresi citra :
- Lebih mudah untuk implementasi real-time
- sangat baik untuk kompresi citra dan video
• Ada beberapa jenis WT yang telah dikembangkan, diantaranya yang
digunakan untuk format JPEG2000 :
- ''CDF 9/7'' Cohen-Daubechies-Fauvaue (irreversible).
- ''spline 5/3'' pour Le Gall (lebih sederhana dan reversible).
• Bilangan 9 dan 5 merupakan jumlah elemen filter low-pass. Bilangan 7
dan 3 merupakan jumlah elemen filter high-pass.
Pour la CDF 9/7 :
+0.602949018236
+0.266864118443 (Z1 +Z-1)
-0.0782223266529 (Z2 +Z-2)
-0.016864118448 (Z3 +Z-3)
+0.026748757411 (Z4 +Z-4)
+0.557543526229 (Z1)
-0.295635881557 (Z2 +Z0)
-0.028771763114 (Z3 +Z-1)
+0.045635881557 (Z4 +Z-2)
Filter low-pass L :
Filter high-pass H :
• Wavelet Transform (WT)
- Ide : membagi citra kedalam tingkat resolusi yang berbeda
- Pembagiannya berdasarkan pita frekuensi yang bebeda
- Menjaga/mempertahankan kualitas data
• Principes :
– Melakukan proses WT terhadap citra asli
– Kuantisasi skalar (sesuai tingkat resolusi)
– Pengkodean (RLE, entropy, Huffman, …)
KuantisasiWavelet
Transform
Coding
per blok
Citra
asli
Citra
terkompresi
Encoder Optimisasi
rasio-distorsi
Pembentukan
bitstream
Citra
rekonstruksi
Kantisasi
invers
Decoder
Decoding
Per blok
Wavelet
transform
inverse
Citra
terkompresi
Standar Kompresi JPEG2000LL1
LH1
HL1
HH1baris
kolom
Citra
asli
Detil
horisontal
Detil
vertikal
Detil
diagonal
Standar kompresi JPEG2000
Transmisi secara progresif per resolusi
Standard compression JPEG2000
Transmisi secara progresif per resolusi
Standar kompresi JPEG2000Transmisi secara progresif per resolusi
Standar kompresi JPEG2000Transmisi secara progresif per resolusi
Standard compression JPEG2000
Perbandingan rasio kompresi
Contoh citra hasil kompresi :
Standar kompresi JPEG2000
JPEG JPEG 2000
Standard compression JPEG2000
• Keuntungan
– Kualitas lebih baik dari JPEG
– Lossless dan lossy compression sangat baik
– Regions of Interests ROI coding
– Transmisi dan pengkodean progressif
– Sesuai untuk data aplikasi multimedia
• Untuk nilai PSNR (pick signal to noise ratio) yang sama,
ratio kompresi JPEG2000 dapat mencapai 2 kali dari
JPEG
• Efek blok tidak tampak
Kompresi VideoProblem :
1. Satu citra dari suatu video dapat menempati kapasitas
memori sekitar 0,916 MB (640x480 pixel).
2. Untuk menampilkan video yang secara visual tampak kontinu,
maka kecepatan pengambilan gambar adalah 25 atau 30 citra
per detik, atau sekitar 23 MB/detik atau sekitar 1,38 GB/menit
atau sekitar 82,94 GB/jam.
3. Kapasitas penyimpanan (CD dan DVD) yang ada saat ini
sekitar 7GB,
4. Kapasitas band-width jaringan komunikasi yang terbatas.
5. 25 citra/detik butuh band-with sekitar 184 Mbps.
Kompresi Video
Solusi :
- Meningkatkan kapasitas memori penyimpanan,
implikasinya penambahan biaya yang besar
- Memperbesar band-width komunikasi
implikasinya penambahan biaya yang besar
- Kompresi data video pengembangan algoritma
CoDec (COmpression/DECompression) untuk
memperkecil semaksimal mungkin data video tanpa
banyak mengurangi kualitas visualnya
Kompresi Video
• Ide pertama adalah mengurangi jumlah data rate
(dari 25 fps ke 12 fps atau dari 30 fps ke 15 fps),
dengan konsekuensi menghilangkan sejumlah
pergerakan objek video (video motions)
• Intraframe (spatial) compression:
mengurangi redundant informasi/data yang
berada dalam satu citra atau frame.
Kompresi Video
Interframe (temporal) compression
• Landasan pemikiran adalah bahwa banyak terdapat
perulangan informasi/data video dari satu frame (citra)
ke frame lainnya.
• Sehingga perlu pengembangan metode atau algoritma
yang mampu menghilangkan redundancy informasi/dat
antar frame.
• Butuh identifikasi key frame (master frame)
• Key frame: dasar untuk menentukan berapa banyaknya
frame secara berurutan yang memiliki pergerakan objek
yang sama (hampir sama)
Kompresi Video
Interframe (temporal) compression
• Andaikan bahwa informasi/data background adalah tetap (langit,
jalan dan rumput) dan hanya mobil yang bergerak.
• Frame pertama disimpan sebagai key frame dan frame-frame
lainnya diambil hanyalah objek yang bergerak (mobil).
t
Standar video MPEG
MPEG-1, adalah suatu standar untuk kompresi data video
dan audio (2 kanal audio). Memungkinkan untuk
menyimpan video dengan kapasitas 1.5 Mbps pada media
VCD (Video CD).
MPEG-2, suatu standard dikembangkan untuk televisi
numerik (HDTV) yang memberikan kualitas tinggi dengan
kapasitas 40 Mbps dan 5 canal audio. MPEG-2 juga
dikembangkan untuk dapat mengidentifikasi dan
memproteksi terhadap pembajakan. Format ini digunakan
untuk video DVD.
Standards et normes vidéos : MPEG
MPEG-4, standard yang ditujukan untuk compresidata multimédia dalam bentuk objek numériques,sehingga lebih memudahkan interactivity, danpengunaanya lebih adaptif terhadap kebutuhan webdan interface mobile.
MPEG-7, standard ditujukan untuk memberikanrepresentasi standar data audio dan visual agar dapatlebih memungkinkan pencarian informasi dalamvideo berdasarkan content. Standar ini disebut jugaMultimedia Content Description Interface.
MPEG : Prinsip dasar
Prediksi Transformasi Kuantisasi Entropy Coding
P T Q Ce
Decoding
R G B Y U V
Luminance
Format ruang warna : 4:1:1 (4:2:0)
MPEG : Prinsip dasar
Konversi RGB Yuv :
Konversi Yuv RGB :
Konversi dari camera-bmp-avi-mpeg
Kirim ke : [email protected]
Cari salah satu :1. Video Compression dari camera-bmp-avi-wmv
2. Video Compression dari camera-bmp-avi-flv
Source :http://www.mathworks.com/search/ice.cgi?query=wmv
http://www.mathworks.com/search/ice.cgi?query=flashvideo
TUGAS MEMBEDAH 5 JURNAL
Buat suatu karya ilmiah dengan topik, pilih salah satu topik dibawah ini :
“Video Compression Dari Citra bmp-AVI-MPEG Dengan MatLab ”
“Video Compression Dari Citra jpg-MPEG-WMV Dengan MatLab”
“Video Compression Dari Citra gif-AVI-FLV Dengan MatLab”
Atau cari yang sesuai dengan Video Compression
Ada pun ketentuannya adalah: yang dikirim ke email : [email protected]
Minimal 5 referensi/daftar pustaka tahun terbit paling akhir 2009.
Paling sedikit 2 Halaman selain daftar pustaka. Disimpulkan dari 5 jurnal
thesis, skripsi, atau proceding sbb : abstrak, pendahuluan, isi, dan
kesimpulan.
TUGAS MEMBEDAH 5 JURNAL
MPEG : Prinsip dasar
Komponen Y mengandung lebih banyak informasi dari komponen U dan V
MPEG : Prinsip dasar
Modul Prediksi :
MPEG : Prinsip dasar
Modul Prediksi :
• Frames I : citra dikompresi secara terpisah tanpa citra
referensi dari citra sebelumnya.
• Frames P: citra yang diprediksi berdasarkan pada citra
referensi I atau P sebelumnya.
• Frames B (Citra interpolsi bidireksional) : citra ini dihitung
berdasarkan citra referensi I dan P,
Urutan penyimpanan dalam file : I P B B B P B B B I B B B
I B B B P B B B P B B B I
MPEG : Prinsip dasar
MPEG : Prinsip dasarr
Citra ini dikompresi dengan hanya menggunkan
metode
kompresi JPEG.
Citra ini sangat penting dalam video MPEG karena
dialah yang menjamin kesinambungan data citra
lainnya
Ada 2 atau 3 citra I per detiknya dalam video MPEG.
Frames I :
MPEG : Principe
Frames P :
Citra ini dihitung melalui perbedaan antra citra actual terhadap
citra I atau citra P sebelumnya.
Algoritma yang dikembangkan untuk menghitung citra P adalah
melalui perbandingan blok per blok, disebut macroblocs (16x16
pixels), dan berdasarkan pada nilai ambang tertentu dapat
dinyatakan apakah blok tesebut berbeda dengan blok citra
sebelumnya. Jika ya maka dilakukan compresi JPEG dan jika tidak,
blok tersebut dinyatakan sama dengan blok citra sebelumnya dan
tidak perlu dikompresi.
Perhitungan macroblocs sangat mempengaruhi kecepatan
kompresi.
MPEG : Principe
Frames B :
Sama halnya dengan frames P, frames B dihitung
berdasarkan perbedaan antara citra actual terhadap citra
referensi I sebelumnya dan citra referensi P berikutnya, hal
ini dapat memberikan kualitas kompresi yang baik, namun
memberikan delay waktu karena harus mengetahui dulu
citra berikutnya dan harus disimpan di memori 3 citra
secara berturutan (citra I/P sebelumnya, citra actual dan
citra P/I berikutnya).