paper, customer behavior and awareness about legal software and cloud computing
DESCRIPTION
Introduction to SAS Programming 1, ComLabs ITBTRANSCRIPT
SURVEY AWARENESS DAN BEHAVIOUR MAHASISWA ITB
TERHADAP PENGGUNAAN SOFTWARE LEGAL
DAN CLOUD COMPUTING
MAKALAH
Dibuat Untuk Melengkapi Tugas Besar 1 Pelatihan Statistical Analytic Software (SAS)
oleh
Nicholas Leo 10111051
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
PROGRAM STUDI MATEMATIKA
INSTITUT TEKNOLOGI BANDUNG
BANDUNG
2014
DAFTAR ISI
BAB I. PENDAHULUAN .................................................................... 1
1.1. Latar Belakang ………………………………………………. ..1
1.2. Rumusan Masalah ...................................................................... 2
1.3. Tujuan ........................................................................................ 2
BAB II. TEORI DASAR .......................................................................... 3
BAB III. PEMBAHASAN ........................................................................ 7
3.1. Pengolahan Data Awal ............................................................... 7
3.2. Pengolahan Data Legalitas Software ......................................... 9
3.3. Pengolahan Data Cloud Service ................................................ 13
BAB IV. SIMPULAN dan SARAN ..................................................... 16
4.1. Simpulan .................................................................................. 16
LAMPIRAN A ............................................................................................... 18
LAMPIRAN B ............................................................................................... 19
LAMPIRAN C ................................................................................................ 22
DAFTAR PUSTAKA ....................................................................................... 25
1
BAB I
PENDAHULUAN
1.1 Latar Belakang
“Dalam sehari, Database Facebook dapat menerima 250 juta unggahan foto dan
interaksi antara 800 juta pengguna aktif Facebook dengan lebih dari 900 juta objek”
Pernyataan di atas menggambarkan bahwa dunia sekarang ini telah memasuki era big
data yaitu era dimana suatu data tumbuh secara eksponensial. Bahkan, menurut IDC Digital
University Study, pada tahun 2020, total data yang akan beredar di dunia telah melampaui
ukuran 40 zettabytes1. Peningkatan data secara signifikan tersebut tentu seperti pedang
bermata dua bagi pengguna data. Di satu sisi, para pengguna data mempunyai lebih banyak
data untuk diolah sehingga analisis mereka terhadap data yang ada dapat lebih tajam dan
teliti. Akan tetapi, di sisi lain, para pengolah dan pengguna data tentunya memerlukan suatu
alat bantu yang cukup powerful untuk membantu mereka mengolah dan menganalisi data
yang ada.
Telah disebutkan sebelumnya bahwa penanganan data besar (big data) memerlukan
alat bantu untuk mengolah data tersebut. Hal ini menjadi suatu alasan semakin
berkembangnya alat bantu pengolahan data pada computer yang sering dikenal dengan nama
statistical software. Diantara beberapa statistical software, terdapat software SAS (Statistical
Analyst Sotfware) yang dikenal cukup mumpuni untuk menangani data dalam jumlah yang
sangat besar. SAS sendiri pada awalnya diciptakan tahun 1976 sebagai proyek di Universitas
North Carolina untuk analisis data agricultural. Sampai tahun 2013, SAS telah meluncurkan
1 www.emc.com/about/news/press/2012/20121211-01.htm [10 Januari 2014]
2
versi terakhirnya yaitu versi 9.4 dan dikenal sebagai peranti lunak yang cukup membantu
banyak pihak dalam pengolahan data.
Oleh karena itu, pada makalah ini, penulis akan mencoba untuk menggunakan piranti
lunak SAS dalam mengolah data survey survey tentang Behaviour dan Awareness mahasiswa
ITB terhadap Legalitas Software dan Penggunaan Cloud Computing. Survey tersebut dibuat
dalam rangka kompetisi Microsoft Office 365 Marketing Challenge 2014. Akan tetapi,
makalah ini akan lebih menekankan pada fitur – fitur SAS yang digunakan serta penjelasan
dari fitur – fitur SAS tersebut.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang telah dijelaskan sebelumnya, terdapat rumusan
masalah, yaitu
1.2.1 Bagaimana behavior mahasiswa ITB terhadap pemakaian software legal
menggunakan procedure yang terdapat di SAS untuk pengolahan data?
1.2.2 Bagaimana penggunaan SAS untuk melihat familiaritas mahasiswa ITB terhadap
cloud computing dan mobile editing?
1.2.3 Bagaimana dan syntax – syntax apa saja yang diperlukan untuk menampilkan
hasil olahan data?
1.3 Tujuan
Tujuan yang hendak dicapai dalam penulisan makalah ini adalah:
1.3.1 Menjelaskan cara dan syntax untuk mengolah data pemakaian software legal
mahasiswa ITB..
1.3.2 Melihat penggunaan cloud computing dan familiaritas mobile editing
menggunakan procedure yang terdapat di SAS.
1.3.3 Menjelaskan secara singkat penggunaan syntax yang dipakai.
3
BAB 2
TEORI DASAR
Pada Bab ini, akan dijelaskan secara singkat dan general syntax – syntax umum yang
digunakan pada pengambilan data, procedure yang dipakai dalam pengolahan survey, serta
perbedaan antara Data Set dan Data Step.
Dikutip dari website resmi SAS, support.sas.com, dapat dilihat sedikit penjelasan
tentang Data Set dan Data Step yang akan sering ditemui dalam pengolahan data
menggunakan SAS
“A SAS data set is a SAS file stored in a SAS library that SAS creates and processes. A SAS data set contains data values that are organized as a table of observations (rows) and variables (columns) that can be processed by SAS software. A SAS data set also contains descriptor information such as the data types and lengths of the variables, as well as which engine was used to create the data.”
2
“The DATA step consists of a group of SAS statements that begins with a DATA statement. The DATA statement begins the process of building a SAS data set and names the data set. The statements that make up the DATA step are compiled, and the syntax is checked. If the syntax is correct, then the statements are executed. In its simplest form, the DATA step is a loop with an automatic output and return action”
3
Menurut kutipan tersebut dalam disimpulkan bahwa Data Set merupakan kumpulan
data yang dibuat dan disimpan di dalam SAS library. Data Set tersebut biasanya berbentuk
sebagai table dari observasi yang dilakukan. Sedangkan, Data Step adalah kumpulan dari
perintah – perintah yang terdapat di dalam SAS yang digunakan untuk membuat dan
mengubah Data Set yang ada. Ciri dari Data Step adalah biasanya perintahnya dimulai
dengan syntax DATA.
Telah disinggung sedikit di atas tentang penggunaan library dalam SAS. Library
adalah semacam folder khusus yang dibaca oleh SAS dimana terdapat Data Set didalamnya.
2 https://support.sas.com/documentation/cdl/en/lrcon/62955/HTML/default/viewer.htm#a001005709.htm
[10 Januari 2014] 3 http://support.sas.com/documentation/cdl/en/basess/58133/HTML/default/viewer.htm#a001290590.htm
[10 Januari 2014]
4
Secara otomastis, data yang dibuat akan disimpin di temporary library yaitu work. Jika ingin
membuat permanent library, dapat menggunakan syntax
LIBNAME <namalibrary> <folder khusus dalam harddist tempat library>;
Dengan catatan bahwa namalibrary maksimal 8 karakter dimulai dengan huruf / underscore
Setelah memahami tentang Data Step dan Data Set, akan dijelaskan tentang cara
memasukkan data ke dalam SAS. Data Set yang berada di dalam SAS dapat merupakan data
yang diinput sendiri melalui program SAS atau data yang diambil dari file external. Untuk
pengambilan data melakui file eksternal, dapat menggunakan syntax
DATA <nama_data_set_yang dibuat>;
INFILE <lokasi pengambilan file external>;
INPUT <def_var, cara pengambilan di file external, dan jenis var>;
Dengan catatan bahwa nama_var maksimal 32 karakter dimulai dengan huruf / underscore.
Terdapat dua jenis variable umum yaitu $ melambangkan char dengan jenis var default
adalah number. Syntax General untuk input: INPUT @<pointer_control> <namavar>
<formatvar.>.
Terdapat juga syntax untuk mengubah Data Set yang ada. Pengubahan tersebut akan
disimpan sebagai Data Set lain sehingga data awal yang digunakan tetap ada.Syntax yang
dipakai:
DATA <nama_data_set_yang dibuat>;
SET <nama_data_set_yang_diambil>;
<formatting> <penambahan variable>
Disebutkan di atas bahwa ketika mengubah sebuah data set, dapat digunakan syntax – syntax
formatting yang terdapat di dalam SAS. Syntax formatting yang umum dipakai adalah
Format mata uang serta penulisan uang.
Syntax: FORMAT <var> <dollar/euro><total_char>.<angkadibelakang koma>.
Cukup hilangkan <dollar/euro> jika tidak ingin menampilkan jenis mata uang
Format tanggal. Terdapat banyak jenis format tanggal, salah satunya adalah mmddyy
atau weekday. Syntax: FORMAT <var> <jenisformattanggal.>
5
Format tanggal. Contoh format waktu adalah hhmmss. Syntax: FORMAT <var>
<jenisformatwaktu.>
Secara umum, pemberian format bagi suatu variable biasanya dilakuakan di proses Data Step
sehingga terformat secara permanen. Syntax umum FORMAT <nama_var> <jenis_format>
Selain pemberian format, pada Data Step, pengguna juga dapat memberi variable baru.
Pemberian variable dapat menggunakan operasi artimatik biasa, fungsi dalam SAS, ataupun fungsi
kondisional.
Syntax operasi aritmatik biasa
<Nama_var_baru> = <var1> <operasi> <var2> …..<var_n>;
Syntax fungsi dalam SAS
<Nama_var_baru> = <fungsi_SAS>(<var1, <var2> ,….,.<var_n>);
Syntax fungsi kondisional
IF <nama_var> <kondisi 1> THEN <var_baru/lama = akibat 1>; ELSE
<var_baru/lama = akibat 2>
Selain itu terdapat juga syntax – syntax lain yang digunakan untuk mengolah data survey
yang terkait. Demikian deskripsi singkatnya
Proc content, untuk melihat karakteristik dari data set
syntax: PROC CONTENT DATA=<nama_dataset>
Proc sort, untuk mengurutkan data_set sesuai variable tertentu dengan default adalah
ascending
syntax:
PROC CONTENT DATA=<nama_dataset>;
BY <reference_var1><descending><reference_var2>
Proc print, untuk menampilkan print preview
syntax: PROC PRINT DATA=<nama_dataset>;
Proc tabulate, untuk mentabulasikan data dan melihat statistic deskriptif dari data
syntax:
PROC TABULATE DATA=<nama_dataset>;
CLASS <var_klasifikasi>;
VAR <var_statistik>
TABLE <penyusunan table dan statement jenis statistic>
Proc format, pembuatan user defined format
Syntax:
PROC FORMAT;
VALUE <nama_format> <pembuatan_format>;
6
proc freq, untuk melihat frekuensi atau jumlah parsial tiap variable yang diinginkan
Syntax:
PROC FREQ DATA=<nama_dataset>;
TABLE <var_statistik>;
proc gchart, untuk membuat chart dari data set yang ada
Syntax:
PROC GCHART DATA=<nama_dataset>;
<JENIS CHART> <Var_Chart>;
Terdapat juga beberapa syntax yang sering dipakai, baik dalam Data Step secara umum
ataupun hanya pada procedure PRINT, yaitu
NOOBS, menghilangkan variable observasi dalam table print preview
Syntax: PROC PRINT DATA=<nama_dataset> NOOBS;
LABEL, menambahkan keterangan tambahan u.ntuk variable, dapat digunakan
sebagai judul kolom dalam print preview
Syntax: PROC PRINT DATA=<nama_dataset> LABEL; LABEL <def label>;
WHERE, melakukan perintah sesuai dengan variable yang memenuhi kriteria
biasanya digunakan dalam procedure.
Syntax: WHERE <nama_var><operator><karakter_tertentu>;
PAGEBY, melakukan page break untuk data set yang telah diurutkan. Terdapat di
procedure print. Jika ditambah dengan SUM maka akan dihitung subtotal dan grand
total.
Syntax: PROC PRINT DATA=<nama_dataset; BY <var_sort>;
PAGEBY<var_sort>; SUM <var_jenis_number>;
TITLE, pemberian judul pada setiap table di layar print preview.
Syntax: TITLE <Judul>;
7
BAB 3
PEMBAHASAN
Pada Bab ini, akan dibahas tentang pengolahan data menggunakan SAS. Untuk
mempermudah pembahasan, maka Bab ini akan dibagi menjadi 3 buah subbab yaitu subbab
pengolahan data awal, pengolahan data legalitas, dan pengolahan data Cloud Service.
3.1 Pengolahan Data Awal
Data awal diambil dari survey yang diselenggarakan antara bulan Desember 2013
sampai 9 Januari 2014. Dengan melakukan cleaning data yang tidak valid, didapat pada
akhirnya sebanyak 40 data yang akan diolah menggunakan SAS. Demikian link form survey
yang dilakukan menggunakan google docs, http://goo.gl/Zvge0L. Pada awalnya, survey
tersebut diperuntukan sebagai alat bantu untuk mengetahui Behaviour dan Awareness
mahasiswa ITB dalam kompetisi Marketing Microsoft. Sehingga, untuk dapat memakai data
survey tersebut dalam makalah ini, terdapat perubahan yang dilakukan seperti penghapusan
variable. Data hasil survey sebelum perubahan dapat diperoleh di http://goo.gl/Vnkn5u.
Karena pada awalnya, didapat data dalam format excel, maka harus dilakukan
konversi format ke dalam format .txt untuk dapat memasukan data ke dalam program SAS.
Demikian screenshot data dalam format .txt
Figure 1: Data ‘Mentah’
8
Setelah mempunyai data yang dapat dimasukkan ke dalam program SAS, hal
berikutnya adalah membuat library permanen dalam SAS sebagai tempat penyimpanan data.
Digunakan syntax
libname TuBes "D:\Dav\Non-Academic\SAS\Tugas Besar";
Syntax diatas akan membuat permanent library bernama TuBes yang terletak di dalam
harddisk D\Dav\Non-Academic\SAS\Tugas Besar. Sebelumnya, folder bernama Tugas Besar
harus dibuat terlebih dahulu sehingga dapat menampung library permanen yang dibuat.
Hal berikutnya yang akan dilakukan adalah memasukkan data dari format .txt menjadi
dataset baru di dalam SAS. Cuplikan syntax yang dipakai adalah:
data TuBes.DataAwal; (1)
infile 'D:\Dav\Non-Academic\SAS\Tugas Besar\DataSurvey.txt'; (2)
input (3)
@1 Tanggal mmddyy10. (4)
@12 Waktu hhmmss8.
…
@120 Pengeluaran_per_semester 1.
;
format Tanggal weekdate. Waktu hhmm.;(5)
run;
Baris pertama menyatakan bahwa dataset yang akan dibuat diberi nama DataAwal dan
terletak di dalam library permanent TuBes (1). Selanjutnya syntax infile berisi alamat data
berformat txt yang ingin diimport (2). Data tersebut akan dikategorikan dalam variable yang
terletak setelah syntax input (3). Sebagai contohnya, di baris pertama setelah syntax input,
penulis membuat variable tanggal dengan mengambil 10 kolom dari data mentah dimulai
pada kolom ke 1 dengan melakukan informat mmddyy sehingga akan keluar suatu angka
yang menggambarkan berapa hari dari 1 Januari 1960 sampai tanggal pada data (4). Untuk
mengubah kembali ke format tanggal sesuai pada SAS, terdapat syntax format yang
mengubah variable tanggal menjadi format weekdate dan waktu menjadi format hhmm (5).
Setelah memasukkan data mentah menjadi data set di dalam SAS, dilakukan
pengeditan data sehingga mempermudah analisis. Syntax yang dikerjakan adalah
9
data TuBes.Databaru; (6)
set TuBes.DataAwal; (7)
if upcase(Pembelian_Legal_Software)='YA' then
Pembelian_Legal=1;
else if upcase(Pembelian_Legal_Software)='TIDAK' then
Pembelian_Legal=0; (8)
if upcase(Familiaritas_Cloud_Service)='YA' then
Familiaritas_Cloud=1;
else if upcase(Familiaritas_Cloud_Service)='TIDAK' then
Familiaritas_Cloud=0; (8)
if Pengeluaran_per_semester=1 then
Pengeluaran_per_semester= 50000;
else if Pengeluaran_per_semester=2 then
Pengeluaran_per_semester=175000;
else if Pengeluaran_per_semester=3 then
Pengeluaran_per_semester=375000; (9)
format Pengeluaran_per_semester comma10.2; (10)
run;
Editing dataset yang dilakukan akan menggunakan proses kondisional, seperti pada (8) dan
(9). Perbedaan syntax (8) dan (9) adalah pada syntax (8), kondisional dengan input adalah
string dengan output real number diletakkan disebuah variable baru yaitu Pembelian_Legal.
Sedangkan input dan output syntax (9) adalah variable yang sama karena tipe input dan
outputnya sama yaitu real number. Ditambahkan jumlah formatting untuk memperjelas
tampilan mata uang yaitu penggunaan koma maksimal 10 karakter dengan 2 angka
dibelakang koma (10). Data set tersebut berasal dari data set DataAwal dan akan disimpan
menjadi data set baru yaitu data set DataBaru (1) dan (2).
3.2 Pengolahan Data tentang Legalitas Software
Setelah mendapat data yang memungkinkan untuk diolah, langkah selanjutnya adalah
membuat data set baru sesuai dengan tujuan survey. Dalam bab awal telah dibahas bahwa
tujuan dari survey ini adalah untuk melihat behavior dan awareness mahasiswa ITB terhadap
penggunaan software legal dan Cloud Computing. Pada subbab ini akan dibahas tentang
legalitas software. Tujuannya adalah melihat apakah tingkat pendidikan (dalam hal ini
perbedaan tingkat semester mahasiswa) mempunyai pengaruh dalam awareness terhadap
penggunaan software legal. Selain itu, juga akan dilihat jenis software legal yang dipakai.
10
Hal pertama untuk menganalisis tentang legalitas software adalah membuat data set
baru yang releven. Bagaimana pun, dataset awal yang didapat mempunyai terlalu banyak
variable dan ada beberapa variable yang tidak relevan dengan pembahasasn legalitas
software. Syntax yang digunakan untuk membentuk data set baru adalah
data TuBes.Legalitas; (1)
set TuBes.Databaru; (2)
keep Jenis_Kelamin (3)
Status_Pendidikan
Pembelian_Legal
Jenis_Legal_Software
Alasan_Tidak_Legal
Pengeluaran_per_semester;
run;
proc contents data=TuBes.Legalitas; (4)
run;
Sama seperti dengan pembuatan dataset DataBaru, digunakan syntax DATA sebagai nama
penyimpanan data set yang dibuat yaitu Legalitas di library TuBes (1). Data set tersebut
merupakan hasil olahan dari dataset DataBaru (2). Karena akan dipertahakan beberapa
variable saja, maka digunakan syntax KEEP (3) yang menyatakan bahwa hanya variable
jenis_kelamin, status_pendidikan, pembelian_legal, alasan_tidak_legal, dan
pengeluaran_per_semester yang terdapat di data set Legalitas. Selanjutnya, sebagai verifikasi
jenis karakter yang terdapat di setiap variable, digunakan syntax PROC CONTENT dengan
data set Legalitas sebagai input (4). Syntax ini digunakan untuk mengecek ulang apakah
semua variable sudah berjenis real number atau tidak.
Hal selanjutnya adalah pelaporan data berdasarkan jenis software legal yang dibeli.
Syntax yang dipakai dapat dilihat di bawah ini:
proc sort data=TuBes.Legalitas; (5)
by Jenis_Legal_Software; (6)
run;
proc print data=TuBes.Legalitas label noobs; (7)
by Jenis_Legal_Software; (8)
pageby Jenis_Legal_Software; (9)
sum Pembelian_Legal; (10)
where Pembelian_Legal= 1; (11)
title 'Sorting Berdasarkan Jenis Software'; (12)
label (13)
Jenis_Kelamin='Kelamin'
11
Status_Pendidikan='Status Pendidikan'
Pembelian_Legal='Pembelian Software'
Jenis_Legal_Software='Jenis Software'
Pengeluaran_per_semester='Pengeluaran u/ sofware per semester'
;
var Jenis_Kelamin Status_Pendidikan Pengeluaran_per_semester
Pembelian_Legal; (14)
run;
Seperti yang telah dibahas pada awal subbab, bahwa ingin dilihat jenis software apa saja yang
biasanya didapat secara legal dan bagaimana persebaran software tersebut. Pertama – tama
karena ingin menampilkan dalam bentuk laporan, maka data set harus diurutkan berdasarkan
jenis software terlebih dahulu dengan cara ascending (5) (6). Setelah itu, dengan procedure
print, data set akan ditampilkan di dalam result viewer. Karena bersifat sebagai laporan, maka
digunakan label dan penghilangan variable banyak observasi sehingga lebih enak dilihat (7).
Label yang digunakan merupakan pengganti judul kolom yang biasanya adalah nama
variable, seperti contohnya kolom variable Jenis_Legal_Software akan mempunyai judul
kolom Jenis Software akibat penggunaan label (13). Selain itu ditambahkan pula judul table
sebagai klasifikasi table (12) dan terdapat pula cara penyusunan kolom – kolom sehingga
lebih mudah dilihat (14).
Karena yang ingin ditampilkan adalah jenis software yang dibeli secar legal saja maka
digunakan syntax where dengan input value Jenis_Software=1 dengan 1 merepresentasikan
bahwa pernah membeli jenis software (11). Setelah itu, untuk mempermudah pelaporan, akan
dibedakan perhalaman setiap software yang berbeda dengan syntax pageby (8) berdasarkan
jenis software tentunya (9). Pada akhirnya, akan dilihat dari setiap software, berapa banyak
mahasiswa yang pernah membeli software legal tersebut (10).
Berdasarkan hasil yang diperoleh dari syntax di atas, dapat dilihat bahwa terdapat 3
jenis software yang biasanya dibeli legal oleh responden. Ketiga software tersebut adalah
Antivirus, Microsoft Office, dan Operating System dengan jenis software yang paling banyak
dibeli secara legal adalah Operating Sytem sebanyak 7 responden dan Antivirus menjadi
software paling sedikit dibeli secara legal, yaitu hanya sebanyak 3 responden. (Figure 2).
12
Setelah mengetahui jenis software legal beserta banyak pengguna software legal
tersebut, penulis ingin melihat persebaran pengguna software legal berdasarkan pengeluaran
dan tingkat pendidikan. Syntax yang dipakai adalah
proc tabulate data=TuBes.Legalitas; (15)
class Pengeluaran_per_semester Status_Pendidikan; (16)
var Pembelian_Legal; (17)
table Pengeluaran_per_semester*Status_Pendidikan,
Pembelian_Legal;(18)
title 'Pembelian Software Legal';
label
Jenis_Kelamin='Kelamin'
Status_Pendidikan='Status Pendidikan'
Pembelian_Legal='Pernah/Tidak Membeli Software Legal'
Jenis_Legal_Software='Jenis Software'
Pengeluaran_per_semester='Pengeluaran u/ sofware per semester';
run;
Penggunaan procedure tabulate diperlukan karena ingin melihat pengklasifikasian pembeli
software legal dengan variable pengeluaran biaya software per semester dan status
pendidikan (15). Sehingga pada result viewer akan ditampilkan klasifikasi pengeluaran biaya
software dan dari setiap pengeluaran akan diklasifikasi lagi dengan variable status pendidikan
(16), inilah mengapa syntax CLASS diperlukan dengan input variable pengeluaran per
semester dan status pendidikan. Sedangkan variable banyak pembelian legal akan dibuat
menjadi variable yang ingin diolah secara statistic sehingga dimasukkan ke dalam syntax
VAR (17). Untuk menampilkan tabulasi sesuai kehendak (klasifikasi secara pengeluaran
kemudian status pendidikan) digunakan syntax TABLE (18) dan untuk memperjelas tampilan
terdapat penggunaan label dan judul.
Berdasarkan hasil tabulasi, dapat dilihat bahwa di tingat pengeluaran berapa pun per
semester, lebih mahasiswa tingkat empat atau mahasiswa tingat akhir yang membeli software
secara legal. Kesimpulan sementara yang dapat diambil adalah bahwa mahasiswa tingkat
akhir telah melihat pentingnya penggunaan software legal dan tidak mempermasahkan untuk
membeli software legal selama software tersebut berguna (Figure 3).
13
3.3 Analisis Penggunaan Cloud Service
Sama seperti dengan analisis Legalitas Software, hal pertama yang dilakukan adalah
pembuatan data set baru dengan nama Cloudservice di library permanen TuBes dengan
menyertakan variable yang diperlukan saja seperti variable frekuensi penggunaan mobile
editing dll. Data awal yang digunakan adalah dataset DataBaru.
Selain membuat data set Cloudservice, penulis juga membuat format user defined,
yaitu formatting isi variable yang ditentukan sendiri oleh penulis deskripsi dan isi format
tersebut.Syntax yang digunakan adalah
proc format; (1)
value choice 1='Ya' (2)
0='Tidak';
value frek 0='Tidak tahu' (3)
1='Hampir Tidak Pernah'
2='Pernah'
3='Ragu - ragu'
4='Sering'
5='Sangat sering';
run;
PROC FORMAT (1) merupakan syntax wajib yang dipakai untuk membuat user defined
format. Dalam syntax ini, penulis membuat 2 buah format dengan nama choice dan frek.
Untuk format bernama choice (2), penulis ingin mengubah angka 1 menjadi Ya dan angka 2
menjadi Tidak dengan tipe format adalah real number karena input dari format hanyalah
angka 0 dan 1. Sama halnya dengan format dengan nama frek, penulis ingin mengubah data
kuantitatif menjadi data kualitatif sehingga tidak perlu tambahan $ yang menyatakan string
pada nama format (3). Syntax lain yang terdapat di sini adalah VALUE yaitu syntax wajib
untuk user defined format. Penulis memutuskan untuk menggunakan user defined format
karena data akan diolah secara kuantitatif, tetapi ingin ditampilkan secara kualitatif.
Setelah mendefinisikan user defined format, maka data set Cloudservice akan
dimasukkan dalam procedure print untuk melihat data – data tersebut. Dalam procedure ini
user defined format sudah diaplikasikan sehingga tampilan yang terdapat di result viewer
akan mempunyai nilai kualitatif semua (Figure 4)
14
Tujuan dari analisis data set Cloudservice adalah melihat familiaritas terhadap Cloud
Service dan penggunaan cloud service terhadap mobile editing. Berdasarkan hal tersebut,
data set akan ditampilkan dalam bentuk table familiaritas Cloud Service berdasarkan tingkat
pendidikan. Digunakan procedure frequency karena ingin dilihat persentase dari setiap
jawaban. Syntax yang dipakai.
proc template; (4)
define crosstabs Base.Freq.CrossTabFreqs;
cellvalue frequency percent rowpercent; (5)
define frequency; (6)
format=8.;
header='Banyak Mahasiswa';
end;
…
end;
run;
proc freq data=TuBes.Cloudservice; (7)
tables Status_Pendidikan*Familiaritas_Cloud; (8)
title 'Penggunaan Cloud Menurut Pendidikan';
run;
Sebelum menampilkan table frekuensi dalam result viewer, akan diatur terlebih dahulu
keterangan yang akan ditampilkan di table menggunakan procedure template (4). Keterangan
yang akan diganti adalah keterangan dengan nama default frekuensi, percent, rowpercent (5).
Keterangan tersebut akan diganti namanya, sebagai contoh frekuensi diganti dengan nama
Banyak Mahasiswa (6).
Setelah mendefinisikan template table frekuensi baru, barulah digunakan procedure
frequency untuk menampilkan table frekuense dengan persentasenya (7). Karena diinginkan
klasifikasi berdasarkan Status pendidikan dengan familiaritas cloud yang ingin dihitung
frekuensinya, maka dalam syntax TABLE (8), terdapat input Status_Pendidikan*
Familiaritas_Cloud. Secara umum, syntax tersebut untuk mengatur bagaimana table
ditampilkan. Untuk memperindah tampilan table dan memperjelas tujuan table digunakan
syntax TITLE. Hasil dalam result viewer dapat dilihat pada Figure 5 di lampiran.
15
Analisis terakhir yang dilakukan adalah melihat fraksi penggunaan Mobile Editing
bagi responden yang menjawab familiar menggunakan cloud. Untuk menganalisis tujuan ini,
data akan ditampilkan dalam bentuk grafik batang. Syntax yang digunakan adalah
PROC GCHART data=TuBes.Cloudservice; (9)
Hbar Frekuensi_Mobile_Editing / DISCRETE; (10)
format Frekuensi_Mobile_Editing frek.; (11)
TITLE 'Penggunaan Cloud untuk Mobile Editing';
where Familiaritas_Cloud=1; (12)
RUN;
Untuk dapat menampilkan segala jenis grafik, digunakan PROC GCHART dengan input
adalah dataset yang ingin ditampilkan dalam bentuk grafik (9). Dalam analisis ini digunakan
grafik batan horizontal dengan variable frekuenesi mobile editing yang dibuat grafik (10) dan
keterangan pada frekuensi mobile editing dibuat menjadi kuantitatif menggunakan user
defined format yang telah dibuat sebelumnya (11). Karena hanya ingin dicek tentang
pengguna mobile editing yang familiar dengan cloud maka terdapat syntax tambahan
WHERE (12).
Hasil yang didapat adalah meskipun pada grafik yang diambil hanya responden yang
mengaku familiar dengan Cloud Service, pengguna mobile editing menggunakan cloud
service masih cukup minim. Tercatat hanya 7 responden dari 34 responden yang menyatakan
sering menggunakan mobile editing berbasis cloud service. (Figure 6).
16
BAB 4
KESIMPULAN
Kesimpulan yang didapat setelah menganalis Behavior dan Awareness mahasiswa
ITB terhadap penggunaan software legal dan Cloud Computing, adalah
4.1 Dari survey yang dilakukan, awareness mahasiswa ITB terhadap pemakaian software
legal lebih tinggi kadarnya pada mahasiswa tingkat akhir. Sedangkan, jenis software legal
yang paling banyak dipakai adalah Operating System.
4.2 Untuk penggunaan Cloud Computing, hampir semua mahasiswa ITB mengaku familiar
menggunakan Cloud Service (34 dari 40 responden). Akan tetapi, penggunaan Cloud
Service tersebut masih belum mencapai tingat editing document dengan perangkat
mobile.
4.3 Dalam pengolahan data, digunakan procedure print, sorting, tabulate, frequency, dan
graph. Selain itu terdapat syntax – syntax formatting yang digunakan untuk memperjelas
tampilan data. Syntax – syntax yang dipakai masih standard dan dapat dikembangkan
untuk membuat pengolahan data lebih baik.
Secara umum, banyak hal yang dapat dikembangkan dari survey ini. Melalui ilmu
statistika dapat dicari nilai korelasi antara tingkat pendidikan dan awareness mahasiswa
tentang penggunaan software legal. Selain itu, dapat dibuat model sederhana untuk
menggambarkan awareness dan behavior mahasiswa terhadap penggunaan software legal dan
cloud service. Dalam pengolahan data menggunakan SAS, harus diakui, syntax yang
digunakan masih sangat sederhana. Untuk kedepannya, sangat dimungkinkan untuk analis
menggunakan query dan syntax statistic yang lebih powerfull.
17
LAMPIRAN
18
LAMPIRAN A (KUISONER)
Kuisoner dapat diakses di
http://goo.gl/Zvge0L
Dan Hasil Kuisoner (tanpa editing) dapat dilihat di
http://goo.gl/Vnkn5u
19
LAMPIRAN B (KODE SUMBER/SOURCE CODE)
libname TuBes "D:\Dav\Non-Academic\SAS\Tugas Besar";
data TuBes.DataAwal;
infile 'D:\Dav\Non-Academic\SAS\Tugas Besar\DataSurvey.txt';
input
@1 Tanggal mmddyy10.
@12 Waktu hhmmss8.
@21 Jenis_Kelamin $10.
@32 Status_Pendidikan $34.
@67 Pembelian_Legal_Software $5.
@73 Jenis_Legal_Software $16.
@90 Alasan_Tidak_Legal $19.
@110 Familiaritas_Cloud_Service $5.
@116 Frekuensi_Penggunaan_Cloud 1.
@118 Frekuensi_Mobile_Editing 1.
@120 Pengeluaran_per_semester 1.
;
format Tanggal weekdate. Waktu hhmm.;
run;
data TuBes.Databaru;
set TuBes.DataAwal;
if upcase(Pembelian_Legal_Software)='YA' then
Pembelian_Legal=1;
else if upcase(Pembelian_Legal_Software)='TIDAK' then
Pembelian_Legal=0;
if upcase(Familiaritas_Cloud_Service)='YA' then
Familiaritas_Cloud=1;
else if upcase(Familiaritas_Cloud_Service)='TIDAK' then
Familiaritas_Cloud=0;
if Pengeluaran_per_semester=1 then
Pengeluaran_per_semester= 50000;
else if Pengeluaran_per_semester=2 then
Pengeluaran_per_semester=175000;
else if Pengeluaran_per_semester=3 then
Pengeluaran_per_semester=375000;
format Pengeluaran_per_semester comma10.2;
run;
data TuBes.Legalitas;
set TuBes.Databaru;
keep Jenis_Kelamin
Status_Pendidikan
Pembelian_Legal
Jenis_Legal_Software
Alasan_Tidak_Legal
Pengeluaran_per_semester;
run;
proc contents data=TuBes.Legalitas;
run;
proc sort data=TuBes.Legalitas;
by Jenis_Legal_Software;
run;
proc print data=TuBes.Legalitas label noobs;
by Jenis_Legal_Software;
pageby Jenis_Legal_Software;
20
sum Pembelian_Legal;
where Pembelian_Legal= 1;
title 'Sorting Berdasarkan Jenis Software';
label
Jenis_Kelamin='Kelamin'
Status_Pendidikan='Status Pendidikan'
Pembelian_Legal='Pembelian Software'
Jenis_Legal_Software='Jenis Software'
Pengeluaran_per_semester='Pengeluaran u/ sofware per semester'
;
var Jenis_Kelamin Status_Pendidikan Pengeluaran_per_semester
Pembelian_Legal;
run;
proc tabulate data=TuBes.Legalitas;
class Pengeluaran_per_semester Status_Pendidikan;
var Pembelian_Legal;
table Pengeluaran_per_semester*Status_Pendidikan, Pembelian_Legal;
title 'Pembelian Software Legal';
label
Jenis_Kelamin='Kelamin'
Status_Pendidikan='Status Pendidikan'
Pembelian_Legal='Pernah/Tidak Membeli Software Legal'
Jenis_Legal_Software='Jenis Software'
Pengeluaran_per_semester='Pengeluaran u/ sofware per semester';
run;
proc format;
value choice 1='Ya'
0='Tidak';
value frek 0='Tidak tahu'
1='Hampir Tidak Pernah'
2='Pernah'
3='Ragu - ragu'
4='Sering'
5='Sangat sering';
run;
data TuBes.Cloudservice;
set TuBes.Databaru;
keep Jenis_Kelamin
Status_Pendidikan
Familiaritas_Cloud
Frekuensi_Penggunaan_Cloud
Frekuensi_Mobile_Editing;
run;
proc print data=TuBes.Cloudservice NOOBS label;
format Frekuensi_Mobile_Editing frek. Frekuensi_Penggunaan_Cloud
frek. Familiaritas_Cloud choice.;
title 'Data Penggunaan Cloud Service';
var Jenis_Kelamin Status_Pendidikan Familiaritas_Cloud
Frekuensi_Penggunaan_Cloud Frekuensi_Mobile_Editing;
label
Jenis_Kelamin='Kelamin'
Status_Pendidikan='Status Pendidikan'
Familiaritas_Cloud='Familiar dengan Cloud Service'
Frekuensi_Penggunaan_Cloud='Frekuensi Penggunaan'
Frekuensi_Mobile_Editing='Frekuensi Mobile Editing dengan
Cloud';
21
run;
proc template;
define crosstabs Base.Freq.CrossTabFreqs;
cellvalue frequency percent rowpercent;
define frequency;
format=8.;
header='Banyak Mahasiswa';
end;
define rowpercent;
format=pctfmt.;
header='Row %';
end;
define percent;
format=pctfmt.;
header='Total %';
end;
end;
run;
proc freq data=TuBes.Cloudservice;
tables Status_Pendidikan*Familiaritas_Cloud;
title 'Penggunaan Cloud Menurut Pendidikan';
run;
PROC GCHART data=TuBes.Cloudservice;
Hbar Frekuensi_Mobile_Editing / DISCRETE;
format Frekuensi_Mobile_Editing frek.;
TITLE 'Penggunaan Cloud untuk Mobile Editing';
where Familiaritas_Cloud=1;
RUN;
quit;
22
LAMPIRAN C (SCREEN SHOT HASIL)
Figure 2: Jenis Software Legal
Figure 3: Hasil Tabulasi
23
Figure 4: Data Cloud Service
Figure 5: Frekuensi Familiaritas Cloud
24
Figure 6: Penggunaan Mobile Editing
25
DAFTAR PUSTAKA
Support.SAS.com/documentation [10 Januari 2014]
. . 1 1 1 11- 1. [10 Januari 2014]
H. Karp, Andrew. 1994. Steps to Success with PROC MEANS. California: Sierra Information
Service, Inc.
L. Wright, Wendi. 2006. Introduction to PROC TABULATE. New Jersey: Educational
Testing Service.
Haworth, Lauren. Anyone can learn proc tabulate. California: Genentech, Inc.
W. Borowiak, Kenneth. Using Data Set Options in PROC SQL. New York: Howard M.
Proskin & Associates, Inc.