manajemen data elektronik
TRANSCRIPT
Electronic Data Management
MANAJEMEN DATA ELEKTRONIK
Vika A. Kovariansi
Disampaikan pada Pelatihan untuk Pustakawan UPT PMO ITB
30 Agustus 2013
Apa itu Data?
“A reinterpretable representation of information in a formalized manner suitable for communication, interpretation, or processing.”
Digital Curation Centre
In social science, data is generally
numeric files originating from social research methodologies or
administrative records, from which statistics are produced. It also includes, however, more data
formats such as audio, video, geospatial and other digital content
that are germane to social science research.
Apa itu Data?
Observational data
Laboratory experimental data
Computer simulation
Textual analysis
Physical artifacts or relics
•Preliminary analyses •Drafts of scientific papers •Plans for future research •Physical objects •Trade secrets •Commercial information •Materials necessary to be held
confidential by a researcher until they are published or under protected law
Data yang tidak disebarkan
Jenis data umumnya berupa:
Jadi MENGAPA data perlu
DIKELOLA?
Manajemen data…
Data management is a process that includes all aspects of data planning, handling,
analysis, documentation and storage. The objective is to create a reliable database
containing high quality data.
Good management
of data
Good research
High quality data
Data can be understood
and used now and in future
Data can be shared and
reused
Needs to be planned
Needs to be specific for purposes
Mengapa elektronik?
• Konsistensi • Terpercaya • Akses yang lebih efisien
Data Lifecycle
Alur hidup data
DATA LIFECYCLE
Data Management Plan
Perencanaan Pengelolaan Data (Data Management Plan)
Komponen dalam pengelolaan data:
Deskripsi ruang lingkup pekerjaan /project
Deskripsi data yang akan dikelola
Standar data yang akan digunakan
Media penyimpanan dalam jangka waktu tertentu dan pengelolaan datanya
Isu yang berkaitan dengan etika dan hukum
Kebijakan akses berikut syarat dan ketentuannya
Ketentuan untuk pelestarian dan penyimpanan jangka panjang
Penunjukkan staf pengelola dan tanggung jawabnya
Data Management Plan Checklist
• DMP Digital Curation Center
• DMP University of Minnesota Library
• DMP MIT Libraries
Evaluate the needs: • What type of data will be produced? • How much of it, and at what growth
rate? • Will it change frequently? • Who is it for? • Who controls it? • How long should it be retained?
Dokumentasi berfungsi agar data dapat digunakan sesuai dengan kebutuhannya di masa depan, terutama dalam proses penyimpanan dan penelusuran data. Dokumentasi data ini biasa disebut dengan “METADATA”
METADATA
• Mempermudah retrievalisasi (Proses temu balik) sesuai relevansinya
• mengidentifikasi bahan pustaka • mengelompokkan bahan pustaka • membedakan bahan pustaka yang
tak miliki kesamaan • memberikan informasi lokasi
Fungsi Metadata
METADATA
Proses identifikasi suatu atribut dan struktur dari sebuah data atau informasi
Secara definisi, metadata sebenarnya adalah “data tentang data.”
Metadata Deskriptif Menjelaskan sumber untuk tujuan pencarian dan
pengidentifikasian. Biasanya berisi elemen judul, abstrak, pengarang atau sebuah kata kunci.
Metadata Struktural mengidentifikasikan bagaimana data terbentuk
Metadata Administratif menyediakan informasi yang membantu proses
manajemen data misalnya menjelaskan kapan dan bagaimana data terbentuk, serta informasi teknis lainnya
Metadata
• Title (judul) • Creator (pembuat) • Identifier (nomor identifikasi) • Subject (subjek) • Funders (organisasi/lembaga) • Rights (Hak intelektual) • Access information (akses informasi) • Language (bahasa) • Dates (penanggalan dan jadwal) • Location (lokasi) • Methodology (metodologi pengumpulan data) • Data processing (proses data) • Sources (sumber yang berkaitan dengan data) • List of file names (daftar nama berkas yang
berkaitan) • File formats (format data) • Versions (versi data)
Aspek penting dalam suatu metadata
Format File
Format file untuk penyimpanan jangka panjang
Non-proprietary (bebas)
Open, documented standard (terbuka, terdokumentasi sesuai standard)
Common usage by research community (yang digunakan oleh umum)
Standard representation (penggunaan standar untuk tampilan, seperti ASCII, Unicode)
Unencrypted (tidak di enkripsi)
Uncompressed (tidak dikompresi)
Contoh pilihan format file
• PDF/A, bukan Word • ASCII, bukan Excel • MPEG-4, bukan
Quicktime • TIFF atau JPEG2000,
bukan GIF atau JPG • XML atau RDF, bukan
RDBMS
Pengorganisasian File
• Struktur penamaan file • Setiap perubahan versi wajib diarsipkan, meski sedikit •Musnahkan versi terlama setelah melakukan back-up
File version control
• Folder direktori utama harus mencakup judul, nomor identifikasi dan tanggal Directory structure
naming convention
•Mencantumkan 3-huruf dari ekstensi file sesuai kode aplikasi
• Identifikasi jenis pekerjaan dalam nama file
File naming convention
• Skema penamaan data • Identifkasi harus unik dan tetap (persistent) •Contoh data identifiers -> DOI
Data identifiers for sharing your data
Back-ups
Kendala Hardware faults or failure
Software or media faults
Virus infection or malicious hacking
Power failure
Human errors by changing or deleting files
Strategi Regular back-up
Back-up policy
Back-up media
Make 3 copies (original, external/local, external/remote)
Geographically distributed
Options Hard drive
Tape back up system
Cloud storage
Keamanan
• Kontrol terhadap akses ke ruangan /gedung tempat data, komouter atau media di simpan • Mencatat setiap perubahan dan pengaksesan terhadap media atau materi dalam ruang
penyimpanan • Memindahkan data yang sensitif hanya dalam kondisi yang luarbiasa
Physical data security
• Tidak menyimpan data yang bersifat rahasia, seperti data personal • Proteksi firewall dan peningkatan keamanan pada sistem operasi untuk menghindari virus
dan sejenisnya
Network security
• Mengunci komputer dengan password dan memasang sistem firewall • Menjaga server dengan memasang UPS • Membuat akses kontrol kepada materi terlarang • Membuat surat pernyataan untuk pengelola atau pengguna data rahasia • Tidak mengirimkan data personal melalui e-mail atau apapun tanpa ekripsi terlebih dahulu • Menghapus data secara konsisten jika diperlukan
Computer systems and files security
File Sharing
Virtual environment
• Cloud storage • Research
group
Online file sharing
• Resources Library
• Data center
Data Center / Resources Library
Keuntungan:
Memudahkan peneliti untuk berbagi tata cara praktik yang baik dan pengalaman manajemen
data satu sama lain, dengan demikian dapat membangun kapasitas, pengetahuan kolektif
dan sumber daya untuk pusat data.
Pendekatan penyeragaman pada manajemen data dan membuat standar kebijakan yang berkaitan pada prosedur dan aktifitas data.
Terdapat daftar pemilik data dan daftar kerjanya, yang berguna sebagai “checkpoint”
terutama ketika peneliti sedang bertugas ditempat yang berbeda.
Membuat Peneliti dan staff terkait menyadari akan tugas dan kewajibannya terhadap data
penelitian.
Resources
Further Resources
• University of Minnesota Library, https://www.lib.umn.edu/datamanagement
• MIT Library, http://libraries.mit.edu/guides/subjects/data-management/index.html
• Digital Curation Center, http://www.dcc.ac.uk/resources/data-management-plans
• UK Data Archive http://data-archive.ac.uk