Download - Silabus Web Mining
-
FAKULTAS INFORMATIKA - IT TELKOM PROGRAM STUDI S1 TEKNIK
INFORMATIKA Jl. Telekomunikasi no 1
Gedung E dan F, Bandung 40257
Dokumen Kontrol
Kurikulum: 2012
Revisi Ke:
Disahkan:
SILABUS MATA KULIAH
I. IDENTITAS MATA KULIAH
Nama Mata Kuliah : Web Mining
Kode Mata Kuliah :
SKS : 3 SKS
Jenis : MK Wajib / MK Pilihan / Praktikum *)
Jam pelaksanaan : Tatap muka di kelas = 4 jam per minggu
Tutorial / responsi = 2 jam per minggu
Kerja Lab / praktek = - jam per minggu
.. = - jam per minggu
Semester / Tingkat : Genap / 4
Pre-requisite :
Co-requisite :
Bidang Kajian :
II. DESKRIPSI SINGKAT MATA KULIAH
Web mining merupakan proses automatic discovery dari pattern/pola data yang menarik dan
bermanfaat yang berhubungan dengan usage, content, dan linkage structure dari sumber Web.
Fokus dari mata kuliah Web mining adalah penerapan teknik dari machine learning, data mining,
text mining dan basis data yang berhubungan dengan usage, content, dan linkage structure dari web
resources.
Penerapan teknik-teknik tersebut digunakan untuk mengekstrak knowledge dari web yang dapat
digunakan untuk site menagement, automatic personalization, recommender system dan user
profilling.
III. KOMPETENSI LULUSAN YANG DIDUKUNG
-
CSG2D3 Basis Data Relasional Page 2
IV. TUJUAN PEMBELAJARAN
Pada akhir perkuliahan ini diharapkan mahasiswa memiliki pengetahuan tentang teknik-teknik web
mining meliputi web structure mining, web content mining dan web usage mining serta aplikasi-
aplikasi yang berkaitan dengan web mining.
Secara spesifik tujuan pembelajaran dari Mata Kuliah ini adalah :
a) Mahasiswa memahami konsep web mining
b) Mahasiswa memahami konsep dan implementasi web structure, content dan usage mining
c) Mahasiswa memahami teknik-teknik yang diterapkan di web mining
d) Mahasiswa mampu mengimplementasikan teknik-teknik web mining
e) Mahasiswa mampu mendesain prototype sistem di bidang web mining
f) Mahasiswa mengetahui aplikasi-aplikasi web mining
g) Mahasiswa mampu mengidentifikasi, memformulasikan dan menuliskan kembali
jurnal/paper web mining
V. ABET OUTCOMES
a An ability to apply knowledge of computing and mathematics appropriate to the discipline (*)
b An ability to analyze a problem, and identify and define the computing requirements
appropriate to its solution (*)
c An ability to design, implement, and evaluate a computer-based system, process, component, or
program to meet desired needs (*)
d An ability to function effectively on teams to accomplish a common goal
e An understanding of professional, ethical, legal, security and social issues and responsibilities
f An ability to communicate effectively with a range of audiences
g An ability to analyze the local and global impact of computing on individuals, organizations, and
society
h Recognition of the need for and an ability to engage in continuing professional development
i An ability to use current techniques, skills, and tools necessary for computing practice (*)
j An ability to apply mathematical foundation, algorithmic principles and computer science theory
in the modeling, and design of computer based system in a way that demonstrate
comprehension of the trade off involved in design choices (*)
k an ability to apply design and development principles in the constructions of software systems
of varying complexity (*)
-
CSG2D3 Basis Data Relasional Page 3
-
CSG2D3 Basis Data Relasional Page 4
VI. BAHAN KAJIAN, METODE PENYAMPAIAN & ASSESSMENT
Pertemuan
ke-
Kompetensi yang
diharapkan
Bahan Kajian Sub bahan kajian Metode
Pembelajaran
Indikator Pencapaian Cara
assessment
Bobot
Nilai
1 Mahasiswa memahami
konsep web mining
Web Mining
Introduction
- Syllaby
- Web Mining Definition
- Brief History of Web
Lecture
Discussion
Dapat memahami konsep
web mining
Project
10%
2 Mahasiswa memahami
konsep web mining
Explanation Web Mining
Project
- Introduction of Web Mining
Application
Lecture
Discussion
3 Mahasiswa memahami
konsep web mining
Review Web IR & Web
Search
- Natural Language Processing
methods used for web information
retrieval: lemmatization, part-of-
speech tagging, disambiguation,
shallow syntactic parsing etc.
- Project Presentation
Discussion
Presentation
4 Mahasiswa memahami
konsep web mining
Review Web IR & Web
Search
- Natural Language Processing
methods used for web information
retrieval: lemmatization, part-of-
speech tagging, disambiguation,
shallow syntactic parsing etc.
- Project Presentation
- Project Progress Report
Lecture
Discussion
Presentation
5 - Mahasiswa mengetahui
aplikasi-aplikasi web
mining
- Mahasiswa mampu
mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web mining
Social Network Analysis - Global analysis of the Web
Discussion
Presentation - Mengetahui minimal 2
aplikasi web mining
- Dapat mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web
mining
Project
10%
-
CSG2D3 Basis Data Relasional Page 5
Pertemuan
ke-
Kompetensi yang
diharapkan
Bahan Kajian Sub bahan kajian Metode
Pembelajaran
Indikator Pencapaian Cara
assessment
Bobot
Nilai
6 - Mahasiswa mengetahui
aplikasi-aplikasi web
mining
- Mahasiswa mampu
mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web mining
Social Network Analysis - social networks analysis
Discussion
Presentation
7 - Mahasiswa mengetahui
aplikasi-aplikasi web
mining
- Mahasiswa mampu
mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web mining
Social Network Analysis - Project Progress Report Discussion
Presentation
- Mengetahui minimal 2
aplikasi web mining
- Dapat mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web
mining
Project
8 - Mahasiswa memahami
teknik-teknik yang
diterapkan di web mining
- Mahasiswa mampu
mengimplementasikan
teknik
- -teknik web mining
Crawling the Web Review Crawling the web Lecture
Discussion
Presentation
10%
9 - Mahasiswa memahami
teknik-teknik yang
Crawling the Web Project Progress Report Lecture
Discussion
Dapat
mengimplementasikan
Project
-
CSG2D3 Basis Data Relasional Page 6
Pertemuan
ke-
Kompetensi yang
diharapkan
Bahan Kajian Sub bahan kajian Metode
Pembelajaran
Indikator Pencapaian Cara
assessment
Bobot
Nilai
diterapkan di web mining
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
Presentation teknik web mining
10
- Mahasiswa memahami
konsep dan implementasi
web structure, content
dan usage mining
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
Web Structure Mining - primary web browsing (crawling,
spidering), link topology analysis,
PageRank, HITS methods
Lecture
Discussion
Presentation
- Dapat memahami
konsep dan
implementasi web
structure, content dan
usage mining
- Dapat
mengimplementasikan
teknik web mining
- Dapat mendesain
prototype sistem web
mining
Project
UAS
20%
11 - Mahasiswa memahami
konsep dan implementasi
web structure, content
dan usage minin
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
Web Structure Mining - primary web browsing (crawling,
spidering), link topology analysis,
PageRank, HITS methods
- Project Progress Report
Lecture
Discussion
Presentation
-
CSG2D3 Basis Data Relasional Page 7
Pertemuan
ke-
Kompetensi yang
diharapkan
Bahan Kajian Sub bahan kajian Metode
Pembelajaran
Indikator Pencapaian Cara
assessment
Bobot
Nilai
12 - Mahasiswa memahami
konsep dan implementasi
web structure, content
dan usage minin
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
Web Structure Mining - Project Progress Report Discussion
Presentation
13 - Mahasiswa memahami
konsep dan implementasi
web structure, content
dan usage minin
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
Web Content Mining - document indexing and retrieval in
the web environment - Boolean
and vector retrieval models, latent
semantic indexing (LSI), results
ordering, meta-search.
Lecture
Discussion
Presentation
- Dapat memahami
konsep dan
implementasi web
structure, content dan
usage mining
- Dapat
mengimplementasikan
teknik web mining
Dapat mendesain
prototype sistem web
Project 20%
14
- Mahasiswa memahami
konsep dan implementasi
web structure, content
dan usage minin
- Mahasiswa mampu
mengimplementasikan
Web Content Mining - web documents categorization and
clustering
Lecture
Discussion
Presentation
Project
-
CSG2D3 Basis Data Relasional Page 8
Pertemuan
ke-
Kompetensi yang
diharapkan
Bahan Kajian Sub bahan kajian Metode
Pembelajaran
Indikator Pencapaian Cara
assessment
Bobot
Nilai
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
15
- Mahasiswa memahami
konsep dan implementasi
web structure, content
dan usage minin
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
Web Content Mining - web documents categorization and
clustering part 2
Lecture
Discussion
Presentation
- Dapat memahami
konsep dan
implementasi web
structure, content dan
usage mining
- Dapat
mengimplementasikan
teknik web mining
- Dapat mendesain
prototype sistem web
16
- Mahasiswa memahami
konsep dan implementasi
web structure, content
dan usage minin
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
Web Content Mining - Project Progress Report Lecture
Discussion
Presentation
17 - Mahasiswa mengetahui Opinion Mining & - Opinion Mining and Sentiment Discussion - Dapat memahami 10%
-
CSG2D3 Basis Data Relasional Page 9
Pertemuan
ke-
Kompetensi yang
diharapkan
Bahan Kajian Sub bahan kajian Metode
Pembelajaran
Indikator Pencapaian Cara
assessment
Bobot
Nilai
aplikasi-aplikasi web
mining
- Mahasiswa mampu
mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web mining
Sentiment Analysis Analysis
-
Presentation konsep dan
implementasi web
structure, content dan
usage mining
- Dapat
mengimplementasikan
teknik web mining
- Dapat mendesain
prototype sistem web 18
- Mahasiswa mengetahui
aplikasi-aplikasi web
mining
- Mahasiswa mampu
mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web mining
Opinion Mining &
Sentiment Analysis
- Lexical based opinion mining
Discussion
Presentation
19 - Mahasiswa mengetahui
aplikasi-aplikasi web
mining
- Mahasiswa mampu
mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web mining
Opinion Mining &
Sentiment Analysis
- Model based opinion mining
Discussion
Presentation
- Dapat memahami
konsep dan
implementasi web
structure, content dan
usage mining
- Dapat
mengimplementasikan
teknik web mining
- Dapat mendesain
prototype sistem web
Project
UAS
20 - Mahasiswa mengetahui
aplikasi-aplikasi web
mining
- Mahasiswa mampu
mengidentifikasi,
Opinion Mining &
Sentiment Analysis
- Project Progress Report
Discussion
Presentation
-
CSG2D3 Basis Data Relasional Page 10
Pertemuan
ke-
Kompetensi yang
diharapkan
Bahan Kajian Sub bahan kajian Metode
Pembelajaran
Indikator Pencapaian Cara
assessment
Bobot
Nilai
memformulasikan dan
menuliskan kembali
jurnal/paper web mining
21
- Mahasiswa memahami
konsep dan implementasi
web structure, content
dan usage minin
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
Web Usage Mining - mining for user behavior on the
web, internet marketing
Discussion
Presentation
- Dapat memahami
konsep dan
implementasi web
structure, content dan
usage mining
- Dapat
mengimplementasikan
teknik web mining
- Dapat mendesain
prototype sistem web
Project
UAS
20%
22
- Mahasiswa memahami
konsep dan implementasi
web structure, content
dan usage minin
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
Web Usage Mining - Data collection and sources of data
- Data preparation for usage mining
- Mining navigational patterns
Discussion
Presentation
23
- Mahasiswa memahami
konsep dan implementasi
web structure, content
Web Usage Mining - Integrating e-commerce data
- Leveraging site content and
structure
Discussion
Presentation
-
CSG2D3 Basis Data Relasional Page 11
Pertemuan
ke-
Kompetensi yang
diharapkan
Bahan Kajian Sub bahan kajian Metode
Pembelajaran
Indikator Pencapaian Cara
assessment
Bobot
Nilai
dan usage minin
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
- User tracking and profiling
- E-Metrics: measuring success in e-
commerce
- Privacy issues
24
- Mahasiswa memahami
konsep dan implementasi
web structure, content
dan usage minin
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
Web Usage Mining - Project Progress Report
Discussion
Presentation
- Dapat memahami
konsep dan
implementasi web
structure, content dan
usage mining
- Dapat
mengimplementasikan
teknik web mining
- Dapat mendesain
prototype sistem web
Project
25 - Mahasiswa mengetahui
aplikasi-aplikasi web
mining
- Mahasiswa mampu
mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web mining
Web Mining Application - opinion mining vs. fact mining, web
spam analysis, comparative
shopping, etc.
- Web information integration,
mapping schemas usage
- Web personalization and recommender systems
- Web Mining and its relation to the
Semantic Web: automatic semantic
annotation, ontology learning,
- Mengetahui aplikasi
web mining
Project
-
CSG2D3 Basis Data Relasional Page 12
Pertemuan
ke-
Kompetensi yang
diharapkan
Bahan Kajian Sub bahan kajian Metode
Pembelajaran
Indikator Pencapaian Cara
assessment
Bobot
Nilai
Semantic Web search
26 - Mahasiswa mengetahui
aplikasi-aplikasi web
mining
- Mahasiswa mampu
mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web mining
Web Mining Application - opinion mining vs. fact mining, web
spam analysis, comparative
shopping, etc.
- Web information integration,
mapping schemas usage
- Web personalization and recommender systems
- Web Mining and its relation to the
Semantic Web: automatic semantic
annotation, ontology learning,
Semantic Web search
27-28 - Mahasiswa memahami
teknik-teknik yang
diterapkan di web mining
- Mahasiswa mampu
mengimplementasikan
teknik-teknik web mining
- Mahasiswa mampu
mendesain prototype
sistem di bidang web
mining
- Mahasiswa mampu
mengidentifikasi,
memformulasikan dan
menuliskan kembali
jurnal/paper web mining
Final Project
Presentation
Discussion
Presentation
Dapat mempresentasikan
hasil karya yang
dihasilkan
Project
-
CSG2D3 Basis Data Relasional Page 13
-
CSG2D3 Basis Data Relasional Page 14
Topics & Reading
1. Overview Web Data Mining and E-Business Analytics
Reading:
a. Chapters 1 and 2 of Berry and Linoff
b. Data Mining on the Web - short article by Dan R. Greening, written for webtechniques.com.
c. (Online Paper # 1) Web Mining: Information and Pattern Discovery on the World Wide
Web, by Robert Cooley, Bamshad Mobasher, and Jaideep Srivastava, ICTAI 1997.
2. Knowledge Discovery Process; Data Preparation for Mining
Reading:
a. Chapters 3 and 17 of Berry and Linoff
b. Data Mining Overview
c. (Online Paper # 9) Driving e-Commerce Profitability From Online and Offline Data, White
paper form Torrent Systems.
d. (Online Paper # 3) Web Usage Mining: Discovery and Applications of Usage Patterns from
Web Data, by Jaideep Srivastava, et. al., SIGKDD Explorations, January 2000.
3. Data Mining Techniques: Mining Association Rules and Sequential Patterns
Reading:
a. Chapter 2 of B. Liu's Book
b. Chapter 9 of Berry and Linoff
c. (Online Paper # 5) Web Usage Mining for Web Site Evaluation, by Myra Spiliopoulou,
Communications of ACM, August 2000.
d. (Online paper # 7) An Internet-enabled Knowledge Discovery Process, by Alex Buchner, et.
al., MINEit Software Ltd., 1999.
4. Data Mining Techniques: Classification & Prediction
Reading:
a. Chapter 3 of B. Liu's Book
b. Chapter 6 of Berry and Linoff
c. (Online paper # 33) Modeling Web Robot Navigation Patterns, by Pang-Ning Tan and Vipin
Kumar, WebKDD Workshop at the ACM SIGKDD Conference, 2000.
Note: An additional description of the ID3 and C4.5 algorithms can be found in the
document "Building Classification Models: ID3 and C4.5" from the AI course at Temple
university.
-
CSG2D3 Basis Data Relasional Page 15
5. Data Mining Techniques: Clustering; Memory-Based Reasoning
Reading:
a. Chapter 4 of B. Liu's Book
b. Chapters 11 and 8 of Berry and Linoff
c. (Online Paper # 22) Text-Learning and Related Intelligent Agents: A Survey, by Dunja
Mladenic, IEEE Intelligent Systems, July/August 1999.
d. (Online Paper # 13) Clustering Users of Large Web Sites into Communities, by Georgios
Paliouras, et. al., ICML 2000.
6. Web Usage Mining: Data Preparation and Integration
Reading:
a. Chapter 12 of B. Liu's Book
b. (Online Paper # 4) Data Preparation for Mining World Wide Web Browsing Patterns, by
Robert Cooley, Bamshad Mobasher, and Jaideep Srivastava, Knowledge and Information
Systems, Volume 1, No. 1, 1999.
c. (Online paper # 32) Lessons and Challenges from Mining Retail E-Commerce Data, by Ron
Kohavi, et al., Journal of Machine Learning, 2003.
7. Web Usage Mining: E-Metrics and E-Commerce Data Analysis, Predictive Web Analytics
Reading:
a. Chapters 14 and 4 of Berry and Linoff
b. (Online paper #10) E-Commerce Intelligence: Measuring, Analyzing, and Reporting on
Merchandising Effectiveness of Online Stores, by Stephen Gomory, et. al., IBM T. J. Watson
Research Center.
c. (Online paper #11) E-Metrics Business Metrics For The New Economy, White Paper from
NetGenesis.
8. Web Personalization and Recommender Systems
Reading:
a. (Online paper # 14) Automatic Personalization Based on Web Usage Mining, by Bamshad
Mobasher, Robert Cooley, and Jaideep Srivastava, Communications of ACM, August 2000.
b. (Online paper # 28) Analysis of Recommendation Algorithms for E-Commerce, by Badrul
Sarwar, et. al., ACM Electronic Commerce Conference, November 2000.
c. (Online paper # 15) Integrating Web Usage and Content Mining for More Effective
Personalization, by Bamshad Mobasher et. al., EC-Web 2000.
-
CSG2D3 Basis Data Relasional Page 16
9. Data Mining for the Social Web; Social Network Analysis
Reading:
a. (Online Paper # 20) Text Mining: Finding Nuggets in Mountains of Textual Data, by Jochen
Dorre, Peter Gerstl, and Roland Seiffert, KDD 1999.
b. (Online Paper # 19) Data mining for hypertext: A tutorial survey, by Soumen Chakrabarti,
SIGKDD Explorations, January 2000.
c. (Online Paper # 25) Extracting Patterns and Relations from the World Wide Web, by Sergey
Brin, Stanford University.
VII. REFERENSI / SUMBER BAHAN UTAMA
No Referensi / Sumber Bahan
1 Overview Web Data Mining and E-Business Analytics
Data Mining on the Web - short article by Dan R. Greening, written for webtechniques.com.
2 Knowledge Discovery Process; Data Preparation for Mining
3 Web Usage Mining: Data Preparation and Integration
4 Web Usage Mining: E-Metrics and E-Commerce Data Analysis, Predictive Web Analytics
5 Data Mining for the Social Web; Social Network Analysis
6 Mining the Social Web, Russell, Matthew A.
7 Social Network Data Analytics, Aggar wal, Charu C.
8 Social Network Mining, Analysis and Research Trends : Techniques and Applications, Ting, I-Hsien
9 Web Data Mining : Exploring Hyperlink, Contents and Usage Data, Bing Liu
VIII. SKEMA PENILAIAN
KOMPONEN PENILAIAN BOBOT/ PROSENTASE KETERANGAN
Project 100
-
CSG2D3 Basis Data Relasional Page 17
TUGAS PROJECT WEB MINING :
Mahasiswa dapat memilih 1 dari 2 jenis tugas project :
1. Research paper (Individual)
2. Implementation project (Kelompok maksimal 2 orang)
Setiap mahasiswa/kelompok harus mengajukan proposal project pada minggu kedua perkuliahan
untuk disetujui.
Proposal berisi :
o Jenis project
o Deskripsi project
o Metodologi yang diajukan
o Teknik/metode dan pendekatannya
o Teknik implementasi
o Resource yang digunakan
o Jadwal
Untuk research paper, proposal harus ditambahkan abstrak dan referensi yang digunakan dalam
research paper.
Untuk implementation project, proposal harus ditambahkan deskripsi secara detail, sampel data
yang digunakan, permasalahan data mining yang akan diselesaikan, teknik/metode serta tools yang
akan digunakan.
Secara lebih detail penjelasan dari masing-masing jenis project adalah :
Research paper Project research paper merupakan studi mendalam yang berupa penelusuran, analisis, survei
ataupun evaluasi dari 1 atau lebih topik yang berhubungan dengan Web Mining. Research paper
dapat menganalisis dan mengevaluasi teknik/metode spesifik dalam web mining pada 1 atau lebih
area aplikasi yang diberikan pada deskripsi project.
Tujuan dari research paper adalah menganalisis dan mengevaluasi secara lebih detail dan mendalam
metode dalam lingkup web mining.
Research paper akan dinilai berdasarkan :
o thoroughness, mencakup issue/teknik yang relevan dengan related work/penelitian
yang pernah dilakukan sebelumnya. Point penilaian : 0 4
o soundness, mencakup justifikasi dari beberapa pernyataan yang disampaikan,
ilustrasi/gambaran sistem, analisis secara detail dari teknik/metode yang digunakan
serta keoriginalitasan analisis dan pemaparan yang dilakukan. Point penilaian : 0 4
Catatan : bahwa research paper tidak hanya sekedar menggabungkan analisis dari
beberapa paper melainkan terkandung analisis original yang dilakukan sendiri.
o Progress report/presentasi, Point penilaian : 0 4
o Dokumentasi , Point penilaian : 0 4
Disarankan panjang untuk research paper = 15 20 halaman (single-spaced)
Beberapa contoh topik untuk research paper :
Aplikasi web usage mining (Ex : e-commerce, user profiling, Web personalization).
Catatan : Paper harus mengandung konten dan sumber yang secara substansi berbeda
dengan materi/reference paper yang telah disampaikan di kelas.
Recommender Systems dan User Profiling
-
CSG2D3 Basis Data Relasional Page 18
Studi perbandingan dari beberapa teknik/metode dalam data mining dan collaborative
filtering untuk mengetahui user profiles dan memprediksi user behavior ke depannya. Studi
yang dilakukan harus mencakup beberapa teknik dan pendekatan yang digunakan dalam
recommender systems (mencakup collaborative filtering, content-based filtering, model-
based approaches yang memanfaatkan data mining, dan hybrid systems).
Web content mining/Text mining
Studi dari beberapa teknik/metode untuk me-mining informasi dan pola seperti pada text
ataupun Web documents. Paper harus mencakup analisis beberapa topik, antara lain aplikasi
text mining pada Web, information extraction dan mining data records dari Web, concept
discovery dari document collections, document categorization dan classification, dll.
Web structure mining
Studi dari beberapa teknik/metode untuk me-mining knowledge dari linkage structure di
Web. Di antara beberapa topik, dapat pula dieksplorasi mengenai aplikasi structure mining
pada information retrieval (example Google's Pagerank algorithm), algoritma berdasarkan
pada Hubs and Authorities, serta automatic discovery dari Web communities.
Web Data Warehousing
Studi mendetail mengenai Web data warehouses dan datamarts, serta kegunaannya,
dengan menggunakan beberapa teknik/metode dalam data mining baik untuk kepentingan
SPPK maupun untuk membangun business intelligence dari Web data.
Catatan: Fokus utamanya bukan hanya pada Data warehousing, akan tetapi pada
kegunaannya dalam konteks Web dan data e-commerce, serta keterhubungannya dengan
data mining atau data analysis.
Struktur Research Papers secara keseluruhan diserahkan kepada mahasiswa, akan tetapi ada
beberapa bagian yang wajib dicantumkan, yaitu :
1. Abstraksi
Berisi sinopsis/deskripsi singkat mengenai isi dari paper. Terdiri dari 200-300 kata
2. Previous works
Hasil riset-riset yang pernah dilakukan sebelumnya dan dirujuk pada paper ini
3. Desain sistem
Berisi desain sistem secara detail dari input proses - output
4. Pengujian dan analisis
Skenario uji dan hasil pengujian serta analisis terhadap hasil pengujian
5. Kesimpulan
Berisi kesimpulan dari research paper. Harus berisi kesimpulan yang bersifat original dan
bukan mengutip dari reference paper.
6. Referensi
Berisi daftar referensi yang digunakan dalam reserach paper. Referensi diberi penomoran
sesuai dengan aturan penulisan pada format IEEE.
Disarankan untuk menyusun bagian/sub bagian sesuai dengan konten research paper dan
memudahkan pembaca untuk memahami isi dari paper yang disampaikan.
-
CSG2D3 Basis Data Relasional Page 19
IMPLEMENTATION PROJECT
Implementation project mencakup implementasi dari teknik/metode data mining
(mengkombinasikan dari beberapa teknik data mining) untuk menyelesaikan permasalahan spesifik
dalam web mining, serta melakukan evaluasi terhadap pengujiannya .
beberapa contoh spesifik dari implementation project :
a. Mendesain, mengimplementasikan dan mengujikan teknik data mining untuk data set
seperti data web usage, e-commerce atau data yang ada di UCI KDD Archive.
b. Mendesain, mengimplementasikan dan mengujikan teknik data mining untuk preprocessing
data web usage, mencakup user/session identification, path completion, automatic
discovery and filtering of robot navigation, dan pageview identification.
c. Mendesain dan mengimplementasikan datawarehouse untuk integrasi dan manajemen web
usage, struktur, konten dan data e-commerce serta menganalisis data tersebut dengan
query OLAP di datawarehouse untuk kemudian diolah dengan teknik data mining.
d. Mengimplementasikan sistem untuk menganalisis keefektifan web site dengan
membandingkan struktur site dengan navigational behaviour of user, menganalisis site dan
user e-metric dan memprediksikan user behaviour untuk user individu atau segmen tertentu
e. Mendesain dan mengimplementasikan recommender system berdasarkan usage mining,
content filtering
f. Mendesain dan mengimplementasikan automated classification tool yang menggunakan
machine learning untuk mengidentifikasi dan mengklasifikasikan robot navigation sessions
dari Web usage log files.
g. Mendesain dan mengimplementasikan query language untuk meng-query rules/patterns
yang didapatkan dari Web usage atau Web content data.
h. Mendesain dan mengimplementasikan filtering agent untuk mail, news atau informasi web
(agent yang dapat mengekstrak informasi mengenai topik/produk dari site-site tertentu).
Desain dari filtering agent mencakup 1/lebih metode/teknik machinelearning dan data
mining.
Implementation project akan dievaluasi berdasarkan lingkup permasalahan yang dipilih, desain,
correctness, dokumentasi dan hasil evaluasi/pengujian.
Dokumentasi sistem minimal mencakup :
o Executive summary dari project (mencakup problems, goals, metode dan kesimpulan)
o Deskripsi/penjelasan detail sistem yang mencakup teknik/metode/algoritma yang digunakan
Blok diagram/flowchart sistem secara detail dan penjelasannya
Komponen-komponen yang diimplementasikan dalam sistem (code segment, modul,
method, function, procedure dll)
Interaksi antar komponen di atas
Dataset yang digunakan
o Pengujian sistem dengan sample data yang menjelaskan cara kerja sistem dari input, proses
dan output
o Complete source code (pastikan source code anda didokumentasikan dengan baik dan
mudah dipahami)
o Binary files (., executables, DLLs, Class files) atau komponen lain yang diperlukan untuk
mengeksekusi program anda
o Readme, yang berisi instruksi/panduan bagaimana compile, install atau menjalankan
program anda
o Project report/dokumentasi
o Data training/testing untuk evaluasi sistem
Implementation project akan dievaluasi berdasarkan :
-
CSG2D3 Basis Data Relasional Page 20
o significance dari sebuah permasalahan/kasus, Point penilaian : 0 4
o desain dan implementasi sistem, Point penilaian : 0 4
o thoroughness (tingkat analisis terhadap data dan permalasahan yang diselesaikan),
Point penilaian : 0 4
o dokumentasi, Point penilaian : 0 4
LEVEL PENILAIAN
LEVEL/INDEKS INDIKATOR KOMPETENSI KETERANGAN *)
A Masing-masing point penilaian > 3 Lulus/Tidak Lulus
B 2 < point