pengenalan pola text mining

Upload: fajar-wicaksono

Post on 12-Oct-2015

33 views

Category:

Documents


0 download

DESCRIPTION

Text mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, yaitu proses penganalisisan teks guna menyarikan informasi yang bermanfaat untuk tujuan tertentu.

TRANSCRIPT

  • 5/21/2018 Pengenalan Pola Text mining

    1/3

    Pengenalan pola 1

    Pengenalan pola

    Pengenalan pola merupakan bidang dalam pembelajaran mesin dan dapat diartikan sebagai "tindakan mengambil

    data mentah dan bertindak berdasarkan klasifikasi data"[1]

    [2]

    . Dengan demikian, ia merupakan himpunan kaidah

    bagi pembelajaran diselia (supervised learning).

    Ada beberapa definisi lain tentang pengenalan pola, di antaranya:

    Penentuan suatu objek fisik atau kejadian ke dalam salah satu atau beberapa kategori.[3]

    Ilmu pengetahuan yang menitikberatkan pada deskripsi dan klasifikasi (pengenalan) dari suatu pengukuran.[4]

    Suatu pengenalan secara otomatis suatu bentuk, sifat, keadaan, kondisi, susunan tanpa keikutsertaan manusia

    secara aktif dalam proses pemutusan.[5]

    Berdasar beberapa definisi di atas, pengenalan pola bisa didefinisikan sebagai cabang kecerdasan yang

    menitik-beratkan pada metode pengklasifikasian objek ke dalam klas - klas tertentu untuk menyelesaikan masalah

    tertentu.

    Salah satu aplikasinya adalah pengenalan suara, klasifikasi teks dokumen dalam kategori (contoh. surat-E

    spam/bukan-spam), pengenalan tulisan tangan, pengenalan kode pos secara otomatis pada sampul surat, atau sistempengenalan wajah manusia. Aplikasi ini kebanyakan menggunakan analisis citra bagi pengenalan pola yang

    berkenaan dengan citra digital sebagai input ke dalam sistem pengenalan pola

    Teknik Pengenalan Pola

    Pengenalan pola biasanya merupakan langkah perantaraan bagi proses lebih lanjut. Langkah ini biasanya merupakan

    dapatan data (gambar, bunyi, teks, dll.) untuk dikelaskan, pre-pemrosesan untuk menghilangkan gangguan atau

    menormalkan gambar dalam satu cara (pemrosesan gambar (image processing), teks dll.), pengiraan ciri-ciri,

    pengkelasan dan akhirnya post-pemrosesan berdasarkan kelas pengenalan dan aras keyakinan.

    Pengenalan pola itu sendiri khususnya berkaitan dengan langkah pengkelasan. Dalam kasus tertentu, sebagaimanadalam jaringan syaraf (neural networks), pemilihan ciri-ciri dan pengambilan juga boleh dilaksanakan secara semi

    otomatis atau otomatis sepenuhnya.

    Sementara terdapat banyak kaidah untuk pengkelasan, ia menyelesaikan satu dari tiga masalah matematis berkaitan.

    Pertama adalah mencari peta ruang ciri (feature space) (biasanya pelbagai dimensi ruang vektor (vector space)) bagi

    set label. Secara bersamaan ia membagi ruang ciri menjadi kawasan-kawasan, kemudian meletakkan label kepada

    setiap kawasan. Algoritma yang demikian ini (contohnya the nearest neighbour algorithm) biasanya belumlah

    menghasilkan kepercayaan atau class probabilities, sebelum diterapkannya post-processing.

    Masalah kedua adalah untuk menganggap masalah sebagai anggaran, dimana matlamat adalah untuk menganggar

    fungsi bagi bentuk

    dimana input vektor ciri adalah , dan fungsi f biasanya diparameter oleh sebagian parameter . Dalam

    pendekatan statistik Bayesian bagi masalah ini, berlainan dengan memilih satu vektor parameter , hasil dibentuk

    bagi kesemua thetas yang mungkin, dengan turutan berat bagi ketepatan berdasarkan data latihanD:

    Masalah ketiga terkait dengan masalah kedua, tetapi masalahnya adalah untuk menganggar kebangkalian bersyarat

    (conditional probability) dan kemudian menggunakan aturan Bayes untuk menghasilkan kemungkinan

    kelas sebagaimana dalam masalah kedua.

    Contoh algoritma klasifikasi termasuk:

    Klasifikasi linear

    http://id.wikipedia.org/w/index.php?title=Klasifikasi_linearhttp://id.wikipedia.org/w/index.php?title=Aturan_Bayeshttp://id.wikipedia.org/w/index.php?title=Statistik_Bayesianhttp://id.wikipedia.org/w/index.php?title=Posterior_probabilityhttp://id.wikipedia.org/w/index.php?title=Nearest_neighbor_%28pattern_recognition%29http://id.wikipedia.org/w/index.php?title=Algoritmahttp://id.wikipedia.org/w/index.php?title=Ruang_vektorhttp://id.wikipedia.org/w/index.php?title=Jaringan_syarafhttp://id.wikipedia.org/w/index.php?title=Pemrosesan_gambarhttp://id.wikipedia.org/w/index.php?title=Citra_digitalhttp://id.wikipedia.org/w/index.php?title=Analisis_citrahttp://id.wikipedia.org/w/index.php?title=Pengenalan_wajah_manusiahttp://id.wikipedia.org/w/index.php?title=Pengenalan_tulisan_tanganhttp://id.wikipedia.org/w/index.php?title=Pengenalan_suarahttp://id.wikipedia.org/w/index.php?title=Pembelajaran_mesin
  • 5/21/2018 Pengenalan Pola Text mining

    2/3

    Pengenalan pola 2

    Diskriminan linier Fisher

    Regresi Logistik

    Naive Bayes classifier

    Perceptron

    Metode Nearest neighbor

    Boosting

    Decision tree

    Jaringan Saraf Tiruan

    Jaringan Bayesian

    Mesin sokongan vektor (Support vector machine)

    Model Markov Tersembunyi (Hidden Markov model)

    Domain Aplikasi

    komputer visi

    pengenalan karakter medis (Medical image analysis)]]

    Pengenalan karakter optis

    Pengenalan suara (speech recognition)

    Pengenalan tulisan tangan (handwritten recognition)

    Identifikasi biometrik

    klasifikasi dokuman

    Internet

    Credit scoring

    Rujukan

    [1] Richard O. Duda, Peter E. Hart, David G. Stork (2001)Pattern classification (2nd edition), Wiley, New York, ISBN 0-471-05669-3.

    [2] J. Schuermann:Pattern Classification: A Unified View of Statistical and Neural Approaches, Wiley&Sons, 1996, ISBN 0-471-13534-8

    [3][3] IJCSNS, 2006, ISSN 1738-7906)

    [4][4] IJCSNS, 2006, ISSN 1738-7906

    [5][5] McGraw-Hill Dictionary of Scientific and Technical Terms (2003)

    http://id.wikipedia.org/w/index.php?title=Klasifikasi_dokumanhttp://id.wikipedia.org/w/index.php?title=Pengenalan_tulisan_tanganhttp://id.wikipedia.org/w/index.php?title=Pengenalan_suarahttp://id.wikipedia.org/w/index.php?title=Pengenalan_karakter_optishttp://id.wikipedia.org/w/index.php?title=Pengenalan_karakter_medishttp://id.wikipedia.org/w/index.php?title=Komputer_visihttp://id.wikipedia.org/w/index.php?title=Model_Markov_tersembunyihttp://id.wikipedia.org/w/index.php?title=Mesin_sokongan_vektorhttp://id.wikipedia.org/w/index.php?title=Jaringan_Bayesianhttp://id.wikipedia.org/w/index.php?title=Jaringan_Saraf_Tiruanhttp://id.wikipedia.org/w/index.php?title=Metode_Nearest_neighborhttp://id.wikipedia.org/w/index.php?title=Regresi_Logistikhttp://id.wikipedia.org/w/index.php?title=Diskriminan_linier_Fisher
  • 5/21/2018 Pengenalan Pola Text mining

    3/3

    Sumber dan Kontributor Artikel 3

    Sumber dan Kontributor ArtikelPengenalan pola Sumber: http://id.wikipedia.org/w/index.php?oldid=6621399 Kontributor: Ali Akbar, Dykeey, Jagawana, Mssetiadi, Roscoe x, Wic2020, Yosri, 1, 2 suntingan anonim

    Lisensi

    Creative Commons Attribution-Share Alike 3.0//creativecommons.org/licenses/by-sa/3.0/