การใช้เหมืองข้อมูลช่วยในการตัดสินใจจ่ายสำนวนคดีความให้กับ...
TRANSCRIPT
การใชเหมองขอมลชวยในการตดสนใจจายส านวน
คดความใหกบผพพากษา: กรณศกษาศาลจงหวดปทมธาน
นเรศ หมทอง
งานคนควาอสระนเปนสวนหนงของการศกษาตามหลกสตรวทยาศาสตรมหาบณฑต
สาขาเทคโนโลยคอมพวเตอรและการสอสาร คณะวศวกรรมศาสตร
มหาวทยาลยธรกจบณฑตย
พ.ศ. 2558
DPU
Using data mining to Assist in Decision Making on Distribution
Of case among judges: Case Study of Pathumthani Court
Nares Moothong
An Independent Study Submitted in Partial Fulfillment of the Requirements
for the Degree of Master of Science
Department of Computer and Communication Technology
Faculty of Engineering, Dhurakij Pundit University
2015
DPU
ค
หวของานคนควาอสระ การใชเหมองขอมลชวยในการตดสนใจจายส านวนคด ความใหกบผพพากษา: กรณศกษาศาลจงหวดปทมธาน
ชอผเขยน นเรศ หมทอง อาจารยทปรกษา ผชวยศาสตราจารย ดร.วรพล พงษเพชร สาขาวชา เทคโนโลยคอมพวเตอรและการสอสาร ปการศกษา 2557
บทคดยอ
งานวจยนมวตถประสงคเพอศกษาและคนควารปแบบการเกดความสมพนธของ
แอตทบวตหรอตวแปรจากขอมลส านวนคดทมอย และน าความรทไดจากการศกษาไปสรางโมเดลทสามารถท านายผลลพธทคาดวาจะเกดขนในอนาคตเพอชวยใหผบรหารสามารถตดสนใจพจารณาการจายส านวนคดใหกบผพพากษาของศาลจงหวดปทมธานใหมประสทธภาพมากขน
ในการศกษาครงนใชวธการจ าลองขอมลขนมาดวยชดคณลกษณะของขอมลทจดเกบไวภายในฐานขอมลจรง โดยใชโปรแกรม Weka (Waikato Environment for Knowledge Analysis) ในการศกษาเปนหลกโดยใชเทคนคของเหมองขอมลประเภทเทคนคตนไมตดสนใจ (Decisions tree) หรอโมเดล Classifier tree J48 และวธการเรยนรเบยอยางงาย (Naïve Bayes) หรอโมเดล Classifier Naïve Bayes มาใชในการศกษา
โดยผลจากการศกษาคนควาพบวาเทคนคตนไมตดสนใจใหความถกตองจากการท านายสงคดเปนรอยละ 93.52 สามารถจ าแนกกลมประเภทคดงายและประเภทคดยาก ทสามารถแบงกลมไดตามเงอนไขทชดเจนทสด และน ากฎทไดมาเปนตวอยางทส าคญส าหรบการพฒนาโปรแกรมตรวจสอบขอมลทางคดทใชประกอบในการตดสนใจจายส านวนคดใหกบผพพากษาได
ฆ
DPU
ง
Independent Study Title Using Data Mining to Assist in Decision Making on Distribution of Cases among Judges: Case Study of Pathumthani Court
Author Nares Moothong Independent Study Advisor Asst. Prof. Worapol Pongpech, Ph.D. Department Computer and Communication Technology Academic Year 2014
ABSTRACT
This research aims to study and investigate the pattern of relations of attributes or
variables in an existing case data, and to use the knowledge gained from the study to develop a model that can predict the consequences that is expected to occur in the future. This can help the administrators to decide how to distribute cases among judges at Pathumthani court more efficiently.
In this study, data were duplicated according to features of the data stored in the actual database mainly using Weka (Waikato Environment for Knowledge Analysis) program. Moreover, data mining techniques called the decisions tree technique or Classifier tree J48 model, and Classifier Naïve Bayes model were applied.
The results of the study showed that the decision tree technique could provide the predicted outcomes with high accuracy at 93.52 percent. It could classify cases into easy and difficult cases according to the most apparent criteria. Finally, the rule from the study could be used as an important example for developing a program to verify case data that is to be included in the decision on the distribution of cases among the judges.
DPU
จ
กตตกรรมประกาศ
งานคนควาอสระนส าเรจไดดวยความกรณาของผ ชวยศาสตราจารย.ดร.วรพล พงษเพชร ผอ านวยการหลกสตรมหาบณฑต สาขาเทคโนโลยคอมพวเตอรและการสอสาร ทไดกรณาใหค าปรกษาแนะน า ชวยเหลอ ใหก าลงใจ และแกไขขอบกพรองตางๆ ดวยความเอาใจใสเปนอยางยงมาโดยตลอด ท าใหงานคนควาอสระฉบบนนมความสมบรณมากยงขน ผศกษารสกซาบซงในความกรณาของทานเปนอยางยง ผศกษาขอกราบขอบพระคณอาจารยเปนอยางสง
ขอขอบพระคณ อาจารย ดร.ประศาสน จนทราทพย และอาจารย ดร.สณห รฐวบลย ทกรณาตรวจแกไข และใหค าแนะน าในการปรบปรงผลลพธทไดจากการศกษาครงน ใหมประสทธภาพมากยงขน และขอบคณเจาหนาท คณะวศวกรรมศาสตร มหาวทยาลยธรกจบณฑตย ในการอ านวยความสะดวก ใหความรวมมอในการตดตอประสานงาน สนบสนนขอมลตางๆ ท าใหการศกษาครงนส าเรจลลวงลงดวยด
สดทายนผ ศกษาขอกราบขอบพระคณบดา มารดา รวมท งเพอน พ นอง สาขาเทคโนโลยคอมพวเตอรทกทานทไดใหการสนบสนนในทกๆ ดานและเปนก าลงใจในการท างานคนควาอสระฉบบนมาโดยตลอด
นเรศ หมทอง
ง
ง
DPU
ฉ
สารบญ
หนา
บทคดยอภาษาไทย........................................................................................................... ฆ
บทคดยอภาษาองกฤษ...................................................................................................... ง
กตตกรรมประกาศ........................................................................................................... จ
สารบญตาราง................................................................................................................... ซ
สารบญภาพ...................................................................................................................... ฌ
บทท
1. บทน า.................................................................................................................. 1
1.1 หลกการและเหตผล..................................................................................... 1
1.2 วตถประสงค................................................................................................ 3
1.3 ขอบเขตการศกษา........................................................................................ 3
1.4 ผลทคาดวาจะไดรบ..................................................................................... 3
1.5 นยามศพทเฉพาะ.......................................................................................... 3
2. แนวคด ทฤษฎ และงานวจยทเกยวของ............................................................... 5
2.1 ศาลยตธรรมและศาลจงหวดปทมธาน......................................................... 5
2.2 ทฤษฎและแนวความคดทเปนพนฐานในการพฒนาตวโมเดลตนแบบ........ 8
2.3 ซอฟตแวรทใชในการศกษา......................................................................... 19
2.4 การวเคราะหและออกแบบระบบ................................................................. 28
2.5 งานวจยทเกยวของ....................................................................................... 30
3. ระเบยบวธวจย.................................................................................................... 33
3.1 ขนตอนการศกษาคนควา............................................................................. 33
3.2 เครองมอทใชในการศกษา........................................................................... 34
3.3 ขนตอนการวเคราะหและออกแบบระบบ.................................................... 35
DPU
ช
สารบญ (ตอ)
บทท หนา
3.4 ระยะเวลาในการด าเนนการศกษาคนควา..................................................... 39
4. ผลการด าเนนการศกษาคนควา........................................................................... 41
4.1 การศกษาและรวบรวมขอมล....................................................................... 41
4.2 การเตรยมขอมล (Data Preparation)............................................................ 42
4.3 การศกษา ทดสอบ และเลอกเทคนคทเหมาะสม.......................................... 46
4.4 การวเคราะหและสรปผล............................................................................. 51
4.5 ขนตอนการพฒนาระบบ.............................................................................. 57
5. สรปผลการศกษาคนควาและขอเสนอแนะ......................................................... 70
5.1 สรปผลการศกษาคนควา.............................................................................. 70
5.2 ปญหาและแนวทางแกไข............................................................................. 71
5.3 ขอเสนอแนะส าหรบพฒนาตอไป................................................................ 72
บรรณานกรม................................................................................................................... 73
ภาคผนวก......................................................................................................................... 77
ประวตผเขยน................................................................................................................... 85
DPU
ซ
สารบญตาราง
ตารางท หนา
2.1 แสดงขอมลสภาพอากาศยอนหลง 14 วน.................................................... 15
2.2 แสดงขอมลการค านวณจากโมเดลของ Naïve Bayes …………………………… 18
2.3 แสดงขอมลสภาพอากาศในวนปจจบน ซงเรายงไมสามารถทราบคลาส
ค าตอบ..............................................................................................................
18
3.1 ตารางแสดงการจดเกบขอมลของฐานขอมลชอ data_case…………………….… 38
3.2 ตารางแสดงขอมลเกยวกบการจดการขอมลบคคลทเกยวของภายในระบบ. 38
3.3 แสดงระยะเวลาในการด าเนนการศกษาคนควา............................................ 39
4.1 แสดงคณลกษณะ (Attribute) ทใชด าเนนการศกษา..................................... 44
4.2 แสดงการแปลงคาขอมล.............................................................................. 46
DPU
ฌ
สารบญภาพ
ภาพท หนา
2.1 แสดงกระบวนการคนหาความรในการขดขอมล............................................ 11
2.2 โมเดลโครงสรางตนไมตดสนใจ..................................................................... 16
2.3 แสดงหนาตาง Weka GUI Chooser................................................................. 19
2.4 เมนหลกในหนาตาง Weka Explorer............................................................... 20
2.5 แสดงขนตอนการท างาน PHP Script Request/Response ............................... 22
2.6 แสดงขนตอนการเขาสโปรแกรม Adobe Dreamweaver CS5 ........................ 26
2.7 สวนประกอบของ Welcom Screen................................................................. 27
2.8 สวนประกอบของหนาจอโปรแกรม............................................................... 27
2.9 แสดงวงจรการพฒนาระบบ System Development Life Cycle: SDLC.......... 29
3.1 แสดงแผนภาพยสเคสของโปรแกรมตรวจสอบขอมลทางคด......................... 35
3.2 แสดงแผนภาพการท างานในสวนของการเขาสระบบ..................................... 36
3.3 แสดงแผนภาพการท างานในสวนของการท านายผลลพธทเกดขน................. 37
3.4 แผนผงแสดงขนตอนการด าเนนการศกษาวเคราะหขอมลในโปรแกรม
Weka ..............................................................................................................
40
4.1 แสดงรายละเอยดของฐานขอมล..................................................................... 42
4.2 แสดงการโอนยายขอมลจากระบบจดการฐานขอมลมาอยในรปแบบไฟล
Microsoft Excel..............................................................................................
43
4.3 แสดงการเปดโปรแกรม Weka เวอรชน 3.6.................................................... 47
4.4 แสดงการเขาหนาจอโปรแกรม Weka เวอรชน 3.6......................................... 47
4.5 แสดงการน าเขาขอมลในโปรแกรม Weka เวอรชน 3.6.................................. 48
4.6 หนาจอแสดงขอมลทน าเขาในโปรแกรม Weka เวอรชน 3.6.......................... 49
DPU
ญ
สารบญภาพ (ตอ)
ภาพท
หนา
4.7 การเลอกเทคนคทใชในการศกษาในการจ าแนกขอมลแบบ Decsion Tree:
J48 .................................................................................................................
49
4.8 หนาจอผลลพธของโมเดลการจ าแนกขอมลแบบ Decsion Tree: J48.............. 50
4.9 การเลอกเทคนคทใชในการศกษาในการจ าแนกขอมลแบบ Naïve Bayes ..... 50
4.10 หนาจอผลลพธของโมเดลการจ าแนกขอมลแบบ Naïve Bayes.................... 51
4.11 ผลลพธจากการจ าแนกกลมแบบ Decsion Tree: J48..................................... 52
4.12 แสดงแผนภาพการจ าแนกกลมแบบ Decsion Tree: J48................................ 52
4.13 ผลลพธจากการจ าแนกกลมแบบ Naïve Bayes.............................................. 53
4.14 แสดงขนตอนการใชงาน phpMyAdmin Database Manager........................ 58
4.15 แสดงการปอน Username และ Password เพอเขาสระบบ............................. 58
4.16 แสดงหนาตางของ phpMyAdmin................................................................. 59
4.17 แสดงขนตอนการสรางฐานขอมล................................................................. 60
4.18 แสดงผลการสรางฐานขอมล......................................................................... 60
4.19 แสดงโครงสรางหนาเวบเพจของโปรแกรมตรวจสอบขอมลทางคด............ 61
4.20 หนาจอแสดงการลอกอนเขาสระบบ............................................................. 61
4.21 หนาจอบนทกขอมลทางคดทตองการวเคราะห............................................. 62
4.22 หนาจอแสดงผลการวเคราะห........................................................................ 63
4.23 หนาจอการจดการเพมขอมลบคคล............................................................... 64
4.24 แสดงขอมลบคคลผมสทธเขาใชงานในระบบ.............................................. 64
4.25 แสดงเงอนไขในการเขยนโปรแกรมในสวนของการท านายผลลพธ............ 66
DPU
บทท 1 บทน ำ
1.1 หลกกำรและเหตผล
นบตงแตกระทรวงยตธรรมท ำหนำทดแล รบผดชอบงำนธรกำรของศำลยตธรรมเปนระยะเวลำ 100 ปเศษ จงเกดแนวคดทจะแยกศำลยตธรรมออกจำกกระทรวงยตธรรมโดยมวตถประสงคเพอใหพนจำกขอระแวง ขอสงสย กำรแทรกแซงจำกฝำยบรหำร จนกระทงรฐธรรมนญแหงรำชอำณำจกรไทย พ.ศ. 2540 มำตรำ 275 วรรคหนง บญญตใหศำลยตธรรมมหนวยงำนธรกำรของศำลยตธรรมท เปนอสระ ใหเลขำธกำรส ำนกงำนศำลยตธรรมเปนผบงคบบญชำขนตรงตอประธำนศำลฎกำ (รำชกจจำนเบกษำ เลม 144 ตอนท 55 ก 11 ตลำคม 2540 หนำ 71) และ พระรำชบญญตระเบยบบรหำรรำชกำรศำลยตธรรม พ.ศ.2543 มำตรำ 5 วรรคหนงบญญตใหมส ำนกงำนศำลยตธรรมเปนสวนรำชกำรทเปนหนวยงำนอสระมฐำนะเปนนตบคคล (รำชกจจำนเบกษำ เลม 117 ตอนท 59 ก 21 มถนำยน 2543,น.2) ดงนนจงถอไดวำส ำนกงำนศำลยตธรรมมกำรแยกออกจำกกระทรวงยตธรรม นบตงแตวนท 20 สงหำคม 2543 เปนตนมำ
ส ำนกงำนศำลยตธรรมมโครงสรำงลกษณะกำรท ำงำน แบงได 2 สวนใหญๆ คอ สวนงำนตลำกำรมอ ำนำจหนำทในกำรพจำรณำพพำกษำอรรถคดตำงๆ อนไดแก คดแพง คดอำญำ คดลมละลำย และคดประเภทอนทอยในเขตอ ำนำจของศำลยตธรรม สวนงำนธรกำร มส ำนกงำนศำลยตธรรมท ำหนำทดแลเกยวกบงำนธรกำรของศำลยตธรรม งำนสงเสรมงำนตลำกำรและงำนวชำกำร เพอสนบสนนและอ ำนวยควำมสะดวก ใหแกศำลยตธรรม รวมทงเสรมสรำงใหกำรพจำรณำพพำกษำคดเปนไปโดยสะดวก รวดเรว และมประสทธภำพ
ศำลยตธรรมตำมพระธรรมนญศำลยตธรรม พ.ศ.2543 มอยท วรำชอำณำจกร และระบบศำลยตธรรมสำมำรถแบงออกไดเปน 3 ชน คอ ศำลชนตน ศำลอทธรณ และศำลฎกำ มจ ำนวนศำลรวมทงสน 248 ศำลทวรำชอำณำจกร (ส ำนกแผนและงบประมำณ ขอมล ณ วนท 1 เมษำยน 2557 )
ศำลจงหวดปทมธำน จดอยในศำลชนตน ทท ำหนำทรบค ำฟองหรอค ำรอง ในชนเรมตนไมวำจะเปนคดแพง คดผบรโภค คดแรงงำน คดภำษอำกร คดลมละลำย คดทรพยสนทำงปญญำและกำรคำระหวำงประเทศ หรอ คดอำญำ โดยด ำเนนกระบวนกำรตดสนชขำดเปนชนศำลแรก ทงมอ ำนำจด ำเนนกระบวนกำรพจำรณำแทนศำลอทธรณและศำลฎกำในบำงเรอง
DPU
2
ศำลจงหวดปทมธำนเปนหนงในสบสศำล ทไดรบคดเลอกจำกส ำนกเทคโนโลยสำรสนเทศ ส ำนกงำนศำลยตธรรม ใหเปนศำลตนแบบในกำรน ำระบบเทคโนโลยสำรสนเทศ มำชวยอ ำนวยควำมสะดวกดำนกำรบรหำรจดกำรกบขอมลทำงคด โดยเรยกชอโปรแกรมวำ “ระบบสำรสนเทศส ำนวนคดศำลชนตนและศำลอทธรณ ในกลมศำลตนแบบ” ตงแตเดอนตลำคม พ.ศ.2552 เปนตนมำ
ในกำรปฏบตงำนประจ ำวนของเจำหนำท ทท ำหนำทรบค ำฟองหรอค ำรอง ไดบนทกขอมลทำงคดผำนโปรแกรมระบบสำรสนเทศส ำนวนคดศำลชนตนและศำลอทธรณ ในกลมศำลตนแบบ โดยมซอฟตแวรทใชในกำรบรหำรจดกำรฐำนขอมล (DBMS) ทำงคดชอ Microsoft SQL Server 2005 และพบวำขอมลทำงคดทบนทกมจ ำนวน 10-30 เรองตอหนงวนและมปรมำณคดเพมขนอยทกๆวน
ขอมลทำงคดทจดเกบในระบบจดกำรฐำนขอมล (DBMS) ณ ปจจบนท ำหนำทในกำรจดเกบขอมลทำงคดโดยไมมกำรน ำขอมลทำงคดทจดเกบมำใชใหเกดประโยชนแตอยำงใด กำรสบคนควำมรทเปนประโยชนและนำสนใจจำกฐำนขอมลขนำดใหญ (Knowledge Discovery from very large Database: KDD) ห รอท เรยกกนวำ Data Mining เปนสำขำหนงทำงวทยำศำสตรคอมพวเตอร ทก ำลงไดรบควำมสนใจอยำงสงในปจจบน ดวยเทคนคของ KDD ขอมลขนำดใหญทเรำสนใจจะถกวเครำะหและดงเอำควำมรหรอสงส ำคญออกมำรวบรวมใหอยในรปของฐำนควำมร(Knowledge Base) เพอใชส ำหรบกำรสบคนสงทเรำตองกำร ซงไมสำมำรถสบคนไดจำกวธกำรของระบบจดกำรฐำนขอมล (DBMS) โดยทวไป (ธระวฒน พงษศรปรดำ,กำรจดสรรกฎหมำยทเหมำะสมใหกบคดควำมโดยอตโนมต,2544,น.3)
ดวยเหตนจงมแนวคดทจะศกษำขอมลทจดเกบภำยในฐำนขอมลของศำลจงหวดปทมธำน โดยมงเนนกำรศกษำ คนควำ ทจะหำรปแบบ หำควำมสมพนธ หำโครงสรำงทเดนชด เพอท ำนำยผลลพธทเกดขน จำกระบบฐำนขอมลทจดเกบโดยใชวธกำรจ ำลองขอมลเปรยบเทยบกบโครงสรำงของฐำนขอมลทไดจดเกบจรง โดยใชเทคนคของเหมองขอมลประเภทเทคนคตนไมตดสนใจ (Decisions tree) และวธกำรเรยนรเบยอยำงงำย (Naïve Bayes) มำใชในกำรศกษำและชวยในกำรอธบำยรปแบบ ลกษณะบำงอยำงภำยใตขอมลทมอยและน ำผลลพธทไดจำกกำรศกษำน ำไปท ำนำยหรอน ำไปใชประโยชนตอกำรสนบสนนกำรตดสนใจ หรอสนบสนนท ำงำนของผบรหำรในกำรพจำรณำจำยส ำนวนคดควำมใหกบผพพำกษำประจ ำศำลไดโดยสะดวกและรวดเรว
DPU
3
1.2 วตถประสงค
1. เพอศกษำ คนควำ รปแบบกำรเกดควำมสมพนธของแอททรบวตหรอตวแปรจำกขอมลทำงคดทมอย
2. เพอสำมำรถน ำควำมรทไดจำกกกำรศกษำคนควำน ำไปสรำงโมเดล (Model) กำรท ำนำยผลลพธทคำดวำจะเกดขนภำยในอนำคต
3. เพอชวยใหผบรหำรสำมำรถตดสนใจพจำรณำในกำรจำยส ำนวนคดใหกบผพพำกษำใหมประสทธภำพมำกขน
1.3 ขอบเขตของกำรศกษำ
1. ผด ำเนนกำรศกษำใชวธกำรจ ำลองของมลแอททรบวตจำกฐำนขอมลจรงทจดเกบในปจจบน
2. ผด ำเนนกำรศกษำใชวธกำรศกษำคนควำโดยใชเทคนคของเหมองขอมลประเภทเทคนคตนไมตดสนใจ (Decisions tree) และวธกำรเรยนรเบยอยำงงำย (Naïve Bayes)
1.4 ผลทคำดวำจะไดรบ
1. ผศกษำคำดวำจะไดรปแบบกำรเกดควำมสมพนธของแอทรบวต เพอน ำไปใชประโยชนในกำรน ำเสนอบทสรปตอผบรหำรในล ำดบตอไป
2. สำมำรถทรำบปจจยของมลเหตคดในกำรจดกลมประเภทคดและไดรปแบบโมเดลทชดเจน สำมำรถน ำไปใชงำนไดจรง
3. สำมำรถน ำผลลพธกำรศกษำดวยเทคนคของเหมองขอมลและคดเลอกวธทดทสดน ำไปเขยนโปรแกรมเพอประยกตใชงำนในกำรน ำเสนอใหกบผบรหำรได
1.5 นยำมศพทเฉพำะ เหมองขอมล (Data Mining) เปนกระบวนกำรในกำรคนหำควำมสมพนธ คนหำ
รปแบบ คนหำแนวโนม จำกควำมรทเกบรวบรวมอยไวเปนจ ำนวนมำก โดยอำศยเทคนคตำงๆ เพอน ำควำมรทได มำสนบสนนกระบวนกำรตดสนใจ จำกขอมลทไดเพอน ำไปท ำนำยผลลพธทคำดวำจะเกดขนภำยในอนำคตอนใกล
DPU
4
แอททรบวต (Attribute) หมำยถง คณลกษณะของสงทตองกำรอธบำยควำมสมพนธทตองกำรจดเกบ
โครงสรำงตนไม (Decisions tree) หมำยถง โครงสรำงทมลกษณะกำรเรยงเปนกงกำน สำขำแตกแขนงออกไป ทมควำมสมพนธกนระหวำงโหนด โดยแตละโหนดจะลดลนควำมส ำคญลงไป
วธกำรเรยนรเบยอยำงงำย (Naïve Bayes) หมำยถงกำรจ ำแนกประเภทโดยใชหลกสถตในกำรพยำกรณควำมนำจะเปนของสมำชก
คดจดกำรพเศษ (Special case management) หมำยถง คดทไมมควำมยงยำกซบซอนและมแนวโนมทจะพจำรณำใหแลวเสรจไดภำยในนดเดยวหรอในวนหนงสำมำรถพจำรณำคดใหแลวเสรจไดหลำยคด หรอ สำมำรถสงเอกสำรแทนกำรสบพยำนได
คดสำมญ (General special case) หมำยถงคดแพงหรอคดอำญำทมใชคดจดกำรพเศษหรอตองสบพยำนหลกฐำนของคควำมตอไปและไมสำมำรถนงพจำรณำคดเสรจไดภำยในเวลำอนรวดเรวรวมถงคดทศำลสงยอยส ำนวนใหศำลชนตนสบพยำนและพพำกษำคดใหม คดรอฟนคดอำญำ คดจ ำเลยถอนค ำใหกำรรบสำรภำพเปนใหกำรปฏเสธ คดแพงทจ ำเลยขำดนดค ำใหกำรและศำลอนญำตใหยนค ำใหกำรได หรอคดประเภทอนทผบรหำรศำลเหนสมควรใหด ำเนนกำรคดอยำงคดสำมญ
คดสำมญพเศษ (Special case) หมำยถง คดสำมญท มควำมยงยำกสลบซบซอน มพยำนหลกฐำนทจะตองน ำสบจ ำนวนมำก ไมสำมำรถนดสบตอเนองกนไปจนเสรจ จ ำเปนตองก ำหนดวนนดสบพยำนตอเนอง ชวงละ 2-4 วนเปนชวงๆ โดยก ำหนดใหแลวเสรจภำยใน 6 เดอนนบแตวนก ำหนดสบพยำน แตไมวำกรณใดๆ ตองไมเกน 1 ป นบแตวนก ำหนดสบพยำน โดยตองไดรบอนญำตจำกผบรหำรศำลชนตน
คดงำย (Easy) หมำยถง ประเภทคดทจดอยในประเภทคดทงำย ไมมควำมซบซอนในกำรพจำรณำพพำกษำอรรถคด
คดยำก (Difficulty) หมำยถง ประเภทคดทจดอยในประเภทคดทยำก มควำมซบซอนในกำรพจำรณำพพำกษำอรรถคด
DPU
บทท 2 แนวคด ทฤษฎ และงานวจยทเกยวของ
ในการศกษาคนควาหาเพอคนหารปแบบการเกดความสมพนธหรอตวแปรทมอยดวยเทคนคของเหมองขอมล ไดด าเนนการศกษา ทบทวนทฤษฏ แนวความคด และผลงานวจยทเกยวของกบการพฒนาโมเดล โดยด าเนนการรวบรวมขอมลทอาจจะเปนประโยชนตอการก าหนดแนวทางและระเบยบวธการวจย ซงไดแบงการศกษาออกเปน 5 กลมดวยกนคอ
1. ศาลยตธรรมและศาลจงหวดปทมธาน 2. ทฤษฎและแนวความคดทเปนพนฐานในการพฒนาตวโมเดลตนแบบ 3. ซอฟตแวรทใชในการศกษา 4. การวเคราะหและออกแบบระบบ 5. งานวจยทเกยวของ
2.1 ศาลยตธรรมและศาลจงหวดปทมธาน
ศาลยตธรรมตามพระธรรมนญศาลยตธรรม พ.ศ. 2543 มอยท วราชอาณาจกรระบบศาลยตธรรมสามารถแบงออกได เปน 3 ชน คอ ศาลชนตน ชนอทธรณ ชนฎกา รวมทงสน จ านวน 248 ศาล ทวราชอาณาจกร
ศาลชนตน ศาลชนตน เปนศาลซงรบค าฟอง หรอค ารองในชนเรมตนคดไมวาเปนคดแพง คด
ผบรโภค คดแรงงาน คดภาษอากร คดลมละลาย คดทรพยสนทางปญญาและการคาระหวางประเทศหรอคดอาญา โดยด าเนนกระบวนการตดสนชขาดเปนชนศาลแรก ทงมอ านาจด าเนนกระบวนพจารณาแทนศาลอทธรณและศาลฎกาในบางเรองดวย
ศาลชนตนทวราชอาณาจกรมจ านวนทงหมด 233 ศาล ประกอบดวยศาลตางๆดงน 1. ศาลชนตนพจารณาคดแพงและคดอาญาในกรงเทพมหานคร จ านวน 6 ศาล ประกอบดวย
กลมศาลแพง ไดแก ศาลแพง ศาลแพงกรงเทพใต ศาลแพงธนบร กลมศาลอาญา ไดแก ศาลอาญา ศาลอาญากรงเทพใต ศาลอาญาธนบร
DPU
6
2. ศาลจงหวดและศาลจงหวดสาขามจ านวน 114 ศาล ประกอบดวย ศาลจงหวดทตงอยในภาค 1-9 จ านวน 111 ศาล ศาลจงหวดสาขา จ านวน 3 ศาลสาขา
3. ศาลแขวง มจ านวน 26 ศาล ประกอบดวย ศาลแขวง จ านวน 26 ศาล
4. ศาลพเศษ (ศาลเยาวชนและครอบครว) มจ านวน 78 ศาลประกอบดวย ศาลเยาวชนและครอบครวกลาง จ านวน 1 ศาล ศาลเยาวชนและครอบครวสาขา (สาขามนบร) จ านวน 1 ศาลสาขา ศาลเยาวชนและครอบครวจงหวด จ านวน 76 ศาล
5. ศาลช านญพเศษ มจ านวน 13 ศาล ประกอบดวย ศาลแรงงานกลาง จ านวน 1 ศาล และศาลแรงงานภาค จ านวน 9 ศาล ศาลทรพยสนทางปญญาและการคาระหวางประเทศกลาง จ านวน 1 ศาล ศาลลมละลายกลาง จ านวน 1 ศาล ศาลภาษอากรกลาง จ านวน 1 ศาล ชนศาลอทธรณ เปนศาลทมอ านาจพจารณาพพากษาคดทอทธรณค าพพากษาหรอค าสงของศาลชนตน
ตามบทบญญตแหงกฎหมายวาดวยการอทธรณ รวมทงมหนาทในการพจารณาค าสงอนๆ เชนมค าสงเกยวกบการประกนตวในคดอาญาและ การขอทเลาการบงคบคดในคดแพง การพจารณาคดของศาลอทธรณมลกษณะเปนการตรวจสอบหรอทบทวน ในชนอทธรณประกอบดวยศาลอทธรณกลางจ านวน 1 ศาล และศาลอทธรณภาค 1-9 จ านวน 9 ศาล รวม 10 ศาล
ชนฎกา เปนศาลสงสดมอ านาจพจารณาพพากษาคดทอทธรณค าพพากษาหรอค าสงของศาล
อทธรณตามบทบญญตแหงกฎหมายวาดวยการฎกา และมอ านาจวนจฉยชขาดคดทศาลฎกามอ านาจวนจฉยไดตามกฎหมายเฉพาะ แตหากคดใดมปญหาส าคญไมวาจะเปนปญหาขอเทจหรอปญหาขอกฎหมาย ประธานศาลฎกาเหนวาควรให วนจฉยโดยทประชมใหญของศาลฎกาประธานศาลฎกามอ านาจสงใหน าปญหาดงกลาวเขาสการวนจฉยโดยทประชมใหญของศาลฎกา ศาลฎกามเพยงศาลเดยวตงอยทกรงเทพมหานคร
DPU
7
ประวตความเปนมาของศาลจงหวดปทมธาน ในป ร.ศ.117 (พ.ศ.2442) พระเจาบรมวงศเธอ กรมพระนเรศวรฤทธ ซงขณะนนด ารง
หลวงอารกษประชาราษฎร ขาหลวงรกษาการเมองปทมธานจดซอทดนบรเวณปากคลองรงสตประยรศกดแขวงเมองปทมธานซงเหนวาเปนทราษฎรไปมามากกวาบรเวณอน เพอใชเปนทสรางศาลากลางเมองปทมธานกบศาลส าหรบพจารณาคด แตการจดซอทดนครงนนมปญหา เพราะราษฎรชาวมอญเจาของท 6 ราย ไมยอมขายทให โดยอางวาไดอยอาศยมาแตสมยป ยา ตา ยาย และทงไดปลกตนไมผลไมลงในเนอทนนแลว เนองจากชาวมอญ 5 คน ในจ านวนนนเปนหมทหารเรอพระเจาบรมวงศเธอ กรมพระนเรศวรฤทธ จงมหนงสอทล ชแจงไปยงพระวรวงศเธอ กรมหมนปราบปรปกษ ผบญชาการกรมทหารเรอใหชวยชแจงแกชาวมอญหมทหารเรอซงอยในบงคบบญชาตามหนงสอ ลงวนท 12 กรกฎาคม รตนโกสนทรศก 117 ตอนหนงวา
“ หมอมฉนขอทลใหทรงทราบวา ทต าบลวดเทยนถวาย ปากคลองรงสฤษรมแมน านเปนทสมควรจะสรางทวาราชการเมองปทมธาน และศาลส าหรบเมอง เพราะจะไดท าทางรมคลองรงสตเขาหารถไฟนครราชสหมา อนจะเดนทางไดทงทางบกแลน า จงจ าตองตงทวาราชการเมองแลศาลต าบลน เมอราษฎรเจาของทไมตองการเงนจะตองการทโดยจะหาซอทโดยล าพงเปนการล าบาก ทหลวงทเมองปทมธานมอยรมแมน าเหมอนทราษฎรตงอยตามทจะตองการน หมอมฉนจะจดเปลยนใหได แลทงรอขลบานเรอนไปปลกใหมใหดวย เพอการส าเรจจะไดแลวไปไมขดของแกความเจรญของราชการ ขอทานไดทรงพระเมตตาโปรดใหเจาพนกงานชแจงแกเจาของทใหเปนการตกลงกน ”
การกอสรางทวาการเมองปทมธาน ศาลเมองปทมธานครงนนใชเวลาประมาณ 1 ป ไดมพธเปดเมอวนท 10 มกราคม รตนโกสนทรศก 118 (พ.ศ.2443) ตอมาพระบาทสมเดจพระมงกฎเกลาเจาอยหว ทรงพระกรณาโปรดเกลาฯใหเปลยนค าเรยก “เมอง” เปน “จงหวด” ศาลยตธรรมในหวเมองทวไปจงเปลยนจาก “ศาลเมอง” เปน “ศาลจงหวด” ดวย ดงน นตามประกาศกระทรวงยตธรรม ลงวนท 15 มถนายน พ.ศ.2459 ศาลเมองปทมธานจงเปลยนเรยกเปน “ศาลจงหวดปทมธาน” ตงแตนนมา
ในป พ.ศ.2461 ศาลากลางจงหวดปทมธานไดยายทตงใหมไปอย ณ บรเวณซงปจจบนใชเปนทวาการอ าเภอเมองปทมธาน ท าใหศาลจงหวดปทมธานกบศาลากลางจงหวดปทมธานตองอยไกลกน ปรากฏตามหนงสอของพระยาโบราณราชธานนทร อปราชมณฑล กรงเกาถงเสนาบดกระทรวงยตธรรม ท 45/3424 ลงวนท 10 มถนายน พ.ศ.2461 วาศาลจงหวดปทมธานเดมกบศาลากลางจงหวดปทมธานทยายไป อยหางไกลกนมากประมาร 100 เสนเศษ หนทางทจะไปมาถงกน ถาใชเรอแจวพายแลวตองใชเวลาราวชวโมงเศษ จงขอยายศาลจงหวดปทมธานไปปลกสราง ณ ทท า
DPU
8
การจงหวดใหม โดยใหสรางตอจากศาลากลางจงหวดปทมธานลงมาทางใต กระทรวงยตธรรมด ารแลวเหนชอบดวย
ทท าการศาลจงหวดปทมธานไดเรมเปดท าการในวนท 25 ตลาคม พ.ศ.2462 เวลา 11.00 น. หลงพธเปดมการพจารณาคดเรองคนรายลกทรพย จ าเลยใหการรบสารภาพ จงพพากษาคดเสรจไปในวนนน นอกจากการกอสรางทท าการศาลหลงใหมแลวยงไดสรางบานพกผพพากษา จาศาลดวยอกอยางละ 1 หลง ตงอยหลงทท าการศาลจงหวดปทมธาน
เมอ พ.ศ.2516 นางกฐน กยยกานนท และครอบครว ไดทลเกลาฯถวายทดนโฉนดท 5693 และโฉนดท 2651 บางสวนรวมเนอท 16 ไร อยรมถนนสายกรงเทพฯ-ปทมธาน ใหจงหวดปทมธานใชเปนทตงศาลกลางจงหวดปทมธาน ทางจงหวดจงขอใหศาลจงหวดปทมธานมาปลกสรางในบรเวณเดยวกนเพอจะไดเปนศนยราชการตอไป กระทรวงยตธรรมพจารณาแลวเหนชอบดวย ก าหนดแลวเสรจภายในวนท 22 ธนวาคม พ.ศ. 2520 ซงเปนทตงปจจบนของศาลจงหวดปทมธาน 2.2 ทฤษฎและแนวความคดทเปนพนฐานในการพฒนาตวโมเดลตนแบบ 2.2.1 นยาม ความหมายของเหมองขอมล
เหมองขอมล คอ กระบวนการคนหาสารสนเทศหรอขอความรทอยในฐานขอมลขนาดใหญทซบซอน เพอน าขอความรทไดไปใชประโยชนในการตดสนใจ สารสนเทศทไดอาจน ามาสรางการพยากรณหรอสรางตวแบบส าหรบการจ าแนกหนวยหรอกลม หรอแสดงความสมพนธระหวางหนวยงานตางๆ หรอใหขอสรปของสาระในฐานขอมล (สชาดา กระนนทน, 2545)
เหมองขอมล คอ เทคนคการสบคน ความ รบนฐานขอ มลขนาดใหญ (KDD: Knowledge discovery in database) เพอคนหารปแบบ (pattern) และความสมพนธ (Associations) ทซอนอยในชดขอมลนน (U.fayyad,G.piatetsky-shapiro and P.smyth,1997, pp.37-54)
การท าเหมองขอมล (Data Mining) คอการส ารวจและวเคราะหขอมลจ านวนมากใหอยในรปแบบทมความหมายและอยในรปของกฎโดยความสมพนธเหลาน แสดงใหเหนถงความรตางๆทม (ธนาคม จยสร และ เนองวงศ ทวยเจรญ, 2556, pp.879-882)
การท าเหมองขอมล คอ กระบวนการคนหาความรทเกบอยในฐานขอมลขนาดใหญ (สรธร เจรญรตน และชฏารตน พพฒนนนท, 2556, pp.131-151)
การท าเหมองขอมล หมายถง การส ารวจและวเคราะหขอมลทมขนาดใหญ เพอคนหารปแบบ (pattern) หรอกฎเกณฑ (Rule) ท แฝงอยในขอมลจ านวนมากน นและน าความ ร(Knowledge) ทคนพบไปใชประโยชน ในการพฒนาองคกร รวมถงเปนการคนหาความสมพนธ
DPU
9
(Relation) และแนวโนม (Trend) ของพฤตกรรมตางๆ โดยอาศยเทคนคการสรางแบบแผน เพอใหไดมาซงสารสนเทศทมประโยชนในดานตางๆ ตามทตองการมาใชสนบสนนการตดสนใจ (Pang-Ning Tan,Michael steinbanch,and Vipin kumar, 2006)
เหมองขอมล คอ การคนหาความสมพนธ และรปแบบทงหมด ซงมอยจรงในฐานขอมล แตไดถกซอนไวในขอมลจ านวนมาก เหมองขอมลจะท าการส ารวจวเคราะหขอมลดงกลาว เพอใหไดสารสนเทศทอยในรปแบบทเตมไปดวยความหมายและในรปของกฎสารสนเทศทไดแสดงใหเหนถงความรตางๆทมประโยชน มความถกตอง และสามารถน าไปใชไดจรง (ปณธ แกวสวสด, 2553, pp. 51-60)
เหมองขอมล คอกระบวนการสกดความรทนาสนใจจากขอมลปรมาณมาก ซงความรทได จากกระบวนการน เปนความรทไมปรากฏใหเหนเดนชด ความรทบงบอกเปนนย ความรทไมทราบมากอน ทมศกยภาพในการน าไปใชประโยชน (ชนวฒน ศรสอาน, 2550, p. 207)
โดยสรป เหมองขอมล เปนกระบวนการในการคนหาความสมพนธ คนหารปแบบ คนหาแนวโนม จากความรทเกบรวบรวมอยไวเปนจ านวนมาก โดยอาศยเทคนคตางๆ เพอน าความรทได มาสนบสนนกระบวนการตดสนใจ จากขอมลทไดเพอน าไปท านายผลลพธทคาดวาจะเกดขนภายในอนาคตอนใกล 2.2.2 เทคนคการวเคราะหขอมลดวยดาตา ไมนนง
เทคนคการวเคราะหขอมลดวยดาตาไมนนง นนสามารถจ าแนกได 2 ประเภทหลกๆดวยกนคอ
2.2.2.1 เทคนคการเรยนรแบบไมมผสอน (Unsupervised learning) เทคนคประเภทนจะเนนการพจารณาขอมลเปนหลก เชน พจารณาวาขอมลม
ความสมพนธกนในลกษณะใดไดบาง ซงเทคนคประเภทนสามารถแบงยอยไดอก คอ เทคนคการคนหากฎความสมพนธ (Association rule discovery) และการแบงกลมขอมล (Clustering)
2.2.2.2 เทคนคการเรยนรแบบมผสอน (Supervised learning) เทคนคในประเภทนจะเนนการเรยนรจากขอมลทมอยในอดต เพอน ามาสรางโมเดล
ส าหรบการท านายหรอคาดการณในสงทคาดวาจะเกดขนในอนาคต ซงโมเดลในทนอาจจะเปนสมการทางคณตศาสตร หรอกฎตางๆ ซงเทคนคการเรยนรประเภทนสามารถแบงยอยไดอก คอ การจ าแนกประเภทขอมล (Classification) และเทคนคการประมาณคาขอมล (Regression) ซงทงสองเทคนคนมลกษณะทคลายคลงกนมาก แตมความแตกตางกนทผลลพธทตองการท านาย ซงการจ าแนกประเภทขอมลการท านายขอมลทมคาเปน นอมนอล (Nominal) หรอ คาทไมใชตวเลข สวนการประมาณคาขอมลจะใชกบขอมลทเปนตวเลขเทานน
DPU
10
2.2.3 ประเภทขอมลทน ามาใชในวเคราะห โดยปกตแลวขอมลทสามารถน ามาวเคราะหไดจะตองเปนขอมลแบบมโครงสราง
(Structure data) หรออยในรปแบบของตาราง เชน ขอมลสมาชก หรอ ขอมลการซอขายสนคาตางๆ แตในปจจบนเรากาวเขาสยคของบก ดาตา (Big Data) ซงมขอมลจ านวนมหาศาล แตขอมลเหลานมกจะไมมโครงสราง (Unstructured Data) เชน ขอความตางๆทอยในรปของอเมล (E-mail) หรอเครอขายสงคมออนไลน (Social Network) ตางๆ ถาเราตองการน าขอมลทไมมโครงสรางมาด าเนนการวเคราะห เราตองท าการแปลงขอมลเหลานใหเปนขอมลทมโครงสรางกอน หรอแปลงใหอยในรปแบบของตารางกอนน าขอมลทไดไปด าเนนการวเคราะหตอไป
2.2.3.1 ขอมลแบบมโครงสราง (Structure data) ขอมลแบบมโครงสรางทวๆไปทเรามกจะพบเหนในรปแบบของตาราง เชน ขอมลท
เกบรายละเอยดของสมาชก หรอการซอขายสนคา โดยปกตขอมลเหลานจะเกบอยในไฟลประเภท Microsoft Word หรอ Microsoft Excel หรอในฐานขอมลตางๆ ซงในการวเคราะหขอมลโดยใชเทคนคเหมองขอมล สวนใหญน นเราจะเรยกขอมลแตละแถววา “ตวอยาง (Example)” หรอ “อนสแตนซ (Instance)” และเรยกขอมลแตละคอลมน วา “แอตทรบวต (Attribute)” และขอมลในตารางบรรทดทหนง คอชอของแตละแอตทบวตเสมอ
2.2.3.2 ขอมลแบบไมมโครงสราง (Unstructured data) ขอมลสวนใหญทพบ คอ ขอมลประเภทรปภาพ ขอความ ตางๆ ซงขอมลเหลานมก
ความส าคญ ดงนนถาเราจ าเปนตองขอมลประเภทเหลานไปใชงาน เราตองด าเนนการแปลงขอมลเหลานใหเปนขอมลทอยในรปแบบของตารางโดยใชกระบวนการแปลงขอมล (Data information)
DPU
11
2.2.4 ขนตอนการท าเหมองขอมล หรอ ขนตอนการคนหาความร
ภาพท 2.1 แสดงกระบวนการคนหาความรในการขดคนขอมล ทมา: Jiawei Han and Micheline Kamber. (2011, p.17)
ขนตอนการท าเหมองขอมล ประกอบไปดวยขนตอนหลกดงตอไปน 1. การท าความเขาใจปญหา (Problem Understanding) ในขนตอนนเปนการท าความ
เขาใจถงปญหาและสามารถระบปญหาหรอโอกาส จากนนท าการแปลงโจทยทได ใหอยในรปแบบทเหมาะสมตอการน ามาวเคราะหขอมลทางดาตาไมนนง
2. การท าความเขาใจขอมล (Data Understanding) ขนตอนนเรมจากกระบวนการเกบรวบรวมขอมล หลงจากน นจะด าเนนการตรวจสอบขอมลทไดรวบรวมไวเพอตรวจเชคความถกตองของขอมลรวมถงควรพจารณาดวยวาเปนขอมลทไดมาจากแหลงขอมลทถกตองและมความนาเชอถอ ประกอบกบขอมลทไดมปรมาณมากพอ มรายละเอยดเพยงพอตอการน าไปใชในการวเคราะห
3. การเตรยมขอมล (Data Preparation) เปนขนตอนทใชเวลานานทสด เนองจากโมเดลทไดจากการท าดาตาไมนนงจะใหผลลพทธทถกตองหรอไมนน ขนอยกบคณภาพของขอมลทใช กลาวคอถาขอมลทใชนนไมถกตอง มผดพลาด ยอมสะทอนถงผลลพธทได ซงอาจท าใหตความผลลพธไดคลาดเคลอนเชนกน โดยการเตรยมขอมลนน สามารถแบงออกไดเปน 3 ขนตอนยอยดงน
3.1 ท าการคดเลอกขอมล (Data Selection) เราควรก าหนดเปาหมายกอนวาเราจะท าการวเคราะหอะไร แลวจงเลอกใชเฉพาะขอมลทเกยวของกบสงทเราจะท าการวเคราะห
DPU
12
3.2 การกลนกรองขอมล (Data Cleaning) ในบางกรณอาจพบขอมลทไมถกตอง อนเนองมาจากปญหาในระหวางการจดเกบขอมล เชน การกรอกขอมลไมครบ กรอกขอมลซ าซอน ในขนตอนนเราจะท าการกรองขอมลทไมถกตองหรอซ าซอนออก หรออาจท าการซอมแซมขอมลทขาดหายไปดวยวธการบางอยาง
3.3 การแปลงรปขอมล (Data Transformation) เปนขนตอนการเตรยมขอมลใหอยในรปแบบทพรอมน าไปใชในการวเคราะหตามอลกอรทมของดาตาไมนนงทเลอกใช
4. การสรางตวแบบ (Modeling) เปนขนตอนการวเคราะหขอมลดวยเทคนคดาตาไมนนง ไดแก การสรางตวท านาย (prediction model) ในบางครงพบวามการน าเทคนคดาตาไมนนงหลายเทคนคมาใชในการวเคราะหขอมล เพอใหไดผลลพธทดทสด ดงนนเมอท าขนตอนนแลว อาจมการยอนกลบไปทข นตอน data preparation เพอแปลงขอมลบางสวนใหเหมาะสมกบแตละเทคนคดวย นอกจากนยงมการประเมนโมเดลวเคราะหขอมลทได ในรปแบบความถกตองของโมเดล เพอเปนตวบงชความนาเชอถอของโมเดลทได
5. การประเมนผล (Evaluation) ในขนตอนนเปนการประเมนประสทธภาพของผลลพธจากโมเดลวเคราะหขอมลวาครอบคลมและสามารถตอบโจทยทต งไวในขนตอนแรกหรอไม ในกรณทมการสรางโมเดลวเคราะหขอมลหลายโมเดล ในขนตอนนจะท าการประเมนแตละโมเดลดวยวา มสวนดสวนดอยอยางไร และควรเลอกใชโมเดลใด การท างานในสวนนตองอาศยทกษะในการวเคราะหขอมลเพอชวยใหการวเคราะหท าไดสะดวกและรวดเรวขน จงมการใชเครองมอทางดานกราฟฟก เชน การแสดงผลการวเคราะหดวยกราฟ รายงานรปแบบตางๆ หรอ Dashboard
6. การน าไปใชงาน (Deployment) เมอไดตวตนแบบหรอโมเดลหรอองคความรทไดจากการวเคราะหขอมลดวยเทคนคดาตาไมนนงทมความถกตองกสามารถน าตวตนแบบหรอโมเดลหรอองคความรไปใชงานและตรวจสอบวาบรรลเปาหมายทไดตงไวหรอไม 2.2.5. เทคนคในการท าเหมองขอมล สามารถแบงไดดงน
2.2.5.1 การจ าแนกประเภทขอมล (Classification) เทคนคการจ าแนกประเภทขอมลเปนกระบวนการสรางโมเดลจดการขอมลใหอยใน
กลมทก าหนดมาให จากกลมตวอยางขอมลทเรยกวาขอมลสอนระบบ (Training data) ทแตละแถวของขอมลประกอบดวยฟลดหรอแอตทรบวตจ านวนมาก แอตทรบวตนอาจเปนคาตอเนอง (continuous) หรอคากลม (categorical) โดยจะมแอตทรบวตแบง (classifying attribute) ซงเปนตวบงชคลาสของขอมล จดประสงคของการจ าแนกประเภทขอมลคอการสรางโมเดลการแยกแอตทร-บวตหนงโดยขนกบแอตทรบวตอน โมเดลทไดจากการจ าแนกประเภทขอมลจะท าใหสามารถพจารณาคลาสในขอมลทยงมไดแบงกลมในอนาคตได โดยมรปแบบการเขยนกฎจ าแนกไดดงน
DPU
13
P1, P2 ……….Pn Ci Pn = เงอนไขของกฎ Attribute Condition Class Ci = คลาสของกฎ หรอ
IF<Conditions> THEN <Class> “ถา<เงอนไข>แลว<คลาส>” ในขนตอนของการจ าแนกขอมลประกอบไปดวย 3 ขนตอน คอ ขนตอนท 1 การสรางตวแบบโมเดล เปนการน าชดขอมลฝกสอนใหระบบเกดการ
เรยนร ซงผลลพธทไดจะอยในรปของตวแบบโมเดล เชน โครงสรางตนไมตดสนใจ ขนตอนท 2 การทดสอบประสทธภาพของโมเดล เปนขนตอนทเราจะตองท าการวด
ประสทธภาพของโมเดลทไดสราง โดยการวดประสทธภาพของโมเดลสามารถแบงไดเปน ตววดประสทธภาพของโมเดลการจ าแนกประเภทขอมล โดยทวไปแลวจะมตววดท
นยมใช อย 4 คา ดงน 1. Precision เปนการวดความแมนย าของโมเดล โดยพจารณาแยกทละคลาส
Precision=True Positive
True Positive+False Positive
True Positive (TP) คอ จ านวนขอมลทท านายถกวาเปนคลาสซงก าลงสนใจอย False Positive (FP) คอ จ านวนขอมลทท านายผดมาเปนคลาสซงก าลงสนใจอย
2. Recall เปนการวดความถกตองของโมเดล โดยพจารณาแยกทละคลาส
Recall=True Positive
True Positive+False Negative
True Positive (TP) คอ จ านวนขอมลทท านายถกวาเปนคลาสซงก าลงสนใจอย False Negative (FN) คอ จ านวนขอมลทท านายผดมาเปนคลาสซงไมไดสนใจอย
DPU
14
3. F-measure เปนการวดคา Precision และ Recall พรอมกนของโมเดล โดยพจารณาแยกทละคลาส
F-measure=2×Precision×Recall
Precision+Recall
4. Accuracy เปนการวดความถกตองของโมเดล โดยพจารณารวมทกคลาส คอจ านวน
True Positive ของทกคลาสรวมกน การแบงขอมลเพอใชในการวดประสทธภาพของโมเดลการจ าแนกประเภทขอมล
เปนการแบงขอมลเพอมาทดสอบ แบงได 3 วธการใหญๆคอ 1. วธ Self-Consistency Test หรอเรยกวา Use Training set เปนวธทงายทสด เนองจาก
ขอมลทใชในการสรางโมเดลและขอมลทใชในการทดสอบโมเดลเปนขอมลชดเดยวกน 2. วธ Split Test เปนการแบงขอมลดวยการสมออกเปน 2 สวน เชน 70% ตอ 30% หรอ
80% ตอ 20% โดยขอมลสวนทหนงใชในการสรางโมเดล และขอมลสวนทสองใชในการทดสอบประสทธภาพของโมเดล
3. วธ Cross-Validation Test เปนวธทนยมใชในการทดสอบประสทธภาพของโมเดลเนองจากผลทไดมความนาเชอถอ การวดวธนจะท าการแบงขอมลออกเปนหลายสวน เชน 5-fold cross-validation คอการแบงขอมลออกเปน 5 สวน โดยทแตละสวนมจ านวนขอมลเทากน หลงจากนนขอมลสวนหนงจะใชเปนตวทดสอบประสทธภาพของโมเดล ท าวนเชนนไปจนครบจ านวนทแบงไว
ขนตอนท 3 การใชตวแบบโมเดล เพอการท านาย ซงเปนจดประสงคหลกทใชในการแกไขกบปญหา คอการสรางตวตนแบบ เมอมขอมลใหมเขามาสระบบจะสามารถท านายไดโดยการน าขอมลทไดรบมาท าการเปรยบเทยบกบตวตนแบบโมเดลทเราจ าแนกไดจากขนตอนท 1 เพอวเคราะห เพอตดสนใจในความเปนไปไดของขอมลนนๆ
การแบงกลมขอมลดวยวธ Decision Tree เปนโครงสรางทใชแสดงกฎทไดจากเทคนคการจ าแนกประเภทขอมล โดยตนไมชวย
ในการตดสนใจจะมลกษณะคลายกบโครงสรางตนไมทแตละโหนดแสดงคณลกษณะ (Attribute) แตละกงแสดงเงอนไขในการทดสอบและโหนดปลาย แสดงกลมทก าหนดไว
การแทนตนไมการตดสนใจ (Decision Tree Representation) 1. โหนดภายใน (internal node) คอคณสมบตตางๆของขอมล ซงเมอขอมลใดๆตลลง
มาทโหนด จะใชคณสมบตนเปนตวตดสนใจวาขอมลทไดจะไปในทศทางใด โดยโหนดภายในทเปนจดเรมตนของตนไมเราเรยกวาโหนดราก
DPU
15
2. กง (Branch, Link) เปนคาคณสมบตของคณสมบตในโหนดภายในทแตกกงนออกมา ซงโหลดภายในจะแตกกงเปนจ านวนเทากบคาคณสมบตของโหนดภายในนนๆ
3. โหนดใบ (Leaf node) คอกลมตางๆซงเปนผลลพธในการแยกแยะขอมล เทคนคการจ าแนกประเภทขอมลดวยวธ Decision Tree เปนวธการหนงทนยมใชกน
อยางแพรหลาย เนองจากเปนโมเดลทไดสามารถแปลความหมายและเขาใจไดงาย ซงจะใชขอมลดงตารางท 2.1 แสดงขอมลสภาพอากาศยอนหลง 14 วน มาด าเนนการศกษารปแบบ กระบวนการท างานของการจ าแนกประเภทขอมลดวยวธการสรางตนไมในการตดสนใจ ตารางท 2.1 แสดงขอมลสภาพอากาศยอนหลง 14 วน
Outlook Temperature Humidity Windy Play Sunny Hot High False No Sunny Hot High True No
Overcast Hot High False Yes Rainy Mild High False Yes Rainy Cool Normal False Yes Rainy Cool Normal True No
Overcast Cool Normal True Yes Sunny Mild High False No Sunny Mild Normal False Yes Rainy Mild Normal False Yes Sunny Mild Normal True Yes
Overcast Mild High True Yes Overcast Hot Normal False Yes
Rainy Mild High True No
DPU
16
Outlook
Yes WindyHumidity
Yes No Yes No
=Overcast=Sunny =Rainy
=high=normal =False =True
จากขอมลในตารางท 2.1 เราสามารถน ามาสรางเปนโครงสรางตนไมชวยในการตดสนใจ ดงน ภาพท 2.2 โมเดลโครงสรางตนไมตดสนใจ
เมอน าโมเดลโครงสรางตนไมตดสนใจ น าไปใชงานเราจะเรมพจารณาจากโหนดบนสด(Root node) เชน ถาแอตทรบวต Outlook มคาเปน Overcast แลวคลาส Play ค าตอบทไดเปน Yes และยงสามารถน ามาสรางเปนกฎ IF-THEN ได ดงน
IF Outlook=Overcast THEN play=yes IF Outlook=rainy AND Windy= TRUE THEN play=no IF Outlook=rainy AND Windy= FALSE THEN play=yes IF Outlook=sunny AND Humidity= high THEN play=no IF Outlook= sunny AND Humidity = normal THEN play=yes การจ าแนกประเภทขอมลดวยวธ Naïve Bayes การจ าแนกประเภทขอมลดวยวธ Naïve Bayes เปนอกวธหนงทไดรบความนยม
เนองจากเปนการสรางโมเดลทงายและไมซบซอน โดยจะอาศยทฤษฎความนาจะเปน (Probability) เปนหลก โดยสามารถแสดงสมการของความนาจะเปนไดดงน
P(A|B)=P(A∩B)
P(B)
DPU
17
โดยท P(A|B) คอ คา Conditional probability หรอคาความนาจะเปนทเกดเหตการณ B ขนกอนและจะมเหตการณ A ตามมา P(A∩B) คอ คา joint probability หรอคาความนาจะเปนทเหตการณ A และเหตการณ B เกดขนรวมกน P(B) คอ คาความนาจะเปนทเหตการณ B เกดขน
ในลกษณะเดยวกนเราจะเขยน P(B|A) หรอคาความนาจะเปนทเหตการณ A เกดขนกอนและเหตการณ B เกดขนตามมาทหลงไดเปน
P(B|A)=P(A∩B)
P(A)
จากสมการทง 2 แบบจะเหนวามคา P(A∩B) ทเหมอนกนอยดงนนเราสามารถเขยน
สมการของ P(A∩B) ไดเปนดงน P(A∩B)=P(A|B)×P(B)=P(B|A)×P(A)
P(B|A)=P(A|B)×P(B)
P(A)
จากสมการทไดเราเรยกวา Bayes theorem หรอทฤษฎของเบย สวนในการน าไปใชงาน จะขอเปลยนสญลกษณ A และ B ใหมใหเปน A และ C โดยท A คอ แอตทรบวต (attribute) และ C คอ คาคลาส (class) แสดงไดดงสมการ
P(C|A)=P(A|C)×P(C)
P(A)
จากสมการของ Bayes อธบายไดวา ถาตองการท านายคลาส C เมอเราทราบแอตทรบวต A แลวสามารถค านวณไดจาดความนาจะเปนของแอตทรบวต A ทมคลาส C ในเทรนนง ดาตา และคาความนาจะเปนของแอตทรบวต A และคลาส C เพอใหเขาใจงายจะแบงสมการของ Bayes ออกเปน 3 สวน คอ
(1) Posterior probability หรอ P (C|A) คอ คาความนาจะเปนทขอมลทมแอตทรบวตเปน A จะมคลาส C
(2) Likelihood หรอ P (A|C) คอ คาความนาจะเปนทขอมล training data ทมคลาส C และมแอตทรบวต A โดยท A = a1 ∩ a2 … ∩aMโดยท M คอจ านวนแอตทรบวตใน training data
(3) Prior probability หรอ P(C) คอ คาความนาจะเปนของคลาส C
DPU
18
แตการทแอตทรบวต A = a1 ∩a2 … ∩aM ทเกดขนใน training data อาจจะมจ านวนนอยมากหรอไมมรปแบบของแอตทรบวตแบบนเกดขนเลย ดงนนจงไดใชหลกการทวาแตละแอตทร-บวตเปน independent ตอกนท าใหสามารถเปลยนสมการ P(A|C) ไดเปน
P(A|C)=P(a1|C)×P(a2|C)×…×P(aM|C)
ซงในการค านวณเราสามารถค านวณแยกทละแอตทรบวตไดดงสมการขางลางน
P(C|A)=P(a1|C)×P(a2|C)×…×P(aM|C)×P(C)
จากสมการของ Bayes สามารถแสดงวธการค านวณโดยใชขอมลจากตารางท 2.1 ได
ดงตอไปน ตารางท 2.2 แสดงขอมลการค านวณจากโมเดลของ Naïve Bayes
Outlook Temperature Humidity Windy Play
Yes No Yes No Yes No Yes No Yes No Sunny 2 3 Hot 2 2 High 3 4 False 6 2 9 5 Overcast 4 0 Mild 4 2 Normal 6 1 True 3 3 Rainy 3 2 Cool 3 1
Sunny 2/9 3/5 Hot 2/9 2/5 High 3/9 4/5 False 6/9 2/5 9/14 5/14 Overcast 4/9 0/5 Mild 4/9 2/5 Normal 6/9 1/5 True 3/9 3/5 Rainy 3/9 2/5 Cool 3/9 1/5 ตารางท 2.3 แสดงขอมลสภาพอากาศในวนปจจบน ซงเรายงไมสามารถทราบคลาสค าตอบ
Outlook Temperature Humidity Windy Play
sunny hot high false ?
DPU
19
P(Play=yes|A)=P(Outlook=sunny|Play=yes)×P(Temperature=hot|Play=yes) ×P(Humidity=high|Play=yes)×P(Windy=false|Play=yes)×P(Play=yes) = (2/9) × (2/9) × (3/9) × (6/9) × (9/14) = 0.22 × 0.22 × 0.33 × 0.67 × 0.64
= 0.0068 P(Play=no|A)=P(Outlook=sunny|Play=no)×P(Temperature=hot|Play=no) ×P(Humidity=high|Play=no)×P(Windy=false|Play=no)×P(Play=no) = (3/5) × (2/5) × (4/5) × (2/5) × (5/14) = 0.6 × 0.4 × 0.8 × 0.4 × 0.36
= 0.0276 ดงนน ขอมลทเราท านายจากตารางท 2.11 โดยใชโมเดลของ Naïve bayes พบวาคลาส
Play=no เนองจาก คา (Play=no|A) = 0.0276 ซงมคามากกวา P(Play=yes|A) = 0.0068 2.3 ซอฟตแวรทใชในการศกษา 2.3.1 โปรแกรม WEKA
ค าวา Weka ยอมาจากค าวา Waikato Environment for Knowledge Analysis พฒนาขนโดยใชภาษา java และเปนซอฟตแวรเสรทอยภายใตขอตกลงของ GNU (General Public License) ซงภายในโปรแกรมจะมเมนใหเราเลอกใชงานดงภาพท 2.12
ภาพท 2.3 แสดงหนาตาง Weka GUI Chooser
DPU
20
Explorer เปนสวนทผ ใชสามารถใชฟงกชนการท างานตางๆ ของ Weka ผานทางหนาจอ GUI ซงเปนสวนทเหมาะส าหรบผทเรมตนใชงาน Weka เพราะผใชจะสามารถเรยกฟงกชนการท างานตางๆ ไดเพยงแคคลกและเปลยนแปลงพารามเตอรในหนาฟอรมเทานน
Experimenter เปน GUI ทยอมใหผใชสามารถเปลยนแปลงเทคนคในการวเคราะหขอมลและคาพารามเตอรตางๆ ทเกยวของไดหลากหลายรปแบบ จนไดผลลพธทนาพอใจ ซงการใช Explorer นนไมสะดวกเนองจากตองมาท าการเปลยนแปลงคาตางๆ
Knowledge Flow เปน GUI อกสวนหนงทยอมใหผใชสามารถน าเทคนคตางๆ ของ Weka มาเรยงตอกนเพอชวยใหการวเคราะหขอมลใหท างานไดตามทตองการ
Simple CLI เปนสวนทผใชสามารถเรยกฟงกชนการท างานของ Weka มาใชผานทาง command line ได ซงการเรยกใชฟงกชนผานทาง command line นจะชวยใหผใชเขาใจการเรยกฟงกชนตางๆเบองหลงหนาจอ GUI ของ Weka ไดและสามารถน าไปประยกตใชในการเขยนโปรแกรมเพอเรยก Weka ในการใชงานไดอกดวย
ในสวนนจะน าเสนอหนาตางในสวนของ Explorer เปนหลกโดยในหนาตาง Weka Explorer สามารถแบงพนทไดดงน
ภาพท 2.4 เมนหลกในหนาตาง Weka Explorer
DPU
21
สวนบนสดจะเปนแทบ (tab) ซงมดวยกนทงหมด 6 แทบวางเรยงกนอยทางดานบน ซงแทบตางๆ เหลานจะเปนเมนใหผใชสามารถใชงานเทคนคตางๆ ของ Weka ได
สวนทอยตรงกลางซงจะเปลยนไปตามการกดแทบตางๆ สวนนเปนสวนของการเลอก option ตางๆ ในการวเคราะหขอมล และสวนการแสดงผลลพธหลงจากท าการวเคราะหขอมลเสรจ สวนนบางครงจะเรยกวา Workspace
สวนทอยดานลางสด จะเปนสวนทบอกสถานะ (status) ของการท างานในแตละขนตอน และป มทางขวามอจะเปนป มส าหรบด Log ไฟล เมอคลกจะแสดงหนาจอของ log ขนมา 2.3.2 ภาษา PHP
PHP เปนชอยอของภาษาโปรแกรมมงชนดหนงทมชอวา “Professional Home pages” แตในปจจบนภาษาชนดนถกพฒนาตอมาจนกลายเปนภาษาโปรแกรมมงชนดใหมทมชอเรยกวา “Personal Hypertext Processor: PHP” ภาษาชนดใหมนเปนท นยมในการน ามาพฒนาใชเขยนสครปต (ชดค าสงควบคมการท างานของโปรแกรม ซงมความยาวไมมากนกและสามารถท างานไดดกบเวบไซต) PHP เปนภาษาสครปตทเปน Server Side Scrip และเปน Open Source ทผใชทวไปสามารถ Download Source Code ไดฟร จดประสงคทส าคญของภาษา PHP คอการชวยใหนกพฒนาเวบเพจสามารถเขยนเวบเพจทเปนแบบไดนามคไดอยางรวดเรว ภาษา PHP จะท างานรวมกนกบเอกสาร HTML โดยการสรางโคดแทรกระหวาง Tag HTML และสรางเปนไฟลทมนามสกล .php .php3 หรอ php4 และไวยากรณทใชใน PHP เปนการน ารปแบบของภาษาตางๆมารวมกน เชน ภาษา C Perl และ Java ท าใหผใชทมพนฐานของภาษาเหลานสามารถใชงานได
เนองจาก PHP จะท างานโดยมตวแปลและเอกซควตทฝงเซรฟเวอรอาจจะเรยกการท างานวาเปนเซรฟเวอรไซด (Server Side) สวนการท างานของบราวเซอรของผใชเรยนวาไคลเอนไซด (Client Side) โดยการท างานจะเรมตวทผใชสงความตองการผานเวบบราวเซอรทาง HTTP (HTTP Request) ซงอาจเปนการกรอกแบบฟอรม หรอใสขอมลทตองการ หรอแสดงโดยเรยกเอกสาร PHP (เอกสารนจะมสวนขยายเปน php) เชน test.php เมอเอกสาร PHP เขามาถงเวบเซรฟเวอรกจะถกสงตอไปให PHP Interpreter เพอท าหนาทแปลค าสงแลวเอกซควตค าสงตามบรรทดทระบบค าสงนนๆ จากนน PHP จะสรางผลลพธในรปแบบเอกสาร HTML สงกลบไปใหเวบเซรฟเวอรเพอสงตอไปใหบราวเซอรแสดงผลทางฝงผใชตอไป (HTTP Response) ดงรปท 2.5ตามกระบวนการดงน
1. จากไคลเอนตจะเรยกไฟล php script ผานทางโปรแกรมบราวเซอร (Internet Explore)
2. บราวเซอรจะสงค ารอง (Request) ไปยงเวบเซรฟเวอรผานทางเครอขายอนเทอรเนต
DPU
22
3. เมอเวบเซรฟเวอรรบค ารองขอจากบราวเซอรแลวกจะน าสครปต php ทเกบอยในเซรฟเวอรมาประมวลผลดวยโปรแกรมแปลภาษา PHP ทเปน อนเตอรพรเตอร
4. กรณท php script มการเรยกใชขอมลกจะตดตอกบฐานขอมลตาง ๆ ผานทาง ODBC Connection ถาเปน ฐานขอ มลก ลม Microsoft SQL Server, Microsoft Access, FoxPro ห รอใช Function Connection ท มอยใน PHP Library ในการเชอมตอฐานขอมลเพอดงขอมลออกมา หลงจากแปลสครปต PHP เสรจแลวจะไดรบไฟล HTML ใหมทมแตแทกซ HTML ไปยง Web Service
5. Web Service สงไฟล HTML ทไดผานการแปลแลวกลบไปยงบราวเซอรทรองขอผานทางเครอขายอนเตอรเนต
6. บราวเซอรรบไฟล HTML ทเวบเซรฟเวอรสงมาใหแปล HTML แสดงผลออกมาทางจอภาพเปนเวบเพจ โดยใชตวแปลภาษา HTML ทอยในบราวเซอรซงเปนอนเตอรพรเตอรเชนเดยวกน
ภาพท 2.5 แสดงขนตอนการท างาน PHP Script Request/Response
DPU
23
ความสามารถของภาษา PHP ภาษา PHP เปนภาษาทพฒนาขนจากพนฐานของภาษาโปรแกรมมงชนดอนๆ เชน C,
C++และ Perl ท าใหมลกษณะเดนของภาษาตนแบบแตละชนดรวมกนอย ความสามารถของภาษา PHPทเหนไดอยางเดนชด สามารถจ าแนกออกไดดงน
เปนภาษาทท าความเขาใจและใชงานงายไมเหมอนกบ JAVA หรอ C++ และมสวนทสนบสนนการท างานไดกบทกเวบไซต
เปน Open Source ผใชสามารถดาวนโหลด และน า source code ของ PHP ไปใชไดโดยไมเสยคาใชจาย
เปนสครปตแบบเซรฟเวอรไซดดงน นจงท างานบนเวบเซรฟเวอรไมสงผลกบการท างานของเครองไคลเอนตโดย PHP จะอานโคด และท างานทเซรฟเวอรจากนนจงสงผลลพธทไดจากการประมวลผลมาทเครองของผใชในรปแบบของเอกสาร HTML ซงอานโคดของ PHP ผใชไมสามารถมองเหนได
PHP สามารถท างานไดในระบบปฏบตการทตางชนดกน เชน Unix, Windows,Mac, OS หรอ Risc OS อยางดประสทธภาพเนองมาจาก PHP เปนสรปตทตองท างานบนเซรฟเวอรดงนนคอมพวเตอรทใช ส าหรบเรยกค าสง PHP จงจ าเปนตองตดตงโปรแกรมประเภทเวบเซรฟเวอรไวดวยเพอใหสามารถประมวลผล PHP ไดซงเปนเหตผลทท าให PHP สมารถท างานไดกบหลายระบบปฏบตการหลายชนด
PHP สามารถท างานไดในเวบเซรฟเวอรหลายชนด เชน Personal Web Server (PWS), Apache, OmniHttpd, Microsoft Internet Information Server (IIS) เปนตน
สนบสนนการเขยนสรปตทใชหลกของ Object Orientation PHP สามารถสรางเวบไซตทบรรจขอมลรปแบบตาง ๆ ลงในเวบ เชน รปภาพ ไฟล
PDF หรอ Flash Movie คณสมบตทส าคญอกประการหนงของ PHP คอความสามารถในการท างานรวมกบ
ระบบจดการฐานขอมลทหลากหลายซงระบบการจดการฐานขอมลทสนบสนนการท างานของ PHP มตวอยางดงน
1) ช น ด ORACLE เช น Oracle (OC17 and OC18), AdabasD, Ingres, FilePro (read-only) และ Solid
2) ชนด Access เชน dBase, InterBase, Ovrimos Empress และ FrontBase 3) ชนด SQL เชน MS SQL, PostgreSQL, mSQLและMySQL
DPU
24
PHP อนญาตใหผใชสรางเวบไซตซงท างานผานโปรโตคอล (Protocol) ชนดตางๆ ไดเชน LDAP, IMAP, SNMP, NNTP, POP3, HTTP และ COM (ส าหรบ Windows)
ผ ใชสามารถเขยนโคด PHP และอานขอมลในรปแบบของ Extensible Markup Language (XML) ได 2.3.3 ระบบจดการฐานขอมล MySQL
MySQL (อานวา “มาย-เอส-คว-แอล”) จดเปนระบบจดการฐานขอมลเชงสมพนธ (RDBMS: Relational Database Management System) ซงเปนท นยมกนมากในปจจบน เพราะวา MySQL เปนฟรแวรทางดานฐานขอมลทมประสทธภาพสง และเปนทางเลอกใหมจากผลตภณฑระบบจดการฐานขอมลในปจจบน ผทเคยใช MySQL ตางยอมรบในความสามารถ ความรวดเรวการรองรบจ านวนผ ใชและขนาดของขอมลจ านวนมหาศาล ท งยงสนบสนนการใชงานบนระบบปฏบตการมากมาย ไมวาจะเปน Unix, OS/2, Mac OS หรอWindows นอกจากน MySQL ยงสามารถใชงาน รวมกบ Web Development Platform ท งหลาย เชน C, C++, Java, Perl, PHP, Python, Tcl หรอ ASP
สถาปตยกรรมของ MySQL สถาปตยกรรม หรอ โครงสรางภายในของ MySQL กคอ การออกแบบการท างานใน
ลกษณะของ Client/Server ซงประกอบดวยสวนหลกๆ 2 สวน คอ สวนของผใหบรการ (Server) และ สวนของผใชบรการ (Client) โดยในแตละสวนจะมโปรแกรมส าหรบการท างานตามหนาทของตน
สวนของผใหบรการ หรอ Server จะเปนสวนทท าหนาทบรหารจดการระบบฐานขอมลในทนกหมายถงตว MySQL Server นนเองและเปนทจดเกบขอมลทงหมดขอมลทเกบไวนมขอมลทจ าเปนส าหรบการท างานกบระบบฐานขอมลและขอมลทเกดจากการทผใชแตละคนสรางขนมา
สวนของผใชบรการ หรอ Client กคอผใชนนเอง โดยโปรแกรมส าหรบใชงานในสวนนไดแก MySQL Client, Access, Web Development Platform ตางๆ (เชน Java, Perl, PHP, ASP)
หลกการท างานในลกษณะ Client/ Server มดงน 1. ทฝงของ Server จะมโปรแกรมหรอระบบส าหรบจดการฐานขอมลท างานรออย เพอ
เตรยมหรอรอคอยการรองขอการใชบรการจาก Client 2. เมอมการรองขอการใชบรการเขามา Server จะท าการตรวจสอบตามวธการของตน
เชน อาจจะมการใหผใชบรการระบชอและรหสผาน และส าหรบ MySQL สามารถก าหนดไดวาจะอนญาตหรอปฏเสธ Client ใดๆ ในระบบทจะเขาใชบรการอกดวย
DPU
25
3. ถาผานการตรวจสอบ Server กจะอนมตการใหบรการแก Client ทรองขอการใชบรการนนๆ ตอไปและถาในกรณทไมไดรบการอนมต Server กจะสงขาวสารความผดพลาดแจงกลบไปท Client ทรองขอการใชบรการนน
เครองคอมพวเตอรทท าหนาทเปน Client หรอ Server อาจจะอยบนเครองเดยวกน หรอแยกเครองกนกไดทงนขนอยกบลกษณะการท างาน หรอการก าหนดของผบรหารระบบ ตามปกตถาเปนการท างานลกษณะ Web-based มการใชฐานขอมลขนาดไมใหญนกตว MySQL Server และ Client มกจะมอยบนเครองเดยวกน โดยเครองคอมพวเตอรดงกลาวจะตองมทรพยากรเพอการท างาน เชน เนอทฮารดดสก , RAM มากพอสมควร แตส าหรบการท างานจรง (Real-world Application) กมกจะแยก Client และ Server ออกเปนคนละเครองกน และสามารถรองรบงานไดดมากกวา 2.3.4 โปรแกรม Adobe Dreamweaver CS5
Adobe Dreamweaver CS5 เปนโปรแกรมส าเรจรปทใชส าหรบการพฒนาเวบไซต โดยมคณสมบตในการออกแบบและสรางเวบเพจ จนถงการพฒนาแอพลเคชนเบองตน ซงในโปรแกรมตวนมเครองมอส าหรบการวางขอความ ภาพกราฟก ตาราง แบบฟอรม พรอมทงมลตมเดยตางๆ เพอแสดงใหผพฒนาเวบไซตใชงานไดงาย โดยไมตองรจกภาษา HTML, JavaScript, CSS หรอภาษาสครปตอนๆ ซงเมอออกแบบและพฒนาเวบไซตในโปรแกรม แลวน ามาแสดงผลทางบราวเซอรกจะเหนเปนลกษณะทไดจดวางไว หรอจะเรยกอกอยางวา What You See Is What You Get (WYSIWYG)
เรมตนใชงาน Dreamweaver การเรยกเปดโปรแกรม Dreamweaver ขนมาใชงานมขนตอนดงน 1.คลก All Programs > Adobe Web Premium CS5 >Adobe Dreamweaver CS5 2.จะเขาสหนาจอโปรแกรม
DPU
26
ภาพท 2.6 แสดงขนตอนการเขาสโปรแกรม Adobe Dreamweaver CS5 Welcome Screen
Welcome Screen เปนเครองมอสาหรบชวยเลอกขนตอนเรมตนในการใชงานโปรแกรมโดยตวเลอกจะแบงออกเปนกลมๆดงภาพตอไปน
Open a Recent Item เปดไฟลทเคยใช โดยคลกเลอกจากรายชอทแสดงอย (เรยงลาดบจากทเคยเปดหลงสดเปนตนไปหรอคลก Open เพอเปดไฟลอนๆ
Create New สรางไฟลใหม โดยถาคลก HTML จะเปนการสรางเวบเพจพนฐานแตถาคลกหวขออนจะเปนการสรางเวบเพจหรอไฟลตามชนดนนๆ
Top Features (videos) เปนเสนทางลดสาหรบเขาดรายละเอยดและเทคนคในการใชงานตาง ๆ ของโปรแกรมผานทางเวบไซตของ Adobe
DPU
27
ภาพท 2.7 สวนประกอบของ Welcome Screen ภาพท 2.8 สวนประกอบของหนาจอโปรแกรม
DPU
28
2.4 การวเคราะหและออกแบบระบบ วงจรการพฒนาระบบ (System Development Life Cycle :SDLC) คอกระบวนการหรอ
วงจรในการพฒนาระบบดานคอมพวเตอรหรอระบบสารสนเทศ โดยแปลจากความตองการของผใชงานมาเปนในรปของแอพพลเคชน โดยมการก าหนดกจกรรมตางๆทเกดขนในแตละระยะของการพฒนาระบบขนอยางชดเจนตงแตระยะเรมแรกไปจนถงหลงระยะสนสดการพฒนาระบบมอยดวยกน 7 ขน ดวยกน คอ
1. การก าหนดปญหา (Problem Definition) สรปขนตอนของระยะการก าหนดปญหา รบรสภาพของปญหาทเกดขน คนหาตนเหตของปญหา รวบรวมปญหาของระบบงานเดม ศกษาความเปนไปไดของโครงการพฒนาระบบ จดเตรยมทมงาน และก าหนดเวลาในการท าโครงการ ลงมอด าเนนการ
2. วเคราะห (Analysis) สรปขนตอนของระยะการวเคราะห วเคราะหระบบงานปจจบน การก าหนดความตองการ หรอเปาหมายของระบบใหม วเคราะหความตองการเพอสรปเปนขอก าหนด สรางแผนภาพ DFD และแผนภาพภาพ E – R
3. ออกแบบ (Design) สรปขนตอนของระยะการออกแบบ พจารณาแนวทางในการพฒนาระบบ ออกแบบสถาปตยกรรมระบบ ออกแบบรายงาน ออกแบบหนาจออนพตขอมล ออกแบบผงงานระบบ ออกแบบฐานขอมล การสรางตนแบบ การออกแบบโปรแกรม
4.การพฒนา (Development) สรปขนตอนของระยะการพฒนา พฒนาโปรแกรม เลอกภาษาโปรแกรมทเหมาะสม สามารถน าเครองมอมาชวยพฒนาโปรแกรมได
DPU
29
5. การทดสอบ (Testing) สรปขนตอนของระยะการพฒนา ทดสอบไวยากรณภาษาคอมพวเตอร ทดสอบความถกตองของผลลพธทได ทดสอบวาระบบทพฒนาตรงตามความตองการของผใชหรอไม สรางเอกสารประกอบโปรแกรม
6. การน าระบบไปใช (Implementation Phase) หรอ Installation สรปขนตอนของระยะการน าระบบไปใช ศกษาสภาพแวดลอมของพนทกอนทจะน าระบบไปตดตง ตดตงระบบใหเปนไปตามสถาปตยกรรมระบบทออกแบบไว จดท าคมอระบบ ฝกอบรมผใช ด าเนนการใชระยะงานใหม ประเมนผลการใชงานของระบบใหม
7. การบ ารงรกษา (Maintenance) สรปขนตอนของระยะการบ ารงรกษา กรณเกดขอผดพลาดขนจากระบบ ใหด าเนนการแกไขใหถกตอง อาจจ าเปนตองเขยนโปรแกรมเพม กรณทผใชมความตองการเพมเตม วางแผนรองรบเหตการณทอาจเกดขนในอนาคต บ ารงรกษาระบบงาน และอปกรณ
ภาพท 2.9 แสดงวงจรการพฒนาระบบ System Development Life Cycle :SDLC
DPU
30
2.5 งานวจยทเกยวของ 2 .5.1 ง าน วจย เรอ ง Using Data Mining technique to select the law and article for lawsuits โดยธระวฒน พงษศรปรดาและกฤษณะ ไวยมย
งานวจยนไดน าเสนอเทคนค Data Classification มาใชสรางระบบจดสรรกฎหมายทเหมาะสมใหกบคดความแบบอตโนมต ซงผลการทดลองทไดยงไมเปนทนาพอใจ ซงสามารถสรปได ดงน
ประเดนท 1 การตดค าในขนตอนการเตรยมขอมลยงขาดประสทธภาพ ท าใหผลการท านายของระบบมความถกตองนอยมากหรออยในระดบต า
ประเดนท 2 ระบบไมสามารถท านายกฎหมายใหกบคดความไดครงละมากกวาหนงกฎหมาย
ประเดนท 3 ระบบไมสามารถท านายกฎหมายแบบมล าดบชนในเวลาเดยวกนได 2.5.2 งานวจยเรอง การจดสรรกฎหมายทเหมาะสมใหกบคดความอตโนมตโดยธระวฒน พงษศรปรดา ภาควชาวศวกรรมคอมพวเตอร คณะวศวกรรมศาสตร มหาวทยาลยเกษตรศาสตร
งานวจยนไดน าเสนอเทคนค การตดค าโดยใชเทคนค Suffix Array เพอท าการสรางพจนานกรมวลข นมาใชงาน แลวสรางตวท านายผลกฎหมายโดยใชเทคนค Association Rule Discovery มาใชรวมกบเทคนค Data Classification ซงการจ าแนกประเภทขอมลใหความแมนย าในการท านายสง เนองจากไดน าเทคนคการหากฎความสมพนธเขามารวมกบเทคนคการจ าแนกประเภทขอมล แต เนองจากวธการท านายของเทคนคดงกลาวไดพจารณาเพยงเฉพาะกฎความสมพนธเดยวในการท านาย ซงอาจจะท าใหเกดความผดพลาดได ซงผลจากการทดสอบระบบนนสามารถจ าแนกขอดและขอเสย ไดดงตอไปน
ขอด (1) สามารถท านายกฎหมายใหกบคดความแบบอตโนมตได (2) สามารถท านายกฎหมายไดครบทกมาตรา (3) สามารถระบจ านวนมาตราทตองการเพอใหระบบสามารถท านายได ขอเสย (1) ตองแยกกฎเกณฑส าหรบการท านายผลออกเปน 2 ระดบ คอ ระดบกฎหมายและ
ระดบมาตรา (2) รอยละของความถกตองทไดจากระบบนนยงไมสงมากพอ
2.5.3 งานวจย เรองการวนจฉยคดดวยเทคนคตนไมตดสนใจ โดย ชดชยแกวตา และอจฉรา มหาวรวฒน ภาควชาเทคโนโลยสารสนเทศ คณะวทยาศาสตร มหาวทยาลยอบลราชธาน
DPU
31
งานวจยนไดน าเสนอการวนจฉยคดดวยเทคนคตนไมตดสนใจ โดยกลาวถงปญหาในการวนจฉยคด ซงถาไมมความช านาญกจะท าใหเกดความยากล าบากในการวนจฉยคด รวมถงการคนหาตวบทกฎหมายมาสนบสนนในการวนจฉยคด ซงงานวจยชนนไดน าเสนอวธการวนจฉยคดโดยประยกตใชเทคนคตนไมในการตดสนใจเพอจ าแนกความถกผด ซงสามารถอธบายไดโดยชดคณลกษณะของขอมล ออกเปนรายมาตราทเหมาะสมกบคดความน นๆและเปรยบเทยบความถกตองของการจ าแนกขอมลดวยขนตอนวธ ID3 และ C4.5 โดยวดประสทธภาพตวแบบในการท านายดวยวธ K-fold Cross Validation จากการวนจฉยพบวาขนตอนวธ C4.5 ใหคาความถกตองสงกวาขนตอนวธ ID3 2.5.4 งานวจยเรอง การใชเทคนคการท าเหมองขอมล (Data Mining) เพอพฒนาคณภาพการศกษาคณะวศวกรรมศาสตร โดยกฤษณะ ไวยมย ชดชนก สงศร และธนาวนท รกธรรมานนท อาจารยประจ าคณะวศวกรรมศาสตร คณะวศวกรรมศาสตร มหาวทยาลยเกษตรศาสตร และนสตปรญญาโทวศวกรรมคอมพวเตอร คณะวศวกรรมศาสตร มหาวทยาลยเกษตรศาสตร Published in NECTEC Technical Journal Vol.III, No. 11 page 134-142
งานวจยน ไดน าเสนอเทคนคตางๆทส าคญของการท าเหมองขอมลมาประยกตใชในการสบคนสงทนาสนใจจากขอมลนสตคณะวศวกรรมศาสตร มหาวทยาลยเกษตรศาสตร โดยใชเทคนคทส าคญ 3 เทคนค คอ กฎความสมพนธ (Association rule discovery) เทคนคการจ าแนกขอมล (Data Classification) การพยากรณขอมล (Data Prediction) มาประยกตในการชวยนสตเลอกสาขาทเหมาะสม และสามารถท านายเกรดแตละรายวชาในภาคการศกษาตอไป โดยใชตนไมในการตดสนใจ (Decision tree) ของการจ าแนกขอมล ในการสรางตวตนแบบโมเดล (Model)
ขอด สามารถท านายสาขาวชาทเหมาะสมทสดใหกบนกศกษาได ขอเสย ตวแบบโมเดล(Model) จะท านายแนวโนมเอยงไปทางสาขาวชาท มจ านวนนสต
นกศกษามากเปนผลท าใหความถกตองของโมเดลทไดคอนขางต า จากขอเสยของโมเดลนน ผวจยจงไดใชเทคนคการคนหากฎความสมพนธมาชวยใน
การท านายแนวโนมเกรด โดยหาความสมพนธของผลการเรยนในแตละสาขาวชาทสงผลตอกน ท าใหทราบไดวาวชาใดบางทมผลตอวชาทตองการท านายเกรดลวงหนา โดยไดก าหนดคาสนบสนนต าสด (Minimum support) และคาความมนใจต าสด (Minimum confidence) เพอใชในการหาความสมพนธทไดจากนสตจ านวนมาก ท าใหสนบสนนโมเดลมความนาเชอถอเปนทนาพอใจ โดย
DPU
32
มเปอรเซนตความถกตองคอนขางสงและมปญหาบางประการไดแก การจ าแนกขอมลในบางสาขาวชามปรมาณนอยท าใหโมเดลตวตนแบบทไดไมมความแมนย าเทาทควร 2.5.5 งานวจยเรอง การวดประสทธภาพของขนตอนวธ ตวจ าแนก C4.5, ADTree และNaïve Bayes ในการจ าแนกขอมลการซกซอนสงเสพยตดส าหรบไปรษณยระหวางประเทศ โดยสทธโชค มกดาสกลภบาล นสตปรญญาโทสาขาวทยาการคอมพวเตอร ภาควชาวทยาการคอมพวเตอร คณะวทยาศาสตร มหาวทยาลยเกษตรศาสตร
งานวจยฉบบนไดน าเสนอการวดความแมนย าและประสทธภาพดานความเรวของตวจ าแนก 3 ชนด คอ C4.5, ADTree และ Naïve Bayes เพอน าไปใชงานในการตรวจสอบสงของซกซอนสงเสพยตดส าหรบไปรษณยระหวางประเทศ ของเจาหนาทศลกากร โดยไดใชขอมลเกาๆทเจาหนาทไดจดเกบ และยงใชวธการเกบขอมลใหมทสมเกบเพมเตมจากเจาหนาท เพอใหไดปรมาณขอมลทเพยงพอ โดยใชวธการทดสอบกบตวจ าแนกทง 3 ชนด โดยท าการประเมนในแงของคาความแมนย า คาสวนเบยงเบนมาตรฐาน และระยะเวลา และขอมลทจะน ามาท าการวดผลมทงขอมลทเปนสองฉลาก และหลายฉลาก
ผลลพธจากการศกษาวจยพบวาตวจ าแนกแตละตวมขอดและขอเสยทแตกตางกน ซงในแงของความถกตอง โดยรวมพบวา ADTree สามารถท างานไดด แตในดานความเรวในการท างานพบวา ADTree ใชเวลาในการประมวลผลนานสดจากตวจ าแนกทงสาม ซงพบวา Naïve Bayes และ C4.5 ใชเวลาในการประมวลผลทใกลเคยงกน และ C4.5 มความสามารถทท านายขอมลไดดทสด
DPU
บทท 3 ระเบยบวธวจย
3.1 ขนตอนการศกษาคนควา
ในบทนเปนการอธบายถงวธในการด าเนนการศกษาคนควา และมสวนประกอบทจ าเปนในการศกษาหลายสวน โดยประกอบไปดวยขนตอนการด าเนนงานดงน
(1) การศกษาและรวบรวมขอมล ในสวนของการศกษาและรวบรวมขอมล ผศกษาไดด าเนนการศกษาโครงสรางของ
ฐานขอมลจรงจากโปรแกรมระบบจดการฐานขอมล Microsoft SQL Server 2005 ทไดใชงานจรงรวมถงรวบรวมขอมลตางๆทมความเกยงของกบการใชงานในการศกษาคนควาครงน เชน รวบรวมขอมลงานวจย งานศกษาคนควา จากผมประสบการณ
(2) การเตรยมขอมล หลงจากทไดศกษาและรวบรวมขอมล ในขนตอนนจะตองมการจดเตรยมขอมลและ
คดเลอกขอมลทจะน ามาใชงาน เนองจากขอมลทเราจ าลองขนมานนยงไมสามารถน าไปใชงานได ตองผานกระบวนการทดสอบและวเคราะหดวยเครองมอของการท าเหมองขอมล จงตองมการจดเตรยมขอมลใหเปนไปตามมาตรฐานเดยวกน และคดเลอกขอมลทมความถกตอง สมบรณมากทสด เพอใหไดผลการทดสอบทมประสทธภาพสงสด
(3) การก าหนดคณลกษณะ (Attribute) และคาทเปนไปไดของคณลกษณะ จากการศกษาโครงสรางของฐานขอมลจรง และการจดเตรยมขอมลน น เราจะได
คณลกษณะทคาดวาจะน ามาใชงานเพอใชในการหาความร และไดมการก าหนดคาทเปนไปไดของคณลกษณะ
(4) การแปลงขอมลส าหรบการประมวลผล ในสวนของการแปลงขอมลส าหรบการประมวลผลนน พบวากอนทจะด าเนนการ
แปลง เราตองมการโอนยายขอมล (Data Transfer) การลดขนาดขอมล (Data Reduction) และการท าความสะอาดขอมลกอน (Data Cleaning)
(5) การศกษา การทดสอบ และเลอกเทคนคทเหมาะสมน ามาใชงาน ในขนตอนนเปนการน าขอมลทไดคดเลอกจากขนตอนทผานมา น าขอมลทไดมา
ด าเนนการทดสอบกบโปรแกรม Weka ซงตองมการเลอกเทคนคการจ าแนกกลมขอมลทเหมาะสม
DPU
34
โดยเทคนคแตละเทคนคนนจะใหผลลพธทแตตางกน ดงนนตองน าโมเดลทไดจากการศกษามาคดเลอกเทคนคทเหมาะสม เพอน ามาใชวเคราะหการตรวจสอบขอมลทางคด และน าไปพฒนาระบบสนบสนนการตดสนใจ ซงมการทดสอบจ านวน 2 เทคนค โดยรายละเอยดของเทคนคไดกลาวไวในรายละเอยดของบทท 2 และแสดงผลลพธทไดในบทท 4 และผลลพธฉบบเตมอยทภาคผนวก
(6) การวเคราะหผลและการสรปผลการทดสอบ ในขนตอนนเปนการวเคราะหผลลพธทไดจากการทดสอบของเทคนคของเหมอง
ขอมลจ านวน 2 เทคนค โดยน าผลลพธทไดของแตละเทคนคมาวเคราะหความถกตองจากขอมลทน ามาทดสอบ เพอท าการเลอกกฎทมความนาเชอถอทสด และมคาความเปนจรงมากทสด เพอใชเงอนไขในการพฒนาระบบสนบสนนการตดสนใจจายส านวนคดความใหกบผพพากษา ในขนตอนตอไป
(7) การพฒนาระบบสนบสนนการตดสนใจจายส านวนคดความใหกบผพพากษา ในขนตอนนเปนการน ากฎทไดจากการท าเหมองขอมลมาเปนเงอนไขในการพฒนา
โปรแกรมใหเปนเครองมอสนบสนนการตดสนใจจายส านวนคดความใหกบผพพากษา (8) สรปผลการศกษาและขอเสนอแนะ ในขนตอนนเปนการกลาวถงผลการศกษาในการใชเหมองขอมลมาชวยสนบสนนการ
ตดสนใจจายส านวนคดความใหกบผพพากษา เพอชวยใหดานการบรหารงานของผบรหารไดสะดวก
(9) ด าเนนการเรยบเรยงงานคนควาอสระ 3.2 เครองมอทใชในการด าเนนการศกษา
(1) โปรแกรมส าเรจรป WEKA Version 3.6 เพอใชในการศกษาในการท าเหมองขอมล (2) ระบบปฏบตการ Windows 7 Professional 64 bit (3) โปรแกรมส าเรจรป Microsoft Excel version 2010 ใชในการเตรยมขอมลส าหรบ
น าเขาทดสอบในโปรแกรม WEKA (4) โปรแกรมส าเรจรป Microsoft Word version 2010 ใชในการจดท ารายงานคนควา
อสระและเอกสารอนๆ (5) โปรแกรมส าเรจรป Microsoft PowerPoint version 2010 ใชในการน าเสนอผล
การศกษางานคนควาอสระ (6) โปรแกรม Adobe Dreamweaver CS5 ใชในการพฒนาโปรแกรม
DPU
35
(7) โปรแกรม MySQL ใชเปนฐานขอมลในการใชงาน (8) ภาษา PHP
3.3 ขนตอนการวเคราะหและออกแบบ 3.3.1 แผนภาพแสดง Use Case Diagram
แผนภาพแสดงขอมลยสเคสของโปรแกรมจะแสดงภาพรวมของระบบทมการใชงาน โดยจะมผเกยวของอยดวยกนสองสวนคอ ผบรหารและผดแลระบบ ซงผบรหารจะมสทธแคตรวจสอบขอมลทางคดเทานน สวน ผดแลระบบมสทธในการจดการกบขอมลทกอยาง รวมถงมสทธในการตรวจสอบขอมลทางคดไดดวย ดงแสดงในแผนภาพท 3.1
ภาพท 3.1 แสดงแผนภาพยเคสของโปรแกรมตรวจสอบขอมลทางคด
DPU
36
3.3.2 แผนภาพแสดง Sequence Diagram ทแสดงขนตอนการท างานของระบบ
ภาพท 3.2 แสดงแผนภาพการท างานในสวนของการเขาสระบบ
ในสวนของหนาจอในการลอกอน (Login) เขาสระบบนน ผบรหารตองการลอกอนเขา
สระบบตองด าเนนการเปดเวบแอพพลเคชน (Web Application) หนาจอของเวบแอพพลเคชนจะ
ตอบสนองใหผบรหารด าเนนการกรอก Username และ Password เพอด าเนนการลอกอนเขาส
ระบบ ระบบจะด าเนนการสงคาทไดไปตรวจสอบภายในฐานขอมล ถาผลการตรวจสอบขอมลม
ความถกตอง ระบบจะแสดงผลใหผบรหารสามารถเขาไปใชงานได ถาผบรหารกรอก Username
หรอ Password อยางใดอยางหนงผดพลาด ระบบจะแสดงผลตอบสนองและแจงความผดพลาดท
เกดขนใหทราบ
DPU
37
3.3.3 แผนภาพแสดง Sequence Diagram แสดงผลการท านายผลลพธทเกดขน
ภาพท 3.3 แสดงแผนภาพการท างานในสวนของการท านายผลลพธทเกดขน
เมอผบรหารลอกอนเขาสระบบเปนทเรยบรอยแลว ในขนตอนตอมาเปนการแสดงผล
การบนทกขอมลทางคด โดยผบรหารสามารถบนทกขอมลทางคดในหนาเวบแอพพลเคชนเมอ
ด าเนนการบนทกขอมลทางคดเสรจ ระบบจะสงขอมลการบนทกไปยงฐานขอมลเพอบนทกขอมลท
ไดลงฐานขอมล จากนนผบรหารจะตองคลกแทปของหนาเวบแอพพลเคชนในแทปถดไป ระบบจะ
แสดงผลขอมลทไดบนทกไป จากนนใหผบรหารคลกผลการท านายในการแบงกลมประเภทคด ซง
ผลลพธทไดจากการแบงกลมจะเปนประเภทคดงายหรอประเภทคดยาก
DPU
38
3.3.4 การออกเกบการจดเกบขอมลในระบบฐานขอมล ส าหรบการจดเกบขอมลในระบบฐานขอมลแสดงในตารางท 3.1 ถงตารางท 3.2 โดยม
รายละเอยดดงตอไปน
ตารางท 3.1 ตารางแสดงการจดเกบขอมลของฐานขอมลชอ Data_case
ล าดบ ชอฟลด ประเภท ขนาด ค าอธบาย คย
1 id int 11 ล าดบของขอมลทจดเรยงภายในฐานขอมล PK 2 Gender Varchar 255 เพศ 3 Reasoning Varchar 255 ประเภทคด 4 Have_rate Varchar 255 ความเกยวเนองของคด 5 Time Varchar 255 ชวงระยะเวลา 6 Document Varchar 255 ความครบถวนของเอกสาร 7 Consider Varchar 255 ผลการพจารณา/ผลการตดสน
ตารางท 3.2 ตารางแสดงขอมลเกยวกบการจดการขอมลบคคลทเกยวของภายในระบบ
ล าดบ ชอฟลด ประเภท ขนาด ค าอธบาย คย 1 id int 100 ล าดบของบคคลทจดเรยงภายในฐานขอมล PK 2 fullname Varchar 200 ชอ-นามสกล 3 username Varchar 200 ชอ log in เขาสระบบ 4 email Varchar 200 ขอมลอเมล 5 tel Varchar 45 หมายเลขโทรศพท 6 password Varchar 200 รหสผานเขาสระบบ 7 User_level tinyint 4 สทธของการเขาใชงานในระบบ (99=สทธสงสด,1=
สทธรองลงมา,2=สทธการใชงานทวไป)
8 date date - วนทจดการขอมลบคคล
DPU
39
3.4 ระยะเวลาในการด าเนนการศกษาคนควา ระยะเวลาในการด าเนนการศกษาคนควาสามารถแสดงขนตอนในการด าเนนการศกษา
คนควา สามารถสรปไดดงตารางท 3.1
ตารางท 3.3 แสดงระยะเวลาในการด าเนนการศกษาคนควา ท ขนตอน /ระยะเวลาในการ
ด าเนนงาน(เดอน) ต.ค.57
พ.ย.57
ธ.ค.57
ม.ค.58
ก.พ.58
ม.ค.58
เม.ย.58
พ.ค.58
ม.ย.58
1. การศกษาและรวบรวมขอมล 2. การเตรยมขอมล 3. ก ารก าห น ด ค ณ ล ก ษณ ะ
(Attribute) และคาทเปนไปไดของคณลกษณะ
4. การแปลงขอมลส าหรบการ ประมวลผล
5. การศกษา การทดสอบ และเล อ ก เท ค น ค ท เห ม าะส มน ามาใชงาน
6. ก ารว เค ราะ ห ผล แล ะก ารสรปผลการทดสอบ
7. การพฒนาระบบสนบสนนการตดสนใจจายส านวนคดความใหกบผพพากษา
8. ส ร ป ผ ล ก า ร ศ ก ษ า แ ล ะขอเสนอแนะ
9. ด า เ น น ก า ร เ ร ย บ เ ร ย งงานคนควาอสระ
DPU
40
60 %
60 %
ภาพท 3.4 แผนผงแสดงขนตอนการด าเนนการศกษา วเคราะหขอมลในโปรแกรม Weka
DPU
บทท 4 ผลการด าเนนการศกษาคนควา
หลงจากทไดศกษาวธการตางๆ เพอน ามาประยกตใชในงานการศกษาคนควาอสระแลว
นน สามารถอธบายผลการด าเนนการศกษาออกเปนสวนยอยได 5 สวน ดงรายละเอยดน 1. การศกษาและรวบรวมขอมล 2. การเตรยมขอมล 3. การศกษา การทดสอบ และเลอกเทคนคทเหมาะสม 4. การวเคราะหและสรปผล 5. ขนตอนการพฒนาระบบ ผลการด าเนนการศกษาคนควาดงกลาวสามารถสรปขนตอนหรอกระบวนการท างาน
แสดงไดดงรายละเอยดตอไปน
4.1 การศกษาและรวบรวมขอมล การศกษาโครงสรางของฐานขอมลจากระบบการจดการฐานขอมล Microsoft SQL
server 2005 ซงประกอบดวยฐานขอมลจ านวน 4 ฐานขอมลซงประกอบไปดวย GP_LawCourt , GP_Master, GP_Start_Report, GP_System ดงแสดงในภาพท 4.1 สวนขอมลทางคดท จดเกบภายในระบบบรหารจดการฐานขอมล ชอฐานขอมล GP_LawCourt จะอยในตาราง thCommand มจ านวนแอททรบวต 140 แอททรบวตทจดเกบขอมลต งแตเดอนตลาคม 2552-มนาคม 2557 มจ านวน 127,055 แถว แตในการศกษาครงนจะใชวธการจ าลองขอมลใหคลายกบฐานขอมลจรง เนองจากขอมลทางคดนนมความส าคญ และเปนขอมลทเปนความลบ
DPU
42
ภาพท 4.1 แสดงรายละเอยดของฐานขอมล
4.2 การเตรยมขอมล(Data Preparation)
หลงจากทเราเตรยมขอมลคณลกษณะน น พบวาขอมลทไดมานนเปนขอมลทยงไมสมบรณทจะสามารถน าไปใชงานผานกระบวนการศกษาดวยเทคนคตางๆของเหมองขอมล จงตองมการบรหารจดการกบขอมลทมอย โดยเรามวธการจดเตรยมขอมลเบองตน ดงตอไปน
4.2.1 การโอนยายขอมล (Data Transfer)
ในการโอนยายขอมลเปนการโอนขอมลเดมท ถกจดเกบอยภายในระบบจดการฐานขอมล Microsoft SQL server 2005 ท าใหไมสามารถน าขอมลทไดมาด าเนนการศกษา จงไดด าเนนการโอนยายขอมลจากระบบจดการฐานขอมล Microsoft SQL server 2005 ใหมาอยในรปแบบไฟล Microsoft Excel และบนทกขอมลใหอยในรปแบบไฟล .CSV เพอใหสามารถน าไปใชงานไดและสะดวกตอการน าเขาในโปรแกรม Weka ตามภาพท 4.2
DPU
43
ภาพท 4.2 แสดงการโอนยายขอมลจาก ระบบจดการฐานขอมลมาอยในรปแบบไฟล Microsoft
Excel
4.2.2 การลดขนาดขอมล (Data Reduction) เนองจากขอมลทเราไดมปรมาณมากและไมไดรบความสะดวกตอการศกษา เพอใหได
ขอมลทมความสมบรณ ถกตองและครบถวน จงตองด าเนนการลดขนาดของขอมลลงเพอให
สะดวกตอการน าขอมลทไดไปด าเนนการวเคราะหในโปรแกรม Weka และไดลดขนาดขอมลอย 3
สวนดวยกนคอ สวนท 1 ลดขนาดของจ านวนแอตทรบวต จะไดจ านวนแอตทรบวต ดงตารางท 4.1
สวนท 2 ด าเนนการลดจ านวนขอมลแอตทรบวตทมขอมลไมครบถวน พบวามขอมลบางสวนทม
ขอมลไมครบถวน ดงนน จงด าเนนการตดขอมลทไมครบถวนออกไปคงเหลอขอมลทครบถวนมา
ใชในการศกษาดวยเทคนคของเหมองขอมลในล าดบตอไป สวนท 3 ลดความหลากหลายของ
DPU
44
จ านวนแอตทรบวต ไดแก แอตทรบวต Difficulty case แตเดมไดจดแบงออกเปน 3 คณลกษณะ คอ
Easy General และ Difficulty คงเหลอเพยง 2 คณลกษณะดงตารางท 4.1
ตารางท 4.1 แสดงคณลกษณะ (Attribute) ทใชด าเนนการศกษา
รายละเอยดของคาในแตละคณลกษณะ (Attribute)
คณลกษณะท 1 Reasoning แบงขอมลออกเปน 3 คณลกษณะ
Special case management คดจดการพเศษ
General litigation คดสามญ
Special case คดพเศษ
คณลกษณะท 2 Have Relate แบงขอมลออกเปน 2 คณลกษณะ
Relate มคดเกยวเนอง
Not relate ไมมคดเกยวเนอง
คณลกษณะท 3 Consider แบงขอมลออกเปน 6 คณลกษณะ
Justice ตดสน/พพากษา
Sent to justice สมควรสงใหภาคตรวจ
Lawyer requested ขอแรงทนาย
Psychologists requested มหนงสอขอนกจตวทยา
High incarceration rate อตราโทษสง
Interpreter requested มหนงสอขอลาม
คณลกษณะท 4 Time แบงขอมลออกเปน 3 คณลกษณะ
Morning เชา
Afternoon บาย
All day ทงวน
DPU
45
ตารางท 4.1 (ตอ)
คณลกษณะท 5 Document แบงขอมลออกเปน 2 คณลกษณะ
Complete เอกสารครบ
Not Complete เอกสารไมครบ
คณลกษณะท 6 Gender แบงขอมลออกเปน 2 คณลกษณะ
Male ชาย
Female หญง
คณลกษณะท 7 แบงขอมลออกเปน 2 คณลกษณะ
Easy คดงาย คดทวไป
Difficulty คดยาก
4.2.3 การท าความสะอาดขอมล (Data Cleaning)
การท าความสะอาดขอมลนเปนการแกไขคาของขอมลทมความหมายเหมอนกน ใหม
คาเปนมาตรฐานเดยวกน แสดงไดดงตารางท 4.2
DPU
46
ตารางท 4.2 แสดงการแปลงคาของขอมล
ท สถานะภาพเดม สถานะภาพใหม
1 08.30
Morning 2 09.00
3 09.30-11.30
4 13.00 Afternoon
5 13.30
6 13.00-16.00
7 08.30-16.00 All day
8 09.00-16.00
4.3 การศกษา ทดสอบ และเลอกเทคนคทเหมาะสม
เทคนคการจ าแนกกลมขอมลนนมหลากหลายเทคนคดวยกน แตละเทคนคกใหผลลพธในรปแบบทแตกตางกน ในการศกษาครงนตองการน าโมเดลทไดไปด าเนนการพฒนาระบบสนบสนนการตดสนใจของผบรหารในการตดสนใจการแบงกลมประเภทคด เพอรองรบการจายส านวนใหกบผพพากษาในการพจารณาคดความของศาลจงหวดปทมธาน ดงนน เทคนคการจ าแนกกลมขอมลทน ามาด าเนนการศกษาในครงนจงเปนเทคนคทใหผลลพธท เปนกฎทงหมด โดยรายละเอยดการท างานของแตละเทคนคไดอธบายไวในบทท 2 และเทคนคทใชศกษาไดแกเทคนค
1) เทคนคการจ าแนกก ลมแบบตนไมตด สนใจ (Decisions tree) หรอ J48 ในโปรแกรม Weka
2) เทคนคการจ าแนกกลมดวยวธการเรยนรเบยอยางงาย (Naïve Bayes)ในโปรแกรม Weka
การศกษาครงนผศกษาไดทดสอบโมเดลโดยใชโปรแกรมประยกต Weka เวอรชน 3.6 ขอมลทใชในการทดสอบมจ านวน 1,280 แถว ในการทดสอบไดใชการทดสอบ แบบ 10-fold cross validation ซงไดแก การแบงขอมลออกเปนจ านวน 10 กลม โดยในแตละรอบของการทดสอบจะน า
DPU
47
กลมขอมลจ านวน 9 กลมเปนกรณศกษา (Training Set) และกลมขอมลทเหลอเปนกลมทดสอบ (Testing Set) โดยท าการทดสอบซ าๆกนจ านวน 10 รอบ เพอท าการเปลยนกลมส าหรบการทดสอบใหครบทกกลม
4.3.1 การทดสอบขอมล
หลงจากทได เตรยมขอมลส าหรบการทดสอบท มความสมบรณ ครบถวน และด าเนนการลดความหลากหลายของขอมลแลว จงน าขอมลดงกลาว มาทดสอบกบโปรแกรม Weka เวอรชน 3.6 ซงมขนตอนการท างานดงน
ขนตอนท 1. คลก (Click) เปดโปรแกรม Weka เวอรชน 3.6 ขนมา ตามภาพท 4.3 และแสดงหนาตาโปรแกรม ตามภาพท 4.4
ภาพท 4.3 แสดงการเปดโปรแกรม Weka เวอรชน 3.6
ภาพท 4.4 แสดงการเขาหนาจอโปรแกรม Weka เวอรชน 3.6
DPU
48
ขนตอนท 2. น าขอมลทไดจดเตรยมไว โดยเลอกท Applications >> Explorer >> Open file เลอกไฟลขอมลทตองการน ามามาทดสอบ ตามภาพท 4.5 และหลงจากน น โปรแกรมจะแสดงผลหนาจอขอมล ตามภาพท 4.6 ซงหนาจอนจะท าการวเคราะหหาจ านวนขอมล
ภาพท 4.5 แสดงการน าเขาขอมลในโปรแกรม Weka เวอรชน 3.6
DPU
49
ภาพท 4.6 หนาจอแสดงขอมลทน าเขาในโปรแกรม Weka เวอรชน 3.6
ขนตอนท 3. ด าเนนการเลอกเทคนคทตองการ ไดแก เทคนคการจดกลมขอมลโดยเลอก Classification >> Choose >> tree >> เลอกเทคนคทตองการ ในท นผศกษาเลอกใชเทคนค J48 จากนนใหกดป ม Start ตามภาพท 4.7 จะแสดงผลลพธทไดตามภาพท 4.8
ภาพท 4.7 การเลอกเทคนคทใชในการศกษาในการจ าแนกขอมลแบบ Decision Tree: J48
DPU
50
ภาพท 4.8 หนาจอผลลพธของโมเดลการจ าแนกขอมลแบบ Decision Tree: J48
ขนตอนท 4. ด าเนนการเลอกเทคนคทตองการ ไดแก เทคนคการจดกลมขอมลโดยเลอก Classification >> Choose >> Bayes >> Naïve Bayes จากน นใหกดป ม Start ตามภาพท 4.9 จะแสดงผลลพธทไดตามภาพท 4.10
ภาพท 4.9 การเลอกเทคนคทใชในการศกษาในการจ าแนกขอมลแบบ Naive Bayes
DPU
51
ภาพท 4.10 หนาจอผลลพธของโมเดลการจ าแนกขอมลแบบ Naive Bayes
4.4 การวเคราะหและสรปผล
4.4.1 ผลการจ าแนกกลม แบบ Decision Tree: J48
จากผลการทดลองพบวาเทคนค Decision Tree: J48 ใหผลลพธการจ าแนกประเภทคดงาย (Easy) และคดยาก (Difficulty) มความถกตองสงถง 93.52 % และไดกฎจ านวน 15 กฎ ดงภาพท 4.11 แสดงผลลพธทเปนกฎในลกษณะของตนไมการตดสนใจทมกงแตกออกมา
DPU
52
ภาพท 4.11 ผลลพธจากการจ าแนกกลมแบบ Decision Tree: J48
ภาพท 4.12 แสดงแผนภาพการจ าแนกกลมแบบ Decision Tree: J48
DPU
53
4.4.2 ผลการจ าแนกกลม แบบ Naïve Bayes
จากผลการทดลองพบวาเทคนคของ Naïve Bayes ใหผลลพธการจ าแนกคดงาย (Easy) และคดยาก (Difficulty) มความถกตองเพยง 79.53 % ซงนอยกวาเทคนคของ Decision Tree: J48 แสดงไดดงภาพท 4.11 ซงวธการแบบนจะไมมกฎออกมาใหศกษาท าใหยากตอการน าไปใชงาน ประกอบกบผลลพธทไดจากการท านายใหผลลพธต ากวา Decision Tree: J48 ถง 13.99%
ภาพท 4.13 ผลลพธจากการจ าแนกกลมแบบ Naïve Bayes
ดงนน จะใชเทคนคของการจ าแนกกลมแบบ Decision Tree: J48 มาใชในการศกษาเนองจากใหผลลพธในการท านายทสงประกอบกบมกฎทสามารถท านายไดจ านวน 15 กฎ ซงสามารถน าไปใชในการแบงกลมไดตามเงอนไขไดชดเจนทสดและสามารถน ากฎทไดสามารถน าไปวเคราะหกฎตอไปได (ผลการรนฉบบเตมอยทภาคผนวก) จากภาพท 4.11 และภาพท 4.12 โดยสามารถจ าแนกกฎทไดออกเปน 4 กลม ดงตอไปน
กลมท 1. กฎทจ าแนกกลมประเภทคดงาย (Easy) ไดถกตอง 100 เปอรเซนต มจ านวน 4 กฎ ทอยในกลมทมความนาเชอถอมากทสด เพราะสามารถจ าแนกกลมตวอยางไดถกตองทงหมด
DPU
54
IF Have Relate = Not relate THEN Difficulty case= Easy
หมายความวา ถาคดความไมมประเภทคดทเกยวเนองกน ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทงาย
IF Have Relate = Relate AND Document = Complete AND Time = Morning THEN Difficulty case = Easy
หมายความวา ถาคดความมประเภทคดทมเกยวเนองกนและเอกสารในการประกอบพจารณามความครบถวนสมบรณและเวลาในการพจารณาคดอยในชวงเชา ผลการพจารณาน นพบวาประเภทคดความนนจะเปนประเภทคดทงาย
IF Have Relate = Relate AND Document = Complete AND Time = Afternoon AND Gender = Male THEN Difficulty case = Easy
หมายความวา ถาคดความมประเภทคดทมเกยวเนองกนและเอกสารในการประกอบพจารณามความครบถวนสมบรณและเวลาในการพจารณาคดอยในชวงบายและคดสวนใหญเกดขนกบเพศชาย ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทงาย
IF Have Relate = Relate AND Document = Not Complete AND Reasoning = Special case AND Time = All day AND Consider = Sent to justice THEN Difficulty case = Easy
หมายความวา ถาคดความมประเภทคดทมเกยวเนองกนและเอกสารในการประกอบพจารณาไมครบถวน และประเภทคดสวนใหญเปนคดจดการพเศษและเวลาในการพจารณาคดไดพจารณาคดตลอดทงวนและคดสวนใหญมผลการพจารณานนพบวาสงเอกสารใหภาคเปนคนตรวจ ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทงาย
กลมท 2 กฎทจ าแนกกลมประเภทคดยาก (Difficulty) ไดถกตอง 100 เปอรเซนต มจ านวน 6 กฎ ทอยในกลมทมความนาเชอถอมากทสด เพราะสามารถจ าแนกกลมตวอยางไดถกตองทงหมด
IF Have Relate = Relate AND Document = Complete AND Time = All day THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดทมเกยวเนองกนแลละเอกสารประกอบการพจารณาครบถวนสมบรณและเวลาในการพจารณามการพจารณาทงวน ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
DPU
55
IF Have Relate = Relate AND Document = Complete AND Time = Afternoon AND Gender = Female THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดท มเกยวเนองกนและเอกสารประกอบการพจารณาครบถวนสมบรณและเวลาในการพจารณามการพจารณาอยในชวงบายและคดสวนใหญเกดขนกบเพศหญง ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
IF Have Relate = Relate AND Document = Not Complete AND Reasoning = General litigation THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดท มเกยวเนองกนและเอกสารประกอบการพจารณาไมครบถวนและประเภทคดสวนใหญเปนคดสามญ ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
IF Have Relate = Relate AND Document = Not Complete AND Reasoning = Special case management THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดท มเกยวเนองกนและเอกสารประกอบการพจารณาไมครบถวนและประเภทคดสวนใหญเปนคดจดการพเศษ ผลการพจารณาน นพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
IF Have Relate = Relate AND Document = Not Complete AND Reasoning = Special case AND Time = Afternoon THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดท มเกยวเนองกนและเอกสารประกอบการพจารณาไมครบถวนและประเภทคดสวนใหญเปนคดสามญและเวลาในการพจารณาคดสวนใหญอยในชวงบาย ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
IF Have Relate = Relate AND Document = Not Complete AND Reasoning = Special case AND Time = All day AND Consider = Lawyer requested THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดท มเกยวเนองกนและเอกสารประกอบการพจารณาไมครบถวนและประเภทคดสวนใหญเปนคดพเศษและเวลาในการพจารณาคดสวนใหญมการพจารณาคดทงวนและผลการพจารณานนไดจดท าหนงสอขอแรงทนายความ ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
DPU
56
กลมท 3 กฎท จ าแนกกลมประเภทคดยาก (Difficulty) ไดถกตองนอยกวา 100 เปอรเซนต มจ านวน 2 กฎ คอ
IF Have Relate = Relate AND Document = Not Complete AND Reasoning = Special case AND Time = Morning THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดท มเกยวเนองกนและเอกสารประกอบการพจารณาไมครบถวนและประเภทคดสวนใหญเปนคดพเศษและเวลาในการพจารณาคดสวนใหญอยในชวงเชา ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
IF Have Relate = Relate AND Document = Not Complete AND Reasoning = Special case AND Time = All day AND Consider = Justice THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดท มเกยวเนองกนและเอกสารประกอบการพจารณาไมครบถวนและประเภทคดสวนใหญเปนคดพเศษและเวลาในการพจารณาคดสวนใหญมการพจารณาคดทงวนและผลการพจารณานนไดมการตดสนหรอมค าพพากษา ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
กลมท 4 กฎทจ าแนกกลมประเภทคดยาก (Difficulty) ทไมมตวอยางสนบสนน มจ านวน 3 กฎ คอ
IF Have Relate = Relate AND Document = Not Complete AND Reasoning = Special case AND Time = All day AND Consider = High incarceration rate THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดท มเกยวเนองกนและเอกสารประกอบการพจารณาไมครบถวนและประเภทคดสวนใหญเปนคดพเศษและเวลาในการพจารณาคดสวนใหญมการพจารณาคดทงวนและผลการพจารณานนมอตราโทษสง ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
IF Have Relate = Relate AND Document = Not Complete AND Reasoning = Special case AND Time = All day AND Consider = Psychologists requested THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดท มเกยวเนองกนและเอกสารประกอบการพจารณาไมครบถวนและประเภทคดสวนใหญเปนคดพเศษและเวลาในการพจารณาคดสวนใหญมการพจารณาคดทงวนและผลการพจารณาน นไดมมหนงสอขอนกจตวทยา ผลการพจารณาน นพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
DPU
57
IF Have Relate = Relate AND Document = Not Complete AND Reasoning = Special case AND Time = All day AND Consider = Interpreter requested THEN Difficulty case = Difficulty
หมายความวา ถาคดความมประเภทคดท มเกยวเนองกนและเอกสารประกอบการพจารณาไมครบถวนและประเภทคดสวนใหญเปนคดพเศษและเวลาในการพจารณาคดสวนใหญมการพจารณาคดทงวนและผลการพจารณานนไดมหนงสอขอลาม ผลการพจารณานนพบวาประเภทคดความนนจะเปนประเภทคดทมความยงยาก ซบซอน
4.5 ขนตอนการพฒนาระบบ
หลงจากทเราไดเลอกเทคนคของการจ าแนกกลมแบบ Decision Tree: J48 มาใชงานในขนตอนตอมาจะเขาสในสวนของการพฒนาระบบ โปรแกรมตรวจสอบขอมลทางคดของศาลจงหวดปทมธาน โดยเปนการน ากฎทไดจากการท าเหมองขอมลประเภทการจ าแนกกลมแบบ Decision Tree: J48 มาใชเปนเงอนไขในการพฒนาโปรแกรมตรวจสอบขอมลทางคด ของศาลจงหวดปทมธาน เพอเปนเครองมอชวยในการตดสนใจของผบรหารในการแบงกลมประเภทคดงายหรอประเภทคดยาก โดยใชภาษา PHP ในการพฒนา และ ระบบฐานขอมลทใชคอ My SQLและใช phpMyAdmin เปนเครองมอส าหรบใชจดการฐานขอมล
4.5.1 ออกแบบระบบฐานขอมล
ในสวนของการออกแบบระบบฐานขอมลจะจะประกอบไปดวยจ านวนตารางอยจ านวน 2 ตารางคอ data_case และ ตาราง useraccount ทไดกลาวไวในตารางท 3.1 และตารางท 3.2 ไปนน สามารถสรปความสมพนธของตารางไดดงน Data_case
id gender reasoning Have_rate time document consider Id_useraccount PK FK
useraccount
id fullname username email tel password User_level date PK
DPU
58
หลงจากทไดท าการออกแบบตารางความสมพนธเปนทเรยบรอยแลวนน หลงจากนจะแสดงวธการตดตงโปรแกรมจดการฐานขอมลหรอด าเนนการสรางฐานขอมลทไดออกแบบไว โดยสามารถแสดงขนตอนการท างานไดดงตอไปน
ขนตอนท 1 ใหเราเปด Browser เชน IE Chrome Firefox ขนมาแลวพมพ 127.0.0.1หรอพมพค าวา http://localhost/ ท ชอ ง URL จากน น ใหค ลกท ข อความ phpMyAdmin Database Manager ตามภาพท 4.14
ภาพท 4.14 แสดงขนตอนการใชงาน phpMyAdmin Database Manager
ขนตอนท 2 เมอคลกท PhpMyAdmin Database Manager จะมหนาตางใหใส ชอผใช และ รหสผาน ปรากฏข นมาในชองชอผใช (Username) ใหใสค าวา root สวนในชองรหสผาน (password) ใหใสรหสผานทเราสรางไวเมอตอนตดตง Appserv ซงกคอ 07303126 จากนนกดป ม ตกลง (OK)
ภาพท 4.15 แสดงการปอน Username และ Password เพอเขาสระบบ
DPU
59
ขนตอนท 3 ถาลอกอนเขาสระบบไดเปนทเรยบรอย ระบบจะน าเขาสหนาตางของโปรแกรม phpMyAdmin แสดงไดดงรปท 4.16
ภาพท 4.16 แสดงหนาตางของ phpMyAdmin
ขนตอนท 4 ใหด าเนนการสรางฐานขอมลชอ forecast ประกอบดวย 2 ตาราง คอ ตาราง data_case และ ตาราง useraccount เพอเกบรายละเอยดขอมลทบนทก ตวอยางของตารางทจดเกบขอมลปรากฏอยในตารางท 3.1 และตารางท 3.2 ของบทท 3
โดย หมายเลข 1 คอ ชองส าหรบใสชอฐานขอมลทเราจะสราง ในทนจะสรางฐานขอมลชอ Forecast ใหด าเนนการพมพชอฐานขอมลลงไปในชองท 1
หมายเลข 2 คอ ชองส าหรบเปลยนรหสอกขระ ใหคลกเลอกเปน utf8_unicode_ci
หมายเลข 3 คอ ป ม สราง เพอสรางฐานขอมล ตามภาพท 4.17
DPU
60
ภาพท 4.17 แสดงขนตอนการสรางฐานขอมล
ขนตอนท 5 หลงจากทเราสรางฐานขอมลเสรจในขนตอนท 4 ระบบจะแสดงผลการสรางฐานขอมล ตามภาพท 4.18 จะประกอบไปดวย 2 ตาราง คอตาราง data_case และ ตาราง useraccount
ภาพท 4.18 แสดงผลการสรางฐานขอมล
4.5.2 การออกแบบหนาจอ
ในการออกแบบหนาจอโปรแกรมตรวจสอบขอมลทางคด ของศาลจงหวดปทมธาน เพอด าเนนการบนทกขอมลรายละเอยดตางๆทใชในการวเคราะหขอมลมหนาเวบเพจทเกยวของจ านวน 6 เวบเพจ สามารถแสดงไดโดยแผนภาพ ดงรปท 4.19
DPU
61
ภาพท 4.19 แสดงโครงสรางหนาเวบเพจของโปรแกรมตรวจสอบขอมลทางคด
ภาพท 4.20 หนาจอแสดงการลอกอนเขาสระบบ
DPU
62
ภาพท 4.21 หนาจอบนทกขอมลทางคดทตองการวเคราะห
DPU
63
ภาพท 4.22 หนาจอแสดงผลการวเคราะห
DPU
64
ภาพท 4.23 หนาจอของการจดการเพมขอมลบคคล
ภาพท 4.24 แสดงขอมลบคคลผมสทธเขาใชงานในระบบ
DPU
65
4.5.3 การเขยนโปรแกรม
เมอด าเนนการออกแบบหนาจอและการแสดงผลลพธทได เราจะใชกฎทไดจากการท าเหมองขอมลประเภทจ าแนกกลมแบบ Decision Tree: J48 มาเปนเงอนไขในการเขยนโปรแกรม และจากกฎทเราไดจ านวน 15 กฎนน จะท าการแปลงกฎทไดมาเปน โคด (Code) ของตวโปรแกรม โดยหนงกฎทได คอหนงเงอนไข ดงนนเราจะไดเงอนไขในการท านายจ านวน 15 เงอนไข มาใชในการพฒนาโปรแกรม และในสวนนจะแสดงโคดโปรแกรมในสวนของเงอนไขการท านาย ดงตวอยางขางลางนพรอมประกอบค าอธบาย ตวอยางเงอนไขในการเขยนโปรแกรมในสวนของการท านายผลลพธ DPU
66
ภาพท 4.25 แสดงเงอนไขในการเขยนโปรแกรมในสวนของการท านายผลลพธ
DPU
67
ค าอธบายโคดโดยภาพรวม
บรรทดท 1 เรมตนการใชงานภาษา PHP
บรรทดท 4 คอ การเรมตนในการเชอมตอฐานขอมลทไดมการสรางไฟลไวท ชอวา database_connection.php
บรรทดท 9-10 เปนค าสง echo หมายความวาเปนการแสดงผลขอความทางจอภาพทเราสามารถแทรกชอตวแปรเขาไปอยในขอความ ซงเราตองใชเครองหมาย “ ” (Double code) ไว
บรรทดท 11 เปนการตงชอตวแปรแบบอารเรย เพอมารองรบคา ในทนจะรองรบคาทสงมาคอ case_id
บรรทดท 12 เปนการใชค าสง SELECT ขอมลจากฐานขอมลมาแสดงผลโดยมการอางองขอมลจากหมายเลข case_id
บรรทดท 13 คอการคนคา คาขอมล ของผลลพธในแถวทชอย และเกบไวท array และเลอนไปตวชชไปยงต าแหนงถดไปโดย array ทไดม key คอคอลมนทหรอชอฟลดโดยจะคนคา false ถาเกดความผดพลาดขนในทนจะท าการคนคาไปยงค าสง SQL ของแตละ case_id ทคลกผลการท านาย
บรรทดท 16-21 คอเงอนไขการท านายกฎขอท 1 ทวาถาคดไมมความเกยวเนอง จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดงาย แลวด าเนนการออกจากเงอนไข
บรรทดท 23-28 คอเงอนไขของการท านายกฎขอท 2 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาครบถวนสมบรณ และเวลาในการพจารณาคดเปนเวลาทงวน จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 30-35 คอเงอนไขของการท านายกฎขอท 3 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาครบถวนสมบรณ และเวลาในการพจารณาคดเปนเวลาเชา จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดงาย แลวด าเนนการออกจากเงอนไข
บรรทดท 37-42 คอเงอนไขของการท านายกฎขอท 4 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาครบถวนสมบรณ และเวลาในการพจารณาคดเปนเวลาบาย และคดสวนใหญเปนเพศชาย จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดงาย แลวด าเนนการออกจากเงอนไข
DPU
68
บรรทดท 44-49 คอเงอนไขของการท านายกฎขอท 5 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาครบถวนสมบรณ และเวลาในการพจารณาคดเปนเวลาบาย และคดสวนใหญเปนเพศหญง จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 51-59 คอเงอนไขของการท านายกฎขอท 6 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาไมครบ และประเภทคดเปนคดสามญ จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 58-63 คอเงอนไขของการท านายกฎขอท 7 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาไมครบ และประเภทคดเปนคดจดการพเศษจะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 65-70 คอเงอนไขของการท านายกฎขอท 8 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาไมครบ และประเภทคดเปนคดพเศษ และเวลาในการพจารณาคดสวนใหญเปนเวลาเชา จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 72-77 คอเงอนไขของการท านายกฎขอท 9 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาไมครบ และประเภทคดเปนคดพเศษ และเวลาในการพจารณาคดสวนใหญเปนเวลาบาย จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 79-84 คอเงอนไขของการท านายกฎขอท 10 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาไมครบ และประเภทคดเปนคดพเศษ และเวลาในการพจารณาคดสวนใหญทงวน และผลการพจารณาเบองตนคอการตดสนหรอพพากษา จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 86-91 คอเงอนไขของการท านายกฎขอท 11 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาไมครบ และประเภทคดเปนคดพเศษ และเวลาในการพจารณาคดสวนใหญทงวน และผลการพจารณาเบองตนคอสมควรสงใหภาคตรวจ จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดงาย แลวด าเนนการออกจากเงอนไข
บรรทดท 93-98 คอเงอนไขของการท านายกฎขอท 12 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาไมครบ และประเภทคดเปนคดพเศษ และเวลาในการพจารณาคด
DPU
69
สวนใหญทงวน และผลการพจารณาเบองตนคอมอตราโทษสง จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 99-104 คอเงอนไขของการท านายกฎขอท 13 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาไมครบ และประเภทคดเปนคดพเศษ และเวลาในการพจารณาคดสวนใหญทงวน และผลการพจารณาเบองตนคอมหนงสอขอนกจตวทยา จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 106-111 คอเงอนไขของการท านายกฎขอท 14 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาไมครบ และประเภทคดเปนคดพเศษ และเวลาในการพจารณาคดสวนใหญทงวน และผลการพจารณาเบองตนคอมหนงสอขอลาม จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 113-116 คอเงอนไขของการท านายกฎขอท 15 ทวาถาถาคดมความเกยวเนอง และเอกสารประกอบการพจารณาไมครบ และประเภทคดเปนคดพเศษ และเวลาในการพจารณาคดสวนใหญทงวน และผลการพจารณาเบองตนคอมหนงสอขอแรงทนาย จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดยาก แลวด าเนนการออกจากเงอนไข
บรรทดท 119 คอกรณทมเงอนไขนอกเหนอจากเงอนไขท 1 ถงเงอนไขท 15 จะสงผลลพธการท านายไปแสดงวาเปนประเภทคดงาย แลวด าเนนการออกจากเงอนไข
บรรทดท 122 คอปดการใชงาน PHP
DPU
บทท 5 สรปผลการศกษาคนควา และขอเสนอแนะ
5.1 สรปผลการศกษาคนควา
จากการด าเนนการศกษาวจย เรองการตรวจสอบขอมลทางคด ของศาลจงหวดปทมธาน ดวยเทคนคของเหมองขอมล มวตถประสงคเพอการศกษาและคนควารปแบบการเกดความสมพนธของตวแปรของขอมลทางคดทมอยและน าความรทไดจากการศกษาคนควาน ามาสรางโมเดลการท านายผลลพธทคาดวาจะเกดขนภายในอนาคต นนมขนตอนการท างานหลกๆอย 5 สวน ไดแก
สวนท 1 ด าเนนการศกษาและเกบรวบรวมขอมลทางคด โดยใชวธการจ าลองขอมลใหคลายกบฐานขอมลทจดเกบจรง จ านวน 1,280 แถวใหอยในรปไฟล Excel
สวนท 2 จดเตรยมขอมลทไดใหเปนไปตามมาตรฐานเดยวกนโดยท าการโอนยายขอมล(Data Transfers) ท าการลดขนาดขอมล (Data Reduction) คดเลอกขอมล และท าความสะอาดขอมล (Data Cleaning) เมอผานกระบวนการจดเตรยมขอมล จะคดเลอกเฉพาะขอมลทสมบรณและมรปแบบท ถกตอง ครบถวนท สด เพอน ามาวเคราะหในโปรแกรม Weka 3.6 กอนทจะท าการวเคราะหขอมลในโปรแกรมดงกลาวตองท าการแปลงไฟลใหอยในรป .CSV
สวนท 3 การทดสอบขอมล และเลอกเทคนคทเหมาะสม ซงในการศกษา คนควา วจย ครงนไดทดสอบเทคนคของเหมองขอมล โดยใชเทคนคการจ าแนกกลม จ านวน 2 เทคนค คอ โมเดลการจ าแนกกลมแบบ Decision Tree:C4.5 หรอ โมเดล Classifier tree J48 และ โมเดลการจ าแนกกลมแบบ Bayes: Naïve Bayes หรอโมเดล Classifier Naïve Bayes ในโปรแกรม Weka จากผลการทดสอบการจ าแนกกลมดงกลาวพบวา การจ าแนกกลมแบบ Decision Tree:C4.5 ใหผลลพธดทสดและใหกฎออกมาทสามารถน าไปวเคราะหกฎตอไปได โดยผลลพธมความถกตองสงถง 93.52 เปอรเซนต และไดกฎจ านวน 15 กฎ สวนผลลพธของโมเดลการจ าแนกกลมแบบ Bayes: Naïve Bayes สามารถใหผลลพธจากการท านายสงเชนเดยวกน แตมขอดวยตรงท ไมมกฎ ใหสามารถศกษาหรอน าไปตอยอดได
สวนท 4 การวเคราะหขอมล จากผลการจ าแนกกลมขอมลแบบ Decision Tree: C4.5 เปนการจดกลมทเหมาะสมทสดในการทดสอบ เนองจากมกฎออกมาใหเราไดด าเนนการศกษาและน าไปตอยอดได ประกอบกบมเงอนไขทเหมาะสมสามารถท านายไดถกตอง 100 เปอรเซนต และมบางกรณท ม เงอนไขไมเหมาะสม รวมถงมกฎในการท านายท มความถกตองนอยกวา 100
DPU
71
เปอรเซนต มจ านวน 15 กฎ ทสามารถน ามาใชเปนเงอนไขในการพฒนาโปรแกรมตรวจสอบขอมลทางคดของศาลจงหวดปทมธานตอไป
สวนท 5 การพฒนาโปรแกรมตรวจสอบขอมลทางคดของศาลจงหวดปทมธาน เปนการน ากฎทไดจากการท าเหมองขอมลมาใชเปนเงอนไขในการเขยนโปรแกรม เพอเปนเครองมอชวยผบรหารชวยการการตดสนใจการจายส านวนคดใหกบผพพากษาในการพจารณาอรรถคดความ โดยใชโปรแกรม PHP และใชฐานขอมล My SQL ในการพฒนาโปรแกรมโดยโปรแกรมทพฒนาน นมจ านวนเพจใหใชงานจ านวน 6 เพจ ประกอบไปดวย ไฟลของการเชอมตอฐานขอมล (Database Connection.php), ไ ฟ ล ข อ งก า ร จด ก า รข อ ม ล บ ค ค ล แ ล ะ ก ารก าห น ด ส ท ธ (Personal_info.php), หนาจอการลอกอนเขาสระบบ (Index.php), การสรางฟอรมการปอนขอมลทางคด (Create_data.php), ตารางสรปขอมลการปอนขอมลทางคด (List_data.php) และฟอรมส าหรบการแสดงผลการท านาย (Decision_tree.php) โดยโปรแกรมทไดชวยอ านวยความสะดวกใหกบผบรหารไดเปนอยางด 5.2 ปญหาและแนวทางแกไข
1. ในการท าเหมองขอมลครงนมขนตอนในการเตรยมขอมลยงขาดขอมลบางสวนทมความจ าเปนในการพจารณา เชน ปรมาณคดทอยระหวางการพจารณาพพากษาอรรถคด หากมการน าขอมลแหลานมาศกษา อาจจะท าใหผลการศกษาครงนมความนาเชอถอมากขน
2. ในการใชเครองมอ (Tool) ตางๆในการศกษาคนควา ไดใชซอฟตแวรแบบโอเพนซอส (Open source) ซงเอกสารประกอบการใชงานมนอย ท าใหยากตอการศกษาวธการใชงาน การวเคราะหผลลพธ จงไดด าเนนการหาเอกสารจากทางเวบไซตทเปนภาษาองกฤษ หรอบทความมาด าเนนการศกษา หรออานประกอบ
3. ในการท าเหมองขอมลไดใชขอมลทดสอบหรอขอมลตวอยางทไมไดแบงแยกประเภททชดเจนมาด าเนนการศกษา ท าใหยากตอการวเคราะหขอมล หรอไดผลลพธทไมเปนทนาพอใจ จงไดด าเนนการแยกประเภทขอมลทชดเจนออกมาด าเนนการทดสอบ ท าใหผลลพธมความชดเจนมากขน
4. ในการพฒนาโปรแกรมเกดขอผดพลาดบอยครง เนองจากไมมระยะเวลาในการศกษามากพอ จงไดสอบถามจากผมประสบการณและหาหนงสอมาศกษาเพมเตม
DPU
72
5.3 ขอเสนอแนะส าหรบการพฒนาตอไป 1. ในการท าเหมองขอมล สงทส าคญทสดในการวเคราะหขอมลคอ ผด าเนนการศกษา
จะตองทราบโครงสรางของฐานขอมลเบองตน เพอความถกตองในการคดเลอกแอตทรบวตมาใชงานเพอท านายผลลพธท เกดข นดวยเทคนคของเหมองขอมล ซงจะสงผลใหไดผลลพธท มประสทธภาพสงสด
2. ในการท าเหมองขอมลควรใชขอมลในการทดสอบทหลากหลายและมจ านวนมาก เพอใหไดผลลพธในการศกษา วเคราะหทมความนาเชอถอมากยงขน
3. ควรด าเนนการใชเทคนคของเหมองขอมลดวยเทคนคอนนอกเหนอจากการศกษามาใชในการทดสอบกบขอมลทมอยเพอใหไดผลลพธทถกตอง ชดเจน มากขน
4. ในการพฒนาตอยอดโปรแกรมตรวจสอบขอมลทางคดของศาลจงหวดปทมธานนนเหนควรมการเพมฐานขอมลในสวนของผลลพธจากการท านาย เพราะวาจะท าใหการใชงานจากผลลพธการท านายไดอยางสะดวกและรวดเรว ท าใหลดขนตอนในกระบวนการตรวจสอบขอมลทางคดได
5. เมอเราไดบนทกผลลพธทไดจากการท านายนนทเราไดด าเนนการแบงกลมประเภทคด เหนควรศกษาเทคนคของเหมองขอมลในสวนของการพยากรณ ในล าดบตอไป เพอสามารถท านายผลลพธของคดความทเราแบงกลม วาแตละประเภทคดนนใชเวลาในการพจารณาคดมากนอยเพยงใด และจะเปนประโยชนตอการบรการจดการกบขอมลทางคดได
DPU
บรรณานกรม
DPU
74
บรรณานกรม
ภาษาไทย
กฤษณะ ไวยมย, ชดชนก สงศร, และธนาวนท รกธรรมานนท. (2544). การใชเทคนคดาตาไมนนง
เพ อพฒ น าคณ ภาพก ารศกษาน สตคณ ะวศวกรรมศาสต ร , The Nectec Thailand Jurnal.3(11) , : 134-142.
กฤษณะ ไวยมย,และ ธระวฒน พงษศรปรดา. (2544.) การใชเทคนค Association Rule Discovery
เพอการจดสรรกฎหมายในการพจารณาคดความ . The Nectec Thailand Jurnal.3 (11) , : 143-152.
ชนวฒน ศรสอาน. (2551). ฐานขอมล คลงขอมล และเหมองขอมล .กรงเทพฯ : มหาวทยาลยรงสต.
ชดชย แกวตา, และอจฉรา มหาวรวฒน. (2553). การวนจฉยคดดวยเทคนคตนไมตดสนใจ.
(วทยานพนธปรญญามหาบณฑต). อบลราชธาน: มหาวทยาลยอบลราชธาน.
ทพยธดา วงศพพนธ. (2556). การใชเหมองขอมลชวยในการตดสนใจการใหสนเชอ กรณศกษา:
บรษท กรงไทยคารเรนท แอนด ลส จ ากด(มหาชน) (สารนพนธปรญญามหาบณฑต). กรงเทพฯ: มหาวทยาลยธรกจบณฑตย.
ธนาคม จยสร, และเนองวงศ ทวยเจรญ. (2556). การพฒนาระบบสนบสนนการตดสนใจเลอกสาขา
ว ช า เอ ก ข อ ง ผ ท ต อ ง ก า ร ส ม ค ร เข า ศ ก ษ า ต อ ใน ร ะ ด บ ป ร ญ ญ าต ร ข อ ง มหาวทยาลยสโขทยธรรมาธราชดวยเหมองขอมล. การประชมวชาการทางวศวกรรมไฟฟา ครงท 36 (EECON-36). มหาวทยาลยเกษตรศาสตร.
ธระวฒน พงษศรปรดา. (2544). การจดสรรกฎหมายทเหมาะสมใหกบคดความโดยอตโนมต.
(วทยานพนธปรญญามหาบณฑต). กรงเทพฯ : มหาวทยาลยเกษตรศาสตร.
บญชา ปะสละเตสง. (2553).พฒนาเวบแอปพลเคชนดวย PHP รวมกบ MySQL และ Dreamweaver.
กรงเทพฯ: ซเอดยเคชน .
DPU
75
ปณธ แกวสวสด. (2553). เหมองขอมล: การคนหาความรและการขดคนขอมล . คอมพวเตอรและ
เทคโนโลยขนสง . 11 , 51-60.
สายชล สนสมบรณทอง. (2558).การท าเหมองขอมล Data Mining. กรงเทพฯ: จามจรโปรดกท.
สทธโชค มกดาสกลภบาล.(2551). การวดประสทธภาพของขนตอนวธตวจ าแนก C4.5 ,ADTree
และ Bayes ในการจ าแนกขอมลการซกซอนสงเสพยตดส าหรบไปรษณยระหวางประเทศ . (วทยานพนธปรญญามหาบณฑต).กรงเทพฯ : มหาวทยาลยเกษตรศาสตร.
สธธร เจรญรตน, และชฏารตน พพฒนนนท. (2556). การศกษาปจจยทมผลตอรายไดของประชากร
ในประเทศไทยโดยใชเทคนคเหมองขอมล. วารสารวชาการ มหาวทยาลยหอการคาไทย. 33(1) , 131-151 .
อนรรฆรงค คณมณ. (2555). พฒนา Web App แบบมออาชพดวย PHP+AJAX และ jQuery.
นนทบร: ไอดซ พรเมยร.
เอกสทธ พชรวงศศกดา. (2556). ค มอการใชงาน Weka Explorer เบองตน.กรงเทพฯ: บรษท เอเชย
ดจตอลการพมพ จ ากด.
เอกสทธ พชรวงศศกดา. (2557). การวเคราะหขอมลดวยเทคนคดาตา ไมนนง เบองตน. กรงเทพฯ:
บรษท เอเชย ดจตอลการพมพ จ ากด.
ภาษาตางประเทศ
Ian H. Witten, Frank Eibe, & Mark A. Hall. (2011). Data mining : practical machine learning
tools and techniques(3rd Edition). Morgan Kaufmann,San Francisco.
Jiawei Han, Micheline Kamber, & Jian Pei . (2011). DATA MINING: CONCEPTS AND
TECHNIQUES (3RD EDITION) Morgan Kaufmann,San Francisco.
DPU
76
Pang-Ning Tan, Michael Steinbanch, & Vipin Kumar. (2006). Introduction to data mining.
Addison-Wesley Longman Publishing Co. Inc. Boston Ma,USA.
T.Pongsiripreeda, & K. Waiyamai. (2000). Using Data Mining technique to select the law and
article for lawsuite(in thai language). The National Computer Science and Engineering Conference (NCSEC’2000). Thailand, Bangkok.November
U.Fayyad, G. Piatetsky-Shapiro, & P. Smyth. (1997). From Data Mining to Knowledge Discovery in Database. AI MAGAZINE, 1 , 39-45.
DPU
ภาคผนวก
DPU
78
ผลการรนโปรแกรมฉบบสมบรณ classifiers.bayes.NaiveBayes
=== Run information === Scheme:weka.classifiers.bayes.NaiveBayes Relation: test Instances: 1280 Attributes: 7 gender Reasoning HaveRelate consider time document difficultycase Test mode:10-fold cross-validation === Classifier model (full training set) === Naive Bayes Classifier Class Attribute easy difficulty (0.5) (0.5) ==================================================
DPU
79
gender male 396.0 341.0 female 246.0 301.0 [total] 642.0 642.0 Reasoning general litigation 171.0 141.0 special case 216.0 426.0 special case management 256.0 76.0 [total] 643.0 643.0 HaveRelate notrelate 366.0 1.0 relate 276.0 641.0 [total] 642.0 642.0 consider justice 346.0 371.0 sent to justice 116.0 66.0 High incarceration rate 66.0 16.0 Psychologists requested 41.0 41.0 interpreter requested 26.0 56.0 lawyer requested 51.0 96.0 [total] 646.0 646.0
DPU
80
time allday 146.0 206.0 morning 411.0 266.0 afternoon 86.0 171.0 [total] 643.0 643.0 document complete 296.0 186.0 notcomplete 346.0 456.0 [total] 642.0 642.0 Time taken to build model: 0.03 seconds === Stratified cross-validation === === Summary === Correctly Classified Instances 1018 79.5313 % Incorrectly Classified Instances 262 20.4688 % Kappa statistic 0.5906 Mean absolute error 0.2607 Root mean squared error 0.3818 Relative absolute error 52.1453 % Root relative squared error 76.3615 % Total Number of Instances 1280
DPU
81
=== Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.667 0.077 0.897 0.667 0.765 0.844 easy 0.923 0.333 0.735 0.923 0.819 0.844 difficulty Weighted Avg. 0.795 0.205 0.816 0.795 0.792 0.844 == Confusion Matrix === a b <-- classified as 427 213 | a = easy 49 591 | b = difficulty ผลการรนโปรแกรมฉบบสมบรณ classifiers.trees.J48
=== Run information === Scheme:weka.classifiers.trees.J48 -C 0.25 -M 2 Relation: test04052558 Instances: 1280 Attributes: 7 gender Reasoning HaveRelate consider time document difficultycase
DPU
82
Test mode:10-fold cross-validation === Classifier model (full training set) === J48 pruned tree ------------------ HaveRelate = notrelate: easy (365.0) HaveRelate = relate | document = complete | | time = allday: difficulty (60.0) | | time = morning: easy (150.0) | | time = afternoon | | | gender = male: easy (25.0) | | | gender = female: difficulty (125.0) | document = notcomplete | | Reasoning = general litigation: difficulty (115.0) | | Reasoning = special case | | | time = allday | | | | consider = justice: difficulty (75.0/25.0) | | | | consider = sent to justice: easy (25.0) | | | | consider = High incarceration rate: difficulty (0.0) | | | | consider = Psychologists requested: difficulty (0.0) | | | | consider = interpreter requested: difficulty (0.0) | | | | consider = lawyer requested: difficulty (50.0) | | | time = morning: difficulty (200.0/50.0) | | | time = afternoon: difficulty (15.0) | | Reasoning = special case management: difficulty (75.0)
DPU
83
Number of Leaves : 15 Size of the tree : 22 Time taken to build model: 0.13 seconds === Stratified cross-validation === === Summary === Correctly Classified Instances 1197 93.5156 % Incorrectly Classified Instances 83 6.4844 % Kappa statistic 0.8703 Mean absolute error 0.0827 Root mean squared error 0.2044 Relative absolute error 16.5386 % Root relative squared error 40.881 % Total Number of Instances 1280 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.891 0.02 0.978 0.891 0.932 0.984 easy 0.98 0.109 0.9 0.98 0.938 0.984 difficulty Weighted Avg. 0.935 0.065 0.939 0.935 0.935 0.984
DPU
84
=== Confusion Matrix === a b <-- classified as 570 70 | a = easy 13 627 | b = difficulty DPU
85
ประวตผเขยน ชอ-นามสกล นายนเรศ หมทอง ประวตการศกษา พ.ศ. 2552 วทยาศาสตรบณฑต
สาขาวทยาการคอมพวเตอร คณะวทยาศาสตร มหาวทยาลยเชยงใหม
ต าแหนงและสถานทท างานปจจบน นกวชาการคอมพวเตอรปฏบตการ ศาลจงหวดปทมธาน
DPU