detecting fake news with machine learning methodprabhas/thesis/supanya-final... ·...

104
5771425821_3179412591 CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10 การตรวจสอบข่าวปลอมด้วยวิธีการเรียนรู้ด้วยเครื่อง น.ส.สุปัญญา อภิวงศ์โสภณ วิทยานิพนธ์นี้เป็นส่วนหนึ่งของการศึกษาตามหลักสูตรปริญญาวิศวกรรมศาสตรดุษฎีบัณฑิต สาขาวิชาวิศวกรรมคอมพิวเตอร์ ภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย ปีการศึกษา 2561 ลิขสิทธิ์ของจุฬาลงกรณ์มหาวิทยาลัย 3179412591

Upload: others

Post on 27-Apr-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

5771425821_3179412591

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

การตรวจสอบขาวปลอมดวยวธการเรยนรดวยเครอง

น.ส.สปญญา อภวงศโสภณ

วทยานพนธนเปนสวนหนงของการศกษาตามหลกสตรปรญญาวศวกรรมศาสตรดษฎบณฑต สาขาวชาวศวกรรมคอมพวเตอร ภาควชาวศวกรรมคอมพวเตอร

คณะวศวกรรมศาสตร จฬาลงกรณมหาวทยาลย ปการศกษา 2561

ลขสทธของจฬาลงกรณมหาวทยาลย

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

DETECTING FAKE NEWS WITH MACHINE LEARNING METHOD

Miss Supanya Aphiwongsophon

A Dissertation Submitted in Partial Fulfillment of the Requirements for the Degree of Doctor of Philosophy (Computer Engineering) in Computer

Engineering Department of Computer Engineering

Faculty of Engineering Chulalongkorn University

Academic Year 2018 Copyright of Chulalongkorn University

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

หวขอวทยานพนธ การตรวจสอบขาวปลอมดวยวธการเรยนรดวยเครอง โดย น.ส.สปญญา อภวงศโสภณ สาขาวชา วศวกรรมคอมพวเตอร อาจารยทปรกษาวทยานพนธหลก ศาสตราจารย ดร.ประภาส จงสถตยวฒนา

คณะวศวกรรมศาสตร จฬาลงกรณมหาวทยาลย อนมตใหนบวทยานพนธฉบบนเปนสวนหนงของการศกษาตามหลกสตรปรญญาวศวกรรมศาสตรดษฎบณฑต

คณบดคณะวศวกรรมศาสตร (ศาสตราจารย ดร.สพจน เตชวรสนสกล)

คณะกรรมการสอบวทยานพนธ

ประธานกรรมการ (รองศาสตราจารย ดร.ววฒน วฒนาวฒ) อาจารยทปรกษาวทยานพนธหลก (ศาสตราจารย ดร.ประภาส จงสถตยวฒนา) กรรมการ (รองศาสตราจารย ดร.ทวตย เสนวงศ ณ อยธยา) กรรมการ (ผชวยศาสตราจารย ดร.สกร สนธภญโญ) กรรมการภายนอกมหาวทยาลย (ผชวยศาสตราจารย ดร.ชวลต ศรสถาพรพฒน)

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

บทค ดยอ ภาษาไทย สปญญา อภวงศโสภณ : การตรวจสอบขาวปลอมดวยวธการเรยนรดวยเครอง. (

DETECTING FAKE NEWS WITH MACHINE LEARNING METHOD) อ.ทปรกษาหลก : ศ. ดร.ประภาส จงสถตยวฒนา

วทยานพนธนน าเสนอวธการตรวจจบขาวปลอมบนเครอขายสงคมออนไลนทวตเตอรดวย

วธการเรยนรดวยเครอง โดยใชการเรยนรดวยเครองสามวธ ไดแก Naïve Bayes, Neural Network และ Support Vector Machine โดยเกบขอมลจากหวขอขาวท เปนภาษาไทย ในระหวางเดอนตลาคมถงพฤศจกายน พ.ศ. 2560 ผลการวจยพบวาทงสามวธสามารถตรวจจบขาวปลอมในชดขอมลไดอยางถกตอง รอยละความถกตองของวธ Naïve Bayes คอ 96.08 เปอรเซนต Neural Network 99.89 เป อ ร เซ น ต และ Support Vector Machine 99.89 เป อ ร เซ น ต นอกจากนไดท าการวเคราะหขอมลขาวปลอมและชใหเหนลกษณะของขาวปลอมทพบในชดขอมล

สาขาวชา วศวกรรมคอมพวเตอร ลายมอชอนสต ................................................ ปการศกษา 2561 ลายมอชอ อ.ทปรกษาหลก ..............................

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

บทค ดยอ ภาษาองกฤษ # # 5771425821 : MAJOR COMPUTER ENGINEERING KEYWORD: FAKE NEWS, MACHINE LEARNING, ONLINE SOCIAL NETWORK, TWITTER Supanya Aphiwongsophon : DETECTING FAKE NEWS WITH MACHINE

LEARNING METHOD. Advisor: Prof. Dr. Prabhas Chongstitvatana, Ph.D.

This dissertation proposes a machine learning method which can identify fake news from Twitter data. The experiment is carried out with three widely used machine learning methods: Naïve Bayes, Neural Network and Support Vector Machine using Thai’s topic and collected from October to November 2017. The results show that all three methods can detect fake news in this data set accurately. The accuracy of Naïve Bayes method is 96.08 percent, Neural Network 99.89 percent and Support Vector Machine 99.89 percent. Furthermore, we analyze the data of fake news and point out some of its characteristics.

Field of Study: Computer Engineering Student's Signature ............................... Academic Year: 2018 Advisor's Signature ..............................

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

กตตกรรมประกาศ

กตตกรรมประกาศ

ขอขอบคณศาสตราจารย ดร.ประภาส จงสถตยวฒนา อาจารยทปรกษาทใหค าแนะน าทงในดานวชาการ ใหค าชแนะในการแกไขปญหาตาง ๆ ใหก าลงใจในยามทอแท จนท าใหวทยานพนธนสามารถลลวงไปไดดวยความเรยบรอย

ขอขอบคณคณะกรรมการสอบวทยานพนธทใหความอนเคราะหเปนกรรมการสอบและใหค าแนะน าทท าใหวทยานพนธนเรยบรอยมากยงขน ซงคณะกรรมการสอบวทยานพนธนประกอบดวย รองศาสตราจารย ดร.ววฒน วฒนาวฒ รองศาสตราจารย ดร. ทวตย เสนวงศ ณ อยธยา ผชวยศาสตราจารย ดร. สกร สนธภญโญ และ ผชวยศาสตราจารย ดร. ชวลต ศรสถาพรพฒน

ขอขอบคณคณาจารยทกทานในภาควชาวศวกรรมคอมพวเตอร จฬาลงกรณมหาวทยาลย ทไดประสทธประสาทความร และใหประสบการณทดตลอดระยะเวลาทศกษาในหลกสตร

ขอขอบคณบณฑตวทยาลย จฬาลงกรณมหาวทยาลย ทสนบสนนทนการศกษาหลกสตรดษฎบณฑต "100 ป จฬาลงกรณมหาวทยาลย" ส าหรบการด าเนนงานวทยานพนธฉบบน

ขอบคณทกคนในครอบครวทรกและหวงใย คอยใหก าลงใจกนมา ตลอดจนพนองในหองปฏบตการ ISL (Intelligent Systems Laboratory) รวมถงเพอน ๆ ในภาควชาวศวกรรมคอมพวเตอรทกทานทเปนก าลงใจใหกนเสมอมา

สปญญา อภวงศโสภณ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

สารบญ

หนา บทคดยอภาษาไทย ............................................................................................................................ ค

บทคดยอภาษาองกฤษ ........................................................................................................................ ง

กตตกรรมประกาศ............................................................................................................................. จ

สารบญ .............................................................................................................................................. ฉ

สารบญภาพ ...................................................................................................................................... ซ

สารบญตาราง ................................................................................................................................... ฌ

บทท 1 ทมาและความส าคญของปญหา ............................................................................................ 1

บทท 2 ทฤษฎและงานวจยทเกยวของ .............................................................................................. 7

2.1 สอสงคมออนไลนกบการเผยแพรขาวสาร .............................................................................. 7

2.2 นยามของขาวและขาวปลอม ................................................................................................. 9

2.3 องคประกอบของขาว ........................................................................................................... 11

2.4 ประเภทของขาว .................................................................................................................. 13

2.5 ลกษณะของขาวปลอม ......................................................................................................... 14

2.6 สาเหตทท าใหเกดขาวปลอม ................................................................................................ 15

2.7 วธการจ าแนกขาวปลอม ...................................................................................................... 16

2.8 ปญหาและผลกระทบทเกดจากขาวปลอม ............................................................................ 18

2.9 การปองกนขาวปลอมเบองตน ............................................................................................. 20

2.10 คณลกษณะเดนของทวตเตอร.................................................................................... 21

2.11 การเรยนรดวยเครอง ................................................................................................. 22

2.12 งานวจยทเกยวของ .................................................................................................... 28

บทท 3 วธการด าเนนงานวจย ......................................................................................................... 34

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

3.1 ภาพรวมของระบบ ............................................................................................................... 34

3.2 การเกบขอมลขาวจากสอสงคมออนไลนทวตเตอร ................................................................ 35

บทท 4 ผลงานวจย .......................................................................................................................... 65

4.1 การเรยนรดวยเครอง ............................................................................................................ 65

4.2 การเลอกคณลกษณะทเหมาะสม .......................................................................................... 73

บทท 5 วเคราะหผลการวจย ........................................................................................................... 78

5.1 สรปผล ................................................................................................................................. 78

5.2 ขอจ ากดและแนวทางวจยในอนาคต ..................................................................................... 81

บรรณานกรม ................................................................................................................................... 83

บรรณานกรม ................................................................................................................................... 92

ประวตผเขยน .................................................................................................................................. 94

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

สารบญภาพ

รปท 2.1 ตวอยาง CONFUSION MATRIX ขนาด 2×2 .......................................................................... 26 รปท 2.2 การแบงประเภทงานวจยทเกยวของกบการตรวจจบขาวปลอม ......................................... 31 รปท 3.1 ภาพรวมกระบวนการด าเนนงานในงานวจย .................................................................... 35

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

สารบญตาราง

ตารางท 3.1 เงอนไขทใชในการแปลงขอมลแตละคณลกษณะเปนตวเลข ......................................... 40 ตารางท 3.2 ตวอยางรายการขอมลหลงจากกระบวนการปรบเปลยนขอมลใหอยในรปแบบตวเลข .. 43 ตารางท 3.3 รายละเอยดจ านวนขาวทมการจดเกบขอมล ................................................................ 45 ตารางท 3.4 ผลการวเคราะหขอมลขาวตามคณลกษณะ ID .............................................................. 49 ตารางท 3.5 ผลการวเคราะหขอมลขาวตามคณลกษณะ NAME ........................................................ 49 ตารางท 3.6 ผลการวเคราะหขอมลขาวตามคณลกษณะ ISVERIFIED ................................................. 50 ตารางท 3.7 ผลการวเคราะหขอมลขาวตามคณลกษณะ PROFILEIMAGEURL .................................... 50 ตารางท 3.8 ผลการวเคราะหขอมลขาวตามคณลกษณะ FOLLOWERSCOUNT ................................... 51 ตารางท 3.9 ผลการวเคราะหขอมลขาวตามคณลกษณะ FRIENDSCOUNT ......................................... 52 ตารางท 3.10 ผลการวเคราะหขอมลขาวตามคณลกษณะ FAVOURITESCOUNT ................................. 53 ตารางท 3.11 ผลการวเคราะหขอมลขาวตามคณลกษณะ STATUSESCOUNT .................................... 54 ตารางท 3.12 ผลการวเคราะหขอมลขาวตามคณลกษณะ DESCRIPTION .......................................... 55 ตารางท 3.13 ผลการวเคราะหขอมลขาวตามคณลกษณะ LOCATION ............................................... 56 ตารางท 3.14 ผลการวเคราะหขอมลขาวตามคณลกษณะ TIMEZONE .............................................. 57 ตารางท 3.15 ผลการวเคราะหขอมลขาวตามคณลกษณะ CREATEDDATE ......................................... 58 ตารางท 3.16 ผลการวเคราะหขอมลขาวตามคณลกษณะ STATUS ................................................... 59 ตารางท 3.17 ผลการวเคราะหขอมลขาวตามคณลกษณะ URL ........................................................ 59 ตารางท 3.18 ผลการวเคราะหขอมลขาวตามคณลกษณะ MENTIONS และ NUMBER OF MENTIONS .. 60 ตารางท 3.19 ผลการวเคราะหขอมลขาวตามคณลกษณะ HASHTAGS และ NUMBER OF HASHTAGS . 61 ตารางท 3.20 ผลการวเคราะหขอมลขาวตามคณลกษณะ RETWEETCOUNT ..................................... 62 ตารางท 3.21 ผลการวเคราะหขอมลขาวตามคณลกษณะ TWEETCREATEDDATE .............................. 63 ตารางท 3.22 ผลการวเคราะหขอมลขาวตามคณลกษณะ MESSAGETEXT ........................................ 63 ตารางท 3.23 ผลการวเคราะหขอมลขาวตามคณลกษณะ MESSAGEIMAGE ....................................... 64 ตารางท 4.1 ผลการท านายโดยแบบจ าลองทไดจากแตละวธการเรยนรดวยเครอง .......................... 67 ตารางท 4.2 ผลลพธจากการทดลองการจ าแนกขอมลดวยวธการเรยนรดวยเครอง ......................... 71 ตารางท 4.3 ผลการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองเมอมการลดหนงคณลกษณะ ..... 75 ตารางท 4.4 ผลการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองเมอลดมากกวาหนงคณลกษณะ . 76

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

บทท 1 ทมาและความส าคญของปญหา

ขาวปลอม (Fake news) เปนปญหาส าคญในสงคม การรบรขาวปลอมของประชาชน สงผล

กระทบท าใหเกดความเสยหายจากมลเหตอนเปนเทจได จงมความพยายามในการควบคมดแลขาวปลอม ไมใหมการแพรกระจายไปในวงกวางทงดานกฎหมายควบคมการเผยแพรขอมลอนเปนเทจ [1] ตวอยางการตรวจสอบขอเทจจรงทมการเผยแพรกนในวงกวาง อาทเชน รายการชวรกอนแชร ซงเปนการตรวจสอบขอเทจจรงของขาวปลอมโดยสงผสอขาวออกไปสมภาษณผทมความรความเชยวชาญเกยวกบประเดนทกลาวถงในขาวปลอม แลวจงน ามาเผยแพรเปดเผยขอเทจจรง นอกจากนนยงมเวบไซตทพยายามตรวจสอบขาวปลอมทเกดขนในประเทศไทย

หากจะพจารณาถงขาวปลอมควรเรมตนจากการสงขาว ในอดตเรมจากลกษณะของการบอกตอกนไปเรอย ๆ กระจายขาวออกไปแบบเดยวกบการกระจายขาวลอ เนองจากการบอกตอแบบคนตอคน อาจเกดความคลาดเคลอนไดจากการทคนสอสารพดผด คนฟงเกดความเขาใจผดไป การตความผดความหมาย หรอการขยายความโดยเพมเตมความคดเหนสวนตวทอาจเกดจากความอคต กอนการสงขาวตอไป ท าใหประสทธภาพของการสงขาวท าไดไมดเทาทควร เนอหาของขาวทอาจเกดเปลยนแปลงไป เมอมการสงขาวตอกนไปในระยะเวลาหนง ตอมาราวป ค.ศ. 1439 เมอเรมมการใชกระดาษ จงเกดการบนทกเนอหาขาวตาง ๆ ลงบนกระดาษเปนสอสงพมพกอนสงตอไปยงผรบ [2] จนกระทงววฒนาการตอมาในปจจบนท าใหเกดการสอสารขอมลตาง ๆ ทสามารถท าไดอยางรวดเรวผานระบบเครอขายอนเทอรเนต การสงเนอหาขาวออกไป สามารถสงไดทงขอความ ภาพหรอเสยงไดในเวลาเดยวกน อกทงยงสามารถกระจายขาวสารไปถงผรบปรมาณไดครงละมาก ๆ ในคราวเดยวกน เกดการเปลยนแปลงขอมลใหอยในรปอเลกทรอนกสท าใหสามารถสงตอไดอยางงายดาย ท าใหเนอหาขาวสารสามารถแพรกระจายออกไปไดอยางรวดเรว โดยทผสงไมอาจทราบเลยวา ขาวสารทตนเองไดสงออกไปถกรบไปโดยผใด ในมมมองอกดานหนงทางฝงผรบขาวสารเอง เมอไดรบขาวสารใด ๆ จะทราบไดอยางไรวา เนอหาขอมลขาวสารท ไดรบมา เปนความจรง หรอเปนขอมลทผานการเปลยนแปลงแกไขทอาจถกบดเบอนขอเทจจรงไปกอนหนาหรอไม

ระบบเครอขายอนเทอรเนตทมผใชงานจ านวนมาก ประกอบดวยสวนของเครอขายสงคมออนไลนทปจจบนก าลงไดรบความนยมใชงานกนมาก และยงเปนแหลงก าเนดขอมลขาวสารตาง ๆ ทผคนสวนใหญใชเสพขาวสารเปนเรองปกตในชวตประจ าวน โดยขาวสารทปรากฏตามสอตาง ๆ จะพบวามทงสวนทเปนขอเทจจรง และสวนทเปนขาวปลอมทตองการหลอกลวงใหผคนหลงเชอ เกดความเขาใจผดพลาด คลาดเคลอนไปจากขอเทจจรง อนเกดจากความเขาใจผดของผสงเอง หรอ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

2

เจตนาของผสงขาวทตองการบดเบอนขอเทจจรงของขาวนน อาจเปนความพยายามสรางความคลมเครอระหวางเรองราวเนอหาทเปนความจรงกบขอมลอนเปนเทจ เพอท าลายความเชอถอในเรองราวบางอยาง [3]

การแพรกระจายขาวในอดต เรมตนดวยค าพดของคนโดยสงตอจากปากตอปาก ซงการแพรกระจายขอความผานทางค าพดมโอกาสทจะสอสารกนไดทไมถกตองในหลายดาน อาทเชน ผรบตความไมถกตอง เกดความเขาใจผดจากการสอสารทผดพลาด การมอคตสวนบคคล อาจรวมถงความคดเหนสวนตวกอนทจะมการปาวประกาศออกไป [4] สงผลใหประสทธภาพของการสอสารไมด โดยเนอหาของขาวอาจผดเพยนไปเมอมการสงขอความตอ ๆ กนไปในชวงระยะเวลาหนง [5] [6]

ขอมลขาวทอยในรปแบบอเลกทรอนกสสามารถสงตอไดงายและรวดเรว เนอหาสามารถแพรกระจายไปไดอยางกวางขวางรวดเรว เครอขายสงคมออนไลนกลายเปนแหลงขาวส าคญ มขอมลปรมาณมากมายมหาศาลสามารถสงตอเผยแพรไปบนสอสงคมออนไลน ผอานจงไดรบรเนอหาขาวจากหลายแหลงในคราวเดยวกน [7] [8] [9] แตอยางไรกตาม ขอมลทไมถกตองยงคงแพรกระจายผานไปยงสอสงคมออนไลน

เครอขายสงคมออนไลนทวตเตอร (Twitter) เรมตนใชงานครงแรกตงแตเดอนมนาคม ค.ศ. 2006 ในชวงแรกทเปดใหมการใชงาน ผใชจะสามารถสงเฉพาะขอความทเปนตวอกษรไมเกน 140 ตวอกษร ตอมาไดปรบเพมความยาวในการสงขอความเปนไมเกน 280 ตวอกษร ลกษณะคลายกบการสงขอความผานโทรศพทเคลอนทหรอโปรแกรมสนทนาออนไลน [10] ท าใหผใชงานคนชนกบการใชงานทวตเตอรเพอสงขาวสน ๆ กระชบไดใจความ จากรายงาน “Digital in 2019” ของ We Are Social และ Hootsuite [11] ทมความเกยวของกบสถานการณการใชงานดจทล และอนเทอรเนต ประจ าปค.ศ. 2019 โดยรวบรวมขอมลสถตจากทวโลกรวมถงประเทศไทย พบวาปจจบน โลกมประชากร 7,876 ลานคน แบงเปนผชาย 50.5% และผหญง 49.5% มจ านวนผใชงานอนเทอรเนต ทวโลกราว 4,388 ลานคน คดเปนจ านวนมากกวา 50% ของประชากรโลก โดยมจ านวนผใชโทรศพทเคลอนททวโลก 5,112 ลานคน มจ านวนผใช เครอขายสงคมออนไลน (Online Social Network) 3,484 ลานคน และพบวาจ านวนผใชงานเครอขายสงคมออนไลนมากถง 3,256 ลานคน ใชงานผานโทรศพทเคลอนท ในเดอนเมษายน ค.ศ. 2019 พบวามผเปดบญชใชงานทวตเตอรทวโลกมากกวา 330 ลานบญช และรายงานในสวนของภมภาคเอเชยตะวนออกเฉยงใต ในประเทศไทยมการใชงานทวตเตอรในแตละเดอนประมาณ 89.4 ลานครง จากบญชผใชงานทวตเตอรประมาณ 3.9 ลานคน จากขอมลทกลาวมาน พบวาในประเทศไทยเองมการใชงานทวตเตอรเพอสงขาวสารกนอยางมากมาย จงเกดค าถามวาจะทราบไดอยางไรวาขาวทก าลงอานอยเปนเรองจรงหรอเปนขาวปลอม

จากรายงาน [11] ยงพบวาพฤตกรรมการใชเครอขายสงคมออนไลนทวโลกในการใชงานเครอขายสงคมออนไลนมจ านวนเพมมากขนในประเทศก าลงพฒนา จ านวนผใชงาน เครอขายสงคม

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

3

ออนไลน ป ค.ศ. 2019 อยท 3,484 ลานคน เพมมากขนถง 288 ลานคนจากปกอนหนา โดยประชากรสวนใหญทใชเครอขายสงคมออนไลนเปนกลมอาย 18 – 24 ป และ 25 – 34 ป แตละคนใชเวลาไปกบเครอขายสงคมออนไลน โดยเฉลย 2 ชวโมง 16 นาทตอวน และโดยเฉลยแตละคนจะมบญชเครอขายสงคมออนไลน 8.9 บญช

ปจจบนป ค.ศ. 2019 ประเทศไทยมประชากร 69.24 ลานคน แบงเปนผหญง 51.3% และผชาย 48.7% โดย 50% ของจ านวนประชากรทงหมด อาศยอยในเขตเมอง คนไทยประมาณ 57 ลานคนสามารถเขาถงอนเทอรเนต และนยมใชเครอขายสงคมออนไลน โดยคนไทย 51 ลานคน มการใชงานเครอขายสงคมออนไลนเปนประจ า และมการใชงานอนเทอรเนตเฉลย 9 ชวโมง 11 นาทตอวน โดยใชเวลาอยกบเครอขายสงคมออนไลน 3 ชวโมง 11 นาทตอวน แตละคนมบญชเครอขายสงคมออนไลนเฉลย 10.5 บญช ประเทศไทยยงจดอยในกลม 5 อนดบสงสดของโลกทมบญชเครอขายสงคมออนไลนเฉลยสงสดเปนรองจากอนเดย (12.0 บญชตอคน) อนโดนเซย (11.2 บญชตอคน) เวยดนาม (10.8 บญชตอคน) เทากบโคลมเบย (10.5 บญชตอคน) และมากกวาฟลปปนส (10.4 บญชตอคน) [11]

การทแตละคนมบญชเครอขายสงคมออนไลนจ านวนมาก แสดงใหเหนถงความหลากหลายของเครอขายสงคมออนไลนจ านวนมากทมการใชงานแลว ยงอาจท าใหเกดขาวปลอมขนมาได เนองจากการใชงานทเกดขนในเครอขายสงคมออนไลนท าใหคนไดรบขาวจากหลายชองทาง อนจะกอใหเกดความสบสนเกดความเขาใจผดพลาดสงตอขอมลโดยมไดระมดระวงจนกลายเปนภยคกคามทางสงคม ในสงคมปจจบนหลายประเทศพยายามสรางกลไกปองกนขาวปลอมทแตกตางกน ทงกลไกทางกฎหมายและมาตรการตาง ๆ จากบรษทผใหบรการ กลมคนอายสงวยเปนกลมทมความออนไหวตอการสงสารขอมลอนเปนเทจ เนองดวยความไมรเทาทนสอ หรอเปนความปรารถนาดทตองการสงตอไปยงผรบสาร โดยมไดตระหนกวาการสงตอออกไปเปนการชวยแพรกระจายขาวปลอมใหเผยแพรออกไปรวดเรวมากขน ในประเทศไทยเองมความพยายามควบคมการเผยแพรขอมลบนเครอขายคอมพวเตอรดวยการออกมาตรการทางกฎหมาย เชน การออกพระราชบญญตวาดวยการกระท าความผดเกยวกบคอมพวเตอร (ฉบบท ๒) พ.ศ. ๒๕๖๐ [1]

การเผยแพรขาวปลอมทหวงผลทางการเมอง หรอตองการสรางกระแสขนในสงคมในชวงเวลาหนง ขาวสารตาง ๆ ทผใชไดรบมสวนส าคญส าหรบการตดสนใจคอประเดนความถกตองของเนอหา ขอเทจจรงทเกดขนจรง ๆ ขาวปลอมในดานลบกอใหเกดผลกระทบกบผทเกยวของกบประเดนเนอหา ตวอยางเชน การปลอยขาวปลอมเรองพระอาการประชวรทรดหนก และการเสดจสวรรคตของรชกาลท 9 ในชวงเดอนตลาคม พ.ศ. 2559 สงผลใหนกลงทนในตลาดหลกทรพยในประเทศไทยเกดความหวนวตก ขายหนออกมาจ านวนมากอยางตอเนอง ท าใหดชนตลาดหลกทรพยลดลงอยางหนกโดย

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

4

ลดลงมากทสดถง - 99.08 จด ในมลคาการซอขายมากกวา 91 ลานบาท ภายในชวงเวลาบายของวนท 12 ตลาคม พ.ศ. 2559 [12]

ประเทศไทยตงอยเหนอเสนศนยสตร อยในบรเวณทมโอกาสเกดมรสมเขตรอนไดบอย ดงนนขาวทเกยวของกบภยพบตทางธรรมชาต เชน พายเขา ฝนตก น าทวม เขอนแตกจงเปนขาวทสงผลกระทบตอชวตความเปนอยของประชาชน การรบรขาวสารทถกตอง รวดเรว จะท าใหประชาชนสามารถเตรยมพรอม เพอรบสถานการณภยธรรมชาตทจะเกดขนไดทนเวลา ซงจะชวยลดความสญเสยตาง ๆ ทอาจเกดขนได แตหากประชาชนไดรบขาวปลอมหรอขาวทผดพลาด จะเกดความเสยหาย อาทเชน สถานการณน าทวมฉบพลนทเกดจากการน าปาทไหลลงมา หากประชาชนไมไดเตรยมความพรอมรบสถานการณลวงหนา ขาวของ ทรพยสนตาง ๆ ในบานจะเกดความเสยหายได

ทวตเตอร (Twitter) เปนหนงเครอขายสงคมออนไลนทก าลงไดรบความนยมมากขนเรอย ๆ มผใชจ านวนมากใชขอมลทเผยแพรผานแพลตฟอรมเครอขายสงคมออนไลนทวตเตอรเปนประจ าทกวน การสงขอมลผานทวตเตอรยงเปนการสงขอมลทมประสทธภาพ ถงแมวาผใชจะไดรบอนญาตใหสงขอมลในจ านวนอกขระทจ ากด แตผใชมอสระในการเผยแพรเนอหาเปนอะไรกได ตามแตความตองการ ในชวงหลายปมานผใชงานทวตเตอรทมความประสงคราย สามารถแพรกระจายขอมลขาวสารทเปนอนตราย ซงสงผลกระทบตอความสงบสขของสงคม หรอความปลอดภย ดงนนการแพรกระจายขาวลอหรอขาวปลอมตาง ๆ ทเกดขนในเครอขายสงคมออนไลนไมเพยงแตสงผลกระทบในทางลบ แตยงรวมถงชวตของผคนทไดรบผลกระทบจากขาวปลอมอกดวย [13]

ตวอยางการไดรบขอมลทผดพลาดทเกดขนผานสอสงคมออนไลนอน ๆ เชน WhatsApp เปนตวอยางทชาวอนเดยหาคนถกทบตจนตาย เนองจากผทเขามาท ารายเชอวาผทตกเปนเหยอทงหาคนมความเกยวของกบการลกพาตวเดกตามขอมลทการเผยแพรกนผาน WhatsApp ซงในประเทศอนเดย มผใชงาน WhatsApp ประมาณ 200 ลานคน การสงผานขอมลใด ๆ ผานสอสงคมออนไลนทคนสวนใหญเชอถอยอมสงผลกระทบไดอยางรนแรง ดงผลของการหลอกลวงดวยขอความลกโซหรอขอความทบดเบอนความจรงทแชรใน WhatsApp ทท าใหมคนเสยชวตจรง ๆ จากการสงตอขอมลขาวปลอม [14]

อกตวอยางหนงของผลกระทบทเกดขนจากขาวปลอมคอเรองสลดใจทเกดโดยไมคาดฝน เปนเรองราวของสาเหตทท าใหเกดการฆาตวตายของผอ านวยการส านกงานเศรษฐกจและวฒนธรรมไทเป ในนครโอซากา ประเทศญปน โดยเกดการฆาตวตายโดยการแขวนคอในบานตวเอง เนองจากขาวลอทเกดขนระหวางพายไตฝน Sheppard ในบรเวณเขตคนไซของญปน ท าใหผคนเขาใจผดวามการเลอกปฏบต ในการเขาใหความชวยเหลอระหวางนกทองเทยวชาวจนทเดนทางมาจากแผนดนใหญ กบนกทองเทยวชาวไตหวน [15]

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

5

สองในสามของชาวอเมรกนทใชงานอนเทอรเนต มการใชงานเครอขายสงคมออนไลนเพอรบขอมลขาวสารตาง ๆ [16] การแพรกระจายขาวออนไลนสงผลกระทบตอสงคมโดยรวม ตวอยางเชนในชวงสามเดอนกอนการเลอกตงประธานาธบดสหรฐอเมรกาในชวงปพ.ศ. 2559 (ค.ศ. 2016) มขาวปลอมเกดขนมากมายในสอสงคมออนไลน โดยเฉพาะอยางยงมขาวปลอมทเกดขนมการแพรกระจายไปมากกวา 37 ลานครงบนเครอขายสงคมออนไลนเฟซบก (Facebook) โดยทจ านวนขาวปลอมทมการแพรกระจายกนมากกวาครงหนงมาจากแหลงขอมลทมความนาเชอถอ [17]

ผอานจะทราบไดอยางไรวาขอมลขาวทก าลงอานเปนเรองจรงหรอเทจ เมอในแตละวนผอานไดรบขอมลขาวสารปรมาณมากมาย การพจารณาตดสนใจเชอเนอหาของขอมลทไดรบวาเปนเรองจรงหรอเปนเรองของการเปลยนแปลงบดเบอนขอเทจจรง เปนเรองยากทผอานไมอาจทราบไดวาเนอหาของขอความหรอขาวนนเปนจรงหรอเทจ [18]

จากงานวจย [19] พบวาการกระจายขาวปลอมเกดขนอยางรวดเรว ขาวปลอมสามารถเขาถงผอานไดรวดเรวมากกวาขาวจรงถง 6 เทา ในขณะทปจจบนมการเผยแพรขาวปลอมมากกวาขาวจรงประมาณ 70 เปอรเซนต นอกจากนนยงพบวาการกระจายขาวสวนใหญเกดจากคนจรง ๆ ไมไดเกดจากการกระท าของหนยนต (bot) โดยงานวจยนพบวาเรองราวขาวทไดรบความนยมในการเผยแพรมากทสดเปนเรองทมความเกยวของกบการเมอง ตามดวยเรองราวความลลบทเกยวของกบต านาน ขาวสารทางดานเศรษฐกจ ขาวอาชญากรรมและการกอการราย ขาววทยาศาสตรและเทคโนโลย ขาวบนเทง และขาวภยธรรมชาต

งานวจยสวนใหญท เกยวของกบขาวปลอม เปนงานวจยในภาษาตางประเทศ อาทเชน ภาษาองกฤษ [20] [21] [22] ภาษาอาหรบ [13] [23] [24] [25] แตมงานวจยท เกยวของกบขาวปลอมในภาษาไทยจ านวนไมมากนก โดยงานวจยทมการวเคราะหขาวเพอจ าแนกวาเปนขาวปลอมหรอไมดวยการวเคราะหเนอความในขาว [26] [27] การวเคราะหอารมณความรสกทไดจากการอานเนอความขาว [28] [29] ซงงานวจยทมงเนนกบการวเคราะหเนอหาของขาว เมอมการเปลยนแปลงเนอขาวเปนภาษาอน ๆ บรบททางดานภาษา ไวยากรณหรอความหมายของค าในแตละภาษาจะเปลยนแปลง ท าใหไมสามารถใชผลการวเคราะหทไดกบเนอหาขาวในภาษาทเปลยนแปลงไป นอกจากนงานวจยทเกยวของกบการวเคราะหองคประกอบของขาวปลอม [2] การวเคราะหลกษณะการกระจายของขาวปลอมสผรบสารดวยแบบรปตาง ๆ [6] ยงคงเปนเรองทมความนาสนใจส าหรบอกหลายงานวจย

การประเมนขาวปลอมไมเพยงแตเกยวของกบความนาเชอถอของเนอหาขาวเทานน แตยงรวมถงความนาเชอถอของแหลงสอสงคมออนไลนอกดวย จากปญหาทกลาวมาขางตน ในงานวจยนจงเสนอวธการจ าแนกขาวปลอมทเปนภาษาไทยทไดจากเครอขายสงคมออนไลนทวตเตอร โดยการคนหาคณลกษณะทสามารถใชจ าแนกขาวปลอมออกจากขาวจรง โดยใชกระบวนการว ธการเรยนร

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

6

ดวยเครอง (Machine learning) เพอจ าแนกขาวปลอมจากขอความทมการสงกนในทวตเตอร โดยงานวจยนมสมมตฐานเบองตน ไดแก

1) แหลงขาวทเผยแพรขาวครงแรก มผลตอความนาเชอถอของผรบขาวสาร 2) จ านวนการสงตอขาวสาร (Retweet) กอนหนา มผลตอการสงตออกครงของผอานขาว 3) การสงตอของผอานขาวโดยการระบบคคลทตองการใหรบรเฉพาะ (Mention) แสดงถง

ความมนใจในความนาเชอถอของขาวนน 4) ขาวทมแหลงอางอง เชน รปภาพประกอบ คลปวดทศน หรอแหลงเชอมโยงอน (URL) จะ

ไดรบความนาเชอถอมากกวาขาวทมแตเนอหาเปนขอความเพยงอยางเดยว จากสมมตฐานเบองตนทไดกลาวมาขางตน จะน าไปสเปาหมายส าหรบการท าวจยดงตอไปน 1) ท าใหแยกแยะคณลกษณะของขอมลทสงผลตอจ าแนกขาวปลอมในเครอขายสงคมออนไลน

ทวตเตอร (Twitter) 2) เพอคนหาปจจยหรอคณลกษณะเฉพาะทท าใหสามารถจ าแนกขาวปลอมออกจากขาวจรง 3) เสนอค าแนะน าเพอการหลกเลยงการสงตอ หรอขยายความขาวปลอมออกไป ขอบเขตการด าเนนงานวจย ประกอบดวย 1) งานวจยนใชขอมลจากเครอขายสงคมออนไลนทวตเตอรในการเกบขอมล 2) เลอกเกบขอมล 22 คณลกษณะ จากเครอขายสงคมออนไลนทวตเตอร ไดแก Id, Name, IsVerified, ProfileImageUrl, FollowersCount, FriendsCount,

FavouritesCount, StatusesCount, Description, Location, TimeZone, UserCreatedDate, Status, Url, Mentions, Number of Mentions, HashTags, Number of HashTags, RetweetCount, TweetCreatedDate, MessageText, MessageImage

ประโยชนทคาดวาจะไดรบ 1) ทราบคณลกษณะของขอมลทสงผลตอจ าแนกขาวปลอมออกจากขาวจรงในเครอขายสงคม

ออนไลนทวตเตอร 2) สามารถตดสนใจเชอขาวไดจากคณลกษณะทคนพบ 3) ไดขอเสนอแนะเพอหลกเลยงการสงตอ หรอขยายความขาวปลอม

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

บทท 2 ทฤษฎและงานวจยทเกยวของ

เอกสารบทนแสดงความเกยวของกบหลกการ ทฤษฎตาง ๆ ทเกยวของกบขาวสาร ทงในสวน

ของสอสงคมออนไลนทใชในการเผยแพรขาวสาร การนยามความหมายของขาวจรง ขาวปลอม องคประกอบของขาว ประเภทของขาว ลกษณะเดนของขาวปลอม สาเหตทท าใหเกดขาวปลอมรวมถงเรองทเกยวของกบการจ าแนกขาวปลอม ปญหาและผลกระทบทเกดจากขาวปลอม การปองกนการรบรขาวปลอมเบองตน คณลกษณะเดนของทวตเตอร (Twitter) ตลอดจนงานวจยทเกยวของ ดงรายละเอยดตอไปน

2.1 สอสงคมออนไลนกบการเผยแพรขาวสาร

จากการใชงานอนเทอรเนตและเครอขายสงคมออนไลนในการสอสารระหวางกนเพมมากขน โดยเฉพาะในประเทศไทยทมการเจรญเตบโตดานการใชอนเทอรเนตผานอปกรณไรสายมากเปนอนดบตน ๆ ของโลก [11] ดงนนจงเกดการรายงานขาวทรวดเรว มการสงตอขาวสารทไดรบทงเรองจรงหรอเรองหลอกลวง โดยทผสงเองอาจไมไดตรวจสอบและไมทราบวาสงทไดสงตอไปนนเปนเรองจรงหรอไมจรง

แตละวนาทมขอมลใหม ๆ เกดขนมากมายนบไมถวนบนเครอขายสงคมออนไลน ไมวาจะเปนขอมลขาวสาร กจกรรมตาง ๆ เนอหาบทความทมคนสรางขนใหมตลอดเวลาผานสอตาง ๆ โดยในทน สอ มความหมายถง ภาพ เสยง เนอหา ทประกอบดวยขอมลทผรบและผสงสามารถใชสอสารถงกนได ตามวตถประสงคทตองการ

คนทใชอนเทอรเนตในชวตประจ าวน สวนใหญจะไดรบขาวสารตาง ๆ เปนกจวตรจากแหลงขาวตาง ๆ หลายแหลง ทงสวนทเปนเครอขายสงคมออนไลน (Online Social network) เชน Facebook, Twitter หรอเวบไซตบรการของแหลงขาวตาง ๆ เชน Thairath, Dailynews, Nations, Manager, Khaosod, Matichon, Kapook, Pantip หรอแมแตเวบไซตเลยนแบบส านกขาวทปลอยขาวปลอม ซงปรมาณขอมลขาวสารทเกดขนมามากมายประกอบดวยขาวจรง ขาวปลอม ขาวลอ ความคดเหนสวนบคคลทเกยวกบขาว ความหลากหลายของขาวทมการผสมปนเปกนท าใหผรบขาวสารแยกแยะความจรงไดยาก เกดความสบสนในการรบรขาวสาร ซงน ามาใหเกดความเสยหายในชวตและทรพยสนได

เครอขายสงคมออนไลนทวตเตอร (Twitter) เปนชองทางการสอสารของขาวทนเหตการณชองทางหนงทไดรบความนยมในการกระจายขาวสารตาง ๆ อยางรวดเรว ดวยคณลกษณะของ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

8

ทวตเตอรทสามารถสงขอความสนไดอยางกระชบ ท าใหผรบสามารถรบรประเดนส าคญของขาวไดโดยไมเสยเวลามากนก และสามารถสงตอใหใครกไดอยางรวดเรว

เมอมการรบสงขาวสารกนอยางมากมาย ปญหาทตามมาคอ การจ าแนกเนอหาขาวสารเมอผรบขาวสารไดรบวาขาวนนเปนเรองจรงหรอเรองหลอกลวง ซงการสงตอเรองราวทไมเปนความจรงอาจกอใหเกดผลกระทบไดทงในดานดและดานรายตามมา ดวยเนอหาเรองราวทปรากฏในขาวอาจเปนเรองไมดส าหรบคนบางกลมในขณะเดยวกนอาจเปนเรองทดส าหรบคนอกกลมกเปนได ตวอยางเชน ขาวเขอนแตกท าใหเกดน าทวม หากพจารณาในดานความเสยหายทเกดขนกบกลมคนทอาศยอยในพนททเกดเหตการณ ยอมไดรบผลกระทบและเกดความสญเสยในทรพยสน ท าใหสภาพจตใจย าแย เกดความเครยดสะสม แตจากเหตการณเดยวกนน หากพจารณาในดานบวกจากคนอกกลม หลงจากเหตการณน าทวมจะตองมการฟนฟสภาพบานเรอนทอยอาศย ยอมเปนโอกาสของกลมผรบเหมากอสรางทจะมงานท า หรอกลมสถาบนการเงนทจะมลกคาเพมขนจากการกยมเงนมาซอมแซมบานเรอน นกจตวทยามกรณศกษาเพมขน ในการเขาไปมสวนรวมใหค าปรกษาเพอฟนฟสภาพจตใจ ลดความเครยดใหผประสบภย แตในดานความรสกของคนทไมไดรบผลกระทบกบเหตการณโดยตรง อาจพจารณาไดวาเปนเรองราวทนาสงสาร นาเหนใจ และควรชวยเหลอผประสบภยมากกวา

ความสมพนธระหวางผใชในเครอขายสงคมออนไลน เปนความสมพนธรปแบบเฉพาะท ไมสามารถพบไดในการส ารวจผอานขาวจากหนงสอพมพหรอสออน ๆ ทวไป การทผใชในเครอขายสงคมออนไลนสามารถสงตอขาวสารใหคนอนทรจกกนเปนการสวนตวหรอใครกได ซงเปนการบงชประการหนงไดวา คนรบขาวมความเชอมนในเนอหาขาว มนใจวาการเผยแพรกระจายขาวนนเปนเรองจรง สามารถสงตอไปยงผอนได ดงนนแหลงขาวตงตนทเรมตนเผยแพรขาวครงแรกไมวาจะมความนาเชอถอมากหรอนอยเพยงใด ยอมสงผลท าใหผใชทไดรบขาวยนยอมทจะเผยแพรขาวตอไปหรอไม

การเผยแพรขาวสารในแนวรปแบบของ Clickbait โดยการใชประเดนขาวปลอมในการพาดหวขาว หลอกลวงใหผอานเกดความสนใจแลวคลกเพอหารายละเอยดมากขน เกดขนกบหวขอพาดขาวทงขาวจรงและขาวปลอม โดยการหลอกลอใหคลกลงคดวยการใชขอความพาดหวทเกนจรง หรอเปนเรองทคนสวนใหญก าลงอยากรในชวงเวลานน ท าใหสามารถดงดดความสนใจคนไดจ านวนมาก ๆ แตเมอเขาไปดรายละเอยดขาวแลวจะพบวาไมมสาระตามหวขอหรอขอความพาดหวขาว บางครงอาจสรางขาวปลอมขนมาเพอหลอกผอานหลงเชอ ท าใหคนสนใจแตพาดหวขาวสงตอขอมลออกไป ดงนนขาวปลอมเหลานจงสามารถกระจายออกไปเปนวงกวางไดเรอย ๆ โดยเปาหมายของการท า Clickbait คอตองการใหเกดการคลกเขาไปดจ านวนมาก ๆ หรอเขาไปมปฏสมพนธกบหนาเวบเพจเพอแสดงโฆษณา ในสอสงคมออนไลนมความพยายามในการเผยแพรขาวสาร ประเดนส าคญทท าใหผคนเกด

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

9

ความสนใจและตดตาม ท าใหผสรางขอมลไดรบประโยชนจากเงนคาโฆษณาเมอมคนสนใจจ านวนมาก ซงปญหาทเกดขนนไมเพยงหลอกใหผสนใจขาวเสยเวลา ในบางกรณรายละเอยดของเนอขาวยงไมเปนความจรงอกดวย ปญหานไมเพยงแตพบมากในประเทศไทย ยงเปนปญหาทสามารถพบไดทวโลก และยงคงเปนทสนใจในผคนมากมาย โดยเฉพาะหลงจากเกดเหตการณการปลอยขาวลอ ขาวปลอมตาง ๆ ชวงกอนการเลอกตงประธานาธบดประเทศสหรฐอเมรกาเมอป ค.ศ. 2016 [17]

ขาวปลอมสวนมากจะมการอางองถงขาวลอในประเดนทก าลงเปนทถกเถยงกนในสงคม อกทงขาวปลอมทสงเปนขอความยงมความคลายคลงกบขาวจรงหรอขาวลอมาก ๆ ทเปนประเดนทก าลงมการพดถงกนอยางมากในสงคม ขาวปลอมสามารถแพรกระจายไดอยางงายดายทางสอสงคมออนไลน จดหมายอเลกทรอนกส การสงขอความคยกนโดยตรง และการสงขอความไปยงทกคนโดยไมระบชอผรบปลายทาง ซงเปนการเผยแพรแบบสาธารณะได คณลกษณะของขาวปลอมสวนมากใชขอมลพนฐานจากความจรงและเปนสงทคนก าลงใหความสนใจ โดยมการเตมแตงความคดเหนสวนบคคลเพมเตมลงไป [30]

ขาวปลอมสามารถกอใหเกดความผดพลาดจากความหวาดระแวงและความกลวในภยธรรมชาต การจดการลงทนทางธรกจผดพลาดมาจากการตดสนใจจากการไดรบขาวปลอมเชนกน หรอแมแตขอมลประกอบการตดสนใจเลอกตง สามารถเกดความผดพลาดจากการไดรบขาวปลอมแงลบในฝายตรงขามได [19]

ขาวปลอมทเกดขนในทวตเตอร เรมตนจากผใชท อางสทธถงขอความ รปภาพ หรอสวนเชอมโยงไปยงบทความออนไลนหรอหลกฐานทมความเกยวของกบเนอหาทตองการสอสาร แลวคนอนทเหนเผยแพรตอดวยการสงตอ ขอความนนอกครง มหลายหนวยงานใหความส าคญในการวเคราะหขาว จากตวอยางทเกดเวบไซตบรการตรวจสอบคนหาความจรง โดยการท างานของเวบไซตเหลานตองการใหมการระบหวขอขาว เนอหาขาว เพอจะน าขอมลไปประมวลผลออกมาเปนความนาเชอถอของหวขอขาวทระบ [6] [21] [24] โดยมทงสวนทใชคนในการตรวจสอบความจรงและใช ขนตอนวธหรออลกอรทม (Algorithm) ในการประมวลผล [31] ความนาเชอถอของขาว ควรพจารณาถงทมาของขาวจากแหลงขาวทมความนาเชอถอ อาจเปนองคกรทน าเสนอขาว หรอเปนบคคลทมความรความเชยวชาญเฉพาะดาน หรอเปนผทสามารถใหขอเทจจรงได โดยไมมความผดพลาดในการเสนอเนอหา ตลอดจนไมมการบดเบอน หรอแสดงความคดเหนทมความล าเอยงกบขอเทจจรงของเนอหา หรอแสดงอคตกบประเดนเนอหาทตองการน าเสนอ [31]

2.2 นยามของขาวและขาวปลอม

จากพจนานกรม ฉบบราชบณฑตยสถาน พ.ศ. ๒๕๕๔ [32] ใหนยามความหมายของค าทเกยวของกบขาวทเกยวของกบงานวจยน ดงตอไปน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

10

"ขาว" หมายถง ค ำบอกเลำเรองรำวซงโดยปรกตมกเปนเรองเกดใหมหรอเปนทสนใจ ค ำบอกกลำว ค ำเลำลอ

"ขาวกรอง" หมายถง ขำวทไดตรวจสอบหลกฐำนแลววำเปนขำวทเชอถอได "ขาวลอ" หมายถง ขำวทพดกนทวไป แตยงไมมอะไรยนยนไดแนนอน ขาว หมายถง การรายงานสถานการณหรอเหตการณทเปนขอเทจจรงทเกดขนหรอขอคดเหน

จากบคคลส าคญทคนใหความสนใจ อาจจะเปนเรองทมผลกระทบตอคนในสงคม หรอเปนเรองราวใหม ๆ ขอมลใหมทมเนอหาทคนสวนใหญยงไมทราบ หรออาจเปนเรองราวเสยดส ในบางครงอาจมการน าเรองจรงมาเขยนลอเลยนใหกลายเปนเรองตลกขบขน

จากความหมายของค าวาขาวในพจนานกรม ฉบบราชบณฑตยสถาน พ.ศ. ๒๕๕๔ ไมปรากฏการนยามความหมายของค าวา "ขาวปลอม" หรอ "ขาวลวง" ในทนจงใชความหมายจากค าทเกยวของในสวนของ "ขาวกรอง" เปนความหมายในทางตรงกนขาม และ "ขาวลอ" ในความหมายท ขาวลออาจจะเปนขอมลจรงกไดหรออาจจะเปนสวนหนงของขาวปลอม

ดงนน "ขาวปลอม" หรอ "ขาวลวง" จะหมายถง ค าบอกเลาเรองราวทเปนเรองเกดใหมหรอเปนเรองทผคนใหความสนใจ อาจเปนค าบอกกลาว ค าเลาลอทยงไมมหลกฐานยนยนวาเปนเรองจรงทนาเชอถอ หรออาจเปนเหตการณทมผเกยวของออกมาแถลงการณยนยนแลววาเนอหาขาวได ถกบดเบอนไป หรอไมไดเปนความจรงตามทเนอขาวนนไดกลาวอาง

การตรวจสอบขอเทจจรงของขาววาเปนความจรงหรอเปนขาวปลอม จงมความจ าเปนตองศกษาวจยคนควา เพอคนหาปจจยหรอคณลกษณะเฉพาะทท าใหสามารถจ าแนกขาวปลอมออกจากขาวจรงได ซงจะเปนการชวยใหผรบขาวสารสามารถตดสนใจเลอกวาจะสงตอขาวสารนนตอไปอกหรอไม เพอใหสงคมเกดการสงตอขาวสารทเปนจรง สงผลใหเกดความชวยเหลอกนในเหตการณจ าเปนอยางทนเวลา เกดการรบรเรองราวด ๆ ทท าใหทกคนมความเบกบานใจ ไมเครยด เมอผ คนสบายใจจะท าใหจ านวนผปวยตาง ๆ ท เกดความอาการผดปกต ทมสาเหตเนองมาจากความ ไมสบายใจมจ านวนลดลง [3]

หากเนอหาขาวเปนความจรง จะตองมหลกฐานจากขอเทจจรงทปรากฏอยางชดเจน สามารถพสจนได แตหากเปนขาวปลอม ทอาจเกดจากค าเลาลอ การบอกตอ รวมถงการสงตอทเกดขนในสอสงคมออนไลนตาง ๆ จะไมสามารถหาหลกฐานมายนยนความถกตอง อกทงขาวปลอมทเกดขน ยงอาจสงผลเสยหายตอบคคล สงคม เศรษฐกจ ประเทศชาต

ตวอยางขาวปลอมทเปนปรากฏการณครงแรกทมการบนทกไว ถกคนพบเมอปค.ศ. 1835 ในหน งสอพมพ The Sun ของน วยอรก เปนบทความท ม เน อหาทางดานดาราศาสตร ของ Sir John Herschel [33] ทกลาวถงสงมชวตมหศจรรยทอาศยอยบนดวงจนทร โดยอางองจากการส ารวจดวงจนทรดวยกลองโทรทรรศนแบบพเศษ ซงเปนบทความ 6 เรองทในเวลาตอมาเปนรจกกน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

11

ในชอ The Great Moon Hoax ถงแมวาเนอหาในบทความจะเปนเรองไมจรง แตกกลายเปนประเดนในวงการดาราศาสตรยคนน เนองจากมผคนมากมายใหความสนใจ และตอมาภายหลงบทความนไดกลายเปนเรองอานสนกราวกบนวนยาย เมอทกคนทราบความจรงวาเนอหาในบทความไมใชเรองจรง

ขาวปลอมเกดจากขอมลทผด [29] [33] และขอมลทถกบดเบอน หลายหนวยงานมความพยายามในการใหค านยามเกยวกบขาวปลอม ดงตวอยางตอไปน

firstdraftnews.com กลาววา ขาวปลอม เปนเพยงสวนหนงของขาวทเกดจากการสอสารขอมลทผดพลาดและถกบดเบอน

หองปฏบตการวจย Nieman Lab ในมหาวทยาลย Harvard พจารณาจากบทสรปในการศกษาวจยทเกยวของกบการเพมขนของการรายงานขาวจากขอมลทเปนขาวปลอม เกดจากขอมลทผดพลาด เนอหาทบดเบอน การรบรขาวสารตาง ๆ ของผคน และยงมการพจารณาการเผยแพรขาวปลอมรวมถงการแพรกระจายของขอมลขาวทมเนอหาไมถกตอง

แนวคดจากศาสตราจารย Melissa Zimdars ผเชยวชาญทางดานนเทศศาสตรของ วทยาลย Merrimack ไดกลาวถงขาวปลอมวาเปนขอมลทไมเปนความจรง เปนขอมลทท าใหคนเกดความเขาใจผด หรอขาวเสยดสตาง ๆ ทจ าตองพจารณาการวเคราะหแหลงขาว ตลอดจนวเคราะหจ านวนรายการตาง ๆ ทมการสอสารผดพลาด รวมถงแหลงขาวท เผยแพรขาวเสยดสออกสสาธารณชน

ขาวปลอมสวนใหญเกดจากบญชทไมไดเปนทรจกกนมากนก บางครงไมได เปนบคคลทมความโดดเดนหรอมชอเสยง ไมไดเปนกลมคนทมอทธพลทางออนไลน ตองการสรางกระแสในโลกออนไลน ขาวปลอม การแพรกระจายออกไปไดไกลมากเพยงใดขนอยกบการสงตอของกลมคนทมอทธพลในโลกออนไลน (Online Influencer) เนองจากกลมคนเหลานมผตดตามจ านวนมาก ดงนนการแสดงหรอสงตอขาวปลอม หรอเพยงการกลาววามคนลอวา กอาจเปนประเดนทกอใหเกดความสงสยขนมาได ในทางการเมองขาวปลอมทเกดขนสงผลทางจตวทยากบประชาชน แมวาผสงขาวตออาจจะทราบวาเปนขาวปลอม แตยงมการสงขาวตอไปอยางตอเนองทจะท าใหเกดผลบวกกบฝายการเมองฝงทตนเองชนชอบนนเอง [17]

ขาวปลอมทเกดจากความเขาใจคลาดเคลอน (Mis-Information) เปนการสงตอขาวปลอมโดยไมไดตงใจ ไมมเจตนาปนปวน ไมเจตนาท ารายใคร แตมการสงตอขาวไปจากความไมร โดยไมทราบวาสงทสงตอไปนนเปนเรองไมจรง เปนเรองทถกหลอกลวง หรอในบางครงขาวทสงตออาจเปนเรองทขอเทจจรงยงไมคลคลาย แตในทายทสดพบวาเปนเรองไมจรง

2.3 องคประกอบของขาว

ขาว ทท าใหผอานใหความสนใจ ประกอบดวยโครงสรางส าคญ [2] [3] ดงตอไปน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

12

ทมาของขาว อาจเปนผเขยนขาวหรอส านกพมพหรอหนวยงานทเผยแพรขาว พาดหวขาวเปนขอความสน ๆ และกระชบ ใชแสดงใจความหลกและประเดนส าคญท

เปนความนาสนใจของขาว เพอดงดดความสนใจของผอาน อกทงยงเปนสวนส าคญทสามารถตอบสงทผ อานตองการทราบจากขาวได โดยสามารถตอบค าถามในรปแบบ 5W1H ไดแก ใคร (Who) ท าอะไร (What) เมอไหร (When) ทไหน (Where) ท าไม (Why) อยางไร (How)

เนอหาขาวเปนขอความทแสดงรายละเอยดทเปนใจความส าคญของเรองหรอเหตการณ เปนล าดบเหตการณหรอรายละเอยดเฉพาะทตองการสอในขาว

รปภาพ หรอ วดทศน แสดงรายละเอยดประกอบเนอหาขาวทท าใหเหนอานเหนภาพของเรองราวขาวไดชดเจนกวาการอานขอความเพยงอยางเดยว

เงอนไขของเหตการณทน ามาเสนอเปนขาว เพอใหไดรบความสนใจจากผอาน ประกอบดวย มการรายงานดวยความรวดเรว ทนตอเหตการณทก าลงเกดขนในขณะนน หรอเพงจะ

เกดขนในเวลาไมนาน หรอสามารถน าเสนอขาวสารไดอยางรวดเรวทนททนใด เปนขอมลของเหตการณทเกดขนแลวจะมความเกยวของกบผอาน เปนเรองใกลตวท

อาจพบไดในชวตประจ าวน หรอเปนเรองสงผลกระทบโดยตรงตอผอาน เปนเรองทสงผลตอความเปนอยของผคนแตละคนมากนอยเพยงใด หรอสงผลกระทบตอคนสวนใหญในสงคม หากเปนเรองทมผลกระทบมาก ขาวนนยอมจะไดรบความสนใจจากผอานมากขน

เปนเหตการณทเกดกบบคคลส าคญ บคคลทมชอเสยง หรอสถานทส าคญททกคนรจกกนด

ความผดปกตหรอเหตการณแปลกประหลาดทเกดขน ทไมเคยเกดขนมากอน เหตการณทท าใหผคนเกดความสงสยและสนใจ

ความมเงอนง า ความนาสงสยของเหตการณทสาเหตท าใหเกดนนยงไมถกเปดเผย จงยงท าใหเหตการณยงเปนทนาสนใจของคนทมความอยากรอยากเหนกบเหตการณนน ๆ

ความขดแยงกนทเกดขนในเหตการณมการใหขอมลทไมตรงกน โดยปกตคนสวนใหญจะใหความสนใจกบประเดนความขดแยง ไมวาจะเปนความขดแยงดานการแสดงความคดเหน หรอความสมพนธตาง ๆ และกอใหเกดปญหาอน ๆ ตามมา

เปนเรองราวทท าใหเกดอารมณรวมไปกบเหตการณหรอบคคลในขาว อาจจะเปนเรองนาตนเตน ท าใหเกดความปลมปต ดใจ ใหความชนชมยนด หรอกอใหความเศราโศกสะเทอนใจ

ความเจรญกาวหนาในการพฒนาดานตาง ๆ ทงดานเทคโนโลย การประดษฐคดคนนวตกรรมใหม ๆ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

13

2.4 ประเภทของขาว การน าเสนอขาวสวนใหญแบงตามประเภทของหวขอการพาดขาว ดงน เหตการณปรากฏการณทางธรรมชาต และภยพบตจากภยธรรมชาต เศรษฐกจ การคาและการลงทน อาชญากรรม สงครามและการกอการราย การเมอง วทยาศาสตรเทคโนโลย สงแวดลอม กฬา ขาวบนเทง ขาวทวไป จากงานวจย [27] พบวาขาวปลอมทพบมากในปจจบน สามารถแบงประเภทตามระดบความ

รนแรงของผลกระทบไดดงตอไปน ขาวหลอกลวงทสงผลรนแรง เปนรายงานความรนแรงทไมเคยมการรายงานหรอ

กลาวถงมากอนทงในสอสงพมพและสอออนไลนตาง ๆ การเปดเผยประเดนขาวลกษณะนมความเหมาะสมทจะน ามาจดเกบเปนฐานขอมลขาวปลอม แตการเกบขอมลในลกษณะแบบนตองใชเวลานานและจะตองมการเกบส าเนาตนฉบบเพอใชอางองขาวทเกดขน

ขาวหลอกลวงทสงผลกระทบในวงกวาง เปนการหลอกลวงเปนอกรปแบบหนงทมเจตนาปลอมแปลง ในสอหลกตาง ๆ บนเครอขายสงคมออนไลน เจตนาและมความพยายามทจะบดเบอนขาวโดยการหลอกลวงผอานดวยเนอหาขาวอนเปนเทจ อาจท าใหสออนหลงเชอ รวมรายงานขาวหลอกลวงนดวยความไมรจรง และน าไปรายงานซ าอกดวย

ขาวปลอมทเปนเรองตลก อาจเปนเรองนาข าขน ทผอานจะรสกถงอารมณรวมไปกบการรายงานขาว เชน ขาวลอเลยน ขาวหยอกลอทางการเมอง การวจยในขาวกลมนมความพยายามใชเทคโนโลยทหลากหลายเพอการวเคราะหอารมณความรสกดานบวกหรอดานลบหลงจากทผอานไดรบรเนอหาขาว

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

14

2.5 ลกษณะของขาวปลอม ปญหาหนงในการวเคราะหขาวคอการแยกขาวปลอมออกจากขาวจรง ซงจดเดนของขาวปลอม

สวนใหญทพบมขอสงเกตดงน [22] [31] Clickbait มการพาดหวขอขาวทท าใหตกใจ คนอานเกดความสนใจอยากรจงคลกเขามา

ดรายละเอยดเนอหามากขน แตเนอหารายละเอยดภายในขาวไมปรากฏสาระส าคญ หรอในบางครงอาจเปนเรองไมจรงทงหมด เพยงตองการหลอกใหคนตนตกใจ อยากรอยากเหนและคลกเขามาดรายละเอยดเพมขนเทานน [34]

Propaganda เปนขาวในลกษณะของการโฆษณาชวนเชอทมเจตนาหลอกใหคนอานเขาใจผด แสดงการตอตาน หรอมการยยงปลกปน กอใหเกดความเกลยดชงกน และเกดความไมสงบ

Commentary/Opinion เปนการแสดงความคดเหนหรอแสดงปฏกรยาตอบโตดวยความล าเอยงดานใดดานหนงกบเหตการณทเกดขนในขณะนน ในบางครงมความพยายามชกจงใหผอานเกดความเหนคลอยตามกนไปดวย

Humor/Satire เปนบทความเนนดานความบนเทง อาจเปนเรองตลก เรองราวการลอกนเลน เพอใหเกดความสนกสนานเพลดเพลนในการรบชมและไมใหเกดความเครยด

หากพจารณาจากมมมองตามแบบสงคมศาสตร (Social Science) ลกษณะของขาวปลอมแบงเปนประเภทตาง ๆ ดงน [35]

• Visual-based: ใชกราฟกหรอสอประสมตาง ๆ ในการแสดงเนอหาขาว อาจอยในรปแบบรป ภาพ วดทศน หรอทงสองแบบ

• User-based: ผใชงานใชบญชปลอมในการเผยแพรขาว เพอใหสงตอขาวไดตรงกบกลม เปาหมายทตองการ โดยอาจก าหนดประวตผใชงานตามกลมอาย เพศ เรองราวทสนใจรวมกน

• Post-based: ตามลกษณะการโพสตบนกลมทขาวนนไปปรากฏบนสอเครอขายสงคมออนไลน ในรปแบบขอความ รปภาพ ภาพเคลอนไหว หรอวดทศน

• Network-based: เครอขายทเชอมตอกน หมายถงกลมคนทมความสนใจบางอยางรวมกนหรอชอบเขารวมกจกรรมบางอยางดวยกน

• Knowledge-based: กลมทแบงปนขอมลผด ๆ บางอยางรวมกน บนความเชอรวมกนวาสงนนเปนความจรง

• Style-based: เปนรปแบบทขาวปลอมถกน าเสนอโดยบคคลธรรมดาทไมใชนกขาวอาชพ เพยงแตตองการรวมรายงานขาวคราวตาง ๆ

• Stance-based: เนนไปทวธการแสดงขอความขาวทงในสวนของการพาดหวขาวแสดงความเหนดวยหรอไมเหนดวยกบแตละขาวเฉพาะ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

15

2.6 สาเหตทท าใหเกดขาวปลอม สาเหตทผอานใหความสนใจขาวปลอม ขาวลวง เกดจาก

ผคนสนใจอยากรอยากเหนและสงสยในขาวทเปนประเดน อาจเปนเรองทอยบนพนฐานขอเทจจรงบางอย าง หรออาจเปนเรองหลอกท แต งขนก ได ซ งความไมแนนอนท ปรากฏ ในเนอหาขาว จะกระตนใหผคนสนใจตดตามอยางไมรตว

ผคนสวนใหญมความอยากรอยากเหนในเรองคนอน เนองจากมนษยเปนสตวสงคม จงมความอยากรอยากเหนในเรองราวตาง ๆ ทเกดขนในสงคม ทแมจะไมใชเรองของตนเองกตาม

ผคนชอบเรองทเหนคนอนท าอะไรผดไปจากท านองครองธรรมทควรจะเปน เนองจากจะท าใหรสกสะใจแบบลก ๆ เหมอนก าลงไดตดตามนยายเรองหนง

ผอานชอบอานเรองราวทตวเองจะเดาตอนจบของเรองได ไมวาเรองราวนนจะเปนจรงหรอไมกตาม หรอจะมความเปนไปอยางไร ซงเรองราวทไดอาน ท าใหเกดความตนเตน สนใจตดตามตอนจบจรง ๆ ทจะเกดขน

ผอานชอบการวพากษวจารณ ซงในขาวฉาวสวนใหญจะเปนเรองราวการกระท าความผดของคน ซงเมอเรองราวถกเปดเผยสสาธารณชนแลว จะมการวเคราะหโจษจนในลกษณะวากลาวตตง นบวาเปนการลงโทษจากสงคมออนไลน โดยผคนสวนใหญจะรสกพอใจกบผลการกระท าจากสงคมออนไลนในลกษณะทพงพอใจกบความยตธรรมทเกดขน และมความพงพอใจกบการลงโทษคนผดในประเดนขาว

“ความอยากรอยากเหน” คอ ความตองการทจะเรยนรหรออยากรเรองราวตาง ๆ โดยนกจตวทยา George Loewenstein ไดกลาววา ความอยากรอยากเหนเปนแรงจงใจส าคญทสงผลตอพฤตกรรมของมนษย [29]

วตถประสงคของผสรางขาวปลอม [36] 1) ตองการสรางกระแสสงคม เพอใหผคนหนมาใหความสนใจผสรางขาวปลอม 2) อยากเปนบคคลทมชอเสยง และเปนทนาจดจ าของคนทวไป 3) การหวงผลทางการเมอง โดยการปลอยขาวทท าใหเกดกระแสความนยมกบนกการเมอง

บางคน หรอขาวทท าใหเกดความเขาใจผดในฝายตรงขาม ซงอาจกอใหเกดกระแสตอตานอนสงผลตอสถานภาพทางการเมอง เชน ขาวลอ ขาวปลอมตาง ๆ ทเกดขนในชวงระหวางการหาเสยงเลอกตงประธานาธบดในประเทศสหรฐอเมรกาเมอป ค.ศ. 2016 [17]

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

16

2.7 วธการจ าแนกขาวปลอม เมอผอานไดรบขาวสารใด ๆ จะมความเชอมนความจรงทปรากฏในเนอหาขาวนนไดมากนอย

เพยงใด มงานวจย [20] ไดกลาวถงวธการพจารณาขาวปลอมเบองตนไวดงน 1) แหลงทมาของขาว

แหลงทมาทน าเสนอขาว เปนแหลงขาวทเปนองคกรน าเสนอขาวอาชพ หรอแหลงขาวทเปนบคคลทมชอเสยง หรอเปนเพยงบคคลทวไป [35]

ความนาเชอถอของแหลงขาว เปนแหลงขาวท ไม เคยเสนอขาวผดพลาด ขาวปลอม หรอขาวลอตาง ๆ

แหลงขาวนนมาจากผทมความรจรง หรอเปนผทมความเชยวชาญเกยวของกบเนอหาทปรากฏ หรอเปนนกวชาการดานตาง ๆ ทเกยวของ

แหลงขาวทใหขอมลเปนบคคลทไดรบผลกระทบโดยตรงจากการน าเสนอขาวปลอม อาจจะเปนบคคลในขาว หรอผทอยรวมในเหตการณ

พจารณาเรองราวทปรากฏในเวบไซตเพอส ารวจเวบไซต ภารกจของหนวยงาน และมขอมลส าหรบการตดตอ

ขาวจากแหลงเดยวกน สามารถเผยแพรกระจายออกไปอยางรวดเรวโดยการสงตอในหลายชองทางเครอขายสงคมออนไลนทงทางเวบไซต หรอเครอขายสงคมออนไลน [37]

2) ผเสนอขาว ประวตของผน าเสนอขาว ความเชยวชาญ ช านาญในงานเฉพาะดาน ความ

นาเชอถอทเกยวของกบเนอหาทน าเสนอนน ๆ ซงอาจเปนบคคลหรอองคกรสอสารมวลชน ผน าเสนอขาว แสดงขอมลทเกยวของทมความนาเชอถอ และความมตวตนจรง ๆ

โดยทอาจเปนส านกขาว ผสอขาว รวมถงนกเขยนบทความผาน blogger ความถในการโพสต ความถในการน าเสนอขาว หรอความถในการกระจายขาว

สงตอขาว การตอบสนองตอเนอหาทน าเสนอ หรอการตอบโตดวยการแสดงความคดเหน

ตาง ๆ พจารณาความคดเหน ความเชอสวนบคคล และผลกระทบกบการตดสนใจ ม

ความนาเชอถอระดบใด 3) เนอหา

การหวขอพาดขาวมความสมพนธกบเนอหาทงหมดหรอไม หรอเพยงตองการชกชวนใหผอานสนใจคลกเขาไปดรายละเอยดของขาวเทานน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

17

รายละเอยดของเนอหาขาว อยในหลายรปแบบ ดงตอไปน [35] [38] [39] [40] [41] [42] [43] [44] [45] [46]

ตวอกษรท เปนขอความในการบรรยายเนอหาขาว มการวเคราะหความหมายของขอความ การวเคราะหความหมายแฝง การวเคราะหหวขอขาว

รปภาพประกอบทเกยวของกบเนอหา หรอเหตการณทตองการน าเสนอ อาจพจารณาความเหมอนความคลายกนของรปภาพ ความหลากหลายของรปภาพทแสดง การคนคนรปภาพทเกยวของ การพจารณาคณลกษณะตาง ๆ ของรปภาพในเชงสถต

วดทศนทเกยวของกบเหตการณขาวนน ๆ จดเชอมโยง อางองไปยงแหลงขาวอนท เกยวของกบเหตการณ ม

แหลงขอมลทสนบสนนเนอหาขาวมความนาเชอถอมากนอยเพยงใด 4) เหตการณ

พจารณาจากประเภทของเหตการณทเกดขน ผลกระทบทเกดจากเหตการณ เกดขนกบบคคล องคกร หรอสงคม สามารถแสดงหลกฐานหรอขอพสจนทางวทยาศาสตรทสามารถยนยนความ

ถกตองของขอมลทน าเสนอในเหตการณได เนอหาขาวท เกยวของกบเหตการณ การประมวลผลภาพ การพจารณา

ความสมพนธระหวางต าแหนงทเกดกบภาษาทใชในการน าเสนอเหตการณ ประเภทของเหตการณ อาทเชน อาชญากรรม รฐบาลและการเมอง เศรษฐกจและส งคม สภาพภมอากาศ เรองราวทเกยวของกบความบนเทง ขาวสารทเกยวกบราชวงศ บคคลทมชอเสยงและทรงอทธพลในแตละวงการ

5) เวลา เวลาทเกดเหตการณ เวลาทมการน าเสนอขาวทเกยวของกบเหตการณครงแรก ระยะเวลาทยงคงมการกระจายขาวทเกยวของกบเหตการณนน ความทนสมยของวนเวลาทน าเสนอเหตการณ การน าเสนอเรองราวเกา ๆ ทม

ความเกยวของกบเรองราวในปจจบน การเสนอขาวสารในเวลาทลวงเลยมาแลว จะตองสามารถแสดงหลกฐานเพอ

ประกอบการพจารณาตดสนใจความนาเชอไดหรอไมได แตหากเปนเวลาทเหตการณนนยงไมเกดขน ยงไมสามารถพจารณาวาเกดเหตการณจรง เชนเดยวกบทกลาวหรอไม หรอเกดเหตการณขดแยงกบประเดนขาวทมการกลาวอางถงหรอไม ท าไดเพยงรอใหเวลามาถงแลวจงจะทราบขอเทจจรง

การวเคราะหขอความขาวเพยงอยางเดยว ไมสามารถน ามาใชวเคราะหแยกขาวปลอมไดถกตอง การประเมนขอมลจากสอเครอขายสงคมออนไลน การพจารณาอางองแหลงขอมลทมความ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

18

นาเชอถอ การระบบคคลทเขยนบทความ การพจารณาล าดบความส าคญของขอมลบางประเภท การท าความเขาใจกบคณสมบตพนฐานของผน าเสนอขาว อาจเปนสวนหนงในการพจารณาความนาเชอถอของขอมลทไดรบจากสอสงคมออนไลน

2.8 ปญหาและผลกระทบทเกดจากขาวปลอม

การทคนไดรบขาวสารมากมายในปจจบน ทงเรองจรงเรองปลอม โดยทไมสามารถแยกแยะไดวาเรองราวของขาวไมใชเรองจรง อาจสงผลใหเกดผลเสยตามมา เกดความหวนวตกในเหตการณรายแรงตาง ๆ อาจสงผลใหเกดความเสยหายทางเศรษฐกจและสงคม [17] อาทเชน เมอคราวทรชกาลท ๙ ใกลจะเสดจสวรรคต มขาวลอ ขาวปลอมสรางกระแสออกมาตลอดเวลา ท าใหประชาชนเกดความหวนไหว ดชนตลาดหลกทรพยแหงประเทศไทยไดรบผลกระทบ มการเทขายหนออกมาจนกระทงมคาตดลบมากถงเกอบหนงรอยจด [12] ท าใหนกลงทนบางคนอาจไดรบความเสยหายจากเหตการณน [47]

ตวอยางขาวปลอมท าใหสงคมเกดความสบสน และมการตรวจสอบยนยนขอเทจจรงจากผทเกยวของแลว [48] เชน

ประเทศไทยอนญาตใหบคคลสญชาตไทยทมสมาชกในครอบครวอยางนอย 3 คน สามารถปลกกญชาไดไมเกนครอบครวละ 50 ตน อกทงยงสามารถใชกญชาในทางสนทนาการได จากการตรวจสอบขอมลพบวาขอความมเนอหาบดเบอนไปจากขอเทจจรง โดยพระราชบญญตยาเสพตดใหโทษ ฉบบท 7 พ.ศ.2562 ระบวา อนญาตใหสามารถน ากญชาไปใชประโยชนเฉพาะทางการแพทยเทานน สวนการน าไปใชเพอหวงผลดานอน ๆ เชน ใชในดานสนทนาการ หรอการเปดเสรการปลกกญชาไดครอบครวละไมเกน 50 ตน ยงไมมการประกาศอนญาตอยางเปนทางการ ดงนนผใด ทลกลอบครอบครองหรอจ าหนาย ยงคงมความผดตามกฎหมาย

การกนน าทเยนจดบอย ๆ จะท าใหเปนนว จงตองระวงและหลกเลยงการดมน าเยน ส านกงานคณะกรรมการอาหารและยา (อย.) ชแจงวาขอความนไมเปนความจรงเนองจากการกนน าเยนจด บอย ๆ ไมมความเกยวของกบการเปนโรคนวในไต สาเหตของการเกดโรคนวเกดไดจากหลายปจจยรวมกน ตงแตปสสาวะมความเขมขนสง ดมน านอยและสญเสยเหงอมาก หรอกนอาหารทมแคลเซยมสง โปรตนสง โซเดยมสง เปนประจ า หรอมภาวะยรกในเลอดสงจากโรคเกาต หรอคนทไดรบเคมบ าบดระหวางเปนโรคมะเรง และกนยาในกลมทมความเสยงสง เชน ยากนชก (ไดแลนตน) หรอมประวตคนในครอบครวเปนโรคนวมากอน

ภาพประกอบขอความทระบวา มการประกาศใช พ.ร.บ. ขาว ทระบวา ชาวนาตองขายขาวผานรฐบาลเทานน หากฝาฝนจะไดรบโทษหนกจ าคก 5 ป ปรบเปนเงน 5 แสนบาท ขอเทจจรงคอสภานต

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

19

บญญตแหงชาต (สนช.) ไดถอดถอนวาระการพจารณาราง พ.ร.บ. ขาว ออกไปอยางไมมก าหนด เพอไมใหเกดความขดแยงทงฝายทเหนดวยและฝายทไมเหนดวย

เวบไซตอนเวสตง เวบไซตขาวดานการเงน เศรษฐกจ และการลงทน ไดรายงานชอ รองนายกรฐมนตรของไทยเปนหนงในบคคลทมฐานะร ารวยในระดบเศรษฐของทวปเอเชยทงหมด 45 คน ทางโฆษกกระทรวงกลาโหมออกมาแถลงขอเทจจรงวาเปนขาวเทจถกจดท าเพอหวงผลทางการเมอง

จากปญหาทเกดจากขาวปลอมทสงผลกระทบตอบคคล ซงอาจกอใหเกดการสญเสยของบคคลจากการรบรขาวปลอมอกดวย [14] [15]

การตรวจสอบความนาเชอถอของสอสงคมออนไลนนน มความซบซอนมากขน เนองจากการเตบโตของเครอขายอนเทอรเนต ความนาเชอถอของขอมลทพบในขาวสวนใหญน าเสนอผานความ สมพนธระหวางการใชค าและเนอหา นอกจากนความนาเชอถอของขาวอาจตองพจารณารายละเอยดในองคประกอบทเกยวของของความนาเชอถอของแหลงขาว และปจจยทใชในการพจารณาความนาเชอถอของเนอหาขาว สามารถพจารณาไดในหลายมมมอง [49] [50] [51] [52] [53]

วตถประสงคการสรางขาวปลอม [54] ไดแก - หวงผลสนบสนนสงเสรมประโยชนของฝายตนเองและท าลายฝายตรงขาม ทงในเรองสวนตว

การฉอโกง ธรกจ การลงทน หรอแมแตเรองการหวงผลทางการเมอง - การท าใหคนอนหลงเชอสนองเพอความสนกสวนตว โดยไมไดหวงผลชดเจน อาจเปนการ

หมนประมาท เมอผอานขาวทขาดทกษะการรเทาทนสอทมความซบซอน เพราะเคยชนกบการไดรบขอมล

จากสอหลกทมการกลนกรอง จงไมสามารถท าความเขาใจเนอหาขาวปลอม หรอเขาใจผดไปหลงจากทอานจบ จงไมสามารถตดสนใจเชอขาวทอานไดหรอไม ซงอกปญหาหนงทเกดจากขาวปลอมและท าใหเกดผลเสยหายทางดานการเมองอยางชดเจน ทมการกลาวถงกนอยางมากคอในชวงระหวางการหาเสยงกอนการเลอกตงประธานาธบดสหรฐอเมรกาเมอป ค.ศ. 2016 ขาวลอตาง ๆ ทงขาวจรงขาวปลอมถกปลอยออกมาอยางมากมาย ความขดแยงทางการเมองสงผลกระทบตอความรสก ความเชอมนของประชาชนตอผลงสมครรบเลอกตงเพอด ารงต าแหนงประธานาธบด ท าใหคะแนนเสยงมการเปลยนแปลงไป [17]

ผลเสยทเกดจากการสงตอขอมลการสรางขาวเทจ อาจกอใหเกดปญหาระหวางบคคลจนกลายเปนคดความ ท าใหบคคลอนและสงคมเกดความตนตระหนก ในบางครงอาจรายแรงจนสงผลกระทบในวงกวางตอสงคมและเศรษฐกจของประเทศ การเผยแพรออกไปเปนวงกวางอาจสรางความเสยหายสงผลกระทบตอประเทศได

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

20

2.9 การปองกนขาวปลอมเบองตน วธการตรวจสอบขาวปลอม เมอไดรบขอมลขาวสารบนสอเครอขายสงคมออนไลนไมควรรบ

หลงเชอในทนท ควรพจารณาความนาเชอถอของทมาแหลงขาววามความนาเชอถอเพยงใด และพยายามหาขอมลประกอบจากแหลงอน ๆ เพอสนบสนนเนอหาขาวดงกลาว หากไมพบขอมลอนทเกยวของใหตงขอสนนษฐานวาเปนขาวปลอม และเมอพบเหนประเดนทนาสงสย ไมควรหลงเชอและสงตอในทนท ควรรอจนกวาจะไดรบการยนยนขอเทจจรงจากบคคลหรอหนวยงานทเกยวของ และหากมนใจวาเปนขาวปลอม ควรรบแจงเตอนผใชอน เพอชวยลดการแพรกระจายขาวปลอม

ตวอยางเวบไซตขาวภาษาไทยทมการตรวจสอบขอเทจจรง ดวยการไปสบหาขอเทจจรงมายนยน หรอโดยการไปสมภาษณสอบถามขอเทจจรงจากผเชยวชาญแตละดาน แลวจงน ามาเฉลยวาขาวเหลานเปนขาวปลอม สามารถพจารณาไดโดยการเขาถงจากหวขอ “ขาวปลอม” ดงตวอยางเวบไซตตอไปน

https://twitter.com/hashtag/ขาวปลอม https://www.thairath.co.th/tags/ขาวปลอม https://mgronline.com/tags/ขาวปลอม https://news.kapook.com/topics/ขาวปลอม https://news.mthai.com/tag/ขาวปลอม https://www.sanook.com/news/tag/ขาวปลอม เครอขายสอสงคมออนไลนเฟซบก (Facebook) เสนอวธการสงเกตขาวปลอมเบองตนส าหรบ

ผใชทวไปดงน [55] ไมควรหลงเชอหวขอขาว ใหสรางความสงสยกบขอความพาดหวขาวกอน เนองจากขาว

ปลอมสวนใหญจะใชขอความพาดหวทสะดดตาเพอดงดดความสนใจผอาน โดยหากเปนภาษาองกฤษอาจใชตวอกษรเปนตวพมพใหญทงหมด หรอการเนนขอความดวยตวหนา และการใชเครองหมายสญลกษณตาง ๆ เพอท าใหเกดความสะดดตา ท าใหคนสนใจประเดนขาวนน ๆ หากพจารณาขอความหวขอขาวพาดหวแลวพบวามความหวอหวา นาตนตระหนก ดเกนจรงกวาปกตทเคยเกดขน จะท าใหเปนเรองเหลอเชอ และไมนาจะเปนไปได ใหสนนษฐานขอความขาวนนกอนวานาจะเปนขาวปลอม

พจารณาสงเกตทจดเชอมตอหรอลงค (URL) อยางละเอยด โดยสวนใหญจดเชอมตอปลอมหรอหลอกลวงจะมลกษณะคลายคลงกบจดเชอมตอจรง ๆ แตมการปรบเปลยนหรอดดแปลงเพยงเลกนอยเพอเลยนแบบแหลงขาวจรง หากผใชไมทนสงเกตจะหลงเชอคลกตามไป ดงนนหากพบจดเชอมตอแปลก ๆ อาจเปนสญญาณเตอนของขาวปลอมได โดยผใชสามารถไปทเวบไซตขาวปลอมและเปรยบเทยบกบแหลงขาวทไดรบการยอมรบเพอเปรยบเทยบขอมลได

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

21

ตรวจสอบแหลงขาว โดยการสงเกตแหลงทมา และตรวจสอบเรองราวใหเกดความมนใจวาเปนแหลงขาวทนาเชอถอและมชอเสยงดานการใหขอมลทถกตอง หากเรองราวนนมาจากแหลงขาวทไมรจกหรอจากองคกรทชอไมคนเคย ควรตรวจสอบทสวน “เกยวกบ” ของแหลงขาวนน ๆ

สงเกตสงทผดปกต ในเวบไซตขาวปลอมสวนใหญสะกดค าผดหรอมการจดวางรปแบบทดไมเปนมออาชพ มการสะกดค าผดพลาดหรอวางรปแบบโครงรางทไมปกต หากพบลกษณะเหลานควรระมดระวงในการอานขาวนน

พจารณารปภาพประกอบ เรองราวของขาวปลอมสวนใหญ จะใชรปภาพประกอบหรอวดทศนทมการบดเบอนไปจากความจรง บางครงรปภาพอาจเปนรปจรง แตไมเกยวของกบบรบทของเรองราว ผใชสามารถตรวจสอบหาแหลงทมา โดยการคนหารปภาพนน

ตรวจสอบวนเวลาทขาวนนปรากฏ เนองจากเรองราวของขาวปลอมสวนใหญอาจมการเปลยนแปลงวนเวลาทเกดเหตการณ ท าใหล าดบเหตการณสบสนและไมสมเหตสมผล

ตรวจสอบหลกฐานและแหลงทมาของขอมลเพอยนยนความถกตอง หากไมมหลกฐานประกอบขาว หรอมการอางองโดยทไมไดระบชอผเชยวชาญ ขาวดงกลาวอาจเปนขาวปลอม

เปรยบเทยบขาวกบรายงานขาวจากแหลงอน ๆ หากไมมแหลงขาวอนทรายงานขาวในเรองเดยวกน อาจเปนสญญาณบงชวาเปนขาวปลอม ขาวจรงควรมการรายงานจากหลากหลายแหลงขาวทนาเชอถอ

พจารณาเนอหาเรองราวของขาว เปนเรองตลกข าขน หรอเปนเรองลอกนเลนหรอไม ในบางครงผอานแยกขาวปลอมออกจากมกตลกหรอขาวเสยดสหรอการลอเลยนไดยาก การตรวจสอบเพอพจารณารายละเอยด สนใจแหลงทมาของเรองทลอเลยน ตลอดจนการใชน าเสยงในการเลาเรอง มลกษณะในเชงลอกนเลนเพอความสนกสนานหรอเปนเรองจรงจง

บางเรองมเจตนาและมความจงใจสรางขนเพอใหเปนขาวปลอม ดงนนผอานจงตองใชวจารณญาณในการอาน เพอคดวเคราะหเรองราว และสงตอเฉพาะขาวทมความมนใจวาเชอถอไดเทานน

2.10 คณลกษณะเดนของทวตเตอร

ทวตเตอรเนนการแสดงขอความและมรปภาพแนบขยายความ การใชงานของทวตเตอร ผใชบางคนมการใชงานเสมอนเปนการประโยคบอกเลา ไมม

การระบผรบ เปนลกษณะของการบอกกลาวอยางไมระบเหตผล การค าใชพดพร าบน การแสดงความคดเหน หรอการเขยนขอความใด ๆ แบบไมเปนทางการ

ไมมระบบเพอน กลม หรอหนาเวบเพจ จงไมมระบบคดกรองคนด ขอความทมการแสดงออกมาทงหมด จะถกตงคาการมองเหนเปนแบบสาธารณะทงหมด ดงนนใคร ๆ สามารถด

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

22

ขอความไดทงหมดทกคน ไมวาจะเปนผใชงานทมบญชผใชงานหรอไม และจะเปนผตดตามบญชนนหรอไมกตาม

ระบบการตดตาม เมอผใชตดตาม (follow) บญชทตนเองสนใจแลว บญชผใชทตองการตดตามไดตงคาความเปนสวนตวเปนแบบสาธารณะ (public) เมอผใชไดตดตามบญชนนแลวจะเหนขอความของบญชนนในสวนการรบขาวสารไดกอนขอความอน ๆ

กรณทสรางบญชแบบปด ซงเปนบญชเฉพาะทสามารถก าหนดใหบคคลทอนญาตใหตดตามเทานน จงจะสามารถดขอความทแสดงไดทงหมด

ทกคนมสทธสมครบญชผใชงานทวตเตอรไดมากกวา 1 บญช ดงนนแตละผใชจงสามารถเปดหลายบญชแยกกนส าหรบใชงานตามวตถประสงคสวนตวได

ผใชทวตเตอรเนนการอานขอความ ซงอาจเปนขอความขาวหรอขอความทมคนกลาวถง หากหวขอขาว (Topic) เปนทนาสนใจ จะมการใชแฮชแทก (# Hashtag) ปรมาณมากจนขนเปน เทรนด ตวอยางเชน ละคร การเชยรกฬา การเมอง

การคนหาเรองทสนใจในทวตเตอรสามารถคนหาผานแฮชแทก หากตองการใหขอความไปอยในหมวดใด สามารถเพมแฮชแทกได เพอใหคนทสนใจในเรองเดยวกนสามารถคนหาขอความทมการแสดงออกไป

2.11 การเรยนรดวยเครอง

กระบวนการเรยนรดวยเครอง เปนทยอมรบในดานการประยกตใชงานกบแกไขปญหาหลายดาน หรอใชส าหรบโปรแกรมประยกตมากมาย โดยแตละกระบวนการเรยนรมความเหมาะสมกบขอมลในรปแบบเฉพาะ กระบวนการเรยนรดวยเครองทแกปญหาดวยการสอนโดยใชขอมลทมค าตอบทแทจรงของปญหาเรยกวาการเรยนรแบบไดรบการแนะน าหรอมผสอน (Supervised Learning) กระบวนการเรยนรดวยเครองโดยมขอมลทไมมค าตอบเรยกวาเปนวธการเรยนรแบบไมไดรบการแนะน า หรอการเรยนรโดยไมมผสอน (Unsupervised Learning) [56]

การเรยนรของเครองดวยวธการจ าแนกแบบ Naïve Bayes เปนวธการหนงในการจ าแนกขอมลดวยคาความนาจะเปนอยางงาย โดยเปนวธการทงานวจยสวนใหญนยมใชส าหรบการจ าแนกขอมล เนองจากเปนวธการทเขาใจไดงายและไดผลการจ าแนกขอมลทเปนทยอมรบได โดยอาศยหลกการพนฐานของการใชกฎของ Bayes ภายใตสมมตฐานทวาขอมลทกคณลกษณะตองเปนอสระจากกน ไมมคณลกษณะใดขนอยกบคณลกษณะอนทใช [26] [57] [58]

เรมมการศกษาใชงาน Naïve Bayes กนอยางแพรหลายตงแตทศวรรษ 1960 ในกลมงานวจยทเกยวของกบการสบคนขอความในเอกสารตาง ๆ โดยเปนวธทนยมส าหรบการจดหมวดหมขอความ การพจารณาการแยกประเภทเอกสารออกจากเอกสารประเภทอน มการน าไปใชประยกตกบงานดาน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

23

การจดกลมเอกสารตามจ านวนความถของค าส าคญทคนพบในเอกสารตาง ๆ ซงจ านวนความถของค าเปนคณสมบตทเหมาะสม ส าหรบการน าไปใชในการประมวลผลขอมลเอกสารเบองตน

ตวจ าแนก Naïve Bayes มความยดหยนสง สามารถน าไปใชจ าแนกขอมลจ านวนมาก ๆ ได โดยการใชจ านวนพารามเตอรหลายตวกบตวแปรทเปนคณลกษณะหรอตวพยากรณ ในปญหาการเรยนร การฝกสอนทใหคาความนาจะเปนสงสดสามารถท าไดโดยการประเมนแบบ Closed-form expression ทใชเวลามากกวาการประเมนดวย Iterative approximation ทใชส าหรบการจ าแนกประเภทอน ๆ

Naïve Bayes เปนขนตอนวธการจ าแนกประเภทตามคณลกษณะ โดยสมมตวามการแจกแจงของขอมลทเปนอสระตอกน ความนาจะเปนกอนหนาส าหรบแตละคลาสค าตอบจะถกค านวณจากขอมลการฝกสอน และก าหนดสมมตฐานวาเปนอสระจากกน เพอหาคาสมมตฐานทนาจะถกตองทสด

Naïve Bayes เปนเทคนคส าหรบการสรางตวแยกประเภท แบบจ าลองทก าหนดค าตอบของคลาสใหปญหา แสดงดวยคาคณลกษณะซงมการดงค าตอบของคลาสจากชด จ ากด บางชด คาของคณสมบตเฉพาะนนไมขนอยกบคาของคณสมบตอนใด ๆ ยกตวอยางเชน ผลไมผลหนงจะถกพจารณาวาเปนสม กตอเมอเปนผลทมสสม สเหลอง หรอสเขยว มลกษณะทรงคอนขางกลม และมเสนผานศนยกลางประมาณ 10 เซนตเมตร เมอพจารณาคณสมบตแตละตว เพอสนบสนนความนาจะเปนทจะจ าแนกใหไดวาผลไมผลนจะเปนสมหรอไม Naïve Bayes จะไมค านงถงความสมพนธทเปนไปไดระหวางคณลกษณะของส ลกษณะทรงวตถ หรอขนาดเสนผานศนยกลางวตถ

ส าหรบแบบจ าลองทสรางจาก Naïve Bayes สามารถไดรบฝกสอนใหเกดประสทธภาพสงมากในสภาพแวดลอมการเรยนรแบบมผสอน การใชงานจรงหลายอยางใชการประมาณคาพารามเตอรส าหรบแบบจ าลอง Naïve Bayes โดยใชวธการทเลอกคาความนาจะเปนสงสด

ขอไดเปรยบของ Naïve Bayes คอตองการขอมลการฝกสอนจ านวนไมมากเพอการประมาณคาพารามเตอรทจ าเปนส าหรบการจ าแนกประเภท

Naïve Bayes เปนแบบจ าลองความนาจะเปนแบบมเงอนไข ส าหรบการแกปญหาการจ าแนกกลมขอมล โดยอาศยความรกอนหนา (Prior knowledge) ซงคอความนาจะเปนกอนหนาของสมมตฐานหนงรวมกบขอมลทเกดขน ปญหาการจ าแนกกลมขอมลทใชกฎของ Bayes ในการอธบายสามารถค านวณคาความนาจะเปนของการจ าแนกคลาสเมอทราบแตละขอมล ไดจากสมการท (1)

p(Ck|x) = p(Ck)p(x|Ck)

p(x) (1)

โดยท k แทนดวยคาทเปนไปไดในคลาสค าตอบ Ck

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

24

x = (x1, …, xn) แทนคาเวกเตอรขอมลทใชค านวณแจกแจงความนาจะเปน ซง n เปนจ านวนคณลกษณะของขอมลทงหมดทแตละตวมความเปนอสระไมขนตอกน

p(Ck|x) แทนคาความนาจะเปนทจะเกดคลาสค าตอบ Ck เมอทราบคา x p(Ck) แทนคาความนาจะเปนกอนหนาทจ าแนกไดคลาสค าตอบ Ck

p(x|Ck) แทนคาความนาจะเปนทจะเกด x เมอทราบคาคลาสค าตอบ Ck

p(x) แทนคาความนาจะเปนกอนหนาทจะเกด x

การสรางตวจ าแนกขอมลจากแบบจ าลองความนาจะเปน ซงรปแบบคณลกษณะทเปนอสระ ตอกน ท าใหแบบจ าลองความนาจะเปนของ Naïve Bayes เปนการรวมกฎการตดสนใจ โดยการเลอกคาสมมตฐานทเปนไปไดมากทสด และฟงกชนทก าหนดคลาสคอ y= Ck ส าหรบคา k บางตวตามสมการท (2)

y = argmaxk∈{1, …, k}

p(Ck)∏ p(xi|Ck)ni=1 (2)

Neural Network เปนรปแบบการเรยนรของเครองทเลยนแบบจากลกษณะทวไปทางชววทยาของโครงสรางสมอง เพอจ าลองการท างานของสมองมนษย ประกอบดวยหนวยประมวลผลยอย (Neuron) จ านวนมากทท างานรวมกนโดยสงสญญาณผานตวเชอมทเรยกวา (Connection link) ในแตละเสนเชอมจะมคาความส าคญตางกนจากคาน าหนกประจ าเสน (Weight) และแตละหนวยประมวลผลยอยหรอโหนด (Node) จะสงคาสญญาณเมอไดรบคาจากฟงกชนการกระตน (Activation function) ไปยงหนวยประมวลผลยอยอน โดยโครงสรางระบบเปนการท างานแบบขนาน ในการท างานเครอขายประสาทเทยมจะแบงการท างานเปนสามชนหลก โดยรบขอมลเขาเปนชนแรก (Input layer) และประมวลผลเปน หลายชนเพอทดสอบหาคาลกษณะส าคญจากเสนทางภายในโครงขายในเรยกวาชนซอน (Hidden layer) จนกระทงไดเปนค าตอบทดทสดอยในชนผลลพธ (Output layer) ซงขนตอนการเรยนร มการใชวธการแพรยอนกลบ (Back propagation) เพอเลอกคาลกษณะทเหมาะสมทสดในเสนทางตาง ๆ ในเครอขาย ท าใหสามารถใชแยกขอมลไดหลายประเภท มความแมนย าสงในการแยกแยะขอมล เหมาะกบขอมลหลายประเภททงแบบตอเนองและไมตอเนอง และมความทนทานตอสญญาณรบกวนไดด แตมขอจ ากดในการอธบายความหมายของคาน าหนกทเกดขนไดยาก เสยเวลาในการเรยนรขอมลคอนขางนานเพอการสรางแบบจ าลองทด [59]

หลกส าคญในการกระตนความสนใจในเครอขายประสาทเทยมและการเรยนรคอขนตอนวธการแพรกระจายยอนกลบของ Werbos (1975) ทท าใหเกดการฝกสอนเครอขายทเปนไปไดแบบหลายชนและมประสทธภาพ การกระจายแบบ Backpropagation ปรบแกคาน าหนกของแตละโหนดเพอลดคาความผดพลาดของแตละชนในการฝกสอนแบบจ าลอง ตอมาในชวงกลางทศวรรษ 1980 การ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

25

ประมวลผลแบบกระจายขนานเปนทไดรบความนยมจากแนวคดของ Rumelhart และ McClelland (1986) จงไดอธบายวธการใชหลกการน เพอเชอมตอการจ าลองกระบวนการท างานของระบบประสาท

Vanishing gradient ถกใชเปนปญหาในการอธบายการใชงานเครอขายแบบหลายชน โดยการท า Feedforward ทใช Backpropagation ซงเปนทรจกกนในชอ Recurrent Neural Network (RNNs) เมอเกดคาความผดพลาดแพรกระจายจากชนหนงไปอกชนหนง จะมสงผลใหมการปรบคาน าหนกของแตละโหนดทจ านวนการปรบคาขนอยกบคาผดพลาดทเกดขน และท าใหเกดการใชงานโครงขายหลายชนทมความลกมากขน ส าหรบการแกปญหาน Schmidhuber ไดน าวธการใชล าดบชนของเครอขายหลายระดบ (1992) ทไดรบการฝกสอนมากอนระดบหนงทละครง ส าหรบการฝกสอนทไมมค าตอบลวงหนา Backpropagation ถกปรบแตงโดย Behnke (2003) อาศยเครองหมายของ gradient (Rprop) ในการใชแกปญหา

แนวความคดของ Support Vector Machine (SVM) เกดจากการทน าคาของกลมขอมลมาวางลงในฟเจอรสเปซ (Feature Space) จากนนจงหาเสนทใชแบงขอมลทงสองออกจากกน โดยจะสรางเสนตรงทใชแบง (Hyperplane) ขนมา และเพอใหทราบวาเสนตรงทแบงสองกลมออกจากกน โดยเลอกเสนตรงทดทสดในการแบงกลม การจ าแนกขอมลบนระนาบหลายมต จะใชสวนการเลอกทมความเหมาะสมทสดเรยกวา โครงสรางในการคดเลอก (Feature selection) ซงโครงสรางในการคดเลอกมาจากขอมลทสอนใหระบบเรยนร จ านวนกลมของโครงสรางทใชอธบาย เรยกวา เวกเตอร (Vector) โดยตวแบบ SVM ตองการแบงแยกกลมของเวกเตอรดวยหนงกลมของตวแปรเปาหมายทอยขางหนงของระนาบ และกรณอนทอยทางระนาบตางกน ซงเวกเตอรทอยขางระนาบหลายมตทงหมดเรยกวา Support Vectors

ขนตอนวธในการจ าแนกโดยหลกการท างานคอ การใหขอมลน าเขาทใชฝกสอนเปนเวกเตอรใน N มต เชนถาในกรณของ 2 มต และ 3 มต จะเปนจดทอยในพกด xy และ xyz ตามล าดบ จากนนจงสราง Hyperplane ทใชแยกกลมของเวกเตอรขอมลน าเขาออกเปนประเภทตาง ๆ ในกรณทขอมลเปน 2 มต Hyperplane เปนเสนตรง และหากขอมลเปน 3 มต Hyperplane จะเปนลกษณะของระนาบ อาศยหลกการของการหาสมประสทธของสมการ เพอสรางเสนแบงแยกกลมขอมลทถกปอนเขาสกระบวนการสอนใหระบบเรยนร โดยเนนไปยงเสนแบงแยกกลมขอมล (Margin) ไดดทสด เปนการเรยนรของเครองเพอแบงตวอยางสอนในสองกลม โดยการสรางระนาบหลายมตแบงแยกแบบดทสด (Optimal Separating Hyperplane) แบงแตละกลมใหอยบนแตละดานของระนาบหลายมต จดเดนของ SVM คอสามารถจบค (Map) เวกเตอรในมตขอมลน าเขา ใหกลายเปน Feature Space โดยใชฟงกชนทเรยกวา kernel กรณทขอมลน าเขาเปนแบบ 2 มต สามารถจ าแนกขอมลน าเขาเปน 2 กลม โดยใช Hyperplane เสนตรง โดยทวไปมเสนตรงจ านวนมากทสามารถแบงกลมขอมลออกเปน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

26

สองสวนได แตเสนตรงเสนใดสามารถใชแบงกลมไดดทสด (Optimal Line) จะพจารณาจาก ทเปนผลรวมระยะหางของเสนตรงทเปน Hyperplane ถงเสนตรงทผานขอมลน าเขาทอยใกลเสนมากสดและขนานกบ Hyperplane ของทงสองกลม ระยะทกลาวถงนสามารถมองเปนเวกเตอรได และเรยกวา Support Vector Machine โดยขนตอนวธ SVM จะเลอก Hyperplane ทใหคาเสนแบงแยกกลมขอมล และมระยะหางจากขอมลสอนมายงระนาบหลายมตทกวางทสดหรอมคาสงสด

SVM เปนวธการเรยนรของเครองทไดรบความนยม ใหความแมนย าสงส าหรบการจ าแนกขอมล เปนวธการเรยนรแบบมผสอนทใชส าหรบการวเคราะหการจ าแนกประเภทขอมล [60] สามารถใชชวยแกปญหาการจ าแนกขอมล ใชในการวเคราะหขอมลและจ าแนกขอมล [61]

การน าแบบจ าลอง (Model) ไปใชงานจ าเปนตองมการวดประสทธภาพของแบบจ าลองกอน โดยทวไปนยมใชตาราง Confusion Matrix ในการวดประสทธภาพแบบจ าลองสามารถ ตารางนอยในรปเมตรกซจตรส โดยจะมจ านวนแถว เทากบ จ านวนคอลมนมคาเทากบจ านวนคลาสค าตอบ ยกตวอยางเชน หากค าตอบมเพยง 2 คา คอ จรง และ เทจ จะไดตารางเมตรกซขนาด 2x2 โดยขอมลในดานคอลมนคอ คาค าตอบทปรากฏอยในชดขอมล และขอมลในแนวแถวเปนคาทแบบจ าลองท านายได อธบายไดดงรปท 2.1

คาทท านาย/คาค าตอบ จรง เทจ

จรง True Positive (TP) False Positive (FP) เทจ False Negative (FN) True Negative (TN)

รปท 2.1 ตวอยาง Confusion Matrix ขนาด 2×2 โดยท

True Positive (TP) คอจ านวนขอมลทท านายวาเปนจรงและค าตอบเปนจรง True Negative (TN) คอจ านวนขอมลทท านายถกตองวาเปนเทจจากค าตอบทเปนเทจ False Positive (FP) คอจ านวนขอมลทท านายผดวาเปนจรงแตค าตอบจรงเปนเทจ False Negative (FN) คอจ านวนขอมลทท านายผดวาเปนเทจแตค าตอบทถกตองเปนจรง Accuracy เปนการวดความถกตองของแบบจ าลองทตอบไดถกตองจากขอมลทงหมด โดย

สามารถค านวณไดจากสมการท (3)

Accuracy = True Positive + True Negative

(True Positive + True Negative + False Positive + False Negative) (3)

Precision เปนการวดความแมนย าของขอมลทท านายวามความถกตองตามจรงหรอไม เปนคาทบอกวาการท านายวาจรงมความถกตองเพยงใด โดยสามารถค านวณไดจากสมการท (4)

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

27

Precision = True Positive

(True Positive + False Positive) (4)

Recall หรอ True Positive Rate (TPR) เปนการวดความถกตองของแบบจ าลองทตอบไดถกตองเปนอตราสวนจากขอมลทจรงทงหมดเทาใด โดยสามารถค านวณไดจากสมการท (5)

Recall = True Positive

(True Positive + False Negative) (5)

F-measure เปนการวดคาประสทธภาพโดยรวมของแบบจ าลองโดยค านวณจากเฉลยระหวาง Precision และ Recall สามารถค านวณไดจากสมการท (6)

F-measure=2* (Precision*Recall)

(Precision+Recall) (6)

True Negative Rate (TNR) คอ คาทบอกวาท านายวาเทจ เปนอตราสวนเทาใดจากค าตอบทเปนเทจทงหมด โดยสามารถค านวณไดจากสมการท (7)

True Negative Rate (TNR) = True Negative

(True Negative + False Positive) (7)

False Positive Rate (FPR) คอ คาทบอกวาท านายวาจรง เปนอตราสวนเทาใดจากค าตอบทเปนเทจทงหมด โดยสามารถค านวณไดจากสมการท (8)

False Positive Rate (FPR) = False Positive

(True Negative + False Positive) (8)

False Negative Rate (FNR) คอ คาทบอกวาโปรแกรมท านายวาไมจรง เปนอตราสวนเทาใดจากค าตอบจรงทงหมด โดยสามารถค านวณไดจากสมการท (9)

False Negative Rate (FNR) = False Negative

(True Positive + False Negative) (9)

กอนทจะน าผลลพธทไดไปใชงานการสรางแบบจ าลองดวยเทคนค Classification มการทดสอบประสทธภาพของแบบจ าลอง 3 แบบ ไดแก

(1) วธ Self-Consistency Test หรอ Use Training Set เปนวธใชชดขอมลเดยวกนในการสรางแบบจ าลองและทดสอบแบบจ าลอง โดยจากสรางแบบจ าลองดวยชดขอมลทม การฝกสอน (Training data) หลงจากนนน าแบบจ าลองทสรางไดมาท านายผลดวยชดขอมลเดม การวดประสทธภาพแบบจ าลองวธน ใหผลการวดประสทธภาพทมคาสง เนองจากเปนชดขอมลทน ามาทดสอบเปนขอมลเดยวกบแบบจ าลองทไดมการเรยนรแลว ดงนนวธการนเหมาะส าหรบการใชดความเหมาะสมของแบบจ าลองทสรางขนกบชดขอมล

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

28

(2) วธ Split Test เปนการแบงชดขอมลออกเปน 2 สวน โดยการสมขอมล ตวอยางเชนอาจแบงชดขอมลออกเปนรอยละ 50 ตอรอยละ 50 หรอรอยละ 60 ตอรอยละ 40 หรออน ๆ โดยการแบงชดขอมลสวนแรกส าหรบใชในการสรางแบบจ าลอง และชดขอมลในสวนทเหลอเกบไวใชในการทดสอบประสทธภาพการท างานของแบบจ าลอง วธการนควรท าซ าหลาย ๆ ครงเ พอใหเกดความมนใจในการสมขอมลทแบงสวน เหมาะกบการสรางแบบจ าลองทมชดขอมลขนาดใหญมาก ๆ

(3) วธ Cross-validation Test แบงขอมลออกเปนหลายสวนโดยก าหนดเปนคา k สวน ในการแบงชดขอมลออกเปน k สวนทมขนาดเทา ๆ กน แลวแบงหน งสวนไวใชในการทดสอบประสทธภาพของแบบจ าลอง และชดขอมลสวนทเหลอทงหมดจะถกน าไปใชสรางแบบจ าลองแตละรอบ โดยจะท าซ าวนไปจนกระทงครบตามจ านวน k ทระบ

2.12 งานวจยทเกยวของ

ววฒนาการของสอในชวงศตวรรษท 19 สงพมพในรปแบบกระดาษยงมราคาถก จงท าใหผคนสามารถเขาถงหนงสอพมพไดงาย [17] การเผยแพรขาวสารปรมาณมาก ท าใหเกดความกงวลวาสอมวลชนจะมสวนส าคญในการชกจงแนวความคดของประชาชนใหโนมเอยงไปตามทตองการไดมากกวาผน าประเทศ ตอมามการเปลยนรปแบบการสอสารไปสสอสงคมออนไลนมโครงสรางแตกตางกนอยางมากกบเทคโนโลยสอกอนหนา การเจรญเตบโตของขาวออนไลนท าใหเกดความหวนวตกกงวล เกยวกบความคดเหนทเกดขนมความหลากหลายมากเกนไป จะท าใหประชาชนสามารถสรางเสยงสะทอน ขอเรยกรองตาง ๆ มากขน อกทงยงเกดความกงวลเกยวกบแพลตฟอรมใหมทเกดขนอาจท าใหการท างานของสอมวลชนถกตรวจสอบมากยงขน เนอหาขาวสารตาง ๆ สามารถถายทอดใหกบผใชไดโดยตรง มการเผยแพรกระจายขาวกนไดโดยไมตองมการกลนกรองหรอการตรวจสอบความจรงหรอการตความของสอหรอบคคลใด ๆ และผใชยงมทางเลอกในการเขาถงสอมากขน สามารถเขาถงสอไดหลายราย และสามารถเปรยบเทยบกนไดอกดวย

ขาวสารทมการเผยแพรกนบนสอสงคมออนไลนมทงขาวจรงทไดผานการตรวจสอบกอนการน าเสนอ และขาวปลอมทถกน าเสนอดวยความรวดเรว ในงาน [62] กลาววาการประชาสมพนธทเกยวกบขาวจรงสามารถแพรกระจายไปทวโลกอยางรวดเรว แตขาวทเกยวกบขาวปลอมมการปรบเปลยนเนอหาสามารถแพรกระจายออกไปไดมากกวา ในการศกษาการแพรกระจายขาวทเปนจรงและขาวปลอมบนเครอขายสงคมออนไลนใน [6] แสดงใหเหนความขดแยงกนทสามารถน ามาจ าลองการเผยแพรขาวสารของผเขารวมงานวจย ท าใหเหนวาประชาชนสามารถมสวนรวมกบงานวจยโดยสมครรบขาวสาร นอกจากนน [29] ไดวเคราะหหาปจจยทเกยวของกบขอความทสงผลตอทศนคตดานลบและความเชอทไมถกตองตามขอมลทไดรบ [3] ไดเสนอค าแนะน าเกยวกบวธจดการกบความเสยงทเกดขนไดอยางมประสทธภาพ ตลอดจนการปรบปรงวธการรบรขาวสาร ความเขาใจ การ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

29

แกปญหาในระยะยาวของปญหาของขาวปลอม ในงาน [2] ไดส ารวจบทความวชาการตาง ๆ เพอชวยในการท างานวจยทเกยวกบปญหาขาวปลอม มการน าเสนอการตรวจสอบขาวปลอมทเกยวกบสอสงคมออนไลน รวมทงการปลอมตวของขาวปลอมในเชงจตวทยาและทฤษฎทางสงคม อลกอรทมทางดานการท าเหมองขอมลทมการใชงาน ชดขอมลตวแทน โดย [2] [63] ไดเสนอมาตรวดเพอจดระเบยบประเภทขาวปลอม และแสดงใหเหนถงความสมพนธทแตกตางกนของแตละวธการ คณสมบตของขาวปลอมทแตกตางกบขาวจรงคอผเขยนตงใจจะหลอกลวงผอาน ปจจยแรงจงใจดานการเงนท าใหเกดการสรางขาวปลอมขนมาเพอหลอกใหผอานตดตามรายละเอยด

งานวจย [62] วเคราะหโครงสรางววฒนาการของการเผยแพรขาวปลอมบนสอสงคมออนไลน โดยงาน [19] พบวาขาวเทจเปนขาวแปลกใหมกวาขาวจรง แสดงใหเหนวาผคนมแนวโนมทจะแบงปนขอมลใหม ๆ แมวาเรองราวนนจะเปนเรองไมจรงกตาม โดยงาน [62] พบวาขอความทเกยวกบขาวจรงเกดการเผยแพรในแนวกวางและมความลกทสนกวาขอความเกยวกบขาวปลอม และในงาน [64] แสดงใหเหนวาขาวลอทไดรบการพสจนแลววาจรง มแนวโนมทจะไดรบการแกไขอยางรวดเรวกวาทเปนจรง นอกจากน [19] [29] [62] พบวาผคนสวนใหญจะใหความสนใจในการตอบกลบเรองราวใหม มากกวาเรองจรงทถกเปดเผยในภายหลง ซงงาน [64] ไดเสนอวธการทท าใหสามารถรวบรวม จ าแนกและใสค าอธบายประกอบชดขอมลขาว เพอท าความเขาใจวาผใชแพรกระจายสนบสนนหรอปฏเสธขาวลอทไดรบการพสจนแลว และวเคราะหบทบาทของผใชทแตกตางกน

การแบงประเภทขาวปลอมในงาน [27] ไดใชการพจารณาจากน าหนกขอดขอเสยจากการใชคลงขอมลค า ส าหรบการวเคราะหขอความและการท านายแบบคาดเดา การกรองขอมล การตรวจสอบและการยนยนขอมลออนไลนยงเปนสงส าคญ ในงาน [24] มวเคราะหขอมลขาวปลอมทขนอยกบความหมายของขอความทสงออกไป เชน การวเคราะหความหมายของค า การวเคราะหความเชอมนทางอารมณในการท าเหมองขอมล [21] ไดทดสอบประสทธภาพในการตรวจสอบความนาเชอถอของการมอารมณรวมจากการตรวจสอบวดทศน และส ารวจรปแบบขอมลทมการพมพขอความเปรยบเทยบกบขอมลรปแบบวดโอ และเปรยบเทยบอารมณทไดจากการรบรขอมลแบบมอารมณขนและไมมอารมณขน และ [24] ใหความส าคญของคณลกษณะทใช การลดคณลกษณะทเนนถงคณลกษณะทแสดงถงความนาเชอถอทดทสด สวน [65] เสนอระบบการวเคราะหความนาเชอถอใหมส าหรบการประเมนความนาเชอถอของขอมลบนทวตเตอร องคประกอบทอางองจากความมชอเสยง เครองมอแบงประเภทความนาเชอถอ องคประกอบดานประสบการณการใชงานของผใช และอลกอรทมส าหรบการจดอนดบคณลกษณะ นอกจากนมการพฒนาวธการตรวจหาขาวปลอมบนทวตเตอรแบบอตโนมต โดยการเรยนรจากการคาดการณการประเมนความถกตองในชดขอมล ทวตเตอรทนาเชอถอสองชด การวเคราะหคณลกษณะจะระบถงคณลกษณะทคาดการณไดมากทสดส าหรบการประเมนความถกตองทเขมงวดของนกขาว [45] [66]

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

30

การวเคราะหความนาเชอถอของขอมลขาวสารทแพรกระจายผานทางทวตเตอรทเปนบรการทไดรบความนยมมาก [6] [39] [65] [67] ในงานวจย [10] พบวาขอความสวนใหญท โพสตไวท ทวตเตอรเปนจรง แตยงมการแพรกระจายขอมลทผดพลาดและขาวลอทเปนเทจ โดยสวนใหญมาจากความไมไดตงใจ งานวจยนใหความส าคญกบวธการการประเมนความนาเชอถอของขอมลทมการสงในทวตเตอรแบบอตโนมต โดยเฉพาะการวเคราะหโพสตทเกยวของกบหวขอทอยในกลม "Trending" และแยกกลมขอความทนาเชอถอหรอไมนาเชอถอ โดยคณลกษณะจากการสกดขอมล ในงาน [20] ใชแพลตฟอรมในสอสงคมออนไลนเพอใหเกดโอกาสในการศกษารปแบบการแบงปนขอมลรวมกนของผใช การปรกษาหารอเรองเกยวกบขาวลอ และวธการประเมนความถกตองโดยอตโนมตโดยใชการประมวลผลภาษาธรรมชาตและเทคนคการท าเหมองขอมล เปาหมายในการพฒนาระบบ และประเภทขาวลอทประกอบดวย 4 สวน ไดแก การตรวจจบขาวลอ การตดตามขาวลอ การแบงประเภท การจดประเภทความถกตองของขาวลอ

งานวจย [27] [66] [68] [69] ตางมงเนนวธการประมวลผลกบขอความโดยใชกระบวนการวธการเรยนรดวยเครองในการวเคราะหขาวปลอมแบบอตโนมต

งานวจย [26] แสดงวธการตรวจสอบขาวปลอมอยางงายดวยการใชตวแบงประเภท Naïve Bayes โดยใชเปนระบบทดสอบกบชดขอมลจากเฟซบกมความแมนย าในการจดหมวดหมประมาณ 74% งาน [23] ใชการจ าแนกดวย Naïve Bayes ในการวเคราะหความนาเชอถอในกรอบงานใหมแบบหลายขนตอน เพอระบเนอหาทไมนาเชอถอในทวตเตอร และมการปรบปรงความส าคญสมพทธของคณลกษณะทใชเพอปรบปรงความถกตองในการจดหมวดหม ผลการวจย [23] พบวาสามารถจ าแนกความนาเชอถอไดดวยความถกตอง 90.3% ความแมนย า 98.24% และการเรยกคน 98.8%

SAMAR [28] เปนระบบการเรยนรดวยเครองแบบ Supervised learning ในการวเคราะหเนอหาและความรสก ส าหรบสอสงคมออนไลนภาษาอาหรบ ในบรบทนจะกลาวถงปญหาทเกยวของ ดงตอไปน การแสดงขอมลเกยวกบค าศพททดทสด คณสมบตมาตรฐานทใชส าหรบภาษาองกฤษมประโยชนสอดคลองกบภาษาอาหรบหรอไม วธจดการภาษาอาหรบส าหรบคณลกษณะเฉพาะประเภททสงผลกระทบตอประสทธภาพการท างาน [25] งาน [27] ไดเสนอความตองการของระบบคลงขอมลค าศพทส าหรบการตรวจสอบขาวปลอม และขอเสนอแนะในการจดการขาวปลอมแตละประเภท และยงมงานวจยทวเคราะหขาวปลอมในเนอหาขาวอกหลายภาษา เชน ภาษาจน ภาษาอนโดนเซย [6] [39] [45] [57] [65] [67] [65]

ตวอยางการวเคราะหสอสงคมออนไลนทมผลตอระบอบประชาธปไตยในประเทศฝงตะวนตกงาน [3] และขาวการเมองในประเทศสหรฐอเมรกา [17] ไดรบการตแผซ า ๆ เนองจากการเปลยนแปลงเทคโนโลยของสอท าใหคนรบขาวสารไดงายขน จงสงผลใหประชาชนเกดความสนใจใน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

31

เรองการเมองมากขน งาน [62] ไดตรวจสอบปญหาขาวปลอมดานบรบทเนอความขาว ในการเลอกตงประธานาธบดของประเทศสหรฐอเมรกาในป ค.ศ. 2016

จากการศกษาตวอยางงานวจยทมความเกยวของกบการตรวจสอบขาวปลอมบนสอสงคมออนไลน แบงออกเปน 4 ดาน ไดแก Data-oriented, Feature-oriented, Model-oriented และApplication-oriented ดงรายละเอยดในรปท 2.2 [2]

รปท 2.2 การแบงประเภทงานวจยทเกยวของกบการตรวจจบขาวปลอม

จากรปท 2.2 แสดงการแบงประเภทงานวจยท เกยวของกบการตรวจจบขาวปลอมม

รายละเอยดของงานวจยทเกยวของแตละดานดงน Data-oriented ใหความสนใจกบความแตกตางของลกษณะของขอมล ทงในสวนของ

ชดขอมล (Dataset) ทปจจบนยงไมมชดขอมลทเปนมาตรฐานจรง ๆ ส าหรบใชในการวเคราะหขาวปลอม สวนในดานของมมมองดานเวลา พจารณาทชวงระยะเวลาของเนอหาขาวปลอมสามารถปรากฏอย กอนทความจรงจะถกเปดเผย ซงจะมรปแบบทพบแตกตางกนมากมาย การวเคราะหในสวนนจะมงเนนการตรวจหาขาวปลอมเพอแจงเตอนผใชใหระมดระวงตว และสวนสดทายเปนการวเคราะหขาวสารในเชงจตวทยาทมความพยายามในการวเคราะหดานพฤตกรรม ความรสก ปจจยทมความเกยวของกบจตวทยาออกมาในรปแบบตวเลขเชงปรมาณ ทมความนาสนใจทงดานการวดและการประเมนตวเลขทางสถตตาง ๆ [13] นอกจากนนการวเคราะหเนอหาขาวยงประกอบดวยการวเคราะหความหมายของค าทปรากฏในเนอหาขาวรปแบบไวยากรณทใชในเนอหาขาว การวเคราะหโครงสรางประโยคทใชในขาวความพยายามในการสรางฐานความรทเปนชดขอมล (Corpus) ท

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

32

ประกอบดวยค าศพทเทคนคค าศพทเฉพาะ และค าทใชงานทวไป ตลอดจนการวจยทเกยวของกบอารมณทเกดขนและการรบรความรสกเมออานค าทปรากฏในเนอหาขาว [68] [70] การประมวลผลภาษาธรรมชาตถกน ามาใชในการวเคราะหค าทมการใชงาน ตลอดจนความหมายทตองการสอของเนอหาขาวปลอม เพอจ าแนกรายละเอยดตาง ๆ [18] [71]

Feature-oriented สนใจในสวนของการตรวจหาคณลกษณะขอมลทสามารถใชจ าแนกขาวปลอมได แบงเปนสองสวนคอ การวเคราะหเนอหาขาว และการวเคราะหบรบททเกยวของกบขาว โดยการวเคราะหเนอหาขาวจะมงเนนไปในสวนของการวเคราะหทางภาษาศาสตร หรอการวเคราะหภาพ เพอสกดเอาคณลกษณะเฉพาะออกจากขอความ แตการวเคราะหบรบททเกยวของกบขาวมงเนนไปในอกสามดาน ไดแก ดานคณลกษณะทเกยวของกบผใชงาน จะใหความสนใจกบผใชทมประวตผใชทวไปมากกวาผใชทมคณลกษณะเฉพาะบคคล ดานคณลกษณะของการโพสตทมการใชเทคนค Convolution Neural Networks (CNNs) เพอชวยให เขาใจความคดเหนของผ ใชและปฏกรยาการตอบสนองตอขาวปลอม และดานคณลกษณะทเกยวของเครอขายความสมพนธระหวางผใชงาน โดยจะมงเนนไปในสวนของรปแบบในการเชอมตอกนระหวางการตดตอสอสารของผคนทใชงานสอสงคมออนไลนเดยวกนหรอตางกน และการเชอมโยงขอมลระหวางเครอขายสงคมออนไลนตางกนเพอคนหาความจรง

Model-oriented เปนการปรบปรงประสทธภาพในการตรวจจบขาวปลอมใหสามารถท างานไดดมากยงขน โดยการใชเทคนคการจ าแนกขอมลหลายแบบ เชน Supervised classification model, Unsupervised classification model และ Semi-supervised classification model โดยตวอยางของเทคนคทใชในการสรางแบบจ าลองการจ าแนกขอมลทไดรบความนยมใชกน ไดแก Naïve Bayes, [26] [57] Decision Tree, Logistic Regression, K-Nearest Neighbor (KNN), Neural Network, [72] Random Forest [23] และ Support Vector Machine (SVM) [73]

Application-oriented เปนงานวจยทเนนการประยกตการใชงาน เชน การกระจายขาวปลอม ในสวนของการหารปแบบการกระจาย [64] หรอการแทรกแซงขาวปลอมดวยการปรบปรงเปลยนแปลงขอเทจจรงใหบดเบอนไป

หลายหนวยงานมความพยายามในการหยดการเผยแพรขาวปลอม [74] โดยการตรวจสอบความนาเชอถอของขาว เพอหยดการกระจายของขาวปลอม ดวยวธการดงน

การใชคนตรวจสอบความถกตองของขอมล โดยมการอางองกบเครอขายตรวจสอบขอเทจจรงระดบนานาชาต (International Fact Checking Network : IFCN) ทอนญาตใหผใชงานเครอขายสงคมออนไลน สามารถก าหนดคาสถานะของบทความทผดพลาดแบบจงใจได นอกจากนขาวปลอมยงถกตรวจสอบจากองคกรสอสารมวลชนตาง ๆ เชน หนงสอพมพ Washington Post และเวบไซต Snopes.com

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

33

การใชอลกอรทมในการตรวจสอบ [22] [75] [76] [77] เนองจากการแพรกระจายของขาวปลอมไดใช อลกอรทมในการเผยแพร ดงนนจงเกดแนวคดในการใชอลกอรทมมาจดการแพรกระจายของขาวปลอมดวยการระบเนอหาและแหลงทมาของขาว โดยแบงประเภทเปนดงน

อลกอรทมทขนอยกบเนอหาของขาว อลกอรทมทขนอยกบรปแบบทศทางในการกระจายของขอความขาวออกไป อลกอรทมแบบผสมขนอยกบการใหคาน าหนกความส าคญของคาทสนใจ หรอกลม

ของคณลกษณะทสงผลตออลกอรทมทใชเรยนร การใชคนตรวจสอบขอเทจจรงของเนอหาขาววาเปนขาวจรงหรอขาวปลอมเปนสงทนาเชอถอ

มากกวาการใชเทคโนโลยใด ๆ เพยงแตการใชแรงงานคนในการตรวจสอบขอเทจจรงขาวนน ตองใชทรพยากรและคาใชจายในการด าเนนการสงมาก หนวยงานทใหบรการตรวจสอบความจรงขาวจงมความพยายามในการใชวธการในกระบวนการเรยนรดวยเครอง โดยอาศยหลกการใหเหตผลทางตรรกศาสตรทเกยวของมาชวยแกไขปญหา [21] [22] ตวอยางเวบไซตบรการตรวจสอบความถกตอง ความนาเชอถอของขาว ไดแก

FactCheck.Org ตรวจสอบความถกตองของแถลงการณ โฆษณา นโยบายทางการเมอง จากนกการเมอง ผเชยวชาญ รวมถงกลมบคคลทมสวนไดสวนเสยทเกยวของ

Michigan Truth Squad ประเมนความถกตองและความจรงของโฆษณาทางการเมองใน Michigan โดยการแสดงผลการประเมนในหวขอเฉพาะ

Politifact.com ด าเนนการโดยหนงสอพมพ St. Petersburg Times เปนเวบไซตทแสดงคาความจรงดวย "Truth-o-meter" ในการจ าแนกเรองจรงจากเรองราวในแถลงการณทางการเมอง รวมถงโฆษณาตาง ๆ ทเกดขน

Project Vote Smart ตรวจสอบประวตการลงคะแนนเสยง ประวตทมาของบคคล และขอความสาธารณะทปรากฏจากผสมครตาง ๆ ทวประเทศ

ProPublica เปนองคกรอสระทไมหวงผลก าไร โดยหนวยงานจะสรางงานวารสารในเชงสบสวนสอบสวนขอเทจจรงทประชาชนใหความสนใจ

Fact Checker ด าเนนการโดย Glenn Kessler ซงเปนผสอขาวของหนงสอพมพ Washington Post เพอตรวจสอบความถกตองของแถลงการณทางการเมองทเกยวของกบตวเลขทส าคญ ปญหาทมความส าคญในระดบทองถน ระดบชาตในประเทศสหรฐอเมรกา และระดบนานาชาต

Snopes.com เปนเวบไซตตรวจสอบเรองราวทเกยวของกบการเมอง เรองชาวบาน เรองเลาตาง ๆ ขาวลอทเกดขน

นอกจากประเดนทกลาวมาขางตน [2] ไดอภปรายเกยวกบพนททเกยวของกบงานวจย ปญหาและแนวทางในการวจยในอนาคตส าหรบการตรวจสอบขาวปลอมบนสอสงคมออนไลน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

บทท 3 วธการด าเนนงานวจย

งานวจยนเสนอ วธการจ าแนกขาวปลอมบนสอสงคมออนไลนทวตเตอรดวยวธการเรยนรดวยเครอง เนอหาในบทนประกอบดวย ภาพรวมของระบบ การเกบขอมลขาวจากสอสงคมออนไลน ทวตเตอร กอนจะน าไปประมวลผลดวยวธการเรยนรดวยเครองการวดและประเมนผล ดงรายละเอยดตอไปน

3.1 ภาพรวมของระบบ

การเกบขอมลเพอใชในงานวจยทพฒนาแบงออกเปนสามสวนหลก ไดแก สวนแรกเปนการเกบขอมลหวขอขาวทสนใจจากเครอขายสงคมออนไลนทวตเตอร สวนตอมาเปนสวนของกระบวนการปรบปรงเปลยนแปลงรปแบบขอมลใหเหมาะสมกบการน าไปประมวลผล และสวนสดทายคอการน าขอมลไปผานกระบวนการเรยนรดวยเครอง โดยรายละเอยดของภาพรวมกระบวนการด าเนนงานในงานวจยนแสดงดงรปท 3.1

รปท 3.1 ภาพรวมกระบวนการด าเนนงานในงานวจย

Twitter’s news

Text preprocessing formatted

Normalization

Eliminated duplicate data

Machine learning processes

Experimental results

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

35

จากรปท 3.1 แสดงภาพรวมกระบวนการด าเนนงานในงานวจยประกอบดวยสามสวน โดยเรมตนจากการเกบขอมลหวขอขาวทสนใจจากเครอขายสงคมออนไลนทวตเตอร จากนนจงท าการประมวลผลจากขอมลดบของหวขอขาวทก าหนดใหทอยในรปแบบไมเปนโครงสราง (Unstructured data) ใหเปนขอมลทอยในรปแบบเปนโครงสราง (Structure data) ทเหมาะสมโดยจดเกบเปนไฟล .csv เนองจากขอมลทมลกษณะไมเปนโครงสรางนนไมเหมาะสมกบการน าไปใชในกระบวนการเรยนรดวยเครอง [56] จากนนจงน าไฟล .csv ทไดมาปรบเปลยนรปแบบขอมลทอยในโครงสรางทก าหนดไวจากขอมลทเปนขอความตาง ๆ ใหเปลยนคาเปนคาตวเลขโดยใชเงอนไขทก าหนดไวในตารางท 3.1 แลวจงท าความสะอาดขอมลโดยการขจดขอมลสวนทซ ากนออกไปใหเหลอเฉพาะขอมลทไมซ ากนเลย และเขาสกระบวนการสดทายคอการน าขอมลไปผานกระบวนการเรยนรดวยเครองไดเปนผลลพธออกมาในทสด

3.2 การเกบขอมลขาวจากสอสงคมออนไลนทวตเตอร การเลอกหวขอขาวส าหรบงานวจยน ใหความส าคญกบหวขอขาวทมความเกยวของกบ

เหตการณจากปรากฏการณทางธรรมชาต และเหตการณส าคญเฉพาะกาล ซงภยคกคามทางธรรมชาตเปนเรองทคาดเดาไดยากวาจะเกดเหตการณรายแรงขนมาเมอใด บางครง เมอมขาวลวงเกดขนมาในระหวางทเกดเหตการณ คนทวไปจะทราบไดอยางไรวาขาวทมการบอกตอกนนนเกดจากขอเทจจรง หรอเกดจากการเขาใจคลาดเคลอนในการแจงขาวสารกอใหเกดความเทจแลวสงตอกนไปจงท าใหผคนเกดความเขาใจผดพลาดไปได

การด าเนนงานวจยในเบองตน ไดจดเกบขอมลจากสอสงคมออนไลนทวตเตอร ในชวงทมการเปลยนแปลงฤดกาล ระหวางเดอนตลาคม ถงพฤศจกายน พ.ศ. 2560 โดยเลอกเกบขอมลในหวขอเรองทเกยวของกบภยทเกดจากผลกระทบสบเนองจากปรากฏการณทางธรรมชาต เชน น าทวม, น าทวมกรงเทพ, ฝนตก, น าปา, เขอนแตก, พาย, พายขนน, พายไตฝนลง, พายดเพรสชน, ปลอยน าทวมรงสต, ปลอยน าทวม, แผนดนไหว, เขาสฤดหนาว, ภยหนาว, อณหภมลดลง, สภาพอากาศแปรปรวน, หนาว เปนตน นอกจากนนในชวงเวลาดงกลาวยงมขาวทเกยวของกบงานทมความส าคญตอจตใจของประชาชนชาวไทยอกประเดนหนงคอขาวทเกยวของกบงานพระราชพธถวายพระเพลงพระบรมศพพระบาทสมเดจพระเจาอยหว รชกาลท 9 ซงเปนเหตการณเฉพาะกาลในชวงเวลานน เนองจากในรชสมยของรชกาลท 9 มชวงระยะเวลายาวนานถง 70 ป มโครงการอนเนองมาจากพระราชด าร และจากพระราชกรณยกจทเกดขนเพอประโยชนสขของประชาชนจ านวนมากมาย ดงนนประชาชนไทยสวนมากจงใหความรกความเทดทนตอสถาบนพระมหากษตรย เปนอยางยง ดวยความรกความผกพนทเกดขนนท าใหประเดนขาวใดกตามทมความเกยวของกบพระมหากษตรยจะเปนทไดรบความสนใจ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

36

จากประชาชนอยางมากเปนพเศษ ในงานวจยนจงไดเลอกหวขอขาวทมค าส าคญทเกยวของกบรชกาลท 9 ในชวงเวลาด งกล าว เชน รชกาลท 9, พระราชพธถวายพระเพล ง, ดอกไม เพอ พอ , ปากคลองตลาด, นทรรศการงานพระราชพธ, สฟาเสวยสวรรค, สถตในดวงใจไทยนรนดร, สงเสดจสสวรรคาลย, เตมน ามนฟร, บางจากเตมฟร, ดอกไมจนทน, พนกานดอกไมจนทนจากสด าเปนขาว, ยายผวาชลบร นนทบร เปนตน และยงมหวขอขาวอนทเปนเหตการณทคนในสงคมใหความสนใจ เชน การลดหยอนภาษ การเกบเงนสมทบกองทนประกนสงคม เปนตน

จากหวขอขาวทกลาวมาขางตน การเลอกเกบขอมลจากเครอขายสงคมออนไลนทวตเตอรผาน Twitter API ดวย 22 คณลกษณะ ดงตอไปน

Id, Name, IsVerified, ProfileImageUrl, FollowersCount, FriendsCount,

FavouritesCount, StatusesCount, Description, Location, TimeZone, UserCreatedDate, Status, Url, Mentions, Number of Mentions, HashTags, Number of HashTags, RetweetCount, TweetCreatedDate, MessageText, MessageImage

โดยการเลอกใช 22 คณลกษณะในงานวจยน ไดแนวความคดมาจากงานวจย [23] ทมการใช 20 คณลกษณะในการประเมนความนาเชอถอขอความภาษาอาหรบในเครอขายสงคมออนไลน ทวตเตอร ซงในงานวจยนหลงจากเกบขอมลไดมการวเคราะหความส าคญของคณลกษณะหากมการพจารณาตดคณลกษณะใดออกแลวจะสงผลตอคารอยละของความถกตองในการวเคราะหขาวปลอม รายละเอยดจะกลาวถงในหวขอถดไป

เมอจดเกบขอมลจากทวตเตอรตามเงอนไขทไดกลาวมาขางตนแลว ไดขอความทเกยวของกบหวขอขาวทก าหนด น าขอความทไดมาผานกระบวนการท าความสะอาดขอมลกอนน าไปประมวลผลจ านวนทงหมด 948,373 ขอความ

เมอจดเกบขอมลจากทวตเตอรและปรบรปแบบขอมลในอยในรปโครงสรางดวยไฟล .csv แลว ล าดบตอไปในการจดเตรยมขอมลส าหรบกระบวนการเรยนรดวยเครองคอการน าขอมลมาปรบคาใหเปนตวเลข (Encoder to data normalization) ซงเปนการจดหมวดหมขอมลเพอท าใหงายและเกดประสทธภาพในกระบวนการเรยนรมากขน การน าขอมลมาปรบคาใหเปนตวเลข กอนน าไปเขา สกระบวนการเรยนรดวยเครอง

รปแบบการปรบคาขอมลใหเปนตวเลขมหลายวธ [78] ยกตวอยางเชน 1) การปรบคาขอมลโดยการเขารหสแบบคลาสสค (Classic Encoders)

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

37

ขอมลทอยในรปแบบตวอกษร หรอขอความตาง ๆ หากใชการเขารหสแบบคลาสสคจะใชวธการแปลงคาขอมลทอยในรปแบบตวอกษรหรอตวเลขใหเปลยนแปลงไปเปนตวเลขหนงเพอสอความหมายตามทตองการ เชน

Ordinal —เปนวธการแปลงขอมลอยางงายทก าหนดใหขอความตาง ๆ เปลยนไปเปนตวเลขจ านวนเตมตามทตองการ โดยตวเลขผลการแปลงคา จะมคาอยในชวงระหวาง 1 ถง k โดยทคา k เปนจ านวนขอมลทไมซ ากนเลยในจ านวนมตขอมลทตองการแปลง

OneHot — เปนการแปลงขอมลจากคาหนงไปเปนตวเลขทมคาเพยงคาใดคาหนงจากคาในหลายมตทก าหนด โดยทคาทอยในมตอน ๆ จะมคาเปนศนยหรอไมมคา เพอท าใหสามารถเปรยบเทยบกบคาทไดกบคาในมตอน ๆ

Binary — เปนวธการแปลงคาแตละตวเลขใหอยในรปแบบตวเลขฐานสอง ซงแตละหลกของเลขฐานสองจะถกเกบในแตละคอลมนแยกกน ซงรปแบบนอาจท าใหขอมลบางสวนหายไปไดในกรณทมจ านวนคอลมนส าหรบจดเกบขอมลนอยกวาจ านวนหลกจรงของคาตวเลขฐานสองทแปลงได

BaseN — เปนการแปลงคาลกษณะเดยวกนกบการแปลงคาใหอยในรปแบบเลขฐานสอง แตใชฐานเลขเปนจ านวน N ใด ๆ แทน ซงขอจ ากดจะนอยกวาแบบ Binary เนองจากชวงคาขอมลมคามากกวา

Hashing — เปนการแปลงขอมลจากคาหนงไปเปนตวเลขทมคาในคอลมนใดเพยงคอลมนหนงลกษณะเชนเดยวกบแบบ OneHot แตวธการนจะใชจ านวนคอลมนทนอยกวาและมการใชฟงกชนการค านวณผลลพธ ซงอาจท าใหผลทไดเกดปญหาการชนกนของขอมล (Collision)

2) วธการเขารหสแบบเปรยบเทยบ (Contrast Encoders) การเขารหสในลกษณะนใชส าหรบกรณทมหลายปญหาทขดแยงกน ซงผลลพธทไดจากการ

แปลงคาจะไดขอมลหนงคอลมนส าหรบขอมลหนงคา

Helmert (reverse) — ใชกบตวแปรทมความอสระตอกน เพอใชเปรยบเทยบคาเฉลยกบความสมพนธทขนอยกบตวแปรกอนหนา

Sum — เปรยบเทยบคาเฉลยของตวแปรทขนกบคาตวแปรกอนหนากบคาเฉลยของตวแปรทงหมดในระดบเดยวกน

Backward Difference — เปรยบเทยบคาเฉลยตวแปรตามในระดบขอมลกบคาเฉลยตวแปรตามของขอมลระดบกอนหนา

Polynomial — การ เป ร ยบ เท ยบความแตกต างระหว างค า เฉล ย ข อม ลด วย Orthogonal polynomial โดยแสดงออกมาในรปกราฟความสมพนธ เพอวเคราะหแนวโนมโดยพจารณาจากคาสมประสทธของกราฟทได หากเปนรปแบบกราฟเสนตรงแสดงวาไดคาสมประสทธยก

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

38

ก าลงหนง (Linear) กราฟเสนโคงแสดงวาไดคาสมประสทธยกก าลงสอง (Quadratic) หรอคาสมประสทธยกก าลงสาม (Cubic)

งานวจยนเลอกใชวธการแปลงเปนตวเลขแบบ Ordinal ซงเขาใจไดงายเปนเงอนไขการแปลงขอมลใหอยในชวงตวเลขจ านวนเตมทเหมาะสมกบแตละคณลกษณะขอมล โดยมรายละเอยดทใชในการแปลงขอมลเปนตวเลขดงตอไปน

1) Id หรอรหสผใชเปนตวเลขททวตเตอรใชในการจ าแนกแตละบญชผใชงาน ประกอบดวยตวเลขสองลกษณะคอลกษณะแรกประกอบดวยตวเลขจ านวน 9-10 หลกใชส าหรบบญชผใชทไดเรมตนใชงานในชวงแรกททวตเตอรเรมเปดใหบรการ และอกลกษณะหนงประกอบดวยตวเลขจ านวน 18 หลกเปนบญชของผใชทขอใชงานทวตเตอรมาไมนาน

2) Name ซงคอชอผใชงานทวตเตอร โดยรปแบบของชอผใชงานทปรากฏแบงไดเปน 4 รปแบบ ไดแก ชอทประกอบดวยตวอกขระภาษาไทยเทานน ชอทประกอบดวยตวอกขระภาษาองกฤษเทานน ชอทประกอบดวยตวอกขระภาษาไทยผสมกบภาษาองกฤษกบตวเลข และชอทประกอบดวยตวอกขระภาษาอน ๆ

3) Isverified เปนคณลกษณะของผใชทผใชไดยนยนตวบคคลกบทางทวตเตอร ซงเงอนไขนมคาอยสองแบบคอ true ส าหรบผใชงานทผานการยนยนตวตนผใชแลว และ false ส าหรบผใชทไมมการยนยนตวตน

4) ProfileImageUrl คอต าแหนงทจดเกบ URL ทเชอมโยงไปยงรปภาพประวตสวนตวของผใช ซงผใชบางคนอาจไมมรปภาพประวตสวนตว หรอมรปภาพทมนามสกลเปน .jpg หรอรปภาพทมนามสกลเปน .png หรอรปภาพทมนามสกลอน ๆ

5) FollowersCount ซงเปนตวเลขการนบจ านวนผตดตามของบญชผใช Twitter แตละคน ตวเลขจ านวนผตดตามนประกอบดวยตวเลขหลายหลก จงใชวธการค านวณโดยการหารดวยเลข 10 ไดผลออกมาเปนตวเลขจ านวนหลกของผตดตามแทนจ านวนนบจรง ๆ จากขอมลเบองตนในทนมคาอยในชวงระหวาง 1-7 โดยเรมตนจาก 1 หมายถงบญชนนมจ านวนผตดตาม 0-9 คน และมคาไมเกน 7 ทหมายถงมผตดตามบญชนน 1,000,000-9,999,999 คน

6) Friendscount, Favoritescount, และ StatusesCount หมายถง จ านวนเพอนทมของบญช จ านวนขอความทผใชเคยกดถกใจ และจ านวนสถานะของบญช ตามล าดบ ซงคาทกลาวมานเปนคาตวเลขลกษณะแบบเดยวกบ FollowersCount จงใช เงอนไขในการแปลงคาตวเลขเชนเดยวกน

7) Description คอรายละเอยดของผใชทตองการอธบายเกยวกบตวเอง เงอนไขทใชในการแปลงเปนตวเลขของเงอนไขนเปนเชนเดยวกบ Name เนองจากมคณลกษณะขอมลแบบเดยวกน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

39

8) Location เปนสถานททผใชโพสตขอความ TimeZone เปนเขตเวลาทบญชผใชนนถกสรางขน ทงสองคณลกษณะนเปนชอสถานทเชนเดยวกนจงใชเงอนไขเดยวกน โดยแบงเขตเวลาและสถานทตามต าแหนงบรเวณทตงของแตละภมภาค ในงานวจยนสนใจขอความทวตเตอรภาษาไทยจงตองการเนนเฉพาะสวนประเทศไทยจงแยกออกจากมาเปนอกสวน โดยรายละเอยดทง 7 เขต ไดแก ในประเทศไทย , เอเชยตะวนออกเฉยงใต , เอเชย , ออสเตรเลย/นวซแลนด , ยโรป/รสเซย , สหรฐอเมรกา/แคนาดา/อลาสกา/ฮาวาย และ แอฟรกา นอกจากนอาจมผใชบางคนไมไดระบสถานทและเขตเวลาใน 7 บรเวณทกลาวมาขางตน

9) UserCreateDate เปนวนทผใชสรางบญชผใชงานขนมา ทวตเตอรถกสรางขนมาใชงานครงแรกในเดอนมนาคม ค.ศ. 2006 และมการเรมตนใชงานในเดอนกรกฎาคมในปเดยวกน เพอใหสามารถแยกกลมอายการใชงานของผใชได ในงานวจยนจงไดประมวลผลคาวนทบญชผใชงานถกสรางขนเปนอายการใชงานของบญชแลวเลอกแบงกลมยอยตามระยะเวลาทบญชไดเปดใชงานมาแลว โดยก าหนดการแบงชวงหางของระยะเวลาการเปดใชงานแตละชวงเทากบ 6 เดอน หรอมคาเทากบ 0.5 ป เชน 0.5, 1, 1.5, ...

10) Status เปนคณลกษณะทผใชบงบอกสถานะของบญชผใชงาน ในเงอนไขนสนใจเฉพาะการมคาสถานะปรากฏอย หรอไมมคาสถานะ

11) Url เปนขอความของการเชอมโยงไปยงสอปลายทางทขอความนนตองการระบถง ในทนแตละขอความอาจไมม URL ปรากฏเลย หรออาจมเพยงหนง URL หรออาจมมากกวากได

12) Mentions เปนรายละเอยดของชอผใชทถกกลาวถงในขอความ ซงจะปรากฏในขอความตามหลงสญลกษณ @ และในแตละขอความอาจจะไมม Mentions เลย หรอม Mentions เพยงหนงสญลกษณ หรอมากกวากได

13) Number of Mentions เปนจ านวนสญลกษณ @ ทปรากฏในขอความ ซงคาดงกลาวนไดตวเลขมาจาก Twitter API

14) HashTags เปนรายละเอยดทผใชตองการอธบายหรอระบเฉพาะเจาะจงในหวขอเรองของขอความโดยปกตขอความทเปน HashTag จะปรากฏสญลกษณ # หนาขอความ และอาจไมมในขอความเลยหรอมมากกวาหนงสญลกษณในขอความกได

15) Number of HashTags เปนจ านวนสญลกษณ # ทปรากฏในขอความ ซงไดคาตวเลขนไดมาจาก Twitter API เชนเดยวกนกบจ านวนตวเลขของ Mentions

16) RetweetCount เปนจ านวนตวเลขของขอความทถกน าไปเผยแพรซ าอกครงโดยบคคลอนทไมใชเจาของขอความ เนองจากจ านวนคาตวเลขทไดมความคลายกบจ านวนผตดตาม จงใชเงอนไขในการแปลงเปนตวเลขเชนเดยวกน ซงจากขอมลทใชในงานวจยจะไดคาผลลพธทไดอยในชวงระหวาง 1-7

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

40

17) TweetCreatedDate เปนวนทเวลาทขอความนนถกสรางขน ซงคาตวเลขทน ามาใชในการแปลงไดแบงตามชวงเวลาทสรางขอความขนมา เพอใหสามารถแยกแยะไดวาขอความนนถกสรางในเวลากลางวนหรอกลางคน จงแบงชวงเวลาของขอความทถกสรางเปน 4 ชวงดงน 06.01-12.00 น., 12.01-18.00 น., 18.01-24.00 น., 00.01-06.00 น.

18) MessageText เปนรายละเอยดของขอความทมการสงถงกน โดยขอความทสงนอาจเปนขอความทเขยนขนมาเอง หรอเปนขอความทสงตอจากบญชผใชอนกได ดงนนเงอนไขในการแปลงนจงตรวจสอบความเปนเจาของหรอไมใชแตเปนขอความทถกสงตออกครง

19) MessageImage เปนทอยการเชอมโยง URL ไปยงรปภาพทเกยวของกบขอความ โดยในแตละขอความอาจจะไมปรากฏหรออาจมเพยงหนงหรออาจมมากกวาหนงการเชอมโยงไปยงรปภาพทเกยวของกได

จากเงอนไขทกลาวมาขางตน สรปขอมลแสดงในรปแบบตารางไดดงตารางท 3.1 ตารางท 3.1 เงอนไขทใชในการแปลงขอมลแตละคณลกษณะเปนตวเลข

คณลกษณะ เงอนไขการแปลงคา

รายละเอยดทตรวจสอบ ผลการแปลงคา

Id

ไมปรากฏขอมล 0

9-10 หลก 1

18 หลก 2

Name, Description

ไมปรากฏขอมล 0

ตวอกขระภาษาไทยทงหมด 1

ตวอกขระภาษาองกฤษทงหมด 2

ตวอกขระภาษาไทยหรอภาษาองกฤษหรอตวเลข 3

ตวอกขระภาษาอน ๆ 4

สญลกษณอน ๆ 5

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

41

ตารางท 3.1 (ตอ) เงอนไขทใชในการแปลงขอมลแตละคณลกษณะเปนตวเลข

คณลกษณะ เงอนไขการแปลงคา รายละเอยดทตรวจสอบ ผลการแปลงคา

IsVerified ไมปรากฏขอมล 0 True 1 False 2

ProfileImageUrl

ไมปรากฏขอมล 0 .jpg 1 .png 2 อน ๆ 3

FollowersCount, FriendsCount,

FavouritesCount, StatusesCount, RetweetCount,

ไมปรากฏขอมล 0 1-9 1 10-99 2 100-999 3 1,000-9,999 4 10,000-99,999 5 100,000-999,999 6 1,000,000-9,999,999 7

Location, TimeZone

ไมปรากฏขอมล 0 ประเทศไทย 1 เอเชยตะวนออกเฉยงใตยกเวนประเทศไทย 2

เอเชยยกเวนเอเชยตะวนออกเฉยงใต 3 ออสเตรเลย/นวซแลนด 4 ยโรป/รสเซย 5 สหรฐอเมรกา/แคนาดา/อลาสกา/ฮาวาย 6

แอฟรกา 7 อน ๆ 8

CreatedDate

ไมปรากฏขอมล 0 นอยกวา 0.5 ป 1 ระหวาง 0.5 ป ถง 1 ป 2 … (เพมขนชวงละ 0.5 ป) …

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

42

ตารางท 3.1 (ตอ) เงอนไขทใชในการแปลงขอมลแตละคณลกษณะเปนตวเลข

คณลกษณะ เงอนไขการแปลงคา รายละเอยดทตรวจสอบ ผลการแปลงคา

Url, MessageImage, Mentions, HashTags, Number of Mentions, Number of HashTags

ไมปรากฏขอมล 0 1 ลงค หรอ 1 @ หรอ 1 # 1 2 ลงค หรอ 2 @ หรอ 2 # 2 3 ลงค หรอ 3 @ หรอ 3 # 3 มากกวา 3 ลงค หรอ 3 @ หรอ 3 # 4

Status ไมปรากฏขอมล 0 มคาสถานะ 1

TweetCreatedDate

ไมปรากฏขอมล 0 06.01-12.00 น. 1 12.01-18.00 น. 2 18.01-24.00 น. 3 00.01-06.00 น. 4

MessageText ขอความทเขยนเอง 0 ขอความท Retweet 1

ขนตอนนมการระบประเภทของขาว (Class) แตละรายการโดยคาของรายการทเปนเนอหาขาว

จรงมคาเปน 1 และขาวปลอมมคาเปน 0 หลงจากกระบวนการปรบเปลยนขอมลใหอยในรปแบบตวเลขทงหมดแลว จะไดไฟล .csv ทมชดขอมลตวเลขแทนขอความทเกยวของกบหวขอขาวทงหมด 948,373 รายการ ตอจากนนยงไดท าความสะอาดชดขอมลโดยการก าจดขอมลสวนทซ ากนออกไป เพอใหกระบวนการเรยนรดวยเครองท างานไดอยางมประสทธภาพมากขน หลงจากการเอารายการทซ ากนออก จงเหลอชดขอมลทมคาไมซ ากนเลยจ านวน 327,784 รายการ ส าหรบน าไปใชในกระบวนการเรยนรดวยเครองเพอจ าแนกขาวปลอมตอไป ตวอยางรายการบางสวนของชดขอมลท ไมซ ากนแสดงดงตารางท 3.2

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

43

ตารางท 3.2 ตวอยางรายการขอมลหลงจากกระบวนการปรบเปลยนขอมลใหอยในรปแบบตวเลข Id

Nam

e

IsVer

ified

Prof

ileIm

ageU

rl

Follo

wersC

ount

Frien

dsCo

unt

Favo

urite

sCou

nt

Stat

uses

Coun

t

Desc

riptio

n

Loca

tion

TimeZ

one

Crea

tedD

ate

Stat

us

Url

Men

tions

Num

ber o

f Men

tions

Hash

Tags

Num

ber o

f Has

hTag

s

Retw

eetC

ount

Twee

tCre

ated

Date

Mes

sage

Text

Mes

sage

Imag

e

Clas

s

1 3 2 1 3 3 5 5 3 1 0 4 1 0 2 2 3 3 4 1 1 0 1

2 3 2 1 2 3 3 5 3 1 0 1 1 3 2 2 2 2 2 4 1 0 0

จากตวอยางรายการขอมลในบรรทดแรกของตารางท 3.2 สามารถอธบายหมายความของ

ขอมลรายการนไดดงรายละเอยดตอไปน Id มคาเทากบ 1 แสดงวารหสของบญชผใชเปนขอมลทเปนตวเลขขนาด 9-10 หลกทเปนบญช

ผใชทไดเรมตนใชงานในชวงแรกททวตเตอรเรมเปดใหบรการ Name มคาเทากบ 3 แสดงวาเปนชอผใชงานทวตเตอรทประกอบดวยตวอกขระภาษาไทยผสม

กบภาษาองกฤษกบตวเลข IsVerified มคาเทากบ 2 แสดงถงคณลกษณะของผใชทผใชไดยนยนตวบคคลกบทางทวตเตอร

มคาเปน false นนคอผใชนไมมการยนยนตวตน ProfileImageUrl มคาเทากบ 1 แสดงวาต าแหนงทจดเกบ URL ทเชอมโยงไปยงรปภาพ

ประวตสวนตวของผใชเปนรปภาพทมนามสกลเปน .jpg FollowersCount มคาเทากบ 3 แสดงวาจ านวนผตดตามของบญชผใชงานน อยในชวงคา

ระหวาง 100-999 FriendsCount มคาเทากบ 3 แสดงวาจ านวนเพอนทมของบญชผใชงานน อยในชวงคา

ระหวาง 100-999 FavouritesCount มคาเทากบ 5 แสดงวาจ านวนขอความทผใชนเคยกดถกใจ อยในชวงคา

ระหวาง 10,000-99,999 StatusesCount มคาเทากบ 5 แสดงวาจ านวนสถานะของบญช อยในชวงคาระหวาง

10,000-99,999 Description มคาเทากบ 3 แสดงวาเปนรายละเอยดของผใชทตองการอธบายเกยวกบตวเองท

ประกอบดวยตวอกขระภาษาไทยผสมกบภาษาองกฤษกบตวเลข Location มคาเทากบ 1 แสดงวาสถานททผใชโพสตขอความอยในประเทศไทย TimeZone มคาเทากบ 0 แสดงวาไมมการระบคาเขตเวลาทบญชผใชนนถกสรางขน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

44

CreatedDate มคาเทากบ 4 แสดงวาบญชผใชนไดเปดใชงานมาแลวเปนระยะเวลานานระหวาง 1.5 ป ถง 2 ป

Status มคาเทากบ 1 แสดงวาบญชผใชงานนมคาสถานะปรากฏอย Url มคาเทากบ 0 แสดงวาขอความนไมมจดเชอมโยงไปยงสอปลายทางอน ๆ Mentions มคาเทากบ 2 แสดงวามรายละเอยดของชอผใชทถกกลาวถงในขอความตามหลง

สญลกษณ @ เพยง 2 ชอ Number of Mentions มคาเทากบ 2 แสดงวา Twitter API คนคาจ านวนสญลกษณ @ ท

ปรากฏในขอความมาเปน 2 ซงเปนทสงเกตวามคาเทากบจ านวน Mentions ทพบในขอมลรายการเดยวกน

HashTags มคาเทากบ 3 แสดงวามรายละเอยดทผใชตองการอธบายหรอระบเฉพาะเจาะจงในขอความตามหลงสญลกษณ # จ านวน 3 ประเดน

Number of HashTags มคาเทากบ 3 แสดงวา Twitter API คนคาจ านวนสญลกษณ # ทปรากฏในขอความมาเปน 3 ซงเปนทสงเกตวามคาเทากบจ านวน HashTags ทพบในขอมลรายการเดยวกน

RetweetCount มคาเทากบ 4 แสดงวาขอความนมการน าไปเผยแพรซ าอกจ านวนอยในชวงคาระหวาง 1,000-9,999 ครงโดยบคคลอนทไมใชเจาของขอความ

TweetCreatedDate มคาเทากบ 1 แสดงวาวนทเวลาทขอความนนถกสรางขนอยในชวงเวลาระหวาง 06.01-12.00 น.

MessageText มคาเทากบ 1 แสดงวารายละเอยดของขอความทมการสงถงกนเปนขอความทถกสงตออกครง (Retweet)

MessageImage มคาเทากบ 0 แสดงวาไมมการเชอมโยง URL ไปยงรปภาพทเกยวของกบขอความ

Class มคาเทากบ 1 แสดงวา ขอความรายการนเปนขาวจรง การเกบขอมลขาวในงานวจยนเลอกเกบขอมลจากเครอขายสงคมออนไลนทวตเตอรระหวาง

เดอนตลาคม ถงเดอนพฤศจกายน 2560 โดยมรายละเอยดจ านวนหวขอขาวทไดจดเกบรวมมา จ านวน 948,373 ขอความ แบงตามประเภทขาวจรงจ านวน 827,073 ขอความ (คดเปนรอยละ 87.21 จากหวขอขาวทเกบมาทงหมด) ขาวปลอมจ านวน 121,300 ขอความ (คดเปนรอยละ 12.79 จากหวขอขาวทเกบมาทงหมด) ซงรายละเอยดทงหมดแสดงดงตารางท 3.3

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

45

ตารางท 3.3 รายละเอยดจ านวนขาวทมการจดเกบขอมล

หวขอขาว จ านวนขาว คดเปนรอยละ

รวม ขาวจรง ขาวปลอม ขาวจรง ขาวปลอม

ดอกไมจนทน, กานดอกไมจนทนด าเปนขาว, ดอกไมเพอพอ, ปากคลองตลาด, สนามหลวง, ถวายอาลย, นอมสงเสดจสสวรรคาลย, สงเสดจสสวรรคาลย, สฟาเสวยสวรรค, รชกาลท 9, พระราชพธถวายพระเพลง, สถตในดวงใจนรนดร, นทรรศการงานพระราชพธ, เครองราชอสรยาภรณ, น ามนฟร, สลบผวา ชลบร นนทบร

363,639 357,485 6,154 98.31 1.69

น าทวม, เขอนแตก, น าเหนอมา, ปลอยน าทวมรงสต, ฝนตก, พายขนน, ไตฝนลง, หนาว, อากาศหนาว, แผนดนไหว

361,751 254,777 106,974 70.43 29.57

กาวคนละกาว, กนเจ, เลอกตงญปน, อบตเหต, เจาชายซาอฯ, มารค เยอนไทย, รานสะดวกซอ ขายเบยรสด, เพมเงนสมทบประกนสงคม, ชอปชวยชาต ลดหยอนภาษ, อาบอบนวด ลดหยอนภาษ

222,983 214,811 8,172 96.34 3.66

จ านวนรวม 948,373 827,073 121,300 87.21 12.79

จากตารางท 3.3 หวขอขาวทจดเกบมาในกลมแรก ไดแก ขาวทเกยวของกบพระมหากษตรย

เชน ดอกไมจนทน, กานดอกไมจนทนด าเปนขาว, ดอกไมเพอพอ, ปากคลองตลาด, สนามหลวง, ถวายอาลย, นอมสงเสดจสสวรรคาลย, สงเสดจสสวรรคาลย, สฟาเสวยสวรรค , รชกาลท 9, พระราชพธถวายพระเพลง, สถตในดวงใจนรนดร, นทรรศการงานพระราชพธ, เครองราชอสรยาภรณ, น ามนฟร, สลบผวา ชลบร นนทบร จ านวนขาวรวม 363,639 ขอความ แบงเปนขาวจรง 357,485 ขอความ (คดเปนรอยละ 98.31 จากหวขอขาวทเกบมา) ขาวปลอม 6,154 ขอความ (คดเปนรอยละ 1.69 จากหวขอขาวทเกบมา) หวขอขาวกลมทสอง ไดแก น าทวม, เขอนแตก, น าเหนอมา, ปลอยน าทวมรงสต, ฝนตก, พายขนน, ไตฝนลง, หนาว, อากาศหนาว, แผนดนไหว จ านวนขาวรวม 361,751 ขอความ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

46

แบงเปนขาวจรง 254,777 ขอความ (คดเปนรอยละ 70.43 จากหวขอขาวทเกบมา) ขาวปลอม 106,974 ขอความ (คดเปนรอยละ 29.57 จากหวขอขาวทเกบมา) และหวขอขาวกลมสดทาย ไดแก กาวคนละกาว, กนเจ, เลอกตงญปน, อบตเหต, เจาชายซาอฯ, มารค เยอนไทย, รานสะดวกซอ ขายเบยรสด, เพมเงนสมทบประกนสงคม, ชอปชวยชาต ลดหยอนภาษ, อาบอบนวด ลดหยอนภาษ จ านวนขาวรวม 222,983 ขอความ แบงเปนขาวจรง 214,811 ขอความ (คดเปนรอยละ 96.34 จากหวขอขาวทเกบมา) ขาวปลอม 8,172 ขอความ (คดเปนรอยละ 3.66 จากหวขอขาวทเกบมา)

การเกบรวบรวมขอมลจากเครอขายสงคมออนไลนทวตเตอร เรมจากการก าหนดคาคณลกษณะตาง ๆ ทตองการเรยกเกบจาก Twitter API และ ระบค า

ส าคญทเปนหวขอขาวทตองการเกบขอมล โดยการเกบขอมลจากทวตเตอรมขอจ ากดในสทธการเขาถงขอมลคอส าหรบแตละคาโทเคน (token) จะสามารถใชเรยกเกบขอมลไดทก ๆ 15 นาทตอครง และเรยกขอความไดมากทสดครงละไมเกน 20,000 ขอความ การเรยกขอมลยอนหลงท าไดไมเกน 7 วน ดงนนหากตองการขอมลทมค าส าคญเดยวกนมาก ๆ จ าเปนตองมการเรยกเกบขอมลดวยค าส าคญเดมซ ากนหลายครง แลวจงน าไปท าความสะอาดขอมลโดยการตดรายการทซ าออกในภายหลง

วธการพจารณาขาวจรงขาวปลอมของขอความทไดจากเครอขายสงคมออนไลนทวตเตอร เมอพจารณาขอความทไดจากเครอขายสงคมออนไลนทวตเตอร และตรวจพบสงทไมใชขาว ซง

ไมใชขอความทตองการใชในงานวจย จะลบขอความเหลานทงไป ซงสงทไมใชขาวมลกษณะดงตอไปน ค าบน ค าพดกลาวขนมาลอย ๆ ไมมทมาทไป ประโยคค าถาม ค าโฆษณาชวนเชอ การแสดงความคดเหนทเกยวของกบประเดนขาว ค าชกชวน ปลกระดม ไปรวมท ากจกรรมตาง ๆ การโจมต กลาวหาใหรายบคคลอน/องคกรตาง ๆ ค าหยาบ ค าไมสภาพ ค าสบถ ค าดา ค าทมความหมายเชงหมนเหมในเรองเพศ ค าพดทตอง

ตความในลกษณะตองคดลกจงจะเขาใจความหมาย การใชค าทเปนเทรนด แตขอความในเนอหาไมมความเกยวของกบ hashtag ทอางถง ค าบญญตเองเปนค าทไมมความหมายตามพจนานกรมฉบบราชบณฑตยสถาน พ.ศ. ๒๕๕๔ การตรวจสอบขอความวาเปนขาวปลอมพจารณาจาก ตรวจสอบขอมลจากแหลงขาวในประเดนทเนอหาขาวอางถงจากหลาย ๆ แหลง หนวยงานทรบผดชอบทเกยวของกบประเดนเนอหา ผทมความเกยวของ/ถกพาดพงในประเดนเนอหาขาว แหลงขาวอน ๆ เพอเปรยบเทยบเนอหาตรงกนหรอไม

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

47

ใชเครองมอคนหา (search engine) คนหาประเดนทเกยวของ พจารณาความสมพนธกบขาวทสนใจ

เปรยบเทยบรปภาพ แหลงอางองทปรากฏในเนอหา เปนเรองเกาแลวน ามาเลาใหม หรอมความเกยวของกบประเดนทขาวอาง/กลาวถง

เวบไซตแหลงขาวทมการตรวจสอบขอมลโดยผเชยวชาญยนยนหรอหนวยงานผรบผดชอบ ความสมพนธระหวางเวลากบเหตการณทกลาวถงในเนอหามความสมเหตสมผลเขากน

หรอไม ขอระวงในการแยกขาวปลอม ขอความทเลอกมาจากหวขอขาวทมค าส าคญเหมอนกน แตอาจมรายละเอยดเนอหาไมตรง

กบหวขอขาวนน บางขอความมค าส าคญเหมอนกน แตมค าแสดงความขดแยงกนในเนอหา หรอค าในเชง

ปฏเสธ จ าตองพจารณาความหมายของค าเชงปฏเสธในเนอหาประกอบดวย เชน ขาว…เปนขาวปลอม เรอง....เปนเรองลวง ไมมเรอง...เกดขนจรง เนอหา...ไมเปนความจรง

สวนความหมายของแตละคณลกษณะขอมลทเลอกใชในชดขอมล สามารถอธบายรายละเอยดไดดงน

ชอคณลกษณะทใช ควำมหมำย Id รหสผใชเปนตวเลขททวตเตอรใชในการจ าแนกแตละบญชผใชงาน Name ชอผใชงานทวตเตอร IsVerified คณลกษณะการยนยนตวบคคลกบทางทวตเตอรของผใช ProfileImageUrl ต าแหนงทจดเกบ URL ทเชอมโยงไปยงรปภาพประวตสวนตว

ของผใช FollowersCount จ านวนผทตดตามบญชผใชงานน FriendsCount จ านวนทเจาของบญชนก าลงตดตาม FavouritesCount จ านวนเจาของบญชนเคยกดถกใจ StatusesCount จ านวนสถานะทเคยโพสตของบญชน Description รายละเอยดของผใชทตองการอธบายเกยวกบตวเอง Location สถานททผใชโพสตขอความ TimeZone เขตเวลาทบญชผใชนนถกสรางขน CreatedDate วนทผใชสรางบญชผใชงานขนมา Status คณลกษณะทผใชบงบอกสถานะปจจบนของบญชผใชงาน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

48

Url ต าแหนงการเชอมโยงไปยงสอปลายทางทขอความนนตองการ ระบถง

Mentions รายละเอยดของชอผใชทถกกลาวถงในขอความ ปรากฏหลงสญลกษณ @

NumberofMentions จ านวนสญลกษณ @ ทปรากฏในขอความ ไดคาจาก Twitter API HashTags รายละเอยดพเศษทผใชตองการอธบายหรอระบเฉพาะเจาะจงใน

หวขอเรองของขอความ ปรากฏสญลกษณ #หนาขอความพเศษ NumberofHashTags จ านวนสญลกษณ # ทปรากฏในขอความ ไดคาจาก Twitter API RetweetCount จ านวนครงทขอความถกน าไปเผยแพรซ าอกครงโดยบคคลอนท

ไมใชคนโพสตขอความครงแรก TwittCreatedDate วนทเวลาทขอความนนถกสรางขน MessageText รายละเอยดของขอความ MessageImage ต าแหนงทอยการเชอมโยงไปยงรปภาพทเกยวของ

สวนตอไปจะเปนการอธบายรายละเอยดของชดขอมลทใชกบคณลกษณะทเลอกใช เมอน าชด

ขอมลขาวทจดเกบมาไดตามรายละเอยดในตารางท 3.3 มาผานกระบวนการปรบคาขอมลใหเปนตวเลขทงหมดตามเงอนไขทกลาวมาในบทกอนหนา แลวจงน าขอมลทไดมาขจดความซ าซอนของขอมล โดยลบขอมลสวนทซ ากนออก เหลอเฉพาะขอมลสวนทมคาไมซ ากนเลย จ านวน 327,784 ขอความ และเมอน าชดขอมลนมาพจารณาแตละคณลกษณะทไดเลอกใช จะปรากฏรายละเอยดดงตอไปน

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ Id พบวาลกษณะของขาวทน ามาใชสวนใหญเปนบญชผใชทมรหสผใชงาน (Id) ทมการใชงานมานานแลวซงใชรหสผใชขนาด 9-10 หลก มากกวา 18 หลก โดยในขาวจรงเปนขาวของบญชผใชทมรหสผใชขนาด 9-10 หลก จ านวนรอยละ 71.75 และในสวนของขาวปลอมเปนขาวของบญชผใชทมรหสผใชขนาด 9-10 หลก จ านวนรอยละ 89.35 ดงรายละเอยดในตารางท 3.4

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

49

ตารางท 3.4 ผลการวเคราะหขอมลขาวตามคณลกษณะ Id

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

Id

ไมปรากฏขอมล 0.00 0.00

9-10 หลก 71.75 89.35

18 หลก 28.25 10.65

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ Name พบวาลกษณะของขาวทน ามาใชสวนใหญเปนบญชผใชทมการใชชอผใชงาน (Name) เปนตวอกขระผสมทเปนภาษาไทยหรอภาษาองกฤษหรอตวเลขผสมกนมากกวารปแบบอน ๆ กลาวคอ ในบญชทมการแสดงขาวจรงเปนบญชชอตวอกขระผสมภาษาไทยหรอภาษาองกฤษหรอตวเลข จ านวนรอยละ 74.14 บญชชอตวอกขระภาษาไทย จ านวนรอยละ 23.21 บญชชอตวอกขระภาษาองกฤษ จ านวนรอยละ 2.66 ไมพบชอบญชผใชทเปนตวอกขระภาษาอน ๆ และสญลกษณอน ๆ และในสวนของขาวปลอมมลกษณะการใชชอบญชเชนเดยวกบบญชขาวจรง กลาวคอ ในบญชทมการแสดงขาวปลอมเปนบญชชอตวอกขระผสมภาษาไทยหรอภาษาองกฤษหรอตวเลข จ านวนรอยละ 76.04 บญชชอตวอกขระภาษาไทย จ านวนรอยละ 20.41 บญชชอตวอกขระภาษาองกฤษ จ านวนรอยละ 3.55 และไมพบชอบญชผใชทเปนตวอกขระภาษาอน ๆ และสญลกษณอน ๆ เชนเดยวกบบญชผใชทแสดงขาวจรง ดงรายละเอยดในตารางท 3.5

ตารางท 3.5 ผลการวเคราะหขอมลขาวตามคณลกษณะ Name

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

Name

ไมปรากฏขอมล 0.00 0.00 ตวอกขระภาษาไทยทงหมด 23.21 20.41 ตวอกขระภาษาองกฤษทงหมด 2.66 3.55 ตวอกขระภาษาไทยหรอภาษาองกฤษหรอตวเลข

74.14 76.04

ตวอกขระภาษาอน ๆ 0.00 0.00 สญลกษณอน ๆ 0.00 0.00

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

50

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ IsVerified พบวาลกษณะของขาวทน ามาใชสวนใหญเปนบญชผใชทมคณลกษณะ IsVerified เปน FALSE แสดงวาไมมการยนยนตวตนทงในสวนของการแสดงขาวจรงและขาวปลอม โดยบญชผใชทแสดงขาวจรง จ านวน รอยละ 99.22 ไมมการยนยนตวตน และบญชผใชทแสดงขาวปลอมทงหมด (รอยละ 100) ไมมการยนยนตวตน ดงรายละเอยดในตารางท 3.6

ตารางท 3.6 ผลการวเคราะหขอมลขาวตามคณลกษณะ IsVerified

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

IsVerified

ไมปรากฏขอมล 0.00 0.00

TRUE 0.78 0.00

FALSE 99.22 100.00

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ ProfileImageUrl ซงเปนรายละเอยดลงคของภาพประวตของบญชผใชงานทวตเตอร พบวาโดยสวนใหญเปนบญชผใชมการใชภาพประวตเปนไฟล .jpg ทงในสวนของบญชผใชทแสดงขาวจรงจ านวนรอยละ 94.92 และบญชผใชทแสดงขาวปลอมจ านวนรอยละ 92.01 โดยมบางสวนใชภาพประวตผใชเปนไฟล .png จ านวนรอยละ 2.00 ในบญชผใชทแสดงขาวจรง และจ านวนรอยละ 1.48 ในบญชผใชทแสดงขาวปลอม และทเหลอเปนรปแบบไฟลรปภาพอน ๆ โดยทบญชผใชทงหมดไมมบญชใดทไมปรากฏขอมลรปภาพประวตผใช ดงรายละเอยดในตารางท 3.7

ตารางท 3.7 ผลการวเคราะหขอมลขาวตามคณลกษณะ ProfileImageUrl

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

ProfileImageUrl

ไมปรากฏขอมล 0.00 0.00

.jpg 94.92 92.01

.png 2.00 1.48

อน ๆ 3.08 6.51

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

51

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ FollowersCount คอจ านวนผทตดตามบญช ในสวนของบญชผใชทมการแสดงขาวจรงพบวารอยละ 41.49 มจ านวนผตดตามระหวาง 100-999 บญช รอยละ 35.04 มจ านวนผตดตามระหวาง 10-99 บญช รอยละ 10.14 มจ านวนผตดตามระหวาง 1,000-9,999 บญช รอยละ 9.48 มจ านวนผตดตามระหวาง 1-9 บญช รอยละ 1.82 ไมมผตดตาม รอยละ 1.40 มจ านวนผตดตามระหวาง 10,000-99,999 บญช รอยละ 0.42 มจ านวนผตดตามระหวาง 100,000-999,999 บญช และรอยละ 0.21 มจ านวนผตดตามระหวาง 1,000-9,999 บญช สวนในบญชของผใชทมการแสดงขาวปลอมพบวารอยละ 48.82 มจ านวนผตดตามระหวาง 100-999 บญช รอยละ 17.75 มจ านวนผตดตามระหวาง 10-99 บญช รอยละ 15.98 มจ านวนผตดตามระหวาง 1,000-9,999 บญช รอยละ 7.10 มจ านวนผตดตามระหวาง 10,000-99,999 บญช รอยละ 3.55 มจ านวนผตดตามระหวาง 1,000,000-9,999,999 บญช จ านวนผตดตามระหวาง 100,000-999,999 บญชเทากบจ านวนผตดตามระหวาง 1-9 บญชคอ รอยละ 3.25 และรอยละ 0.30 ไมมผตดตาม ดงรายละเอยดในตารางท 3.8

ตารางท 3.8 ผลการวเคราะหขอมลขาวตามคณลกษณะ FollowersCount

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

FollowersCount

ไมปรากฏขอมล 1.82 0.30

1-9 9.48 3.25

10-99 35.04 17.75

100-999 41.49 48.82

1,000-9,999 10.14 15.98

10,000-99,999 1.40 7.10

100,000-999,999 0.42 3.25

1,000,000-9,999,999 0.21 3.55

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ FriendsCount คอจ านวนท

ผใชบญชก าลงตดตามซงเทากบจ านวน Follower ทปรากฏในหนาบญชผใช แตการเรยกคาผาน Twitter API จะใชค าวา Friend แทน Follower ซงในสวนของบญชผใชทมการแสดงขาวจรงพบวา

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

52

รอยละ 63.33 มจ านวนผก าลงตดตามระหวาง 100-999 บญช รอยละ 25.14 มจ านวนผก าลงตดตามระหวาง 10-99 บญช รอยละ 9.98 มจ านวนผก าลงตดตามระหวาง 1,000-9,999 บญช รอยละ 1.30 มจ านวนผก าลงตดตามระหวาง 1-9 บญช รอยละ 0.23 ไมมผก าลงตดตาม และรอยละ 0.03 มจ านวนผก าลงตดตามระหวาง 10,000-99,999 บญช ไมพบบญชผใชทมการแสดงขาวมจ านวนผก าลงตดตามมากกวา 100,000 บญชขนไป สวนในบญชของผใชทมการแสดงขาวปลอมพบวารอยละ 65.38 มจ านวนผก าลงตดตามระหวาง 100-999 บญช รอยละ 18.64 มจ านวนผก าลงตดตามระหวาง 10-99 บญช รอยละ 13.61 มจ านวนผก าลงตดตามระหวาง 1,000-9,999 บญช รอยละ 1.48 มจ านวนผก าลงตดตามระหวาง 1-9 บญช รอยละ 0.89 ไมมผก าลงตดตาม และไมพบบญชผใชทมการแสดงขาวปลอมมจ านวนผก าลงตดตามตงแต 10,000 บญชขนไป ดงรายละเอยดในตารางท 3.9

ตารางท 3.9 ผลการวเคราะหขอมลขาวตามคณลกษณะ FriendsCount

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

FriendsCount

ไมปรากฏขอมล 0.23 0.89

1-9 1.30 1.48

10-99 25.14 18.64

100-999 63.33 65.38

1,000-9,999 9.98 13.61

10,000-99,999 0.03 0.00

100,000-999,999 0.00 0.00

1,000,000-9,999,999 0.00 0.00

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ FavouritesCount คอจ านวนสงทสนใจของเจาของบญชหรอจ านวนทเจาของบญชเคยไปกดถกใจ ในสวนของบญชผใชทมการแสดงขาวจรงพบวารอยละ 37.55 มจ านวนสงทสนใจ 1,000-9,999 ครง รอยละ 28.75 มจ านวนสงทสนใจระหวาง 100-999 ครง รอยละ 17.91 มจ านวนสงทสนใจระหวาง 10,000-99,999 ครง รอยละ 10.45 มจ านวนสงทสนใจระหวาง 10-99 ครง รอยละ 3.00 มจ านวนสงทสนใจระหวาง 1-9

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

53

ครง รอยละ 1.24 มจ านวนสงทสนใจระหวาง 100,000-999,999 ครง รอยละ 1.10 ไมมมสงทสนใจ และไมมบญชใดทมจ านวนสงทสนใจมากกวา 1,000,000 ครงขนไป สวนในบญชของผใชทมการแสดงขาวปลอมพบวารอยละ 34.62 มจ านวนสงทสนใจระหวาง 1,000-9,999 ครง รอยละ 24.56 มจ านวนสงทสนใจระหวาง 100-999 ครง รอยละ 15.38 มจ านวนสงทสนใจระหวาง 10,000-99,999 ครง รอยละ 10.95 มจ านวนสงทสนใจระหวาง 10-99 ครง รอยละ 7.69 มจ านวนสงทสนใจระหวาง 1-9 ครง รอยละ 1.78 มจ านวนสงทสนใจระหวาง 100,000-999,999 ครง และไมมบญชใดทมจ านวนสงทสนใจมากกวา 1,000,000 ครงขนไป ดงรายละเอยดในตารางท 3.10

ตารางท 3.10 ผลการวเคราะหขอมลขาวตามคณลกษณะ FavouritesCount

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

FavouritesCount

ไมปรากฏขอมล 1.10 5.03

1-9 3.00 7.69

10-99 10.45 10.95

100-999 28.75 24.56

1,000-9,999 37.55 34.62

10,000-99,999 17.91 15.38

100,000-999,999 1.24 1.78

1,000,000-9,999,999 0.00 0.00

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ StatusesCount คอจ านวนสถานะของเจาของบญชไดทวตออกไปแลวนบแตเปดบญชผใชงาน ในสวนของบญชผใชทมการแสดงขาวจรงพบวารอยละ 44.40 มจ านวนสถานะ 10,000-99,999 สถานะ รอยละ 25.97 มจ านวนสถานะระหวาง 1,000-9,999 สถานะ รอยละ 18.76 มจ านวนสถานะระหวาง 100,000-999,999 สถานะ รอยละ 8.37 มจ านวนสถานะระหวาง 100-999 สถานะ รอยละ 2.05 มจ านวนสถานะระหวาง 10-99 สถานะ รอยละ 0.39 มจ านวนสถานะระหวาง 1-9 สถานะ รอยละ 0.04 มจ านวนสถานะระหวาง 1,000,000-9,999,999 สถานะ และไมมบญชใดเลยทไมมมสถานะ สวนในบญชของผใชทมการแสดงขาวปลอมพบวารอยละ 37.87 มจ านวนสถานะระหวาง 10,000-99,999 สถานะ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

54

รอยละ 34.02 มจ านวนสถานะระหวาง 100,000-999,999 สถานะ รอยละ 20.71 มจ านวนสถานะระหวาง 1,000-9,999 สถานะ รอยละ 4.14 มจ านวนสถานะระหวาง 100-999 สถานะ รอยละ 1.48 มจ านวนสถานะระหวาง 10-99 สถานะเทากบรอยละ 1.48 มจ านวนสถานะระหวาง 1,000,000-9,999,999 สถานะ รอยละ 0.30 มจ านวนสถานะระหวาง 1-9 สถานะ และไมมบญชใดเลยทไมมมสถานะ ดงรายละเอยดในตารางท 3.11

ตารางท 3.11 ผลการวเคราะหขอมลขาวตามคณลกษณะ StatusesCount

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

StatusesCount

ไมปรากฏขอมล 0.00 0.00

1-9 0.39 0.30

10-99 2.05 1.48

100-999 8.37 4.14

1,000-9,999 25.97 20.71

10,000-99,999 44.40 37.87

100,000-999,999 18.76 34.02

1,000,000-9,999,999 0.04 1.48

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ Description พบวาลกษณะ

ของบญชผใชทมการใชรายละเอยดของผใชงาน (Description) ในบญชทมการแสดงขาวจรงจ านวนรอยละ 99.73 เปนตวอกขระผสมภาษาไทยหรอภาษาองกฤษหรอตวเลขผสมกนมากกวารปแบบอน ทมเพยงรอยละ 0.27 ทเปนบญชรายละเอยดทเปนตวอกขระภาษาองกฤษทงหมด และไมพบรายละเอยดของบญชผใชทเปนตวอกขระภาษาไทยทงหมด ภาษาอน ๆ และสญลกษณอน ๆ สวนของขาวปลอมมลกษณะการใชรายละเอยดของบญช โดยมลกษณะคลายกบบญชขาวจรงโดยใช ตวอกขระผสมภาษาไทยหรอภาษาองกฤษหรอตวเลขทงหมดรอยละ 100 โดยไมพบบญชผใชทมรายละเอยดในแบบอน ๆ ดงรายละเอยดในตารางท 3.12

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

55

ตารางท 3.12 ผลการวเคราะหขอมลขาวตามคณลกษณะ Description

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

Description

ไมปรากฏขอมล 0.00 0.00

ตวอกขระภาษาไทยทงหมด 0.00 0.00

ตวอกขระภาษาองกฤษทงหมด 0.27 0.00

ตวอกขระภาษาไทยหรอภาษาองกฤษหรอตวเลข 99.73 100.00

ตวอกขระภาษาอน ๆ 0.00 0.00

สญลกษณอน ๆ 0.00 0.00

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ Location พบวาลกษณะของต าแหนง (Location) ของบญชผใชทมการแสดงขาวจรงจ านวนรอยละ 43.80 เปนสถานทอน ๆ ทไมตรงกบขอมลในตารางท 4.11 รอยละ 33.06 แสดงต าแหนงบญชผใชอยในประเทศไทย รอยละ 17.83 แสดงต าแหนงบญชผใชในเอเชยตะวนออกเฉยงใตยกเวนประเทศไทย รอยละ 2.32 แสดงต าแหนงบญชผใชในเอเชยยกเวนเอเชยตะวนออกเฉยงใต รอยละ 2.08 แสดงต าแหนงบญชผใชทอยในสหรฐอเมรกา/แคนาดา/อลาสกา/ฮาวาย รอยละ 0.63 แสดงต าแหนงบญชผใชในยโรป/รสเซย รอยละ 0.16 แสดงต าแหนงบญชผใชใน ออสเตรเลย/นวซแลนด รอยละ 0.12 ไมปรากฏต าแหนงของบญชผใช และรอยละ 0.02 แสดงต าแหนงบญชผใชในแอฟรกา สวนของบญชผใชทมการแสดงขาวปลอมจ านวนรอยละ 37.87 เปนสถานทอน ๆ ทไมตรงกบขอมลในตารางท 4.11 รอยละ 29.29 แสดงต าแหนงบญชผใชทอยในประเทศไทย รอยละ 27.81 แสดงต าแหนงในเอเชยตะวนออกเฉยงใตยกเวนประเทศไทยรอยละ 2.66 แสดงต าแหนงบญชผใชในเอเชยยกเวนเอเชยตะวนออกเฉยงใต รอยละ 1.78 แสดงต าแหนงบญชผใชในสหรฐอเมรกา/แคนาดา/อลาสกา/ฮาวาย รอยละ 0.59 แสดงต าแหนงบญชผใชในยโรป/รสเซย ไมพบบญชผใชทอยในออสเตรเลย/นวซแลนด หรอแอฟรกา และบญชผใชไมปรากฏขอมลต าแหนงของบญชผใช ดงรายละเอยดในตารางท 3.13

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

56

ตารางท 3.13 ผลการวเคราะหขอมลขาวตามคณลกษณะ Location

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

Location

ไมปรากฏขอมล 0.12 0.00

ประเทศไทย 33.06 29.29

เอเชยตะวนออกเฉยงใตยกเวนประเทศไทย 17.83 27.81

เอเชยยกเวนเอเชยตะวนออกเฉยงใต 2.32 2.66

ออสเตรเลย/นวซแลนด 0.16 0.00

ยโรป/รสเซย 0.63 0.59

สหรฐอเมรกา/แคนาดา/อลาสกา/ฮาวาย 2.08 1.78

แอฟรกา 0.02 0.00

อน ๆ 43.80 37.87

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ TimeZone ทแสดงต าแหนงตามการแบงเสนเขตเวลาโลก พบวาทงหมดของบญชผใชทมการแสดงขาวจรงและบญชผใชทมการแสดงขาวปลอมไมปรากฏขอมลแสดงต าแหนงตามการแบงเสนเขตเวลาโลก แมวาจะมเงอนไขการพจารณาเวลาเชนเดยวกบต าแหนงสถานทโดยแบงเปนสวนยอย ๆ ตามภมภาคเชน ประเทศไทย เอเชยตะวนออกเฉยงใตยกเวนประเทศไทย เอเชยยกเวนเอเชยตะวนออกเฉยงใต ออสเตรเลย/นวซแลนด ยโรป/รสเซย สหรฐอเมรกา/แคนาดา/อลาสกา/ฮาวาย แอฟรกา และอน ๆ รายละเอยดดงตารางท 3.14

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

57

ตารางท 3.14 ผลการวเคราะหขอมลขาวตามคณลกษณะ TimeZone

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

TimeZone

ไมปรากฏขอมล 100.00 100.00

ประเทศไทย 0.00 0.00

เอเชยตะวนออกเฉยงใตยกเวนประเทศไทย 0.00 0.00

เอเชยยกเวนเอเชยตะวนออกเฉยงใต 0.00 0.00

ออสเตรเลย/นวซแลนด 0.00 0.00

ยโรป/รสเซย 0.00 0.00

สหรฐอเมรกา/แคนาดา/อลาสกา/ฮาวาย 0.00 0.00

แอฟรกา 0.00 0.00

อน ๆ 0.00 0.00

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ CreatedDate ทแสดงวนทบญชผใชทวตเตอรถกสรางขน ส าหรบในงานวจยนไดน าขอมลวนทบญชผใชทวตเตอรถกสรางขนมาประมวลผลขอมลโดยการค านวณเปนอายการใชงานของบญชทสรางขน และไดแบงชวงการแสดงผลชวงละ 0.5 ป พบวาบญชผใชทมการแสดงขาวจรงรอยละ 18.68 มอายการใชงานนอยกวา 0.5 ป รอยละ 12.62 มอายการใชงานระหวาง 0.5 ป ถง 1 ป รอยละ 11.19 มอายการใชงานระหวาง 3 ป ถง 3.5 ป รอยละ 10.24 มอายการใชงานระหวาง 1.5 ป ถง 2 ป รอยละ 10.06 มอายการใชงานระหวาง 3.5 ป ถง 4 ป รอยละ 9.78 มอายการใชงานระหวาง 1 ป ถง 1.5 ป รอยละ 9.31 มอายการใชงานระหวาง 2 ป ถง 2.5 ป รอยละ 8.71 มอายการใชงานระหวาง 4 ป ถง 4.5 ป รอยละ 0.35 มอายการใชงานระหวาง 4.5 ป ถง 5 ป รอยละ 0.13 มอายการใชงานระหวาง 5 ป ถง 5.5 ป และ ไมพบบญชผใชทมอายการใชงานมากกวา 5.5 ปขนไป สวนบญชผใชทมการแสดงขาวปลอมรอยละ 29.68 มอายการใชงานระหวาง 4 ป ถง 4.5 ป รอยละ 16.77 มอายการใชงานระหวาง 3.5 ป ถง 4 ป รอยละ 14.84 มอายการใชงานระหวาง 3 ป ถง 3.5 ป รอยละ 12.26 มอายการใชงานระหวาง 2.5 ป ถง 3 ป รอยละ 9.03 มอายการใชงานนอยกวา 0.5 ป รอยละ 5.81 มอายการใชงานระหวาง 2 ป ถง 2.5 ป รอยละ 5.16 มอายการใชงานระหวาง 0.5 ป ถง 1 ป รอยละ 3.87 มอายการใชงานระหวาง 1.5 ป ถง 2 ป รอยละ 2.58 มอายการใชงานระหวาง 1 ป ถง 1.5 ป และไมพบบญชผใชทมอายการใชงานมากกวา 4.5 ปขนไป ดงรายละเอยดในตารางท 3.15

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

58

ตารางท 3.15 ผลการวเคราะหขอมลขาวตามคณลกษณะ CreatedDate

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

CreatedDate

ไมปรากฏขอมล 0.00 0.00

นอยกวา 0.5 ป 18.68 9.03

ระหวาง 0.5 ป ถง 1 ป 12.62 5.16

ระหวาง 1 ป ถง 1.5 ป 9.78 2.58

ระหวาง 1.5 ป ถง 2 ป 10.24 3.87

ระหวาง 2 ป ถง 2.5 ป 9.31 5.81

ระหวาง 2.5 ป ถง 3 ป 8.94 12.26

ระหวาง 3 ป ถง 3.5 ป 11.19 14.84

ระหวาง 3.5 ป ถง 4 ป 10.06 16.77

ระหวาง 4 ป ถง 4.5 ป 8.71 29.68

ระหวาง 4.5 ป ถง 5 ป 0.35 0.00

ระหวาง 5 ป ถง 5.5 ป 0.13 0.00

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ Status ซงเปนรายละเอยด

ของสถานะของเจาของบญช ในสวนของบญชผใชทมการแสดงขาวจรงและบญชของผใชทมการแสดงขาวปลอมพบวาไมมบญชใดเลยทไมมมสถานะ ทกบญชมสถานะทงหมด ดงรายละเอยดในตารางท 3.16

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

59

ตารางท 3.16 ผลการวเคราะหขอมลขาวตามคณลกษณะ Status

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

Status ไมปรากฏขอมล 0.00 0.00

มคาสถานะ 100.00 100.00 พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ Url ซงเปนรายละเอยดของ

ลงค (Link) หรอจดเชอมโยงขอมลของขอความททวต โดยในสวนของบญชผใชทมการแสดงขาวจรง รอยละ 50.41 มจ านวน 3 ลงคทปรากฏในขอความ รอยละ 49.46 ไมปรากฏจ านวนลงคในขอความ รอยละ 0.12 มจ านวน 1 ลงคทปรากฏในขอความ และรอยละ 0.01 มจ านวนมากกวา 3 ลงคทปรากฏในขอความ สวนของบญชของผใชทมการแสดงขาวปลอมพบวา รอยละ 89.94 มจ านวน 3 ลงคทปรากฏในขอความ รอยละ 10.06 ไมปรากฏจ านวนลงคในขอความ และไมมบญชใดเลยทมจ านวน 1 ลงคหรอ 2 ลงค หรอมากกวา 3 ลงคทปรากฏในขอความ ดงรายละเอยดในตารางท 3.17

ตารางท 3.17 ผลการวเคราะหขอมลขาวตามคณลกษณะ Url

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

Url

ไมปรากฏขอมล 49.46 10.06

1 ลงค 0.12 0.00

2 ลงค 0.00 0.00

3 ลงค 50.41 89.94

มากกวา 3 ลงค 0.01 0.00

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ Mentions ทเปนการระบถง

บญชผใชอนทพบในขอความททวต จะมคาเทากบ Number of Mentions ทเปนคาจาก Twitter API โดยแสดงจ านวนการระบถงบญชผใชอนทพบในขอความททวต ในสวนของบญชผใชทมการแสดงขาวจรง รอยละ 89.68 มจ านวน 1 @ ปรากฏในขอความ รอยละ 6.72 ไมปรากฏจ านวน @ ใน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

60

ขอความ รอยละ 3.11 มจ านวน 2 @ ปรากฏในขอความ รอยละ 0.40 มจ านวน 3 @ ปรากฏในขอความ และรอยละ 0.09 มจ านวนมากกวา 3 @ ปรากฏในขอความ สวนของบญชของผใชทมการแสดงขาวปลอมพบวา รอยละ 68.93 มจ านวน 1 @ ปรากฏในขอความ รอยละ 28.99 ไมปรากฏจ านวน @ ในขอความ รอยละ 1.78 มจ านวน 2 @ ปรากฏในขอความ รอยละ 0.30 มจ านวน 3 @ ปรากฏในขอความ และไมมบญชใดเลยทมจ านวนมากกวา 3 @ ปรากฏในขอความ ดงรายละเอยดในตารางท 3.18

ตารางท 3.18 ผลการวเคราะหขอมลขาวตามคณลกษณะ Mentions และ Number of Mentions

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

Mentions และ Number of Mentions

ไมปรากฏขอมล 6.72 28.99

1 @ 89.68 68.93

2 @ 3.11 1.78

3 @ 0.40 0.30

มากกวา 3 @ 0.09 0.00

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ HashTags ทเปนการระบถง

ขอความเฉพาะทตองการเนนโดยใชสญลกษณ # ประกอบในขอความ โดยมคาเทากบ Number of HashTags ทเปนคาจาก Twitter API จากขอมลพบวาสวนของบญชผใชทมการแสดงขาวจรง รอยละ 49.635 ไมปรากฏจ านวน # ในขอความ รอยละ 26.71 มจ านวน 1 # ปรากฏในขอความ รอยละ 13.70 มจ านวน 2 # ปรากฏในขอความ รอยละ 5.50 มจ านวน 3 # ปรากฏในขอความ และรอยละ 4.44 มจ านวนมากกวา 3 # ปรากฏในขอความ สวนของบญชของผใชทมการแสดงขาวปลอมพบวา รอยละ 53.25 ไมปรากฏขอมลจ านวน # ในขอความ รอยละ 22.78 มจ านวน 1 # ปรากฏในขอความ รอยละ 19.23 มจ านวน 3 # ปรากฏในขอความ รอยละ 1.18 มจ านวน 2 # ปรากฏในขอความ และรอยละ 3.55 มจ านวนมากกวา 3 # ปรากฏในขอความ ดงรายละเอยดในตารางท 3.19

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

61

ตารางท 3.19 ผลการวเคราะหขอมลขาวตามคณลกษณะ HashTags และ Number of HashTags

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

HashTags และ Number of HashTags

ไมปรากฏขอมล 49.65 53.25

1 # 26.71 22.78

2 # 13.70 1.18

3 # 5.50 19.23

มากกวา 3 # 4.44 3.55

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ RetweetCount เปนจ านวนครงทมการสงตอขอความทวตซ า ในสวนของบญชผใชทมการแสดงขาวจรง พบวารอยละ 28.91 มจ านวนครงทมการสงตอขอความทวตซ า 1,000-9,999 ครง รอยละ 23.02 มจ านวนครงทมการสงตอขอความทวตซ าระหวาง 100-999 ครง รอยละ 20.87 มจ านวนครงทมการสงตอขอความทวตซ าระหวาง 10,000-99,999 ครง รอยละ 14.60 มจ านวนครงทมการสงตอขอความทวตซ าระหวาง 10-99 ครง รอยละ 6.84 มจ านวนครงทมการสงตอขอความทวตซ าระหวาง 1-9 ครง รอยละ 5.77 ไมมการสงตอขอความทวตซ า และไมมบญชใดทมจ านวนครง ทมการสงตอขอความทวตซ ามากกวา 100,000 ครงขนไป สวนในบญชของผใชทมการแสดงขาวปลอมพบวารอยละ 52.66 มจ านวนครงทมการสงตอขอความทวตซ าระหวาง 10-99 ครง รอยละ 24.85 มจ านวนครงทมการสงตอขอความทวตซ าระหวาง 1-9 ครง รอยละ 21.89 ไมมการสงตอขอความทวตซ า และไมมบญชใดทมจ านวนครงทมการสงตอขอความทวตซ ามากกวา 1,000 ครงขนไป ดงรายละเอยดในตารางท 3.20

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

62

ตารางท 3.20 ผลการวเคราะหขอมลขาวตามคณลกษณะ RetweetCount

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

RetweetCount

ไมปรากฏขอมล 5.77 21.89

1-9 6.84 24.85

10-99 14.60 52.66

100-999 23.02 0.59

1,000-9,999 28.91 0.00

10,000-99,999 20.87 0.00

100,000-999,999 0.00 0.00

1,000,000-9,999,999 0.00 0.00

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ TweetCreatedDate เปน

วนเวลาทขอความทวตถกสรางขน ในงานวจยนสนใจชวงเวลาทแตละขอความถกสรางขน จงแบงชวงเวลาในวนเปน 4 ชวงเวลาไดแก 06.01-12.00 น. 12.01-18.00 น. 18.01-24.00 น. และ 00.01-06.00 น. ซงพบวาขอมลสวนของบญชผใชทมการแสดงขาวจรงรอยละ 31.59 ขอความถกสรางขนในชวงเวลา 00.01-06.00 น. รอยละ 30.29 ขอความถกสรางขนในชวงเวลา 12.01-18.00น. รอยละ 28.18 ขอความถกสรางขนในชวงเวลา 06.01-12.00 น. และรอยละ 9.94 ขอความถกสรางขนในชวงเวลา 18.01-24.00 น. สวนในบญชของผใชทมการแสดงขาวปลอมพบวารอยละ 48.22 ขอความถกสรางขนในชวงเวลา 06.01-12.00 น. รอยละ 29.88 ขอความถกสรางขนในชวงเวลา 12.01-18.00 น. รอยละ 20.12 ขอความถกสรางขนในชวงเวลา 00.01-06.00 น. และรอยละ 1.78 ขอความถกสรางขนในชวงเวลา 18.01-24.00 น. ดงรายละเอยดในตารางท 3.21

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

63

ตารางท 3.21 ผลการวเคราะหขอมลขาวตามคณลกษณะ TweetCreatedDate

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

TweetCreatedDate

ไมปรากฏขอมล 0.00 0.00

06.01-12.00 น. 28.18 48.22

12.01-18.00 น. 30.29 29.88

18.01-24.00 น. 9.94 1.78

00.01-06.00 น. 31.59 20.12 พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ MessageText พจารณา

ขอความททวตเปนขอความทสรางจากบญชผใชเองหรอสงตอขอความทวตของบญชอนซ า ในสวนของบญชผใชทมการแสดงขาวจรงพบวารอยละ 5.77 เปนขอความทเจาของบญชผใชเขยนขนมาเอง และรอยละ 94.23 เปนขอความทสงตอขอความทวตของบญชอน สวนในบญชของผใชทมการแสดงขาวปลอมรอยละ 21.89 เปนขอความทเจาของบญชผใชเขยนขนมาเอง และรอยละ 78.11 เปนขอความทสงตอขอความของบญชอน ดงรายละเอยดในตารางท 3.22

ตารางท 3.22 ผลการวเคราะหขอมลขาวตามคณลกษณะ MessageText

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

MessageText ขอความทเขยนเอง 5.77 21.89

ขอความทมการสงตอซ าอกครง (Retweet) 94.23 78.11

พจารณาชดขอมลทน ามาใชในงานวจย เมอวเคราะหคณลกษณะ MessageImage ซงเปน

รายละเอยดของลงคของต าแหนงทจดเกบรปภาพประกอบขอความขาว พบวาในสวนของบญชผใชทมการแสดงขาวจรง รอยละ 72.33 ไมปรากฏจ านวนลงคของรปภาพในขอความ รอยละ 27.03 มจ านวน 1 ลงคของรปภาพทปรากฏในขอความ รอยละ 0.62 มจ านวน 3 ลงคของรปภาพทปรากฏในขอความ รอยละ 0.03 มจ านวนมากกวา 3 ลงคของรปภาพทปรากฏในขอความ และไมพบบญชทม

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

64

จ านวน 2 ลงคของรปภาพทปรากฏในขอความ สวนของบญชของผใชทมการแสดงขาวปลอมพบวารอยละ 73.96 ไมปรากฏจ านวนลงคของรปภาพในขอความ รอยละ 25.44 มจ านวน 1 ลงคของรปภาพทปรากฏในขอความ รอยละ 0.59 มจ านวน 3 ลงคของรปภาพทปรากฏในขอความ มจ านวนมากกวา 3 ลงคของรปภาพทปรากฏในขอความ และไมพบบญชทมจ านวน 2 ลงค และมากกวา 3 ลงคของรปภาพทปรากฏในขอความ ดงรายละเอยดในตารางท 3.23

ตารางท 3.23 ผลการวเคราะหขอมลขาวตามคณลกษณะ MessageImage

คณลกษณะ รายละเอยด รอยละของขอมล

ขาวจรง ขาวปลอม

MessageImage

ไมปรากฏขอมล 72.33 73.96

1 ลงค 27.03 25.44

2 ลงค 0.00 0.00

3 ลงค 0.62 0.59

มากกวา 3 ลงค 0.03 0.00

บทนไดกลาวถงรายละเอยดของชดขอมลทจดเกบจากเครอขายสงคมออนไลนทวตเตอร สวนในเอกสารบทตอไปเปนการน าเสนอรายละเอยดของการทดลอง และการพจารณาคณลกษณะส าคญของชดขอมลทเหมาะสมในการใชจ าแนกขาวปลอม

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

บทท 4 ผลงานวจย

บทนน าเสนอรายละเอยดของผลทไดจากการทดลองไดจากการประมวลผลดวยวธการเรยนร

ดวยเครองทง 3 วธการ ไดแก Naïve Bayes, Neural Network และ Support Vector Machine และการทดลองเพอปรบปรงความถกตองในการจ าแนกขาวปลอม โดยการเลอกคณลกษณะทเหมาะสมส าหรบการทดลองในชดขอมลทจดเกบ โดยพจารณาตดบางคณลกษณะออกกอนการประมวลผลดวยวธการเรยนรดวยเครองอกครงเพอตรวจสอบคาความถกตองในการจ าแนกขาวปลอม โดยมรายละเอยดดงตอไปน

4.1 การเรยนรดวยเครอง

เมอขอมลไดผานกระบวนการปรบคาขอมลใหเปนตวเลขทงหมด และน าไปขจดความซ าซอนของขอมลออกไปเหลอขอมลทมคาไมซ ากนเลย จ านวน 327,784 ขอความ จากนนน าขอมลนไปผานกระบวนการเรยนรดวยเครอง เพอจ าแนกขอมลทขาวปลอม โดยเลอกใชวธการเรยนรของเครอง 3 วธการ ไดแก Naïve Bayes, Neural Network และ Support Vector Machine ดวยการใชโปรแกรม Weka ไดผลการจ าแนกขอมลในการทดลอง ก าหนดใหใช 10-fold cross validation ส าหรบการทดสอบประสทธภาพของโมเดล โดยการแบงขอมลเปน 10 สวน เพอน าไป เทรน 9 สวน และใชทดสอบ 1 สวน โดยผลลพธทไดจากการทดลองแสดงดงตารางท 4.1

สวนของโปรแกรม Weka ทเลอกใช มการก าหนดคาตวแปรตาง ๆ ของแตละวธการเรยนรของเครอง ดงรายละเอยดตอไปน

Naïve Bayes:

function NaiveBayes,

batchSize = 100,

numDecimalPlaces = 2,

useKernelEstimator = False,

useSupervisedDiscretization = False

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

66

Neural Network:

function MultilayerPerceptron, batchSize = 100,

hiddenLayers = a, l

earningRate = 0.3,

momentum = 0.2,

nominalToBinaryFilter = True,

nomalizeAttribute = True,

nomalizeNumericalClass = True,

numDecimalPlaces = 2,

seed = 0,

trainingTime = 500,

validationSetSize = 0,

validationThreshold = 20

Support Vector Machine:

function SGD, batchSize = 100,

epochs = 500,

epsilon = 0.001,

lambda 1.0E-4,

learningRate = 0.01,

lossFunction = Hinge loss,

numDecimalPlaces = 2,

seed = 1

จากผลการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองทง 3 วธ ไดตารางประเมนการท างาน

ของแบบจ าลอง (Confusion matrix) ของแตละวธการ โดยคาตวเลขเปนจ านวนขอความขาว โดยคาทอยในแนวตงเปนค าตอบจรงของขอมลขาวจรงและขาวปลอมตามล าดบ สวนคาทอยในแนวนอนเปนคาทแบบจ าลองท านายผลเปนขาวจรงหรอขาวปลอมตามล าดบ ดงรายละเอยดในตารางท 4.1

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

67

ตารางท 4.1 ผลการท านายโดยแบบจ าลองทไดจากแตละวธการเรยนรดวยเครอง

คาทท านาย/คาค าตอบ ขาวจรง ขาวปลอม

ขาวจรง True Positive (TP) False Positive (FP)

ขาวปลอม False Negative (FN) True Negative (TN)

วธการเรยนรดวยเครอง จ านวนขาว

Naïve Bayes 283,745 2,595

10,239 31,205

Neural Network 293,728 115

256 33,685

Support Vector Machine

293,738 99

246 33,701

จากขอมลในตารางท 4.1 ในสวนแรกเปนการนยามโครงสรางของตารางประเมนการท างานของแบบจ าลอง ทใชแสดงผลการท านายจากแบบจ าลองของแตละวธการ ซงมความหมายดงตอไปน

True Positive (TP) หมายถง จ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวจรง False Positive (FP) หมายถง จ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวจรง False Negative (FN) หมายถง จ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวปลอม True Negative (TN) หมายถง จ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวปลอม ความสมพนธของจ านวนขาวทปรากฏในตารางท 4.1 มดงน จ านวนขาวจรงทงหมดทใชในชดขอมล มคาเทากบ ผลรวมของจ านวนขาวจรงท

แบบจ าลองท านายไดวาเปนขาวจรง กบ จ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวปลอม จ านวนขาวปลอมทงหมดทใชในชดขอมล มคาเทากบ ผลรวมของจ านวนขาวปลอมท

แบบจ าลองท านายไดวาเปนขาวจรง กบ จ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวปลอม จ านวนขาวทแบบจ าลองทายวาเปนขาวจรง มคาเทากบ จ านวนขาวจรงทแบบจ าลอง

ท านายไดวาเปนขาวจรง กบ จ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวจรง จ านวนขาวทแบบจ าลองทายวาเปนขาวปลอม มคาเทากบ จ านวนขาวจรงทแบบจ าลอง

ท านายไดวาเปนขาวปลอม กบ จ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวปลอม

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

68

จากขอมลในตารางท 4.1 เมอพจารณาในสวนของวธการเรยนรดวยเครองแบบ Naïve Bayes จะได

True Positive (TP) = 283,745 False Positive (FP) = 2,595 False Negative (FN) = 10,239 True Negative (TN) = 31,205 เมอน าไปค านวณคา Precision ซงในทนใชเพอวดความแมนย าในการท านายของแบบจ าลอง

โดยแสดงสดสวนระหวาง จ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวจรง กบ ผลรวมระหวางจ านวนขาวจรงทแบบจ าลองท านายวาจรงและจ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวจรง ตามการค านวณในสมการท (4) จะได

Precision = True Positive

(True Positive + False Positive) =

283,745

283,745+2,595 = 0.9909

ค านวณคา Recall หรอ True Positive Rate (TPR) เปนการวดคาความถกตองทแบบจ าลองท านายขอมลขาวจรงไดถกตองเมอเทยบกบ ผลรวมระหวางจ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวจรงและจ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวปลอม ตามการค านวณในสมการท (5) จะได

Recall = True Positive

(True Positive + False Negative) =

283,745

283,745+10,239 = 0.9652

ค านวณคา F-measure เพอการวดคาประสทธภาพโดยรวมของแบบจ าลองโดยค านวณจากเฉลยระหวาง Precision และ Recall สามารถค านวณไดจากสมการท (6) จะได

F-measure=2* (Precision*Recall)

(Precision+Recall) = 2*

(0.9909*0.9652)

(0.9909+0.9652) = 0.9779

ค านวณคา True Negative Rate (TNR) คออตราสวนจ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวปลอม กบ ผลรวมระหวางจ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวปลอมและจ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวจรง โดยสามารถค านวณไดจากสมการท (7)

True Negative Rate (TNR) = True Negative

(True Negative + False Positive) =

31,205

31,205+2,595 = 0.9232

ค านวณคา False Positive Rate (FPR) คออตราสวนจ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวจรง กบ ผลรวมระหวางจ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวปลอมและจ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวจรง โดยสามารถค านวณไดจากสมการท (8)

False Positive Rate (FPR) = False Positive

(True Negative + False Positive) =

2,595

31,205+2,595 = 0.0768

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

69

ค านวณคา False Negative Rate (FNR) คออตราสวนจ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวปลอม กบ ผลรวมระหวาง จ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวจรงและ จ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวปลอม โดยสามารถค านวณไดจากสมการท (9)

False Negative Rate (FNR) = False Negative

(True Positive + False Negative) =

10,239

283,745+10,239 = 0.0348

ค านวณคา Accuracy ทใชเพอการวดคาความถกตองในการท านายของแบบจ าลองทสามารถท านายไดผลถกตองคออตราสวนของผลรวมระหวางจ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวจรงและจ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวปลอม กบ จ านวนขอมลทงหมดในชดขอมล โดยสามารถค านวณไดจากสมการท (3) และคดเปนคารอยละไดโดยการคณดวย 100

Accuracy = True Positive + True Negative

(True Positive + True Negative + False Positive + False Negative)

= 283,745+31,205

283,745+31,205+2,595+10,239 = 0.9608

จากขอมลในตารางท 4.1 เมอพจารณาในสวนของวธการเรยนรดวยเครองแบบ Neural

Network จะได True Positive (TP) = 293,728 False Positive (FP) = 115 False Negative (FN) = 256 True Negative (TN) = 33,685 เมอน าไปค านวณคา Precision ตามการค านวณในสมการท (4) จะได

Precision = True Positive

(True Positive + False Positive) =

293,728

293,728+115 = 0.9996

ค านวณคา Recall หรอ True Positive Rate (TPR) ตามการค านวณในสมการท (5) จะได

Recall = True Positive

(True Positive + False Negative) =

293,728

293,728+256 = 0.9991

ค านวณคา F-measure ไดจากสมการท (6) จะได

F-measure=2* (Precision*Recall)

(Precision+Recall) = 2*

(0.9996*0.9991)

(0.9996+0.9991) = 0.9994

ค านวณคา True Negative Rate (TNR) ไดจากสมการท (7) จะได

True Negative Rate (TNR) = True Negative

(True Negative + False Positive) =

33,685

33,685+115 = 0.9966

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

70

ค านวณคา False Positive Rate (FPR) ไดจากสมการท (8) จะได

False Positive Rate (FPR) = False Positive

(True Negative + False Positive) =

115

33,685+115 = 0.0034

ค านวณคา False Negative Rate (FNR) ค านวณไดจากสมการท (9) จะได

False Negative Rate (FNR) = False Negative

(True Positive + False Negative) =

256

293,728+256 = 0.0009

ค านวณคา Accuracy ไดจากสมการท (3) จะได

Accuracy = True Positive + True Negative

(True Positive + True Negative + False Positive + False Negative)

= 293,728+33,685

293,728+33,685+115+256 = 0.9989

จากขอมลในตารางท 4.1 เมอพจารณาในสวนของวธการเรยนรดวยเครองแบบ Support

Vector Machine จะได True Positive (TP) = 293,738 False Positive (FP) = 99 False Negative (FN) = 246 True Negative (TN) = 33,701 เมอน าไปค านวณคา Precision ตามการค านวณในสมการท (4) จะได

Precision = True Positive

(True Positive + False Positive) =

293,738

293,738+99 = 0.9997

ค านวณคา Recall หรอ True Positive Rate (TPR) ตามการค านวณในสมการท (5) จะได

Recall = True Positive

(True Positive + False Negative) =

293,738

293,738+246 = 0.9992

ค านวณคา F-measure ไดจากสมการท (6) จะได

F-measure=2* (Precision*Recall)

(Precision+Recall) = 2*

(0.9997*0.9992)

(0.9997+0.9992) = 0.9994

ค านวณคา True Negative Rate (TNR) ไดจากสมการท (7) จะได

True Negative Rate (TNR) = True Negative

(True Negative + False Positive) =

33,701

33,701+99 = 0.9971

ค านวณคา False Positive Rate (FPR) ไดจากสมการท (8) จะได

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

71

False Positive Rate (FPR) = False Positive

(True Negative + False Positive) =

99

33,701+99 = 0.0029

ค านวณคา False Negative Rate (FNR) ค านวณไดจากสมการท (9) จะได

False Negative Rate (FNR) = False Negative

(True Positive + False Negative) =

246

293,738+246 = 0.0008

ค านวณคา Accuracy ไดจากสมการท (3) จะได

Accuracy = True Positive + True Negative

(True Positive + True Negative + False Positive + False Negative)

= 293,738+33,701

293,738+33,701+99+246 = 0.9989

จากการค านวณขางตนของแตละแบบจ าลองทสรางจากวธการเรยนรดวยเครองทง 3 ไดแก Naïve Bayes, Neural Network และ Support Vector Machine แสดงรายละเอยดดงตารางท 4.2 ตารางท 4.2 ผลลพธจากการทดลองการจ าแนกขอมลดวยวธการเรยนรดวยเครอง

Precision Recall

(True Positive Rate)

F-Measure True

Negative Rate

False Positive

Rate

False Negative

Rate Accuracy

Naïve Bayes 0.9909 0.9652 0.9779 0.9232 0.0768 0.0348 96.08%

Neural Network 0.9996 0.9991 0.9994 0.9966 0.0034 0.0009 99.89%

Support Vector Machine 0.9997 0.9992 0.9994 0.9971 0.0029 0.0008 99.89%

จากผลทไดในตารางท 4.2 พบวาคา Precision ทใชเพอวดความแมนย าในการท านายของ

แบบจ าลองทสรางดวย Support Vector Machine ใหคาดทสดมากถง 0.9997 ตามมาดวย Neural Network ทใหคา 0.9996 ซงมความแตกตางกนนอยมาก สวน Naïve Bayes ใหคาความแมนย ามากถง 0.9909 แมวาจะมคานอยกวาอกสองวธ แตกเปนตวเลขทมคาคอนขางสง สวนคา Recall หรอ True Positive Rate (TPR) เปนการวดคาความถกตองทแบบจ าลองท านายขอมลขาวจรงไดถกตองเมอเปรยบเทยบกบจ านวนขาวจรงทงหมดทปรากฏอยในชดขอมล ซงผลการค านวณทไดเปนไปในแนวทางเดยวกบคา Precision กลาวคอ Support Vector Machine ใหคาดทสดมากถง 0.9992 ตามมาดวย Neural Network ทใหคา 0.9991 และ Naïve Bayes ใหคา 0.9652 ดงนนการค านวณคา F-measure ทใชวดคาประสทธภาพโดยรวมของแบบจ าลองทค านวณจาก คาเฉลยระหวาง

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

72

Precision และ Recall ของแบบจ าลองทไดจาก Support Vector Machine และ Neural Network จงมคาเทากนคอ 0.9994 สวน Naïve Bayes ใหคาต ากวาเพยงเลกนอยคอ 0.9779

คา True Negative Rate (TNR) เปนอตราสวนของจ านวนขาวปลอมทแบบจ าลองสามารถท านายไดถกตองวาเปนขาวปลอมกบจ านวนขาวปลอมทงหมดทปรากฏในชดขอมล พบวาแบบจ าลองทสรางจากวธ Support Vector Machine ใหคา 0.9971 สวน Neural Network ใหคา 0.9966 และ Naïve Bayes ใหคา 0.9232 แสดงวาทกแบบจ าลองทสรางขนจากสามวธการเรยนรดวยเครองสามารถใชจ าแนกขาวปลอมไดอยางถกตองมากกวารอยละ 90 ขนไป

คา False Positive Rate (FPR) เปนอตราสวนของจ านวนขาวปลอมทแบบจ าลองท านายไดวาเปนขาวจรงซงเปนผลท านายทผดพลาดกบจ านวนขาวปลอมทงหมดทปรากฏในชดขอมล ดงนนคาทไดนควรจะเปนคาตวเลขนอย ๆ ยงวธการใดใหคายงนอยแสดงวาแบบจ าลองนนท านายขอมลขาวปลอมผดนอยมากเทานน จากผลการวจยพบวาแบบจ าลองทสรางจากวธ Support Vector Machine ใหคานอยทสดคอ 0.0029 ตามดวยคาทไดจาก Neural Network คอ 0.0034 และคาทไดจาก Naïve Bayes มคาเปน 0.0768

คา False Negative Rate (FNR) เปนอตราสวนของจ านวนขาวจรงทแบบจ าลองท านายไดวาเปนขาวปลอมซงเปนผลท านายทผดพลาดกบจ านวนขาวจรงทงหมดทปรากฏในชดขอมล ซงคาทไดนควรจะเปนคาตวเลขนอย ๆ ยงวธการใดใหคายงนอยแสดงวาแบบจ าลองนนท านายขอมลขาวจรงผดไปนอยมากเทานน จากผลการวจยพบวาแบบจ าลองทสรางจากวธ Support Vector Machine ใหคานอยทสดคอ 0.0008 ตามดวยคาทไดจาก Neural Network คอ 0.0009 และคาทไดจาก Naïve Bayes มคาเปน 0.0348

ค านวณคา Accuracy เปนวดคาความถกตองในการท านายของแบบจ าลองทสามารถท านายไดผลถกตองทงในสวนของการท านายขาวจรงไดถกตองและท านายขาวปลอมไดยางถกตองจากจ านวนขอมลทงหมดในชดขอมล ดงนนหากคาทไดมคามาก ๆ แสดงวาแบบจ าลองทไดจากวธการนนสามารถจ าแนกขาวไดอยางถกตองมาก เพอความสะดวกในการเปรยบเทยบคาจงไดคดค านวณเปนคารอยละดวยการคณดวย 100 จะไดผลเปน

คารอยละของความถกตองทไดจาก Naïve Bayes มคาเทากบ 96.08% แตวธการ Neural Network และ Support Vector Machine ใหผลลพธคารอยละความถกตอง (Accuracy) สงกวาวธการของ Naïve Bayes ซงคารอยละความถกตองทไดจาก Neural Network มคาเทากนกบคาทไดจาก Support Vector Machine นนคอมคาเทากบ 99.89% ซงเปนขอสงเกตไดวาแบบจ าลองทสรางจากวธการเรยนรดวยเครองทง 3 วธ ใหผลการจ าแนกขาวปลอมไดอยางถกตอง

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

73

4.2 การเลอกคณลกษณะทเหมาะสม การเลอกพจารณาตดคณลกษณะทมความส าคญนอยออกเพอใหประสทธภาพการท านายไดคา

ความถกตองสงมากขน โดยการคดสรรคณลกษณะ Attribute Selection โดยการเลอกลดจ านวนคณลกษณะทไมเกยวของออก ใหเหลอเฉพาะคณลกษณะทมความสมพนธกนเทานน ซงท าใหผลการจ าแนกไดคาความถกตองมากขนและลดเวลาทใชในการประมวลผลลง ยกตวอยางเชน

การลดคณลกษณะดวย InfoGain Attribute Evaluation เปนการลดคณลกษณะโดยการวดคา Information gain ทคณลกษณะมความสมพนธกบคลาส

GainRatio Attribute Evaluation เปนการประเมนคาคณลกษณะดวยการวดคา Gain Ratio ทวดความสมพนธของคณลกษณะโดยมการปรบตามคาขอบเขตของขอมลในคณลกษณะทสนใจกบคลาส

OneR Attribute Evaluation เปนการลดจ านวนคณลกษณะโดยใชกฎ (Rule) ดวยการสรางกฎจากตนไมตดสนใจหนงระดบ โดยกฎทสรางไดจากแตละคณลกษณะจะมความแตกตางกน โดยจะเลอกใชกฎทมคาความผดพลาดนอยสดเพยงกฎเดยว โดยคาของคณลกษณะทใหคาความผดพลาดนอยสดจะเปนคาทดทสด

ChiSquare Attribute Evaluation เปนการลดจ านวนคณลกษณะทใช โดยการค านวณคา Chi-Square ทางสถต

การปรบปรงความถกตองในการจ าแนกขาวปลอม เมอพจารณาคณลกษณะทคาดวาจะสงผลตอความแมนย าในการจ าแนกขาวปลอม ในงานวจยนไดเลอกวธการทดลองโดยการลดคณลกษณะออกทละหนง แลวใชวธการเรยนรดวยเครองแตละวธการจ าแนกขาวปลอม ผลของรอยละความถกตองในการจ าแนกขอมลเมอมการพจารณาลดแตละคณลกษณะส าหรบการทดลองดวยแตละวธการเรยนรดวยเครอง ไดแก Naïve Bayes, Neural Network และ Support Vector Machine แสดงคารอยละความถกตองของการจ าแนกขาวปลอมแตละวธการเรยนรดวยเครองโดยการลดทละหนงคณลกษณะและคาเปรยบเทยบทเปลยนแปลงไปจากเดมทจ าแนกดวยคณลกษณะทง 22 คณลกษณะ

หากผลทไดทเปนคาตวเลขบวกหมายถงไดคารอยละความถกตองในการจ าแนกขาวปลอมเพมมากขน แสดงวาการลดคณลกษณะนน ท าใหไดความถกตองในการจ าแนกมากยงขน จงควรไปพจารณาคณลกษณะนน แตหากผลทไดทเปนคาตวเลขลบจะหมายความวาไดคารอยละความถกตองในการจ าแนกขาวปลอมลดลงจากเดม แสดงวาการลดคณลกษณะนน ท าใหไดความถกตองในการจ าแนกลดลง จงไมควรพจารณาการลดคณลกษณะนน ดงตารางท 4.3

อธบายความหมายของตวอยางของผลการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองเมอมการลดหนงคณลกษณะ (Id) ทไดแสดงในตารางท 4.3 ดงตอไปน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

74

เมอลดคณลกษณะ Id และน าขอมล 21 คณลกษณะทเหลอไปจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Naïve Bayes ไดคารอยละความถกตองในการจ าแนกเปน 96.0828 เมอเปรยบเทยบกบการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Naïve Bayes โดยใช 22 คณลกษณะทไดคารอยละความถกตองในการจ าแนกเปน 96.0825 จะไดความแตกตางเมอเปรยบเทยบกนเปน 0.0003 แสดงวาการลดคณลกษณะ Id และน าขอมลทเหลอไปจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Naïve Bayes แลวจะไดคารอยละความถกตองในการจ าแนกดขนเพยงรอยละ 0.0003 ซงเปนคาทไดเปนคานอยมาก มความแตกตางกนไมมาก

เมอลดคณลกษณะ Id ออกไป และน าขอมล 21 คณลกษณะทเหลอไปจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Neural Network ไดคารอยละความถกตองในการจ าแนกเปน 99.8957 เมอเปรยบเทยบกบการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Neural Network โดยใช 22 คณลกษณะทไดคารอยละความถกตองในการจ าแนกเปน 99.8969 จะไดความแตกตางเมอน าคามาเปรยบเทยบกนเปน -0.0012 แสดงวาการลดคณลกษณะ Id และน าขอมลทเหลอไปจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Neural Network แลวจะไดคารอยละความถกตองในการจ าแนกขาวปลอมลดลงรอยละ 0.0012

เมอลดคณลกษณะ Id ออกไป และน าขอมล 21 คณลกษณะทเหลอไปจ าแนกขาวปลอมปลอมดวยวธการเรยนรดวยเครองวธ Support Vector Machine ไดคารอยละความถกตองในการจ าแนกขาวปลอมเปน 99.8969 ซงมคาเทากบผลของรอยละความถกตองในการจ าแนกขาวปลอมดวยวธการเรยนรด วยเครองวธ Support Vector Machine โดยใช 22 คณลกษณะ คาเปรยบเทยบทเปลยนแปลงไปจงมคาเทากบ 0 แสดงวาการลดคณลกษณะ Id เพยงคาเดยวนไมสงผลตอการเปลยนแปลงของคารอยละความถกตองในการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Support Vector Machine

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

75

ตารางท 4.3 ผลการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองเมอมการลดหนงคณลกษณะ

คณลกษณะขอมลทลดไป

รอยละความถกตองในการจ าแนกขาวปลอม คาเปรยบเทยบทเปลยนแปลงไป

Naïve Bayes

Neural Network

Support Vector

Machine

Naïve Bayes

Neural Network

Support Vector

Machine

ไมลดคณลกษณะใด ๆ 96.0825 99.8969 99.8969

Id 96.0828 99.8957 99.8969 0.0003 -0.0012 0

Name 96.2060 99.8963 99.8969 0.1235 -0.0006 0

IsVerified 96.1935 99.8954 99.8969 0.1110 -0.0015 0

ProfileImageUrl 96.2286 99.8969 99.8969 0.1461 0 0

FollowersCount 96.3693 99.8957 99.8969 0.2868 -0.0012 0

FriendsCount 96.1835 99.8963 99.8969 0.1010 -0.0006 0

FavouritesCount 96.2512 99.8969 99.8969 0.1687 0 0

StatusesCount 96.1584 99.8966 99.8969 0.0759 -0.0003 0

Description 96.1935 99.8963 99.8969 0.1110 -0.0006 0

Location 96.2045 99.896 99.8969 0.1220 -0.0009 0

TimeZone 96.1935 99.8966 99.8969 0.1110 -0.0003 0

CreatedDate 96.0489 99.896 99.8969 -0.0336 -0.0009 0

Status 96.1935 99.8963 99.8969 0.1110 -0.0006 0

Url 94.9012 99.8969 99.8969 -1.1813 0 0

Mentions 98.4169 99.8957 99.8969 2.3344 -0.0012 0

Number of Mentions 98.4169 99.8957 99.8969 2.3344 -0.0012 0

HashTags 96.1819 99.8963 99.8969 0.0994 -0.0006 0

Number of HashTags 96.1819 99.8963 99.8969 0.0994 -0.0006 0

RetweetCount 97.1326 99.8969 99.8969 1.0501 0 0

TweetCreatedDate 96.1871 99.8969 99.8969 0.1046 0 0

MessageText 97.096 99.8954 99.8969 1.0135 -0.0015 0

MessageImage 96.2088 99.8969 99.8969 0.1263 0 0

จากขอมลทงหมดทปรากฏในตารางท 4.3 พบวาแตละหนงคณลกษณะทลดหายไปไมสงผลทด

ขนกบคารอยละความถกตองในการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Neural Network เนองจากคาผลตางของการเปรยบเทยบทไดทงหมดเปนคาตวเลขตดลบหรอศนย สวน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

76

ผลตางของคารอยละความถกตองในการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Support Vector Machine เมอลดแตละหนงคณลกษณะแลวมคาเปนศนยทงหมด จงกลาวไดวาการลดแตละหนงคณลกษณะของชดขอมลแลวน าไปจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Neural Network และ วธ Support Vector Machine ไมสงผลใหการจ าแนกขาวปลอมท าไดถกตองมากขน แตมคณลกษณะทลดไปแลวสงผลทดขนส าหรบคารอยละความถกตองในการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองวธ Naïve Bayes จ านวน 4 คณลกษณะ ไดแก Mentions, Number of Mentions, RetweetCount และ MessageText แตเนองดวยคารอยละความถกตองในการจ าแนกขาวปลอมเมอลดคณลกษณะ Mentions มคาเทากบ Number of Mentions จงเลอกพจารณาเฉพาะ Mentions แทนคณลกษณะ Number of Mentions ในการทดลองลดคณลกษณะมากกวาหนงคณลกษณะซงใหผลดงตารางท 4.4

ตารางท 4.4 ผลการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครองเมอลดมากกวาหนงคณลกษณะ

คณลกษณะขอมลทลดไป

รอยละความถกตองในการจ าแนกขาวปลอม

คาเปรยบเทยบทเปลยนแปลงไป

Naïve Bayes

Neural Network

Support Vector

Machine

Naïve Bayes

Neural Network

Support Vector

Machine

ไมลดคณลกษณะใด ๆ 96.0825 99.8969 99.8969 Mentions, RetweetCount 99.0390 99.8969 99.8969 2.9565 0.0000 0.0000

Mentions, MessageText 98.9896 99.8960 99.8969 2.9071 -0.0009 0.0000

RetweetCount, MessageText 98.2998 99.8969 99.8969 2.2173 0.0000 0.0000 Mentions, RetweetCount, MessageText

99.3898 99.8969 99.8969 3.3073 0.0000 0.0000

จากตารางท 4.4 แสดงคารอยละความถกตองของการจ าแนกขาวปลอมโดยการลดมากกวา

หนงคณลกษณะแลวน าไปผานกระบวนการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครอง Naïve Bayes, Neural Network และ Support Vector Machine โดยเลอกคณลกษณะท สนใจจากคณลกษณะทสงผลตอคารอยละความถกตองของการจ าแนกขาวปลอมมคาเพมมากขนจากการลด ทละหนงคณลกษณะ ไดแก Mentions, RetweetCount และ MessageText ซงไดผลปรากฏวา

การเปลยนแปลงคารอยละความถกตองของการจ าแนกขาวปลอมทเกดจากการลดมากกวาหนงคณลกษณะของชดขอมล แลวน าไปผานกระบวนการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครอง Naïve Bayes ไดคารอยละความถกตองในการจ าแนกขาวปลอมทถกตองมากยงขน โดยการลดสองคณลกษณะของ Mentions กบ RetweetCount พรอมกนท าใหไดคารอยละความถกตองใน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

77

การจ าแนกขาวปลอมเปนรอยละ 99.0390 โดยมคาเพมมากขนรอยละ 2.9565 เมอเปรยบเทยบกบคาเดมของคารอยละความถกตองของการจ าแนกขาวปลอมทไมมการลดคณลกษณะใด ๆ จาก 22 คณลกษณะคอรอยละ 96.0825 เมอพจารณาการลดสองคณลกษณะของ Mentions กบ MessageText พรอมกน ท าใหไดคารอยละความถกตองในการจ าแนกขาวปลอมสงขนเปนรอยละ 98.9896 โดยมคาเพมมากขนรอยละ 2.9071 และการลดสองคณลกษณะของ RetweetCount กบ MessageText พรอมกน ท าใหไดคารอยละความถกตองในการจ าแนกขาวปลอมสงขนเปนรอยละ 98.2998 โดยมคาเพมมากขนรอยละ 2.2173 เมอเปรยบเทยบกบคาเดม และพจารณาการลดคณลกษณะพรอมกนทงสามคณลกษณะทคาดวาจะสงผลตอคารอยละความถกตองในการจ าแนกขาวปลอมคอ Mentions, RetweetCount และ MessageText ไดคารอยละความถกตองในการจ าแนกขาวปลอมสงขนเปนรอยละ 99.3898 โดยมคาเพมมากขนรอยละ 3.3073 ซงเปนคารอยละความถกตองทมคามากทสดในการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครอง Naïve Bayes ส าหรบชดขอมลน

เมอพจารณาการลดมากกวาหนงคณลกษณะของชดขอมลแลวน าไปผานกระบวนการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครอง Neural Network พบวาคารอยละความถกตองของการจ าแนกขาวปลอมทมการลดคณลกษณะพรอมกนสองคณลกษณะคอ Mentions กบ MessageText สงผลตอคาเปรยบเทยบทเปลยนแปลงไปโดยมคาแยลงรอยละ -0.0009 นอกจากนนผลจากการลดมากกวาหนงคณลกษณะแบบอน ไดแก Mentions พรอมกบ RetweetCount หรอ RetweetCount พรอมกบ MessageText หรอการลดสามคณลกษณะในคราวเดยวโดยลดคณลกษณะ Mentions, RetweetCount และ MessageText พรอมกน ผลปรากฏวาไมมความแตกตางกนในคารอยละความถกตองของการจ าแนกขาวปลอมไดคาเปรยบเทยบออกมาเปนศนยทงหมด

พบวาคารอยละความถกตองของการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครอง Support Vector Machine ไมมการเปลยนแปลงใด ๆ ไดคาเปรยบเทยบทเปลยนแปลงไปมความแตกตางกนเปนศนยทงหมด

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

บทท 5 วเคราะหผลการวจย

เอกสารในบทนเปนบทสดทาย ประกอบดวยสองสวน ไดแก สวนแรกเปนการสรปผลการ

ด าเนนงานของงานวจยนและอภปรายผลการด าเนนงานทได ในสวนสดทายเปนขอจ ากดตาง ๆ รวมถงแนวทางวจยตอในอนาคต ดงรายละเอยดตอไปน

5.1 สรปผล

ขอมลจากเครอขายสงคมออนไลนทวตเตอร ในชวงระหวางเดอนตลาคมถงพฤศจกายน พ.ศ. 2560 ประเทศไทยมการปกครองในระบอบประชาธปไตยอนมพระมหากษตรยเปนพระประมข ดงนนสถาบนพระมหากษตรยจงมความสมพนธกบประชาชนอยางแนบแนน โดยเฉพาะอยางยงในหลวงรชกาลท 9 ทรงครองราชยเปนระยะเวลายาวนานกวา 70 ป พระราชกรณยกจตาง ๆ ทเคยทรงปฏบตมาตลอดรชกาล ไดสงผลตอวถชวตความเปนอยของผคนสวนใหญในประเทศ ดงนนประชาชนโดยสวนใหญจงมความรกความผกพนเทดทนพระมหากษตรยเหนอกวาสงอนใด เมอมเหตการณทเกยวของกบพระองค อาทเชน ขาวการประชวร การเสดจสวรรคต ตลอดจนพระราชพธทเกยวของกบพระมหากษตรย จงมผลกบประชาชนอยางยง ทงทางตรงและทางออม สงผลตอสภาพจตใจ สงคม และเศรษฐกจภายในประเทศ ดงนนการสงขาวถงกนในเรองขาวคราวตาง ๆ ทเกยวของกบสถาบนพระมหากษตรยจงไดรบความสนใจมากกวาประเดนขาวอน ๆ ซงขาวทเกดขนไมวาจะเปนขาวจรงหรอขาวปลอมยอมสงผลตอความรสกของประชาชนอยางมากมาย

ขอมลทเกยวของกบเหตการณปรากฏการณทางธรรมชาตเปนเรองทสงผลกระทบตอชวตความเปนอยของชาวบาน หากเกดภยพบตจากปรากฏการณทางธรรมชาตโดยมไดมการเตรยมตวระวงปองกนภยไวลวงหนา จะกอใหเกดความเดอดรอน สงผลใหเกดความเสยหายตอทรพยสนได ดงนนขอมลขาวสารดานการแจงเตอนภยธรรมชาตจงเปนเรองทควรใหความส าคญเปนอยางยง ขาวตาง ๆ ทเกดในชวงเหตการณภยธรรมชาตมทงขาวจรงขาวปลอมจ านวนมาก ดงนนประชาชนจงอาจเกดความสบสนในการเตรยมการระวงภยได หวขอขาวอน ๆ ทมผลตอผคนสงคมโดยตรง คนสวนใหญจะใหความส าคญรบฟงขาวสารและแสดงความคดเหนกนมากกวาประเดนขาวทเปนเรองไกลตว อาทเชน ขาวเรองการเสยภาษ การลดหยอนภาษ การจายเงนสมทบเขากองทนประกนสงคม ซงในงานวจยนไดรวบรวมจดเกบขอมลขาวทวไปไวดวย

จากหวขอเรองทเกยวกบเหตการณขาวปรากฏการณทางธรรมชาต ขาวทวไป และขาวทเกยวของกบเหตการณพระราชพธพระบรมศพรชกาลท 9 ปรากฏวา เมอไดวเคราะหคณลกษณะของ

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

79

ขอมลขาวทจดเกบมา สวนใหญไมพบบญชทวตเตอรทมสถานะ IsVerified เปน TRUE ในบญช ทวตเตอรทโพสตขอความ สวนคาของจ านวนผทตดตามบญชผใช (FollowersCount) ทมคามากทสด มคามากกวารอยละ 40 และจ านวนบญชทผใชก าลงตดตาม (FriendsCount) ของบญชทวตเตอรมคามากทสด มคามากกวารอยละ 60 ทงทโพสตขาวจรงและขาวปลอมมคามากทสดอยในชวงระหวาง 100-999 คน เชนเดยวกน คาของจ านวนสงทเคยกดถกใจ (FavouritesCount) ของบญชทวตเตอรทงทโพสตขาวจรงและขาวปลอมมคามากทสดอยในชวงระหวาง 1,000-9,999 โดยมคามากทสดมากกวารอยละ 30 คาของจ านวนสถานะทเจาของบญชเคยแสดงมา (StatusesCount) ทงบญชทวตเตอรทโพสตขาวจรงและขาวปลอมมคาเปนไปในแนวทางเดยวกน คอมคาอยในชวงระหวาง 10,000-99,999 ครง มคามากทสดรอยละ 44.40 และรอยละ 37.87 ตามล าดบ เมอพจารณาวนทสรางบญชทวตเตอร (CreatedDate) ของบญชทวตเตอรทโพสตขาวจรงสวนใหญ (รอยละ 18.68) เปนบญชทมอายการใชงานนอยกวา 0.5 ป แตส าหรบบญชทวตเตอรทโพสตขาวปลอมสวนใหญ (รอยละ 29.68) เปนบญชทมอายการใชงานระหวาง 4-4.5 ป ขอความทพบในขาว (MessageText) ของบญชทวตเตอรทแสดงขาวจรง มสดสวนของขอความทเขยนเองตอขอความรทวตทสงตอเปน รอยละ 8.17 ตอ 91.83 นอยกวาบญชทวตเตอรทโพสตขาวปลอม ซงมสดสวนระหวางขอความทเขยนเองกบขอความรทวตซ าจากคนอน เปนรอยละ 21.89 ตอ 78.11 จ านวนครงของการสงตอขอความ (RetweetCount) ของบญชทวตเตอรทโพสตขาวจรงมคามากทสดอยในชวงระหวาง 1,000-9,999 ครง แตบญชทวตเตอรทโพสตขาวปลอมมการรทวตซ ามากทสดเพยง 10-99 ครงเทานน จากชดขอมลทจดเกบมาไดพบวาวนเวลาทโพสตขอความขาว (TweetCreatedDate) ของบญชทวตเตอรทแสดงขาวจรงสวนนอยทสด (รอยละ 9.94) แสดงในชวงเวลา 18.01น.-24.00 น. เนองจากในชวงเวลาดงกลาวเปนเวลาทคนสวนใหญพกผอน นงเลน ดหนง ฟงเพลง ใชเวลาไปกบการทองอนเทอรเนต หลงจากเสรจสนจากภารกจประจ าวน แตจากชดขอมลทจดเกบมาพบวาบญช ทวตเตอรทโพสตขาวปลอมสวนใหญจะโพสตขอความในชวงกลางวนระหวางเวลา 06.00-18.00น. ซงนาจะสนนษฐานไดวา ผสงขาวปลอมมความตงใจทจะใหคนอนไดเหนขาวนนในชวงเวลาหลงเลกงานเวลาเยน อกขอสงเกตหนงทไดจากการจดเกบขอมลจากบญชทวตเตอรทโพสตขาวจรงและขาวปลอมพบวา จากขอความทโพสตทงหมดโดยประมาณครงหนงในขอความขาวจรงคอรอยละ 49.65 และรอยละ 53.25 ของขอความขาวปลอม ไมปรากฏสญลกษณเครองหมาย HashTags (#) ในขอความขาว ซงเปนทนาแปลกใจเปนอยางยง จงสนนษฐานวาอาจเกดจากหวขอขาวเหลานนตองการแสดงรายละเอยดเนอหาขาวมากกวาการเนนหรอกลาวอางถงประเดนอนดวยการใชเครองหมาย # จ านวนจดเชอมโยงขอมล (URL) ทพบทงบญชทวตเตอรขาวจรงและขาวปลอม สวนใหญพบวามจ านวนจดเชอมโยงทสามารถเขาถงแหลงขอมลมากกวา 3 ลงค สวนของการระบถงบญชผใชอน (Mentions)

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

80

และจ านวนการระบถงบญชผใชอน (Number of Mentions) ของบญชผใชทวตเตอรทแสดงขาวจรงและขาวปลอม สวนใหญมหนงการอางองถง

จากผลการวเคราะหขอมลขาวปลอมทใชในงานวจยน สามารถสรปไดวาคณลกษณะของขาวปลอมทปรากฏในชดขอมลมลกษณะดงตอไปน

ขาวปลอมทพบสวนมาก 89.35% จากขอมลขาวปลอมทพบในชดขอมลทงหมดมาจากบญชผใชงานทเปดมานาน (ขนาด Id ยาว 9-10 ตว) โดยอายการใชงานเฉลยของบญชผใชงานทวตเตอรอยในชวงระหวาง 4-4.5 ป ชอบญชทใชสวนใหญเปนตวอกขระผสมภาษาไทยภาษาองกฤษ ตวเลข มากกวาแบบอน ๆ และเกอบครงหนงของบญชทโพสตขาวปลอมรอยละ 48.82 มผตดตามและมจ านวนบญชทมการตดตามบญชอน ๆ อยในชวงเดยวกนคออยในชวงระหวาง 100-999 บญช และกดถกใจสงทชอบมากระหวาง 1,000-9,999 บญชผใช บญชทแสดงการสงขอความทเปนขาวปลอมสวนใหญมจ านวนสถานะของการสงขอความทวตออกไปแลวของเจาของบญชนบแตเรมเปดบญชผใชงาน อยในชวงระหวาง 10,000-99,999 ครง เปนจ านวนมากถงรอยละ 37.87 และมจ านวนผใชงานทสงขาวปลอมท าการสงขอความไปแลว 100,000-999,999 ขอความมากถงรอยละ 34.02 รายละเอยดของชอบญชผใชสวนใหญเลอกใชตวอกขระผสมมากกวา การใชตวอกขระแบบภาษาไทยทงหมดหรอภาษาองกฤษทงหมด นอกเหนอจากสวนของขอมลทแสดงต าแหนงเปนต าแหนงอน ๆ ทไมอยในตารางท 3.13 แลวพบวาบญชผใชงานสวนใหญเปนบญชทพบในประเทศไทยและเอเชยตะวนออกเฉยงใตมากกวาบรเวณอน ๆ ซงมความสอดคลองกบชดขอมลทจดเกบจากหวขอของขอความขาวทเปนภาษาไทย แตจากขอมลทงหมดพบวาไมมการระบบรเวณต าแหนงเวลาในขอความทเปนขาวปลอมถกน าไปเผยแพรใหม (retweeted) เพยง 10-99 ครง เนองจากความจรงปรากฏแลว ขอความเหลานนจงไมมการเผยแพรซ าออกไปอก อกขอสงเกตหนงทพบคอขอความขาวปลอมทจะโพสตสวนใหญไมไดเปนขอความทเจาของบญชผใชสรางขนเอง แตเปนการสงตอขอความจากทมเคยมการสงไปแลวมากกวา และการโพสตครงแรกสวนใหญท าในชวงเวลากลางวนมากกวากลางคน

การเรยนรของเครองในการตรวจจบขาวปลอมไมใชเรองยาก หากขอมลทใชในการจดหมวดหมเปนขอมลทมค าตอบทชดเจน [38] ผลการวจยนใชวธการเรยนรดวยเครองเพอการจ าแนกขาวปลอมสามวธการ ไดแก Naïve Bayes, Neural Network และ Support Vector Machine ซงความถกตองของการจ าแนกขาวปลอม ส าหรบการจ าแนกขาวปลอมของชดขอมลตวอยางนไดด จงเปนไปในแนวทางเชนเดยวกบงานวจยของ [79] ทเลอกใชวธการ Support Vector Machine ในการวเคราะหความนาเชอถอของเหตการณทเปนขาว นอกจากนนยงมงานวจยของ [26] [65, 69, 72] ทใชวธการเรยนรดวยเครอง Naïve Bayes, Neural Network ในการจ าแนกขาวปลอมเชนกน รวมถงเรมมการใช deep Neural Network ในการปรบปรงประสทธภาพการท างาน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

81

ขอสงเกตทไดจากการพจารณาขาวปลอมทอยในทวตเตอรพบวา ขาวปลอมทเกดขนสวนใหญเกดขนในระยะเวลาสน ๆ แลวจะหายไปเมอความจรงปรากฏ จากผลการเกบขอมลของงานวจยน พบวาระยะเวลาทใชในการเผยแพรขาวจรงและขาวปลอม มความแตกตางกนอยางมนยยะส าคญ โดยระยะเวลาเฉลยทมการเผยแพรขาวปลอมเปน 5 วน 1 ชวโมง 19 นาท ซงสนกวาระยะเวลาเฉลยทมการเผยแพรขาวจรง 7 วน 7 ชวโมง 13 นาท คาความแปรปรวนของระยะเวลาเฉลยทใชในการเผยแพรขาวจรงเปน 7.34 และขาวปลอมเปน 4.78 ดงนนจงกลาวไดวาระยะเวลาวงจรชวตของขาวปลอมสนกวาขาวจรง ชวงระยะเวลาทขาวปลอมมการเผยแพรกนในชวงขาวทเผยแพรอยางรวดเรวบนทวตเตอร บางขาวปลอมมการแพรกระจายกนนานจนกระทงความจรงปรากฏขนแลวขาวปลอมนนจะหายไปอยางเงยบ ๆ แตปญหาคอตราบใดทยงไมมการเปดเผยความจรง ขาวนนจะยงคงเผยแพรตอไปเรอย ๆ ซงจะท าใหเกดความเขาใจผด และในบางประเดนหากทเปนหวขอขาวทเปนเรองทสงคมมความออนไหว อาจสรางความเสยหายตอผคนและสงคมได

จากขอมลในงานวจยนพบวา ชวงระยะเวลาทขาวปลอมมการเผยแพรในระยะเวลาอนจ ากดและเปนเพยงชวงเวลาสน ๆ มากกวาการเผยแพรขาวจรงทมการสงตอเผยแพรกนอยางยาวนานกวาซงสอดคลองกบผลงานวจยของ [80]

คณลกษณะทสงผลตอจ าแนกขาวปลอมออกจากขาวจรงในเครอขายสงคมออนไลนทวตเตอร มผลตอคารอยละความถกตองของการจ าแนกขาวปลอมของชดขอมลน ไดแก Mentions, RetweetCount และ MessageText จากการทดลองลดคามากกวาหนงคณลกษณะแลวน าไปผานกระบวนการจ าแนกขาวปลอมดวยวธการเรยนรดวยเครอง Naïve Bayes, Neural Network และ Support Vector Machine แลวไดผลคารอยละความถกตองของการจ าแนกขาวปลอมมคามากขน

5.2 ขอจ ากดและแนวทางวจยในอนาคต

ขอจ ากดของวธการทใชในงานวจยนคอสามารถใชงานไดดกบขาว "จรง" ทไมไดใชเนอหาของขาวในการวเคราะห วธการเรยนรดวยเครองส าหรบการจ าแนกขาวปลอมใชการแปลงขอมลจากกฎการแปลงขอมลแปลงใหเปนตวเลข โดยไมไดพจารณาเนอหาของขาว ในอนาคตเพอขยายขอบเขตของขาวทสามารถจ าแนกได จะใชวธการวเคราะหค าความหมายของเนอขาวมารวมพจารณา

การเรยนรดวยเครองยงมอกขอจ ากดหนงคอ กรณทมขอมลทไมรจกจ านวนมากแบบจ าลองจะไมสามารถจ าแนกขอมลไดอยางถกตอง หากไมมขอมลการเทรนนงในจ านวนมากเพยงพอ ดงนนจงจ าเปนตองมการรวบรวมขอมลจ านวนมากเพอรองรบขาวทหลากหลายมากขน

เนองจากระยะเวลาอนจ ากดทสามารถดงขอมลยอนหลงจากเครอขายสงคมออนไลนทวตเตอรเพยงไมเกน 7 วนยอนหลง ดงนนการเกบขอมลขาวหวขอใด ๆ กตาม หากเปนเรองทยงอยในความสนใจทยงมการพดถงกนในสงคม จะตองท าการเกบขอมลในหวขอเดมซ า ๆ กนอยางตอเนอง เพอให

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

82

ไดขอมลทเกยวของมากทสด นอกจากนนขาวปลอมทเกดมานนยงมระยะเวลาจ ากด เนองจากเมอความจรงปรากฏขนขาวปลอมเหลานนกจะหายไป ไมมใครกลาวถงอก ดงนนการจะเกบขอมลขาวปลอมจะตองเฝาคอยเกบหลาย ๆ หวขอขาว โดยทในระหวางการเกบขอมลจะยงไมทราบลวงหนาวาหวขาวนนจะเปนขาวจรงหรอขาวปลอม อกทงขนอยกบประเดนทสนใจอกดวย

ขอจ ากดในงานวจยนคอแบบจ าลองทใชในการระบขาวปลอมทสรางขน เกดจากการรวบรวมขอมลในชวงระยะเวลาไมนานมาก ซงชดขอมลทน ามาใชเปนขาวในหวขอจ ากด ดงนนเมอเวลาเปลยนแปลงไป ปญหาขาวตาง ๆ มการเปลยนแปลงไป แบบจ าลองทสรางขนน อาจไมสามารถใชในการจ าแนกขาวปลอมไดอยางมประสทธภาพ

ในอนาคตอาจมขอมลเพมเตมทใชในการสรางแบบจ าลองทดยงขน เพอปรบปรงประสทธภาพการจ าแนกขาวปลอมใหสามารถรองรบประเดนขาวทมากขน และทนสมยเขากบขาวปจจบน

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

บรรณานกรม [1] ส. อ. ห. สพธอ., "รจก พ.ร.บ. คอมพวเตอรฯ ฉบบท 2 พ.ศ. 2560," 2016. [Online].

Available: https://ictlawcenter.etda.or.th/news/detail/computer-2559. [2] K. Shu, A. Sliva, S. Wang, J. Tang, and H. Liu, "Fake News Detection on Social

Media: A Data Mining Perspective," SIGKDD Explor. Newsl., vol. 19, no. 1, pp. 22-36, 2017, doi: 10.1145/3137597.3137600.

[3] K. Niklewicz, "Weeding out fake news: an approach to social media regulation," European View, vol. 16, no. 2, pp. 335-335, 2017/12/01 2017, doi: 10.1007/s12290-017-0468-0.

[4] A. Campan, A. Cuzzocrea, and T. M. Truta, "Fighting fake news spread in online social networks: Actual trends and future research directions," in 2017 IEEE International Conference on Big Data (Big Data), 11-14 Dec. 2017 2017, pp. 4453-4457, doi: 10.1109/BigData.2017.8258484.

[5] M. Egele, G. Stringhini, C. Kruegel, and G. Vigna, "Towards Detecting Compromised Accounts on Social Networks," IEEE Transactions on Dependable and Secure Computing, vol. 14, no. 4, pp. 447-460, 2017, doi: 10.1109/TDSC.2015.2479616.

[6] A. Ehsanfar and M. Mansouri, "Incentivizing the dissemination of truth versus fake news in social networks," in 2017 12th System of Systems Engineering Conference (SoSE), 18-21 June 2017 2017, pp. 1-6, doi: 10.1109/SYSOSE.2017.7994981.

[7] H. Bansal and M. Misra, "Sybil Detection in Online Social Networks (OSNs)," in 2016 IEEE 6th International Conference on Advanced Computing (IACC), 27-28 Feb. 2016 2016, pp. 569-576, doi: 10.1109/IACC.2016.111.

[8] P. Jain and V. Singh, "CredRank: Evaluating tweet credibility during high impact events," in 2016 2nd International Conference on Contemporary Computing and Informatics (IC3I), 14-17 Dec. 2016 2016, pp. 553-557, doi: 10.1109/IC3I.2016.7918025.

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

84

[9] H. Berghel, "Alt-News and Post-Truths in the "Fake News" Era," Computer, vol. 50, no. 4, pp. 110-114, 2017, doi: 10.1109/MC.2017.104.

[10] C. Castillo, M. Mendoza, and B. Poblete, Information credibility on Twitter. 2011, pp. 675-684.

[11] W. A. S. a. Hootsuite, "Digital in 2019 Global Digital Overview," 2019. [Online]. Available: https://wearesocial.com/global-digital-report-2019.

[12] WorkpointTV, "หนไทยวกฤต! ภาคบายรวงตดลบเกอบ 100 จด คาดสถานการณความมนคงในประเทศ," 2016. [Online]. Available: https://www.facebook.com/WorkpointNews/posts/321351604900791/.

[13] M. Alrubaian, M. Al-Qurishi, M. M. Hassan, and A. Alamri, "A Credibility Analysis System for Assessing Information on Twitter," IEEE Transactions on Dependable and Secure Computing, vol. 15, no. 4, pp. 661-674, 2018, doi: 10.1109/TDSC.2016.2602338.

[14] S. Phartiyal. "India asks WhatsApp to curb spread of false messages." The Thomson Reuters https://www.reuters.com/article/us-whatsapp-india-fakenews/india-asks-whatsapp-to-curb-spread-of-false-messages-idUSKBN1JT1Z2 (accessed 2018).

[15] Y. L. Mari Saito. "Taiwan representative in Japan's Osaka commits suicide." The Thomson Reuters. https://www.reuters.com/article/us-japan-taiwan/taiwan-representative-in-japans-osaka-commits-suicide-idUSKCN1LV067 (accessed 2018).

[16] E. S. a. J. Gottfried. "News Use Across Social Media Platforms 2017." Pew Research Center. http://www.journalism.org/2017/09/07/news-use-across-social-media-platforms-2017/ (accessed 2018).

[17] M. G. Hunt Allcott, "Social Media and Fake News in the 2016 Election," Journal of Economic Perspectives, vol. 31, no. 2, pp. 211-236, 2017.

[18] S. Y. Bhat and M. Abulaish, "Community-based features for identifying spammers in Online Social Networks," in 2013 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM 2013), 25-28 Aug. 2013 2013, pp. 100-107, doi: 10.1145/2492517.2492567.

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

85

[19] S. Vosoughi, D. Roy, and S. Aral, "The spread of true and false news online," Science, vol. 359, no. 6380, p. 1146, 2018, doi: 10.1126/science.aap9559.

[20] A. Zubiaga, A. Aker, K. Bontcheva, M. Liakata, and R. Procter, "Detection and Resolution of Rumours in Social Media: A Survey " presented at the 2017 12th System of Systems Engineering Conference (SoSE), Waikoloa, HI, 2018.

[21] D. G. Young, K. Hall Jamieson, S. Poulsen, and A. Goldring, Fact-Checking Effectiveness as a Function of Format and Tone: Evaluating FactCheck.org and FlackCheck.org. 2017, p. 107769901771045.

[22] W. Vorhies, "Using Algorithms to Detect Fake News – The State of the Art," Data Science Central May 1, 2017 at 3:30pm 2017. [Online]. Available: https://www.datasciencecentral.com/profiles/blogs/using-algorithms-to-detect-fake-news-the-state-of-the-art.

[23] M. AlRubaian, M. Al-Qurishi, M. Al-Rakhami, S. M. M. Rahman, and A. Alamri, "A Multistage Credibility Analysis Model for Microblogs," presented at the Proceedings of the 2015 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining 2015, Paris, France, 2015.

[24] R. El Ballouli, W. El-Hajj, A. Ghandour, S. Elbassuoni, H. Hajj, and K. Shaban, "CAT: Credibility Analysis of Arabic Content on Twitter," Valencia, Spain, apr 2017: Association for Computational Linguistics, in Proceedings of the Third Arabic Natural Language Processing Workshop, pp. 62-71, doi: 10.18653/v1/W17-1308. [Online]. Available: https://www.aclweb.org/anthology/W17-1308

[25] R. Mouty and A. Gazdar, "Survey on Steps of Truth Detection on Arabic Tweets," in 2018 21st Saudi Computer Society National Computer Conference (NCC), 25-26 April 2018 2018, pp. 1-6, doi: 10.1109/NCG.2018.8593060.

[26] M. Granik and V. Mesyura, "Fake news detection using naive Bayes classifier," in 2017 IEEE First Ukraine Conference on Electrical and Computer Engineering (UKRCON), 29 May-2 June 2017 2017, pp. 900-903, doi: 10.1109/UKRCON.2017.8100379.

[27] V. Rubin, Y. Chen, and N. Conroy, Deception Detection for News: Three Types of Fakes. 2015.

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

86

[28] M. Abdul-Mageed, M. Diab, and S. Kübler, "SAMAR: Subjectivity and sentiment analysis for Arabic social media," Computer Speech & Language, vol. 28, no. 1, pp. 20-37, 2014/01/01/ 2014, doi: https://doi.org/10.1016/j.csl.2013.03.001.

[29] M.-P. S. Chan, jones, hall, and D. Albarracin, Debunking: A Meta-Analysis of the Psychological Efficacy of Messages Countering Misinformation. 2017.

[30] Y. U. Chandra, Surjandy, and Ernawaty, "Higher education student behaviors in spreading fake news on social media: A case of LINE group," in 2017 International Conference on Information Management and Technology (ICIMTech), 15-17 Nov. 2017 2017, pp. 54-59, doi: 10.1109/ICIMTech.2017.8273511.

[31] Á. Figueira and L. Oliveira, The current state of fake news: challenges and opportunities. 2017, pp. 817-825.

[32] ส านกงานราชบณฑตยสภา, "ระบบคนหาค าศพท," พจนานกรม ฉบบราชบณฑตยสถาน พ.ศ. ๒๕๕๔, 2011. [Online]. Available: http://www.royin.go.th/dictionary/index.php.

[33] S. J. Herschel, "The Great Moon Hoax," New York Sun, 1835. [Online]. Available: http://hoaxes.org/archive/permalink/the_great_moon_hoax.

[34] D. Bufnea and D. Şotropa, "A Community Driven Approach for click Bait Reporting," in 2018 26th International Conference on Software, Telecommunications and Computer Networks (SoftCOM), 13-15 Sept. 2018 2018, pp. 1-6, doi: 10.23919/SOFTCOM.2018.8555759.

[35] S. B. Parikh and P. K. Atrey, "Media-Rich Fake News Detection: A Survey," presented at the 2018 IEEE Conference on Multimedia Information Processing and Retrieval (MIPR), 2018.

[36] B. Nyhan and J. Reifler, Displacing Misinformation about Events: An Experimental Test of Causal Corrections. 2015, pp. 1-13.

[37] A. Algarni, Y. Xu, and T. Chan, "Measuring Source Credibility of Social Engineering Attackers on Facebook," presented at the 2016 49th Hawaii International Conference on System Sciences (HICSS), 2016.

[38] J. Hyman, "Addressing fake news: Open standards & easy identification," in 2017 IEEE 8th Annual Ubiquitous Computing, Electronics and Mobile Communication

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

87

Conference (UEMCON), 19-21 Oct. 2017 2017, pp. 63-69, doi: 10.1109/UEMCON.2017.8248986.

[39] Z. Jin, J. Cao, Y. Zhang, J. Zhou, and Q. Tian, "Novel Visual and Statistical Image Features for Microblogs News Verification," IEEE Transactions on Multimedia, vol. 19, no. 3, pp. 598-608, 2017, doi: 10.1109/TMM.2016.2617078.

[40] H. S. Al-Ash and W. C. Wibowo, "Fake News Identification Characteristics Using Named Entity Recognition and Phrase Detection," in 2018 10th International Conference on Information Technology and Electrical Engineering (ICITEE), 24-26 July 2018 2018, pp. 12-17, doi: 10.1109/ICITEED.2018.8534898.

[41] A. Dey, R. Z. Rafi, S. H. Parash, S. K. Arko, and A. Chakrabarty, "Fake News Pattern Recognition using Linguistic Analysis," in 2018 Joint 7th International Conference on Informatics, Electronics & Vision (ICIEV) and 2018 2nd International Conference on Imaging, Vision & Pattern Recognition (icIVPR), 25-29 June 2018 2018, pp. 305-309, doi: 10.1109/ICIEV.2018.8641018.

[42] S. Gheewala and R. Patel, "Machine Learning Based Twitter Spam Account Detection: A Review," in 2018 Second International Conference on Computing Methodologies and Communication (ICCMC), 15-16 Feb. 2018 2018, pp. 79-84, doi: 10.1109/ICCMC.2018.8487992.

[43] G. B. Guacho, S. Abdali, N. Shah, and E. E. Papalexakis, "Semi-supervised Content-Based Detection of Misinformation via Tensor Embeddings," in 2018 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM), 28-31 Aug. 2018 2018, pp. 322-325, doi: 10.1109/ASONAM.2018.8508241.

[44] N. Kim, D. Seo, and C. Jeong, "FAMOUS: Fake News Detection Model Based on Unified Key Sentence Information," in 2018 IEEE 9th International Conference on Software Engineering and Service Science (ICSESS), 23-25 Nov. 2018 2018, pp. 617-620, doi: 10.1109/ICSESS.2018.8663864.

[45] H. Nurrahmi and D. Nurjanah, "Indonesian Twitter Cyberbullying Detection using Text Classification and User Credibility," in 2018 International Conference on Information and Communications Technology (ICOIACT), 6-7 March 2018 2018, pp. 543-548, doi: 10.1109/ICOIACT.2018.8350758.

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

88

[46] M. L. D. Vedova, E. Tacchini, S. Moret, G. Ballarin, M. DiPierro, and L. d. Alfaro, "Automatic Online Fake News Detection Combining Content and Social Signals," in 2018 22nd Conference of Open Innovations Association (FRUCT), 15-18 May 2018 2018, pp. 272-279, doi: 10.23919/FRUCT.2018.8468301.

[47] V. Bakir and A. McStay, Fake News and The Economy of Emotions: Problems, causes, solutions. 2017, pp. 1-22.

[48] SpringNews, "ดสเครดตรฐบาล!! 3 ขาวปลอมท าสงคมสบสน," 2019. [Online]. Available: https://www.springnews.co.th/truth/truth-election-62/485023

[49] F. Benamara, C. Bosco, E. Fersini, G. Pasi, V. Patti, and M. Viviani, "SeCredISData 2018: Special Session on Sentiment, Emotion, and Credibility of Information in Social Data," in 2018 IEEE 5th International Conference on Data Science and Advanced Analytics (DSAA), 1-3 Oct. 2018 2018, pp. 638-640, doi: 10.1109/DSAA.2018.00082.

[50] S. B. Fazili and M. Ahmad, "Guassian Gradient Descent Model for Trust Inference in Imbalanced Data," in 2018 Second International Conference on Intelligent Computing and Control Systems (ICICCS), 14-15 June 2018 2018, pp. 929-934, doi: 10.1109/ICCONS.2018.8663243.

[51] J. Hodson and B. Traynor, "Design Exploration of Fake News: A Transdisciplinary Methodological Approach to Understanding Content Sharing and Trust on Social Media," in 2018 IEEE International Professional Communication Conference (ProComm), 22-25 July 2018 2018, pp. 1-5, doi: 10.1109/ProComm.2018.00008.

[52] C. M. M. Kotteti, X. Dong, N. Li, and L. Qian, "Fake News Detection Enhancement with Data Imputation," in 2018 IEEE 16th Intl Conf on Dependable, Autonomic and Secure Computing, 16th Intl Conf on Pervasive Intelligence and Computing, 4th Intl Conf on Big Data Intelligence and Computing and Cyber Science and Technology Congress(DASC/PiCom/DataCom/CyberSciTech), 12-15 Aug. 2018 2018, pp. 187-192, doi: 10.1109/DASC/PiCom/DataCom/CyberSciTec.2018.00042.

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

89

[53] K. Ootani and H. Yamana, "External Content-dependent Features for Web Credibility Evaluation," in 2018 IEEE International Conference on Big Data (Big Data), 10-13 Dec. 2018 2018, pp. 5414-5416, doi: 10.1109/BigData.2018.8622398.

[54] ว. ศรโหมด, ""หยดคด เชคตนตอ" หนทางยต "ขาวปลอม" ทก าลงเปนปญหาโลก," PostToday., 2019. [Online]. Available: https://www.posttoday.com/social/general/543708.

[55] Facebook. "เคลดลบในการสงเกตขาวปลอม." https://www.facebook.com/help/spotfalsenews (accessed 2019).

[56] S. R. Guruvayur and R. Suchithra, "A detailed study on machine learning techniques for data mining," in 2017 International Conference on Trends in Electronics and Informatics (ICEI), 11-12 May 2017 2017, pp. 1187-1192, doi: 10.1109/ICOEI.2017.8300900.

[57] I. Y. R. Pratiwi, R. A. Asmara, and F. Rahutomo, "Study of hoax news detection using naïve bayes classifier in Indonesian language," in 2017 11th International Conference on Information & Communication Technology and System (ICTS), 31-31 Oct. 2017 2017, pp. 73-78, doi: 10.1109/ICTS.2017.8265649.

[58] Wikipedia. "Naive Bayes classifier." https://en.wikipedia.org/wiki/Naive_Bayes_classifier (accessed 2019).

[59] Wikipedia. "Artificial neural network." https://en.wikipedia.org/wiki/Artificial_neural_network (accessed 2019).

[60] A. Pal and A. Y. K. Chua, "Classification of rumors and counter-rumors," in 2018 4th International Conference on Information Management (ICIM), 25-27 May 2018 2018, pp. 81-85, doi: 10.1109/INFOMAN.2018.8392814.

[61] Wikipedia. "Support-vector machine." https://en.wikipedia.org/wiki/Support-vector_machine (accessed 2019).

[62] M. Jones - Jang et al., A computational approach for examining the roots and spreading patterns of fake news: Evolution tree analysis. 2018, pp. 103-113.

[63] M. Verstraete, D. E. Bambauer, and J. R. Bambauer, Identifying and Countering Fake News. 2017.

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

90

[64] A. Zubiaga, M. Liakata, R. Procter, G. Wong Sak Hoi, and P. Tolmie, Analysing How People Orient to and Spread Rumours in Social Media by Looking at Conversational Threads. 2016.

[65] S. K. a. M. Chen, "Identifying Tweets with Fake News," presented at the 2018 IEEE International Conference on Information Reuse and Integration (IRI), Salt Lake City, UT, USA, 2018. [Online]. Available: doi.ieeecomputersociety.org/10.1109/IRI.2018.00073.

[66] C. Buntain and J. Golbeck, "Automatically Identifying Fake News in Popular Twitter Threads," in 2017 IEEE International Conference on Smart Cloud (SmartCloud), 3-5 Nov. 2017 2017, pp. 208-215, doi: 10.1109/SmartCloud.2017.40.

[67] Y. Qin, W. Dominik, and C. Tang, "Predicting Future Rumours," Chinese Journal of Electronics, vol. 27, no. 3, pp. 514-520, 2018, doi: 10.1049/cje.2018.03.008.

[68] N. Conroy, V. Rubin, and Y. Chen, "Automatic Deception Detection: Methods for Finding Fake News," in ASIS&T2015, St. Louis, MO, USA, 2015, 2015. [Online]. Available: https://www.researchgate.net/publication/281818865_Automatic_Deception_Detection_Methods_for_Finding_Fake_News. [Online]. Available: https://www.researchgate.net/publication/281818865_Automatic_Deception_Detection_Methods_for_Finding_Fake_News

[69] L. Krzysztof, S.-W. Jacek, J.-L. Michal, and G. Amit, "Automated Credibility Assessment on Twitter," Computer Science, vol. 16, no. 2, 2015, doi: 10.7494/csci.2015.16.2.157.

[70] M. Thandar and S. Usanavasin, "Measuring Opinion Credibility in Twitter," in Recent Advances in Information and Communication Technology 2015, Cham, H. Unger, P. Meesad, and S. Boonkrong, Eds., 2015// 2015: Springer International Publishing, pp. 205-214.

[71] D. Wang, L. Kaplan, T. Abdelzaher, and C. C. Aggarwal, "On Credibility Estimation Tradeoffs in Assured Social Sensing," IEEE Journal on Selected Areas in Communications, vol. 31, no. 6, pp. 1026-1037, 2013, doi: 10.1109/JSAC.2013.130605.

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

91

[72] S. T. Allaparthi, G. Yaparla, and V. Pudi, "Sentiment and Semantic Deep Hierarchical Attention Neural Network for Fine Grained News Classification," in 2018 IEEE International Conference on Big Knowledge (ICBK), 17-18 Nov. 2018 2018, pp. 65-72, doi: 10.1109/ICBK.2018.00017.

[73] O. Ajao, D. Bhowmik, and S. Zargari, Fake News Identification on Twitter with Hybrid CNN and RNN Models. 2018.

[74] D. Berkowitz and D. A. Schwartz, "Miley, CNN and The Onion," Journalism Practice, vol. 10, no. 1, pp. 1-17, 2016/01/02 2016, doi: 10.1080/17512786.2015.1006933.

[75] S. Gilda, "Evaluating machine learning algorithms for fake news detection," in 2017 IEEE 15th Student Conference on Research and Development (SCOReD), 13-14 Dec. 2017 2017, pp. 110-115, doi: 10.1109/SCORED.2017.8305411.

[76] I. P. Benitez, A. M. Sison, and R. P. Medina, "An improved genetic algorithm for feature selection in the classification of Disaster-related Twitter messages," in 2018 IEEE Symposium on Computer Applications & Industrial Electronics (ISCAIE), 28-29 April 2018 2018, pp. 238-243, doi: 10.1109/ISCAIE.2018.8405477.

[77] S. Girgis, E. Amer, and M. Gadallah, "Deep Learning Algorithms for Detecting Fake News in Online Text," in 2018 13th International Conference on Computer Engineering and Systems (ICCES), 18-19 Dec. 2018 2018, pp. 93-97, doi: 10.1109/ICCES.2018.8639198.

[78] J. Hale, "Smarter Ways to Encode Categorical Data for Machine Learning Exploring Category Encoders," TowardsDataScience, 2018. [Online]. Available: https://towardsdatascience.com/smarter-ways-to-encode-categorical-data-for-machine-learning-part-1-of-3-6dca2f71b159.

[79] S. Krishnan and M. Chen, "Identifying Tweets with Fake News," presented at the 2018 IEEE International Conference on Information Reuse and Integration (IRI), 2018.

[80] S. H. a. H. Paulheim, "Weakly Supervised Learning for Fake News Detection on Twitter," in 2018 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM), Barcelona, Spain, 2018, vol. 00, pp. 274-277, doi: 10.1109/ASONAM.2018.8508520.

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

บรรณานกรม

บรรณานกรม

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

31

79

41

25

91

CU iThesis 5771425821 dissertation / recv: 15072562 10:01:25 / seq: 10

ประวตผเขยน

ประวตผเขยน

ชอ-สกล สปญญา อภวงศโสภณ วฒการศกษา วท.บ. (วทยาการคอมพวเตอร) มหาวทยาลยหวเฉยวเฉลมพระเกยรต

วท.ม. (วทยาการสารสนเทศ) สถาบนเทคโนโลยพระจอมเกลา เจาคณทหารลาดกระบง วศ.ด. (วศวกรรรมคอมพวเตอร) จฬาลงกรณมหาวทยาลย (ก าลงศกษา)

ทอยปจจบน 37/3 หมท 17 ต าบลคลองนครเนองเขต อ าเภอเมอง จงหวดฉะเชงเทรา ผลงานตพมพ S. Aphiwongsophon and P. Chongstitvatana, "Detecting Fake

News with Machine Learning Method," 2018 15th International Conference on Electrical Engineering/Electronics, Computer, Telecommunications and Information Technology (ECTI-CON), Chiang Rai, Thailand, 2018, pp. 528-531. doi: 10.1109/ECTICon.2018.8620051

31

79

41

25

91