การจำแนกความน่าเชื่อถือของเนื้อหาในเว็บไซต์ภาษาไทยด้านมะเร็งโดยใช้ CancerDic+

Main Article Content

สุภาพร เกิดกิจ
องอาจ อุ่นอนันต์
พยุง มีสัจ

บทคัดย่อ

- ปัจจุบันจำนวนเว็บไซต์ที่ให้ความรู้ด้านมะเร็งมีอยู่เป็นจำนวนมาก ทำให้ผู้ใช้งานเข้าถึงข้อมูลได้อย่างสะดวกและมีปริมาณมากแต่จะทราบได้อย่างไรว่าเนื้อหาบนเว็บไซต์นั้นมีความน่าเชื่อถือหรือไม่ งานวิจัยนี้จึงมีวัตถุประสงค์ในการจำแนกความน่าเชื่อถือของเนื้อหาภายในเว็บไซต์ด้านมะเร็ง เพื่อแยกประเภทของเนื้อหาเว็บไซต์ที่มีความน่าเชื่อถือและไม่น่าเชื่อถือ ซึ่งงานวิจัยนี้นำเสนอ CancerDic+ เพื่อใช้ในการสกัดคำ โดยมีการเพิ่มข้อมูลคำศัพท์เฉพาะด้านเกี่ยวกับมะเร็งและใช้เหมืองข้อมูล (Text Mining) ทำการจำแนกข้อมูล โดยมีการเปรียบเทียบค่าความถูกต้อง (Accuracy) ค่าความแม่นยำ (Precision) และค่าความครบถ้วน (Recall) ของการจำแนกความน่าเชื่อถือของเนื้อหาที่ผ่านเครื่องมือสกัดคำจาก Lexto SWATH และ CancerDic+ ซึ่งผลการจำแนกความน่าเชื่อถือของเนื้อหาภายในเว็บไซต์พบว่าการทำเหมืองข้อมูลโดยใช้ CancerDic+ สกัดคำให้ผลการจำแนกได้ดีที่สุด (Accuracy = 0.844, Precision = 0.838, Recall =0.845) ซึ่งสามารถนำไปประยุกต์ใช้งานอื่นได้อย่างมีประสิทธิภาพ

Article Details

รูปแบบการอ้างอิง
[1]
เกิดกิจ ส., อุ่นอนันต์ อ., และ มีสัจ พ., “การจำแนกความน่าเชื่อถือของเนื้อหาในเว็บไซต์ภาษาไทยด้านมะเร็งโดยใช้ CancerDic+”, JIST, ปี 5, ฉบับที่ 2, น. 34–43, ธ.ค. 2015.
ประเภทบทความ
บทความวิจัย Soft Computing: