Optimization Feature Selection for Classification of Manuscript Grouping

Main Article Content

Yanapat Chuchuen

Abstract

Currently, data mining can be very useful to data computational, retrieve important and relevant information. Classification is a popular data mining function. The limitation of the classification model must use a feature selection to investigate with the real system. This paper, we used the Information Gain approach, which is the one method of feature selection, to improve performance Naïve Bayes and Decision Tree model for a manuscript grouping. The case study used 177 manuscripts from National Science Conference 4th which has 4 groups including mathematic healthcare computer science and other related fields. The results shown the Naïve Bayes model with information gain weight 0.03 has the best accuracy at 84% and 444 features. Moreover, the Decision Tree model with information gain weight 0.20 has accuracy only 60% and 9 features. Concluding, the Naïve Bayes classification method with the information gain method can apply the best classification model with this case study.

Downloads

Download data is not yet available.

Article Details

How to Cite
Chuchuen, Y. (2020). Optimization Feature Selection for Classification of Manuscript Grouping. ournal of cience and echnology ongkhla ajabhat niversity, 1(1), 55-66. etrieved from https://ph02.tci-thaijo.org/index.php/SciAndTechSkru/article/view/241696
Section
Research Article

References

Kan Deng. (1998). OMEGA: ON-LINE MEMORY-BASED GENERAL PURPOSE SYSTEM CLASSIFIER. The Robotics Institute School of Computer Science Carnegie Mellon University Pittsburgh, PA 15213.

ก้องนาคินทร จรัญวุฒิวงศ และดวงรัตน โกยกิจเจริญ (2561). “การรับรูคุณภาพบริการที่สงผลตอการตัดสินใจเลือกใชบริการสายการบินตนทุนต่ำ ทาอากาศยานนานาชาติภูเก็ต.” ใน การประชุมวิชาการระดับชาติ มหาวิทยาลัยราชภัฏภูเก็ต ครั้งที่ 11. ภูเก็ต: มหาวิทยาลัยราชภัฏภูเก็ต, 739 – 746.

ธาดา หวังธรรมมั่ง เสกสรรสุวรรณมณี ธัชชัย เองฉ้วน และแสงสุรีย์ วสุพงศ์อัยยะ(2560). “การพัฒนาโปรแกรมช่วยจัดแผนการเลือกวิชาลงทะเบียนโดยใช้เทคนิคการ ค้นหาเฉพาะที่และรายการทาบู.” ใน วารสารมหาวิทยาลัยทักษิณ ปที่ 22, ฉบับที่ 2. สงขลา: มหาวิทยาลัยทักษิณ, 275 – 283.

นูรุลอีมาน เบ็งบูงอ ฮัสมะ เระดุมหลี กฤษณ์วรา รัตนโอภาส และยุพดี อินทส (2561). “การจําแนกโพสตเกมโดยใชเทคนิคเหมืองขอมูล : กรณีศึกษาการโพสต์บนเฟสบุ๊ค.” ใน การประชุมวิชาการระดับชาติ มหาวิทยาลัยราชภัฏภูเก็ต ครั้งที่ 11. ภูเก็ต: มหาวิทยาลัยราชภัฏภูเก็ต, 547 – 555.

เอกสิทธิ์ พัชรวงศ์ศักดา (2557). การวิเคราะห์ข้อมูลด้วยเทคนิคดาต้า ไมน์นิง เบื้องต้น. พิมพ์ครั้งที่ 1. กรุงเทพมหานคร : บริษัท เอเชีย ดิจิตอลการพิมพ์ จำกัด.