Optimization Feature Selection for Classification of Manuscript Grouping

Authors

  • Yanapat Chuchuen

Keywords:

data mining, feature selection, classification

Abstract

Currently, data mining can be very useful to data computational, retrieve important and relevant information. Classification is a popular data mining function. The limitation of the classification model must use a feature selection to investigate with the real system. This paper, we used the Information Gain approach, which is the one method of feature selection, to improve performance Naïve Bayes and Decision Tree model for a manuscript grouping. The case study used 177 manuscripts from National Science Conference 4th which has 4 groups including mathematic healthcare computer science and other related fields. The results shown the Naïve Bayes model with information gain weight 0.03 has the best accuracy at 84% and 444 features. Moreover, the Decision Tree model with information gain weight 0.20 has accuracy only 60% and 9 features. Concluding, the Naïve Bayes classification method with the information gain method can apply the best classification model with this case study.

References

Kan Deng. (1998). OMEGA: ON-LINE MEMORY-BASED GENERAL PURPOSE SYSTEM CLASSIFIER. The Robotics Institute School of Computer Science Carnegie Mellon University Pittsburgh, PA 15213.

ก้องนาคินทร จรัญวุฒิวงศ และดวงรัตน โกยกิจเจริญ (2561). “การรับรูคุณภาพบริการที่สงผลตอการตัดสินใจเลือกใชบริการสายการบินตนทุนต่ำ ทาอากาศยานนานาชาติภูเก็ต.” ใน การประชุมวิชาการระดับชาติ มหาวิทยาลัยราชภัฏภูเก็ต ครั้งที่ 11. ภูเก็ต: มหาวิทยาลัยราชภัฏภูเก็ต, 739 – 746.

ธาดา หวังธรรมมั่ง เสกสรรสุวรรณมณี ธัชชัย เองฉ้วน และแสงสุรีย์ วสุพงศ์อัยยะ(2560). “การพัฒนาโปรแกรมช่วยจัดแผนการเลือกวิชาลงทะเบียนโดยใช้เทคนิคการ ค้นหาเฉพาะที่และรายการทาบู.” ใน วารสารมหาวิทยาลัยทักษิณ ปที่ 22, ฉบับที่ 2. สงขลา: มหาวิทยาลัยทักษิณ, 275 – 283.

นูรุลอีมาน เบ็งบูงอ ฮัสมะ เระดุมหลี กฤษณ์วรา รัตนโอภาส และยุพดี อินทส (2561). “การจําแนกโพสตเกมโดยใชเทคนิคเหมืองขอมูล : กรณีศึกษาการโพสต์บนเฟสบุ๊ค.” ใน การประชุมวิชาการระดับชาติ มหาวิทยาลัยราชภัฏภูเก็ต ครั้งที่ 11. ภูเก็ต: มหาวิทยาลัยราชภัฏภูเก็ต, 547 – 555.

เอกสิทธิ์ พัชรวงศ์ศักดา (2557). การวิเคราะห์ข้อมูลด้วยเทคนิคดาต้า ไมน์นิง เบื้องต้น. พิมพ์ครั้งที่ 1. กรุงเทพมหานคร : บริษัท เอเชีย ดิจิตอลการพิมพ์ จำกัด.

Downloads

Published

2020-09-13

How to Cite

Chuchuen, Y. (2020). Optimization Feature Selection for Classification of Manuscript Grouping. Journal of Science and Technology Songkhla Rajabhat University, 1(1), 55–66. Retrieved from https://ph02.tci-thaijo.org/index.php/SciAndTechSkru/article/view/241696

Issue

Section

Research Article