Dealing with Imbalanced Data for Forecasting Model of Higher Education Selection of Grade 9 Students in Muang District Nakhonsawan Province
Main Article Content
บทคัดย่อ
Nowadays big data has become more and more active because most organisations need to review their organisational performance in the past years and to seek impact factors both strengths and weaknesses for problem solving, operation plan and organisational development including the future prediction. A problem of big data is imbalanced data resulting in less predictive accuracy. Therefore, the study aims to create a proper model of multinomial logistic regression and to compare the predictive accuracy of the models between imbalanced data and balanced data using random over-sampling method and random under-sampling for correcting the data balancing. A real dataset of higher education selection of grade 9 students in Nakhonsawan, 2,692 students, was applied. It was found that main impact factor on students’ decision was demographic. Moreover, the results revealed that the accuracy of forecasting models were more than 60% whereas the predictive accuracy of balanced data was better than another.
Article Details
ข้อความภายในบทความที่ตีพิมพ์ในวารสารทั้งหมด รวมถึงรูปภาพประกอบ ตาราง เป็นลิขสิทธิ์ของมหาวิทยาลัยเทคโนโลยีราชมงคลรัตนโกสินทร์ การนำเนื้อหา ข้อความหรือข้อคิดเห็น รูปภาพ ตาราง ของบทความไปจัดพิมพ์เผยแพร่ในรูปแบบต่าง ๆ เพื่อใช้ประโยชน์ในเชิงพาณิชย์ ต้องได้รับอนุญาตจากกองบรรณาธิการวารสารอย่างเป็นลายลักษณ์อักษร
มหาวิทยาลัยฯ อนุญาตให้สามารถนำไฟล์บทความไปใช้ประโยชน์และเผยแพร่ต่อได้ โดยต้องแสดงที่มาจากวารสารและไม่ใช้เพื่อการค้า
ข้อความที่ปรากฏในบทความในวารสารเป็นความคิดเห็นส่วนตัวของผู้เขียนแต่ละท่านไม่เกี่ยวข้องกับราชวิทยาลัยจุฬาภรณ์ และบุคลากร คณาจารย์ท่านอื่น ๆ ในมหาวิทยาลัยฯแต่อย่างใด ความรับผิดชอบองค์ประกอบทั้งหมดของบทความแต่ละเรื่องเป็นของผู้เขียนแต่ละท่าน หากมีความผิดพลาดใด ๆ ผู้เขียนแต่ละท่านจะรับผิดชอบบทความของตนเอง ตลอดจนความรับผิดชอบด้านเนื้อหาและการตรวจร่างบทความเป็นของผู้เขียน ไม่เกี่ยวข้องกับกองบรรณาธิการ
เอกสารอ้างอิง
[2] Kesornsit W., Lorchirachoonkul V. and Jitthavech J.(2018).Imbalanced Data Problem Solving in Classification of Diabetes Patients.Master thesis, M.S., Khon Kaen University, Khon Kaen.
[3] Chomnok P. and Yanwiset C. Secondary education. Retrieved May 28, 2020, from https://sites.google.com/site/fihakhwamru/kar-suksa-radab-mathymsuksa
[4] Institute for the Promotion of Teching Science and Technology.Different school sizes. Retrieved January 11, 2021, from https://pisathailand.ipst.ac.th/issue-2019-41/?fbclid=IwAR0-Q-XWo8GA83wUPJXvEWHr7DQVtpEJwq2A6XzI0rgAWAxiEg7-3d4KVJg
[5] Bureau of information and communication technology and Office of the permanent secretary ministry of education. (2007-2019). Statistics on further study selection of Mathayomsuksa 3 students. Retrieved May 28, 2020, from http://www.bict.moe.go.th/2020/index.php
[6] Nakhonsawan Provincial Statistical Office. (2018-2019). Nakhon Sawan Provincial Statistical Report. Retrieved May 30, 2020, from http://nksawan.nso.go.th/index.php?option=com_content&view=article&id=335&Itemid=507
[7] Tongpool P., Jamrueng P., Boonrit R. and Sinsomboonthong S. Performance Comparison in Predietion of Imbalanced Data in Data Mining Classification. Master thesis, King Mongkut’s Institute of Technology Ladkrabang, Bangkok.
[8] Woraphongsathorn T. (4/2/2018). Multiple Logistic Regression Analysis. Retrieved May 30, 2020, from http://oec.anamai.moph.go.th/download/OEC_2016/MEETTING2561/APRIL2561/2_5April2561/6-Multiple%20Logistic%20Regression%20Analysis.pdf
[9] Poosumpa S., Sathongkhao P. and Supprasert T. Forecasting Model for the Number of Grade 9 Students Who Intend to Study the Upper Secondary Level in Science, Muang District, Nakhonsawan Province