การพัฒนาแบบจำลองปัจจัยที่มีผลต่อการเป็นโรคเบาหวานด้วยเทคนิคต้นไม้ตัดสินใจ
คำสำคัญ:
โรคเบาหวาน, เหมืองข้อมูล, ต้นไม้ตัดสินใจ, อัลกอริทึมเจสี่สิบแปดบทคัดย่อ
โครงงานนี้มีวัตถุประสงค์เพื่อพัฒนาแบบจำลองของปัจจัยที่มีผลต่อการเป็นโรคเบาหวานด้วยเทคนิคเหมืองข้อมูลแบบต้นไม้ตัดสินใจเพื่อช่วยในการวิเคราะห์หาแบบจำลองของปัจจัยที่มีผลต่อการเป็นโรคเบาหวาน ปัจจัยเสี่ยงที่มีผลต่อการเกิดโรคเบาหวานถือเป็นสารสนเทศที่มีความสำคัญที่จะช่วยให้หน่วยงานทางด้านการแพทย์นำไปใช้สำหรับวางแผนกลยุทธ์ กลุ่มเป้าหมายในการดำเนินงานวิจัยใช้ข้อมูลผู้เข้ารับบริการที่โรงพยาบาลด่านขุนทด จังหวัดนครราชสีมา ระหว่างปี 2550 – 2555 จำนวนทั้งสิ้น 4,402 ราย แบ่งข้อมูลสำหรับฝึกและทดสอบแบบจำลองออกเป็นร้อยละ 90:10 ตามลำดับ พัฒนาแบบจำลองด้วยอัลกอริทึมเจสี่สิบแปด ซึ่งเป็นเทคนิคแบบต้นไม้ตัดสินใจ ประเมินประสิทธิภาพของแบบจำลองด้วยค่าความแม่นตรง ผลการวิจัยพบว่าแบบจำลองที่พัฒนาให้ประสิทธิภาพที่มีค่าความแม่นตรง 76.14% และสามารถสร้างกฎการจำแนกจากต้นไม้ตัดสินใจทั้งสิ้น 97 กฎ ซึ่งพบว่าปัจจัยเสี่ยงที่อาจก่อให้เกิดโรคเบาหวาน ได้แก่ อายุ เพศ สถานะภาพ ที่อยู่ อาชีพ ประวัติความดันโลหิตเกินมาตรฐาน ประวัติค่าดัชนีมวลกายเกินมาตรฐาน พฤติกรรมการสูบบุหรี่ พฤติกรรมการดื่มสุรา และประวัติครอบครัวเป็นเบาหวาน
References
กิตติพล วิแสง, สิรภัทร เชี่ยวชาญวัฒนา และคำรณ สุนัติ. (2552). การวิเคราะห์ปัจจัยเสี่ยงต่อโรคเบาหวาน. วิทยานิพนธ์ปริญญาโท. เทคโนโลยีสารสนเทศ. มหาวิทยาลัยขอนแก่น.
กิตติศักดิ์ สุมามาลย์. การคัดกรองสุขภาพเบื้องต้นโดยใช้เทคนิคเหมืองข้อมูล [สารนิพนธ์วิทยาศาสตร์มหาบัณฑิต].กรุงเทพฯ: มหาวิทยาลัยธุรกิจบัณฑิต; 2555. หน้า 1.
ชนวัตน์ ศรีสอ้าน. (2550). ฐานข้อมูล คลังข้อมูลและเหมืองข้อมูล. กรุงเทพมหานคร : บริษัท เอเชียดิจิตอล จำกัด. ประเทศไทย.
พวงทิพย์ แท่นแสง. (2550). การทดสอบประสิทธิภาพการทำงานของอัลกอริทึมไมนิ่งกฏสำหรับจำแนก. วิทยานิพนธ์วิทยาศาสตรมหาบัณฑิต บัณฑิตวิทยาลัย สถาบันเทคโนโลยีพระจอมเกล้าพระนครเหนือ.
เอกสิทธิ์ พัชรวงศ์ศักดา. 2557. การแบ่งข้อมูลเพื่อทดสอบประสิทธิภาพของโมเดล. สืบค้นจาก: http:// dataminingtrend.com/2014/data-mining-techniques/ cross-validation/.
Bhargava, N., Sharma, G., Bhargava, R., and Mathuria, M. (2013). Decision tree analysis on j48 algorithm for data mining. Proceedings of International Journal of Advanced Research in Computer Science and Software Engineering, 3(6).
Dunham, M. H. (2006). Data mining: Introductory and advanced topics. Pearson Education India.
Patil, T. R. and Sherekar, S. S. (2013). Performance analysis of Naive Bayes and J48 classification algorithm for data classification. International Journal of Computer Science and Applications, 6(2), 256-261.
Quinlan, J. R. (1993). C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers.
Sharma, A. K. and Sahni, S. (2011). A comparative study of classification algorithms for spam email data analysis. International Journal on Computer Science and Engineering, 3(5), 1890-1895.
Zorman, M., Masuda, G., Kokol, P., Yamanoto and R., Stiglic, B. (2002). Mining Diabetes Database with Decision Trees and Association Rules. In Computer-Based Medical Systems, 2002. (CBMS 2002). Proceedings of the 15th IEEE Symposium, 134-139.