Predicting Diabetes Mellitus by Using Data Mining Techniques
Main Article Content
Abstract
This research aims to 1) develop a model for diabetic patient prognosis using data mining techniques and 2) compare the performance of the most suitable model for diabetic patient prognosis to create a prognostic model. Furthermore, compare the performance measures of data classification by the Accuracy (Accuracy) that gives the highest value. The sample used in this study was 300 items of patients who received screening for diabetes and 100 items of patients with diabetes, totaling 400 items. The research tools were questionnaires, and data were analyzed through the Waikato Environment for Knowledge Analysis program using multilayer perceptron, Naive Bay, logistics techniques Random Forest Technique, and decision tree technique. The research instruments tools include accuracy, precision, recall, F-measure, and ROC curve.
The results showed that the Random Forest technique gave the highest accuracy in predicting the outcome of diabetes at 99.75% with a precision of 98.50%. The Recall was 98.50%. The overall efficiency measurement (F-Measure) was 98.50%, and the curve value (ROC) was 95.20%. The results of this research could be applied in treating diabetic patients in the future.
Article Details

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
References
สมาพันธ์เบาหวานนานาชาติ (International Diabetes Federation). 2560. สมาพันธ์เบาหวานนานาชาติ ประเมินทั่วโลกมีผู้ป่วย
เบาหวาน 425 ล้านราย Hfocus.Org เจาะลึกระบบสุขภาพ. จาก https://www.hfocus.org/content/ 2019/11/18054
ฉวีวรรณ ศรีดาวเรือง และจิราพร วรวงศ์. (2565). ความสัมพันธ์ระหว่างความรอบรู้ด้านสุขภาพกับพฤติกรรมสุขภาพตามหลัก 3
อ. 2ส. ของผู้สูงอายุที่ป่วยเป็นโรคเบาหวานชนิดที่ 2. วารสารศูนย์อนามัยที่ 9, 9(2), 456–456.
จรรยา สุนทรปกาสิต และขณัฏฐา เพียงแก้ว. (2561). การพัฒนารูปแบบการส่งเสริมสุขภาพเชิงรุกเพื่อป้องกันการเกิด
โรคเบาหวานรายใหม่ใน. วารสารวิชาการสำ นักงานสาธารณสุขจังหวัดมหาสารคาม, 2(3), 1-14.
กองโรคไม่ติดต่อ กรมควบคุมโรค กระทรวงสาธารณสุข. (2564). กองโรคไม่ติดต่อ กรมควบคุมโรค กระทรวงสาธารณสุข.
จาก http://www.thaincd.com/2016/mission/documents.php?tid=32&gid=1-020
กมลพร สิริคุตจตุพร, วิราพรรณ วิโรจน์รัตน์ และนารีรัตน์ จิตรมนตรี. (2560). ปัจจัยทำนายพฤติกรรมการจัดการตนเองของ
ผู้สูงอายุโรคเบาหวานชนิดที่ 2. วารสารสภาการพยาบาล, 32(1), 81–93. จาก https://he02.tci- thaijo.org/index.php/TJONC/article/view/82615
population/pop-all/changwat?year=2017&cw=44
กระทรวงสาธารณสุข กรมอนามัย. (2561). อัตราผู้ป่วยเบาหวานรายใหม่จากกลุ่มเสี่ยงเบาหวาน เขตฯ 07. จาก
http://healthkpi.moph.go.th/kpi2/kpi/index/?id=957&kpi_year=2561&lv=2&z=07
สุภาภรณ์ ตันตินันทตระกูล. (2555). เบาหวาน....ถ้ารู้ทัน...ก็ไร้เสี่ยง. วารสารวิชาการมหาวิทยาลัยการกีฬาแห่งชาติ, 4(2),
–36. จาก https://he02.tci-thaijo.org/index.php/TNSUJournal/article/view/254484
วิบล ญึก และจารี ทองคํา. (2561). การเปรียบเทียบเทคนิคอนุกรมเวลาเพื่อพยากรณ์ราคาทองและราคาน้ำมัน. วารสาร มทร.
อีสาน ฉบับวิทยาศาสตร์และเทคโนโลยี, 11(2), 157–58.
สายชล สินสมบูรณ์ทอง. (2563). การเปรียบเทียบประสิทธิภาพในการทำนายผลความไม่สมดุลของข้อมูลในการจำแนกด้วยเทคนิคการ
ทำเหมืองข้อมูล. วารสารวิทยาศาสตร์และเทคโนโลยี, 28(3), 387–88.
จุฑาทิพย์ ทิพย์พูล และนิเวศ จิระวิชิตชัย. (2559). การจำแนกจดหมายอิเล็กทรอนิกส์ที่เป็นสแปมโดยใช้เทคนิคเหมืองข้อมูล.
วารสาร มทร. วิทยาศาสตร์และเทคโนโลยี, 6(1), 104–5.
พิพัฒน์ ลิ้มประไพพงษ์ และสมชาย เล็กเจริญ. (2560). ศึกษาปัจจัยที่ส่งผลต่อคะแนนการประเมินคุณภาพภายในระดับคณะ
ของมหาวิทยาลัยรังสิต โดยใช้เทคนิคเหมืองข้อมูล. การประชุมวิชาการระดับชาติ มหาวิทยาลัยรังสิต ประจำปี ๒๕๐ (RSU
National Research Conference, 2017), 109–10.
อนัตต์ชัย ชุติภาสเจริญ และจรัญ แสนราช. (2561). การเปรียบเทียบประสิทธิภาพของอัลกอริทึมและการคัดเลือกคุณลักษณะที่
เหมาะสมเพื่อการพยากรณ์โอกาศความสำเร็จในการโอนเงินข้ามประเทศของบุคคลทั่ว. วารสารวิจัย มหาวิทยาลัยขอนแก่น (ฉบับ
บัณฑิตศึกษา) สาขามนุษยศาสตร์และสังคมศาสตร์, 6(3), 105–6.
สุรวัชร ศรีเปารยะ และสายชล สินสมบูรณ์ทอง. (2560). การเปรียบเทียบประสิทธิภาพวิธีการจำแนกกลุ่มการเป็นโรคไตเรื้อรัง :
กรณีศึกษาโรงพยาบาลแห่งหนึ่งในประเทศอินเดีย. วารสารวิทยาศาสตร์และเทคโนโลยี, 25(5), 845–46. จาก
https://li01.tci-thaijo.org/index.php/tstj/article/view/85101
กัลยา บุญหล้า และวรวุฒิ มหาโพธิ์. (2565). การจำแนกคุณภาพน้ำในประเทศไทยโดยใช้เทคนิคเหมืองข้อมูล. วารสาร
วิทยาศาสตร์และเทคโนโลยี, 30(5), 29–30. จาก https://li01.tci-thaijo.org/index.php/tstj/article/view/255032
ปริยานุช ประเสริฐสิริกุล, ศิริสรรพ เหล่าหะเกียรติ, เรืองศักดิ์ ตระกูลพุทธิรักษ์ และศศิวิมล สุขพัฒน. (2565). การเปรียบเทียบ
ประสิทธิภาพแบบจำลองการทำนายผลการเรียนของนิสิตที่ใช้งาน ระบบการจัดการเรียนรู้ออนไลน์ด้วยการเรียนรู้ขอเครื่อง. วารสาร
วิทยาศาสตร์และเทคโนโลยีมหาวิทยาลัยราชภัฏบุรีรัมย์, 6(1), 81–82.
จาก https://ph02.tci-thaijo.org/index.php/scibru/article/view/245527
ธนัท จรณะสมบูรณ์. (2561). การทำนายการซื้อซ้ำของผู้ซื้อโดยใช้เทคนิคการเรียนรู้ของเครื่องจักร. บัณฑิตวิทยาลัย
มหาวิทยาลัยศรีนครินทรวิโรฒ, 4–5.
อัครพล พลูสวัสดิ์ และจรัญ แสนราช. (2562). การศึกษาเทคนิคพยากรณ์การได้รับปัจจัยพื้นฐานนักเรียนยากจนของนักเรียน
โรงเรียนวัดพระขาว (ประชานุเคราะห์) ด้วยเทคนิคเหมืองข้อมูล. วารสารวิทยาศาสตร์ แห่งมหาวิทยาลัยราชภัฏเพชรบุรี, 16(2), 6–7.
สุภัสสรา สมเจตนา และจารี ทองคำ. (2564). การเปรียบเทียบประสิทธิภาพเทคนิคเหมืองข้อมูลในการสร้างแบบจำลองเพื่อจำแนก
ความคิดเห็นของผู้ปกครองต่อการใช้สมาร์ทโฟนของบุตร. วารสารวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัย อุบลราชธานี, 23(1),
–27.
ภูมิพัฒน์ ดวงกลาง และรัจนา เครือแก้ว. (2562). แบบจำลองการทำนายแบบอากาศยานจากข้อมูลเป้าหมายไม่ทราบฝ่าย
อัตโนมัติ. วารสารวิทยาศาสตร์และเทคโนโลยีนายเรืออากาศ, 15, 3–4.
อัชฌาพร กว้างสวาสดิ์ เพียงฤทัย หนูสวัสดิ์, วราลี คงเหมาะ, ปวีณา ทิพยากุลรักษ์ และบุษกร สังขนันท์. (2562). ระบบการ
ทำนายระดับความเครียดโดยใช้แผนผังการตัดสินใจ. Rattanakosin Journal of Science and Technology, 1(2), 13–26. จาก https://ph02.tci-thaijo.org/index.php/RJST/article/view/239865
นพรัตน์ นนท์ศิริ, พิศณุ ชัยจิตวณิชกุล และกริช สมกันธา. (2565). การจำแนกข้อมูลเพื่อวินิจฉัยความเสี่ยงการเป็นโรคเบาหวาน
โดยใช้เทคนิค วิธีแบบร่วมกันตัดสินใจและวิธีเลือกคุณลักษณะเด่นไปข้างหน้า. วารสารวิทยาศาสตร์และเทคโนโลยี
มหาวิทยาลัยราชภัฏอุดรธานี, 10(2), 107–22. จาก https://ph01.tci-thaijo.org/index.php/scudru/
article/view/245642
เพชรรัตน์ ม่วงน้อย, จักรพันธ์ พลาผล, ภรัณยา ปาลวิสุทธิ์ และสาขาวิชาเทคโนโลยี สารสนเทศ. (2564). ตัวแบบประเมินภาวะความ
เสี่ยงการเป็นโรคซึมเศร้าของนักศึกษาด้วยเทคนิคเหมืองข้อมูล. วารสารวิชาการการประยุกต์ใช้เทคโนโลยีสารสนเทศ, 7(1).
นงเยาว์ ในอรุณ. (2564). การเปรียบเทียบประสิทธิภาพของแบบจำลองการทำนายความเสี่ยงโรคหัวใจ และหลอดเลือดโดยใช้
อัลกอริทึมเหมืองข้อมูล Efficiency Comparison of Cardiovascular Risk Prediction Models Using Data Mining
Algorithms ผู้ช่วยศาสตราจารย์ , สาขาวิชาเทคโนโลยีสารสนเทศ คณะวิทยาศาสตร์ และเทคโนโลยี มหาวิทยาลัยราชภัฏ
พระนครศรีอยุธยา, จังหวัดพระนครศรี อยุธยา 13000. วารสารวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยมหาสารคาม, 40(2).
รุ่งโรจน์ บุญมา และนิเวศ จิระวิชิตชัย. (2562). การจำแนกประเภทผู้ป่วยโรคเบาหวานโดยใช้เทคนิคเหมืองข้อมูล และการเลือก
คุณลักษณะจากความสัมพันธ์ของข้อมูล. PKRU SciTech Journal, 3(2), 11–19. จาก https://ph01.tci-
thaijo.org/index.php/pkruscitech/article/view/201722
อิทธิพล ดวงแก้ว และสายัญ สายยศ. (2562). การวิเคราะห์ปัจจัยที่ส่งผลต่อพัฒนาการล่าช้าตามอายุของเด็กปฐมวัยด้วยเทคนิค
เหมืองข้อมูล. วารสารวิทยาศาสตร์และเทคโนโลยีสารสนเทศ (JIST), 9(2), 44-55.
ณัฐวดี หงษ์บุญมี และประภาสิริ ตรีพาณิชกุล. (2562). การเปรียบเทียบประสิทธิภาพการจำแนกข้อมูลเพื่อวิเคราะห์ปัจจัยความ
เสี่ยงที่ส่งผลต่อการเกิดโรคไฮเปอร์ไทรอยด์ด้วยเทคนิคเหมืองข้อมูล. วารสารวิทยาศาสตร์และเทคโนโลยีสารสนเทศ, 9(1), 41-51.
วนิดา พงษ์สงวน, ทิพยา ถินสูงเนิน และมาโนช ถินสูงเนิน. (2561). การพัฒนาแบบจำลองปัจจัยที่มีผลต่อการเป็นโรคเบาหวาน
ด้วยเทคนิคต้นไม้ตัดสินใจ. วารสารวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราชภัฏมหาสารคาม, 1(1), 1-8.
จารี ทองคำ, วาทินี สุขมาก และภีมพศ สุขมาก. (2561). การเปรียบเทียบประสิทธิภาพของเทคนิค Apriori และ FP-Growth ในการ
สร้างกฎความสัมพันธ์ของโรคมะเร็งต่อมลูกหมาก Performance Comparison of Apriori and FP-Growth Techniques in
Generating Association Rules to Prostate Cancer. วารสารวิทยาการสารสนเทศและเทคโนโลยี ประยุกต์, 1(2), 103-111.
ณัฐพล แสนคำ, ธนากร ปุรารัมย์ และทิพวัลย์ แสนคำ. (2560). ระบบสนับสนุนทางการแพทย์สำหรับคัดกรองผู้ป่วยโรคไตเรื้อรัง
โดยใช้เทคนิคเหมืองข้อมูล.” วารสารวิชาการ โรงเรียนนายร้อยพระจุลจอมเกล้า 15(1): 161–70. จาก https://ph01.tci-
thaijo.org/index.php/crma-journal/article/view/243110
เบญจภัค จงหมื่นไวย์. (2558). การเปรียบเทียบปัจจัยโรคประจำตัวผู้สูงอายุโดยใช้อัลกอริทึมการจัดกลุ่ม J48 และ NaiveBayes
กรณีศึกษาสาธารณสุขโพธิ์กลางนครราชสีมา. วารสารโครงงานวิทยาการคอมพิวเตอร์และเทคโนโลยีสารสนเทศ, 1(2),
-51.
ปพนน์ศรณ์ สิ่วสําแดงเดช. (2565). การจําแนกผู้ป่วยเบาหวานโดยใช้เทคนิคการโหวตรวม กรณีศึกษา โรงพยาบาลศูนย์อุดรธานี.
(วิทยานิพนธ์ปริญญาวิศวกรรมศาสตรมหาบัณฑิต). มหาสารคาม: มหาวิทยาลัยมหาสารคาม.