การเปรียบเทียบประสิทธิภาพการจำแนกประเภทข้อมูลความเสี่ยงการเป็นโรคไต ด้วยเทคนิคการทำเหมืองข้อมูล
คำสำคัญ:
โรคไต, โครงข่ายประสาทเทียม, การเรียนรู้แบบเบย์, ต้นไม้ตัดสินใจ, การเรียนรู้ของเครื่องมือแบบมีผู้สอนบทคัดย่อ
งานวิจัยนี้มีวัตถุประสงค์เพื่อนำเทคนิคการเหมืองข้อมูลแบบการจำแนกประเภทข้อมูลมาประยุกต์ใช้ในการทำนายความเสี่ยงการเป็นโรคไต พร้อมทั้งเปรียบเทียบประสิทธิภาพ เพื่อให้ได้อัลกอริทึมที่มีประสิทธิภาพเหมาะสมที่สุด โดยใช้อัลกอริทึม 3 เทคนิค คือ โครงข่ายประสาทเทียม ต้นไม้ตัดสินใจ และการเรียนรู้แบบเบย์ ชุดข้อมูลที่ใช้ในการวิจัยคือ ชุดข้อมูลระยะเริ่มต้นของโรคไตเรื้อรัง จากฐานข้อมูล UCI Machine Learning มีจำนวนข้อมูล 400 ชุดข้อมูล ปัจจัยสำหรับการวิเคราะห์ 24 ปัจจัย และเปรียบเทียบประสิทธิภาพของแบบจำลองด้วยวิธี 10-Fold Cross Validation โดยเครื่องมือในการวิจัยครั้งนี้ใช้ Scikit-Learn Library ของภาษา Python ผลการวิจัยพบว่า การจำแนกประเภทข้อมูลโดยใช้แบบจำลองจากเทคนิคต้นไม้ตัดสินใจ มีประสิทธิภาพเหมาะสมที่สุด ที่ค่าความถูกต้อง 98.47% ค่าความแม่นยำ 98.33% ค่าความระลึก 99.16% และค่าความถ่วงดุล 98.73% และให้กฎการตัดสินใจ จำนวน 5 กฎ ที่ควรนำไปพัฒนาเว็บแอปพลิเคชันเพื่อการวินิจฉัยโรคเบื้องต้นเกี่ยวกับความเสี่ยงการเกิดโรคไตได้
References
ณัฐวดี หงษ์บุญมี และประภาสิริ ตรีพาณิชกุล. (2562). การเปรียบเทียบประสิทธิภาพการจำแนกข้อมูลเพื่อวิเคราะห์ปัจจัยความเสี่ยงที่ส่งผลต่อการเกิดโรคไฮเปอร์ไทรอยด์ด้วยเทคนิคเหมืองข้อมูล. วารสารวิทยาศาสตร์และเทคโนโลยีสารสนเทศ, 9(1), 41-51.
ทวี ศิลารักษ์, สัฆวี ปิยะปัณฑิตกุล, และวิริณธิ์ กิตติพิชัย. (2563). ปัจจัยทำนายการเกิดโรคไตเรื้อรังในผู้ป่วยโรคเบาหวานในจังหวัดศรีสะเกษ. วารสารพยาบาลสงขลานครินทร์, 40(2), 109-121.
นงเยาว์ ในอรุณ. (2564). การเปรียบเทียบประสิทธิภาพของแบบจำลองการทำนายความเสี่ยงโรคหัวใจและหลอดเลือดโดยใช้อัลกอริทึมเหมืองข้อมูล. วารสารวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยมหาสารคาม, 40(2), 137-147.
ปริญญา สงวนสัตย์. (2562). Artificial Intelligence with Machine Learning, AI สร้างได้ด้วยแมชชีนเลิร์นนิ่ง. นนทบุรี: ไอดีซี พรีเมียร์.
โรงพยาบาลพระรามเก้า. (2563). โรคไตเรื้อรัง. ค้นจาก https://www.praram9.com/โรคไตเรื้อรัง-2
วิทยา พรพัชรพงศ์. (2555). โครงข่ายประสาทเทียม (Artificial Neural Networks - ANN). ค้นจาก https://www.gotoknow.org/posts/163433
สุพัฒน์ วาณิชย์การ. (2554). ปัจจัยเสี่ยงต่อการเป็นโรคไต. วารสารมูลนิธิโรคไตแห่งประเทศไทย, 25(49), 14-17.
อุกฤษฏ์ ศรีสุข. (2564). การเปรียบเทียบประสิทธิภาพของเทคนิคเหมืองข้อมูลสำหรับอุบัติการณ์ของผู้ป่วย. วารสารวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยมหาสารคาม, 40(2), 157-163.
IBM. (2020). What are neural networks. Retrieved from https://www.ibm.com/cloud/learn/neural-networks
MastersInDataScience. (2022). What Is a Decision Tree. Retrieved from https://www.mastersindatascience.org/learning/machine-learning-algorithms/decision-tree
Noyunsan, C., Katanyukul, T., and Saikaew, K. (2018). Performance evaluation of supervised learning algorithms with various training data sizes and missing attributes. Engineering and Applied Science Research, 45(3), 221–229.
World Kidney Day. (2022). What is chronic kidney disease. Retrieved from https://www.worldkidneyday.org/facts/chronic-kidney-disease/
Downloads
เผยแพร่แล้ว
ฉบับ
บท
License
Copyright (c) 2023 Loei Rajabhat University
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
บทความที่ได้รับการตีพิมพ์