การเปรียบเทียบประสิทธิภาพการจำแนกประเภทข้อมูลความเสี่ยงการเป็นโรคไต

ผู้แต่ง

  • นิพาดา ธงสันเทียะ สาขาวิชาคอมพิวเตอร์และเทคโนโลยีสารสนเทศ คณะเทคโนโลยีสารเทศ มหาวิทยาลัยราชภัฏร้อยเอ็ด
  • ก้องเกียรติ สุวรรณการ สาขาวิชาคอมพิวเตอร์และเทคโนโลยีสารสนเทศ คณะเทคโนโลยีสารเทศ มหาวิทยาลัยราชภัฏร้อยเอ็ด
  • ธีระศักดิ์ ยอดดี สาขาวิชาคอมพิวเตอร์และเทคโนโลยีสารสนเทศ คณะเทคโนโลยีสารเทศ มหาวิทยาลัยราชภัฏร้อยเอ็ด
  • ณัฐธิดา บุตรพรม สาขาวิชาคอมพิวเตอร์และเทคโนโลยีสารสนเทศ คณะเทคโนโลยีสารเทศ มหาวิทยาลัยราชภัฏร้อยเอ็ด

คำสำคัญ:

การวิเคราะห์ข้อมูลโรคไต, โครงข่ายประสาทเทียม, การเรียนรู้แบบเบย์, ต้นไม้ตัดสินใจ

บทคัดย่อ

งานวิจัยนี้มีวัตถุประสงค์เพื่อนําเทคนิคการทำเหมืองข้อมูลแบบการจําแนกประเภทข้อมูลมาประยุกต์ใช้ในการทํานายความเสี่ยงการเป็นโรคไต พร้อมทั้งเปรียบเทียบประสิทธิภาพ เพื่อให้ได้อัลกอริทึมที่มีประสิทธิภาพเหมาะสมที่สุด โดยใช้อัลกอริทึม 3 เทคนิค คือ โครงข่ายประสาทเทียม(Multilayer Perceptron) ต้นไม้ตัดสินใจ (Decision Tree) และการเรียนรู้แบบเบย์ (Bayesian Learning) ชุดข้อมูลที่ใช้ในการวิจัย คือชุดข้อมูลระยะเริ่มต้นของโรคไตเรื้อรัง จากฐานข้อมูล UCI dataset ปี ค.ศ. 2015 มีจำนวนข้อมูล 400 ชุดข้อมูล ปัจจัยสำหรับการวิเคราะห์ 25 ปัจจัย และเปรียบเทียบประสิทธิภาพของแบบจําลองด้วยวิธี 10-Fold Cross Validation โดยเครื่องมือในการวิจัยครั้งนี้ใช้ โปรแกรม Weka ผลวิจัยพบว่าชุดข้อมูลแบบโครงข่ายประสาทเทียมเป็นชุดข้อมูลที่เหมาะสมที่สุด โดยมีค่าความถูกต้อง 98.75% ค่าความแม่นยำ 98.80% ค่าความระลึก 98.80% และค่าความถ่วงดุล 99.90%

References

Akkarapon, P., & Nipaporn, C. (2023). Efficiency Comparison of Classification Methods for Kidney Disease with Data Mining Techniques. Journal of Science Engineering and Technology LOEI Rajabhat University, 3(1), 1-17. https://ph02.tci-thaijo.org/index.php/JSET/article/view/247493/168624

Friedman, N., Geiger, D., & Goldszmidt, M. (1997). Bayesian network classifiers. Machine learning, 29, 131-163. https://link.springer.com/content/pdf/10.1023/A:1007465528199.pdf

Kamolthip, V. (2022). Epidemiology and review of measures to prevent chronic kidney disease. Division of Non Communicable Diseases. https://ddc.moph.go.th/uploads/publish/1308820220905025852.pdf

Nongyao, N. (2021). Performance Comparison of Cardiovascular Risk Prediction Models using Data Mining Algorithms. Journal of Science and Technology, 40(2), 137-147. https://scjmsu.msu.ac.th/pdfsplit.php?p=MTYyMjE3NzA5My5wZGZ8MTctMjc=

Rubini, L., Soundarapandian, P., & Eswaran, P. (2015). Chronic Kidney Disease. UCI Machine Learning Repository. https://doi.org/10.24432/C5G020

Surajit, N. (1999). Knowledge discovery in database on kohonen self-organizing map algorithm [Unpublished master dissertation, Mahidol University]. http://www.thaithesis.org/detail.php?id=44074#

Weka 3: Machine Learning Software in Java. (2023). Retrieved from https://www.cs.waikato.ac.nz/ml/weka/

Zorman, M., Masuda, G., Kokol, P., Yamanoto, R., & Stiglic, B. (2002). Mining Diabetes Database with Decision Trees and Association Rules. In Computer-Based Medical Systems, 2002. (CBMS 2002). Proceedings of the 15th IEEE Symposium, 134-139. https://sci-hub.se/https://doi.org/10.1109/CBMS.2002.1011367

Downloads

เผยแพร่แล้ว

2024-05-25