ข้อมูลเชิงเวลากับการจาแนกประเภทผู้เป็นโรคเบาหวานในประเทศไทย

Main Article Content

สมภพ ปฐมนพ
กฤษฎา ศรีแผ้ว
ม.ล.กุลธร เกษมสันต์

บทคัดย่อ

- โรคเบาหวานเป็นโรคเรื้อรังที่ทำให้ผู้ป่วยมีคุณภาพชีวิตที่ลดลง เนื่องจากโรคเบาหวานมักจะก่อให้เกิดภาวะโรคแทรกซ้อนอื่นๆ ตามมา เช่น โรคหัวใจ, โรคความดันโลหิตสูง, โรคระบบประสาท หรือแม้แต่การสูญเสียอวัยวะบางส่วนในร่างกาย ซึ่งเป็นสาเหตุร่วมของการเสียชีวิตด้วยโรคเบาหวาน งานวิจัยนี้ได้นาเสนอรูปแบบข้อมูลเชิงเวลาด้วยการเพิ่มคุณลักษณะข้อมูลเชิงเวลาจากข้อมูลประวัติการตรวจสุขภาพเพื่อการจาประเภทข้อมูลโดยการใช้อัลกอริทึม ได้แก่ Naïve Bayes, Logistic Regression, C4.5 (J48), Bagging และ SVMs ซึ่งงานวิจัยนี้ได้ทำการทดลองบนข้อมูลการตรวจสุขภาพในระหว่างปี พ.ศ.2547 – 2553 (7 ปี) ของลูกจ้างโรงงงานอุตสาหกรรมในประเทศไทยโดยมีจานวนลูกจ้างทั้งหมด 43,523 ราย เป็นการตรวจเพียงครั้งเดียว 28,808 ราย และตรวจมากกว่าหนึ่งครั้ง 14,715 ราย โดยได้มีการทารีแซมพลิ่งแบบแทนที่เพื่อปรับอินสแตนซ์ข้อมูลที่ใช้ในการเรียนในแต่ละคลาสให้สมดุลกันก่อนเข้าสู่กระบวนการเรียนต่อไป จากกลุ่มรายการตรวจสุขภาพ 3 รายการ คือ 1) การตรวจร่างกายทั่วไปโดยแพทย์ 2) การตรวจปัสสาวะ 3) การตรวจสารชีวเคมีในเลือด ผลการทดลองได้แสดงให้เห็นว่าข้อมูลที่เพิ่มคุณลักษณะข้อมูลเชิงเวลาให้ผลประสิทธิภาพการจาแนกประเภทดีกว่าข้อมูลแบบปกติที่ไม่มีคุณลักษณะข้อมูลเชิงเวลา

Article Details

รูปแบบการอ้างอิง
[1]
ปฐมนพ ส., ศรีแผ้ว ก., และ เกษมสันต์ ม., “ข้อมูลเชิงเวลากับการจาแนกประเภทผู้เป็นโรคเบาหวานในประเทศไทย”, JIST, ปี 3, ฉบับที่ 2, น. 14–21, ธ.ค. 2017.
ประเภทบทความ
บทความวิจัย Soft Computing:

เอกสารอ้างอิง

1. National Center for Chronic Disease Prevention and Health Promotion. National Diabetes Fact Sheet. Online.. Available:https://www.cdc.gov/diabetes/pubs/pdf/ndfs_2011.pdf, 2011.

2. สานักงานสารวจสุขภาพประชาชนไทย. “รายงานการสารวจสุขภาพประชาชนไทยโดยการตรวจร่างกาย.” ออนไลน์.. เข้าถึงได้จาก : https://nheso.or.th/loadfile/diabetes_mellitus.pdf, 2554.

3. B. H. Cho, H. Yu, K. Kim, T. H. Kim, I. Y. Kim and S. I. Kim. Application of irregular and unbalanced data to predict diabetic nephropathy using visualization and feature selection methods. Journal Artificial Intelligence in Medicine. 2008, 42 : 37-53.

4. H. N. A. Pham and E. Triantaphyllou. Prediction of Diabetes by Employing a New Data Mining Approach Which Balance Fitting and Generalization. Computer and Information Science. 2008, 131:11-26.

5. K. Takahashi, H. Uchiyama, S. Yanagisawa and I. Kamae. The Logistic Regression and ROC Analysis of Group-based Screening for Predicting Diabetes Incidence in Four Years. The Kobe journal of medical science. 2006, 52 (6): 171-180.

6. B. A. Tama, Rodiyatul F.S. and Hermansyah. An Early Detection Method of Type-2 Diabetes Mellitus in Public Hospital. Proceeding of The International Conference on Informatics, Cybernetic,and Computer Applications. Bangalore. 2010, 9 (2): 287-294.

7. R. Peter and T. Thomas. Temporal Data Classification using Linear Classifiers. Journal Information Systems. 2011, 36 (1): 30-41.

8. G. Parthiban, A. Rajesh, and S. K. Srivatsa. Diagnosis of Heart Disease for Diabetic Patients using Naïve Bayes Method. International Journal of Computer Applications. 24 (2011) : 7-11.

9. World Health Organization. BMI Classification. Online.. Available : https://apps.who.int/bmi/index.jsp?introPage=intro_3.html, 2011.

10. World Health Organization. 2003 World Health Organization (WHO)/International Society of Hypertension (ISH) statement on management of hypertension. Online.. Available : https://www.who.int/cardiovascular_diseases/guidelines/hypertension/en/, 2011.

11. I. H. Witten, E. Frank. Data mining: Practical Machine Learning Tools and Techniques, 3rd Edition. San Francisco: Morgan Kaufmann, 2011.

12. A. T. Arnholt. Resample with R. Teaching Statistics, 2007, 29(1), 21-26.