An Explainable Machine Learning Framework for Analyzing Road Accident Severity during Festival Periods
Keywords:
Road Accident Severity, Explainable Machine Learning (XAI) Framework, SMOTE, SHAP Analysis, Accident Risk FactorsAbstract
Severe road traffic accidents are a critical issue causing immense loss of life and property, particularly during the Songkran festival, which is characterized by heavy traffic and unique environmental factors. This study focuses on analyzing accident severity using data from the Ministry of Transport (2021–2024) by proposing an Explainable Machine Learning (XAI) framework to enhance predictive transparency and practical application. To address data imbalance, the SMOTE technique was employed, and the performance of Random Forest, Support Vector Machine (SVM), and Logistic Regression models was compared. Empirical results showed that the Random Forest model achieved the best overall performance (Accuracy = 0.711 ± 0.006, AUC = 0.706 ± 0.025), while the SVM demonstrated superior capability in identifying high-severity cases (Sensitivity = 0.701 ± 0.033). Furthermore, SHAP (SHapley Additive exPlanations) analysis revealed that motorcycle involvement, the number of vehicles, and self-caused collisions are critical risk factors. These insights provide a data-driven foundation for relevant agencies to develop proactive safety measures and mitigate festival-related accidents sustainably.
References
ศูนย์อำนวยการความปลอดภัยทางถนน, “สถิติอุบัติเหตุทางถนนช่วงเทศกาลสงกรานต์ พ.ศ. 2568,” [Online]. Available: https://roadsafety.disaster .go.th/roadsafety/download?id=7091. [วันที่เข้าถึง 17 เมษายน 2568].
ธิดา ธรรมรักษา, บุบผา ลาภทว, และ อมรพล กันเลิศ, “ปัจจัยที่เกี่ยวข้องกับความรุนแรงของการบาดเจ็บในผู้ประสบอุบัติเหตุจราจร ในหอผู้ป่วย,” วารสารโรงพยาบาลธรรมศาสตร์เฉลิมพระเกียรติ., pp. 13-25, 2559.
พรรณี สุรินทชัย, “การเกิดอุบัติเหตุจราจรและปัจจัยที่มีความสัมพันธ์กับระดับความรุนแรงของการบาดเจ็บในเขตอำเภอเมือง จังหวัดพะเยา,” รายงานวิจัย, กลุ่มการพยาบาล โรงพยาบาลพะเยา, พะเยา, 2557, pp. 3–14.
J. S. Madushani, R. K. Sandamal, D. Meddage, H. Pasindu, and P. I. Ayantha Gomes, “Evaluating expressway traffic crash severity by using logistic regression and explainable & supervised machine learning classifiers,” Transportation Engineering., vol. 13, p. 100190, 2022.
R. Yu and M. Abdel-Aty, “Utilizing support vector machine in real-time crash risk evaluation,” Accident Analysis & Prevention., vol. 51, no. 0001-4575, pp. 252-259, 2012.
B. Leo, “Random forests,” Machine Learning., vol. 45, pp. 5-32, 2001.
Q. Zhang, “Deep learning-based surrogate model for flight load analysis,” กรกฎาคม 2564. [Online]. Available: https://www.researchgate .net/figure/The-random-forest-The-data-set-is-divided-into-100-subsets-by-bootstrap-sampling-and_fig4_353520134 [Accessed 19 August 2025].
V. N. Vapnik, The Nature of Statistical Learning Theory, New York: Springer, 1995.
T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning, 2nd ed., New York: Springer, 2009.
รัสรินทร์ เมธาเฉลิมพัฒน์, “การประยุกต์ใช้ Machine Learning กับงานในภาคอุตสาหกรรม,” [ออนไลน์]. แหล่งที่มา: https://www.nectec .or.th/news/news-public-document/machine-learning-manufact-1.html. [วันที่เข้าถึง 19 สิงหาคม 2568].
กาญจน์เขจร ชูชีพ, "การถดถอยโลจีสติก (Logistic Regression)," in Remote Sensing Technical Note No. 5. Faculty of Forestry, Kasetsart University, 2561.
D. W. Hosmer Jr., S. Lemeshow, and R. X. Sturdivant, Applied Logistic Regression, 3rd ed., Hoboken, NJ: John Wiley & Sons, 2013.
P. Gatchalee, “Confusion Matrix เครื่องมือสำคัญในการประเมินผลลัพธ์ของการทำนาย ในMachine learning,” [ออนไลน์]. แหล่งที่มา: https://medium.com/@pagongatchalee/confusion-matrix-เครื่องมือสำคัญในการประเมินผลลัพธ์ของการทำนาย-ในmachine-learning-fba6e3f9508c. [วันที่เข้าถึง 19 สิงหาคม 2568].
S. M. Lundberg and S. I. Lee, “A unified approach to interpreting model predictions,” in Proceedings of the 31st International Conference on Neural Information Processing Systems (NIPS), Long Beach, CA, 2017.
อุบัติเหตุบนโครงข่ายถนนของกระทรวงคมนาคม, “MOT Data Catalog,” [ออนไลน์]. แหล่งที่มา: https://datagov.mot.go.th/dataset/roadaccident. [วันที่เข้าถึง 19 สิงหาคม 2568].
W. G. Cochran, Sampling Techniques, 3rd ed., New York, NY: John Wiley & Sons, 1977.
R. Kohavi, “A study of cross-validation and bootstrap for accuracy estimation and model selection,” in Proceedings of the 14th International Joint Conference on Artificial Intelligence (IJCAI), New York, 1995.
N. V. Chawla, K. W. Bowyer, L. O. Hall, and W. P. Kegelmeyer, “SMOTE: synthetic minority over-sampling technique,” Journal of Artificial Intelligence Research., vol. 16, pp. 321–357, 2002.
G. Louppe, L. Wehenkel, A. Sutera, and P. Geurts, “Understanding variable importances in forests of randomized trees,” in Proceedings of the 26th International Conference on Neural Information Processing Systems (NIPS), 2013.
J. Demšar, “Statistical comparisons of classifiers over multiple data sets,” Journal of Machine Learning Research., vol. 7, pp. 1-30, 2006.
S. Holm, “A simple sequentially rejective multiple test procedure,” Scandinavian Journal of Statistics., vol. 6, no. 2, pp. 65-70, 1979.
Downloads
Published
How to Cite
Issue
Section
License

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
