Applying Machine Learning to Detect Automobile Insurance Claims without Surveys
Keywords:
Naïve Bayes, Adaptive boosting, Random Forest, Variable selectionAbstract
Automobile insurance was the most fraudulent because claims without surveys, also known as “dry claims,” led to fraud and arose from the insured failing to provide details of the incident match with reality. Traditional fraud detection methods were difficult to administer. This research utilized machine learning to solve the above problems. The dependent variable used in the study was compensation claims (dry or fresh claims). The research objectives consisted of 1) searching for factors influencing compensation claims; 2) comparing the predictive performance of the three variable selection methods, no selection of independent variables, Stepwise logistic regression, and decision tree; 3) comparing the predictive performance of the three algorithms, namely Naïve Bayes, random forest, and adaptive boosting; and 4) comparing the predictive performance of the algorithms together with variable selection methods. The claim report of the Type I automobile insurance from an anonymous insurance company in Thailand in 2021 was employed in this study. The study found that the cause of the incident, scene region, insured age, type of repair, sum insured, and amount paid influenced the claims. The most effective variable selection method was the decision tree. Random forest, adaptive boosting, and Naïve Bayes was the most efficient algorithm, respectively. The random forest and the independent variable selection method with the decision tree method were the most efficient.
References
ชุลีกร แต่โศภาพงษ์. บทบาทของการใช้ข้อมูลเชิงวิเคราะห์ (Data Analytics) ในการตรวจสอบการฉ้อฉลในประกันภัย. วารสารประกันภัย 2558;127:9-14.
Belhadji EB, Dionne G, Tarkhani F. A Model for the Detection of Insurance Fraud. Geneva Pap Risk Insur Issues Pract 2000;25(4):517-38.
Roy R, George KT. Detecting insurance claims fraud using machine learning techniques. In: Proceeding of the 2017 International Conference on Circuit Power and Computing Technologies (ICCPCT), April 20-21, 2017, Kollam, India. Institute of Electrical and Electronics Engineers; 2017. p. 1-6.
สำนักงานคณะกรรมการกำกับและส่งเสริมการประกอบธุรกิจประกันภัย. สรุปผลแบบสำรวจความคิดเห็นต่อสภาวะความเสี่ยงและทิศทางการดำเนินธุรกิจประกันภัยปี 2565 (TIPeR). [อินเตอร์เน็ต]. 2565. [เข้าถึงเมื่อ 30 ธ.ค. 2565]. เข้าถึงได้จาก: https://www.oic.or.th/th/consumer/92762
Kowshalya G, Nandhini M. Predicting Fraudulent Claims in Automobile Insurance. In: Proceedings of the 2nd International Conference on Inventive Communication and Computational Technologies (ICICCT 2018), April 20-21, 2018, Coimbatore, India. Institute of Electrical and Electronics Engineers; 2018. p. 1338-43.
Moon H, Pu Y, Ceglia C. A Predictive Modeling for Detecting Fraudulent Automobile Insurance Claims. Theor Econ Lett 2019;9:1886-900.
กฤษณา ศักดิวรพงศ์. การฉ้อฉลในการใช้สิทธิเรียกร้องค่าสินไหมทดแทนในธุรกิจประกันวินาศภัย. วิทยานิพนธ์นิติศาสตรมหาบัณฑิต สาขาวิชานิติศาสตร์, จุฬาลงกรณ์มหาวิทยาลัย. กรุงเทพฯ; 2551.
พราวนภัส จันทร์วดี. นิติเศรษฐศาสตร์ว่าด้วยการฉ้อฉลประกันภัย: กรณีศึกษา คนเดินเท้าแกล้งก่ออุบัติเหตุเพื่อเรียกร้องค่าสินไหมทดแทน. การค้นคว้าอิสระศิลปศาสตรมหาบัณฑิต สาขานิติเศรษฐศาสตร์การค้าระหว่างประเทศ, คณะนิติศาสตร์และคณะเศรษฐศาสตร์ มหาวิทยาลัยธรรมศาสตร์. ปทุมธานี; 2559.
Wang Y, Xu W. Leveraging deep learning with LDA-based text analytics to detect automobile insurance fraud. Decis Support Syst 2018;105(1):87-95.
Simmachan T, Manopa W, Neamhom P, Poothong A, Phaphan W. Detecting Fraudulent Claims in Automobile Insurance Policies by Data Mining Techniques. Thailand Stat 2023;(in press).
Abdelhadi S, Elbahnasy K, Abdelsalam MA. Proposed model to predict auto insurance claims using machine learning techniques. J Theor Appl Inf Technol 2020;98(22):3428-37.
Aksoy S, Haralick RM. Feature normalization and likelihood-based similarity measures for image retrieval. Pattern Recognit Lett 2001;22(5):563-82.
Ioffe S, Szegedy C. Batch normalization: Accelerating deep network training by reducing internal covariate shift. In: Proceedings of the 32nd International conference on machine learning, July 7-9, 2015, Lille, France. PMLR; 2015. p. 448-56.
Mauša G, Galinac Grbac T, Bašić BD. Multivariate logistic regression prediction of fault-proneness in software modules. In: 2012 Proceedings of the 35th International Convention MIPRO, May 21-25, 2012, Opatija, Croatia. Institute of Electrical and Electronics Engineers; 2012. p. 698-703.
Tom M. Mitchell: Machine Learning. Burr Ridge 1997;45(37):870-7.
Patil TR, Sherekar S. Performance analysis of Naive Bayes and J48 classification algorithm for data classification. Int J Comput Sci Appl 2013;6(2):256-61.
ชาลิสา จิตบุญญาพินิจ, ปราลี มณีรัตน์, นิเวศ จิระวิชิตชัย การพัฒนาแบบจําลองการวิเคราะห์ความรู้สึกบนสื่อสังคมออนไลน์ไทยโดยใช้เทคนิคการเรียนรู้เชิงลึก. ว วิทย เทคโน หัวเฉียวเฉลิมพระเกียรติ 2565;8(2),8-18.
กมล บุษบา, มทนาลัย สุดสายสาคร, ภัณฑิรา เตชะพรสิน, สรัลพร โกมลทองทิพย์. การเปรียบเทียบการทำนายการต่ออายุกรมธรรม์ประกันภัยรถยนต์ ประเภท 1 ระหว่างตัวแบบป่าสุ่มและตัวแบบบูสต์ติงปรับได้. TSTJ 2564;10(2):124-34.
สุภัสสรา สมเจตนา, จารี ทองคำ. การเปรียบเทียบประสิทธิภาพเทคนิคเหมืองข้อมูลในการสร้างแบบจำลองเพื่อจำแนกความคิดเห็นของผู้ปกครองต่อการใช้สมาร์ทโฟนของบุตร. ววท มอบ 2564;23(1):21-30.
Vanishkorn B, Supanich W. Crash Severity Classification Prediction and Factors Affecting Analysis of Highway Accidents. In: Proceedings of the 9th International Conference on Advanced Informatics: Concepts, Theory and Applications (ICAICTA 2022), September 28-29, 2022, Tokoname, Japan. Institute of Electrical and Electronics Engineers; 2022. p. 1-6.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Huachiew Chalermprakiet Science and Technology Journal

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
บทความทุกบทความที่ได้รับการตีพิมพ์ถือเป็นลิขสิทธิ์ของ คณะวิทยาศาสตร์แฟละเทคโนโลยี มหาวิทยาลัยหัวเฉียวเฉลิมพระเกียรติ