การศึกษาเชิงเปรียบเทียบของตัวแบบการเรียนรู้เชิงลึกแบบถ่ายโอนและเทคนิค การขยายรูปภาพสำหรับการจำแนกภาพบุคคลจริงและภาพบุคคลที่สร้างจากปัญญาประดิษฐ์

ผู้แต่ง

  • ไพลิน มะนาวหวาน คณะวิทยาศาสตร์ ศรีราชา มหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตศรีราชา
  • สรชัย เพ็ชรขุนทด คณะวิทยาศาสตร์ ศรีราชา มหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตศรีราชา
  • จุฬาลักษณ์ แก้วหวังสกูล คณะวิทยาศาสตร์ ศรีราชา มหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตศรีราชา
  • พงษ์สัญ ประกฤตศรี ผู้ช่วยศาสตราจารย์ คณะวิทยาศาสตร์ ศรีราชา มหาวิทยาลัยเกษตรศาสตร์ วิทยาเขตศรีราชา

คำสำคัญ:

การเรียนรู้เชิงลึก, โครงข่ายประสาทเทียมแบบคอนโวลูชัน, การเรียนรู้แบบถ่ายโอน, การปรับแต่งแบบละเอียด

บทคัดย่อ

การจำแนกรูปภาพของบุคคลจริงและบุคคลที่สร้างจากปัญญาประดิษฐ์เริ่มมีความท้าทายมากขึ้นในปัจจุบัน เนื่องจากเทคโนโลยีของปัญญาประดิษฐ์พัฒนาขึ้นอย่างรวดเร็ว ทำให้ภาพบุคคลที่สร้างจากปัญญาประดิษฐ์มีความคล้ายคลึงกับภาพบุคคลจริงมากขึ้น จึงเป็นที่น่าสนใจในการสร้างเครื่องมือเพื่อจำแนกรูปภาพดังกล่าว โดยปกติแล้วรูปภาพประกอบด้วยองค์ประกอบจำนวนมาก ได้แก่ สี พื้นผิว แสง และรายละเอียดปลีกย่อยอีกมากมาย ตัวแบบการเรียนรู้เชิงลึกประกอบด้วยโครงสร้างที่ซับซ้อนสามารถเรียนรู้รูปแบบและความสัมพันธ์ของรูปภาพได้อย่างมีประสิทธิภาพ ในงานวิจัยนี้นำโครงข่ายประสาทเทียมแบบคอนโวลูชันที่ผ่านการเรียนรู้แบบถ่ายโอนมาปรับให้มีความแม่นยำในการจำแนกภาพบุคคลจริงและบุคคลที่สร้างจากปัญญาประดิษฐ์ โดยใช้ตัวแบบที่ผ่านการเรียนรู้มาก่อนได้แก่ MobleNetV2, ResNet50 และ EfficientNetV2S มาใช้กับชุดข้อมูลจำนวน 3,000 รูป (คลาสละ 1,500 รูป) จากนั้นเปรียบเทียบประสิทธิภาพของตัวแบบที่ใช้และไม่ใช้วิธีการขยายรูปภาพ พร้อมทั้งวิเคราะห์ผลที่ได้ จากการศึกษาพบว่าตัวแบบ EfficientNetV2S ที่ไม่ใช้วิธีการขยายรูปภาพได้ความแม่นยำสูงที่สุดเท่ากับร้อยละ 94.67 และค่า F1-Score เท่ากับร้อยละ 94.47

References

Y. LeCun, L. Bottou, Y. Bengio and P. Haffner, “Gradient-based learning applied to document recognition,” in Proc. of the IEEE., vol. 86, no. 11, pp. 2278-2324, 1998.

A. Krizhevsky, I. Sutskever and G. E. Hinton, “ImageNet Classification with Deep Convolutional Neural Networks,” in Advances in Neural Information Processing Systems 25: 26th Annual Conference on Neural Information Processing Systems, United States, 2012.

J. Yosinski, J. Clune, Y. Bengio and H. Lipson, “How Transferable Are Features In Deep Neural Networks?,” in Advances in Neural Information Processing Systems 27 (NIPS’ 14), NIPS Foundation, Canada, 2014.

C. Shorten and T. M. Khoshgoftaar, “A survey on image data augmentation for deep learning,” Journal of Big Data., vol. 6, no. 60, pp. 1-48, 2019.

K. He, X. Zhang, S. Ren and J. Sun, “Deep Residual Learning for Image Recognition,” in IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, Nevada, United States, 2016.

A. G. Howard, M. Zhu, B. Chen, D. Kalenichenko, W. Wang, T. Weyand, M. Andreetto and H Adam, “MobileNets: efficient convolutional neural networks for mobile vision applications,” ArXiv., pp. 1-9, 2017.

M. Tan and Q. V. Le, “EfficientNet: rethinking model scaling for convolutional neural networks,” ArXiv., pp. 1-11, 2019.

Y. Taigman, M. Tang, M. A. Ranzato and L. Wolf, “DeepFace: Closing the Gap to Human-Level Performance in Face Verification,” in 2014 IEEE Conference on Computer Vision and Vision and Pattern Recognition (CVPR), Columbus, Ohio, United States, 2014.

Z. Cao, T. Simon, S. E. Wei and Y. Sheikh, “Realtime multi-person 2D pose estimation using part affinity fields,” ArXiv., pp. 1-9, 2017.

A. Karpathy, G. Toderici, S. Shetty, T. Leung, R. Sukthankar and L. Fei-Fei, “Large-Scale Video Classification with Convolutional Neural Networks,” in 2014 IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, USA, 2014.

F. M. Salman and S. S. Abu-Naser, “Classification of real and fake human faces using deep learning,” International Journal of Academic Engineering Research., vol. 6, no. 3, pp. 1-14, 2022.

J. J. Bird and A. Lotfi, “CIFAKE: Image classification and explainable identification of AI-generated synthetic images,” ArXiv., pp. 1-13, 2023.

D. C. Epstein, I. Jain, O. Wang and R. Zhang, "Online Detection of AI-Generated Images," in 2023 IEEE/CVF International Conference on Computer Vision Workshops (ICCVW), Paris, France, 2023.

ณัฐวุฒิ ศรีวิบูลย์, “การปรับปรุงประสิทธิภาพการจำแนกภาพเอกซเรย์ทรวงอกด้วยโครงข่ายประสาทเทียมแบบสังวัฒนาการโดยใช้เทคนิคการเพิ่มภาพสำหรับวินิจฉัยโรคโควิด-19,” วารสารวิชาการพระจอมเกล้าพระนครเหนือ, ปีที่ 31, ฉบับที่ 1, น. 109-117, 2564.

ยุทธนา ป้องโสม, “การศึกษาเปรียบเทียบประสิทธิภาพในการวินิจฉัยโรคปอดอักเสบในผู้ป่วยเด็ก จากภาพรังสีทรวงอกด้วยปัญญาประดิษฐ์ ในรูปแบบโครงข่ายประสาทเทียมคอนโวลูชั่นแบบต่างๆ,” สรรพสิทธิเวชสาร, ปีที่ 43, ฉบับที่ 2, น. 41-52, 2565.

อุมาภรณ์ สายแสงจันทร์ , รพีพร ช่ำชอง และอรรถพล สุวรรณษา, “การวิเคราะห์ใบมะนาวที่เป็นโรคโดยใช้การเรียนรู้เชิงลึก,” วารสารวิทยาการสนเทศและเทคโนโลยีประยุกต์, ปีที่ 4, ฉบับที่ 1, น. 71-86, 2565.

Downloads

เผยแพร่แล้ว

2024-12-18

How to Cite

[1]
มะนาวหวาน ไ. ., เพ็ชรขุนทด ส. ., แก้วหวังสกูล จ. ., และ ประกฤตศรี พ. ., “การศึกษาเชิงเปรียบเทียบของตัวแบบการเรียนรู้เชิงลึกแบบถ่ายโอนและเทคนิค การขยายรูปภาพสำหรับการจำแนกภาพบุคคลจริงและภาพบุคคลที่สร้างจากปัญญาประดิษฐ์”, TJOR, ปี 12, ฉบับที่ 2, น. 28–40, ธ.ค. 2024.