การแทนค่าสูญหายจำนวนมากในข้อมูลอนุกรมเวลา ใช้ความสัมพันธ์หลายตัวแปร

Main Article Content

พยุง มีสัจ
กรสิริณัฐ โรจนวรรณ์

บทคัดย่อ

- ข้อมูลอนุกรมเวลามีความสำคัญในงานต่างๆ มากมายหลายประเภท ซึ่งมีประโยชน์ในการพยากรณ์แนวโน้มเพื่อประกอบการตัดสินในธุรกิจ ปัญหาของการเก็บข้อมูลที่ไม่ครบถ้วน ข้อมูลที่สูญหายจำนวนมาก จึงไม่สามารถนำไปใช้ในการวิเคราะห์แนวโน้วได้อย่างมีประสิทธิภาพ บทความวิจัยนี้นำเสนอวิธีการเติมค่าสูญหายในข้อมูลอนุกรมเวลาจำนวนมากใช้ความสัมพันธ์หลายตัวแปร โดยใช้ข้อมูลที่มีอยู่สร้างตัวแบบการเติมค่าสูญหาย การวิจัยเน้นที่การค้นหารูปแบบ ข้อมูลที่เหมาะสมสำหรับใช้สอนตัวแบบการเติมค่าสูญหาย ด้วยการเปรียบเทียบเทคนิคการแทนค่า จำนวน 4 เทคนิค ได้แก่ ค่าเฉลี่ยแถว (Row Average)  เพื่อนบ้านใกล้เคียง (K-Nearest Neighbor: KNN) ระบบคลุมเครือ (Fuzzy Logic Systems) โครงข่ายประสาทเทียม (Artificial Neural Network)   ผลวิจัยพบว่า โครงข่ายประสาทเทียมให้ผลการทำนาย ในชุดทดสอบได้ดีที่สุด และเมื่อทำไปใช้ในการแทนที่ค่าสูญหายให้ผลลัพธ์คล้ายค่าจริง ซึ่งการใช้ข้อมูลที่มีอยู่บางส่วน จากหลายตัวแปรสามารถนำไปใช้สำหรับการสร้างตัวแบบแทนค่าสูญหายได้อย่างมีประสิทธิภาพ ทั้งนี้ข้อมูลตัวแปรหลาย ตัวแปรจะมีผล โดยตรงต่อการจัดรูปแบบข้อมูลและตัวแบบ หรือไม่นั้นควรทำการวิเคราะห์ทำความเข้าใจในข้อมูลอย่างดี ก่อนการนำไปสร้างตัวแบบการแทนค่าสูญหาย

Article Details

รูปแบบการอ้างอิง
[1]
มีสัจ พ. และ โรจนวรรณ์ ก., “การแทนค่าสูญหายจำนวนมากในข้อมูลอนุกรมเวลา ใช้ความสัมพันธ์หลายตัวแปร”, JIST, ปี 8, ฉบับที่ 1, น. 16–25, มิ.ย. 2018.
ประเภทบทความ
บทความวิจัย Soft Computing:

เอกสารอ้างอิง

1. H. Song, C. Miao, W. Roel, Z. Shen, and F. Catthoor, “Implementation of Fuzzy Cognitive Maps Based on Fuzzy Neural Network and Application in Prediction of Time Series,” IEEE Trans. Fuzzy Syst., vol. 18, no. 2, pp. 233–250, Apr. 2010.

2. X. Bai, F. Zhang, J. Hou, F. Xia, A. Tolba, and E. Elashkar, “Implicit Multi-Feature Learning for Dynamic Time Series Prediction of the Impact of Institutions,” IEEE Access, vol. 5, pp. 16372–16382, 2017.

3. I. Pratama, A. E. Permanasari, I. Ardiyanto, and R. Indrayani, “A review of missing values handling methods on time-series data,” in 2016 International Conference on Information Technology Systems and Innovation (ICITSI), pp. 1–6, 2016.

4. Y. S. Afrianti, “Imputation Algorithm Based on Copula for Missing,”, pp. 252–257, 2014.

5. J. D. Velasquez, “Adaptive Multidimensional Neuro-Fuzzy Inference System for Time Series Prediction,” IEEE Lat. Am. Trans., vol. 13, no. 8, pp. 2694–2699, Aug. 2015.

6. W. Insuwan, U. Suksawatchon, and J. Suksawatchon, “Improving missing values imputation in collaborative filtering with user-preference genre and singular value decomposition,” in 2014 6th International Conference on Knowledge and Smart Technology (KST), pp. 87–92, 2014.

7. G. Chang, Y. Zhang, and D. Yao, “Missing data imputation for traffic flow based on improved local least squares,” Tsinghua Sci. Technol., vol. 17, no. 3, pp. 304–309, Jun. 2012.

8. Y. Li, A. Ngom, and L. Rueda, “Missing value imputation methods for gene-sample-time microarray data analysis,” in 2010 IEEE Symposium on Computational Intelligence in Bioinformatics and Computational Biology, pp. 1–7, 2010.

9. P. Keerin, W. Kurutach, and T. Boongoen, “Cluster-based KNN missing value imputation for DNA microarray data,” in 2012 IEEE International Conference on Systems, Man, and Cybernetics (SMC), pp. 445–450, 2012.

10. H. Ichihashi, K. Honda, A. Notsu, and T. Yagi, “Fuzzy c-Means Classifier with Deterministic Initialization and Missing Value Imputation,” in 2007 IEEE Symposium on Foundations of Computational Intelligence, pp. 214–221, 2007.

11. พยุง มีสัจ, ระบบฟัซซีและโครงข่ายประสาทเทียม, มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ. 2555.

12. N. A. Setiawan, P. A. Venkatachalam, and A. F. M. Hani, “Missing Attribute Value Prediction Based on Artificial Neural Network and Rough Set Theory,” presented at the 2008 International Conference on BioMedical Engineering and Informatics, vol. 1, pp. 306–310, 2008.

13. R. and R. D. Little, “Statistical Analysis with Missing Data,” Wiley, New York., p. 381, 1987.