การเปรียบเทียบประสิทธิภาพอัลกอริทึมสำหรับค้นหาไอเท็มเซตที่ปรากฏร่วมกันบ่อย

Main Article Content

ทวีศักดิ์ คงตุก

บทคัดย่อ

        การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อ 1) ศึกษา และเปรียบเทียบอัลกอริทึมสำหรับค้นหาไอเท็มเซตที่ปรากฏร่วมกันบ่อย (Frequent Item sets) ซึ่งเป็นขั้นตอนหนึ่งในกระบวนการทำเหมืองข้อมูลกฏความสัมพันธ์ (Association Rule Mining)  2) ศึกษาชุดข้อมูลที่ใช้สำหรับการทดสอบอัลกอริทึมสำหรับค้นหาไอเท็มเซตที่ปรากฏร่วมกันบ่อย และ 3) สรุปผลได้ว่าอัลกอริทึมใด เหมาะกับชุดข้อมูลลักษณะใด และอัลกอริทึมใดทำงานได้เร็วที่สุดหรือใช้หน่วยความจำน้อยที่สุด


         ผลการวิจัยพบว่า 1) อัลกอริทึมสำหรับค้นหาไอเท็มเซตที่ปรากฏร่วมกันบ่อย มีข้อดีและข้อเสียแตกต่างกันไป ดังนั้นแต่ละอัลกอริทึมจะเหมาะสำหรับการใช้วิเคราะห์ชุดข้อมูลที่แตกต่างกัน  2) อัลกอริทึมที่ทำงานได้เร็วที่สุดสำหรับชุดข้อมูลขนาดใหญ่และมีความหนาแน่นมาก คืออัลกอริทึม FP-Growth, Apriori และ PrePost+ 3) อัลกอริทึมที่ทำงานได้เร็วที่สุดสำหรับชุดข้อมูลขนาดใหญ่และมีความหนาแน่นน้อย คืออัลกอริทึม LCMFreq 4) อัลกอริทึมที่ทำงานได้เร็วที่สุดสำหรับชุดข้อมูลขนาดเล็กและมีความหนาแน่นน้อย คืออัลกอริทึม LCMFreq  และ
5) อัลกอริทึมที่ทำงานได้เร็วที่สุดสำหรับชุดข้อมูลขนาดเล็กและมีความหนาแน่นมาก คืออัลกอริทึม PrePost+, LCMFreq

Article Details

บท
บทความวิจัย

References

[1] R. Agrawal, and R. Srikant. (1994) . Fast algorithms for mining association rules. In J.B. Bocca, Proceedings of the 20th International Confrerence on Very Large Data
Bases (VLDB’94), Santiago dc Chile, Morgan Kaufmann.
[2] M.J.Zaki, and K.Gouda. (2000). Generating non-redundant association rules. In 6th ACM SIGKDD Int’l Conf. Knoledge Discovery and Data Mining, August 2000.
[3] Deng Z. H., Lv S. L. (2014). Fast mining frequent itemsets using Nodesets. Expert systems with Applications, No.41(2014), 4505-4512.
[4] J.Han, J. Pei, and Y. Yin (2000). Mining Frequent Patterns Without Candidate Generation. Proc. ACM-SIGMOD Int’l Conf, Management of Data. pp. 1-12, May 2000.
[5] J. Pei, et.al. (2007). H-Mine: Fast and space-preserving frequent pattern mining in large databases. IIE transaction (2007) 39, 593-605.
[6] T. Uno, et.al. (2004). LCM ver. 2: Efficient mining algorithms for Frequent/Closed/Maximal Itemsets. National Institute of informatics 2-1-2 Hototsubashi, Chiyoda-ku,
Tokyo, Japan.
[7] Deng Z. H., and Lv S. L. (2015). PrePost+: An efficient N-lists based algorithm for mining frequent itemsets via Children-Parent Equivalence pruning. Expert systems with
Applications, No.42(2015), 5424-5432.
[8] C. Borgelt. (2005). Keeping Things Simple: Finding Frequent Item Sets by Recursive Elimination. University of Magdeburg, Germany.
[9] M.J.Zaki, and K.Gouda. (2001). Fast Vertical Mining Using Diffsets. Rensselaer Polytechnic Institute, Troy, NY, USA. Kyushu University, Fukuoka Japan.
[10] M.J. Zaki, and W.M. JR. (2014). Data Mining and Analysis Fundamental Concepts and Algorithms. Cambridge University Press. New York, NY 10013-2473, USA.