การพัฒนาฟีเจอร์แนะนำคำสำคัญสำหรับการค้นหาข้อมูลภาษาไทย

Main Article Content

ปกป้อง ส่องเมือง
ชัยณรงค์ เกษามูล
รัฐภูมิ เกียรติวีระศักดิ์
วรวรรณ วันดี
รัชฎา คงคะจันทร์
ศรัณย์ กุลยานนท์
วสิศ ลิ้มประเสริฐ
วรพล ล้วนตั้งศรีสุข

บทคัดย่อ

ปัญหาที่ผู้ใช้ระบบค้นหาพบคือผู้ใช้ต้องการค้นหาเอกสารที่มีความเฉพาะทาง ผู้ใช้อาจรู้เพียงคำในบริบทของเอกสารที่ต้องการค้นหา แต่ไม่รู้จักคำสำคัญที่ต้องใช้ในการค้นหาที่ตรงกับเอกสาร ทำให้คำที่ใช้ค้นไม่ตรงกับเอกสารในระบบค้นหา ผลลัพธ์จากระบบค้นหาจึงไม่พบเอกสารที่ต้องการ ดังนั้นงานวิจัยนี้จึงพัฒนาระบบค้นหาและแนะนำคำสำคัญสำหรับค้นหาจากพจนานุกรมและออนโทโลยี โดยนำคำในบริบทและองค์ความรู้ในพจนานุกรมและออนโทโลยีเพื่อใช้ในการแนะนำคำสำคัญ จากการทดลองเปรียบเทียบประสิทธิภาพระบบค้นหา ผู้ทดลองที่ไม่ใช้ฟีเจอร์แนะนำคำสำคัญ และผู้ทดลองใช้ฟีเจอร์แนะนำคำสำคัญจากพจนานุกรมและออนโทโลยี ผลลัพธ์คือผู้ทดลองที่ได้รับคำแนะนำจากฟีเจอร์แนะนำคำสำคัญจากออนโทโลยีมีคำตอบจากการค้นหาข้อมูลถูกต้องจำนวนข้อสูงสุด และมีค่าเฉลี่ยจำนวนครั้งในการค้นหาน้อยกว่าการได้รับคำแนะนำจากฟีเจอร์แนะนำคำสำคัญจากพจนานุกรม

Article Details

บท
บทความวิจัย

References

[1] Bharathi, G. and Venkatesan, D., 2012, Improving Information Retrieval Using Document Clusters and Semantic Synonym Extraction, J. Theor. Appl. Inf. Tech. 36: 167-173.
[2] Cho, J. and Garcia-Molina, H., 2000, The Evolution of the Web and Implications for an Incremental Crawler, pp. 200-209, Proceedings of the 26th International Conference on Very Large Data Bases, San Francisco.
[3] Fredkin, E., 1960, Trie Memory, Commun. ACM 3(9): 490-499.
[4] Gan, L. and Tu, W., 2014, Improving Query Expansion Using Wikipedia, pp. 143-146, 2014 International Conference on Management of e-Commerce and e-Government, Shanghai.
[5] Gillies, J. and Cailliau, R., 2000, How the Web Was Born: The Story of the World Wide Web. Oxford University Press, United Kingdom, 392 p.
[6] Kim, Y., & Croft, W. B., 2015, Improving Patent Search by Search Result Diversification. Paper presented at the Proceedings of the 2015 International Conference on The Theory of Information Retrieval, Northampton, Massachusetts, USA.
[7] Langville, A. N. and Meyer, C. D., 2006, Google's PageRank and Beyond: The Science of Search Engine Rankings, Princeton University Press, United Kingdom, 240 p.
[8] Lyman, P. and Varian, H. R., 2003, How Much Information 2003?, Available Source: http://www.sims.berkeley.edu/research/projects/how-much-info-2003/, June 14, 2020.
[9] N. Lin, V. A. Kudinov, H. M. Zaw and S. Naing, 2020, Query Expansion for Myanmar Information Retrieval Used by WordNet, 2020 IEEE Conference of Russian Young Researchers in Electrical and Electronic Engineering (EIConRus), St. Petersburg and Moscow, Russia , pp. 395-399
[10] Noy, N. F. and McGuinness, D. L., 2001, Ontology Development 101: A Guide to Creating Your First Ontology, Available Source: https://protege.stanford.edu/publications/ontology_development/ontology101.pdf, August 3, 2020.
[11] Rawat, R., Nayak, R., & Li, Y., 2011, Improving web database search incorporating users query information. Proceedings of the International Conference on Web Intelligence, Mining and Semantics, WIMS 2011, Sogndal, Norway, May 25 - 27, 2011.
[12] Salton, G. and Buckley, C., 1988, Term-weighting Approaches in Automatic Text Retrieval, Inf. Process. Manage. 24(5): 513-523.
[13] Saravanan, M., Ravindran, B. & Raman, S., 2009, Improving legal information retrieval using an ontological framework, Artif Intell Law 17, 101–124.
[14] Teeramunkong, T., Sornlertlamvanich, V., Tanhermhong T. and Chinnan, W., 2000, Character Cluster Based Thai Information Retrieval, pp. 75-80, Proceedings of the fifth international workshop on Information retrieval with Asian languages (IRAL ’00), Assoc. Comp. Mach., New York.
[15] Toman, S., Abed, M., & Toman, Z.H., 2020, Cluster-Based Information Retrieval by using (K-means)- Hierarchical Parallel Genetic Algorithms Approach, TELKOMNIKA Telecommunication, Computing, Electronics and Control Vol. 19, No. 1, February 2021, pp. 349-356.